Mythe: vanwege digitale technologie en cloudcomputing vermijden bedrijven het genereren van documentafval of afval dat wordt geproduceerd met betrekking tot de opslag van informatie. Organisaties kunnen de stapels afval opruimen, waaronder multimedia-dvd's of Blu-Rays, facturen, contracten, rapporten, voorstellen, budgetten en zakelijke correspondentie.
In werkelijkheid gebeurt er zelfs met digitale technologie verspilling. Mensen creëren verschillende soorten gegevensverspilling, waaronder onnodige gegevens die opslagruimte in beslag nemen, ongesorteerde gegevens die nuttig kunnen zijn maar vergeten (en moeilijk te vinden), dubbele gegevens en gegevens die bedoeld zijn voor bepaalde gebruikers maar onderbenut of helemaal niet worden gebruikt door de veronderstelde gebruikers. Dit zijn kostbare dataverspilling die kunnen worden aangepakt door de volgende best practices.
1. Schaf het juiste systeem en de juiste tools aan om efficiënt om te gaan met grote hoeveelheden gegevens
Organisaties die zich bezighouden met het verzamelen en analyseren van gegevens, moeten zorgen voor efficiëntie in de manier waarop ze gegevens opslaan, beheren en weggooien. Met name AI- of machine learning-ontwikkelaars hebben een efficiënte manier nodig om gegevens te classificeren en te beheren, omdat ze voortdurend een verscheidenheid aan informatie verzamelen en analyseren. Er moet een systeem zijn dat het gemakkelijk maakt om gegevens te lokaliseren, op te halen en vervolgens te verwijderen om opslagruimte vrij te maken voor meer gegevens. De afwezigheid hiervan kan leiden tot opslagredundantie, de voortdurende opslag van onnodige of ongewenste gegevens en problemen bij het lokaliseren van gegevens.
Er zijn verschillende benaderingen voor het omgaan met data, zoals datawarehousing en het gebruik van datameren. Er zijn ook verschillende oplossingen voor gegevensopslag, beheer en analyse. Voorbeelden hiervan zijn Druid, ClickHouse, Cassandra, Prometheus en Elasticsearch. Deze benaderingen en oplossingen hebben verschillende voor- en nadelen, dus het is belangrijk om ze zorgvuldig te evalueren.
Diepgaande vergelijkingen of handleidingen zoals dit artikel over Apache Druid versus Clickhouse kan nuttig zijn bij het kiezen van de juiste tools en strategieën om te implementeren. Verschillende organisaties hebben verschillende behoeften, terwijl verschillende oplossingen voor gegevensopslag en analyse ook verschillende functies en kenmerken hebben. Het is belangrijk om vast te stellen of de gekozen oplossing past bij de specifieke eisen van een organisatie.
2. Investeer in een efficiënt systeem om ROT . uit te roeien en te voorkomen
ROT verwijst naar gegevens die overbodig, verouderd en triviaal zijn. Volgens gegevensbeveiligingsbedrijf ManageEngine, tenminste: 30 procent van de gegevens in organisaties kan worden beschouwd als ROT. Dit vormt een grote uitdaging voor gegevensbeheer, omdat het niet alleen onnodige kosten voor gegevensopslag met zich meebrengt; het maakt het ook moeilijk om specifieke gegevens efficiënt te vinden en te gebruiken wanneer ze nodig zijn.
Alle bestaande gegevens moeten worden onderzocht om te bepalen of ze nog moeten worden bewaard of permanent moeten worden gewist. Vervolgens kunnen de resterende bruikbare of potentieel bruikbare gegevens worden geïnventariseerd en geclassificeerd/gecatalogiseerd. Als het moeilijk is om vast te stellen of een bepaalde hoeveelheid gegevens moet worden verwijderd, kunnen ze een eigen categorie of opslaglocatie krijgen die later gemakkelijk kan worden bekeken.
Het hebben van een efficiënt gegevensbeheersysteem gaat echter niet alleen over de hardware en software. Een cruciaal onderdeel waarmee rekening moet worden gehouden, zijn de mensen die de gegevens in een organisatie maken, gebruiken en beheren. Ze moeten goed worden georiënteerd of getraind in de rol die ze spelen bij het elimineren en voorkomen van ROT-gegevens.
3. Stel een duidelijk gegevensorganisatie- en bewaarbeleid op
Accenture zegt dat bijna 80 procent van de bedrijfsgegevens is ongestructureerd. Dit betekent dat de gegevens die worden bewaard geen logische classificatie hebben. Verschillende soorten gegevens voor verschillende doeleinden worden willekeurig op verschillende locaties opgeslagen. Sommige werknemers hebben misschien een vorm van sortering of organisatie, maar de schema's die ze gebruiken zijn inconsistent.
Het ontbreken van een organisatie- of gegevensopslagstructuur is een van de grootste redenen waarom sommige gegevens overbodig en moeilijk te vinden zijn. Redundantie verspilt niet alleen opslagruimte op locatie, maar ook in de cloud. Bij het doornemen van verzamelingen bestanden om specifieke gegevens te lokaliseren, komt er rekenkracht bij kijken en wordt onnodig tijd en moeite verspild.
Om inefficiëntie en verspilling te voorkomen, is het raadzaam om vanaf het begin een duidelijk gegevensorganisatie- en bewaarbeleid op te zetten. Het helpt om de details uit te leggen over welke gegevens moeten worden opgeslagen, waar ze moeten worden opgeslagen, hoe de gegevens moeten worden geclassificeerd en hoe lang de gegevens moeten worden bewaard. Het helpt ook om er een beleid van te maken om metadata toe te voegen aan alle bestanden die worden opgeslagen om het ontdekken en evalueren van gegevens te vergemakkelijken. Het hebben van een duidelijk en uitgebreid beleid voor gegevensorganisatie en -bewaring heeft ook het extra voordeel dat het automatisering vergemakkelijkt en voldoet aan de gegevensregelgeving.
Bovendien helpt het om het concept "single source of truth" toe te passen. Dit betekent het hebben van een centrale repository of index van alle gegevens in een organisatie. Dit zorgt ervoor dat onnodige dubbele kopieën worden vermeden en maakt het ook gemakkelijker om gegevens te vinden wanneer dat nodig is en om de gegevens te evalueren voor bewaring of verwijdering.
4. Goed op de hoogte zijn van datawet- of regelgeving
Sommige organisaties bewaren gegevens zo lang als ze kunnen omdat ze niet zeker weten wat wet- en regelgeving vereist. Deze voorschriften omvatten die van IRS en FTC, ISO-normen, industrienormen zoals die in CCPA en PCI-DSS, en intern bedrijfsbeleid zoals vereisten voor het bewaren van personeelsdossiers en versiebeheerschema's.
In de Verenigde Staten hebben een aantal federale en staatswetten een mandaat voor het bewaren van gegevens. De Federal Information Security Management Act (FISMA) verplicht aannemers en federale agentschappen bijvoorbeeld om hun gegevens ten minste drie jaar te bewaren. De National Energy Commission (NERC) vereist dat energiegerelateerde entiteiten gegevens drie tot zes maanden bewaren. De Health Insurance Portability and Accountability Act (HIPAA) legt een minimum van ten minste zes jaar archivering van gezondheidsinformatie op voor gezondheidsgerelateerde entiteiten.
Voor organisaties die in verschillende delen van de wereld actief zijn, is het noodzakelijk om vertrouwd te raken met de verschillende wet- en regelgeving van specifieke landen. In Zwitserland is het bijvoorbeeld verplicht om alle bedrijfsgegevens gedurende 10 jaar na het einde van een boekjaar te bewaren. Ook vereist het International Regulatory Framework for Banks (Basel III) dat banken een gegevensgeschiedenis van drie tot zeven jaar bijhouden.
Verspilling van gegevensopslag is geen triviale kwestie
Verspilling van dataopslag beperkt zich niet tot digitale kosten. Het kan ook een offline effect hebben. Volgens een Goed advies voor een groene aarde Q&A, wordt elk jaar 0.2 ton koolstofdioxide gegenereerd voor elke 100 GB aan gegevens die in de cloud zijn opgeslagen. Dit betekent dat het onnodig opslaan van gegevens in de cloud zich vertaalt in emissies die vermeden hadden kunnen worden.
Net als andere vormen van verspilling is verspilling van dataopslag te vermijden of in ieder geval te verminderen. Door te zorgen voor een efficiënte gegevensopslag en het volgen van best practices, kan ongewenste verspilling van gegevensopslag aanzienlijk worden teruggedrongen, inclusief de bijbehorende offline effecten.
Afbeelding: Pixabay
laat een reactie achter
Heb je iets te zeggen over dit artikel? Voeg je commentaar toe en start de discussie.