Myt: På grund av digital teknik och molnberäkning undviker företag att generera dokumentärt skräp eller avfall som produceras i samband med lagring av information. Organisationer får göra sig av med skräphögarna som inkluderar multimedia-DVD eller Blu-ray, fakturor, kontrakt, rapporter, förslag, budgetar och affärskorrespondens.
I verkligheten sker slöseri även med digital teknik. Människor skapar olika typer av dataslöseri inklusive onödig data som tar upp lagringsutrymme, osorterad data som kan vara användbar men glömd (och svår att lokalisera), dubbletter av data och data avsedd för vissa användare men som är underutnyttjad eller inte används alls av de förmodade användarna. Dessa är kostsamt dataslöseri som kan hanteras av följande bästa praxis.
1. Skaffa rätt system och verktyg för att effektivt hantera stora datamängder
Organisationer som sysslar med datainsamling och analys bör säkerställa effektiviteten i hur de lagrar, hanterar och kasserar data. Speciellt AI- eller maskininlärningsutvecklare behöver ett effektivt sätt att klassificera och hantera data eftersom de ständigt samlar in och analyserar en mängd olika information. Det måste finnas ett system som gör det enkelt att hitta, hämta och sedan radera data för att frigöra lagringsutrymme för mer data. Frånvaron av dessa kan leda till lagringsredundans, fortsatt lagring av onödiga eller oönskade data och svårigheter att hitta data.
Det finns olika tillvägagångssätt för att hantera data, såsom datalagring och användning av datasjöar. Det finns också olika lösningar för datalagring, hantering och analys. Exempel på dessa är Druid, ClickHouse, Cassandra, Prometheus och Elasticsearch. Dessa tillvägagångssätt och lösningar har olika för- och nackdelar, så det är viktigt att utvärdera dem noggrant.
Djupgående jämförelser eller guider som den här artikeln om Apache Druid vs Clickhouse kan vara användbar för att välja rätt verktyg och strategier att implementera. Olika organisationer har olika behov, samtidigt som olika datalagrings- och analyslösningar också har olika funktioner och egenskaper. Det är viktigt att försäkra sig om att den valda lösningen matchar en organisations specifika krav.
2. Investera i ett effektivt system för att utrota och förhindra ROT
ROT hänvisar till data som är redundant, föråldrad och trivial. Enligt datasäkerhetsföretaget ManageEngine, åtminstone 30 procent av data i organisationer kan betraktas som ROT. Detta utgör en stor utmaning för datahantering, eftersom det inte bara tillför onödiga kostnader för datalagring; det gör det också svårt att effektivt hitta och använda specifik data när de behövs.
Alla befintliga uppgifter bör undersökas för att avgöra om de fortfarande ska behållas eller raderas permanent. Sedan kan återstående användbara eller potentiellt användbara data inventeras och klassificeras/katalogiseras. Om det är svårt att avgöra om ett specifikt gäng data ska raderas kan de få en egen kategori eller lagringsplats som enkelt kan återbesökas senare.
Att ha ett effektivt datahanteringssystem handlar dock inte bara om hårdvara och mjukvara. En avgörande komponent som bör beaktas är människorna som skapar, använder och hanterar data i en organisation. De måste vara korrekt orienterade eller utbildade i de roller de spelar för att eliminera och förhindra ROT-data.
3. Upprätta tydliga policyer för dataorganisation och lagring
Accenture säger det nästan 80 procent av företagsdata är ostrukturerad. Detta innebär att uppgifterna som lagras inte har någon logisk klassificering. Olika typer av data för olika användningsområden lagras på olika platser godtyckligt. Vissa anställda kan ha någon form av sortering eller organisation, men de system de använder är inkonsekventa.
Bristen på organisation eller datalagringsstruktur är en av de största anledningarna till att vissa data blir överflödiga och svåra att lokalisera. Redundans slösar bort lagringsutrymme inte bara på plats utan även i molnet. När man går igenom samlingar av filer för att lokalisera specifik data är det datorkraft involverad och onödig tid och ansträngning slösas bort.
För att undvika ineffektivitet och slöseri är det tillrådligt att sätta upp tydliga policyer för dataorganisation och lagring från början. Det hjälper till att lägga ut detaljerna om vilka data som ska lagras, var de ska lagras, hur man klassificerar data och hur länge data ska lagras. Det hjälper också till att göra det till en policy att lägga till metadata till alla filer som lagras för att underlätta dataupptäckt och utvärdering. Att ha en tydlig och heltäckande policy för dataorganisation och lagring har också den extra fördelen att det underlättar automatisering och efterlevs av dataregler.
Dessutom hjälper det att anta konceptet "en enda källa till sanning". Detta innebär att ha ett centralt arkiv eller index över all data i en organisation. Detta säkerställer att onödiga dubbletter undviks och gör det också lättare att hitta data närhelst det behövs och att utvärdera data för lagring eller radering.
4. Var ordentligt förtrogen med datalagar eller förordningar
Vissa organisationer behåller data så länge de kan eftersom de är osäkra på vad lagar och förordningar kräver. Dessa regler inkluderar de som fastställts av IRS och FTC, ISO-standarder, industristandarder som de i CCPA och PCI-DSS, och interna företagspolicyer som krav på lagring av anställda och versionskontrollsystem.
I USA har ett antal federala och statliga lagar mandat för datalagring. Federal Information Security Management Act (FISMA), för en, ålägger entreprenörer och federala myndigheter att lagra sina data i minst tre år. National Energy Commission (NERC) kräver att energirelaterade enheter behåller data i tre till sex månader. Health Insurance Portability and Accountability Act (HIPAA) ställer krav på minst sex år av hälsoinformationsarkiv för hälsorelaterade enheter.
För organisationer som verkar i olika delar av världen är det nödvändigt att bekanta sig med de olika lagar och förordningar i specifika länder. I Schweiz, till exempel, är all affärsdata mandat att bevaras i 10 år efter utgången av ett räkenskapsår. Dessutom kräver International Regulatory Framework for Banks (Basel III) banker att ha en datahistorik på tre till sju år.
Datalagringsavfall är ingen trivial sak
Datalagringsslöseri är inte begränsat till digitala kostnader. Det kan också påverka offline. Enligt a Goda råd för en Green Earth Q&A, 0.2 ton koldioxid genereras varje år för varje 100 GB data som lagras i molnet. Detta innebär att onödig lagring av data på molnet leder till utsläpp som kunde ha undvikits.
Precis som andra former av avfall kan datalagringsavfall undvikas eller åtminstone reduceras. Att säkerställa effektiv datalagring och följa bästa praxis kan avsevärt minska oönskat datalagringsavfall, inklusive dess motsvarande effekter offline.
Bild: Pixabay
Lämna en kommentar
Har du något att säga om den här artikeln? Lägg till din kommentar och starta diskussionen.