Mito: a causa della tecnologia digitale e del cloud computing, le aziende evitano di generare rifiuti documentari o rifiuti prodotti in relazione all'archiviazione delle informazioni. Le organizzazioni riescono a farla finita con le pile di spazzatura che includono DVD o Blu-Ray multimediali, fatture, contratti, rapporti, proposte, budget e corrispondenza commerciale.
In realtà, lo spreco avviene anche con la tecnologia digitale. Le persone creano vari tipi di spreco di dati, inclusi dati non necessari che occupano spazio di archiviazione, dati non ordinati che potrebbero essere utili ma dimenticati (e difficili da individuare), dati duplicati e dati destinati a determinati utenti ma sottoutilizzati o non utilizzati affatto da i presunti utenti. Questi sono costoso spreco di dati che può essere affrontato dalle seguenti migliori pratiche.
1. Acquisire il sistema e gli strumenti giusti per gestire in modo efficiente grandi quantità di dati
Le organizzazioni che si occupano di raccolta e analisi dei dati dovrebbero garantire l'efficienza nel modo in cui archiviano, gestiscono ed eliminano i dati. Gli sviluppatori di IA o machine learning, in particolare, necessitano di un modo efficiente per classificare e gestire i dati poiché raccolgono e analizzano costantemente una varietà di informazioni. Deve esistere un sistema che renda facile individuare, recuperare e successivamente eliminare i dati per liberare spazio di archiviazione per ulteriori dati. La loro assenza può portare alla ridondanza dell'archiviazione, all'archiviazione continua di dati non necessari o indesiderati e alle difficoltà di individuazione dei dati.
Esistono diversi approcci alla gestione dei dati, come il data warehousing e l'uso dei data lake. Esistono anche varie soluzioni di archiviazione, gestione e analisi dei dati. Esempi di questi sono Druid, ClickHouse, Cassandra, Prometheus ed Elasticsearch. Questi approcci e soluzioni presentano diversi pro e contro, quindi è importante valutarli meticolosamente.
Confronti approfonditi o guide come questo articolo su Apache Druid contro Clickhouse può essere utile per scegliere gli strumenti e le strategie giuste da implementare. Diverse organizzazioni hanno esigenze diverse, mentre diverse soluzioni di archiviazione e analisi dei dati hanno anche funzioni e caratteristiche diverse. È importante accertare che la soluzione scelta corrisponda ai requisiti specifici di un'organizzazione.
2. Investire in un sistema efficiente per sradicare e prevenire il ROT
ROT si riferisce a dati ridondanti, obsoleti e banali. Almeno secondo la società di sicurezza dei dati ManageEngine Il 30 percento dei dati nelle organizzazioni può essere considerato ROT. Ciò rappresenta una sfida importante per la gestione dei dati, poiché non solo aggiunge costi di archiviazione dei dati non necessari; rende inoltre difficile trovare e utilizzare in modo efficiente dati specifici quando sono necessari.
Tutti i dati esistenti dovrebbero essere esaminati per determinare se devono ancora essere conservati o cancellati in modo permanente. Quindi, i restanti dati utili o potenzialmente utili possono essere inventariati e classificati/catalogati. Se è difficile accertare se un gruppo specifico di dati debba essere eliminato, è possibile assegnare loro una propria categoria o posizione di archiviazione che può essere facilmente rivisitata in seguito.
Avere un efficiente sistema di gestione dei dati, tuttavia, non riguarda solo l'hardware e il software. Un componente cruciale che dovrebbe essere preso in considerazione sono le persone che creano, utilizzano e gestiscono i dati in un'organizzazione. Devono essere adeguatamente orientati o formati sui ruoli che svolgono nell'eliminazione e nella prevenzione dei dati ROT.
3. Stabilire una chiara organizzazione dei dati e politiche di conservazione
Accenture lo dice quasi L'80% dei dati aziendali non è strutturato. Ciò significa che i dati conservati non hanno una classificazione logica. Diversi tipi di dati per usi diversi vengono archiviati arbitrariamente in varie posizioni. Alcuni dipendenti possono avere una qualche forma di smistamento o organizzazione, ma gli schemi che impiegano sono incoerenti.
La mancanza di organizzazione o struttura di archiviazione dei dati è uno dei motivi principali per cui alcuni dati diventano ridondanti e difficili da individuare. La ridondanza spreca spazio di archiviazione non solo in locale ma anche nel cloud. Quando si esaminano raccolte di file per individuare dati specifici, è necessaria la potenza di calcolo e si sprecano tempo e fatica inutili.
Per evitare inefficienze e sprechi, è consigliabile impostare fin dall'inizio un'organizzazione dei dati chiara e politiche di conservazione. Aiuta a definire i dettagli su quali dati archiviare, dove archiviarli, come classificare i dati e per quanto tempo conservarli in archiviazione. Aiuta anche a rendere una politica l'aggiunta di metadati a tutti i file archiviati per facilitare il rilevamento e la valutazione dei dati. Avere una politica chiara e completa sull'organizzazione e la conservazione dei dati ha anche il vantaggio aggiuntivo di facilitare l'automazione e il rispetto delle normative sui dati.
Inoltre, aiuta ad adottare il concetto di "unica fonte di verità". Ciò significa avere un repository centrale o un indice di tutti i dati in un'organizzazione. Ciò garantisce che vengano evitate inutili copie duplicate e rende anche più facile trovare i dati ogni volta che è necessario e valutare i dati per la conservazione o l'eliminazione.
4. Conoscere adeguatamente le leggi oi regolamenti sui dati
Alcune organizzazioni conservano i dati il più a lungo possibile perché non sono sicure di ciò che le leggi e le normative richiedono. Queste normative includono quelle stabilite da IRS e FTC, gli standard ISO, gli standard di settore come quelli in CCPA e PCI-DSS e le politiche aziendali interne come i requisiti di conservazione dei record dei dipendenti e gli schemi di controllo delle versioni.
Negli Stati Uniti, numerose leggi federali e statali prevedono obblighi di conservazione dei dati. Il Federal Information Security Management Act (FISMA), ad esempio, obbliga gli appaltatori e le agenzie federali a conservare i propri dati in archivio per almeno tre anni. La National Energy Commission (NERC) richiede alle entità legate all'energia di conservare i dati per un periodo compreso tra tre e sei mesi. L'Health Insurance Portability and Accountability Act (HIPAA) impone un minimo di sei anni di requisiti di archiviazione delle informazioni sanitarie per le entità legate alla salute.
Per le organizzazioni che operano in diverse parti del mondo, è necessario acquisire familiarità con le diverse leggi e normative di specifici paesi. In Svizzera, ad esempio, tutti i dati aziendali devono essere conservati per 10 anni dopo la fine di un esercizio finanziario. Inoltre, l'International Regulatory Framework for Banks (Basilea III) richiede alle banche di mantenere una cronologia dei dati compresa tra tre e sette anni.
Lo spreco di archiviazione dei dati non è una cosa da poco
Lo spreco di archiviazione dei dati non si limita ai costi digitali. Può anche avere un impatto offline. Secondo a Buoni consigli per una sessione di domande e risposte sulla Terra Verde, ogni anno vengono generate 0.2 tonnellate di anidride carbonica per ogni 100 GB di dati archiviati nel cloud. Ciò significa che il salvataggio non necessario dei dati sul cloud si traduce in emissioni che avrebbero potuto essere evitate.
Proprio come altre forme di spreco, lo spreco di archiviazione dei dati è evitabile o almeno riducibile. Garantire un'archiviazione dei dati efficiente e seguire le migliori pratiche può ridurre significativamente gli sprechi di archiviazione dei dati indesiderati, compresi i relativi effetti offline.
Immagine: Pixabay
Lascia un commento
Hanno qualcosa da dire su questo articolo? Aggiungi il tuo commento e avvia la discussione.