Mythe : Grâce au numérique et à l'informatique en nuage, les entreprises évitent de générer des déchets documentaires ou des déchets produits en relation avec le stockage d'informations. Les organisations se débarrassent des tas de déchets qui incluent les DVD ou Blu-Ray multimédias, les factures, les contrats, les rapports, les propositions, les budgets et la correspondance commerciale.
En réalité, le gaspillage se produit même avec la technologie numérique. Les gens créent divers types de déchets de données, notamment des données inutiles qui occupent de l'espace de stockage, des données non triées qui pourraient être utiles mais oubliées (et difficiles à localiser), des données en double et des données destinées à certains utilisateurs mais qui sont sous-utilisées ou pas du tout utilisées par les utilisateurs supposés. Ceux-ci sont gaspillage de données coûteux qui peuvent être résolus par les meilleures pratiques suivantes.
1. Acquérir le bon système et les bons outils pour gérer efficacement de grandes quantités de données
Les organisations qui se consacrent à la collecte et à l'analyse de données doivent garantir l'efficacité de la manière dont elles stockent, gèrent et éliminent les données. Les développeurs d'intelligence artificielle ou d'apprentissage automatique, en particulier, ont besoin d'un moyen efficace de classer et de gérer les données, car ils collectent et analysent en permanence une variété d'informations. Il doit y avoir un système qui facilite la localisation, la récupération et la suppression ultérieure des données afin de libérer de l'espace de stockage pour plus de données. Leur absence peut entraîner une redondance de stockage, le stockage continu de données inutiles ou indésirables et des difficultés de localisation des données.
Il existe différentes approches de traitement des données, telles que l'entreposage de données et l'utilisation de lacs de données. Il existe également diverses solutions de stockage, de gestion et d'analyse de données. Druide, ClickHouse, Cassandra, Prometheus et Elasticsearch en sont des exemples. Ces approches et solutions présentent différents avantages et inconvénients, il est donc important de les évaluer méticuleusement.
Des comparaisons approfondies ou des guides comme cet article sur Apache Druide contre Clickhouse peut être utile pour choisir les bons outils et stratégies à mettre en œuvre. Différentes organisations ont des besoins différents, tandis que différentes solutions de stockage et d'analyse de données ont également des fonctions et des fonctionnalités différentes. Il est important de s'assurer que la solution choisie correspond aux exigences spécifiques d'une organisation.
2. Investissez dans un système efficace pour éliminer et prévenir la ROT
ROT fait référence à des données redondantes, obsolètes et triviales. Selon la société de sécurité des données ManageEngine, au moins 30 % des données dans les organisations peuvent être considérées comme ROT. Cela représente un défi majeur pour la gestion des données, car cela n'ajoute pas seulement des coûts de stockage de données inutiles ; il est également difficile de trouver et d'utiliser efficacement des données spécifiques lorsqu'elles sont nécessaires.
Toutes les données existantes doivent être examinées pour déterminer si elles doivent encore être conservées ou supprimées définitivement. Ensuite, les données utiles ou potentiellement utiles restantes peuvent être inventoriées et classées/cataloguées. S'il est difficile de déterminer si un groupe spécifique de données doit être supprimé, on peut leur attribuer leur propre catégorie ou emplacement de stockage qui peut être facilement revisité ultérieurement.
Cependant, disposer d'un système de gestion de données efficace ne concerne pas seulement le matériel et les logiciels. Un élément crucial qui doit être pris en compte est les personnes qui créent, utilisent et gèrent les données dans une organisation. Ils doivent être correctement orientés ou formés sur les rôles qu'ils jouent dans l'élimination et la prévention des données ROT.
3. Établir une organisation claire des données et des politiques de conservation
Accenture dit que près de 80 % des données d'entreprise ne sont pas structurées. Cela signifie que les données conservées n'ont aucune classification logique. Différents types de données pour différentes utilisations sont stockées arbitrairement à divers endroits. Certains employés peuvent avoir une certaine forme de tri ou d'organisation, mais les schémas qu'ils emploient sont incohérents.
Le manque d'organisation ou de structure de stockage des données est l'une des principales raisons pour lesquelles certaines données deviennent redondantes et difficiles à localiser. La redondance gaspille de l'espace de stockage non seulement sur site mais également dans le cloud. Lorsque vous parcourez des collections de fichiers pour localiser des données spécifiques, cela implique une puissance de calcul et une perte de temps et d'efforts inutiles.
Pour éviter les inefficacités et les gaspillages, il est conseillé de mettre en place dès le départ des politiques claires d'organisation et de conservation des données. Il est utile de définir les détails concernant les données à stocker, où les stocker, comment classer les données et combien de temps conserver les données dans le stockage. Il est également utile d'en faire une politique consistant à ajouter des métadonnées à tous les fichiers stockés pour faciliter la découverte et l'évaluation des données. Avoir une politique claire et complète sur l'organisation et la conservation des données a également l'avantage supplémentaire de faciliter l'automatisation et de se conformer aux réglementations sur les données.
De plus, cela aide à adopter le concept de « source unique de vérité ». Cela signifie avoir un référentiel central ou un index de toutes les données d'une organisation. Cela garantit que les copies en double inutiles sont évitées et facilite également la recherche de données chaque fois que cela est nécessaire et l'évaluation des données pour la conservation ou la suppression.
4. Bien connaître les lois ou réglementations relatives aux données
Certaines organisations conservent les données aussi longtemps qu'elles le peuvent car elles ne sont pas sûres des exigences des lois et réglementations. Ces réglementations incluent celles établies par l'IRS et la FTC, les normes ISO, les normes de l'industrie telles que celles de CCPA et PCI-DSS, et les politiques internes de l'entreprise telles que les exigences de conservation des dossiers des employés et les systèmes de contrôle de version.
Aux États-Unis, un certain nombre de lois fédérales et étatiques prévoient des mandats de conservation des données. La loi fédérale sur la gestion de la sécurité de l'information (FISMA), pour sa part, oblige les sous-traitants et les agences fédérales à conserver leurs données en stockage pendant au moins trois ans. La Commission nationale de l'énergie (NERC) exige que les entités liées à l'énergie conservent les données pendant trois à six mois. La loi HIPAA (Health Insurance Portability and Accountability Act) impose un minimum d'au moins six ans d'exigence d'archivage des informations de santé pour les entités liées à la santé.
Pour les organisations opérant dans différentes parties du monde, il est nécessaire de se familiariser avec les différentes lois et réglementations de pays spécifiques. En Suisse, par exemple, toutes les données commerciales doivent être conservées pendant 10 ans après la fin d'un exercice. En outre, le cadre réglementaire international pour les banques (Bâle III) exige que les banques conservent un historique des données de trois à sept ans.
Les déchets de stockage de données ne sont pas une mince affaire
Les déchets de stockage de données ne se limitent pas aux coûts numériques. Cela peut également avoir un impact hors ligne. Selon un Conseils avisés pour une séance de questions-réponses sur Green Earth, 0.2 tonne de dioxyde de carbone est générée chaque année pour 100 Go de données stockées dans le cloud. Cela signifie que la sauvegarde inutile de données sur le cloud se traduit par des émissions qui auraient pu être évitées.
Tout comme les autres formes de déchets, les déchets de stockage de données sont évitables ou du moins réductibles. Garantir un stockage efficace des données et suivre les meilleures pratiques peut réduire considérablement le gaspillage de stockage de données indésirable, y compris ses effets correspondants hors ligne.
Image: Pixabay
Laissez un commentaire
Avez vous quelque chose à dire sur cet article? Ajoutez votre commentaire et lancez la discussion.