Mito: Gracias a la tecnología digital y la computación en la nube, las empresas evitan generar basura documental o desperdicios producidos en relación con el almacenamiento de información. Las organizaciones pueden deshacerse de las pilas de basura que incluyen DVD o Blu-Ray multimedia, facturas, contratos, informes, propuestas, presupuestos y correspondencia comercial.
En realidad, el desperdicio ocurre incluso con la tecnología digital. Las personas crean varios tipos de desperdicio de datos, incluidos datos innecesarios que ocupan espacio de almacenamiento, datos desordenados que podrían ser útiles pero olvidados (y difíciles de ubicar), datos duplicados y datos destinados a ciertos usuarios pero que están infrautilizados o no son utilizados en absoluto por los supuestos usuarios. Estos son costoso desperdicio de datos que se pueden abordar con las siguientes prácticas recomendadas.
1. Adquirir el sistema y las herramientas adecuadas para manejar de manera eficiente grandes cantidades de datos
Las organizaciones que están en el negocio de la recopilación y el análisis de datos deben garantizar la eficiencia en la forma en que almacenan, administran y descartan los datos. Los desarrolladores de inteligencia artificial o aprendizaje automático, en particular, necesitan una forma eficiente de clasificar y administrar datos, ya que constantemente recopilan y analizan una variedad de información. Tiene que haber un sistema que facilite la localización, recuperación y posterior eliminación de datos para liberar espacio de almacenamiento para más datos. La ausencia de los cuales puede conducir a la redundancia de almacenamiento, el almacenamiento continuo de datos innecesarios o no deseados y dificultades para localizar datos.
Existen diferentes enfoques para el manejo de datos, como el almacenamiento de datos y el uso de lagos de datos. También hay varias soluciones de almacenamiento, gestión y análisis de datos. Algunos ejemplos son Druid, ClickHouse, Cassandra, Prometheus y Elasticsearch. Estos enfoques y soluciones presentan diferentes pros y contras, por lo que es importante evaluarlos minuciosamente.
Comparaciones en profundidad o guías como este artículo sobre Apache Druida contra Clickhouse puede ser útil para elegir las herramientas y estrategias adecuadas para implementar. Las diferentes organizaciones tienen diferentes necesidades, mientras que las diferentes soluciones de análisis y almacenamiento de datos también tienen diferentes funciones y características. Es importante asegurarse de que la solución elegida coincida con los requisitos específicos de una organización.
2. Invertir en un sistema eficiente para erradicar y prevenir la ROT
ROT se refiere a datos que son redundantes, obsoletos y triviales. Según la empresa de seguridad de datos ManageEngine, al menos El 30 por ciento de los datos en las organizaciones pueden considerarse ROT. Esto presenta un gran desafío para la gestión de datos, ya que no solo agrega costos de almacenamiento de datos innecesarios; también dificulta la búsqueda y el uso eficiente de datos específicos cuando se necesitan.
Todos los datos existentes deben examinarse para determinar si aún deben conservarse o eliminarse permanentemente. Luego, los datos restantes útiles o potencialmente útiles pueden ser inventariados y clasificados/catalogados. Si es difícil determinar si se debe eliminar un conjunto específico de datos, se les puede asignar su propia categoría o ubicación de almacenamiento que se puede revisar fácilmente más adelante.
Sin embargo, tener un sistema de gestión de datos eficiente no se trata solo del hardware y el software. Un componente crucial que debe tenerse en cuenta son las personas que crean, usan y administran los datos en una organización. Deben estar debidamente orientados o capacitados sobre los roles que desempeñan en la eliminación y prevención de datos ROT.
3. Establecer políticas claras de organización y retención de datos
Accenture dice que casi El 80 por ciento de los datos empresariales no están estructurados. Esto significa que los datos que se guardan no tienen una clasificación lógica. Diferentes tipos de datos para diferentes usos se almacenan en varios lugares de forma arbitraria. Algunos empleados pueden tener alguna forma de clasificación u organización, pero los esquemas que emplean son inconsistentes.
La falta de organización o estructura de almacenamiento de datos es una de las principales razones por las que algunos datos se vuelven redundantes y difíciles de localizar. La redundancia desperdicia espacio de almacenamiento no solo en las instalaciones sino también en la nube. Cuando se revisan colecciones de archivos para ubicar datos específicos, se involucra potencia de cómputo y se desperdicia tiempo y esfuerzo innecesarios.
Para evitar ineficiencias y desperdicios, es recomendable establecer políticas claras de organización y retención de datos desde el primer momento. Ayuda a diseñar los detalles sobre qué datos almacenar, dónde almacenarlos, cómo clasificar los datos y cuánto tiempo mantener los datos almacenados. También ayuda convertirlo en una política para agregar metadatos a todos los archivos que se almacenan para ayudar al descubrimiento y la evaluación de datos. Tener una política clara y completa sobre la organización y retención de datos también tiene el beneficio adicional de facilitar la automatización y cumplir con las regulaciones de datos.
Además, ayuda a adoptar el concepto de “fuente única de la verdad”. Esto significa tener un depósito central o índice de todos los datos en una organización. Esto garantiza que se eviten las copias duplicadas innecesarias y también facilita la búsqueda de datos cuando sea necesario y la evaluación de los datos para su retención o eliminación.
4. Estar debidamente familiarizado con las leyes o regulaciones de datos
Algunas organizaciones conservan los datos todo el tiempo que pueden porque no están seguras de lo que exigen las leyes y reglamentos. Estas regulaciones incluyen las establecidas por el IRS y la FTC, las normas ISO, las normas de la industria como las de CCPA y PCI-DSS, y las políticas internas de la empresa, como los requisitos de retención de registros de los empleados y los esquemas de control de versiones.
En los Estados Unidos, varias leyes federales y estatales tienen mandatos de retención de datos. La Ley Federal de Gestión de Seguridad de la Información (FISMA), por ejemplo, obliga a los contratistas y agencias federales a mantener sus datos almacenados durante al menos tres años. La Comisión Nacional de Energía (NERC) exige que las entidades relacionadas con la energía conserven los datos durante tres a seis meses. La Ley de Portabilidad y Responsabilidad de Seguros Médicos (HIPAA) impone un mínimo de al menos seis años de requisito de archivo de información médica para las entidades relacionadas con la salud.
Para las organizaciones que operan en diferentes partes del mundo, es necesario familiarizarse con las diferentes leyes y reglamentos de países específicos. En Suiza, por ejemplo, se exige que todos los datos comerciales se conserven durante 10 años después del final de un año fiscal. Además, el Marco regulatorio internacional para bancos (Basilea III) requiere que los bancos mantengan un historial de datos de tres a siete años.
El desperdicio de almacenamiento de datos no es un asunto trivial
El desperdicio de almacenamiento de datos no se limita a los costos digitales. También puede tener un impacto fuera de línea. De acuerdo a un Consejos sólidos para una sesión de preguntas y respuestas sobre la Tierra Verde, cada año se generan 0.2 toneladas de dióxido de carbono por cada 100 GB de datos almacenados en la nube. Esto significa que el almacenamiento innecesario de datos en la nube se traduce en emisiones que podrían haberse evitado.
Al igual que otras formas de desperdicio, el desperdicio de almacenamiento de datos es evitable o al menos reducible. Garantizar un almacenamiento de datos eficiente y seguir las mejores prácticas puede reducir significativamente el desperdicio de almacenamiento de datos no deseado, incluidos sus efectos correspondientes fuera de línea.
Imagen: Pixabay
Comente
¿Tienes algo que decir sobre este artículo? Agregue su comentario y comience la discusión.