Мит: Поради дигиталните технологии и облачните изчисления, фирмите избягват генерирането на документални отпадъци или отпадъци, произведени във връзка със съхраняването на информация. Организациите се справят с купищата боклук, които включват мултимедийни DVD или Blu-Ray дискове, фактури, договори, отчети, предложения, бюджети и бизнес кореспонденция.
В действителност загубата се случва дори с цифровите технологии. Хората създават различни видове загуба на данни, включително ненужни данни, които заемат място за съхранение, несортирани данни, които биха могли да бъдат полезни, но забравени (и трудни за намиране), дублирани данни и данни, предназначени за определени потребители, но се използват недостатъчно или изобщо не се използват от предполагаемите потребители. Това са скъпоструваща загуба на данни които могат да бъдат адресирани чрез следните най-добри практики.
1. Придобийте правилната система и инструменти за ефективна работа с големи количества данни
Организациите, които се занимават със събиране на данни и анализи, трябва да гарантират ефективност в начина, по който съхраняват, управляват и изхвърлят данни. По-специално разработчиците на AI или машинно обучение се нуждаят от ефективен начин за класифициране и управление на данни, тъй като те постоянно събират и анализират разнообразна информация. Трябва да има система, която улеснява намирането, извличането и последващото изтриване на данни, за да се освободи място за съхранение за повече данни. Липсата на което може да доведе до излишък на съхранение, продължаващо съхранение на ненужни или нежелани данни и трудности при намирането на данни.
Съществуват различни подходи за обработка на данни, като например съхранение на данни и използване на езера от данни. Има и различни решения за съхранение, управление и анализ на данни. Примери за които са Druid, ClickHouse, Cassandra, Prometheus и Elasticsearch. Тези подходи и решения представят различни плюсове и минуси, така че е важно да ги оцените щателно.
Задълбочени сравнения или ръководства като тази статия Apache Druid срещу Clickhouse могат да бъдат полезни при избора на правилните инструменти и стратегии за прилагане. Различните организации имат различни нужди, докато различните решения за съхранение на данни и анализ също имат различни функции и функции. Важно е да се уверите, че избраното решение отговаря на специфичните изисквания на дадена организация.
2. Инвестирайте в ефективна система за изкореняване и предотвратяване на ROT
ROT се отнася до данни, които са излишни, остарели и тривиални. Поне според фирмата за сигурност на данните ManageEngine 30 процента от данните в организациите могат да се считат за ROT. Това представлява голямо предизвикателство за управлението на данни, тъй като не само добавя ненужни разходи за съхранение на данни; също така затруднява ефективното намиране и използване на конкретни данни, когато са необходими.
Всички съществуващи данни трябва да бъдат прегледани, за да се определи дали все още трябва да бъдат запазени или окончателно изтрити. След това останалите полезни или потенциално полезни данни могат да бъдат инвентаризирани и класифицирани/каталогизирани. Ако е трудно да се установи дали определен набор от данни трябва да бъде изтрит, те могат да получат своя собствена категория или място за съхранение, което може лесно да бъде прегледано по-късно.
Наличието на ефективна система за управление на данни обаче не е свързано само с хардуера и софтуера. Един важен компонент, който трябва да се вземе предвид, са хората, които създават, използват и управляват данните в една организация. Те трябва да бъдат правилно ориентирани или обучени за ролите, които играят при елиминирането и предотвратяването на ROT данни.
3. Установете ясна организация на данните и политики за съхранение
Accenture казва, че почти 80 процента от корпоративните данни са неструктурирани. Това означава, че съхраняваните данни нямат логическа класификация. Различни видове данни за различни цели се съхраняват произволно на различни места. Някои служители може да имат някаква форма на сортиране или организация, но схемите, които използват, са непоследователни.
Липсата на организация или структура за съхранение на данни е една от най-големите причини някои данни да станат излишни и трудни за намиране. Резервирането губи място за съхранение не само на място, но и в облака. Когато разглеждате колекции от файлове, за да намерите конкретни данни, има включена изчислителна мощност и ненужно губене на време и усилия.
За да избегнете неефективност и загуба, препоръчително е да настроите ясна организация на данните и политики за съхранение от самото начало. Помага да се изложат подробности за това какви данни да се съхраняват, къде да се съхраняват, как да се класифицират данните и колко дълго да се съхраняват данните в хранилището. Също така помага да се въведе политика за добавяне на метаданни към всички файлове, които се съхраняват, за да се подпомогне откриването и оценката на данни. Наличието на ясна и всеобхватна политика за организиране и задържане на данни също има допълнителната полза от улесняването на автоматизацията и спазването на разпоредбите за данни.
Освен това помага да се възприеме концепцията за „единния източник на истина“. Това означава да имате централно хранилище или индекс на всички данни в една организация. Това гарантира, че се избягват ненужни дублиращи се копия и също така улеснява намирането на данни, когато са необходими, и оценката на данните за запазване или изтриване.
4. Бъдете надлежно запознати със законите или разпоредбите за данни
Някои организации пазят данни толкова дълго, колкото могат, защото не са сигурни какво изискват законите и разпоредбите. Тези разпоредби включват тези, определени от IRS и FTC, стандарти ISO, индустриални стандарти като тези в CCPA и PCI-DSS и вътрешни фирмени политики като изисквания за запазване на записи на служители и схеми за контрол на версиите.
В Съединените щати редица федерални и щатски закони имат мандати за запазване на данни. Федералният закон за управление на сигурността на информацията (FISMA), от една страна, задължава изпълнителите и федералните агенции да съхраняват своите данни на съхранение най-малко три години. Националната енергийна комисия (NERC) изисква от свързаните с енергетиката субекти да съхраняват данни от три до шест месеца. Законът за преносимост и отчетност на здравното осигуряване (HIPAA) налага изискване за минимум най-малко шест години архив на здравна информация за субекти, свързани със здравето.
За организации, работещи в различни части на света, е необходимо да се запознаят с различните закони и разпоредби на конкретни държави. В Швейцария, например, всички бизнес данни трябва да се съхраняват 10 години след края на финансовата година. Освен това Международната регулаторна рамка за банките (Базел III) изисква банките да поддържат хронология на данните от три до седем години.
Отпадъците при съхранение на данни не са тривиални
Отпадъците при съхранение на данни не се ограничават до цифрови разходи. Може да има и офлайн въздействие. Според а Добър съвет за въпроси и отговори за Зелена Земя0.2 тона въглероден диоксид се генерират всяка година за всеки 100 GB данни, съхранявани в облака. Това означава, че ненужното запазване на данни в облака води до емисии, които биха могли да бъдат избегнати.
Точно като други форми на отпадъци, отпадъците от съхранение на данни могат да бъдат избегнати или поне намалени. Осигуряването на ефективно съхранение на данни и спазването на най-добрите практики може значително да ограничи нежеланото разхищаване на данни, включително съответните ефекти офлайн.
На снимката: pixabay
Оставете коментар
Имате ли какво да кажете за тази статия? Добавете вашия коментар и започнете дискусията.