Mit: Ze względu na technologię cyfrową i przetwarzanie w chmurze firmy unikają generowania śmieci dokumentalnych lub odpadów powstałych w związku z przechowywaniem informacji. Organizacje mogą pozbyć się stosów śmieci, takich jak multimedialne płyty DVD lub Blu-Ray, faktury, umowy, raporty, propozycje, budżety i korespondencja biznesowa.
W rzeczywistości marnotrawstwo ma miejsce nawet w przypadku technologii cyfrowej. Ludzie tworzą różne rodzaje marnotrawstwa danych, w tym niepotrzebne dane, które zajmują miejsce w pamięci, nieposortowane dane, które mogą być przydatne, ale zapomniane (i trudne do zlokalizowania), duplikaty danych oraz dane przeznaczone dla określonych użytkowników, ale nie są wykorzystywane lub w ogóle nie są wykorzystywane przez rzekomych użytkowników. To są kosztowne marnowanie danych które można rozwiązać za pomocą następujących najlepszych praktyk.
1. Zdobądź odpowiedni system i narzędzia do efektywnej obsługi dużych ilości danych
Organizacje zajmujące się gromadzeniem i analizą danych powinny zapewnić wydajność w sposobie przechowywania, zarządzania i usuwania danych. W szczególności twórcy sztucznej inteligencji lub uczenia maszynowego potrzebują wydajnego sposobu klasyfikowania danych i zarządzania nimi, ponieważ stale gromadzą i analizują różnorodne informacje. Musi istnieć system, który ułatwi lokalizowanie, pobieranie, a następnie usuwanie danych, aby zwolnić miejsce na więcej danych. Brak których może prowadzić do nadmiarowości pamięci, ciągłego przechowywania niepotrzebnych lub niechcianych danych oraz trudności w lokalizacji danych.
Istnieją różne podejścia do obsługi danych, takie jak hurtownie danych i korzystanie z jezior danych. Istnieją również różne rozwiązania do przechowywania danych, zarządzania i analizy. Przykładami są Druid, ClickHouse, Cassandra, Prometheus i Elasticsearch. Te podejścia i rozwiązania mają różne plusy i minusy, dlatego ważne jest, aby je dokładnie ocenić.
Dogłębne porównania lub przewodniki, takie jak ten artykuł o Apache Druid kontra Clickhouse mogą być przydatne przy wyborze odpowiednich narzędzi i strategii do wdrożenia. Różne organizacje mają różne potrzeby, a różne rozwiązania do przechowywania i analizy danych mają również różne funkcje i cechy. Ważne jest, aby upewnić się, że wybrane rozwiązanie odpowiada specyficznym wymaganiom organizacji.
2. Zainwestuj w wydajny system, aby wykorzenić i zapobiec ROT
ROT odnosi się do danych, które są zbędne, przestarzałe i trywialne. Według firmy ManageEngine zajmującej się bezpieczeństwem danych przynajmniej 30 procent danych w organizacjach można uznać za ROT. Stanowi to poważne wyzwanie dla zarządzania danymi, ponieważ nie tylko zwiększa niepotrzebne koszty przechowywania danych; utrudnia to również sprawne znajdowanie i wykorzystywanie określonych danych, gdy są one potrzebne.
Wszystkie istniejące dane należy przeanalizować w celu ustalenia, czy nadal należy je zachować, czy też trwale usunąć. Następnie pozostałe przydatne lub potencjalnie przydatne dane można zinwentaryzować i sklasyfikować/skatalogować. Jeśli trudno jest ustalić, czy określona grupa danych powinna zostać usunięta, można im nadać własną kategorię lub miejsce przechowywania, do których można później łatwo wrócić.
Posiadanie wydajnego systemu zarządzania danymi to jednak nie tylko sprzęt i oprogramowanie. Jednym z kluczowych elementów, który należy wziąć pod uwagę, są osoby tworzące, wykorzystujące i zarządzające danymi w organizacji. Muszą być odpowiednio zorientowani lub przeszkoleni w zakresie ról, które odgrywają w eliminowaniu i zapobieganiu danych ROT.
3. Ustal przejrzystą organizację i zasady przechowywania danych
Accenture mówi, że prawie 80 procent danych przedsiębiorstwa jest nieustrukturyzowanych. Oznacza to, że przechowywane dane nie mają logicznej klasyfikacji. Różne rodzaje danych do różnych zastosowań są arbitralnie przechowywane w różnych lokalizacjach. Niektórzy pracownicy mogą mieć jakąś formę sortowania lub organizacji, ale stosowane przez nich schematy są niespójne.
Brak organizacji lub struktury przechowywania danych jest jednym z głównych powodów, dla których niektóre dane stają się zbędne i trudne do zlokalizowania. Nadmiarowość marnuje przestrzeń dyskową nie tylko lokalnie, ale także w chmurze. Przeglądając zbiory plików w celu zlokalizowania określonych danych, wiąże się to z mocą obliczeniową oraz niepotrzebną stratą czasu i wysiłku.
Aby uniknąć nieefektywności i marnotrawstwa, wskazane jest, aby od samego początku ustalić przejrzystą organizację danych i zasady przechowywania. Pomaga określić szczegóły dotyczące tego, jakie dane należy przechowywać, gdzie je przechowywać, jak klasyfikować dane i jak długo przechowywać dane. Pomaga również wprowadzić zasadę dodawania metadanych do wszystkich przechowywanych plików, aby ułatwić wykrywanie i ocenę danych. Posiadanie jasnej i kompleksowej polityki dotyczącej organizacji i przechowywania danych ma również dodatkową zaletę ułatwiającą automatyzację i zgodność z przepisami dotyczącymi danych.
Ponadto pomaga przyjąć koncepcję „pojedynczego źródła prawdy”. Oznacza to posiadanie centralnego repozytorium lub indeksu wszystkich danych w organizacji. Gwarantuje to uniknięcie niepotrzebnych duplikatów, a także ułatwia znajdowanie danych w razie potrzeby oraz ocenę danych pod kątem przechowywania lub usuwania.
4. Należy dokładnie zapoznać się z przepisami lub regulacjami dotyczącymi danych
Niektóre organizacje przechowują dane tak długo, jak to możliwe, ponieważ nie są pewne, czego wymagają przepisy i regulacje. Przepisy te obejmują przepisy ustanowione przez IRS i FTC, standardy ISO, standardy branżowe, takie jak CCPA i PCI-DSS, oraz wewnętrzne zasady firmy, takie jak wymagania dotyczące przechowywania dokumentacji pracowniczej i systemy kontroli wersji.
W Stanach Zjednoczonych szereg przepisów federalnych i stanowych nakłada nakaz przechowywania danych. Po pierwsze, Federalna Ustawa o Zarządzaniu Bezpieczeństwem Informacji (FISMA) zobowiązuje wykonawców i agencje federalne do przechowywania ich danych przez co najmniej trzy lata. Narodowa Komisja Energetyczna (NERC) wymaga od podmiotów związanych z energią przechowywania danych przez okres od trzech do sześciu miesięcy. Ustawa o przenośności i odpowiedzialności w ubezpieczeniach zdrowotnych (HIPAA) nakłada na podmioty związane ze zdrowiem wymóg archiwizowania informacji zdrowotnych co najmniej przez okres co najmniej sześciu lat.
W przypadku organizacji działających w różnych częściach świata konieczne jest zapoznanie się z różnymi prawami i regulacjami poszczególnych krajów. Na przykład w Szwajcarii wszystkie dane biznesowe muszą być przechowywane przez 10 lat po zakończeniu roku obrotowego. Ponadto Międzynarodowe Ramy Regulacyjne dla Banków (Bazylea III) wymagają od banków utrzymywania historii danych od trzech do siedmiu lat.
Odpady z przechowywania danych nie są sprawą trywialną
Odpady związane z przechowywaniem danych nie ograniczają się do kosztów cyfrowych. Może mieć również wpływ w trybie offline. Według Dobre rady dotyczące ekologicznej ziemi — pytania i odpowiedzi, co roku na każde 0.2 GB danych przechowywanych w chmurze generuje się 100 tony dwutlenku węgla. Oznacza to, że niepotrzebne zapisywanie danych w chmurze przekłada się na emisje, których można było uniknąć.
Podobnie jak w przypadku innych form marnotrawstwa, marnotrawstwa danych można uniknąć lub przynajmniej można go ograniczyć. Zapewnienie wydajnego przechowywania danych i przestrzeganie najlepszych praktyk może znacznie ograniczyć niepożądane marnotrawstwo przechowywania danych, w tym związane z tym skutki w trybie offline.
Obraz: Pixabay
Zostaw komentarz
Masz coś do powiedzenia na temat tego artykułu? Dodaj swój komentarz i rozpocznij dyskusję.