Dane to nowe złoto
3 sierpnia 2021
Czy wyrażenia „dane to nowe złoto” lub „dane to nowa ropa” to tylko slogany marketingowe mające zachęcić firmy do wydawania większych pieniędzy na technologię Big Data? A może są to metafory opisujące nowy paradygmat, który zrewolucjonizuje świat?
Spróbujmy się tego dowiedzieć i zacznijmy od kilku faktów.
Zarówno ropa naftowa, jak i złoto były zakopane głęboko pod powierzchnią ziemi przez miliony lat. I oba surowce zaczęły być cenne dla ludzi dopiero wtedy, gdy nauczyliśmy się je wydobywać spod ziemi i przetwarzać jako materię do produkcji biżuterii lub paliwa do oświetlenia, ogrzewania, transportu i energii. Podobnie dane istnieją od wieków, począwszy od wczesnych sumeryjskich i chińskich systemów pisma, poprzez wieki danych w drukowanych książkach, a od XX wieku w formie cyfrowej w naszych systemach komputerowych.
Ponadto dane mają wartość tylko wtedy, gdy są podane w odpowiednim formacie, tak, aby można je było odczytać lub skonsumować w inny sposób, a co ważniejsze, aby były dostępne dla ludzi, którzy ich potrzebują, kiedy ich potrzebują. Dlatego właśnie biblioteki powstały po to, by przechowywać książki, umożliwiając uczonym łatwy dostęp do potrzebnych im informacji. Przez wieki korzystanie z danych było na etapie porównywalnym z używaniem oleju do zapalania lamp benzynowych.
Zaczęło to przyspieszać wraz z nastaniem ery cyfrowej. Już od pierwszych dni komputerów opracowywano metody, dzięki którym informacje stawały się czytelne i dostępne dla ludzi. Narodziny światowej sieci internetowej z możliwością hiperłączy były kolejnym wielkim krokiem naprzód w tworzeniu wartości z danych, umożliwiając również przeczytanie tego artykułu.
Dane wszechobecne
Istnieje duża różnica między danymi, a złotem czy ropą. Podczas, gdy dostępne ilości nowego złota i ropy kurczą się, dostępne ilości danych rosną wykładniczo. Jak widać na poniższym wykresie, ilość danych cyfrowych na świecie podwaja się mniej więcej co trzy lata. 74 zettabajty, którymi dziś dysponujemy, to 79 miliardów terabajtów, czyli ponad 10 terabajtów na każdego żyjącego człowieka na Ziemi!
Kolejną istotną różnicą jest to, że ta rosnąca ilość danych jest tworzona w coraz większej ilości wariantów. Podczas gdy złoto i ropa w 2021 roku wciąż wyglądają tak samo, jak wieki temu, dane stały się tak zmienne, że ich ogarnięcie staje się niemożliwe dla człowieka. Jednocześnie wszyscy wiemy, że wgląd w fakty jest kluczem do podejmowania decyzji. Patrząc kilkadziesiąt lat wstecz, informacje do podejmowania decyzji opierały się na niewielkim zestawie tabel, które należało podsumować i przedstawić w raporcie (w tamtych czasach Excel był rewolucją!) i w wielu organizacjach nadal jest to rdzeń systemu wspomagania decyzji.
Dane to możliwości
Pojawiła się wielka szansa. W rosnącym stosie danych, dzięki biznesowo połączonemu światu, znajdują się również informacje o globalnych trendach gospodarczych i rynkach, czynnikach geopolitycznych, zdarzeniach w łańcuchach dostaw, zachowaniach konsumentów i klientów itd. A w murach przedsiębiorstwa, dzięki przemysłowemu internetowi rzeczy (ang. Industrial Internet of Things – IIoT), automatyzacji procesów (ang. Robotic Process Automation – RPA) oraz zarządzaniu procesami biznesowymi i przepływem pracy (ang. Business Process Management – BPM), dostępne stają się zupełnie nowe strumienie danych.
Przedsiębiorstwa, którym udaje się uchwycić bogactwo różnorodnych danych i są w stanie przekształcić je w format odpowiedni do podejmowania decyzji, mają ogromną przewagę nad tymi, które podejmują decyzje wyłącznie w oparciu o tradycyjne raportowanie. Pierwsza kategoria firm będzie patrzyła na fakty w dużo szerszym horyzoncie i z dużo większą ilością kolorów w obrazie.
28 stycznia 2021 roku w Washington Post ukazał się następujący nagłówek:
„Izrael przesuwa się na czoło kolejki po szczepionki, oferując Pfizerowi dostęp do bazy danych służby zdrowia kraju”.
Nie tylko cena zapłacona za szczepionkę sprawiła, że Pfizer postanowił nadać priorytet dostawom do Izraela. Firma prawdopodobnie wyżej ceni bezpośredni dostęp do danych dotyczących opieki zdrowotnej w tym kraju niż faktyczną transakcję pieniężną. Nie może być lepszej ilustracji tego, jak dane stają się nowym złotem. Artykuł oczywiście zwrócił uwagę na potencjalne naruszenie prywatności poprzez dzielenie się danymi zdrowotnymi ludzi. Tak więc nagłówek jest również ilustracją tego, że w świecie Big Data, obawy o prywatność i bezpieczeństwo danych stają się coraz bardziej gorącym tematem.
W biznesie podejmowanie decyzji nie jest wyłącznie obowiązkiem kierownictwa. Każda osoba w organizacji, która ma dostęp do bogatych zbiorów danych w kontekście swojej pracy, będzie podejmować lepsze decyzje, a tym samym lepiej wykonywać swoją pracę. Podczas, gdy w dawnych czasach kierownictwo niechętnie dzieliło się zbyt dużą ilością informacji z pracownikami, w dzisiejszych organizacjach zdają sobie oni sprawę z korzyści płynących z demokratyzacji informacji, podobnie jak w przypadku Google, Wikipedii i wielu innych internetowych źródeł informacji, które przyniosły korzyści społeczeństwu. Liderzy o autorytarnym sposobie myślenia, którzy nie dostrzegają wartości demokratyzacji informacji, stanowią mniejszość.
Skontaktuj się z naszym ekspertem
Coraz powszechniejsze jest przekonanie, że tam, gdzie w starym stylu raportowanie było uważane za nieunikniony koszt, nowy styl strategii danych uznaje, że dane, jeśli są dobrze zarządzane, przede wszystkim tworzą dużą wartość dla firmy. W nadchodzących latach doprowadzi to do powstania zupełnie nowych firm specjalizujących się w kupnie i sprzedaży danych tzw. monetyzacji danych, a w tym momencie dane staną się niemal dosłownie jak ropa naftowa lub złoto towarem handlowym. Ale nawet nie myśląc tak daleko, każde przedsiębiorstwo musi zdać sobie sprawę, że kluczowa staje się ochrona i maksymalne wykorzystanie wartości danych, które tworzą w swoich murach.
Ewolucja technologii danych
Patrząc na rozwój technologii, nowe przepływy danych stają się również pętlą zwrotną w procesach, które są coraz bardziej zautomatyzowane. Na przykład, dane ze zautomatyzowanego przepływu pracy mogą być wykorzystywane do wykrywania wąskich gardeł i dokonywania automatycznych korekt w samym przepływie, w celu zrównoważenia obłożenia pracą.
To prowadzi nas do kolejnego ważnego aspektu technologicznego nowoczesnego zarządzania danymi. Jak wspomniano, ogromne ilości i różnorodność danych uniemożliwiają ludziom znalezienie potrzebnych informacji i przekształcenie ich w użyteczny format. W tym miejscu do gry wkraczają algorytmy: są to inteligentne elementy programowalnej logiki, które są w stanie przedrzeć się przez terabajty danych i wykryć wzorce w informacjach, istotne dla procesu decyzyjnego, który muszą wspierać. Nazywamy to inteligentną logiką, ponieważ może ona „uczyć się” na podstawie poprzednich wyników w pętli sprzężenia zwrotnego i z każdą iteracją coraz lepiej wykonywać swoje zadanie. Inne algorytmy są wyspecjalizowane w poprawianiu błędów i luk w informacjach (oczyszczanie), a inne algorytmy zajmują się harmonizacją i agregacją danych. Wszystkie te techniki wchodzą w zakres tak zwanego „przygotowania danych”, czyli udostępniania danych konsumentom.
Zarządzanie danymi
Po przygotowaniu, duże ilości nowego złota muszą być również przechowywane w nowym „Fort Knox”. Jezioro danych jest technologiczną odpowiedzią z koncepcją przechowywania danych, która jest zaprojektowana do wchłaniania dużych ilości danych w dowolnym formacie i automatycznego replikowania ich w rozproszonej sieci serwerów. Nawet bez wykonywania kopii zapasowych, dane w jeziorze danych pozostaną dostępne, bez zakłóceń, dla wsparcia decyzji i innych celów (np. sprawdzania zgodności z przepisami).
Wszystkie te nowe możliwości złotych danych nie oznaczają, że nie ma żadnych wyzwań.
Pierwszym problemem jest zarządzanie nimi: należy określić zasady zarządzania jakością, bezpieczeństwem i cyklem życia danych. Na ile wiarygodne są dane? Jaki jest ich rodowód? Czy są one poufne? Kto może mieć do nich dostęp? Jak długo możemy przechowywać dane ze względu na zgodność z przepisami? Do stosowania odpowiednich procedur potrzebne są narzędzia. W świecie Big Data, zarządzanie danymi może być efektywne tylko wtedy, gdy narzędzia posiadają pewną formę inteligencji, tak, aby procedury były stosowane automatycznie, bez konieczności ręcznego zarządzania każdym źródłem danych.
Głównym wyzwaniem, biorąc pod uwagę bogactwo możliwości, jest określenie najlepszych przypadków użycia danych dla konkretnego przedsiębiorstwa. Zaczyna się to od pytań: na jakie wyzwania staramy się odpowiedzieć, jakie problemy staramy się rozwiązać? Odpowiedzi będą się bardzo różnić pomiędzy różnymi biznesami.
Producent samochodów będzie prawdopodobnie szukał przyczyn i wpływu na zakłócenia w łańcuchu dostaw spowodowane pandemią lub zakłóceniami geopolitycznymi. Jak ewolucja zmian klimatycznych wpływa na sprzedaż samochodów? Oczywiście sprzedaż pojazdów elektrycznych wzrasta, ale jakie jest tempo tej zmiany i jakie są różnice regionalne? Jaki typ pojazdów elektrycznych prowadzi w wyścigu w poszczególnych regionach? Można to analizować na poziomie globalnym, ale równie istotne jest analizowanie tego w kontekście ekosfery firmy. To bardzo pomoże w podjęciu decyzji, kiedy i gdzie inwestować w moce produkcyjne i logistykę.
Znalezienie właściwych narzędzi analitycznych
Coraz bardziej wydajne narzędzia analityczne stały się dostępne, aby wykorzystać wartość ukrytą w jeziorach danych, skarbcach nowego złota.
Jako wiodący dostawca rozwiązań w chmurze dla przedsiębiorstw produkcyjnych, firma QAD stale inwestuje we wbudowane w system informatyczny rozwiązania analityczne. Począwszy od 2019 roku, QAD Adaptive ERP korzysta z jeziora danych Cassandra, aby przechwytywać zarówno dane ERP 4FACTORY, jak i dane realizacji produkcji. Jest to technologia, która jest gotowa na Big Data. Algorytmy Apache Spark dbają o błyskawiczne przetwarzanie dużych zbiorów danych. We wbudowanej w QAD Adaptive ERP analityce dostępnych jest ponad 300 predefiniowanych wskaźników KPI (ang. Key Performance Indicator) dla 34 procesów biznesowych z samoobsługową konfiguracją, Umożliwia to pełną demokratyzację dzielenia się informacjami w każdej organizacji, na dowolnym urządzeniu, w dowolnym czasie, w dowolnym miejscu.
Autor:
Alban Bentein
Product Manager for Analytics Solutions w QAD Inc.
tłumaczenie z języka angielskiego i redakcja tekstu DSR S.A.
Skontaktuj się z naszym ekspertem
Przeczytaj także:
Dlaczego harmonogramowanie jest tak krytyczne?
Wskaźnik OEE – jak obliczać i interpretować wyniki?
ERP i CRM. Co to jest? Jakie są kluczowe różnice i korzyści?