Big Data, Data Science, Business Intelligence, Data Analysis – omówienie pojęć w kontekście biznesu.

Raport Worldwide Semiannual Big Data and Analytics Spending Guide, przygotowany przez International Data Corporation (IDC), przewiduje, że przychody płynące z Big Data i analizy biznesowej na całym świecie sięgną w 2017 roku poziomu 150,8 mld USD i tym samym wzrosną o 12,4% względem ubiegłego roku, zaś do końca 2020 roku wyniosą aż 210 mld USD. Tak dynamiczny wzrost rynku Big Data skutkuje istotnymi zmianami w zakresie organizacji biznesu, tworzy nowe możliwości, rodzi wyzwania i prowadzi do pojawiania się zupełnie nowych profesji. Jakie relacje występują pomiędzy Big Data, Data Science, Data Analysis i Business Intelligence?

Big Data czyli co?

Termin Big Data wykorzystywany jest w ostatnich latach niezwykle często i niestety równie często pada ofiarą nadinterpretacji. Czym zatem jest Big Data? Najogólniej rzecz ujmując określeniem charakteryzującym niezwykle dynamiczny przyrost danych oraz ich dostępność – mowa zarówno o danych ustrukturyzowanych jak i tych pozbawionych ustalonej struktury. Chcąc być nieco bardziej precyzyjnym warto przytoczyć koncepcję zjawisk Big Data autorstwa amerykańskiego analityka – Douga Laney’a. Mimo iż ujrzała ona światło dzienne na początku XXI wieku, wciąż pozostaje aktualna. Zgodnie z ideą Laney’a o zjawiskach Big Data mówi się wyłącznie w sytuacji, gdy w kontekście danych istnieje możliwość stwierdzenia występowania trzech podstawowych cech, tzw. trzech „V” – ilości / wolumenu (volume), zróżnicowania (variety) oraz szybkości przyrostu danych (velocity). Nieco bardziej współczesne definicje rozszerzają katalog cech dodatkowo o zmienność (variability), weryfikację (veryfication) oraz wiarygodność (veracity), co jest pochodną postępujących zmian, stale rosnącego tempa napływu danych oraz coraz większą liczbą źródeł ich pochodzenia.

Jak duży wolumen danych czy poziom ich zróżnicowania pozwala na stwierdzenie, czy mamy do czynienia z Big Data? Nie istnieje jednoznaczna odpowiedź na tak postawione pytanie, gdyż każdorazowo wymagane jest indywidualne rozpoznanie sytuacji. W zależności od rodzaju pozyskiwanych danych granicę nie zawsze pozwala wyznaczyć sam wolumen czy poziom zróżnicowania danych, ale m. in. zdolność organizacji do wydobycia z nich wymiernych dla biznesu korzyści. Naturalnie istnieją również znacznie łatwiejsze do zidentyfikowania przesłanki. O tym, że firma dotarła do granicy dzielącej standardowe dane od danych masowych, świadczyć mogą chociażby: brak możliwości zapisania ich na jednym komputerze czy niewydolność stosowanych dotychczas technik i technologii zarządzania danymi. Brak dostępnej powierzchni dyskowej, spadająca wydajność obliczeniowa, przeciągające się procesy analityczne… – to tylko wybrane czynniki, które mogą sugerować zbliżanie się lub przekroczenie płynnej granicy Big Data.

Biorąc pod uwagę fakt, iż każdego dnia na świecie generowanych jest 2,5 tryliona bajtów danych, a dynamika wzrostu nie przestaje zaskakiwać, Big Data staje się wyzwaniem dla coraz większej liczby podmiotów. Należy jednak zauważyć, że za wyzwaniem tym kryje się również wiele korzyści. Konieczne jest jednak połączenie danych masowych z zaawansowaną analityką, gdyż tylko takie działanie pozwala na optymalizację strategicznych procesów, co w konsekwencji prowadzi do redukcji kosztów, zwiększenia przychodów, skrócenia czasu wielu procesów i operacji czy podejmowanie trafniejszych decyzji biznesowych. Big Data prowadzi ponadto do uzyskania przewagi konkurencyjnej, sprzyja integracji systemów wykorzystywanych w organizacji, a także stanowi źródło innowacji w wielu obszarach działalności.

Data Science – efektywna monetyzacja danych

Niezbędna w przypadku Big Data warstwa analityczna reprezentowana jest zwykle przez doświadczonego analityka lub dedykowaną komórkę analityczną. Wszystko zależy od skali i specyfiki działalności konkretnej organizacji, wolumenu gromadzonych danych, tempa ich przyrostu i zapotrzebowania zgłaszanego przez biznes. Im większy wolumen danych i wyższy poziom ich złożoności, tym większa potrzeba zaproszenia do współpracy analityków od zadań specjalnych. Mowa o specjalistach Data Science, którzy łączą w jednej osobie kompetencje analityka danych, statystyka, i informatyka. Wspomnieć należy ponadto o ich wysokich zdolnościach komunikacyjnych oraz doskonałym zrozumieniu biznesu, co pozwala na trafne zidentyfikowanie potrzeb i problemu biznesowego, a następnie podjęcie działań, które w finalnym etapie przełożone zostaną na realne korzyści dla organizacji.

Data Scientist to stosunkowo nowa profesja, którą traktować należy jako znak czasów i odpowiedź na stale rosnące znaczenie Big Data. Jej pojawienie się pozwala wnioskować, że coraz większy odsetek organizacji zaczyna dostrzegać w danych cenną z punktu widzenia biznesu wartość. Gruntowna analiza danych, pochodzenia zarówno wewnętrznego jak i zewnętrznego, pozwala bowiem na sprostanie dużym wyzwaniom biznesowym, wypracowanie trwałej przewagi konkurencyjnej, trafniejsze odpowiadanie na potrzeby zgłaszane przez klientów, a także szeroko rozumianą optymalizację, którą można w bardzo szybko przełożyć na konkretne liczby.

Niewątpliwie Data Science z roku na rok staje się coraz ważniejszym narzędziem dla biznesu, jednak stanowi również dla organizacji niemałe wyzwanie. Konieczna staje się bowiem reorganizacja i oparcie biznesu na danych, przygotowanie odpowiedniej infrastruktury informatycznej, a także stworzenie kompetentnego zespołu specjalistów. Szczególnie to ostatnie może okazać się trudnym zadaniem, gdyż zapotrzebowanie na specjalistów Data Science istotnie przewyższa ich podaż na rynku. O najlepszych fachowców, którzy zadbają o efektywne monetyzowanie wartości drzemiącej w danych biją się dziś organizacje na całym świecie – znajdują się pośród nich przede wszystkim międzynarodowe banki, firmy farmaceutyczne oraz firmy z sektora e-commerce. O jak dużym niedoborze specjalistów mowa? Zgodnie z szacunkami McKinsey Global Institute, tylko w Stanach Zjednoczonych do końca 2018 roku nieobsadzonych będzie nawet 190 tys. stanowisk wymagających wysokich kompetencji analitycznych, zaś do końca 2020 roku globalny deficyt może sięgnąć poziomu nawet 4 mln.

Business Intelligence w biznesie

Kolejną interesującą dziedzinę, związaną z tematem danych masowych, stanowi Business Intelligence, w Polsce znaną również jako analityka biznesowa bądź inteligencja biznesowa. Ustalona przez amerykańską firmę analityczno-konsultingową Gartner definicja charakteryzuje Business Intelligence jako zorientowany na użytkownika proces gromadzenia, eksploracji, analizy i interpretacji danych, którego efektem jest usprawnienie i zracjonalizowanie procesu decyzyjnego w organizacji. W nieco szerszym ujęciu BI należy traktować jako kategorię obejmującą nie tylko wspomniany proces gromadzenia i analizowania danych, ale również technologie i aplikacje, które pozwalają na właściwe uporządkowanie danych oraz ich wielowymiarowe filtrowanie. Narzędzi pozwalających na realizację takich działań jest dziś wiele, co czyni wybór optymalnego narzędzia analityczno-raportującego niezwykle trudnym. Czym charakteryzuje się najlepsze systemy BI? Niewątpliwie efektywny system Business Intelligence to system cechujący się wysokim poziomem dostępności, ponadprzeciętną wydajnością i bezpieczeństwem danych. Nie bez znaczenia są również: kompleksowość oprogramowania, możliwości w zakresie jego rozszerzenia oraz integracji z istniejącą już w organizacji infrastrukturą informatyczną, intuicyjność obsługi, możliwość korzystania z poziomu urządzeń mobilnych, a także względy kosztowe, a więc opłaty licencyjne oraz późniejsze utrzymanie systemu.

Stosunkowo wysokie koszty uruchomienia w pełni rozwiniętej platformy Business Intelligence szybko się jednak zwrócą, o ile wdrożenia zostanie odpowiednio zaplanowane i przeprowadzone. Do najważniejszych dla biznesu korzyści płynących z wykorzystania nowoczesnych systemów BI zaliczyć należy m. in.:

  • konsolidację danych pochodzących z różnych źródeł i możliwość ich analizowania na wszelkich poziomach szczegółowości;
  • usprawnienie procesów budżetowych, planistycznych i raportowych oraz efektywne wspieranie realizacji obranych celów biznesowych;
  • istotne skrócenie czasu przygotowania raportów i analiz oraz możliwość ich szybkiego udostępniania i współdzielenia wewnątrz organizacji;
  • poprawę efektywności podejmowanych w organizacji decyzji biznesowych dzięki możliwości otrzymywania wiarygodnych informacji i raportów w czasie rzeczywistym;
  • usprawnienie pracy osób decyzyjnych w firmie (liderów, kierowników, dyrektorów), a w konsekwencji zwiększenie ich autonomii decyzyjnej.

Data Analysis – w poszukiwaniu wartości ukrytej w danych

Data Analysis to kolejne pojęcie związane z tematem danych masowych, które w ostatnich latach odmieniane jest przez wszystkie przypadki. Powodem takiego stanu rzeczy jest przede wszystkim fakt, iż termin ten jest niezwykle pojemny. Data Analysis to jednak nic innego jak analiza danych, a więc czynność, która stanowi naturalną konsekwencję napływu i gromadzenia danych przez organizację (Big Data), a także istotny element pracy badacza danych czy analityka Business Intelligence. Skuteczna analiza danych, poprzedzająca proces decyzyjny w organizacji, to z jednej strony konieczność i sposób budowania trwałej przewagi konkurencyjnej, zaś z drugiej strony ogromne wyzwanie, z którym mierzy się dziś wiele podmiotów. Największą przeszkodą jest niewątpliwie to, iż wciąż wiele organizacji nie traktuje danych jako cennego aktywa i nie dostrzega w nich ogromnej wartości dla biznesu. Kolejny istotny problem to brak odpowiedniej wiedzy i kompetencji. Z badań przeprowadzonych przez analityków PwC jasno wynika, że przez brak umiejętności analizowania danych ich przeciętne wykorzystanie w firmach wynosi zaledwie 12%. Dodając do tego fakt, iż niska jakość danych może prowadzić do obniżenia przychodów operacyjnych organizacji o 20% – 35%, pochylenie się nad zagadnieniem staje się wręcz koniecznością.

Problemem dla wielu organizacji może być również stworzenie spójnej strategii zarządzania danymi, a także integracji danych z procesami organizacyjnymi, przeorganizowanie kultury organizacyjnej, a także odpowiednie przeszkolenie pracowników w całej organizacji. Nie da się ukryć, iż przeprowadzenie takiej rewolucji w sposobie zarządzania organizacją wiąże się również z niemałymi kosztami – mowa przede wszystkim o stworzeniu pożądanej infrastruktury informatycznej oraz zatrudnieniu wysokiej klasy specjalistów, którzy przełożą firmowe bazy danych na niosące wymierne korzyści decyzje biznesowe. Wdrożenie efektywnego systemu zarządzania danymi to jednak inwestycja o wysokiej i szybkiej stopie zwrotu, szansa na zwiększenie produktywności, optymalizację kosztową, trafne i znacznie szybsze odpowiadanie na zmieniające się potrzeby rynkowe, a także możliwość przewidywania trendów i reagowanie na ich zmianę znacznie szybciej aniżeli konkurencja.

Gdzie kryje się różnica?

O prawdziwej i wymagającej analizie danych nie można mówić, jeśli nie mamy do czynienia z Big Data. Ogromne i szybko przyrastające zbiory danych tworzą bowiem ogromne wyzwania i tym samym optymalne warunki do pracy dla analityków, badaczy danych, a także analityków Business Intelligence. Gdzie zatem kryje się różnica pomiędzy tymi profesjami? Analityk danych koncentruje się przede wszystkim na poszukiwaniu korelacji pomiędzy posiadanymi zestawami danych, wyciąga wnioski, na podstawie których podejmowane są decyzje biznesowe, a także udoskonalane wykorzystywane w organizacji modele i teorie. Narzędzia, które mu w tym pomagają, nie należą zwykle do zbyt zaawansowanych, stąd też wymagania stawiane analitykom danych są znacznie niższe aniżeli w kontekście analityka BI czy Data Scientist. Gdzie natomiast znajduje się granica oddzielająca Business Intelligence od Data Science. Prawdopodobnie najlepszym sposobem zobrazowania różnicy będzie wskazane na cele przeprowadzanych analiz. Analityk BI przeprowadza działania analityczne, by zidentyfikować określone zdarzenia, które miały miejsce w przeszłości (np. znaczny spadek sprzedaży) i zaproponować skuteczne rozwiązanie wykrytego problemu. Przedmiotem zainteresowania badacza danych w powyższej sytuacji z kolei powód wystąpienia zdarzenia i próba przewidzenia tego, co może się wydarzyć w przyszłości. Różnica jest zatem jednoznaczna, aczkolwiek należy zauważyć, iż obie te dziedziny mają również wiele elementów wspólnych, w tym m. in.: modelowanie danych, dbanie o ich jakość, wnikliwe analizy oraz atrakcyjną wizualizację wyników przeprowadzonych badań.

PODZIEL SIĘ
Sebastian Andruszczak

Dyrektor Marketingu w Astrafox, oraz konsultant biznesowy. Pierwsze doświadczenie zawodowe zdobywał na stanowisku specjalistycznym w dziale zarządzania kategorią w Procter & Gamble. Kolejnymi kluczowymi etapami Jego rozwoju zawodowego były pozycje managerskie w Agorze, oraz Sage, gdzie odpowiadał za zarządzanie strukturami sprzedaży. Właściciel Quantic Media. Cyfrowy nomada. Od 2014 miał okazję pracować z: Polski, Malezji, Filipin, Indonezji, Australii, Kambodży, Tajlandii, Wietnamu, Anglii i Kanady. Jako konsultant, specjalizuje się w obszarach sprzedaży i marketingu, oraz w doradztwie w zakresie technologicznym. Wierzy w dane i technologię.

ZOSTAW ODPOWIEDŹ