Portal Finanse Firma Klastry Instytucje Promocja Polityka
Newsy
2015/11/10 09:01:04
Big Data – dobry biznes

Big Data 1

W 2002 r. amerykańska drużyna baseballowa Oakland Athletics, pomimo jednego z najniższych budżetów w lidze, ustaliła rekord 20 zwycięstw z rzędu. Tajemnicą sukcesu była statystyka – menedżer, nie mając nic do stracenia, oparł się niemal wyłącznie na liczbach i dobierając do zespołu zawodników z wieloma słabościami, ale też z jedną cechą wybitną, pokazał potencjał drzemiący w takim myśleniu. W dzisiejszych czasach dysponujemy niemalże nieograniczoną ilością danych w wielu dziedzinach życia i każdy biznesmen może stworzyć swoje Oakland Athletics.

Według statystyk IBM każdego dnia ludzkość wysyła 294 miliardy e-maili, wyszukiwarka Google otrzymuje ponad miliard zapytań, na Twitterze jest publikowanych ponad 230 mln nowych ćwierknięć, a Facebook przetwarza ponad 30 petabajtów danych wygenerowanych przez użytkowników. Łącznie (do 2020 r.) w wirtualnym świecie ma istnieć ponad 40 zetabajtów danych, co oznacza, że na jednego człowieka przypadnie średnio 5200 gigabajtów. Co więcej, od 2020 r. co dwa lata ilość danych ma się podwajać. Zdaniem ekspertów McKinsey Global Institute – think-tanku funkcjonującego przy amerykańskiej firmie konsultingowej o tej samej nazwie – ilość i szczegółowość generowanych na świecie danych przy odpowiedniej analizie musi przynieść wymierne korzyści finansowe zarówno biznesowi, rządom państw, jak i konsumentom.

„Big Data” jest bliżej, niż myślisz!

Naukowcy pozostają zgodni – możliwość przetwarzania tak dużej ilości szczegółowych danych wywrze na nasze życie wpływ podobny do tego, jaki miały nowe technologie, począwszy od lat dziewięćdziesiątych ubiegłego wieku. Dobrym przykładem w sektorze zdrowia jest usługa Google Flu, która na podstawie liczby zapytań internautów o sposoby radzenia sobie z grypą, publikuje globalną mapę aktywności wirusa. Metodę amerykańskiego potentata doceniła redakcja prestiżowego naukowego magazynu „Nature”, publikując artykuł poświęcony wykorzystaniu „Big Data” w wykrywaniu ognisk epidemii[1]. Z kolei amerykańska ubezpieczeniowa Aetna zbiera dane na temat zdrowia swoich klientów, aby jak najwcześniej wykrywać u nich choroby serca i cukrzycę.

„Big Data” jest w oczywisty sposób użyteczna dla agencji rządowych. Analiza aktywności na portalach społecznościowych, rozmów telefonicznych, treści e-maili i transakcji bankowych z dużym prawdopodobieństwem pozwala zlokalizować osoby i organizacje potencjalnie zagrażające obronności państwa. Trzeba zaznaczyć, że zapewnienie szeroko pojętego bezpieczeństwa dotyczy dzisiaj w dużej mierze również biznesu. Amerykańska Pindrop oferuje swoim klientom (bankom i innym instytucjom finansowym) usługę wykrywania fałszywych rozmówców przy rozmowach telefonicznych. Idąc dalej, należy wspomnieć o zastosowaniu „Big Data” w polityce. Podczas wyborów prezydenckich w 2012 r. sztab wyborczy Baracka Obamy na niespotykaną wcześniej skalę wykorzystał metodę opracowania modeli zachowania wyborców. W oparciu o informacje dostarczone m.in. przez analityków podejmował decyzje, gdzie się pojawić i co powiedzieć. O innowacyjnym podejściu do kampanii prezydenckiej pisał prestiżowy MIT Technology Review[2].

Jednym z najlepszych przykładów wykorzystania „Big Data” w biznesie jest międzynarodowa kurierska UPS. Każdego dnia przetwarza ona dane ponad 16 mln przesyłek i obsługuje prawie 9 mln klientów, a łącznie na serwerach zgromadzonych jest 16 petabajtów danych. Ponadto w każdym z 46 tys. samochodów dostawczych zainstalowane są czujniki mierzące prędkość w różnych porach dnia, liczbę hamowań i wiele innych parametrów, które po odpowiedniej analizie pozwalają nie tylko lepiej zaplanować trasy kurierów (tylko w 2011 r. dzięki temu zaoszczędziła około 30 mln litrów benzyny), ale także przewidywać z dużą dokładnością, kiedy pojazd wymaga serwisowania. Kolejnym krokiem w podnoszeniu efektywności w UPS ma być zastosowanie analizy „Big Data” do przelotów lotniczych (około 2 tys. każdego dnia).

Powyższe przykłady można mnożyć, ale wniosek z nich płynie jeden – „Big Data” pozwala zwiększyć produktywność w niemal każdej branży. Według danych przytaczanych przez autorów raportu „Measuring the Business Impacts of Effective Data” („Wpływ efektywnych danych na prowadzenie biznesu”)[3] 10-procentowy wzrost efektywności przetwarzania danych powoduje wzrost produktywności o mniej więcej 20% (w sektorze telekomunikacyjnym, budowlanym czy transportowym). W branży consultingowej sięga on 39%, a największy wpływ wywiera na sprzedaż bezpośrednią, powodując średni wzrost aż o 49%. Z czego to wynika?

Hinduski i anioł biznesu Sashi Reddi wskazuje, że „Big Data” pozwala m.in. identyfikować najbardziej wartościowych klientów i przewidywać, jak będą reagować na oferty. Tym samym można proponować atrakcyjny, indywidualnie dopasowany asortyment z dużym prawdopodobieństwem związania konsumenta z firmą na dłużej. Ponadto, przetwarzając dane o korzystaniu z produktu lub usługi, łatwiej wprowadzać udoskonalenia i rozwijać projekt we właściwym, oczekiwanym przez użytkowników kierunku. Analiza otrzymywanych danych wpływa także na obniżenie ryzyka przy podejmowaniu decyzji związanej, np. z wprowadzaniem nowego produktu na rynek. Autorzy artykułu „Why Big Data is the new ” („Dlaczego Big Data jest nową przewagą konkurencyjną?”)[4] wskazują, że średnio 25% pracy umysłowej wykonywanej w zespołach projektowych polega na gromadzeniu i segregowaniu różnych danych. Nowoczesne narzędzia odciążają więc pracowników, pozwalając im pracować nad efektywnym ich wykorzystaniem, a nie porządkowaniem.

Big Data wykres

Ile firm korzysta z „Big Data”?

konsultingowo-informatyczna Capgemini przygotowała raport „Big & Fast Data: The Rise of Insight-Driven Business”[5], w którym przytacza wyniki ankiety przeprowadzonej wśród tysiąca osób decyzyjnych w największych firmach z 10 rozwiniętych państw świata. Aż 65% badanych odpowiedziało, że brak inwestycji w „Big Data” spowoduje spadek ich konkurencyjności, a 56% zamierza zwiększyć nakłady finansowe związane z wykorzystaniem tej technologii w przeciągu najbliższych 3 lat. Co ciekawe, aż 53% wskazało, że w najbliższej przyszłości spodziewa się konkurencji ze strony start-upów, które zdobywają rynek, zajmując się właśnie przetwarzaniem „Big Data”, jak np. popularny portal turystyczny Airbnb czy Uber, która wywołała protesty korporacji taksówkarzy w kilkunastu państwach świata.

Nieco inaczej rysuje się świadomość roli „Big Data” wśród polskich przedsiębiorców. W 2015 r. HP Polska wraz z firmą Infotarget przeprowadzili badanie wśród 168 szefów działów informatycznych dużych i średnich przedsiębiorstw i aż 54% z nich odpowiedziało, że „Big Data” nie znajduje się w sferze zainteresowań firmy. Kolejne 31% wskazało, że rozważa wykorzystanie tej technologii, ale nie ma konkretnych planów z nią związanych. Tylko 15% firm zadeklarowało, że prowadzi projekty związane z „Big Data” lub planuje ich wdrożenie. Polska wypada najgorzej z państw Europy Środkowej – według najnowszych statystyk, udostępnionych przez firmę Intel, z „Big Data” korzysta 25% przedsiębiorstw. W tym badaniu odsetek polskich firm wyniósł 18%, czyli nieznacznie więcej niż w ankiecie HP Polska. Regionalnymi liderami są Czesi (33%), podobny wynik (31%) osiągnęły przedsiębiorstwa na Słowacji, z kolei Węgrzy z 19% uplasowali się tuż przed Polską.

Niskie zainteresowanie „Big Data” ze strony krajowych przedsiębiorców dziwi m.in. dlatego, że ta może być nie tylko dźwignią rozwoju dla niemalże każdej branży, ale również sama w sobie stanowi opłacalny biznes. Takie firmy, jak hiQ, SumAll, Splunk czy Aysadi, specjalizują się w dostarczaniu narzędzi analitycznych swoim klientom. Z kolei Uber, który w 2014 r. przekroczył liczbę 10 mln użytkowników, rok później podpisał umowę z hotelarskim potentatem Starwood. Internauci musieli wyrazić zgodę na przekazanie danych poprzez akceptację nowego regulaminu, a za przynętę posłużył pakiet lojalnościowy wiążący przejazdy dokonywane z wykorzystaniem Ubera z noclegami w hotelach sieci Starwood.

Jak duże muszą być dane, aby były „Big Data”?

O „Big Data” coraz częściej słychać w mediach, ale bardzo rzadko można usłyszeć, co dokładnie kryje się pod tym terminem. Jak odróżnić przetwarzanie zwykłych danych od „Big Data”? Jak nie dać się nabrać firmom outsourcingowym oferującym usługi związane z ich przetwarzaniem? Prof. Rob Kitchin z Maynooth University w Irlandii zebrał wspólne elementy definicji „Big Data”, proponowane przez czołowych naukowców. W artykule „The Real-Time City? Big Data and Smart Urbanism” („Miasto w czasie rzeczywistym? Big Data i inteligentny urbanizm”)[6] wskazał bezsporne, jak się wydaje, elementy tego pojęcia:

  • olbrzymia objętość (tera- i petabajty danych)
  • wysoka dynamiczność (dane są rejestrowane na bieżąco lub niedługo po ich wytworzeniu)
  • duża różnorodność (dane mogą być uporządkowane bądź nieuporządkowane, często odwołują się do siebie nawzajem)
  • wyczerpujące zbiory danych (obejmujące swoim zasięgiem całą populację lub duże grupy)
  • szczegółowość (możliwie największa)
  • relatywność (dane mogą być łączone w różne zestawy, w zależności od potrzeb)
  • elastyczność (łatwość w dodawaniu kolejnych pól do uzupełnienia oraz możliwość scalania różnych zbiorów danych).

Niewątpliwie najważniejszymi elementami tej definicji są pierwsze trzy aspekty – objętość, dynamiczność i różnorodność, które łącznie pozwalają tworzyć modele możliwie dokładne i aktualne. Nie można jednak zapominać, że „Big Data” to wciąż tylko statystyka. Warto tu przytoczyć słowa Aarona Levensteina, profesora Baruch College, będącej jedną z największych szkół biznesowych w USA: „Statystyka jest jak kostium bikini: pokazuje wiele, ale nie pokazuje najważniejszego”. Czym zatem jest ten najważniejszy, ukryty element? W przypadku danych odnoszących się do zachowania ludzi zawsze pozostaje margines niepewności związany z autonomią jednostki.

Autorzy artykułu „Critical questions for Big Data” („Krytyczne uwagi na temat Big Data”)[7] wskazują, że duża ilość danych wcale nie oznacza, że będą one lepsze i dokładniej odwzorują rzeczywistość. Jako przykład podają Twittera, którego często wykorzystuje się w różnego rodzaju analizach m.in. ze względu na łatwy dostęp do treści, a także jego ograniczoną objętość. Naukowcy zwracają uwagę, że jest to specyficzna grupa użytkowników internetu, rozmaita dla różnych państw, dlatego trzeba uważać z wyciąganiem wniosków dla całych grup społecznych na podstawie analizy aktywności na tej platformie. Wiąże się to także z inną cechą „Big Data” – silnym osadzeniem danych w konkretnej sytuacji. Informacje wyjęte z kontekstu i zamienione na liczby lub wartości niekoniecznie muszą oddawać rzeczywisty stan rzeczy. Przykładem są platformy społecznościowe, których specyfiką jest to, że ich użytkownicy pozostają anonimowi i często mogą zachowywać się inaczej niż w rzeczywistości. W tym przypadku kluczową informacją jest specyfika danej społeczności lub portalu.

Kto powinien zajmować się „Big Data”?

 

Big Data 2

Wskazuje się, że tylko około 33% globalnych danych może stanowić wartość, oczywiście po ich uprzednim przetworzeniu. Złożoność „Big Data” sprawia, że na całym świecie rośnie zapotrzebowanie na pracowników, którzy będą potrafili oddzielić wartościowe informacje od tych bezużytecznych i na ich podstawie sformułować trafne wnioski. W ten sposób narodził się nowy zawód – data scientist (nie doczekał się jeszcze polskiego odpowiednika), który w 2012 r. został okrzyknięty przez Harvard Business Review „najseksowniejszym zawodem XXI wieku”[8]. W 2015 r. technologiczni potentaci Facebook i LinkedIn największe zarobki oferowali właśnie analitykom, a nie programistom. Jakie umiejętności powinien posiadać kompetentny data scientist? Wśród najważniejszych wymienia się umiejętność programowania, a także prezentacji danych, w taki sposób, aby liczby i wartości można było przełożyć na konkretne, biznesowe działania. Z kolei najważniejszą miękką kompetencją jest ciekawość, która popycha pracowników do zestawiania informacji na różne sposoby, aż do osiągnięcia satysfakcjonujących rezultatów. Często podkreśla się również wszechstronną wiedzę, pozwalającą szybciej kojarzyć pozornie odlegle zbiory danych. Potwierdzają to statystyki zatrudnionych w tej branży – aż 17% data scientists posiada doktorat, a tylko 10% nie posiada żadnego stopnia naukowego.

Według danych przytaczanych przez firmę technologiczną FICO, zapotrzebowanie na data scientists wzrosło w 2012 r. o 15 000% (w porównaniu z 2011 r.), a rynek momentalnie wchłonie kolejnych 140-190 tys. specjalistów w tym zakresie. Brak wykwalifikowanych pracowników na rynku pracy nie musi jednak oznaczać rezygnacji z „Big Data”. Popularny serwis technologiczny CRN opublikował w 2015 r. listę najlepszych firm analitycznych, a także ranking najlepszych usług i narzędzi do przetwarzania „Big Data. Z kolei Forbes opracował zestawienie najlepszych firm analitycznych w oparciu o opinię ich pracowników. W czołówce znalazły się: InsightSquared, Paxata i Trifacta.

Przetwarzanie danych to nie tylko dostarczanie informacji o obecnym stanie (np. zapotrzebowaniu na dany produkt), ale również określenie przyszłych zachowań rynku. Dziedzinę za to odpowiedzialną nazywamy analityką predyktywną. Specjaliści, opierając się o dane historyczne i aktualne, potrafią stworzyć modele postępowania konsumentów, co daje firmom możliwość szybkiego reagowania. Użyteczność takiej analizy dobrze widać w sprzedaży internetowej – bazując na aktywności na portalach społecznościowych, historii przeglądanych produktów i transakcjach dokonywanych przez klienta, można spersonalizować reklamę, podnosząc tym samym jej skuteczność. Trzeba jednak pamiętać, że wykorzystanie „Big Data” do tworzenia tego typu modeli nie zawsze jest zgodne z prawem. Profilowanie, czyli zbieranie danych o osobach z różnych źródeł, zestawianie ich i tworzenie tzw. profili osobowościowych, wymaga uprzedniej zgody użytkowników poddanych takiej analizie – takie stanowisko zajął Generalny Inspektor Ochrony Danych Osobowych.

Czy w biznesie można polegać tylko na liczbach? Wydaje się, że trafną analogią będzie ponowne odwołanie się do sportu, tym razem do Formuły 1. Gallagher, współwłaściciel zespołu wyścigowego Status Grand Prix, przyznaje, że statystycy są obecnie nieodłącznym elementem tego sportu, a ich praca polega na wykrywaniu odchyleń od normy w pracy bolidu. Dane z czujników zamontowanych w pojeździe przez 99% czasu są zgodne z przewidywaniami. Kiedy jednak jeden z parametrów zauważalnie się odchyla, przekazują o tym informację kierowcy, który – jeżeli widzi szansę na poprawienie pozycji – podejmuje decyzję o ewentualnym przyspieszeniu. Zbierane dane są zatem podstawą do podjęcia decyzji, ale ostateczna ocena, czy i jak zareagować, pozostaje w gestii kierowcy. W końcu to on, a nie statystycy, będzie w pierwszej kolejności odpowiedzialny za osiągnięty wynik. Tak samo jak – za wyniki swojej firmy.

Przywoływane artykuły
 


[1] Ginsberg J., Mohebbi M., Patel R., Brammer L., Smolinski M., Brilliant L., Detecting influenza epidemics using search engine query data, “Nature” 457 (2008), s. 1012-1014

[2] Issenberg S., How President Obama’s campaign used big data to rally individual voters, MIT Technology Review, 2012, http://www.technologyreview.com/featuredstory/509026/how-obamas-team-used-big-data-to-rally-voters/

[3] Barua A., Mani D., Rajiv M., Measuring the Business Impacts of Effective Data, The University of Texas, http://www.datascienceassn.org/sites/default/files/Measuring%20Business%20Impacts%20of%20Effective%20Data%20I.pdf

[4] McGuire T., Manyika J., Chui M., Why Big Data is the new , “Ivey Business Journal” (2012), http://iveybusinessjournal.com/publication/why-big-data-is-the-new-competitive-advantage/

[6] Kitchin R., The real-time city? Big data and smart urbanism, “GeoJournal” (2014) 79:1-14, https://www.maynoothuniversity.ie/progcity/wp-content/uploads/2014/02/GeoJournal-Real-time-city-2014.pdf

[7] Boyd D., Crawford K., Critical Questions for Big Data: Provocations for a cultural, technological, and scholarly phenomenon, “Information, Communication & Society” Volume 15, Issue 5, 2012, http://www.tandfonline.com/doi/citedby/10.1080/1369118X.2012.678878#.VbIgRbV8pTQ

[8] Davenport T., Patil D. J., Data Scientist: The Sexiest Job of the 21st Century, “Harvard Business Review” (2012), https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century/

Autor:Agata Rokita 


powrót | do góry | strona główna | kalendarium | regulamin serwisu | pliki cookies | kontakt
Portal jest współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego.

© 2005-2018 Polska Agencja Rozwoju Przedsiębiorczości