"There's no data like more data" (w wolnym tłumaczeniu: "Najlepsze dane to dużo danych"), miał powiedzieć Robert Mercer, założyciel Cambridge Analytica, firmy, która uzmysłowiła światu, jaką siłę rażenia mogą mieć działania oparte na danych.
1. Każda minuta w internecie to ogrom nowych danych
W tym roku serwis Visual Capitalist po raz ósmy dokonał aktualizacji swojej sztandarowej infografiki, którą uzmysławia, jak dużo danych użytkownicy internetu generują w ciągu każdej minuty korzystania z popularnych serwisów. Rok 2020 jest pod tym względem szczególny w związku ze zwiększoną wskutek pandemii aktywnością użytkowników sieci. W ten sposób pracujemy, uczymy się, podtrzymujemy kontakty, przyklejeni do monitorów spędzamy też wolny czas.
Wrzucane do internetu zdjęcia, filmy, posty, rozmowy prowadzone na komunikatorach, reakcje na aktywność innych osób, ale też wykonywane transakcje – to wszystko cyfrowe ślady pozostawiane twórcom serwisów. Odpowiednio katalogowane i przetwarzane mają wiele zastosowań, pozwalając zarabiać technologicznym gigantom naprawdę duże pieniądze (o tym, jak duże, w dalszej części).
W ciągu każdej minuty w 2020 roku użytkownicy serwisu YouTube uploadują do niego średnio 500 godzin nagrań wideo, wysyłają na Whatsappie 41,6 mln wiadomości, 2,7 tys. osób instaluje TikToka, na Instagram trafia 347 tys. nowych stories, na Twitterze przybywa 319 nowych użytkowników, a konsumenci wydają online 1 mln dolarów.
2. Zetabajty suną w górę
Jeszcze w 2018 roku wolumen przetwarzanych na świecie danych sięgał 33 zetabajtów (1 zetabajt to bilion gigabajtów). Na tę wartość składały się nowe dane – generowane, przechwycane i replikowane na całym świecie. Taka wartość przeciętnie zorientowanemu czytelnikowi nie mówi specjalnie dużo. Zdecydowanie nabiera jednak na znaczeniu w zestawieniu z prognozami dotyczącymi lat kolejnych.
W wielokrotnie cytowanej prognozie firmy IDC mówi się o spodziewanej w 2025 roku „datasferze” na poziomie 175 zetabajtów, co oznaczałoby ponad pięciokrotny wzrost w ciągu siedmiu lat. Skąd te dane? Dostarcza ich szereg urządzeń, począwszy od komputerów, telefonów czy konsol do gier, na kamerach monitoringu miejskiego kończąc. Skąd tyle emocji wokół takich irracjonalnych wartości? Za danymi stoi potencjalny pieniądz. Pozyskane informacje posłużą biznesowi do udoskonalania procesów obsługi klienta (personalizacja usług), zdobywania nowych rynków, poprawy wydajności w miejscu pracy czy budowania konkurencyjnych przewag.
3. Dane surowcem 21. stulecia
Od niedawna posługiwanie się hasłem „dane to nowa ropa” stało się w pełni uzasadnione. Przynajmniej w pewnym sensie. Jeśli bowiem zestawić największe pod względem kapitalizacji firmy na świecie dziś z czołówką sprzed dekady, istotnie okaże się, że teraz najczęściej najwięcej zarobić można na danych, a wtedy – na ropie naftowej.
Na infografice przygotowanej przez Howmuch.net firmy o największej kapitalizacji podzielono według branż, które reprezentują. Spółki wydobywcze zaznaczono kolorem czarnym, spółki ściśle technologiczne – kolorem granatowym. Dysproporcja w rozpatrywanym kontekście jest znacznie większa, niż sugerowałby pierwszy rzut oka. Wśród firm zaznaczonych innymi kolorami (np. zielony – Amazon, różowy – Netflix) nie brakuje takich, które swoją codzienną działalność opierają na zaawansowanej analityce wielkich partii danych (np. podsuwając użytkownikom takie a nie inne produkty na bazie ich wcześniejszych wyborów).
4. Gospodarka chce SI, SI chce danych
Danymi zainteresowany jest nie tylko prywatny biznes. „Jako zadanie pierwszej potrzeby wskazuje się konieczność opracowania polskiej polityki danych, która ma za zadanie jasne określenie statusu prawnego danych osobowych i nieosobowych, danych zbieranych publicznie i prywatnie, pochodzących z różnych obszarów aktywności ludzi, przyrody i maszyn” – to fragment założeń do nowo powstającej polityki rozwoju sztucznej inteligencji (SI) w Polsce. Rządowi doradcy podkreślają w nim, że dane są paliwem niezbędnym do rozpędzenia inwestycji w rozwój sztucznej inteligencji.
Na nic jednak dane bez umiejętności obchodzenia się z nimi. W raporcie Digital Poland, Accenture i Microsoft pt. „Kompetencje ekspertów AI” przeanalizowano zamieszczone w serwisie LinkedIn profile specjalistów od sztucznej inteligencji z 44 krajów. Tak na rynku polskim, jak i międzynarodowym, specjaliści od SI pracują głównie przy analityce i przetwarzaniu danych (data mining i analityka). Tym obszarem zajmuje się średnio czterech na dziesięciu praktyków.
5. Analityka danych w cenie na rynku pracy
Firmy konsultingowe z coraz większą lubością zajmują się prognozowaniem przyszłości rynku pracy. W opracowaniach z tej serii zwykle mowa także o kompetencjach przyszłości. Światowe Forum Ekonomiczne w tym roku umieściło analityków danych na pierwszym miejscu w rankingu zawodów, na które popyt wzrasta. Drugie i trzecie miejsce zajęli specjaliści od uczenia maszynowego oraz od big data. Nie oddaliliśmy się zatem daleko od pozycji lidera.
Co ciekawe, dane pojawiły się też na pierwszy miejscu w rankingu profesji, na które zapotrzebowanie maleje. W tym przypadku mowa jednak o prostych czynnościach biurowych czy urzędniczych polegających na wprowadzaniu informacji do systemu. WEF przewiduje, że do 2025 roku automatyzacja może doprowadzić do ubytku 85 mln miejsc pracy, ale równolegle wygenerować 97 mln pracy.
6. Dane dały władzę
Czas przypomnieć jeden z największych światowych skandali związanych z nieuprawnionym użyciem danych. Firma Cambridge Analytica znalazła się w posiadaniu milionów jednostek informacji o użytkownikach serwisu Facebook, na bazie których stworzono profile osobowe, rozpoznając wiek, płeć, ale też przekonania religijne czy polityczne. Wyświetlając użytkownikom serwisu społecznościowego odpowiednio sprofilowane informacje, można było wpływać na ich pierwotne sympatie, co w sumie miało doprowadzić do decyzji o brexicie w Wielkiej Brytanii i wygranej Donalda Trumpa z Hillary Clinton w wyborach prezydenckich w 2016 roku.
Cambridge Analytica przyznawała się do zaangażowania w wydarzenia polityczne także w Afryce czy Ameryce Południowej.
Danych, w posiadaniu których znalazł się Facebook, dostarczyli serwisowi jego użytkownicy. Między innymi wtedy, kiedy w 2014 roku licznie brali udział w quizie określającym typ osobowości. W źródłowych materiałach na ten temat wspomina się 305 tys. osób, które zainstalowały aplikację z quizem, co - dzięki możliwości sięgnięcia także danych do kontaktów tych użytkowników - miało wyposażyć Facebook w informacje aż o 87 mln użytkowników.
7. Polska uczy się big data
Big data, czyli w uproszczeniu wielkie ilości danych przetwarzane w błyskawicznym tempie na potrzeby różnych zastosowań. W tę stronę zwracają uwagę właściwie wszystkie kraje, w tym Polska. Z najnowszych dostępnych danych Eurostatu na ten temat wynika, że jeszcze w 2018 roku w całej Unii średnio 12-13 proc. przedsiębiorstw używało big data. Polska znajdowała się poniżej średniej z wynikiem 8 proc., dominowały firmy z Malty, Holandii, Belgii, Irlandii i Finlandii.
Dwa lata wcześniej wynik dla Polski był o 2 p.p. niższy, podobnie jak w całej Unii, ale duży skok wykonano np. w przypadku Niemiec, podnosząc wynik tego kraju z 6 na 15 proc.
8. Informacja jest online
Nie byłoby tematu, gdyby nie internet - podstawowe, szybkie i dające gigantyczne możliwości źródło informacji. Najnowsza edycja sondażu prowadzonego przez Centrum Badania Opinii Społecznej wskazuje, że znacząco przybyło w Polsce użytkowników internetu, którzy pozostają online właściwie przez cały czas, na bieżąco śledząc najnowsze informacje i reagując na wiadomości. W 2020 roku tak wskazało 49 proc. ankietowanych, podczas gdy w latach poprzednich odpowiednio 30 i 33 proc.
Pozostali ankietowani deklarują doraźne włączanie aplikacji internetowych (przeglądarki, komunikatory, serwisy społecznościowe etc.), tylko wtedy, gdy mają zamiar wyszukać informacje czy skontaktować się z kimś.
9. "To dopiero początek"
W dużym raporcie wydanym przez Organizację Współpracy Gospodarczej i Rozwoju w ubiegłym roku (gdy nikt jeszcze nie nazywał pandemii Covid-19 katalizatorem cyfryzacji) za jeden z wiodących trendów uznano zasilanie wielu technologii danymi. Od sztucznej inteligencji, przez internet rzeczy, automatyzację, na blockchain czy druku 3d kończąc.
Przyspieszeniu zastosowania danych, o czym pisze OECD, sprzyja też przyspieszenie ruchu w internecie. Prognozuje się, że w ciągu dwóch dekad świat przeszedł od 100 GB dziennie (w 1992 roku) do 150 700 GB na sekundę w 2022 roku. Mimo to świat jest wciąż we wczesnej fazie gospodarowania w oparciu o dane, podkreślają autorzy.