MATERIAŁ POWSTAŁ WE WSPÓŁPRACY Z ORANGE POLSKA

Big data, czyli olbrzymie ilości danych, które oczywiście po analizach mogą na przykład wesprzeć biznes w podejmowaniu odpowiednich decyzji. Jakiego rodzaju dane są tutaj najbardziej użyteczne?

Telekomy mają na przykład precyzyjne dane na temat przemieszczania się ludności. Wszystko to analizujemy oczywiście w postaci zagregowanej i zanonimizowanej, czyli bez jakichkolwiek danych, które pozwalałyby zidentyfikować konkretne osoby. Wiemy, jak użytkownicy zachowują się w sieci, ilu z nich na jakie strony wchodzi, czym są zainteresowani. Te wszystkie dane bardzo nam pomagają w budowaniu analiz, na podstawie których wiele firm podejmuje decyzje biznesowe.

Ale to są nieskończone wręcz zbiory danych. Trzeba wysnuć z nich jakieś wnioski. W jaki sposób?

To prawda, zbiory są ogromne, jednego dnia uzyskujemy około 50 miliardów interakcji. Przede wszystkim możemy wykorzystać te dane pomagając firmom podejmować decyzje biznesowe. Chociażby co do tego, w którym miejscu wybudować zakład produkcyjny, gdzie zlokalizować sklep, bankomat czy automat paczkowy. Ale nie służy to wyłącznie zastosowaniom komercyjnym. Te dane mają także wartość dla miast, dla instytucji publicznych. Pokazują, jak przemieszczają się mieszkańcy. Dzięki danym wiemy na przykład, że z Warszawy co weekend wyjeżdża 240 tysięcy osób. Dane pomagają budować modele transportowe i decydować, gdzie uruchomić np. nową linię autobusową. Pomagają też precyzyjnie oszacować rzeczywistą liczbę mieszkańców w miastach. Dzięki temu miasta są w stanie lepiej prognozować swoje wydatki, chociażby na wywóz śmieci czy na wodę.

Ale czy w związku z tym wszystkim właściciel smartfona może czuć się bezpiecznie?

Zdecydowanie tak. Wszystko odbywa się zgodnie z najbardziej rygorystycznymi regułami prawa, dane są absolutnie anonimowe. Nie ma też żadnej możliwości, aby dane opuszczały naszą firmę. Nasza praca polega na przekazywaniu gotowych analiz bądź zagregowanych raportów. Zapewniamy pełne bezpieczeństwo danych.

A jakie konkretnie projekty prowadziliście na tych danych?

Zostaliśmy na przykład poproszeni o przeliczenie, ile osób statystycznie przebywa w danym mieście każdego dnia. Chodziło o opłaty za śmieci, bo liczba deklaracji i wpływy odbiegały od rzeczywistych kosztów. Miasto na podstawie tych danych całkowicie zmieniło podejście do pobierania opłat. Z kolei dla województw przekazywaliśmy zagregowane dane o przemieszczaniu się mieszkańców między gminami. To bardzo ważne informacje, które pomagają przy budowaniu optymalnego modelu transportowego.

A projekty komercyjne?

Skomplikowane, ale bardzo ciekawe. Jeden z naszych klientów miał na przykład do wyboru kilka miejsc, w których teoretycznie były takie same warunki do wybudowania fabryki. Bardzo mu jednak zależało na tym, aby sprawdzić, jaki będzie potencjał każdego z tych miejsc pod względem rekrutacji pracowników. Dostarczyliśmy mu więc odpowiednie dane dla każdego z tych punktów.

Podobnie jest z decyzjami o lokalizacji bankomatów czy automatów paczkowych. W  przypadku tych pierwszych po analizie danych okazało się, że istotną grupą użytkowników są cudzoziemcy. Dlatego musieliśmy sprawdzić, w jaki sposób się oni przemieszczają. Natomiast w przypadku automatów paczkowych wydawałoby się, że decydującym kryterium jest zagęszczenie mieszkańców, ale to jednak nie do końca prawda. Ludzie starsi rzadko kupują online, więc też rzadziej korzystają z automatów. Zmierzyliśmy zatem dodatkowo skalę używania internetu, aby lepiej ocenić konkretną lokalizację.

Jakie były najważniejsze doświadczenia wypływające z pracy nad tego typu projektami?

Nigdy nie ma dwóch takich samych projektów, jeżeli chodzi o analizę danych. Na początku żadnej analizy nie wiemy, do jakich ciekawych wniosków dojdziemy. Nie ma tu rozwiązań uniwersalnych. Nawet kiedy początkowo wydaje się, że potrzeby dwóch klientów są zbliżone, to potem okazuje się, że dla każdego z nich niezbędne są inne dane. W pracy z big data trudno przewidzieć wyniki na początku analizy, ale to właśnie sprawia, że jest ona tak istotna – pozwala odkrywać nowe i nieoczywiste zależności.

MATERIAŁ POWSTAŁ WE WSPÓŁPRACY Z ORANGE POLSKA