{"id":160990,"date":"2015-10-17T22:48:58","date_gmt":"2015-10-17T20:48:58","guid":{"rendered":"https:\/\/mediarun.com\/pl\/?p=160990"},"modified":"2015-10-17T22:48:58","modified_gmt":"2015-10-17T20:48:58","slug":"hellabytes-czyli-piekielnie-duza-big-data","status":"publish","type":"post","link":"https:\/\/mediarun.com\/pl\/trendy\/technologie\/hellabytes-czyli-piekielnie-duza-big-data.html","title":{"rendered":"Hellabytes, czyli piekielnie du\u017ca Big Data"},"content":{"rendered":"<p><strong>Zetta, Yotta, Hella \u2013 czyli Sie\u0107 w bajtach danych <\/strong><\/p>\n<p>Big Data to termin, kt\u00f3ry by\u0142 w zesz\u0142ym roku na ustach wszystkich marketer\u00f3w i analityk\u00f3w internetowych. W tym roku b\u0119dzie podobnie. W ramach ankiety TimesJobs Job Outlook Survey 2015, rok 2015 okre\u015blili oni mianem \u201eroku Big Data\u201d, za\u015b zaw\u00f3d badacza danych (data scientist) uznali za \u201enajlepsz\u0105 profesj\u0119 tego roku\u201d oraz \u201enajbardziej perspektywiczny zaw\u00f3d\u201d. Podkre\u015blali przy tym dojmuj\u0105cy deficyt profesjonalnych badaczy danych na rynku.<\/p>\n<p>Jak mantr\u0119 powtarza si\u0119 dzi\u015b konieczno\u015b\u0107 analizy i konwersji wielkich zbior\u00f3w danych, pozostawianych w Sieci przez internaut\u00f3w, upatruj\u0105c w tym rozwi\u0105zania wielu k\u0142opot\u00f3w bran\u017cy marketingowej oraz sektora e-commerce. I s\u0142usznie. Cho\u0107 Big Data nie jest mo\u017ce \u201elekiem na ca\u0142e z\u0142o\u201d dzisiejszego marketingu, to nie jest te\u017c placebo, poniewa\u017c daje wymierne efekty zw\u0142aszcza w sektorze e-handlu czy bankowo\u015bci.<br \/>\nW mi\u0119dzyczasie rosn\u0105 zar\u00f3wno wydatki na reklam\u0119 personalizowan\u0105, jak i technologi\u0119 sprzeda\u017cy RTB. Ilo\u015b\u0107 danych w Sieci ro\u015bnie w b\u0142yskawicznym tempie, wi\u0119c nale\u017cy podejrzewa\u0107, \u017ce kolejne lata up\u0142yn\u0105 pod znakiem nie tyle Big, co Huge Data. <\/p>\n<p><strong>Ile wa\u017cy Big Data? <\/strong><\/p>\n<p>Dane wa\u017c\u0105 ca\u0142kiem sporo. Wed\u0142ug analityk\u00f3w internetowych licz\u0105c od samego pocz\u0105tku istnienia Sieci, wygenerowali\u015bmy ju\u017c ponad 6 zettabajt\u00f3w danych. \u017beby uzmys\u0142owi\u0107 sobie wielko\u015b\u0107 tej liczby nale\u017ca\u0142oby do niej dopisa\u0107 21 zer. Big Data nie jest ju\u017c \u201ebig\u201d. Dzisiaj powinni\u015bmy raczej m\u00f3wi\u0107 ju\u017c o \u201eHuge Data\u201d. Tym bardziej, \u017ce ilo\u015b\u0107 danych w Sieci zbli\u017ca si\u0119 do nowej jednostki \u2013 yottabajta (1 YB to 1024 bajt\u00f3w). Jaka b\u0119dzie kolejna jednostka? Angielscy komentatorzy ju\u017c wiedz\u0105 i pisz\u0105 \u017cartobliwie o \u201ehellabytes\u201d, czyli: \u201ehell of a lot of bytes\u201d. Sugeruj\u0105 w ten spos\u00f3b, \u017ce danych w Sieci jest po prostu du\u017co, a nawet: za du\u017co. Te dane przyprawiaj\u0105 o zawr\u00f3t g\u0142owy. <\/p>\n<p>\u2013 W ci\u0105gu minuty w Internecie wysy\u0142anych jest blisko 200 mln maili, a w wyszukiwarce Google\u2019a wpisywanych jest 4 mln zapyta\u0144. Na Facebooku udost\u0119pniamy ponad 2,5 mln r\u00f3\u017cnych tre\u015bci. Sie\u0107 multiplikuje si\u0119 w tempie 5 terabajt\u00f3w surowych danych na dob\u0119. Ilo\u015b\u0107 informacji jest olbrzymia. Potencjalnie w trakcie dnia dociera do internauty tyle informacji, ile jego dziadkowie konsumowali przez ca\u0142e swoje \u017cycie. Na jednego internaut\u0119 przypada dzi\u015b mniej wi\u0119cej tyle danych, ile mie\u015bci si\u0119 w ludzkim DNA \u2013 m\u00f3wi Piotr Prajsnar, CEO Cloud Technologies, najwi\u0119kszej hurtowni Big Data w Polsce.<\/p>\n<p>Metafora kodu DNA nie jest tu przypadkowa. Trudno bowiem wyobrazi\u0107 sobie lepsz\u0105 identyfikacj\u0119 konkretnej osoby ni\u017c jej DNA. W tej helisie krzy\u017cuj\u0105cych si\u0119 ze sob\u0105 kod\u00f3w zawarte s\u0105 informacje nadaj\u0105ce unikatowo\u015b\u0107 i indywidualno\u015b\u0107 ka\u017cdemu cz\u0142owiekowi. Podobnie rzecz ma si\u0119 z kodem danych, na kt\u00f3ry sk\u0142adaj\u0105 si\u0119 krzy\u017cuj\u0105ce si\u0119 ze sob\u0105 pliki cookies, pochodz\u0105ce z r\u00f3\u017cnych \u017ar\u00f3de\u0142. Ka\u017cdy u\u017cytkownik Sieci posiada sw\u00f3j profil behawioralny, czyli pewien wzorzec zachowa\u0144, osobiste internetowe DNA, wyr\u00f3\u017cniaj\u0105ce go spo\u015br\u00f3d t\u0142umu innych internaut\u00f3w. <\/p>\n<p><strong>Look alike modeling<\/strong><\/p>\n<p>Jeszcze 30 lat temu, w 1986 roku, gdy nikt nie s\u0142ysza\u0142 o czym\u015b takim jak \u201eBig Data\u201d, jedynie 6 proc. materia\u0142\u00f3w \u015bwiatowej kultury wyst\u0119powa\u0142o w postaci cyfrowej. Dzisiaj ju\u017c gros naszej kultury i naszego \u017cycia toczy si\u0119 (r\u00f3wnie\u017c) w formie cyfrowej. Digitalizacja to s\u0142owo-klucz do zrozumienia naszych czas\u00f3w. <\/p>\n<p>Czy jednak danych u\u017cywamy w takim stopniu, w jakim mogliby\u015bmy ich u\u017cywa\u0107? Wed\u0142ug ekspert\u00f3w z bran\u017cy analityki internetowej nie do ko\u0144ca wykorzystujemy wszystkie mo\u017cliwo\u015bci oferowane przez dane.<br \/>\nMarketerzy si\u0119gaj\u0105 dzi\u015b po dane g\u0142\u00f3wnie wtedy, gdy potrzebuj\u0119 przeprowadzi\u0107 kampani\u0119 reklamow\u0105 w Sieci i dotrze\u0107 do konkretnej grupy docelowej. Taka strategia pozwala ograniczy\u0107 strat\u0119 mediow\u0105 i dotrze\u0107 do targetu w bardziej efektywny spos\u00f3b. Pytanie jednak brzmi: czy to jest wszystko, co mo\u017cemy z nimi zrobi\u0107? <\/p>\n<p>Wed\u0142ug niej nie wystarczy tylko dociera\u0107 na podstawie danych do konkretnej grupy docelowej. Warto przede wszystkim optymalizowa\u0107 dane, tzn. analizowa\u0107 zachowania u\u017cytkownik\u00f3w na naszej witrynie, szacowa\u0107 potencja\u0142 konwersji, a nast\u0119pnie wykorzystywa\u0107 te dane do optymalizacji ca\u0142ych kampanii reklamowych. W optymalizacji danych pomocne okazuj\u0105 si\u0119 nie tylko informacje zawarte w plikach cookies, ale przede wszystkim r\u00f3\u017cne sygna\u0142y dostarczane przez platformy typu DSP (Demand Side Platforms). <\/p>\n<p>\u2013 W przypadku optymalizacji konwersji ca\u0142ej kampanii reklamowej warto wspomnie\u0107 o trendzie zwanym \u201elook alike modeling\u201d. Ta strategia jest op\u0142acalna zw\u0142aszcza w\u00f3wczas, gdy mamy niski wolumen cookies\u00f3w, tzn. gdy targetujemy na cookiesy, kt\u00f3rych mamy bardzo ma\u0142o. Problemem jest wyrobienie bud\u017cetu czy ilo\u015bci zaplanowanych ods\u0142on. Dzi\u0119ki \u201elook alike modeling\u201d mo\u017cemy znacz\u0105co rozszerzy\u0107 target kampanii. Wyszukujemy bowiem dodatkowych u\u017cytkownik\u00f3w, kt\u00f3rzy zachowuj\u0105 si\u0119 w Sieci podobnie do tych z naszej grupy docelowej, maj\u0105cych dodatkowo \u017c\u0105dan\u0105 przez nas intencj\u0119 zakupow\u0105. W\u00f3wczas nie tylko rozbudowujemy target, lecz tak\u017ce zwi\u0119kszamy szans\u0119 na wzrost wsp\u00f3\u0142czynnika konwersji \u2013 t\u0142umaczy Piotr Prajsnar. \t<\/p>\n<p><strong>Big Data otwiera oczy reklamodawcom<\/strong><\/p>\n<p>Dane to nie tylko nitka do k\u0142\u0119bka, jakim jest u\u017cytkownik. Pozwalaj\u0105 nie tylko go odnale\u017a\u0107 i dotrze\u0107 do niego, lecz tak\u017ce zweryfikowa\u0107, czy grupa docelowa zosta\u0142a zdefiniowana przez reklamodawc\u0119 w spos\u00f3b prawid\u0142owy. Cz\u0119sto bowiem okazuje si\u0119, \u017ce reklamodawcy mylnie okre\u015blili sw\u00f3j target. <\/p>\n<p>\u2013 Czasami mo\u017ce si\u0119 zdarzy\u0107, \u017ce nasz klient wychodzi od bardzo sztywnych ram kampanii, np. definiuje sw\u00f3j target w spos\u00f3b sztywny, nie zdaj\u0105c sobie sprawy z tego, \u017ce robi b\u0142\u0105d. Wtedy warto mu wcze\u015bniej przedstawi\u0107 symulacj\u0119, co\u015b w rodzaju kampanii testowej, powo\u0142uj\u0105c si\u0119 dodatkowo np. na poprzedni case i powiedzie\u0107: \u201eS\u0142uchaj, to si\u0119 nie sprawdzi. Trzeba albo zastanowi\u0107 si\u0119 nad rozszerzeniem grupy docelowej, albo nad jej ca\u0142kowit\u0105 zmian\u0105. By\u0107 mo\u017ce warto by\u0142oby przeznaczy\u0107 cz\u0119\u015b\u0107 bud\u017cetu na przeszukanie nowych segment\u00f3w u\u017cytkownik\u00f3w po to, by znale\u017a\u0107 ten, kt\u00f3ry \u201ezaskoczy\u201d. W\u00f3wczas Big Data okazuje si\u0119 r\u00f3wnie\u017c skutecznym narz\u0119dziem retargetingowym \u2013 przekonuje Bart\u0142omiej Malinowski, Business Development Director w Adform. <\/p>\n<p>Pierwsze efekty popularyzacji zastosowa\u0144 Big Data powoli staj\u0105 si\u0119 widoczne. Coraz wi\u0119cej witryn korzysta z danych personalizuj\u0105c i targetuj\u0105c reklamy pod konkretnych u\u017cytkownik\u00f3w, czyli konkretne pliki cookies. <\/p>\n<p>\u2013 Do tej pory zrealizowali\u015bmy przy u\u017cyciu danych oko\u0142o 500 kampanii reklamowych. Aktualnie mamy aktywnych 80 kampanii reklamowych. W przypadku zastosowania Big Data w kampaniach wzrosty oscyluj\u0105 w granicach od 20 proc. do nawet 120 proc. Otwieramy now\u0105 epok\u0119, je\u015bli chodzi o reklam\u0119 w Internecie: Big Data Marketing. Ko\u0144czy si\u0119 era masowych atak\u00f3w reklamowych i  strzelania na o\u015blep, gdzie popadnie, a n\u00f3\u017c widelec przypadkiem trafi si\u0119 jakiego\u015b internaut\u0119 \u2013 t\u0142umaczy \u0141ukasz Kapu\u015bniak, Big Data Chief Officer w Cloud Technologies. <\/p>\n<p><strong>Micha\u0142 Anio\u0142 Big Data <\/strong><\/p>\n<p>Big Data jest w stanie posprz\u0105ta\u0107 \u015bmietnik w internecie, tworzony przez reklamy masowe. Reklama wykorzystuj\u0105ca dane jest te\u017c mniej inwazyjna, a bardziej dyskretna i pomocna. Trzeba jednak pami\u0119ta\u0107 o tym, \u017ce Big Data nie jest \u017ar\u00f3d\u0142em wszelkiego dobra w marketingu internetowym, nie jest te\u017c rozwi\u0105zaniem wszelkich jego problem\u00f3w. Na pewno jednak jest odpowiedzi\u0105 na te, kt\u00f3re trapi\u0105 go najbardziej.<\/p>\n<p>Nie jest istotne to, czy b\u0119dziemy mieli do czynienia z zetta-, yotta- czy nawet hellabajtami, p\u00f3ki nie b\u0119dziemy dysponowa\u0107 odpowiednimi narz\u0119dziami analitycznymi, kt\u00f3re pozwol\u0105 z tych danych zrobi\u0107 jaki\u015b u\u017cytek, gdy ilo\u015b\u0107 danych prze\u0142o\u017cy si\u0119 na ich jako\u015b\u0107. Wszystko jest zatem kwesti\u0105 pewnego specyficznego spojrzenia roz\u0142\u0105czaj\u0105cego i \u0142\u0105cz\u0105cego zarazem, spojrzenia analityczno-holistycznego. Niekt\u00f3rzy w nieociosanej, kamiennej bryle nie zobacz\u0105 nic, poza zimn\u0105 i nieforemn\u0105 faktur\u0105. Ale artysta-rze\u017abiarz, obdarzony takim spojrzeniem i wyposa\u017cony w odpowiednie narz\u0119dzia, b\u0119dzie w stanie zobaczy\u0107 w tej bryle co\u015b innego \u2013 i przekuje j\u0105 w dzie\u0142o sztuki. Big Data jest takim kamieniem. <\/p>\n<p>Najwy\u017csza pora wyrze\u017abi\u0107 z niego co\u015b wi\u0119cej.<\/p>\n","protected":false},"excerpt":{"rendered":"\u201eHellabytes\u201d, czyli hell-a-lot-of-bytes, w wolnym t\u0142umaczeniu oznacza \u201epiekielnie du\u017co bajt\u00f3w\u201d. W tak ironiczny spos\u00f3b brytyjscy analitycy internetowi odpowiadaj\u0105 na pytanie, ile danych jest obecnie w Sieci. Oracle precyzuje twierdz\u0105c, \u017ce Sie\u0107 aktualnie liczy ponad 6 ZB (zettabajt\u00f3w) danych. Po przeczytaniu tego tekstu Internet rozro\u015bnie si\u0119 o kilkana\u015bcie petabajt\u00f3w.","protected":false},"author":6,"featured_media":160991,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"csco_display_header_overlay":false,"csco_singular_sidebar":"","csco_page_header_type":"","csco_page_load_nextpost":"","csco_post_video_location":[],"csco_post_video_location_hash":"","csco_post_video_url":"","csco_post_video_bg_start_time":0,"csco_post_video_bg_end_time":0,"footnotes":""},"categories":[9666],"tags":[3672,8022,3230],"class_list":{"0":"post-160990","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-technologie","8":"tag-big-data","9":"tag-hellabytes","10":"tag-technologie-2","11":"cs-entry","12":"cs-video-wrap"},"_links":{"self":[{"href":"https:\/\/mediarun.com\/pl\/wp-json\/wp\/v2\/posts\/160990","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/mediarun.com\/pl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/mediarun.com\/pl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/mediarun.com\/pl\/wp-json\/wp\/v2\/users\/6"}],"replies":[{"embeddable":true,"href":"https:\/\/mediarun.com\/pl\/wp-json\/wp\/v2\/comments?post=160990"}],"version-history":[{"count":0,"href":"https:\/\/mediarun.com\/pl\/wp-json\/wp\/v2\/posts\/160990\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/mediarun.com\/pl\/wp-json\/wp\/v2\/media\/160991"}],"wp:attachment":[{"href":"https:\/\/mediarun.com\/pl\/wp-json\/wp\/v2\/media?parent=160990"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/mediarun.com\/pl\/wp-json\/wp\/v2\/categories?post=160990"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/mediarun.com\/pl\/wp-json\/wp\/v2\/tags?post=160990"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}