Google zna ludzkie intencje, bo wie czego szukamy. Wie zatem, który kandydat budzi większe zainteresowanie internautów (mierzone liczbą zapytań o jego nazwisko). Kaczyński, Komorowski, a może jeszcze ktoś inny? Czy na podstawie natężenia zapytań o nazwiska kandydatów można miarodajnie przewidzieć wyniki wyborów? Poniżej przedstawiamy przykłady, jak wyglądały takie przewidywania w latach 2007, 2010 i 2011.
Wybory parlamentarne 2007
W tym roku nowym elementem kampanii wyborczej były nie wątpliwie debaty między liderami partii politycznych, na zapytanie „Debata” Google zwraca nam kilka ciekawych linków sponsorowanych:
Szczególnie na miejscu wydaje się być reklama nowego programu Tomasza Lisa – CozPolska.pl, pierwszego polskiego programu publicystycznego publikowanego tylko w internecie.
Google Trends a wybory
Równie interesujące wydają być informacje zbierane i publikowane w narzędziu Google Trends które pokazuje jaki był volumen wyszukiwań konkretnych fraz w przeszłości. Narzędzie zostało ostatnio rozbudowane i aktualizuje dane co godzinę. Zwróćcie uwagę jakie wyniki prezentowało Google Trends w 2005 roku na kilka dni przed wyborami prezydenckimi:
Obserwujemy wyraźny spadek ilości wyszukiwań frazy „tusk” oraz gwałtowny wzrost wyszukiwań frazy „kaczynski”, miało to miejsce na chwilę przed wyborami… wszyscy wiemy, jak się to skończyło, i kto został w efekcie Prezydentem Polski. Warto więc obserwować, jak sytuacja wygląda na chwilę obecną, można bowiem stwierdzić, iż Google jako wielka baza ludzkich intencji wie z dużym prawdopodobieństwem, kto wygra wybory na długo przed otwarciem lokali wyborczych.
Idąc tym tropem sprawdźmy: nazwisko jakiego polityka jest najczęściej wpisywanym słowem kluczowym?
Debaty odwzorowane w wyszukiwarkach
Pierwsza debata (1.10.2007) Aleksandra Kwaśniewskiego z Jarosławem Kaczyńskim cieszyła się zdecydowanie mniejszą popularnością niż dwie kolejne debaty Donalda Tuska z Jarosławem Kaczyńskim (Debata 2 – 12.10.2007) oraz z Aleksandrem Kwaśniewskim (Debata 3 – 15.10.2007).
W dwóch ostatnich przypadkach widzimy jak bardzo wzrosło zainteresowanie internautów osobą Donalda Tuska. Na podstawie danych prezentowanych przez Google Trends można powiedzieć iż to Donald Tusk wygrał dwie ostatnie debaty tej kampanii.
Konfrontując to z danymi na temat częstości wyszukiwania fraz „PO” „PiS”…
…można prognozować, iż to Platforma Obywatelska ma większe szanse na wygraną. Należy jednak pamiętać że wszystkie dane z mają spory margines błędu związany z faktem, iż polscy internauci ciągle nie są reprezentatywną grupą polskiego społeczeństwa.
Wybory prezydenckie 2010
Dociekania opierać będziemy przede wszystkim na danych dostarczanych przez Google za pośrednictwem narzędzia Google Insights for Search (Google Statystyki Wyszukiwarki). Narzędzie powie ci m.in. jak często internauci pytali Google o wskazane przez ciebie frazy (zapytania). Pokaże natężenie wskazanych przez ciebie zapytań na przestrzeni czasu i umożliwi porównanie takich trendów dla kilku fraz. Poniżej wyjaśniam to na przykładach.
Jak używać Statystyk Wyszukiwarki
Zapytaliśmy Google o to, jak często internauci wpisywali do wyszukiwarki nazwiska kandydatów w wyborach prezydenckich (między 19 maja a 15 czerwca). Google odpowiedział wykresem:
(kliknij w wykres aby powiększyć)
Co ten wykres właściwie pokazuje, a czego nie pokazuje? Mała sesja pytań i odpowiedzi:
Pytanie: O kogo internauci pytali częściej? O Kaczyńskiego, czy Komorowskiego?
Odpowiedź: O Komorowskiego.
Pytanie: Taaak? To ile było zapytań o Komorowskiego, a ile o Kaczyńskiego?
Odpowiedź: Nie wiadomo.
Pytanie:To co wiadomo?
Odpowiedź:Wiadomo tylko o ile częściej pytano o jednego niż o drugiego.
Pytanie:W takim razie o ile częściej pytano o Komorowskiego?
Odpowiedź: Zależy kiedy: np. 14 czerwca na każde 100 pytań o Komorowskiego przypadało 79 pytań o Kaczyńskiego.
Pytanie: Zainteresowanie Komorowskim rośnie, czy maleje?
Odpowiedź: Rośnie. Np. na każde 58 zapytań o Komorowskiego 7 czerwca, tydzień później przypadało już 100 zapytań (to wyjaśnienie jest nieco nieścisłe, ale do naszych celów zupełnie wystarczające).
Pytanie: To co w takim razie oznaczają te wszystkie cyfry na wykresie?
Odpowiedź: Wszystkie punkty tego wykresu mają przypisaną wartość, w zakresie od 0 do 100. Najwyższemu punktowi (największej liczbie zapytań) przypisuje się wartość 100, a pozostałym punktom przelicza się wartości proporcjonalnie. Wyobraźmy sobie, że interesują nas zbiory owoców. Szczyt zapytań o owoce przypada w święto sadownika, np. 15 sierpnia. Tego dnia
internauci pytali 500 razy o jabłka i 400 razy o gruszki. Zatem linia oznaczająca pytania o jabłka osiąga 15 sierpnia wartość=100, a linia oznaczająca gruszki wartość=80. Następnego dnia zainteresowanie jabłkami było już niższe, tylko 300 zapytań. Linia oznaczająca jabłka będzie więc linią opadającą – do wartości=60.
Wróćmy do naszego wykresu. Jak uzyskać go samemu? Wejść na witrynę Statystyk Wyszukiwarki i zapytać o trendy dla wydanych na terenie Polski zapytań o „kaczyński + kaczynski -lech” (zliczamy zapytania o „kaczyński” lub „kaczynski”, ale bez zapytań, w których wystąpiło słowo „lech”), „komorowski”, „napieralski”, „jurek”, „pawlak” za okres od 19 maja do 15 czerwca (niestety, nie da się uzyskać danych dla bieżącego i dwóch poprzednich dni).
Komorowski prowadzi
Z wykresu wynika, że zainteresowanie Komorowskim jest w ostatnich dniach o ok. 20% wyższe, niż zainteresowanie Kaczyńskim. Czy to oznacza, że Komorowski będzie prezydentem?
A czy natężenie zapytań o nazwiska kandydatów jest w ogóle miarodajne? Przyjrzyjmy się temu:
Google nie umie prognozować wyników wyborów!
Jest wiele teoretycznych powodów, dla których przekładalność wolumenu zapytań o nazwisko kandydata na jego wyborczy wynik powinna być traktowana z dystansem.
Po pierwsze, Google zbiera intencje wyłącznie internautów, a internauci nie są reprezentatywną próbką polskiego społeczeństwa. Wiadomo, jesteśmy młodsi, lepiej wykształceni i mieszkamy w większych miastach niż statystyczny wyborca. Część internautów może w ogóle nie być uprawniona do głosowania (niepełnoletni, rezydenci bez polskiego obywatelstwa).
Po drugie, zliczanie zapytań kierowanych do wyszukiwarki nie rządzi się prawami analogicznymi do reguł ordynacji wyborczej. Z oczywistych względów wyszukiwarki nie uwzględniają zasady „równości głosowania”, tzn. pozwalają „oddać więcej niż jeden głos”. Co gorsza, pozwalają oddać wiele „głosów” na różnych kandydatów jednocześnie.
Po trzecie, internauta wpisujący w wyszukiwarkę nazwisko kandydata może robić to z każdego ze 100 możliwych powodów. Może słyszał na mieście złośliwą plotkę o nielubianym kandydacie i chce poczytać więcej? A może waha się między poparciem kandydata X i kandydata Y i chce sprawdzić programy obydwu? A może nowy chłopak jego córki nosi nazwisko takie jak jeden z kandydatów: kto zacz? nakazać córce powrót przed dobranocką, czy odpuścić i wyznaczyć powrót na 21:00? A może, a może…
Po czwarte, Google pokazuje trendy zainteresowania kandydatami, ale są to trendy z przeszłości. Nawet nie teraźniejsze (opóźnienie w wyświetlaniu danych wynosi, jak już pisałem, 3 dni. W dniu wyborów (niedziela) najświeższe dostępne dane będą pochodzić z wczoraj (czwartek, niniejszy tekst piszę w piątek). O przewidywaniu przyszłości nie wspominając. W świecie polityki 3 dni opóźnienia to czas, w którym można wyciągnąć co najmniej kilku dziadków z Wehrmachtu, SB-cką teczkę, czy w ostateczności Annę Jarucką. Być może sztabowcy któregoś kandydata organizują właśnie „kontrolowany przeciek”, który wywróci do góry nogami trendy z wyszukiwarki.
Google umie prognozować wyniki wyborów!
Jest jeden empiryczny powód, dla których prognozowanie wyników wyborów na podstawie statystyk Google jest rozsądne. Takie prognozy w przeszłości wielokrotnie się sprawdzały.
Sprawdziły się m.in. w odniesieniu do wyborów parlamentarnych w Polsce 2007, niedawnych wyborach parlamentarnych w Wielkiej Brytanii, wyborach prezydenckich w USA w 2008 roku.
Choć więc wpisanie do wyszukiwarki nazwiska kandydata nie jest równoznaczne z chęcią zagłosowania na niego, korelacja między jednym i drugim może okazać się wystarczająco wysoka.
Kto wygra wybory prezydenckie 2010?
Zastrzegając, że to zabawa, że polityka jest nieprzewidywalna i że dane są zbyt kiepskiej jakości, odważę się napisać, że:
- Google bardzo przeszacowuje wynik Napieralskiego. W rzeczywistości dałbym mu sondażowe 9%,
- sondaże mocno przeszacowują wynik Komorowskiego i niedoszacowują Kaczyńskiego. Ze statystyk wyszukiwarki wynika, że Kaczyński skraca dystans do Komorowskiego, a tendencja ta będzie się wg mnie utrzymywać aż do dnia wyborów. W konsekwencji Komorowski wygra stosunkowo niedużą różnicą głosów i potrzebna będzie II tura.Mój typ to 43% – 39%.
A jakie są wasze typy? Piszcie!
Wybory prezydenckie 2010 – przed drugą turą
Upłynęły dwa tygodnie od przewidywań przed pierwszą turą wyborów prezydenckich. Jak wygląda sytuacja przed turą drugą, decydującą?
Tak wygląda najświeższy wykres pokazujący natężenie zapytań o nazwiska obu kandydatów (3 czerwca – 30 czerwca):
Jak widać, najwyższym punktem wykresu są zapytania o Bronisława Komorowskiego w dniu wyborów. Tak duży wzrost zainteresowania zawdzięcza kandydat przede wszystkim 4 godzinom (między końcem ciszy wyborczej – godziną 20:00 – kiedy ogłoszono pierwsze sondaże, a północą) kiedy cieszył się ze zwycięstwa. Już następnego dnia zainteresowanie oboma kandydatami znacznie zmalało, a już od wtorku zapytania o Jarosława Kaczyńskiego zdarzały się częściej, niż o Komorowskiego. Taki trend utrzymał się aż do niedzieli, kiedy miejsce miała pierwsza z debat prezydenckich. W powszechnej opinii komentatorów, jej zwycięzcą był Bronisław Komorowski, który w niedzielę zrównał się z przeciwnikiem w zakresie zainteresowania internautów. W kolejnych dniach, aż do środy, widać było nieznaczną przewagę zapytań o Komorowskiego, tak jednak nieznaczną, że chyba nieznaczącą. Linie obrazujące zainteresowanie oboma kandydatami są w tym okresie praktycznie równoległe – jak jednemu spadało, to drugiemu podobnie; jak jednemu rosło, to drugiemu też i o tyle samo.
Jak na przebieg kampanii wpłynęły debaty prezydenckie? Czy kandydatom udało się „wrzucić” do kampanijnego dyskursu jakiś nowy wątek, zawładnąć umysłami wyborców wystarczająco mocno by zaangażować ich do samodzielnego rozszerzania tematu przy użyciu wyszukiwarki?
Wynotowałem najbardziej rzucające się w oczy elementy pierwszej debaty, a następnie sprawdziłem w Google Insights for Search jak kształtowało się natężenie zainteresowania odpowiednimi frazami.
in vitro
małżeństwa homoseksualne
przywileje emerytalne
gaz łupkowy
katastrofa smoleńska
polityka wschodnia
białoruś
g20
Miedwiediew
joanna lichocka
monika olejnik
Wyobraźnią i ciekawością telewidzów zawładnęły tylko niektóre z tych haseł. Oto wykres (przypominam, że debata odbyła się 27 czerwca, w niedzielę):
Jak widać, największe zainteresowanie zyskała wspominana przez Jarosława Kaczyńskiego grupa G20, skupiająca (w teorii) 20 najbogatszych państw świata. W górę poszło także zainteresowaniem „gazem łupkowym”, istnienie dużych złóż którego podejrzewa się w Polsce, co ma z nas uczynić „drugą Norwegię”. Wzrost zanotowała też fraza „in vitro”, warto jednak zauważyć, że zainteresowanie tą frazą podlega znacznym fluktuacjom i niedzielny wzrost nie przewyższa znacząco średniego natężenia zapytań. Nieznaczny wzrost zapytań odnotowaliśmy dla słowa „białoruś”, choć, co charakterystyczne, raczej następnego dnia po debacie, niż w jej dniu. Prawdopodobnie zatem internauci nie uznali poglądów Jarosława Kaczyńskiego w sprawie Białorusi za bulwersujące, a sprawą zaczęli interesować się następnego dnia, gdy słowo to padało często z ust komentatorów. Cichym bohaterem tego zestawienia jest jedna z prowadzących debatę, Joanna Lichocka, której nazwisko wyszło w niedzielę „z niebytu” i od tego czasu utrzymuje się na powierzchni. Wzrost zainteresowania Moniką Olejnik był co prawda w niedzielę znacznie większy, jednak jest to rozpoznawalne nazwisko.
Internauci nie wykazali szczególnego zainteresowania pozostałymi hasłami z listy. Tak wygląda np. wykres dla frazy „katastrofa smoleńska”:
Dla pozostałych wymienionych fraz („małżeństwa homoseksualne”, „przywileje emerytalne”, „polityka wschodnia”, „Miedwiediew” Google zgłosił „zbyt mało danych” by pokazać trendy.
Można się zastanawiać dlaczego zainteresowanie wzbudziły tylko niektóre z wymienionych fraz. Przecież „przywileje emerytalne” to temat bezpośrednio dotykający wieluset tysięcy ludzi, a pośrednio ich rodzin. Małżeństwa homoseksualne to z kolei temat bardzo gorący, budzący duże emocje. Wygląda więc na to, że motywacją dużej części internautów było – po prostu – sprawdzenie definicji słabo znanych pojęć („g20”, „in vitro”, „gaz łupkowy”).
Widać wyraźnie, że także druga debata spowodowała znaczny wzrost zainteresowania kandydatami, ale nie będziemy tu już omawiać konkretnych haseł z tej debaty, bo wnioski byłyby podobne.
Czy internauci szukają kandydatów przez ich hasła wyborcze? Kto ma lepsze hasło? Zobaczmy:
Jak widać, hasła wyborcze dość powoli przebijają się do umysłów wyborców, a wyraźnie wzrostową tendencję notuje w ostatnich dniach hasło „zgoda buduje” Bronisława Komorowskiego. Nie mamy niestety danych w liczbach bezwzględnych, więc trudno powiedzieć na ile istotne są te hasła jako element identyfikujący kandydatów.
Teraz najważniejsze: czy na podstawie danych z Insights for Search można pokusić się o przewidzenie wyniku wyborów? Wg mnie – nie. Obaj kandydaci idą w tym wyścigu łeb w łeb i przewidzenie, który wyjdzie na prowadzenie na ostatniej prostej nie wydaje mi się wykonalne; zależy to zresztą w dużej mierze od frekwencji wyborczej, a ta z kolei od takich czynników jak pogoda czy motywacja urlopowiczów do szukania lokalu wyborczego. Strzelam, że w drugiej turze wyborów prezydenckich 2010 – podobnie jak w pierwszej – różnica między kandydatami będzie mniejsza, niż pokazują to sondaże, raczej nie więcej niż 52-48 dla Komorowskiego.
Wybory parlamentarne 2011
Czy dane o natężeniu zapytań do Google można wykorzystać do przewidywania wyników wyborów parlamentarnych?
Tylko do pewnego stopnia. Z parlamentarnymi jest trudniej, niż z prezydenckimi. Do wszystkich problemów opisanych powyżej (niereprezentatywność „próby” szukających, możliwość wielokrotnego „głosowania”, odzwierciedlanie danych z przeszłości, różnorodność intencji szukających) doszłyby kolejne. Bo jakie zapytania właściwie monitorować?
- Pełne nazwy partii są zbyt długie i rzadko używane w potocznym języku,
- skróty z kolei zbyt wieloznaczne (np. „PO”),
- nazwiska liderów zbyt pospolite (np. Pawlak, Kaczyński), poza tym nazwiska liderów partii wodzowskich będą nadreprezentowane (Palikot), z kolei nazwiska partii z miękkim przywództwem – niedoreprezentowane (np. wielogłosowy PSL, który mógłby bez przeszkód funkcjonować pod przywództwem kogoś innego niż Waldemar Pawlak).
Wziąwszy pod uwagę te zastrzeżenia, a także wnioski ze sprawdzalności naszych prognoz z wyborów prezydenckich 2010, dochodzimy do jedynej chyba rozsądnej metodologii. Różnice w natężeniach zapytań (niezależnie od tego, czy sprawdzamy nazwy partii czy nazwiska liderów) nie odzwierciedlają poparcia dla partii i nie pozwolą przewidzieć wyniku. Warto jednak obserwować trendy, czyli zmiany natężeń wyszukiwań.
Za bazę przewidywań należy uznać wyniki sondaży i prognoz wyborczych podawanych w mediach przez sondażownie. Wyniki te – jak pokazuje doświadczenie – różnią się wyraźnie od ostatecznych wyników wyborów. Przyczyn może być wiele, są jednak 2 najważniejsze:
- sondaże opierają się o deklaracje, a te mogą być zafałszowane; respondenci nie lubią przyznawać się do popierania partii nielubianych przez media (np. PiS, stąd sondaże regularnie niedoszacowują poparcia dla partii Kaczyńskiego), chętnie natomiast mówią o poparciu dla lidera, choć w dniu wyborów nie zawsze chce im się ruszyć do lokalu wyborczego (stąd przeszacowania poparcia dla Platformy),
- sondaże pokazują przeszłość. Nawet sondaże publikowane tuż przed ciszą wyborczą (w piątek wieczorem) pokazują stan ducha wyborców z poniedziałku-wtorku. Do niedzielnych wyborów wyborcy mają jeszcze 4-5 dni, by zmienić decyzje.
Obserwowanie zmian natężenia zapytań o poszczególne partie/liderów rozwiązuje (przynajmniej częściowo) oba te problemy sondaży. Po pierwsze mierzymy bowiem realne zainteresowanie wyborców, a nie ich deklaracje. Po drugie, Google’owych Statystyk wyszukiwarki nie obowiązuje cisza wyborcza, więc w wyborczą niedzielę będziemy mogli obserwować zmiany trendów zachodzących w czwartek-piątek (zamiast w poniedziałek-wtorek, jak w przypadku sondaży).
Zmiany natężenia wyszukiwań mogą więc posłużyć do skorygowania wyników sondaży. Oczywiście nawet dane o trendach obarczone są zbyt wieloma błędami, żeby można było mówić o obliczaniu konkretnego poparcia, ale możemy „doważać” wyniki sondaży „na oko”, np. według modelu:
- jeśli od dnia przeprowadzenia sondażu natężenie zapytań o daną partię/jej lidera mocno spadło, od jej sondażowych wyników należy odjąć 15-20% (procent, nie punktów procentowych!, czyli jeśli partia ma w sondażach 30%, odjęcie 20% daje nie 10%, a 24%),
- jeśli spada łagodnie, od jej sondażowych wyników należy odjąć 5-12%,
- jeśli rośnie mocno, należy dodać jej 15-20%,
- jeśli rośnie łagodnie, należy dodać jej 5-12%.
Zobaczmy zatem, co Statystyki wyszukiwarki mówią w tej chwili (czwartek 6 października, około południa):
…dla zapytań o nazwiska liderów…:
…i dla zapytań o pełne nazwy partii:
Weźmy też robione codziennie sondaże telefoniczne TNS OBOP.
Jakie wnioski?
Przede wszystkim wyszukiwarka uprawdopodabnia przekroczenie progu wyborczego przez Ruch Palikota. Choć buzz wokół Palikota jest olbrzymi, trudno jednak uwierzyć, że googlający go internauci zamierzają w komplecie oddać na niego głos. Ma szanse osiągnąć wynik lepszy, niż pokazują to dziś sondaże (nawet 11-13%). Nie należy jednak przeceniać wagi faktu, że na obu wykresach Palikot wyprzedza nawet PO.
Zgodnie z przyjętą metodologią, nie powinniśmy komentować wyniku SLD i PSL, nie mamy bowiem żadnych danych. Wykres obrazujący natężenie zapytań o obie partie jest bliski poziomemu, a więc skoro nie ma zmian trendów, przyjmujemy, że wynik sondażowy jest tym prawdziwym. Kilka zdań komentarza warto jednak odnieść do SLD: bezprecedensowy spadek notowań tej partii na przestrzeni ostatnich kilku tygodni, obrazowany przez sondaże został potwierdzony przez wyszukiwarkę. Zarówno w sondażach, jak i w wyszukiwarce partia Napieralskiego przestała być łącznikiem między „peletonem” (PSL, Ruch Palikota, PJN) a „ucieczką” (PO i PiS). Wygląda na to, że fatalnie oceniania kampania SLD faktycznie cofnęła tę partię do peletonu. Zainteresowanie frazą „sojusz lewicy demokratycznej” jest na tyle niskie, że Google nie pokazuje wykresu, natomiast zainteresowanie słowem „napieralski” jest 16-krotnie mniejsze, niż zainteresowanie słowem „tusk”, a trend jest stały. SLD dostanie więc pewnie sondażowe 6-8%.
Choć PSL nie wypada dobrze ani w sondażach, ani w wyszukiwarce, utrzymuje swój standardowy poziom poparcia w okolicach 6-8%, może się więc zdarzyć, że prześcignie SLD. Jeszcze kilka tygodni temu było to nie do pomyślenia, proporcje poparcia dla obu partii utrzymywały się bowiem bardzo długo w okolicach 2:1 dla SLD.
Najtrudniejsza jest interpretacja wyników dwóch najmocniejszych partii na polskiej scenie: Platformy i PiS-u. Obie partie notują wzrosty, choć w przypadku PiS są one słabsze, niż w przypadku Platformy. Wzrost zainteresowania liderami obu partii ma za to podobną dynamikę. Wygląda na to, że postępuje polaryzacja sceny, trwa mobilizacja zwolenników obu partii, przy czym mobilizacja wyborców Platformy jest mocniejsza. Uwzględniając standardowe w sondażach przeszacowanie Platformy i niedoszacowanie PiS-u i gdyby wybory odbywały się w miniony poniedziałek (z tego dnia pochodzą dane z wyszukiwarki, a także prawdopodobnie z publikowanych wczoraj i dziś sondaży), Platforma mogłaby dostać ok. 32-33%, a PiS – ok. 22-23%.
Do wyborów może jednak zmienić się jeszcze dużo. Sondaże, które są podstawą naszych szacunków sprawdzają się przy wynikającej z odpowiedzi respondentów frekwencji, na którą wpływ ma wiele czynników (z pogodą włącznie). Inne czynniki to wyciąganie ewentualnych „haków”, wpadki czy motywacja mediów do „trzymania na powierzchni” antyniemieckich wypowiedzi Jarosława Kaczyńskiego.
Przypominamy, że wielkimi krokami zbliża się konferencja I ♥ Marketing & Technology, która odbędzie się już 22–24 października 2024 roku oraz organizowane przez nas 33 szkolenia z zakresu marketingu.
Jeśli chcesz być zawsze na bieżąco, zamów prenumeratę magazynu sprawny.marketing!
NIEPRAWDA! Google Insight widzi to inaczej! Ominęliście liczącego się gracza JKM: sprawdźcie, jest 3ci! http://www.google.com/insights/search/?hl=pl#q=ja…
W tym przypadku Google ma "niewłaściwe" dane wejściowe, bo nie pozwalają na właściwą analizę.
To tak, jak w świecie rzeczywistym prognozować wynik wyborów np. na podstawie danych wejściowych typu;
"zerknięć" na plakat jednego kandydata przy plakacie drugiego. Google to potężne narzędzie globalne i jego
znaczenie rośnie z dnia na dzień. Może w przyszłości pokusi się o prognozowanie wyników wyborów,
wystarczy, że umieści ankietę dla internauty, która zwierać będzie oprócz własnych preferencji,
wpis czy np. ojciec matka też tak będą glosowali, pozwoli to na rozszerzenie grupy ponad użytkowników internetu.
Druga rzecz, to konieczność umieszczania komentarzy do innych wpisów
(np. w tej kampanii do odniesienia się do odczuć internautów,
czy zrzeczenie się głosu Cimoszewicza na prawicowca, nie budzi
u nich odczucia, że p.komuniści muszą czuć się bardzo zagrożeni przy dojściu kandydata PiSu,
co zamiast zaowocować rzeczywistym przeniesieniem głosów nie zaowocuje b.świadomym wyborem,
a to się daje współcześnie zrobić z dostępem i narzędziami Google'a). Podobnie wiele innych danych.
Tak więc przy tych wyborach prognozy Google'a są raczkujące, jednak w przyszłości będą bardzo liczącymi.
Uważam że wyniki te nie są zbyt miarodajne… Internauci używający na co dzień wyszukiwarki Googl'a stanowią jedynie pewną grupe przekroju polskiego społeczeństwa…
Przykładowo z analiz Google Insights wynika iż dwójka liderów nie może być pewna w 100% drugiej tury bo po piętach depcze im groźny konkurent – Jan Korwin Mikke. Dziwie się że zabrakło go w tym zestawieniu. Badania mogą dowodzić bardzo dużego poparcia dla JKM. Potwierdzają to subiektywne analizy popularności JKM na wykopie czy bardzo duża liczbą fanów na FB tego kandydata. Można śmiało powiedzieć że JKM to prawdziwy król internetu, bo mimo słabego wsparcia ze strony innych mediów zajmuje w internecie 3 miejsce. Nawet na portalach typu też gazeta.pl, onet.pl itp nie za wiele się o nim mówi, a jednak pozycja którą zajmuję w badaniach opartych na Insights jest naprawdę zaskakująca …
Warto przeczytać pomoc dla Statystyki Wyszukiwania: http://www.google.com/support/insights/bin/answer…
Statystyki wyszukiwania nie odpowiedzą nam nam bezpośrednio na pytanie kto wygra wybory prezydenckie, ale pośrednią mogą służyć do zaawansowanych analiz – dane wbrew pozorów są wiarygodne, tyle tylko że pewne grupy są nadreprezentowane.
@ "niewłaściwe dane wejściowe"
Wyraźnie zaznaczałem w tekście wszystkie czynniki osłabiające korelację między natężeniem zapytań o nazwisko kandydata a jego wynikiem wyborczym. Korelacja nie jest zatem zupełna, ale jest wystarczająca, by potraktować dane z wyszukiwarki jako sensowny predykator wyniku wyborów. Sensowny, tzn. lepszy od losowego.
Odnosząc się bezpośrednio do twojego argumentu, to spytanie wyszukiwarki o kandydata jest dowodem wielokrotnie większego zaangażowania niż zerknięcie na offlajnowy plakat i w tym sensie jest lepszym predykatorem zachowań wyborczych.
@ "wystarczy , że umieści ankietę dla internauty"
Ankieta jest niekoniecznie lepszym pomysłem. Ankieta w Google nie byłaby w niczym lepsza od standardowego badania ankietowego. Kopiowałaby wszystkie jego wady (przede wszystkim bazowanie na *deklaracjach*, które z wielu różnych powodów bywają zafałszowane), a nawet dodawałaby własne wady (niereprezentatywność próby). Zresztą w realiach amerykańskich Google sugerował już wykorzystanie statystyk wyszukiwarki do badania trendów wyborczych:
@ Szymon: ale co właściwie jest nieprawdą? Korwin jest liczącym się graczem tylko w internecie, gdzie grupka pryszczersów robi wokół niego zamieszanie. Po którym nie ma śladów w realnym świecie. Korwin to takie kuriozum, którym ludzie interesują się tak jak Dodą Elektrodą, ale 20 lat wyborów pokazuje, że *nie chcą na niego głosować*. Kontrowersyjnością możesz przesunąć się w Insights for Search z ligi okręgowej do – powiedzmy – drugiej, ale w wyborach i tak nie przekroczysz 4%.
Co do Smoleńska, to zniekształca on wyniki Insights for Search w mniej-więcej równym stopniu, w którym zniekształca same wybory.
@ "Można śmiało powiedzieć że JKM to prawdziwy król internetu"
Tak jak pisałem we wcześniejszym komentarzu, Korwin jest królem internetu w tym sensie, że udało mu się zebrać wokół siebie nieliczne grono bardzo zaangażowanych młodych ludzi. I że umie skupiać na sobie uwagę niezaangażowanych internautów, którzy są ciekawi co też kontrowersyjnego znów powiedział.
Korwin jest zatem królem internetu w takim sensie, w jakim królami – przykładowo – Warszawy są geje i lesbijki po marszu równości. Zrobili zamieszanie? Zrobili. Widać ich było w przestrzeni publicznej. Widać. Mówią o nich ludzie? Mówią. Ale trzymać się od nich chcą z daleka.
Widać że w ogóle nie interesujesz się polityką czy gospodarką tylko zlepkiem informacji dostarczanych przez media. Znasz chociaż jeden punkt programu Kaczyńskiego albo Komorowskiego oprócz tego że jeden jest z Pis'u a drugi Platformy? Założę się że nie… Więkoszość ludzi głusuje na tak zwane wizerunki.. Obojętnie co myśli, co chce zrobić – ważne z jakiej jest opcji politycznej oraz jak prezentuje się w mediach – odwiedzanie powodzian, przemówienia na wiecach, wpadki słowne, sposób prezencji itp. Żal mi naprawdę takich ludzi którzy chłoną jak gąbka wszystko co przekazują im media. Czy Mikke jest kontrowersyjny? A co mają media pokazywać na pewno nie program wyborczy, przecież tego w mediach się pokazuje, szuka się sensacji.. a nikogo nie obchodzą sprawy merytoryczne. Tutaj znajdziesz poglądy Korwina odnośnie gospodarki wykop.pl/ramka/360268/program-jkm-podany-w-bardzo-przystepny-sposob/
Internet w przeciwnieństwie do innych mediów daje możliwość komunikowania się w obie strony . W tv jest sie tylko biernym odbiorca łykajajcym dosłownie wszytko . ps. być może ta grupka nielicznych ludzi to przedstawiciele ludzi którzy nie dają się manipulować mediom i w przeciwieństwie do większości mają własne zdanie.
@ "Widać że w ogóle nie interesujesz się polityką czy gospodarką tylko zlepkiem informacji dostarczanych przez media"
Skoro tak kompletnie nic nie rozumiem, to po prostu wypunktuj mnie, zdanie po zdaniu. To powinno być bardzo proste.
Najwyraźniej nie było, skoro wolałeś odpłynąć w snucie wizji na mój temat (nie interesuję się polityką, nie znam programów, chłonę jak gąbka wszystko co przekazują media).
Gdybyś wiedział, co to znaczy "kontrowersja", nie miałbyś wątpliwości, że Korwin je budzi (http://sjp.pwn.pl/slownik/2564549/kontrowersja)
Na koniec przypominam, że dyskutujemy tutaj o wyborach, przewidywanych wynikach i możliwościach przewidywania ich na podstawie statystyk wyszukiwarki. A nie o Korwinie.
Chciałem przez to zaznaczyć różnice pomiędzy tradycyjnymi mediami a Internetem.
Może Korwin jest ukazywany jako kontrowersyjna postać ale jego poglądy na gospodarkę wydają się być całkiem rozsądne. Niestety w telewizji w mass mediach nie mówi się za wiele o gospodarce a jedynie szuka się sensacji.
Także odnoszę się do wyników działania tego narzędzia, ukazujące poparcie internautów dla kandydatów. Tak jak pisałem wcześniej wynik Korwina nie jest przypadkiem. Moim zdaniem sugeruję to o dużym zainteresowaniu tą postacią pośród internautów ( a raczej takich co używają googla co najmniej kilka razy dziennie). Na pewno część z tych wyszukiwań nie oznacza poparcia a np. wyszukania jakiś wypowiedzi na dany temat. Ale podobnie też jest z innymi kandydatami. Internauci poszukują różnych wpadek czy wypowiedzi Kaczynskiego i Komorowskiego. Google raczej mówi o popularności a nie poparciu, choć to pierwsze w dużej mierze przekłada się na drugie….
Dlatego sugeruje że w tej grupie ludzie JKM jest 3 w najgorszym wypadku 4.
Zresztą mówmy o działaniu samego narzędzia a nie o polityce i kandydatach.
Zasugerowałem tylko że JKM ze względu na zakakujące wyniki powinien znaleźć się w badaniu.
No i faktycznie, dyżurny błazen polskiej polityki zagrał na nosie różnej maści tzw, ekspertom. Co do wyników, szkoda, że prognoza autora co do niewielkiej różnicy się sprawdziła.
Już po wyborach. Prognoza w oparciu o Google Insights for Search okazała się całkiem trafna. Słuszne były przewidywania, że dystans między Komorowskim i Kaczyńskim szybko skraca się i wyniesie tylko ok. 4% (sondaże wskazywały tymczasem na wysokie zwycięstwo Komorowskiego, nawet 14-16% głosów). Gdybym nie zlekceważył widocznych w IfS świetnych wyników Napieralskiego, to przepowiednia byłaby 100% poprawna (przewidywałem 43-39-9, a faktycznie jest 41-37-14).
Wniosek: Choć dane o natężeniach wyszukań podawał Google mało wiarygodnie (poważna nadreprezentacja Napieralskiego i Korwina-Mikke), to cenne okazują się dane o ZMIANACH tych natężeń, czyli o trendach. Znając te trendy można przewidzieć, w którą stronę zmieniają się nastroje i uwzględnić tę wiedzę przy czytaniu sondaży.
Korwin natomiast okazał się królem III ligi ;-).
najbardziej podoba misie kawalek po trzecie i po czwarte ;-)
dziwne to wszystko i w ogole moze trzeba zaczac w Boga wierzyc, bo najpierw wychodzi, ze Google to nic nie daja, i ze bez sensu (do ostatnich slow bylam przekonana, ze to bez sensu), a potem dowiaduje sie, ze w 2007 w Polsce i w Wielkiej Brytanii to sie okazalo, ze Google wykrakal… hm, czy to skutecznosc kampanii tak przeklada sie na zainteresowanie danym kandydatem, a co za tym idzie, za googlowaniem go?
pozdrawiam i zycze sukcesow
jak dla mnie to tym razem google mógł się pomylić…
Google kompletnie nie sprawdziło się jako 'sondażownia'.
Nie dość że BK pokonał JK (ten drugi miał więcej wyników, lepszą tendencję), to JKM w 1-wszej turze miał zgoła inny wynik niż można by się spodziewać po ilości zapytań ;p
Póki co więcej prawdy o sondażach usłyszymy od wróżki :D
Sondaże to wielka pralnia mózgu. Jedna wielka ściema i nie ważne czy to OBOP czy google czy zupełnie coś innego.
No, to mam nadzieję, że z chwilą rozpoczęcia ciszy wyborczej …wyłączą Google :-D
A ja mam nadzieję, że do sejmu wejdzie jedyne jak na tą chwile ugrupowanie liberalne.
Pewnie jak tak dalej pójdzie to niedługo Google zacznie przewidywać przyszłość ;)
tego typu prognozy zawsze będą na korzyść partii liberalnych niż konserwatywnych:)