Pod koniec października 2011 Google wprowadziło możliwość większej prywatności dla użytkowników wyszukiwarki. Wystarczy posiadać konto Google (czyli jakikolwiek produkt Google) i być zalogowanym. Jeśli w tym czasie będziemy korzystać z wyszukiwarki dane dotyczące naszego wyszukiwania (słowa kluczowe) nie będą przekazywane do żadnego innego podmiotu. Nowa funkcjonalność zapewniająca więcej prywatności użytkowników wyszukiwarki, nie specjalnie przypadła do gustu wszystkim, którzy pracują nad pozycją w wynikach organicznych. Jakaś część informacji do analizy efektywności działań SEO została w końcu odebrana.
Zamiast słów kluczowych pojawiło się w Google Analytics w raporcie słów kluczowych nowe oznaczenie „not provided”. W internecie pojawiło sie sporo komentarzy mówiących o tym, że Google zabiera narzędzia do analizy działań SEO, że niedługo znacząca część ruchu będzie właśnie „not provided”. Na Search Engine Land pojawiły się całkiem spore procenty ruchu zaliczanego do „Not provided” dochodzące do 17% całości ruchu w witrynie. Oznacza to, że właściwie nie wiem jakie intencje miało 17% osób, które pojawiły się na stronie. To bardzo zła wiadomość dla analityków webowych i SEMitów, którzy muszą cały czas optymalizować i poprawiać swoje działania w internecie.
Dodatkowo ostatnio przeglądarka Firefox ogłosiła, że zamierza wprowadzić kodowanie jako standard. W takim przypadku wszyscy użytkownicy FF będą mieli z automatu włączony protokół SSL, a co za tym idzie więcej wizyt będzie oznaczonych jako „not provided”. W tym samym czasie przeglądarka FF staje się bardziej „bezpieczna” niż Chrome czy Internet Explorer. Ciekawe jak długo te dwie przeglądarki pozostaną nie szyfrowane?
Czemu Google wprowadziło tą zmianę?
Google dba o bezpieczeństwo i prywatność swoich użytkowników. Robi to jednak wybiórczo pozostawiając obecnie kilka dużych luk w tym całym zabezpieczeniu prywatności. Jedno to tzw. refferer data czyli dane zawarte w adresach URL przekazywanych do stron z wyszukiwarki. Jeśli wpiszemy coś do wyszukiwarki nasze zapytanie się pojawi w adresie w pasku przeglądarki. Te dane mogą wyciekać. Innymi takimi niedoskonałościami systemu są linki sponsorowane i Narzędzie dla webmasterów. Google AdWords – Google nadal udostępnia reklamodawcom informacje o wyszukiwanych hasłach. Druga to Narzędzie dla webmasterów gdzie otrzymujemy dane dotyczące wyszukiwania organicznego. Są to jednak dane ograniczone czasowo i uśrednione. Te dane nie są szyfrowane z przyczyn nieznanych oficjalnie.
Wracając jednak do raportów Google Analytics.
Musimy jednak szykować się na czasy, gdzie sporo danych będzie jednak nie dostępna dla nas jak do tej pory i ilość tych danych będzie rosnąć.
Od października systematycznie ruch „not provided” się zwiększał na witrynach, którymi się opiekuję. Zwłaszcza mój blog „cierpi” z tego powodu, gdyż obecnie „not provided” to najpopularniejsze słowo kluczowe w raporcie słów kluczowych. Dodatkowo, kolejne sygnały ze świata mówią, że „Not provided” będzie systematycznie rósł. W takiej sytuacji postanowiłem trochę podsumować to wyzwanie i przybliżyć sposoby interpretacji ruchu zaliczanego do „not provided”.
Czy „not provided” należy się w ogóle przejmować?
To dobre pytanie. Po pierwszym jak najbardziej negatywnym odebraniu wiadomości o nowej funkcji i wizji końca sensownych analiz w Google Analytics, podszedłem do tematu bardziej analitycznie i zadałem sobie dość ważne pytanie – Czy ten ruch jest duży i czy jest wartościowy, żeby się tym w ogóle przejmować?
Zerknijmy więc na raport dotyczący ilości i rodzaju ruchu, który generowany jest z oznaczeniem not provided. W tym celu musimy zrobić bardzo prosty segment dla tego rodzaju ruchu…
…i skorzystać za raportu „nowi a powracający”.
Jak widać, nie jest to jakiś znaczący ruch (4%), ale nie jest też to ilość mieszcząca się w błędzie statystycznym. Mimo to interesujący jest fakt, że więcej osób nowych pojawia się na moim blogu pierwszy raz jako „not provided” niż odwiedziny powracające. Mimo wszystko patrząc na oba te segmenty ruch ten na szczęście nie jest jeszcze tak duży, żeby strasznie zaburzał statystyki.
Jednak przy analizie już samego ruchu z wyszukiwarek jest to znacznie poważniejszy procent ruchu. Od dłuższego czasu „not provided” jest w w wielu serwisach jako najbardziej popularne słowo kluczowe w ruchu z wyników organicznych. Jak zatem dowiedzieć sie co mogli wpisać zalogowaniu użytkownicy odnajdujący moją stronę internetową?
Avinash Kaushik rekomenduje porównanie ruchu „not provided” do dwóch ważnych segmentów jakim są ruch ze słów „brandowych” i słów generycznych (czyli nie brandowych) i sprawdzenie do którego ruchu można dopasować zagadkowy ruch „not provided”. Bardzo słuszny pomysł.
Nie ma jakiejś super dokładnej korelacji, ale wygląda na to, że słowa w zbiorze „not provided” są raczej bliżej słów kluczowych nie związanych z marką. To już jakaś informacja ;)
Ten sam autor proponuje też analizę „not provided” pod kątem długiego ogona i fraz głównych. W przypadku jego przykładu okazało się, że ruch „not provided” jest w głównej mierze ruchem z długiego ogona, który teraz po prostu się silnie uwidocznił, gdyż wiele słów odpowiadających za kilka wizyt się zsumowało do jednego źródła jakim jest teraz słowo „not provided”. Warto to sprawdzić.
Tutaj z kolei wyraźnie widać korelacje pomiędzy słowami z długiego ogona a słowami „not provided”. To także już coś mówi więcej o zaszyfrowanym ruchu.
Nadal nie wiadomo jednak jakie dokładnie słowa odpowiadają za wizyty zgromadzone w źródle „not provided”. Możemy jednak się czegoś domyślić.
Jak odszyfrować słowa kluczowe oznaczone jako „not provided”?
Jest kilka metod odszyfrowania informacji oznaczonych jako „not provided”. Jedne są bardziej skomplikowane, inne sprawdzają się dla osób szczególnie wnikliwie analizujących dane na potrzeby raportowania działań SEO.
Najłatwiejsze wyjście to analiza raportu dotyczącego stron docelowych. Avinash Kaushnik zaproponował tą metodą wykorzystując segmenty zaawansowane. Ja podszedłem do sprawy trochę prościej. Wystarczy zobaczyć na jakie strony docelowe wchodzą odwiedzający ze zbioru „not provided”. Jak widać jest to kilka stron, które konsumują najwięcej ruchu przychodzącego z wyników organicznych.
Jest tych stron kilkanaście. Skupmy się na dwóch pierwszych. Pierwsza to strona docelowa dotycząca pozycjonowania w Google Maps, druga to strona główna.
Teraz przechodzimy do raportu „strony docelowe” i analizujemy słowa kluczowe, które najczęściej generują wejścia na strony najczęściej odwiedzane przez użytkowników „zaszyfrowanych”. Musimy wybrać konkretną stronę docelową i zmienić wymiar na słowa kluczowe.
Jak widać dla strony głównej (zaznaczonej w raporcie jako „/”) trudniejsze jest ustalenie dokładnej matrycy słów i tutaj skupiłbym się na analizie, którą zrobiliśmy wcześniej – czy dla strony głównej są to bardziej słowa brandowe czy raczej nie czy może jest to długi ogon?
Z kolei dla innych popularnych podstron tematycznych jest dużo prościej. Spokojnie mogę założyć, że słowa „not provided” w 99% procentach przypadków będą pokrywały się z którymś z tych słów kluczowych.
Wykorzystanie Narzędzia dla webmasterów
Innym bardzo ciekawym rozwiązaniem, trochę bardziej pracochłonnym, jest wykorzystanie drugiej sporej luki w prywatności czyli informacji z narzędzia dla webmasterów. Sposób przedstawiony na Search Engine Watch bazuje na porównaniu ilość kliknięć na konkretne słowa w narzędziu dla webmasterów i ilości wizyt na te słowa w Google Analytics. Różnica miałaby byś ilością zawartą w zbiorze „not provided”. Jest to sposób trochę dla mnie wątpliwy, gdyż jak łatwo zauważyć różnice w danych, które w tych narzędziach potrafią być całkiem duże. Dzieje sie tak ze względu na inny sposób zbierania danych w tych narzędziach. To powoduje, że ten sposób może dać nam jakieś informacje, ale nie będą to informacje obarczone mniejszym lub większym błędem.
Podsumowanie
Co do samej prywatności i danych to prawda jest też taka, że dane pochodzące wyszukiwanych haseł są prawie niemożliwe do przypisania do konkretnych osób. Stąd ich prywatność jest też, powiedzmy delikatnie, dyskusyjna. Można je oczywiście połączyć z innymi danymi takimi jak IP (znowu nie są to precyzyjne dane) i np. z danymi cookies, ale to nie jest dalej tożsame z identyfikacja użytkownika poszukującego w wyszukiwarce. Zresztą my, co analizują dane, nie potrzebujemy wiedzieć kto konkretnie wpisał daną frazę do wyszukiwarki i wszedł na naszą stronę. Potrzebne nam to jest do analiz trendów i optymalizacji wysiłków SEO oraz optymalizacji oferty, użyteczności strony. Patrząc na luki, intencje wykorzystania danych przez właścicieli stron i wątpliwe zagrożenie prywatności, nie do końca rozumiem te działania. Z kolei jeśli bronić prywatności naprawdę to do końca wyłączając narzędzie dla webmasterów i wszystkie informacje z Google AdWords dotyczące wpisywanych haseł.
Zastanawiam się też, w którą to stronę pójdzie, ale na pewno jeśli Google zrobiło pierwszy krok, teraz przyłączył się FireFox to inne przeglądarki też będą włączały prywatność z automatu, tak jak do tej pory nasze przydatne ciastka (cookies) i ilość szyfrowanego ruchu będzie rosnąć.
[tekst ukazał się pierwotnie na blogu Przemysława Modrzewskiego. Grafika w nagłówku pochodzi z serwisu MezAds.com]
Przypominamy, że wielkimi krokami zbliża się konferencja I ♥ Marketing & Technology, która odbędzie się już 8–10 kwietnia 2025 roku.
Zapoznaj się także z ofertą organizowanych przez nas szkoleń z zakresu marketingu.
U mnie Not Provided w tym miesiącu zaczęło podchodzić do 30%. Google zwyczajnie rzuca kłody pod nogi pozycjonerom – ciekawy jestem jak na tą zmianę reagują firmy rozliczające się za ruch…
U nas jest to obecnie najpopularniejsze słowo. Niestety lekko utrudnia analizę.
U mnie to jest ponad 20% i ciągle rośnie. Nowy Firefox bez SSL to będzie już totalna masakra.
u mnie na wszystkich stronach Klientów „not provided” to już ponad 30%. Może inny program do analizy zacząć wykorzystywać ? Jakieś płatne platformy ? Ma ktoś jakieś rekomendacje ?
U mnie na wielu stronach współczynnik (not provided) to już prawie 30-50% . Co z tym zrobić? może jakiś inny system statystyk?
u mnie (not provided) to grubo ponad 50 procent, prawdopodobnie dlatego, że w tym momencie artykuły cieszące się największym powodzeniem dotyczą osób związanych z informatyką, dlatego posiadających w większości konta google. W tym momencie Google analytics praktycznie nie dostarcza mi wartościowych danych
U mnie „not provided” jest około 40-50%. Zastanawia mnie polityka googla odnośnie wyszukiwań lokalnych które maja zamiar skupić wyszukiwania tylko dla odbiorców z okolic? Czy ktoś nad tym się zastanawiał? Bo jak wpisuję hasła pod swoją działalność to mi wyskakują wyniki dopasowane pod biznesy z okolic mojego zamieszkania.
Najgorsze jest to, że niby tak Googlowi zależy na prywatności a ruch z AdWords jest w 100% widoczny (keywordsy)
Kilka przydatnych wskazówek, jednak można dorzucić do tego stosunek procentowy na zasadzie: słowo x ma 100 wejść, a not provided to 50%to można przypuszczać że słowo x ma w rezultacie wejść 200 – 100 odszyfrowanych i na zasadzie średniej statystycznej drugie tyle. Ale to się sprawdza w serwisach z bardzo wysokim ruchem
Na mojej stronie dziś jest 74 procent ,,not provident” a cała witryna ma ok 150 podstron,każda i innej tematyce.
Niech mi ktoś powie jak ja mam wydedukować na które słowa i które podstrony jest najwięcej wejść.
Przecież to totolotek.Na dziś wiem tylko ile było wejść,i obserwując ruch,,na żywo” wiem co sie dzieje.Jednak nie mogę przecież cały dzień siedzieć i obserwować.
A jak wygląda to w wypadku alternatywnych statystyk?
Czy np. skorzystanie z Piwik Analytics lub Open Web Analytics rozwiąże problem z „Not provided”
U mnie aktualnie jest 63% Not provided. Sprawdzał ktoś alternatywne statystyki?
Jednym słowem – cudnie. Czytam i ładnie widać jak w czasie zmienia się ilość procentowa udziału „not provided”. U mnie dzisiaj jest już ponad 90%. I jak tu bawić się w statystyki? Zapewne niedługo osiągniemy wynik dochodzący do 100%.
Dziś przeanalizowałem kilka stron internetowych. not provided na jednej ze stron to średnio ponad 95%! Obserwacja na bazie ponad 22tys. sesji i z miesiąca wstecz. Zatem do analizy pozostaje niecałe 5% fraz kluczowych :)
wynika z tego, że tylko niecałe 5% odwiedzających podczas wizyt nie jest zalogowana na koncie w Google. ARMAGEDON hehe…
Ej, a może not provided to jest case, gdzie ludzie wpisują adres strony do wyszukiwarki, nie do paska adresu?? Bardzo dużo ludzi tak robi… hę?