Algorytm Google Caffeine wreszcie działa! Szybsza indeksacja

Po raz pierwszy Google wspomniał o nowej infrastrukturze indeksującej o nazwie Caffeine jeszcze w sierpniu 2009. Uruchomiono ją wówczas w jednym z data-center, a celem było zebranie opinii. Teraz Caffeine obsługuje już wszystkie zapytania z całego świata. Google nazywa Caffeine na swoim blogu „całkiem nowym systemem indeksowania internetu”, dzięki któremu indeks jest „przeszło 50% świeższy od poprzedniego i jest największym zbiorem treści jaki oferowaliśmy”.

Czym zatem właściwie jest Caffeine i co jego wdrożenie znaczy dla szukających i wydawców witryn?

Od Maile Ohye z Google’s Webmaster Central usłyszałam, że „internet rozszerza się i rozwija, a Caffeine będzie lepiej nadążać za tymi procesami. Zmienia się ekosystem, więc by dostarczyć szukającym możliwie najlepszych wyników, zmieniamy się i my”. Inny pracownik Google, Matt Cutts, dodaje z kolei „Caffeine daje korzyści zarówno szukającym, jak i wydawcom witryn. Wprowadzenie Caffeine oznacza bowiem, że każdy rodzaj treści (nie tylko treści klasyfikowane jako „real time”) będzie dostępny z wyszukiwarki w kilka sekund od zaindeksowania”.

Caffeine jest więc ulepszeniem infrastruktury indeksującej. Nie zmienia algorytmów ustalających ranking. Działa we wszystkich data-center, regionach i językach.

Treść jest szybciej dostępna

Wcześniej proces przeszukiwania internetu i indeksowania go był procesem „pakietowym”. Googlebot odwiedzał zestaw witryn, przetwarzał je („wyciągał” z nich treści, kojarzył anchor texty i linki zewnętrzne, by ustalić ich tematykę), a na końcu dodawał je do indeksu. Kiedy cały taki „zestaw” witryn uległ przetworzeniu, ich treści stawały się możliwe do znalezienia. Teraz Google odwiedza witrynę, przetwarza ją, a jej treść staje się dostępna z wyszukiwarki w zasadzie natychmiast. Dzięki temu indeks jest o ponad 50% świeższy, niż dotychczas.

Zwróć uwagę, że uruchomienie Caffeine nie musi oznaczać, że witryny będą odwiedzane przez robota częściej. Zmiana oznacza po prostu, że gdy już witryna zostanie odwiedzona przez robota, stanie się dostępna dla szukających szybciej, niż do tej pory. (Pamiętaj, że możesz oszacować częstotliwość odwiedzin googlebota sprawdzając logi serwera lub daty ostatniej kopii witryny – „cache’u”).

Google znacznie zwiększył pojemność pamięci

Chociaż indeks Google’a nie jest na razie większy, niż dotychczasowy, to nowa infrastruktura jest na to przygotowana. Jeśli Caffeine ma pomóc lepiej nadążać wyszukiwarce za rozwojem internetu, musi uwzględniać jego rozrastanie się. Internet powiększa się codziennie, i to dużo szybciej, niż ktokolwiek w czasach powstawania Google mógł przypuszczać.

Google znacznie zwiększył elastyczność w zakresie przechowywania informacji o dokumentach

Google zawsze starał się kojarzyć wiele informacji z przechowywanymi dokumentami. (W tym kontekście, przez „dokument” rozumiem każdy „kawałek” treści, jak podstrona, obrazek czy wideo). Przykładowo, gdy Google indeksuje daną podstronę, kojarzy z nią także informacje o linkujących do niej zewnętrznych witrynach i anchor texty linków. Wraz z wdrożeniem Caffeine wzrosnąć ma elastyczność w zakresie typów takich „kontekstowych” informacji. Jeśli zajdą w internecie zmiany polegające na pojawieniu się nowych typów informacji, które warto będzie kojarzyć z „dokumentem”, nie będzie trzeba pisać kodu na nowo. Zatem, choć Caffeine nie wpływa na ranking samo w sobie, taki związek może powstać w przyszłości, wraz z ewentualnym dodaniem nowych typów informacji kojarzonych z dokumentem.

[Aktualizacja]: Podczas wystąpienia na SMX Advanced, Matt Cutts dał przykład dodatkowych danych, jakie mogą być kojarzone z dokumentami: „wyobraźcie sobie przykładowo, że wcześniej mogliśmy skojarzyć stronę z jednym tylko krajem. Teraz natomiast moglibyśmy kojarzyć ze stroną wiele krajów jednocześnie”. (Zwróć uwagę, że Matt nie mówił o realnie wdrożonej funkcji, ale o przykładowych możliwościach wynikających z uruchomienia Caffeine).

Jak wydawcy treści mogą wykorzystać Caffeine?

Wydawcy skorzystają na wdrożeniu Caffeine w zasadzie bez żadnego wysiłku ze swojej strony. Trudno byłoby wskazać cokolwiek, co wydawcy powinni zrobić, by wykorzystać Caffeine jeszcze lepiej. Niektórzy zastanawiają się pewnie, czy zmiany oznaczają, że dotychczasowe zalecenia w zakresie poprawiania dostępności witryn dla robotów stają się teraz ważniejsze. Np. czy szybkość ładowania się strony, wokół której było ostatnio głośno, stała się teraz istotniejsza? Nie. Dowiedziałam się w Google, że wdrożenie Caffeine nie wpływa w żaden sposób na wagę czynników decydujących o odwiedzinach robota, zaindeksowaniu treści i ustaleniu rankingu. Caffeine powoduje po prostu, że treść strony szybciej jest dostępna w wyszukiwarce; przygotowany jednocześnie zostaje grunt pod wprowadzenie do algorytmu nowych czynników.

[źródło: Google’s New Indexing Infrastructure “Caffeine” Now Live]

Maciej Janas

Od 2004 w poznańskich agencjach interaktywnych (UX, copy), od lutego 2010 do grudnia 2012 redaktor serwisu SprawnyMarketing.pl. Lubi tropić i opisywać trendy w biznesie internetowym, interesuje się interakcjami technologii z człowiekiem i społeczeństwem oraz współczesną polszczyzną. Google+


  • Redakcja

    Przy okazji przypominamy o nowej grupie na Facebooku, w której odpowiadamy na szereg pytań. Dołącz do Twoja firma w Internecie i Social Media.

    Subskrybuj Sprawny.Marketing na Messengerze, dostaniesz informację o każdym nowym artykule lub materiale video

    Wielkimi krokami zbliża się także dwudniowa konferencja I ♥ Marketing & Social Media oraz organizowane przez nas 24 szkolenia z zakresu marketingu.

    Możesz też zamówić prenumeratę drukowanego magazynu sprawny.marketing


    • Nowy silnik, będzie teraz popłoch w branży SEO

      • Cezary Lech

        Futro przeczytaj artykuł jeszcze raz dokładnie. Nie ma powodów do paniki, przynajmniej na razie. Google Caffeine to zmiana technologi indeksowania stron a nie parametrów rankingowych!!

        @Maciej link do źródła jest z błędem.

    • lee oswald

      Caffeine wreszcie działa! chyba mialo byc Caffeine rozje…. google :) spam i syf to mozna teraz znalezc…

    • Jak dla mnie ten Caffeine był już od miesiąca widoczny w wynikach. Dla mnie to duża zmiana na plus. Większość klientów zanotowała dużą poprawe wyników więc mnie ten algorytm cieszy :)

      Szybko zachodzą zmiany wyników, to jest na plus, można zrobić top10 na trudne słowo w 2 tygodnie przy odpowiedniej domenie :)

    • Moim zdaniem, te zmiany będą widoczne przede wszystkim dla średnich i dużych serwisów zwłaszcza e-commerce’owych, w których treść często będzie się zmieniać i aktualizować. Dla mniejszych serwisów bardziej statycznych nie będzie tu korzyści.

    • Działa cudownie, dla usera bomba, ale z punktu widzenia SEO to troche ciezko nadązyc za ciaglymi zmianami.

    • Ja nie zauważyłem działania nowego algorytmu na żadnej ze swoich stron. Wszystkie to serwisy raczej małe. Więc teza trenera się potwierdza.

    • Cezary, skoro zmieniła się technologia indeksowania stron – podobno teraz indeksacja jest bardziej dokładna i szybsza – to musi to wpłynąć na pozycję w rankingu i wpływa. W raz ze wzrostem zaindeksowanych podstron wzrasta ilość zaindeksowanych linków. Tutaj Google, nowym silnikiem zrobił prezent osobom korzystającym z systemów wymiany linków. Wcześniej nie zrobiono porządku z tymi systemami, a teraz strony linkujące z tych systemów są lepiej i szybciej indeksowane – m.in. dlatego "syf" wychodzi na prowadzenie – TO WIDAĆ. Przed Coffeine na ogół szybko znajdowałem to czego szukałem, teraz już tak nie jest.

    Dodaj komentarz

    Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *