Blog

Michał Masternak

Michał Masternak

Czynnik świeżości treści - jak za pomocą edycji treści i linków stymulować content.

Google od lat dąży do tego, żeby prezentowane wyniki wyszukiwania były świeże, aktualne i trafne. Mamy szczęście, że model ten został dokładnie opisany w jednym z patentów Google, a ostatnimi czasy dowiedzieliśmy się również jak Yandex pracuje z tym zagadnieniem.


Dotyczy to wszystkich treści - tych aktualnych, przemijających i cyklicznych jak np. newsy, mundiale czy konferencje. Jeśli szukamy fraz w Google, to chcemy otrzymać wyniki o nadchodzącym wydarzeniu lub poprzednim. Jeśli interesuję nas inny Mundial, który odbył się np. 10 lat temu to musimy już zmienić formę zapytania. To logiczne i wygodne.


Tak samo wygląda to w przypadku publikacji czy treści blogowych. Google każdego dnia crawluje miliony znaków ze spacjami, w przeróżnych branżach cały czas rozbudowując klastry tematyczne, content gapy i inne. Dlatego o treści musimy dbać - odświeżać je i uzupełniać.


Również linki w tym procesie wiele znaczą, są jasnym sygnałem czy dokument jest aktualny.


Caffeine web indexing system - czyli algorytm odpowiedzialny za błyskawicznie poszukiwanie treści


W 2011 roku na blogu Google otrzymaliśmy informację o algorytmie, który w 100% skupia się na poszukiwaniu nowych, dynamicznych informacji. Wiemy również, że system miał pierwsze wpływy na SERPy już rok wcześniej.


Google otwarcie przyznało, że algorytm ten ingeruje w około 35% wyników wyszukiwania i znacznie wpływa na wyniki, które widzimy. Na czym przede wszystkim skupia się algorytm? Poniżej kilka przykładów:


Newsy i gorące wydarzenia


Google bardzo mocno monitoruje trendy, tematy szybko rosnące. Dzięki czemu np. po wybuchu agresji Rosji na Ukrainę już po kilku minutach otrzymywaliśmy precyzyjne wyniki. Działa to również w przypadku wydarzeń sportowych, społecznych czy virali.


Dotyczy to również szeroko pojętych wydarzeń czy newsów ze świata. Google chwali się, że zaindexowanie takich treści i umieszczenie ich w wynikach wyszukiwania zajmuje kilka minut.


Wydarzenia powtarzające się regularnie


Inne zasoby, które są przez algorytm monitorowane i szybko aktualizowane to cykliczne wydarzenia jak wybory prezydenckie, konferencje, programy telewizyjne, wyniki sportowe czy akcje firm.


Wszystko co musi pozostać aktualne, by dostarczać precyzyjnych wyników i nie wprowadzać użytkownika w błąd.


Treści często aktualizowane


Ten aspekt interesuje nas najbardziej. Bezpośrednio dotyczy on szeroko pojętego contentu, którego jako branża produkujemy najwięcej. Wcale nie muszą to być treści trendujące o dużych wolumenach. Ta grupa skupia się na przykład na rankingach, recenzjach, listingach produktów, opiniach.


Do tej grupy możemy wrzucić wszystkie publikacje typu:


  • Jaki materac wybrać?
  • 5 pomysłów na prezent na dzień taty
  • Najlepsze perfumy damskie na lato


Ale nie dotyczy treści stałych, które się nie zmieniają. Bo przecież przepis na ciasto czekoladowe nie traci na ważności, mało również się zmienia w kwestii jego przygotowania.


Kategoryzacja treści w kontekście świeżości


Google wie, że nie każde wyszukiwanie wymaga takiej samej uwagi. Algorytm skupiał się również na kategoryzowaniu ich, na sensownym podzieleniu mocy obliczeniowej.


Patent US855952B2 - System i metody określania świeżości dokumentów


Innym źródłem informacji na ten temat jest cały czas aktualny patent. Ten jest dosyć szczegółowo opisany, więc bez problemu możemy rozłożyć go na czynniki pierwsze.


Jest też ciekawszy z mojej perspektywy - bo udział tutaj mają już bezpośrednio linki zewnętrzne.


Najistotniejsze czynniki określane przez patent


  • Współczynnik świeżości może być wykorzystywany jako czynnik rankingowy
  • Świeżość określa się za pomocą linków wewnętrznych jak i zewnętrznych
  • Posiadanie większej ilość dokumentów określonych jako świeżych (kosztem niekatualnych) poprawia "freshness score"
  • Rosnąca ilość linków w czasie poprawia "freshness score"
  • "dateModified" w kodzie strony jest brany pod uwagę przy określaniu świeżości


Czym w ogóle jest ta "świeżość"


Są to dokumenty, które zostały zaktualizowane lub zmodyfikowane w pewnym okresie.


Za świeżość odpowiadają również linki - wewnętrzne i zewnętrzne.


Jakie parametry Google wykorzystuje do określenia świeżości.


Warto wyraźnie odnotować, że pierwszym sygnałem interpretowanym przez Google jest data modyfikacji w kodzie strony. Dopiero w następnej kolejności (lub gdy wartość ta jest niedostępna) sięga on do analizy linków. Linki przychodzące są analizowane pod tym samym kątem.


Naturalnie więc im więcej świeżych linków posiada dokument, tym lepiej zostanie oceniony "freshness ranking".


Google według patentu może określić i wziąć pod uwagę kiedy dany link został utworzony lub usunięty. Może w efekcie zdarzyć się, że świeży artykuł, zmodyfikowany, rozwinięty i ze wskazaną datą modyfikacji w kodzie strony zostanie źle oceniony przez stare odnośniki prowadzące do niego.


Jednym z najważniejszych sygnałów jest malejąca ilość linków - to oczywiste i jasno sugeruje, że dany zasób traci na aktualności.


Linki bezpośrednio wpływają na czynnik świeżości dokumentów


Nie jest to dla nas żadne zaskoczenie. Bardzo długi czas prowadziłem projekt z sezonowym asortymentem. Każdego roku dobrze rankujące treści wypadały nam z SERPów wyrzucane przez nowe zasoby.


Freshness ranking


Już wtedy (nawet bez świadomości wcześniej omówionych algorytmów) wypracowaliśmy skuteczne metody stymulowania starych treści. Jak?


Modyfikacja treści


Sama zmiana daty publikacji nie wystarczy. Treść trzeba rozwinąć, aktualizować lub chociaż zredagować. Osobiście polecam w nowym tekście rozpocząć od czystej optymalizacji SEO - narzędzia typu Surfer, Contadu czy Senuto pozwalają na precyzyjną ocenę treści.


Same wytyczne co dodać, czym nasycić czy jak ograniczyć to już wyraźny sygnał, w którą stronę rozwinąć dany artykuł.


Oczywiście na sam koniec i tak należy upewnić się, że data modyfikacji jest poprawnie oznaczona w kodzie strony.


Zresztą nie musicie mi wierzyć na słowo. John Muller osobiście na ten temat się wypowiedział


"Jeśli artykuł został znacząco zmieniony, warto nadać mu nową datę i godzinę. Nie należy jednak sztucznie odświeżać historii bez dodania istotnych informacji lub innego ważnego powodu".


Źródło: https://www.searchenginejournal.com/googles-john-mueller-changing-dates-on-pages-wont-improve-rankings/401734/#close


Nowe linki przychodzące


Z patentu wiemy, że są one brane pod uwagę przy określaniu świeżości, więc drugim krokiem jest dodanie nowych odnośników. Oczywiście odpowiednio wcześniej, przed sezonowym boomem, by Google miał odpowiednio dużo czasu na przeliczenie wszystkich wartości.


To jest skrajnie logiczne - jeśli dany dokument otrzymywał kiedyś linki, ale już tego nie robi, to jasnym jest, że temat się wyczerpał, nie jest już ciekawy ani aktualny. Użytkownicy szukają czegoś innego.


Dodanie kilku świeżych linków załatwia sprawę, ponownie rzuca światło na naszą treść, a jak jeszcze powiążemy to z odświeżonym artykułem? Drogi Czytelniku, na pewno rozumiesz.


Odświeżenie starych linków


Stare linki, głównie publikacje, możemy cyklicznie stymulować podlinkowywując je w aktualnie prowadzonych działaniach. Planując kampanie i mając w głowie jak rozpływa się link juice, że w przypadku ostatniego linku, który zgarnia najmniej mocy, mogę postawić na inne zasoby. Zazwyczaj korzystam z dwóch sposobów.


Pierwszym są trust linki - które uwierzytelniają nasz artykuł, zapewniają mu dodatkowy kontekst. Często odnoszę je do seedów - czyli najważniejszych stron w danej tematyce.


Drugim - właśnie recykling artykułów stworzonych wcześniej. Link taki dodaję w taki sposób, żeby wyglądał możliwie redakcyjnie, naturalnie. Jak na zdjęciu poniżej.


Podlinkowanie starych treści


Dlaczego to działa? Patent jasno informuję, że jeśli bierze pod uwagę linki przychodzące, to dla nich samych stosuje ten sam algorytm.


Jak Yandex określa świeżość za pomocą linków?


Mamy szczęście, bo w ramach wycieku jest to jedyny czynnik rankingowy dotyczący linków, który został tak dobrze opisany z konkretnym wzorem matematycznym.


Yandex wykorzystuje następujący wzór: LinkAge=Min(log(average link age)/7, 1)


Co istotne i warte odnotowania:


  • Wiek w tym przypadku liczony jest w dniach
  • Punktem granicznym dla którego wartość jest wyliczana to 3 lata. Większe wartości nie mają znaczenia i sprowadzane są do wartości=1.
  • Jeśli wartość=1 najprawdopodobniej dany dokument jest określany jako nieaktualny
  • Nowe linki powodują spadek poniżej wartości=1 co sprawia, że dany zasób ponownie znajduje się w kręgu zainteresowań algorytmu


Jak to działa w praktyce? Zasymulujmy.


Weźmy jeden z naszych wpisów blogowych, który posiada 9 linków: https://off-site.pl/blog/link-building-kompendium-wiedzy-2022


Dla każdego z linków wyciągnąłem datę publikacji (zupełnie zignorowałem datę modyfikacji) i wyszło, że średni wiek linku wynosi 430 dni. Podkładamy go do wzoru: LinkAge=Min(ln(430)/7, 1) i osiągamy wynik - 0.866


Wizualizacja wzoru


Wynik nie przekracza wartości=1, więc znajduje się w kręgu zainteresowań algorytmu.


Wynik równania stosunkowo ciężko obniżać. Możemy więc założyć, że zakres 0,5-0,99 jest optymalnym. Co zresztą potwierdza sam wzór, który, jak już wspomniałem, wszystkie wartości większe od jeden i tak do niego sprowadza.


Wynik zbyt niski może sugerować, że za wcześnie jest na ocenę dokumentu biorąc pod uwagę jedynie linki. Nie ma w tym przypadku odpowiedniego punktu odniesienia.


Podsumowując


Między bajki możemy wsadzić powtarzaną tezę, że jedynie odświeżają content możemy recyklingować treści i skutecznie stymulować je w SERPach.


Na przykładach Google czy Yandexa widzimy, że zaprzęgnięte są skomplikowane algorytmy, które w całym procesie biorą pod uwagę linki.


Stosując kilka powyższych sztuczek, możemy w nieskończoność odświeżać nasze treści, gdy tylko zauważymy, że wypadają z wyników.


Bibliografia:


Michał Masternak

Michał Masternak

Co-founder w Off-site.pl. Head of (off-site) SEO
Od lat planuję kampanie link buildingowe oraz odpowiadam za ich realizację i efekty. Pracowałem nad wieloma projektami o różnych budżetach. Dowoziłem wyniki dla wielu agencji SEO czy specjalistów w naszym kraju oraz po za nim. Od 2019 roku jestem zaangażowany w rozwój swojego projektu – off-site.pl

Średnia ocena artykułu przez użytkowników: 5/5

Szymon

Nie żebym się czepiał słówek, ale to chyba dość istotny niuans - Google Caffeine to nie nazwa algorytmu. Pod tą nazwą ogłoszono aktualizację/przebudowę całego systemu crawlowania, indeksowania (w tym właśnie odświeżania) zasobów Google, dzięki czemu możliwe jest szybsze dotarcie do danych.

Michał Masternak

Hej Szymonie! To oczywiście skrót myślowy, Google samemu system opisuję w taki sposób "We completed our Caffeine web indexing system last year, which allows us to crawl and index the web for fresh content quickly on an enormous scale. Building upon the momentum from Caffeine, today we’re making a significant improvement to our ranking algorithm..."