Czynnik świeżości treści - jak za pomocą edycji treści i linków stymulować content.
Google od lat dąży do tego, żeby prezentowane wyniki wyszukiwania były świeże, aktualne i trafne. Mamy szczęście, że model ten został dokładnie opisany w jednym z patentów Google, a ostatnimi czasy dowiedzieliśmy się również jak Yandex pracuje z tym zagadnieniem.
Dotyczy to wszystkich treści - tych aktualnych, przemijających i cyklicznych jak np. newsy, mundiale czy konferencje. Jeśli szukamy fraz w Google, to chcemy otrzymać wyniki o nadchodzącym wydarzeniu lub poprzednim. Jeśli interesuję nas inny Mundial, który odbył się np. 10 lat temu to musimy już zmienić formę zapytania. To logiczne i wygodne.
Tak samo wygląda to w przypadku publikacji czy treści blogowych. Google każdego dnia crawluje miliony znaków ze spacjami, w przeróżnych branżach cały czas rozbudowując klastry tematyczne, content gapy i inne. Dlatego o treści musimy dbać - odświeżać je i uzupełniać.
Również linki w tym procesie wiele znaczą, są jasnym sygnałem czy dokument jest aktualny.
Caffeine web indexing system - czyli algorytm odpowiedzialny za błyskawicznie poszukiwanie treści
W 2011 roku na blogu Google otrzymaliśmy informację o algorytmie, który w 100% skupia się na poszukiwaniu nowych, dynamicznych informacji. Wiemy również, że system miał pierwsze wpływy na SERPy już rok wcześniej.
Google otwarcie przyznało, że algorytm ten ingeruje w około 35% wyników wyszukiwania i znacznie wpływa na wyniki, które widzimy. Na czym przede wszystkim skupia się algorytm? Poniżej kilka przykładów:
Newsy i gorące wydarzenia
Google bardzo mocno monitoruje trendy, tematy szybko rosnące. Dzięki czemu np. po wybuchu agresji Rosji na Ukrainę już po kilku minutach otrzymywaliśmy precyzyjne wyniki. Działa to również w przypadku wydarzeń sportowych, społecznych czy virali.
Dotyczy to również szeroko pojętych wydarzeń czy newsów ze świata. Google chwali się, że zaindexowanie takich treści i umieszczenie ich w wynikach wyszukiwania zajmuje kilka minut.
Wydarzenia powtarzające się regularnie
Inne zasoby, które są przez algorytm monitorowane i szybko aktualizowane to cykliczne wydarzenia jak wybory prezydenckie, konferencje, programy telewizyjne, wyniki sportowe czy akcje firm.
Wszystko co musi pozostać aktualne, by dostarczać precyzyjnych wyników i nie wprowadzać użytkownika w błąd.
Treści często aktualizowane
Ten aspekt interesuje nas najbardziej. Bezpośrednio dotyczy on szeroko pojętego contentu, którego jako branża produkujemy najwięcej. Wcale nie muszą to być treści trendujące o dużych wolumenach. Ta grupa skupia się na przykład na rankingach, recenzjach, listingach produktów, opiniach.
Do tej grupy możemy wrzucić wszystkie publikacje typu:
- Jaki materac wybrać?
- 5 pomysłów na prezent na dzień taty
- Najlepsze perfumy damskie na lato
Ale nie dotyczy treści stałych, które się nie zmieniają. Bo przecież przepis na ciasto czekoladowe nie traci na ważności, mało również się zmienia w kwestii jego przygotowania.
Kategoryzacja treści w kontekście świeżości
Google wie, że nie każde wyszukiwanie wymaga takiej samej uwagi. Algorytm skupiał się również na kategoryzowaniu ich, na sensownym podzieleniu mocy obliczeniowej.
Patent US855952B2 - System i metody określania świeżości dokumentów
Innym źródłem informacji na ten temat jest cały czas aktualny patent. Ten jest dosyć szczegółowo opisany, więc bez problemu możemy rozłożyć go na czynniki pierwsze.
Jest też ciekawszy z mojej perspektywy - bo udział tutaj mają już bezpośrednio linki zewnętrzne.
Najistotniejsze czynniki określane przez patent
- Współczynnik świeżości może być wykorzystywany jako czynnik rankingowy
- Świeżość określa się za pomocą linków wewnętrznych jak i zewnętrznych
- Posiadanie większej ilość dokumentów określonych jako świeżych (kosztem niekatualnych) poprawia "freshness score"
- Rosnąca ilość linków w czasie poprawia "freshness score"
- "dateModified" w kodzie strony jest brany pod uwagę przy określaniu świeżości
Czym w ogóle jest ta "świeżość"
Są to dokumenty, które zostały zaktualizowane lub zmodyfikowane w pewnym okresie.
Za świeżość odpowiadają również linki - wewnętrzne i zewnętrzne.
Jakie parametry Google wykorzystuje do określenia świeżości.
Warto wyraźnie odnotować, że pierwszym sygnałem interpretowanym przez Google jest data modyfikacji w kodzie strony. Dopiero w następnej kolejności (lub gdy wartość ta jest niedostępna) sięga on do analizy linków. Linki przychodzące są analizowane pod tym samym kątem.
Naturalnie więc im więcej świeżych linków posiada dokument, tym lepiej zostanie oceniony "freshness ranking".
Google według patentu może określić i wziąć pod uwagę kiedy dany link został utworzony lub usunięty. Może w efekcie zdarzyć się, że świeży artykuł, zmodyfikowany, rozwinięty i ze wskazaną datą modyfikacji w kodzie strony zostanie źle oceniony przez stare odnośniki prowadzące do niego.
Jednym z najważniejszych sygnałów jest malejąca ilość linków - to oczywiste i jasno sugeruje, że dany zasób traci na aktualności.
Linki bezpośrednio wpływają na czynnik świeżości dokumentów
Nie jest to dla nas żadne zaskoczenie. Bardzo długi czas prowadziłem projekt z sezonowym asortymentem. Każdego roku dobrze rankujące treści wypadały nam z SERPów wyrzucane przez nowe zasoby.
Już wtedy (nawet bez świadomości wcześniej omówionych algorytmów) wypracowaliśmy skuteczne metody stymulowania starych treści. Jak?
Modyfikacja treści
Sama zmiana daty publikacji nie wystarczy. Treść trzeba rozwinąć, aktualizować lub chociaż zredagować. Osobiście polecam w nowym tekście rozpocząć od czystej optymalizacji SEO - narzędzia typu Surfer, Contadu czy Senuto pozwalają na precyzyjną ocenę treści.
Same wytyczne co dodać, czym nasycić czy jak ograniczyć to już wyraźny sygnał, w którą stronę rozwinąć dany artykuł.
Oczywiście na sam koniec i tak należy upewnić się, że data modyfikacji jest poprawnie oznaczona w kodzie strony.
Zresztą nie musicie mi wierzyć na słowo. John Muller osobiście na ten temat się wypowiedział
"Jeśli artykuł został znacząco zmieniony, warto nadać mu nową datę i godzinę. Nie należy jednak sztucznie odświeżać historii bez dodania istotnych informacji lub innego ważnego powodu".
Nowe linki przychodzące
Z patentu wiemy, że są one brane pod uwagę przy określaniu świeżości, więc drugim krokiem jest dodanie nowych odnośników. Oczywiście odpowiednio wcześniej, przed sezonowym boomem, by Google miał odpowiednio dużo czasu na przeliczenie wszystkich wartości.
To jest skrajnie logiczne - jeśli dany dokument otrzymywał kiedyś linki, ale już tego nie robi, to jasnym jest, że temat się wyczerpał, nie jest już ciekawy ani aktualny. Użytkownicy szukają czegoś innego.
Dodanie kilku świeżych linków załatwia sprawę, ponownie rzuca światło na naszą treść, a jak jeszcze powiążemy to z odświeżonym artykułem? Drogi Czytelniku, na pewno rozumiesz.
Odświeżenie starych linków
Stare linki, głównie publikacje, możemy cyklicznie stymulować podlinkowywując je w aktualnie prowadzonych działaniach. Planując kampanie i mając w głowie jak rozpływa się link juice, że w przypadku ostatniego linku, który zgarnia najmniej mocy, mogę postawić na inne zasoby. Zazwyczaj korzystam z dwóch sposobów.
Pierwszym są trust linki - które uwierzytelniają nasz artykuł, zapewniają mu dodatkowy kontekst. Często odnoszę je do seedów - czyli najważniejszych stron w danej tematyce.
Drugim - właśnie recykling artykułów stworzonych wcześniej. Link taki dodaję w taki sposób, żeby wyglądał możliwie redakcyjnie, naturalnie. Jak na zdjęciu poniżej.
Dlaczego to działa? Patent jasno informuję, że jeśli bierze pod uwagę linki przychodzące, to dla nich samych stosuje ten sam algorytm.
Jak Yandex określa świeżość za pomocą linków?
Mamy szczęście, bo w ramach wycieku jest to jedyny czynnik rankingowy dotyczący linków, który został tak dobrze opisany z konkretnym wzorem matematycznym.
Yandex wykorzystuje następujący wzór: LinkAge=Min(log(average link age)/7, 1)
Co istotne i warte odnotowania:
- Wiek w tym przypadku liczony jest w dniach
- Punktem granicznym dla którego wartość jest wyliczana to 3 lata. Większe wartości nie mają znaczenia i sprowadzane są do wartości=1.
- Jeśli wartość=1 najprawdopodobniej dany dokument jest określany jako nieaktualny
- Nowe linki powodują spadek poniżej wartości=1 co sprawia, że dany zasób ponownie znajduje się w kręgu zainteresowań algorytmu
Jak to działa w praktyce? Zasymulujmy.
Weźmy jeden z naszych wpisów blogowych, który posiada 9 linków: https://off-site.pl/blog/link-building-kompendium-wiedzy-2022
Dla każdego z linków wyciągnąłem datę publikacji (zupełnie zignorowałem datę modyfikacji) i wyszło, że średni wiek linku wynosi 430 dni. Podkładamy go do wzoru: LinkAge=Min(ln(430)/7, 1) i osiągamy wynik - 0.866
Wynik nie przekracza wartości=1, więc znajduje się w kręgu zainteresowań algorytmu.
Wynik równania stosunkowo ciężko obniżać. Możemy więc założyć, że zakres 0,5-0,99 jest optymalnym. Co zresztą potwierdza sam wzór, który, jak już wspomniałem, wszystkie wartości większe od jeden i tak do niego sprowadza.
Wynik zbyt niski może sugerować, że za wcześnie jest na ocenę dokumentu biorąc pod uwagę jedynie linki. Nie ma w tym przypadku odpowiedniego punktu odniesienia.
Podsumowując
Między bajki możemy wsadzić powtarzaną tezę, że jedynie odświeżają content możemy recyklingować treści i skutecznie stymulować je w SERPach.
Na przykładach Google czy Yandexa widzimy, że zaprzęgnięte są skomplikowane algorytmy, które w całym procesie biorą pod uwagę linki.
Stosując kilka powyższych sztuczek, możemy w nieskończoność odświeżać nasze treści, gdy tylko zauważymy, że wypadają z wyników.
Bibliografia:
Nie żebym się czepiał słówek, ale to chyba dość istotny niuans - Google Caffeine to nie nazwa algorytmu. Pod tą nazwą ogłoszono aktualizację/przebudowę całego systemu crawlowania, indeksowania (w tym właśnie odświeżania) zasobów Google, dzięki czemu możliwe jest szybsze dotarcie do danych.
Michał Masternak
Hej Szymonie! To oczywiście skrót myślowy, Google samemu system opisuję w taki sposób "We completed our Caffeine web indexing system last year, which allows us to crawl and index the web for fresh content quickly on an enormous scale. Building upon the momentum from Caffeine, today we’re making a significant improvement to our ranking algorithm..."
Średnia ocena artykułu przez użytkowników: 5/5