Styczeń 31, 2020

Algorytm BERT – czym jest i jak działa? Poradnik

Algorytm BERT

W wyszukiwarce Google codziennie dokonuje się przeszło miliard zapytań. Część z nich to zapytania, które nigdy wcześniej nie był wyszukiwane. Dzieje się tak dlatego, że użytkownik często nie wie lub nie jest pewny tego czy dobrze formułuje zapytania, dlatego wpisuje takie a nie inne frazy. BERT wpłynął na aż 10% wyszukiwania (zazwyczaj normalne aktualizacje wpływają na około 3-4%). 9 grudnia 2019 roku zaczął być wdrażany również w Polsce.

Czym właściwie jest algorytm BERT?

Bidirectional Encoder Representations from Transformers lub BERT to technologia oparta na sieci neuronowej, której celem jest przetworzenie języka naturalnego wypowiedzi wpisywanej w wyszukiwarkę. Dzięki tej technologii wyszukiwarka może lepiej zrozumieć pełny kontekst słowa biorąc pod uwagę frazy, które są przed i za nim.

transformer BERT

Algorytm BERT to według Google największy krok do przodu w historii wyszukiwania od 5 lat. Inżynierzy Google są zdania, że posiadają super wydajne komputery, które przewyższają te, które do tej pory były uważane za najwydajniejsze. Brzmi jak kolejna duża zmiana infrastrukturalna.

Google oficjalnie przyznał, że BERT uczy się na Wikipedii przemieszczając się po najróżniejszych niszach jak np. sport, medycyna, edukacja. Algorytm może uczyć się samodzielnie i dwustronnie.

Krótka historia zmian w wyszukiwarce Google

  • W 2010 roku został wprowadzony nowy system indeksowania, który został nazwany Google Caffeine. Pozwalał na efektywniejsze analizowanie, renderowanie i crawlowanie witryny. Zmiana obejmowała wprowadzenie nowych rozwiązań i nowej infrastruktury.
  • 2013 rok to już wprowadzenie nie systemu, a nowego algorytmu o nazwie Koliber. Algorytm Google lepiej rozpoznaje kontekst haseł oraz synonimy co prowadzi do wyświetlanego wyniku zgodnie z intencją użytkownika. Jest w stanie lepiej interpretować dane, ponieważ bierze pod uwagę całe wyrażenia – nie tylko pojedyncze.
  • W 2015 był wprowadzony algorytm Google Rank Brain, który przy pomocy sztucznej inteligencji dopasowuje wyniki do wpisywanego hasła. Uczy się tego co wpisuje użytkownik i jak się zachowuje na stronach.
  • W 2019 zostały wdrożone 4 aktualizacje core algorytmu – w marcu, czerwcu, wrześniu i listopadzie. Według mnie jak i wielu innych osób z branży uważa, że można było się doliczyć o wiele więcej aktualizacji, które nie były potwierdzane.

Jak działa algorytm BERT?

Jak już wcześniej wspomnieliśmy – nowy algorytm ma rozwiązywać problem, który dotyczy niewłaściwie dobieranych stron do zapytania wpisywanego w wyszukiwarkę.

Zanim wprowadzono nowy algorytm, Google – analizując frazę – nie brał pod uwagę tzw. stopwords-ów. Są nimi m.in przyimki, zaimki czy spójniki, które pozornie nie wnosiły wartości. Dzięki zastosowaniu nowego systemu NLP (Natural Language Processing), BERT jest odpowiedzialny za rozumienie nie tylko słów, ale także zależności między nimi oraz kontekstu.

Jak nowy algorytm działa w praktyce?

Przykład 1:

bert

Źródło: https://www.blog.google/products/search/search-language-understanding-bert/

Na blogu Google znajdziemy przykłady pokazujące zastosowanie algorytmu BERT. Przykład 1 obrazuje nam problem z przyimkiem “to” (pol. do). Pominięcie tego słowa przez wyszukiwarkę spowodowało wygenerowanie odpowiedzi innych niż użytkownicy chcieli otrzymać.

Poprzednio fraza “2019 brazil traveler to usa need a visa” pokazywała odpowiedzi na pytanie czy obywatele USA potrzebują wizy Brazylii. W rzeczywistości chodziło odwrotną sytuację, czyli Brazylijczyka podróżującego do USA.

Przykład 2:

Źródło: https://www.blog.google/products/search/search-language-understanding-bert/

W drugim przykładzie mamy przykład użycia kontekstu w zapytaniu. Fraza “do estheticians stand a lot at work” Poprzednio systemy Google dopasowywały termin “stand a lot” do “stand alone”, co nie jest poprawne w przytoczonym przykładzie. Po zmianie algorytm Google rozumie, że fraza może być powiązana z inną tematyką.

Jaki wpływ może mieć BERT na SEO?

Zmiany w wynikach wyszukiwania w okresie wdrażania algorytmu BERT

Trudno stwierdzić jak bardzo może się zmienić sytuacja pod wdrożeniu BERT w Polsce. Myślę, że zajmie to dobre kilka lat zanim BERT w pełni zacznie pracować na naszym rynku.

Wpływ nowego algorytmu na SEO możemy odczuć biorąc pod uwagę zapytania z długiego ogona. Widoczność na te frazy najszybciej powinna spaść bo przecież chodzi o zrozumienie naturalnego języka.

Przełożenie wiedzy o BERT na procesy SEO

Jeżeli będziemy pisać treści naturalnie, z myślą o użytkownikach a nie robotach to z pewnością zostaniemy docenieni. Monitorowanie fraz i badanie tego jak BERT wpływa na słowa kluczowe może zmienić proces keyword research. Wcześniej były dobierane frazy bez odmian mające w sobie najważniejsze wyrazy jak np. mechanik poznań. Ta nienaturalność może spowodować uwzględnianie odmian i stosowanie łączników, które mogą zmienić kontekst i znaczenie fraz.

Warto śledzić dalszy rozwój nowego algorytmu.