Wyszukiwarki tworzą indeks stron internetowych na podstawie informacji z robotów internetowych, które cały czas odwiedzają nowe i aktualizują już zaindeksowane strony. Każda wyszukiwarka posiada swojego robota. Określa on ranking stron dla odnalezionych tam słowach kluczowych bazując na skomplikowanych algorytmach (są tajemnicą każdej firmy i zmieniają się stosunkowo często – gdyby np. Google ujawnił w jaki sposób tworzy ranking stron to każdy zastosowałby się do tego i wyszukiwanie straciłoby sens).
Mechanizm funkcjonowania wyszukiwarek – trzy główne komponenty:
Roboty internetowe (roboty indeksujące, pajączki, ang. spider, crawler): odwiedzają strony WWW przechodząc po znalezionych łączach.
Moduł indeksujący: Analizowane są informacje tekstowe zawarte na stronach WWW. Nazwy odwiedzonych stron umieszczane są w bazie danych, wraz ze słowami i frazami jakie zostały na nich odnalezione. Każda strona dla znalezionej frazy (słowa) otrzymuje „ranking”, określający w jakim stopniu dana strona związana jest z daną frazą (słowem). Wyszukiwarka przypisuje różne wagi do każdego znalezionego słowa, w zależności czy znajduje się ono np. w tytule strony, metatagach, nagłówkach czy na początku dokumentu. Przypisywanie wag słowom kluczowym dokonuje się poprzez algorytm, który ustala ranking stron (ranking ustalany jest też na podstawie innych kryteriów np. Page Ranku (omówionego w dalszej części pracy) czy obecności w katalogu powiązanym z wyszukiwarką). Każda wyszukiwarka posiada unikalny algorytm łączący słowa kluczowe z wagami.
Procesor zapytań: Użytkownicy wyszukiwarek odnajdują strony na podstawie zapytań – wpisanych słów lub fraz kluczowych. Procesor odnajduje wszystkie strony, które są związane z zapytaniem użytkownika. Następnie wyświetlana jest uporządkowana lista stron, które najlepiej spełniają kryteria użytkownika.
Korzystając z wyszukiwarki nie przeszukujemy Internetu bezpośrednio, przeszukujemy tylko tekstową bazę danych utworzoną na podstawie wszystkich znalezionych przez robota internetowego stron WWW.
Bazy wyszukiwarek aktualizowane są praktycznie codzienne. Z kolei częstotliwość aktualizacji informacji o wybranej stronie zależy od rankingu strony nadawanego przez dany serwis wyszukujący oraz ilości łączy prowadzących do danej strony (informacje mogą być aktualizowane kilka razy dziennie lub np. raz w miesiącu).
Strony są odnajdywane przez wyszukiwarkę względem zadanych przez użytkownika słów kluczowych (słowa kluczowego). Jeśli pod jednym słowem strona jest bardzo wysoko to nie oznacza, że pod innym słowem będzie podobnie.
Ciekawostką jest to, iż m.in. Google dba o to, aby wyniki wyszukiwania się zmieniały, żeby nie było takiej sytuacji, że strona jest ciągle na tym samym miejscu.
Nie trzeba zgłaszać strony do żadnej wyszukiwarki, robot indeksujący podążając po linkach sam trafi na stronę. Błędem jest zgłaszanie strony do setek wyszukiwarek. Warto ten czas poświęcić na optymalizację witryny.
Copyright © 2008-2010 EPrace oraz autorzy prac.