LGORYTM WYSZUKIWANIA
LGORYTM WYSZUKIWANIA
Współczesne komercyjne silniki wyszukiwarek bazują na nauce odnajdywania informacji. Funkcje wyszukujące opierała się na dwóch krytycznych komponentach:
Odpowiedniość / prawidłowość – stopień do którego zawartość zwracanych dokumentów odpowiadała zapytaniu użytkownika pod względem zamiarów i warunków
Popularność – mierzona na podstawie ilości odwołań lub cytatów. Każdy dokument, który odwołuje się do innego zwiększa jego współczynnik popularności.
Tekst przyjazny dla wyszukiwarek
Aby tekst mógł zostać „przeczytany” przez boty lub pająki wyszukiwarek musi być dla nich dostępny. Nie jest to trudne do osiągnięcia ale wielu projektantów czy programistów o tym zapomina. Należy pamiętać, że dla wyszukiwarek nie będzie dostępny tekst, który jest:
Zagnieżdżony wewnątrz aplikacji Java lub Adobe Flash
Umieszczony wewnątrz pliku graficznego jak .jpg, .gif czy .png
Dostępny tylko za pomocą przycisku formularza lub innej akcji wymagającej interakcji z użytkownikiem.
Popularność strony mierzona jest przez silniki wyszukiwarek na podstawie liczby wizyt w ciągu określonego czasu oraz czasu spędzonego przez internautę na danej stronie. Pozycjonowanie strony dla tego parametru polega na umieszczeniu takiego tekstu w tytule strony oraz w jej opisie, aby zdecydowanie zachęcał internautę do kliknięcia linku w wynikach wyszukiwarki i odwiedzenia serwisu. Czas spędzony internauty na stronie zależy oczywiście od tego, czy znajdzie na niej informacje, jakich poszukiwał oraz jak bardzo znaleziona treść będzie dla niego interesująca. Im częściej serwis będzie odwiedzany przez użytkowników wyszukiwarki oraz im więcej czasu będą oni spędzać na stronie, tym parametr popularności strony w wyszukiwarce będzie rósł i tym wyżej będzie umieszczana strona pośród kolejnych wyników wyszukiwania.
Wyszukiwarka składa się z czterech podstawowych elementów:
1. Pająk (Spider, Crawler),
Spider czyta tekst na stronie internetowej tak jak przeglądarka. W przeciwieństwie jednak do przeglądarek czyści kod ze znaczników html. Oczywiście jednak bierze pod uwagę najbardziej interesujące go miejsca w kodzie typu: tytuł, nagłówek czy znacznikh1.
2. Bazy danych,
Baza Danych jest indeksowana. To czy strona pojawi się przy wyszukiwaniu zależy od tego, czy została uwzględniona w Indeksie, a nie w Bazie Danych.
3. Indeksu
Indeks to spis wszystkich unikalnych słów wraz z odnośnikami do miejsc występowania ich w bazie danych.
4. Programu Wyszukującego.
Gdy użytkownik wpisze jakieś hasło w formularzu wyszukiwarki, Program Wyszukujący przeszukuje Indeks w poszukiwaniu tego słowa. Jeśli słowo zostanie znalezione, Program Wyszukujący czyta wszystkie strony z Bazy Danych oznaczone w indeksie jako zawierające dane zapytanie.
Mapa stron serwisu
Mapa serwisu może być bardzo przyjaznym narzędziem w optymalizacji stron pod względem wyszukiwarek. Na stronie głównej oraz wszystkich stronach o wysokiej hierarchii powinien znajdować się link do mapy serwisu (z ang. sitemap). Mapa serwisu jest listą wszystkich stron należących do serwisu oraz linków do nich. Dzięki temu, żadna ze stron nie będzie w hierarchii dalej niż dwa kliknięcia. A to z kolei prawie gwarantuje poprawne zindeksowanie wszystkich stron serwisu.
Współczesne komercyjne silniki wyszukiwarek bazują na nauce odnajdywania informacji. Funkcje wyszukujące opierała się na dwóch krytycznych komponentach:
Odpowiedniość / prawidłowość – stopień do którego zawartość zwracanych dokumentów odpowiadała zapytaniu użytkownika pod względem zamiarów i warunków
Popularność – mierzona na podstawie ilości odwołań lub cytatów. Każdy dokument, który odwołuje się do innego zwiększa jego współczynnik popularności.
Tekst przyjazny dla wyszukiwarek
Aby tekst mógł zostać „przeczytany” przez boty lub pająki wyszukiwarek musi być dla nich dostępny. Nie jest to trudne do osiągnięcia ale wielu projektantów czy programistów o tym zapomina. Należy pamiętać, że dla wyszukiwarek nie będzie dostępny tekst, który jest:
Zagnieżdżony wewnątrz aplikacji Java lub Adobe Flash
Umieszczony wewnątrz pliku graficznego jak .jpg, .gif czy .png
Dostępny tylko za pomocą przycisku formularza lub innej akcji wymagającej interakcji z użytkownikiem.
Popularność strony mierzona jest przez silniki wyszukiwarek na podstawie liczby wizyt w ciągu określonego czasu oraz czasu spędzonego przez internautę na danej stronie. Pozycjonowanie strony dla tego parametru polega na umieszczeniu takiego tekstu w tytule strony oraz w jej opisie, aby zdecydowanie zachęcał internautę do kliknięcia linku w wynikach wyszukiwarki i odwiedzenia serwisu. Czas spędzony internauty na stronie zależy oczywiście od tego, czy znajdzie na niej informacje, jakich poszukiwał oraz jak bardzo znaleziona treść będzie dla niego interesująca. Im częściej serwis będzie odwiedzany przez użytkowników wyszukiwarki oraz im więcej czasu będą oni spędzać na stronie, tym parametr popularności strony w wyszukiwarce będzie rósł i tym wyżej będzie umieszczana strona pośród kolejnych wyników wyszukiwania.
Wyszukiwarka składa się z czterech podstawowych elementów:
1. Pająk (Spider, Crawler),
Spider czyta tekst na stronie internetowej tak jak przeglądarka. W przeciwieństwie jednak do przeglądarek czyści kod ze znaczników html. Oczywiście jednak bierze pod uwagę najbardziej interesujące go miejsca w kodzie typu: tytuł, nagłówek czy znacznikh1.
2. Bazy danych,
Baza Danych jest indeksowana. To czy strona pojawi się przy wyszukiwaniu zależy od tego, czy została uwzględniona w Indeksie, a nie w Bazie Danych.
3. Indeksu
Indeks to spis wszystkich unikalnych słów wraz z odnośnikami do miejsc występowania ich w bazie danych.
4. Programu Wyszukującego.
Gdy użytkownik wpisze jakieś hasło w formularzu wyszukiwarki, Program Wyszukujący przeszukuje Indeks w poszukiwaniu tego słowa. Jeśli słowo zostanie znalezione, Program Wyszukujący czyta wszystkie strony z Bazy Danych oznaczone w indeksie jako zawierające dane zapytanie.
Mapa stron serwisu
Mapa serwisu może być bardzo przyjaznym narzędziem w optymalizacji stron pod względem wyszukiwarek. Na stronie głównej oraz wszystkich stronach o wysokiej hierarchii powinien znajdować się link do mapy serwisu (z ang. sitemap). Mapa serwisu jest listą wszystkich stron należących do serwisu oraz linków do nich. Dzięki temu, żadna ze stron nie będzie w hierarchii dalej niż dwa kliknięcia. A to z kolei prawie gwarantuje poprawne zindeksowanie wszystkich stron serwisu.