Technikai alapok

A keresőgépek alapelvét könnyű megmagyarázni: az interneten található dokumentumokat egy szoftver segítségével átvizsgálják. Az átvizsgált oldalakon talált linkeket önállóan követik. Az így talált információkat egy indexelő szoftver rendszerezi és az adatbankba teszi. De az, hogy az internet-oldalak teljes szövegét vagy a meta elemeket (pl. a linkeket) is tárolják, vagy csak a címeket tárolják-e, és az milyen formában történik, az gépenként változik. Ha a felhasználó begépel egy keresendő fogalmat, akkor a keresőprogramok átnézik az adatbankok indexállományát, és a találatokból egy lista készül. Ez keresőgépenként szigorúan titkos algoritmusok alapján történik. A keresés minőségét az is befolyásolja, hogy milyen kibővített keresési lehetőséggel bír a gép, milyen logikai műveleteket (boolean operator) alkalmaznak. Sok gépnél automatikusan "és"-sel kötik össze a begépelt fogalmakat. Technikailag lehetséges egy egész sor további kombináció is, mint pl. a "vagy" keresés, vagy a teljes kifejezések keresése.

Az interneten a keresés hatékonyságát a keresőgép-üzemeltetők azáltal is növelhetik, hogy klasztereket (Cluster) képeznek. Ekkor a keresőgép-indexekben tárolt adatokból témacsoportokat hoznak létre. A találatok felsorolásánál figyelembe lehet venni, hogy az érintett linkek a témát érintő területekről származnak-e. A felsorolások minősége ezáltal érzékelhetően javul.

Bizonyára Ön is elcsodálkozott már azon, hogy a találatok listáján felbukkannak olyan linkek is, amelyeknek az adott kereséshez semmi köze nincs. Ennek oka az, hogy az internet-oldalak programozói gyakran tisztességtelen eszközöket is bevetnek a találatlisták befolyásolására. Például aprócska betűkkel írt szövegeket tesznek be, hogy a potenciális fogalmak körét gyarapítsák. További tisztességtelen módszer az ún. Spamdexing (search engine spamming - keresőmotorok szeméttel történő elárasztása). Például ugyanazt a lapot minimálisan megváltoztatott formában sokszorosan jelentetik meg, így az eredménylistán mindig ugyanazok a linkek látszanak. A keresőgépek is áldozatul eshetnek a férgeknek. Így történt meg, hogy a MyDoom egyik variánsa átvizsgálta a keresőgépeket elektronikus levélcímek után kutatva, és aztán ezeket a címekre küldte el saját magát.