KVG

Ensimmäinen asia mitä teen kun täytyy löytää mikä tahansa tieto, vaikkapa verkkosivu, aikataulu tai kaupan aukioloaika, on Google-haku. Myös muita hakukoneita on olemassa, kuten Microsoftin Bing tai ranskalainen Qwant, mutta Googlella on käytännössä markkinajohtajuus alalla. Mutta miten se oikein toimii? Miten Google osaa etsiä kaikista maailman verkkosivuista juuri ne minua eniten kiinnostavat sivustot, ja miten ihmeessä se tapahtuu sekunnin sadasosissa?

Google on laittanut indeksointirobotit töihin ja järjestänyt valmiiksi internetissä olevia verkkosivuja hakemistoihin jo ennen kuin sinulle tulee mieleen mitä pitä tietoa pitäisi hakea. Robotit käyvät verkkosivuja läpi ja siirtyvät eteenpäin niistä löytämiään linkkejä. Tieto verkkosivuista palautuu Googlen palvelimille, ja se liitetään hakemistoon sen sanan kohdalle mihin verkkosivu liittyy. Eli esimerkiksi kun Googlen indeksointirobotit käyvät tätä Uuden kehittämä-blogia läpi, ne liittäisivät sen muunmuassa sanoihin "digitaalinen liiketoiminta" ja "innovointiosaaminen". Kun sitten haetaan näillä sanoilla, pompsahtaa tämä blogi hakutuloksiin.

Voiko se olla näin yksinkertaista, verkkosivuja kuitenkin on miljardeja? No ei aivan. Kun tiedot verkkosivuista on järjestelty hakemistoihin, tätä tietoa käy läpi tähän kehitetyt sijoitusjärjestelmät. Nämä algoritmiketjuista koostuvat järjestelmät sijoittavat verkkosivustoja sen perusteella mitä hakusanoja käytetään, kuinka tuore sivu on sekä sijaintitietoja hyödyntäen.

Jotta hakutulos osuisi mahdollisimman lähelle sitä mitä haetaan, on algoritmien toimittava mahdollisimman monipuolisesti. Tärkeintä on varmasti se että Google ymmärtää mitä olet hakemassa, tätä varten on käytössä sanantunnistusalgoritmeja. Nämä osaavat tulkita esimerkiksi hakusanan synonyymejä. Tämän jälkeen algoritmit etsivät verkkosivut joilla hakusana (tai synonyymit) esiintyvät. Samalla ne selvittävät että millainen verkkosivun sisältö on, eli että sivustolla olisi jotain haettavaa tietoakin, eikä vain hakusanaa toistettuna kerta toisensa jälkeen. Tämän jälkeen sivustot järjestetään niin että hyödyllisin on ensin, tätä varten työskentelee algoritmi joka arvioi sivuston laatua. Mitä tuoreempi sivusto, jossa on hakusanoja, sekä se että muut sivustot ovat linkittäneet tälle sivustolle, varmistavat hakutuloksen nousemisen kärkeen.

Näiden lisäksi Googlen algoritmit tutkivat sivustojen luotettavuutta, toimivuutta ja toimivuutta erilaisilla alustoilla. Mitä paremmin sivusto näissä testauksissa pärjää, sitä varmemmin se nousee haun kärkituloksiin. Ja mitä ylemmäs nouset, sitä varmemmin hakija myös löytää sivustolle. Enpä muista että olisin itsekään tutkinut hakutuloksia sivulla kaksi tai kolme.



Lähteet:
Vaihtoehtoja Googlelle
Miten Google-haku toimii
Indeksointi
Algoritmit

Kommentit