Prilagođeno pretraživanje

četvrtak, 23. srpnja 2009.

PageRank Algoritam i njegova Primjena




PageRank-algoritam je postupak pomoću kojeg se brojni povezani dokumenti, kao što je npr. World Wide Web ocjenjuju prema vlastitoj strukturi. Kod navedenog postupka se svakom elementu dodjeljuje ocjena na temelju strukture linkova. PageRank algoritam razvijen je i patentiran na univerzitetu Stanford (Stanford University). Za razvoj su zaslužni Larry Page ( algoritam je dobio ime po njemu) i Sergey Brin. Algoritam je izvorno razvijen za tvrtku Google koju su osnovali Page i Brin, kako bi se na njemu temeljila procjena kvalitete stranica.

PageRank-algoritam je specijalna metoda pomoću koje se određuje linkovna popularnost ( broj linkova koji ukazuje na stranicu) određene stranice ili pojedinačnog dokumenta. Osnovni princip: više linkova = veća popularnost. Koliko je veća popularnost, veći je broj posjetitelja. PageRank algoritam oponaša korisnika koji praktički bez cilja surfa internetom. Vjerojatanost da spomenuti korisnik stigne do stranice može se usporediti sa PageRankom.


PageRank-algoritam

Princip PageRank algoritma temelji se na tome da svaka stranica posjeduje ocjenu (PageRank). PageRank se povećava proporcionalno s brojem stranica (koje imaju po mogućnosti čim veći PageRank) koje ukazuju na određenu stranicu.

Točan izgled i djelovanje algoritma danas nije poznato. Postoje mnoga nagađanja o tome kako PageRank algoritam funkcionira. Najsličnije metode su Gauss-Seidelova metoda (dugoročno nije pouzdana) i sljedeći algoritmi „Hubs und Authorities“ – autor: Jon Kleinberg; Hilltop i TrustRank-algoritam.

Model slučajnog surfera

Ako se PageRank vrijednost normira na 0, ocjena stranice može se interpretirati kao vjerojatnost da se prosječni surfer slučajno nađe na navedenoj stranici. Prosječni surfer kreće se internetom tako da s određenom, algoritmom definiranom vjerojatnošću klikne na link i time dospije na drugu stranicu. Da bi se riješio problem algoritma ukoliko stranica ne posjeduje vlastite izlazne linkove, algoritam svakoj stranici dodaje virtualne izlazne linkove prema prije posjećenim stranicama.


Vrijednosti toolbara i zapisa

Informacije o PageRank vrijednosti određene stranice mogu se odrediti pomoću Google-Toolbara i Googleovog indexa, tj. internih zapisa. Vrijednost prikazana u Google Toolbaru kreće se između 0 i 10, a vrijednost unutar Googleovog indexa kreće se između 0 i 7. Obje vrijednosti prikazuju stvarni PageRank na logaritamskoj skali i prikazuju rezultat kao cijelobrojnu vrijednost.

Page Rank prikazivan pomoću Google Toolbara prije se aktualizirao svakih 30 dana. U međuvremenu se interval između pojedinih aktualizacija povećao na više od 100 dana. Stoga se o točnom Page Rank algoritmu i njegovoj stvarnoj ulozi kod pozicioniranja unutar Googleovih rezultata pretraživanja može samo nagađati.

Manipulacija PageRank-a

Zbog gospodarskog značenja, u međuremenu je došlo do ciljane manipulacije i krivotvorenja PageRanka. Navedeni veoma koristan sistem je postao žrtva spammera na raznim blogovima, forumima i različitih farmi linkova, kao i brojnih drugih neozbiljnih metoda. Prosljeđivanjem korisnika na postojeće stranice sa visokim PageRankom ciljano se pokušava manipulirati PageRank-algoritmom.

Početkom 2005. Google je implementirao novi linkovni atribut „rel="nofollow" “. Navedeni atribut označio je pokušaj borbe protiv spama. Linkovi označeni atributom „rel="nofollow" “. ne ulaze u kalkulacije za PageRank. Pomoću te metode moguće je suzbiti izlazne linkove raznih foruma i blogova koji uglavnom služe spamerima. Takođe treba napomenuti da je navedena metoda veoma diskutabilna.

Povijest i razvoj PageRank-a

Ideja PageRank-algoritma potječe iz sociometrije i u stručnoj literaturi prvi puta je 1953. spominje Katz. Već 1949. Seelay je koristio postupak za objašnjavanje nastanka društenog statusa određenog individuuma. Ali u njegovom opisu još ne postoji normiranje u odnosu na broj izlazećih rubova, te ne postoji „zvijezda“ za ublaživanje tih efekata. Ona je 1956. uvedena zahvaljujući Charlesu H. Hubbellu.




Kritika

Nedostaci PageRanka u pregledu:

Financijski jači klijenti mogu kupiti povratne linkove i time se više pozicionirati u odnosu na konkurente. Iz navedenog razloga kvalitetan sadržaj često je podređen stranicama čiji vlasnici raspolažu većim financijskim mogućnostima, tj. novac određuje redoslijed rezultata pretraživanja.

Webmasteri često u PageRanku vide jedini krirterij prema kojem razmjenjuju linkove. Sadržaj stranica postaje nevažan.

Pomoću PageRanka ne može se procijeniti kvaliteta stranice.

Google - Razvoj Uspješne Tražilice i Kompanije

Tehnika Rada i Pozicioniranje Rezultata Tražilice Google

Google i cenzura u fokusu kritike

Savjeti i trikovi za korištenje tražilice Google

Googleove Usluge i Marketing

Komunikacija, Publikacije i Software Tražilice Google

Nema komentara: