Cum funcționează Google (III)

sâmbătă, aprilie 12, 2014 18:19
Posted in category IT

Google RomaniaDupă ce în Partea I și Partea a II-a am văzut informații interesante despre Google, în partea a III-a avem un subiect fierbinte, mai ales pentru administratorii de site-uri. Vom vedea în această parte cum stabilește Google PageRank-ul (PR).

Multe site-uri se mândresc cu PageRank-ul lor. De multe ori PageRank-ul este un bun indicator al popularităţii unui site ori cel puţin aşa se crede. Dar cum funcţionează PageRank-ul? Spune acesta totul despre valoarea unui site? La ce ajută acesta şi cum poate fi el controlat? O analiză a conceptului în cele ce urmează.

Precizări preliminare

Inainte de orice trebuie făcute câteva precizări privind valoarea de adevăr a afirmaţiilor pe care le vom face mai jos referitoare la PageRank:
::: Informaţiile furnizate sunt probabile, singura entitate care cunoaşte adevărul fiind Google şi care, din motive lesne de înţeles, păzeşte cu străşnicie secretul asupra mecanismelor de stabilire a ierarhiei rezultatelor interogărilor pe motorul de căutare Google;
::: Datele privind modul de calcul al PageRank-ului unei pagini web sunt luate din documentele originale scrise de cei doi fondatori ai Google, Larry Page şi Sergey Brin în 1998;
::: Google îşi actualizează zilnic algoritmii de sortare a datelor şi stabileşte periodic importanţa indicatorilor pe care îi ia în calcul la stabilirea relevanţei unei pagini web;
::: articolul de faţă este rezultatul lecturii a multor paragrafe de cărţi şi articole pe marginea acestui subiect, multe dintre sursele ideilor aici prezente, uitate, nefiind precizate la secţiunea Bibliografie.

Ce este PageRank-ul și cum este determinat

Google foloseşte mulţi indicatori, peste 200, pentru a determina relevanţa unei pagini web. Unul dintre aceşti indicatori este PageRank-ul. Simplu spus, PageRank-ul este metoda patentată de Google pentru a măsura importanţa unei pagini web.

PageRank-ul este un indicator al importanţei unei pagini web oarecare A care se bazează pe cantitatea şi calitatea linkurilor altor pagini care indică spre pagina A. Prin urmare, cu cât mai multe linkuri către paginile site-ului dumneavoastră, cu atât mai bine. Cu cât aceste linkuri sunt mai valoroase (vom vedea imediat ce înseamnă această valoare), din nou, cu atât mai bine.

Valoarea unui link este dată, în principiu, de PageRank-ul paginii pe care se află. Dacă pagina A conţine un link către pagina B, atunci pentru Google acest lucru înseamnă că pagina B este importantă. Astfel, dacă o pagină cu PageRank 8 are un link către dumneavoastră este cu totul altceva un link de pe o pagină cu PageRank 1 (pentru cei ce nu ştiu, PageRank-ul unei pagini poate fi între 0 şi 10). Dar lucrurile nu sunt atât de simple… PageRankul unei pagini web se împarte în mod egal între paginile către care indică linkurile. Astfel, dacă o pagină A cu PageRank 4 va conţine linkuri către paginile B şi C, fiecare dintre cele două pagini primitoare vor împărţi PageRankul paginii A.

Google afirmă că cele mai bune linkuri pentru site-ul dumneavoastră sunt cele care sunt create pe baza valorii conţinutului paginii către care indică. Modul în care determină Google această valoare a linkurilor este, desigur, secret.

Patentul pentru PageRank, deşi dezvoltat de către cei doi co-fondatori Google, aparţine universităţii Stanford, care a cedat dreptul de folosire către Google pentru 1,8 milioane acţiuni Google, pe care le-a vândut în anul 2006 pe suma de 336 milioane de dolari.

Cât de important este PageRank-ul

O pagină care are un PageRank mare nu asigură neapărat succesul site-ului. Dacă domeniul datelor site-ului nu este unul de interes pentru navigatorii pe Internet, oricât de bine alcătuit ar fi respectivul site, vizitatorii se vor lăsa aşteptaţi. De exemplu, puteţi avea un site foarte bun despre peşti. Pentru că alte site-uri vor pune linkuri către site-ul dumnevoastră, PageRank-ul paginilor site-ului va creşte. Dacă însă numărul celor care sunt interesaţi de domeniul peştilor este mic, puţini vor fi cei care vă vor accesa site-ul, chiar dacă la o eventuală căutare pe Google site-ul dumneavoastră s-ar afla pe una dintre primele poziţii.

În opinia unor specialişti în SEO (Search Engine Optimization – optimizarea paginilor web pentru motoarele de căutare), importanţa PageRank-ului a scăzut semnificativ în ultimii ani între indicatorii de relevanţă ai Google. Acest lucru s-a întâmplat, foarte probabil, pentru că deşi greu de manipulat, administratorii de site-uri au făcut tot ce le-a stat în putinţă pentru a creşte PageRank-ul site-urilor lor în mod artificial. De pildă, prin vânzarea/cumpărarea de linkuri cu PageRank mare, prin realizarea masivă de schimburi de linkuri doar pentru a creşte PageRank-ul, înscrierea site-urilor pe portalurile colectoare de linkuri etc. Google a luptat şi luptă împotriva tuturor acestor şmecherii. Se pare însă că filozofia de stabilire a relevanţei unei pagini web a suferit totuşi modificări semnificative de-a lungul anilor.

Cum funcționează ordonarea paginilor rezultate în urma căutării pe Google

Într-o explicaţie simplificată, stabilirea ierarhiei rezultatelor oferite de Google la o interogaţie oarecare pe pagina de căutare Google funcţionează în felul următor:

::: sunt căutate pe serverele Google toate paginile care conţin cuvintele-cheie din interogarea utilizatorului Google;
::: se face o ordonare iniţială a răspunsurilor, pe baza indicatorilor de relevanţă stabiliţi de Google;
::: ordonarea este rafinată pe baza textului ancoră (hiperlinkului) al linkurilor către paginile selectate;
::: se stabileşte ierarhia finală a paginilor, pe baza PageRank-ului paginilor.

Asta înseamnă că dacă aveţi o pagină web cu PageRank mare, la o anumită interogare unde există nenumărate alte pagini, dar cu un PageRank mai mic, pagina dumneavoastră va fi sus în lista rezultatelor, iar probabilitatea ca cel care a efectuat interogarea să ajungă pe site-ul dumneavoastră este mare.

Aşadar, PageRank-ul unei pagini web este important din punct de vedere al locului pe care pagina îl ocupă în ierarhia finală a listei cu rezultate a căutării pe Google.

Cum se calculează PageRank-ul unei pagini?

Desigur, răspunsul corect este: nu ştim. Dar ne putem face o idee prezentând formula originală a PageRank-ului, aşa cum a apărut ea în documentele fondatorilor Google (apropo, denumirea de PageRank nu vine de la Page-pagină, ci de la Page-fondatorul Google).

PR(A) = (1-d) + d(PR(T1)/C(T1) + … PR(Tn)/C(Tn))

PR(A) – PageRank-ul unei pagini A;
PR(T1) – PageRank-ul unei pagini T1;
PR(Tn) – PageRank-ul unei pagini Tn;
C(T1) şi C(Tn) – numărul de linkuri care trimit către alte pagini de pe pagina T1 şi respectiv Tn;
d – este un coeficient de ponderare propus în documentul original să aibă valoarea 0,85.

Două lucruri sunt, credem, de menţionat la acest punct. Unul este acela că, după cum se înţelege foarte clar din formulă, PageRank-ul este al unei pagini web, nu al unui site. Dacă o să vă verificaţi site-ul dumneavoastră, cel mai probabil o să observaţi o diferenţă de PageRank între paginile ce-l alcătuiesc. Al doilea lucru este în fapt o idee derivată: când un site pune un link către o pagină a dv., ceea ce contează nu este PageRank-ul paginii de start a site-lui, ci PageRank-ul paginii unde este pus linkul către pagina dumneavoastră.

Cât de relevante sunt informațiile despre PageRank?

Sunt două aspecte mai importante de discutat privind informaţiile pe care utilizatorii le pot verifica despre PageRank: acurateţea Google Toolbar şi semnificaţia cifrelor aferente PageRank-ului. Pentru cei care folosesc Google Toolbar ca pe un indicator precis al PageRankului unei pagini web avem o veste proastă: Google admite că acest instrument poate oferi valori greşite asupra PageRank-ului; sunt cazuri în care valoarea reală a PageRank-ului, cea luată în calcul de Google atunci când stabileşte ierarhia rezultatelor interogărilor, să nu fie afişată în mod corect pe Google Toolbar. Aşadar, Google foloseşte valorile corecte, dar oferă adeseori informaţii depăşite utilizatorilor.

Cât despre cifrele de la 1 la 10 care ne indică PageRankul unei pagini trebuie spus că reprezintă doar o reprezentare aproximativă şi simplificată a valorii reale calculate pentru pagina respectivă. Iată mai jos un tabel cu o corespondenţă între valorile reale şi cele afişate, pentru a înţelege mai bine ideea.

Dacă PageRank-ul este între valorile (Google Toolbar arată)
0.00000001 şi 5 (1)
6 şi 25 (2)
25 şi 125 (3)
126 şi 625 (4)
626 şi 3125 (5)
3126 şi 15625 (6)
15626 şi 78125 (7)
78126 şi 390625 (8)
390626 şi 1953125 (9)
1953126 şi infinit (10)

Filozofia creşterii valorii afişate a PageRankului este deci aceea că pentru a atinge o valoare mai mare este din ce în ce mai greu pe măsură ce PageRank-ul este mai mare; mult mai uşoară este creşterea de la PR1 la PR2, decât de la PR2 la PR3. Atenţionăm că plajele de valori incluse în tabel sunt pur speculative, valorile reale fiind cunoscute doar de Google.

Cum putem controla PageRank-ul unui site?

Sunt trei lucruri pe care le putem face pentru a îmbunătăţi PageRank-ul unui site:
::: acumularea de linkuri de valoare (care vin de la site-uri de valoare) către paginile site-ului;
::: alegerea cu grijă a site-urilor către care punem linkuri (explicaţia, un pic mai jos);
::: crearea unei structuri logice a site-ului şi distribuirea judicioasă a PageRank-ului către paginile site-ului prin linkuri interne.

Există o dispută printre specialiştii în SEO ori printre pasionaţii de domeniu privind pierderea de PageRank prin linkurile către alte site-uri cu PageRank mai mic. Unii susţin că linkurile către alte site-uri cu PR mai mic duc la o diminuare a PageRank-ului, pe când ceilalţi afirmă că nu poate fi vorba despre aşa ceva. Cum stau lucrurile de fapt?

Dacă privim formula pentru calculul PageRank-ului rezultă foarte clar că PageRankul nu se pierde. Dacă am o pagină cu PR 6 şi pe ea am 100 de linkuri către alte site-uri cu PR 0, nu există nici un motiv pentru ca pagina cu PR 6 să fie retrogadată, întrucât PageRank-ul se bazează pe linkurile care vin către pagina noastră, iar nu pe cele care pleacă. Aşadar, cei care spun că PageRank-ul nu se pierde au dreptate.

Totuşi, şi cei care spun că PageRank-ul se pierde au dreptate. De ce? Să luam următorul exemplu: Am un site cu 3 pagini. Prima pagină cu PR 4, celelalte cu PR 1. Pe pagina cu PR 4 pun linkuri către celelalte două pagini ale site-ului, dar şi către alte două pagini ale altor site-uri. Deşi nu contează câte linkuri pun pe prima pagină din punct de vedere al PageRank-ului acestei pagini, din punct de vedere al PageRank-ului celorlalte pagini ale site-ului meu contează. De ce? Pentru că, după cum am afirmat mai sus, PageRank-ul unei pagini de o anumită valoare se împarte între paginile către care indică. PR 4 nu se mai împarte, deci, în mod egal între cele două pagini ale site-ului meu, ci între cele 4 pagini, dintre care două sunt externe site-ului meu. Astfel, gândind global, există o pierdere de PageRank la nivelul site-ului atunci când o pagină are linkuri atât câtre paginile interne ale site-ului, cât şi către paginile altor site-uri. Matematica din spatele acestei pierderi este însă o necunoscută.

Concluzii

PageRank-ul nu trebuie absolutizat. În principiu, în opinia noastră cel mai important indicator al unui site este valoarea intrinsecă a site-ului. Dacă informaţiile incluse sunt de valoare, alte site-uri vor pune linkuri şi în felul acesta şi PageRank-ul va creşte. Pe de altă parte, un site valoros îşi creează vizitatori fideli, care indiferent de valoarea PageRank-ului ori de estimarea Google a relevanţei paginilor site-ului, vor reveni direct pe site, fără a apela la Google ori la alt motor de căutare. Recomandarea noastră este aşadar: canalizaţi-vă eforturile pentru construirea unui site valoros prin ceea ce conţine; restul vine de la sine.

Sursa: scientia.ro

BIBLIOGRAFIE:
en.wikipedia.org/wiki/PageRank
pr.efactory.de/
seomoz.org/blog/how-googles-rankings-algorithm-has-changed-over-time-
webworkshop.net/pagerank.html
webpronews.com/topnews/2004/04/08/anchor-text-optimization
webmarketingnow.com/tips/google-pagerank-uncovered.html
dailyblogtips.com/linking-out-google-pagerank/
yart.com.au/article.asp?ID=18
markhorrell.com/seo/pagerank.html
google.com/corporate/tech.html
google.com/support/webmasters/bin/answer.py?hl=en&answer=70897
googleguide.com/google_works.html
voelspriet2.nl/PageRank.pdf

Citeste si articolele:

Dacă ţi-a plăcut articolul, ai ceva de completat sau ai ceva de reproşat (civilizat) la acest text, scrie un comentariu, ori pune un link pe site-ul (blogul) tău, în cazul în care vrei ca şi alţii să citească textul sau (obligatoriu) dacă ai copiat articolul parţial sau integral. După ce ai scris comentariul, acesta trebuie aprobat de administratorul site-ului, apoi va fi publicat.

2 Responses to “Cum funcționează Google (III)”

  1. Ce browsere mai folosesc românii | A șaptea dimensiune says:

    august 18th, 2016 at 17:04

    […] Cum funcționează Google (III) […]

  2. Ce inseamna un titlu de articol optimizat SEO | A șaptea dimensiune says:

    septembrie 25th, 2016 at 11:19

    […] Cum funcționează Google (III) […]

Adauga un comentariu