jueves, 11 de noviembre de 2010

EL PageRank

Factores off-the-page

Con esta sección dedicada al PageRank entramos en los factores off the page, es decir, aquellos exteriores a nuestra propia web, y por tanto sobre los que no tendremos un control tan directo como en lo que es puramente la optimización.

Google fue revolucionario precisamente porque fue el primer gran buscador que valoró estos elementos; los aspectos que estaban al alcance de los autores de las webs eran manipulados porque eran manipulables; así pues, el desarrollo de un buscador que funcionara bien se debía basar en aquellos aspectos que se estuvieran más alejados de la influencia de los webmasters.

PageRank para Dummies

El PageRank se ha convertido en un concepto casi mítico entre los webmasters, que no paran de hacer preguntas acerca de él. Así pues, para esta sección contaré con la ayuda de uno de esos webmasters, John Dummies, que hará las preguntas que previsiblemente también se os ocurrirán a vosotros.

El PageRank (bautizado así en honor de uno de los fundadores de Google, Larry Page) ha sido considerado el corazón del sistema de Google para medir la relevancia de las webs. Hay quien cree que el PageRank es el factor clave para lograr buenos puestos en Google, y hay quien dice que el PageRank apenas sirve de nada.

Un símil muy socorrido para explicar el PageRank es que es como un sistema de votaciones. Si yo tengo una web A y en una de mis páginas pongo un link hacia la página de la web B, estoy 'votando' a esa página; estoy indicando que es un recurso de interés.

Así, cuantos más links reciba una página, mayor será su PageRank (PR para los amigos).

No necesariamente. Porque el PR transmitido no es un valor absoluto. A su vez, depende de:

  • El PR que tenga la página que nos enlaza
  • El número de links salientes que tenga esa página
Digamos que a la página A le apunta la página B. Digamos que la página B tiene 20 puntos de PR. Y digamos que la página B también tiene un enlace hacia la página C.

Por tanto, lo primero que debemos tener en cuenta es que, si tiene dos links, el PR transmitido se dividirá entre ellos.

No es seguro que el PR transmitido por una página se divida por igual entre todos sus enlaces, pero en esta explicación asumiremos que es así para no complicarla innecesariamente.

El PR de la página que lo transmite tampoco llega tal cual a su destino; Google aplica un factor de debilitación: multiplica el PR transmitido por un número menor a 1 (en la fórmula original, 0'85).

Es decir, que la página A recibirá 8'5 puntos de PR.

¡No! Aunque no comozcamos la fórmula actual del PR, sí conocemos la fórmula original de los primeros trabajos sobre Google. Aquí os presento la fórmula original del PR (hay otra variante, pero esta es más simple y nos permitirá entender claramente cómo funciona el PR):

PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))

PR(A) es el PageRank de la página que tomamos como referencia.

d es el factor de debilitación.

(1-d) asegura que cualquier página indexada por Google, aunque no reciba ningún enlace, tendrá un PR mínimo de 0'15.

PR(T1)/C(T1) será el PageRank (PR) de una de las páginas que nos enlaza, (T1), dividido por todos los enlaces (C) que también salen de esa página T1, es decir, el PR que nos transmite.

... + PR(Tn)/C(Tn) lo mismo que el punto anterior, repetido por cada página que nos enlace.

Para empezar, la fórmula del PR seguramente ha sufrido variaciones, y actualmente debe presentar diferencias respecto a la que he puesto aquí. Sin embargo, sigue siendo una buena guía para saber cómo se comporta el PR en líneas generales. Además, para conocer tu PR deberías conocer exactamente el PR de las páginas que te enlazan. Y para conocer el PR de las páginas que te enlazan deberías conocer exactamente el PR de las páginas que a su vez las enlazan. Y para conocer el PR de las páginas que enlazan a las páginas que te enlazan, deberías conocer...

Afortunadamente, puedes tener una aproximación descargando e instalando en tu navegador Explorer la barra de herramientas de Google en http://toolbar.google.com/.

Hacia la mitad de la barra verás un raya en verde y blanco. Es una representación gráfica del PR de la página en la que estás, representada en una escala del 1 al 10.

De hecho, es una aproximación al verdadero PR, pues mientras el PR tiene una escala lineal, la barra de Google lo presenta en una escala logarítmica. Esta es una hipótesis acerca de la relación entre el verdadero PR y el PR representado en la barra de Google extraída del artículo PageRank Uncovered:



PR verdadero Barra de Google
De 0.00000001 a 5 1
De 6 a 25 2
De 25 a 125 3
De 126 a 625 4
De 626 a 3125 5
De 3126 a 15625 6
De 15626 a 78125 7
De 78126 a 390625 8
De 390626 a 1953125 9
De 1953126 a infinito 10
Esto explica por qué a los webmasters les cuesta relativamente poco alcanzar un PR3, bastante más un PR4, mucho más un PR5, muchísimo más un PR6, infinitamente más un PR7, etc. El intervalo de enlaces que deben obtener para aumentar un peldaño en el PR que muestra la barra de Google es cada vez mayor.
Es cierto que no conviene tener muchos links hacia fuera, pero a menudo este punto de vista se hace desde la falsa creencia de que, puesto que una página transmite PR a las páginas que enlaza, ella está quedándose sin PR. Y eso es un error.

Si la página A tiene 100 puntos de PR y un enlace a la página B, es cierto que le transmite todo el PR que puede transmitir (85, una vez aplicado el factor de debilitamiento), pero eso no quiere decir que se quede sin ese PR. Entonces, ¿a qué viene toda esa psicosis acerca de no tener enlaces hacia otras webs? Lo veremos en Manejar tu PR interno.

El cálculo del PR es un tema complejo, porque el PR de una página determinada A depende del PR de la página que la enlaza, B. Pero si A y B están entrelazadas, ahora el PR de B depende también del PR de A; y si el PR de B ha cambiado, el PR de A, como consecuencia también, etc. Por tanto, Google debe calcular el PR en diversas iteraciones hasta que éste se estabiliza y los cambios sucesivos no provocan cambios posteriores.


1 comentario: