TrustRank o la confianza de una página web

LuJo


Técnica de funciones, algoritmos matemáticos que analizan enlaces elaborada por la Universidad de Stanford y Google, (también afirman los expertos que Yahoo! tiene algo que ver).
El TR nace con el objetivo de detectar y eliminar el problema del spam en las páginas web, (borrar de la red sitios inútiles).


Se parte de la base, cierta por otro lado, que existen páginas que se dedican a realizar spam. Es una fórmula de obtener enlaces y falsear datos como los que aporta en Pagerank de Google.
No hay que olvidar que muchas de esas páginas de enlaces tienen detrás intenciones pecuniarias.



Trust Rank revisa aproximadamente 200 páginas web, (con alto PR, backlinks, de calidad en grandes directorios o instituciones gubernamentales, educacionales o corporativas), a las que da una buena puntuación. Éstas reciben el nombre de "web semillas".

El análisis del TrustRank contiene una parte de evaluación manual por expertos (personas, seres humanos), que tiene en cuenta la antigüedad del dominio, la información que se renueva, los enlaces...
Cuando se ha identificado a las páginas importantes de calidad, (páginas semilla), se comparan con el resto de webs teniendo como muestra las que obtuvieron buena reputación en su examen preliminar.

El TrustRank se aplica a webs de distintas temáticas de alta calidad como puntos de origen de una red de enlaces. A más cercanía al punto de origen, mejor TR siendo la web bien considerada por los buscadores.


El algoritmo del TrustRank clasifica las webs (spam o no spam).
Distingue entre una lista de páginas de referencia garantizadas como “Good Links” después de un análisis manual hecho por un humano.
Mediante un análisis de los vínculos entre webs, el algoritmo determina si las otras páginas son también “Good Links” o si al contrario son spam o “Bad Links“; se basan en que las páginas "buenas" no tienen enlaces con páginas con spam.




Resumiendo:

Proceso para detectar spam con Trust Rank:


1. Se examinan las web semilla, una a una, para detectar si hay spam.

2. Una persona revisa manualmente cada página para determinar las webs que usan y las que no usan spam.

3. Se rastrean los links de cada página para saber con qué otras webs se relacionan. De este modo, se considera que si una web se enlaza con una página 'buena' (confiable), ésta también lo será. Por el contrario, si una web se enlaza con una página 'mala' (web que usa spam), se considerará mala.
Aquí surge el concepto del neighbour (vecino): se da importancia a las relaciones que las páginas web mantienen con las demás páginas.

* Con TR se valora el nivel de spam de una página web.


■ Ventajas del TR:

Son personas las que se encargan manualmente de detectar spam y la calidad en una web, lo que hace pensar que el índice sea más justo.
Las páginas de calidad (buenas) posicionadas injustamente tendrán la oportunidad de convertirse en más fiables, y las que hacen spam recibirán penalización.


** TR mide la calidad de una página web. Es una medida de la confianza hacia una web; una fórmula para identificar webs que realizan SPAM.

* Los enlaces internos son esenciales para posicionar la página.

*Parece una constante que los enlaces con páginas de la misma temática otorguen más popularidad.

*El índice de fiabilidad (TR) de una web disminuye a medida que se asimila a las páginas calificadas como spam por los expertos.




2 comentarios:

LadyMarian

O sea, es algo así como el refrán "dime con quién andas y te diré quién eres". Es justo. Tranquiliza un poco el hecho de que se evalúe un poco con el sentido común humano y no sólo la simple máquina.

Y es lógico que en algún punto hay cosas que tienen que ser hechas manualmente. No pueden reemplazar por completo al ser humano...al menos por el momento... ;)

Muy interesante la entrada!

Besos

Lujo

@LadyMarian
Es posible...pero hay muchos más factores.
Abrazotes!

Publicar un comentario

(-^o^-) (^_-) (#^_^#) (ÖoÖ) (*^o^*) (>_<) ( ̄へ ̄)(;_・) (ô_Ó) (O_O) (ˇ~ˇ) (ToT)(Q____Q) ಠ_ಠ (。◕‿◕) [(--)]ZZzzz

- Si el comentario es anónimo hay muchas posibilidades que no se publique.

 


UP