lunes, 3 de noviembre de 2008

¿Cómo son Rankeadas las Paginas Web por Los Motores de Búsqueda?

Chinita Guapa con LapiceroHaga una búsqueda en su motor favorito y casi instantáneamente se dará cuenta que el motor de búsqueda lista millones de sitios web que tienen alguna relación con la palabra clave empleada.
Las paginas listadas están rankeadas en donde las que presentan una mayor relevancia tienen prelación frente a las demás. En muchas ocasiones los motores de búsqueda se equivocan mostrando paginas que no tienen ninguna relación con el tema buscado y a veces es necesario explorar con mas detalle para encontrar la información deseada. Sin embargo hay que reconocer la ayuda tan valiosa que es un motor de búsqueda.
A diferencia de un bibliotecario un motor de búsqueda no tiene la habilidad de hacer preguntas para enfocarse en un tema. Ellos tampoco pueden confiar en el juicio y en experiencia pasadas para rankear paginas, en la manera como los seres humanos lo podemos hacer. Agentes inteligentes se están moviendo en esta dirección, pero quedan años de trabajo por seguir.
Entonces, ¿cómo hace un motor de búsqueda para determinar la relevancia de las paginas? Estos siguen un grupo de reglas cuya principal información es la ubicación y la frecuencia de las palabras claves, llamado comúnmente el método de ubicación y frecuencia.
Si comparamos Internet a una gigantesca biblioteca, donde cada libro representa un servidor, no habría manera de colocar los libros en las estanterías de forma que respondiesen a un orden lógico según su contenido. Tampoco habría una forma estándar de ordenar las páginas dentro de cada libro.
Puesto que un servidor puede contener páginas de diferentes temas, y que dentro de un tema las páginas están agrupadas de distinta forma. Si tomamos una página cualquiera de Internet pueden darse diferentes situaciones, desde que sea una página aislada, que esté relacionada con una anterior y una siguiente, o que esté relacionada con millones de páginas.
Así como cuando se cataloga un libro existe una clasificación de materias aceptada universalmente dentro de la cual se puede ubicar un libro según su tema, en Internet no existe esto. Lo más parecido son las categorías del proyecto DMOZ, y de algunos buscadores Google, Yahoo, Altavista, etc, pero incluir una página en estos buscadores es algo voluntario por lo que no todas las páginas de Internet están incluidas en ellos.
Las páginas de Internet no están escritas en forma de texto normal sino en lenguaje HTML. Este lenguaje consta de texto y de código, el código dice en que forma se presentará el texto, de que tamaño, color, posición, etc.
Otro factor a tener en cuenta es que las páginas son dinámicas, es decir, pueden modificarse, crearse y destruirse sin previo aviso. Además, están en diferentes idiomas.
Y para acabarlo de poner difícil la naturaleza del contenido de las páginas es muy variada, pueden contener texto, gráficos, imágenes, sonido, vídeo, programas, etc.
Dado este aparente caos, es fácil suponer que pronto surgieran herramientas que intentasen poner un poco de orden y facilitar la localización de la información. También es fácil deducir que estas herramientas se hayan convertido en algo imprescindible.
Informacion Adicional...


Pareja

Otros Artículos de Interés

No hay comentarios: