Ordenadores y Portátiles
Meta tags
Meta tags

¿Qué son los meta tags?

Siguiendo con nuestro artículo sobre los buscadores de Internet, hablaremos de un elemento que los ayuda a indexar las páginas de una forma más fácil. Los meta tags permiten al administrador de una página Web especificar palabras clave, frases clave y conceptos que permitirán a la página ser indexada. Esto puede ser de gran ayuda, especialmente en casos donde el contenido de la página puede confundir por algún motivo al buscador. Los meta tags pueden guiar al buscador de Internet para elegir cuales de los posibles significados es el correcto y como debería indexar esta página exactamente. Sin embargo, hay casos donde el administrador de la página usa métodos poco escrupulosos añadiendo meta tags que se refieren a temas muy populares, peor que no tienen que ver con el contenido real de la página. Para protegerse de esto, los rastreadores hacer unas comparaciones de los metatags con el contenido de la página Web, y rechaza los que no tienen coincidencias con la temática de la Web. Todo esto asume que el dueño de una página quiere que sus páginas sean incluidas en los resultados de las actividades del buscador. Muchas veces, el administrador no quiere que ciertas páginas aparezcan en el buscador, o no quiere que los rastreadores accedan a unas páginas en particular. Hay casos donde se generan páginas automáticamente, como por ejemplo en un juego online, y no interesa que los rastreadores estén continuamente dando vueltas por estas páginas nuevas. Para evitar esta situación, se desarrolló el protocolo de robot de exclusión. Este protocolo, implementado en la sección al principio de la página, le dice al rastreador no hacer caso de esa página en particular - no indexar las palabras ni seguir los enlaces que contenga.

Los meta tags no son visibles en la página, y solo son interesantes para el rastreador, y por tanto para el buscador. Lo cierto es que los meta tag no son unas etiquetas requeridas en HTML cuando se está creando una página Web (algunas no las usan en absoluto, aunque no es corriente). ¿Qué aspecto tiene un meta tag? Lo primero que hay que comentar es que van incluidos en la parte superior de la página, justamente después de la etiqueta <TITLE>. Sigue la forma habitual de las etiquetas, como por ejemplo <META name="texto" content="texto">, aunque curiosamente no hace falta cerrar la etiqueta con algo como </META> como pasa en otras etiquetas. ¿Qué tipos de etiquetas entonces se pueden incluir? Lo cierto es que hay dos tipos principales que la mayoría suele utilizar, que son las siguientes:


<META content="Descripción de la página" name=description>   Dependiendo del buscador de Internet, se mostrará este texto con el título de la página en el index. El contenido puede ser una palabra, frase o corta descripción para hacer saber la temática de la página. Es mejor dejar esta etiqueta de un modo breve y conciso. Sin embargo hay que buscar la forma que perfectamente describa el contenido de la página.

<META content="Palabras y frases clave" name=keywords>   Esta sección del meta tag es para elegir las palabras y frases apropiadas y más relevantes (separadas por comas) que definirán de una forma exacta el contenido de la página. Hay programas de software dedicados a elegir las más buscadas a partir de una keyword que elijas. El propio buscador Google tiene un servicio de este tipo para su programa de Adwords. No hace falta decir que si tienes una Web de ordenadores, este apartado se tendrá que referir a este tema.

meta tags tutorial meta tags tutorial

Por supuesto, hay muchos más meta tags que se suelen incluir, como es por ejemplo el del idioma de la página <META http-equiv=Content-Language content="es"> que en este caso hace referencia al idioma español. Si tienes un archivo CSS que le está dando un formato a la página, puede incluir la siguiente etiqueta: <META http-equiv=Content-Style-Type content=text/css> y del mismo modo si vas a incluir javascript, podemos poner al principio de la página la siguiente etiqueta: <META http-equiv=Content-Script-Type content=text/javascript>. Hay innumerables meta tags para muchas cosas diferentes, y por eso solo hemos querido mostrar las más utilizadas y conocidas. Si quieres investigar los tipos que hay para aplicarlos en tu Web, hay buenos tutoriales donde dan con detalles lo que hacen y cuando aplicarlos. Una vez que los rastreadores han completado la tarea de encontrar la información en las páginas Web (y es algo que se está haciendo continuamente dada la naturaleza cambiante de los millones de sitios Web que existen), los buscadores de Internet deben almacenar la información de una manera que sea útil. Hay dos maneras que son clave a la hora de hacer que los datos recolectados sean accesibles a los usuarios. La información almacenada con los datos y el método en el cual la información es indexada.

En el caso más simple, el buscador puede simplemente almacenar la palabra y la URL donde lo ha encontrado. En la realidad, esto dejaría al buscador con un uso limitado ya que no habría manera de decir si la palabra en la página es importante o sin relevancia, si se ha utilizado muchas veces, o si la página contiene enlaces a otras páginas donde se contiene la palabra. En otras palabras, no habría manera de construir la lista de relevancia que intenta presentar las páginas más útiles en los primeros puestos de las búsquedas. Para hacer los resultados de las búsquedas más útiles a sus usuarios, la mayoría de buscadores almacenan mucho más que unas cuantas palabras y URLs. Puede contar el número de veces que la palabra aparece en la página. El buscador puede asigna una importancia a cada entrada, lo cual aumenta el valor asignado a dichas palabras según aparecen en la parte superior, en los título, subtítulos, enlaces o en el contenido. Por supuesto, cada buscador tiene un algoritmo para gestionar esto. Esta es una de las razones por lo que la búsqueda por la misma palabra en diferentes buscadores produce listas diferentes y posiciones distintas.

Independientemente de la combinación exacta de la información que se ha almacenado, los datos serán codificados para ahorrar espacio de almacenamiento. Esta forma de tener la información compactada, es muy útil teniendo en cuenta que los datos son muchos y van aumentando todos los días. La indexación tiene un único propósito: permite que la información sea encontrada de la forma más rápida posible. Hay varias maneras de construir un índice, pero una de las maneras más efectivas de construir una lista de este tipo, es con una tabla hash. ¿Qué es un hash? Es un código codificado que define una información concreta. Es este sistema, se aplica una fórmula para añadir un valor numérico a cada palabra. La fórmula está diseñada para distribuir las entradas por un número predeterminado de divisiones. Esta distribución numérica es diferente de la distribución de palabras por el alfabeto, y esa es la clave de la efectividad de una de estas tablas. Por ejemplo, en la mayoría de idiomas, hay letras que comienzan muchas palabras mientras que hay otras que empiezan solo unas pocas.

Si miras en un diccionario, verás que alguna secciones de letras son más gruesas que otras secciones con otras palabras. Esto significa que encontrar una palabra que empieza con una letra popular, puede llevar más tiempo más tiempo que encontrar una con una letra menos popular. Las hashes iguala esto, reduciendo el promedio de tiempo para encontrar un dato en estos casos. También separa el índice de la entrada actual. La tabla contiene la línea o código numérico con un puntero a los datos reales que puede ser  organizado y almacenado en la manera más eficiente posible. La combinación de un buen almacenamiento y efectividad hace posible tener resultados más rápidos, incluso cuando el usuario hace una búsqueda muy complicada.

¿Cómo se construye una búsqueda llegados a este punto? lo veremos en la siguiente parte del artículo, el cual puedes ver pulsando aquí.

Leer mas artículos relacionados