Destapando a la Casa Real Española con SEO
¿Un título llamativo verdad? En este artículo no vamos a tratar de temas de posicionamiento web de forma directa. Pero si que vamos a hablar de un elemento que seguro que conoces bien, el archivo robots.txt. ¿El archivo robots.txt puede destapar a la Casa Real? ¿Cómo? Tiempo al tiempo querido lector, primero vamos a ver qué es el archivo Robots.txt. Según nuestra querida Wikipédia:
Un archivo robots.txt en un sitio web funcionará como una petición que especifica que determinados robots no hagan caso a archivos o directorios específicos en su búsqueda. Esto puede realizarse, por ejemplo, para dejar fuera de una preferencia los resultados de una búsqueda avanzada, o de la creencia que el contenido de los directorios seleccionados puede ser engañoso o inaplicable a la clasificación del sitio en su totalidad.
Es decir, este archivo permite que los robots no indexen o dejen de indexar algún contenido. En la gran mayoría de los casos con este archivo denegamos el acceso a información privada de nuestra web, parámetros de búsqueda, páginas que queramos que Google no muestre… Y en muchas ocasiones, escondemos cosas de nuestro pasado que nos avergüenzan, cosas que ya no queremos que la gente encuentro buscando. Pongamos un ejemplo de archivo robots.txt:
Este es el archivo Robots.txt de esta web. Ya lo sé, no esta nada optimizado… en casa del herrero… Este archivo es el que nos trae un WordPress por defecto. Como podemos ver, no permite el acceso a las partes privadas, propias del administrador, añadiendo Disallow:+ el nombre del directorio en este caso /wp-admin/ y /wp-includes/ . También incluye el sitemap para mejorar el rastreo de la web. Vale se acabo la charla “técnica” y aburrida. Como he dicho este archivo puede servir para saber cosas de gente que, a día de hoy, le avergüenzan. Y entonces la pregunta del millón es…
¿Qué le averguenza a la Casa Real?
Redobles de tambores y… Archivo Robots.txt de la Casa Real: http://www.casareal.es/robots.txt
¡Undangarin! Así es amigos lectores, como podemos observar en este archivo Robots.txt, han capado el acceso a los directorios donde se encontraba la información de Iñaki Undangarin. Como su ficha de producto (para los más técnicos). Pero si vamos a esa página (prohibida), copiando esta extensión en mi navegador…¿Podré ver el contenido? Pues la respuesta es negativa, el contenido ha sido eliminado… Demasiada vergüenza supongo, nose… Vaya…¿Pero no podemos ver sus vergüenzas más a fondo? Claro que sí, si nos ponemos a cotillear lo hacemos hasta el final. Gracias a una web, que seguro que también conoceis, archive.org también conocida como WayBackMachine. Introduciendo cualquier URL en esta web podemos retroceder al pasado y ver como era esta hace algún tiempo. Pues volvamos al pasado (concretamente a Octubre de 2012) de la Casa Real, introduciendo en archive.org la siguiente URL: http://www.casareal.es/ES/FamiliaReal/Urdangarin/ Esto es lo que podemos observar : ¡Tachán! Si esta es la imagen que mostraba la web por aquellos años… Dulces años olvidados que pueden volver a ser recordados gracias a este pequeño truco ;). Seguro que si esto lo lee Iñaki Urdangarin se pone contento…puede volver a ser un ítem de producto en el ecommerce más exclusivo del país: la web de la Casa Real. Después de la sátira y la ironia, me gustaría puntualizar que esto no es ningún robo de información ni nada por el estilo, esta información sigue viva en la red. Solo se necesitan las herramientas y la imaginación para llegar a ella. Si no lo creeis, poner en Google: site: >http://www.casareal.es/ES/FamiliaReal/Urdangarin/. Como veís la página en su infinita memoria caché. Para acabar me gustaría abrir debate sobre el derecho al olvido. Viendo este caso… ¿Es imposible desaparecer para Google? ¿ Se merece Iñaki Undangarin permanecer en el olvido? ¿Algún día, tanta facilidad al acceso a la información será nocivo? ¿Me llamarán por este artículo? ¡Coméntame algo! O segidme en mi Twitter para opinar o increpar a mi persona 😉 @soyjuandigital