El problema de AJAX para los rastreadores web
A continuación presentamos un texto de Katharina Probst (Ingeniero de Google) y Bruce Johnson (Gerente de Ingeniería, Google)
El problema de AJAX para los rastreadores web
- JavaScript produce contenido dinámico que no se ve por los rastreadores
- Ejemplo: Un Google Web Toolkit aplicación que tiene este aspecto a un usuario …
… Pero un rastreador web sólo ve esto:
<script src=’showcase.js’> </ script>
¿Por qué este problema deben ser resueltos?
- Web 2.0: Más contenido en la web se crea de forma dinámica (+ 69%)
- Con el tiempo, esto perjudica a la búsqueda
- Los desarrolladores no se animan a la creación de aplicaciones dinámicas
- No resolver Crawlability AJAX frena el progreso en la web!
Un rastreador de vista de la web – con y sin AJAX
Objetivo: crawl y AJAX índice
- Rastrear e indexar AJAX es necesario para los usuarios y desarrolladores
- Problema: ¿Qué estados de AJAX se pueden indexar?
- Explícito opt-in que necesita el servidor web
- Problema: No quiero manto
- Los usuarios y los rastreadores de motores de búsqueda que ver el mismo contenido
- Problema: ¿Cómo puede el trabajo de logística?
- Ese es el resto de la presentación
- Ese es el resto de la presentación
Descripción del enfoque propuesto – tiempo de rastreo
- “Bastante” URL : www.example.com/page?query # mystate!
- “Feo” URL: www.example.com/page?query&_escaped_fragment_=mystate
Descripción del enfoque propuesto – el tiempo de búsqueda
Acuerdo entre los participantes
- Servidores Web se comprometen a
- optar por indicar los estados indexable
- ejecutar Javascript para URLs feo (no agente de usuario oler!)
- No capa por dar siempre el mismo contenido en el navegador y el rastreador, independientemente de la solicitud (o la eliminación de riesgos, como antes)
- Los motores de búsqueda de acuerdo con
- modificar las URLs muy feo para las direcciones URL
- descubrir las direcciones URL como antes (Sitemaps, hipervínculos)
- Índice
- mostrar direcciones URL muy
Resumen: La vida de una URL
http://example.com/stocks.html # GOOG
fácilmente podría ser cambiado a
http://example.com/stocks.html #!GOOG
que puede ser rastreado como
http://example.com/stocks.html?_escaped_fragment_=GOOG
pero se mostrará en los resultados de búsqueda como
http://example.com/stocks.html #! GOOG