Google adopta un nuevo sistema de indexación de páginas web: Caffeine

Escrito por Antonio
Actualidad
1

Google no se conforma con ser el rey absoluto entre los buscadores. Por ello, el gigante de Mountain View no se queda atrás y sigue innovando en aras de mejorar el buscador de Google, su primer y principal servicio online. Con Caffeine, el nuevo sistema de indexación de Google, ofrece unos resultados un 50% más recientes en las búsquedas web que con el sistema anterior. Conoce más detalles a continuación.

El anterior índice de Google tenía varias capas, algunas de las cuales se refrescaban más frecuentemente que otras. Por ejemplo, la capa principal se actualizaba cada dos semanas. Para refrescar una capa del índice anterior, se analizaba la página web entera, lo cual significaba que había un retraso significativo entre el momento en el que se encontraba una página y el momento en el que Google la hacía disponible para todo el mundo.

Con Caffeine, el nuevo sistema de indexación, se analiza la web en pequeñas porciones y se actualiza el índice de búsqueda continuamente, de manera global. A medida que Google encuentra nuevas páginas o información nueva en páginas existentes, se pueden añadir directamente al índice. Ésto significa que podremos buscar información más reciente que antes.

Con esta mejora, Caffeine permite a Google indexar páginas web a una escala mucho mayor. De hecho, Caffeine procesa cientos de miles de páginas en paralelo por segundo, de forma que Caffeine ocupa unos 100 millones de gigabytes de almacenamiento en una base de datos y añade información nueva por una cantidad de cientos de miles de gigabytes por cada día.

¿Qué os parecen las mejoras introducidas en el sistema de indexación de Google? ¿Notáis que los resultados de búsqueda están más actualizados que antes?

Vía | Google Blog

Compártelo. ¡Gracias!
Continúa leyendo

Comentarios

1 comentario
  1. programa de facturacion 10 Jun, 10 18:15

    esperemos que incremente y mejore la indización y en pro cada vez más del uso del lenguaje natural en las búsquedas/resultados en los buscadores

    0