« Los blogs de Expansión.com | Inicio | Weblogs SL lanza el blog oficial de Serenity »

14/09/2005

Beta del buscador de blogs de Google

20050914bloogleMedia blogosfera habla ya de ello. Google lanzó su herramienta de búsqueda de  blogs: blogsearch.google.com. Lo cuenta, por ejemplo, Dirson:

«El sistema rastreará los blogs, basándose en su 'feed', con mucha mayor frecuencia que el robot de Google para las búsquedas estándares en web. Para aparecer dentro de este buscador, es necesario que tu blog disponga de un feed RSS o Atom, y que realices un 'ping' a algunos servicios como el de 'Weblogs.com'».

En Google Blog Search Help están respondidas las preguntas frecuentes sobre el servicio. Destaco:

  • ¿Indexan sólo blogs? En realidad indexan fuentes de sindicación.
  • Disponen de búsquedas avanzadas utilizando operadores tales como link:, site:, intitle:, inblogtitle:, inposttitle:, inpostauthor:, blogurl:. Por ejemplo, podemos buscar las entradas cuyo el título contenga la palabra 'typepad'.
  • Los resultados se ofrecen en formato RSS y Atom, por lo que podemos suscribirnos a los resultados.
  • Los resultados se pueden filtrar por idioma.
  • Los resultados se pueden ordenar por relevancia o por fecha.

Esta iniciativa supone una amenaza directa a servicios como Technorati, BlogPulse y Feedster. En especial, Technorati ya estaba en el ojo del huracán por los problemas de rendimiento y por la pérdida de calidad en los resultados, que tardaban en aparecer... si tienes la suerte de que te los muestre. Este nuevo motor, en cambio, se beneficia de la gran experiencia de Google en la indexación de contenidos (aunque, de momento, no es del todo instantáneo y parece que tarda varias horas en mostrar los resultados) y en la escalabilidad de las aplicaciones.

A favor de Technorati y otros motores de feeds, está que ofrecen muchas características que no se encuentran (¿de momento?) en el buscador de Google. Technorati dispone de agregación por etiquetas (tags) y APIs para búsquedas. Google quizás se demore poco con el API, pero me intriga los planes del casi todopoderoso Google con respecto a las folksonomías.

Con tanto bot de rastreo suelto, ¿cuántos visitantes tenemos de verdad? ;) A día de hoy, los robotitos y los agregadores fagocitan un buen porcentaje de nuestro ancho de banda, especialmente si no están programados correctamente. Para servicios de blogs como TypePad, que un robot escanee permanentemente miles de fuentes (aún siendo solo la cabecera para ver si ha cambiado la fecha) supone un problema. En sistemas de blogs hechos con páginas dinámicas sin cachés y sin soporte de la cabecera de fecha de última modificación, no solo supone un consumo de ancho de banda, sino de CPU. ¿Se puede remediar? En Six Apart desarrollamos un protocolo denominado AtomStream:

«AtomStream is an endless flow of Atom posts, presenting the updates to LiveJournal and TypePad free for consumption by any tool or application which wants to consume them. There's even client libraries availablewhich our Tatsuhiko Miyagawa developed  to support easy consumption of the stream. As Ben Trott outlined in his earlier post, and Brad Fitzpatrick indicated when launching the service, we think it's important to make all of the public posts from our services available in a consistent way so that valuable services like search can be built on top of them».

Larga vida a la web semántica.

TrackBack

URL del Trackback para esta entrada:
http://www.typepad.com/services/trackback/6a00d8345369a369e200d8342386c353ef

Listados abajo están los enlaces de los blogs que referencian Beta del buscador de blogs de Google:

» Google Blog Search de Las penas del Agente Smith
Acabo de leerlo en Boing Boing: Google launching blog-search service in a couple hours: Boing Boing band manager John Battelle has broken the news that Google is launching a blog-search service. The URL, when it goes live, will apparen... [Leer más]

» blogsearch.google de Patricio
Nueva herramienta y mal día para algunas nuevas .com [Leer más]

Comentarios

Eventos

  • [Maratón Podcastblog]

Acerca de

Twitter / vrruiz

Flickr

  • www.flickr.com