19/05/2009

Wolfram Alpha, Post Scriptum

Resumen

  • Las expectativas están jugando en contra de Wolfram Alpha en este lanzamiento.
  • Stephen Wolfram desea controlar qué datos.

Wolfram Alpha - I'm afraid I cannot do that

Expectativas

Ayer se lanzó oficialmente Wolfram Alpha, después del fin de semana de pruebas en abierto. Durante estos días he intercambiado impresiones sobre el invento. Salvo el caso de mi hermano, en general la recepción de mis conocidos ha sido más tibia que la mía. Sospecho que en parte es por que hasta el jueves no había prestado mucha atención a los artículos sobre Alpha, y ya comentaba en la entrada anterior que el buzz podría jugar en su contra. Algunos titulares aparecidos estas horas: Un google para encontrar la respuesta exacta (Público), eWolfram Alpha, el buscador que te entiende (eWeek), wolframalpha, ¿el verdugo de Google? (Abc.es). Este artículo escrito por Paula Gil para EFE resume bien la situación, Llega a la red Wolfram Alpha, apodado el "asesino potencial" de Google:

«Fruto de varios años de trabajo del matemático Stephen Wolfram y su equipo, Wolfram Alpha quiere llevar las búsquedas de Internet a un nuevo plano y, más que proporcionar listas de resultados, intenta entender lo que el usuario está preguntando. [...] Los críticos se han deshecho en elogios sobre Wolfram Alpha, especialmente por su capacidad de entender lo que el usuario está preguntando. [...] El término "Barack Obama" nos ofrece el lugar y fecha de nacimiento del presidente de EE.UU., pero nada más».

Desconozco de quién ha sido el error, pero haber posicionado a Wolfram Alpha como un compeditor de Google está frustando a los nuevos usuarios. Sospecho que un buen porcentaje de las consultas son del tipo que se hacen habitualmente en Google, buscando una comparación directa, y los usuarios esperan obtener resultados similares (como en el caso de la periodista, que busca "Barack Obama" y "Agencia Efe Noticias"). Y claro, la decepción es enorme: ¿cómo puede ser que Google devuelva 2 millones de resultados y este cacharro ninguno? Pues porque Alpha no es un buscador, y tampoco es omnipotente.

El segundo error de márketing, y éste no es culpa de la prensa, ha sido vender Alpha como un intérprete inteligente. Tras probar con varias consultas, está claro que Alpha tiene muchas limitaciones para entender el lenguaje natural. Prueba de ello es que hay preguntas que Alpha es capaz de responder, pero solo si se realizan con la sintaxis adecuada.

El screencast del que hablaba en la entrada anterior y los vídeos donde Stephen Wolfram mostraba la herramienta daban a entender que el nuevo servicio era capaz de contestar casi a cualquier pregunta, y que por tanto disponía de una cantidad ilimitada de información. Esto ya lo sospechábamos: Mathematica y sus conjuntos de datos eran la base del producto, a los que se les ha añadido un interfaz web. Alguien hablaba de que Alpha fuera vaporware. En mi opinión, la heramienta es sencillamente impresionante, pero hay que aprender a usarla. En lugar de utilizar a ciegas la casilla de búsqueda, lo mejor que podemos hacer es navegar por el índice de ejemplos, que más que ejemplos son tutoriales de uso. Los ejemplos nos indican los dominios de conocimiento de Alpha, sus límites y la sintaxis más adecuada para realizar consultas.

En definitiva. En algún punto, la campaña promocional se les fue de las manos, y esto va a jugar en su contra, al menos hasta que se disipe la polvareda del lanzamiento.

Los talones de Aquiles de Wolfram Alpha

Me reitero un poco, pero sigo opinando que Wolfram Alpha es un regalo para la web semántica. El problema es que poner datos semánticos en Internet no es fácil ni sencillo, razón por la cual su adopción ha sido tan limitada. Alpha ha creado la necesidad de acceder a grandes cantidades de datos, especialmente numéricos, para así analizarlos de una forma sencilla. A pesar de que disponen ya de una gran cantidad, no podemos esperar a que tengan acceso a todos los datos imaginables de cualquier parte del mundo. Al menos, no de momento. Google es capaz de sentarse casi con cualquier ministro del mundo para solicitar la exportación de datos en tal o cual formato; Wolfram, no. Ayer mismo lanzaron la Comunidad Wolfram Alpha, para obtener retroalimentación (un clon de meneame, Pligg): se insiste en saber qué hacer para integrar datos externos.  O bien crecen a un ritmo endiablado para llegar donde no llegan, o bien abren su plataforma.

Y aquí llegamos al quid de la cuestión. Stephen Wolfram ha reiterado, una y otra vez, que los datos de Wolfram Alpha son y serán revisados por sus especialistas, no cree en que cualquier persona esté toqueteando los datos o los algoritmos. Esto es una importante limitación para el desarrollo de la plataforma, y en mi opinión podría resultar una decisión mortal. La semana pasada, Stephen Wolfram realizó una presentación de Wolfram Alpha en la Universidad de Harvard. En el turno de preguntas durante la presentación en Harvard le pidieron su opinión sobre la posible aparición de un competidor libre: su respuesta fue que este era un sistema muy complejo, que la Wikipedia es útil pero más bien enfocada a qué cosas son populares, que Alpha ya es gratuito, que están bien preparados tecnológicamente para aceptar gran cantidad de datos, que si se ven desbordados por las peticiones para mostrar datos, ya verán...

En definitiva, Stephen Wolfram ignora la lección las enciclopedias. A pesar de todos los esfuerzos, la Enciclopedia Britannica no ha podido competir cantidad, calidad y rapidez con la Wikipedia. Un proyecto de software libre que compita con Wolfram Alpha y sea más permisivo a la hora de aceptar colaboraciones lo relegaría rápidamente. La pasión de Wolfram son los números, pero no todos los internautas comparten esa pasión. Tiene razón en que la Wikipedia adolece de irregular calidad en muchos artículos, pero ninguna empresa es capaz de producir tal cantidad de conocimiento en tantos dominios diferentes. Y eso sin tener en cuenta el crítico asunto de la fiabilidad, tanto de las fuentes de datos como de los algoritmos. Veo casi imposible que Wolfram llegue a liberar el código fuente de Wolfram Alpha, que vendría a ser casi lo mismo que publicar el de Mathematica. (Llegado el momento lo más sencillo sería aceptar fuentes de datos no revisadas, pero podría ser demasiado tarde).

Así que Google tiene ahí una oportunidad para desquitarse. Google sabe pensar a lo grande: en red. Quizás le dé un par de vueltas a la idea para que otras personas podamos hacer nuestros propios Alphas y usar los datos que más nos apetezcan.

Sea como sea, estoy convencido de que las propuestas de Wolfram Alpha sobrevevirán a sus creadores.

Más información

15/05/2009

Wolfram Alpha: Algo completamente diferente

Resumen

  • Wolfram Alpha no es un buscador, ni es una enciclopedia
  • Es un web que mezcla conceptos de bases de datos y análisis computacionales

Cada ciertos años uno ve una nueva aplicación que no se parece en nada a lo que habías visto antes, aunque solo sea en aparencia, y sabes que habrá un antes y un después. Ocurrió con Internet, con los navegadores, con Google... Pues bien, como decían los Monty Python, And now for something completely different: Wolfram Alpha. Como todavía no está en línea, es imprescindible ver esta presentación:

¿Lo has visto? ¿Te has quedado tan boquiabierto como yo? En los últimos meses se habían publicado algunas noticias sobre este buscador: en general los medios lo situaban como un competidor de Google. Sin embargo, si has visto la demostración, está claro que Wolfram Alpha no es Google, ni lo pretende ser.

A continuación comento algunas cosas que me parecen destacables.

Alpha es Mathematica

Para entender el origen de esta herramienta quizás es bueno recordar que es un proyecto de Stephen Wolfram, creador de Mathematica y autor del controvertido libro A New Kind of Science. Mathematica es una herramienta de análisis computacional, bastante popular entre ingenieros y científicos. Entre otras muchas cosas, este programa ofrece una serie de datos para utilizar: astronómicos, químicos, geopolíticos, financieros, matemáticos, de idiomas, biomédicos, climatológicos... Son, justamente, los tipos de datos que aparecen en la presentación. Por ejemplo, si echamos un vistazo a la página de Mathematica sobre esos datos geopolíticos vemos que podemos obtener una gráfica del PIB de Francia entre 1970 y 2005. Para ello hay que llamar a varias funciones, con una serie de parámetros:

20090514wolfram-mathematica  


En la presentación de Wolfram Alpha obtienen datos parecidos:

20090514wolfram-alpha-gdp


Como vemos Alpha muestra los mismos datos sobre Francia. La diferencia con Mathematica es que es un sitio web, no un software de escritorio. Y la forma de obtener los datos mezcla las búsquedas por palabras clave y el lenguaje natural -o algo que se le acerca: gdp france, what is the gdp of france. A primera vista impresiona el procesamiento de lenguaje natural, pero gdp france es mucho más corto que what is the gdp of france. ¿La lección? El uso de consultas con cierta estructura evita ambigüedades y ahorra tiempo.

((Alpha vs Google) vs Wikipedia)

¿Todavía hay alguien que piensa que el buscador de Google tiene algo que ver con Wolfram Alpha? Si es así, aquí van algunos argumentos. Hay ciertas similitudes entre Alpha y Google.

  • La página principal de Alpha, con su caja de búsqueda, es un gran homenaje a Google.
  • En Google y Alpha se introducen una serie de palabras y se obtienen unos resultados ;-P
  • Alpha es también un proyecto novedoso y ambicioso, al estilo de Google (uno hubiera esperado que un invento como este saliera de sus laboratorios).
  • Google y Alpha miman mucho la presentación de los datos, intentando ser minimalistas, claros y funcionales.

Pero a partir de ahí, las diferencias son grandes.

  • Google rastrea e indexa documentos que están en Internet, documentos principalmente en HTML, sin estructura.
  • Alpha controla cuáles son las fuentes de datos que utiliza, y son datos con estructura: series temporales de datos, fórmulas matemáticas, símbolos químicos, etc.
  • Alpha intenta realizar una interpretación de las consultas. En el buscador de Google, por lo general, se usan las palabras clave para consultar los índices (aunque también usan algo de procesamiento de lenguajes naturales).
  • Para cada tipo de búsqueda, Alpha presenta diferentes tipos de datos.

Sí es cierto que Google anda trabajando en cuestiones paralelas a Alpha. Google es capaz de realizar sencillas operaciones matemáticas en sus consultas. En 2007 adquirió Gapminder, un visualizador de estadísticas sobre los países. Más recientemente han estado trabajando en la publicación de datos públicos.

Algunos comparan Alpha con la Wikipedia. Tampoco creo que sea acertada esa comparación. La Wikipedia no realiza cálculos, y no almacena series de datos. Sí es un sitio donde se compila el conocimiento, pero en general no es información computable. Sí que han habido esfuerzos para extraer contenido semántico de la Wikipedia y utilizar el lenguaje natural para realizar las consultas. Es el caso de Powerset, adquirida por Microsoft.

Las claves de Alpha

Según Stephen Wolfram, los pilares de Alpha son cuatro:

  • Conservación de los datos. La información está obtenida por lugares públicos y privavdos, y validados por expertos.
  • Algoritmos. Entre 5 y 6 millones de líneas de código de Mathematica con modelos, ecuaciones y métodos.
  • Lenguaje. Las preguntas en lenguaje natural se interpretan simbólicamente para su procesamiento.
  • Representación automática. Los resultados se presentan de forma útil para la gente.

Según Wolfram, en el desarrollo de Alpha han participado 100 personas. El día del lanzamiento, han querido ser capaces de responder a 175 millones de consultas diarias, y para ello han puesto en marcha dos supercomputadores, con 10 mil núcleos y cientos de terabytes.

Sobre el procesamiento de lenguaje natural. En la presentación han seleccionado ejemplos resultones, así que habrá que ver cuáles son las limitaciones cuando Alpha esté abierto al público. Por ejemplo, en las demostraciones ha sido incapaz de responder a preguntas de los periodistas, tales como "teenage pregnancy USA", "what type of sunglasses was Justin Timberlake wearing at the Oscars" y otras relacionadas con los deportes.

Si nos guiamos por el tipo de consultas realizadas en la presentación, no parece que Wolfram Alpha se dirija a un público general. La herramienta está pensada para analizar datos. A pesar de ello, y gracias a su interfaz simple y al procesamiento de lenguaje natural, conseguirán atraer a personas con un perfil mucho menos avanzado que el de Mathematica.

Alpha y la web semántica

Stephen Wolfram ha afirmado que la plataforma se abrirá a contribuciones de terceros. A mi me parece que esta herramienta, de tan fácil uso, es un gran argumento para que los gobiernos y los organismos internacionales liberen de una vez sus datos. Por no repetir el análisis, que bien lo hace Pablo Moreno, está claro que Wolfram Alpha y la web semántica pueden beneficiarse muntuamente:

«Uno de los problemas de Wolfram Alpha, es que sus bases de datos son limitadas (ahora mismo tan solo 10TB). Puede ser bueno en lo que hace, pero mantener y aumentar una base de datos así, siendo una empresa relativamente pequeña, puede ser muy complicado. Sin embargo, es posible que Wolfram se acabe beneficiando de la Linked Data (más explicaciones aquí). Si Tim Berners-Lee tiene éxito promoviendo la apertura de bases de datos, posiblemente no sería muy complicado para Wolfram acceder directamente a las mismas, y convertirse en un magnífico front-end de la linked data, con todo el poder de procesado abstracto y gráfico que tiene Mathematica».

Puedo pecar de optimista, pero Wolfram Alpha puede ser el regalo más grande que le hayan podido hacer a Tim Berners Lee y su web semántica: hay ya un buen referente para la experiencia de usuario.

Alpha, Beta, Gamma...

Algunas personas que han probado la beta se han desilusionado con la falta de respuestas y acusan al producto de estar por y para personas técnicas. Independientemente de lo que ocurra tras la apertura de Wolfram Alpha, creo que la propuesta que han realizado es tan atractiva que, a pesar de que no se cumplan las promesas, otros continuarán el camino. Más pronto que tarde aparecerán servicios web inspirados en las características de Alpha: contenidos estructurados, buscadores se, etc. .

Y por si los amigos de Google no lo habían dejado claro, el futuro es de los nerds ;)

Referencias

PD - 16 may: Bueno, pues ya está abierto. Después de jugar un poco con Wolfram Alpha, creo que lo descrito en el artículo permanece aplicable. En Barrapunto, faragon realiza algunas búsquedas y  reflexiones.

PD - 19 may: Wolfram Alpha, Post Scriptum. Algunas reflexiones tras el lanzamiento.

20/04/2009

El sol se pone por Oracle

200px-Oracle_logo.svg La noticia tecnológica del día es que Oracle ha comprado Sun Microsystems. Después del fallido intento de compra por parte de IBM, Sun ha terminado en manos de Oracle. La noticia tiene mucho interés en varios frentes.

205px-Sun_Microsystems_logo.svgOracle es una empresa principalmente dedicada a la venta de grandes sistemas de bases de datos. Sus principales productos son bases de datos (Oracle Database, Berkeley DB), herramientas de gestión de base de datos, software de desarrollo (JDeveloper), software de colaboración y aplicaciones empresariales (ERPs). Gran parte de sus herramientas tienen mucha relación con Java, y mantienen su propia implementación de Java. Una de las últimas grandes adquisiciones de Oracle fue BEA Systems, empresa fundada por ex-empleados de Sun, también especializada en Java. En los últimos años, Oracle ha apostado por Linux como sistema operativo básico de sus productos, aunque en el pasado utilizaban Solaris. Resultado de esta apuesta, Oracle ha contribuido con importantes mejoras al núcleo de Linux.

Por su parte, Sun Microsystems tiene una larga tradición como empresa de hardware y software. Su sistema operativo Solaris es descendiente del Unix BSD. Sus servidores y estaciones de trabajo han estado basados en una arquitectura propia, Sparc. En los años 90 Sun creó Java, uno de los lenguajes más populares, y cuyos dominios se extienden desde el juegos y aplicaciones para móviles hasta grandes aplicaciones empresariales. En la presente década, Sun ha apostado decididamente por el software libre. Adquirieron y liberaron el código fuente de OpenOffice, liberaron Java (OpenJDK), su plataforma de procesadores (OpenSparc), el sistema operativo (OpenSolaris), herramientas de programación (Netbeans). Recientemente compraron la empresa responsable de la popular base de datos MySQL y la empresa desarrolladora del software de virtualización VirtualBox.

Oracle probablemente estaba muy interesada en controlar Java y hacerse con MySQL, pero el resto del paquete de Sun hay muchas dudas.

  • Java es una tecnología imprescindible para Oracle, quien además se sitúa en una posición ventajosa con respecto a IBM. En este terreno, la duda es qué ocurrirá con la máquina virtual de Java que posee Oracle, JRockit.
  • En el campo de las bases de datos, Oracle intentó adquirir MySQL AB, y no lo consiguió. Terminó comprando InnoDB, una extensión clave de MySQL realizada por una tercera empresa. MySQL, a pesar de ser un producto libre, es muy utilizado y complementa a Oracle Database. En los últimos meses, Sun había sido muy criticada por la gestión del desarrollo de MySQL. Parece bastante claro que MySQL recibirá un trato privilegiado en manos de Oracle.
  • En cuanto al sistema operativo, Oracle utiliza una versión modificada del Linux de RedHat. Sin embargo, en el pasado Oracle utilizaba Solaris, un Unix que está mejor preparado que Linux para grandes entornos corporativos (ZFS, dtrace, etc). Oracle podría optar por continuar dando soporte a Linux, pero volver a priorizar a Solaris.
  • Oracle había entrado en la Junta de Asesores de Xen, software de virtualización que compite con VirtualBox. Ahora VirtualBox está en manos directas de Oracle, así que es bastante probable que continúe con su desarrollo.
  • Netbeans es el entorno de desarrollo de Sun. Oracle tenía una versión de Eclipse (competidor de creado por IBM) llamada JDeveloper.
  • Oracle no es una empresa de hardware. Ahora tiene en sus manos la arquitectura Sparc. ¿Qué hacer? ¿Continuar su desarrollo o venderla? Actualmente, Oracle tiene una alianza bastante fructífera con Hewlett Packard para los servidores.

Los productos de Sun pueden beneficiarse mucho del músculo comercial de Oracle. Entre otras cosas, Oracle podría dedicar más recursos a disposición de Java y OpenOffice, lo cual serían malas noticias para Microsoft. Pero quizás las noticias son peores para IBM, quien también ha apostado por Java y mantiene una pugna en casi todos los segmentos en los que compite Oracle, y ahora también en el de servidores de gama alta.

Pero desde una perspectiva más amplia la cuestión es otra. Sun es una empresa que en los últimos años se había lanzado al mundo del software libre. Oracle, en cambio, es una compañía que vende software cerrado, con algunas aportaciones importantes (pero anecdóticas en el contexto de la empresa) a Linux. Las diferencias culturales son grandes y la venta de Sun podría llegar a entenderse como un cierto fracaso de esta política liberalizadora. No parece que estemos en una adquisición similar a la que Disney realizó con Pixar, en la que Steve Jobs además de mucho dinero cambió el rumbo creativo de la compañía.

Habrá que esperar para ver qué es lo que decide hacer Oracle en cuanto al software libre.

08/04/2009

Capaware: Información geográfica libre

Ulpgc-capaware El Gobierno de Canarias, el Instituto Tecnológico de Canarias y la Universidad de Las Palmas de Gran Canaria han liberado Capaware. Se trata de una aplicación con licencia GPL, realizada en C++ y wxWidgets que viene a competir en el terreno de Google Earth. En Tunel Carpiano han entrevistado al coordinador del proyecto, Capaware! liberado:

«El pasado 27 de marzo se liberó Capaware!, la primera aplicación de la que tengo noticia que ha sido liberada como Open Source por el Gobierno de Canarias. Así que contacté con Agustín Trujillo Pino (Coordinador de proyecto del departamento de Informática y Sistemas de la Universidad de Las Palmas de Gran Canaria), para hacerle unas preguntas y obtener unas respuestas de primera mano sobre este framework».


De momento solo hay binarios para Windows, y el código fuente solo está preparado para compilarse con Visual Studio. Pero al ser GPL seguro que alguien se anima a modificarlo para que esté disponible en otras plataformas como Linux y Mac. Además del archiconocido Google Earth, en el mundo del software libre hay otras aplicaciones de información geográfica como NASA World Wind (C# y Java), Marble (C++/Qt4) y desde Valencia, el veterano gvSIG (Java).

¡Felicidades a todos los involucrados! Son unas noticias excelentes. La comunidad de software libre de las islas hace muchos años que luchamos porque universidades y administraciones públicas apuesten por él para favorecer el desarrollo tecnológico. Si además del software se va liberando en licencias libres los datos del Gobierno de Canarias, como está preparando la Administración de Obama con Data.gov, se estará abonando el ecosistema de las islas para crear muchas otras aplicaciones innovadoras.

20/03/2009

Crisis editorial y cola larga

En Público, Paula Corrot escribe un artículo titulado La burbuja editorial ya no aguanta más. Viene a decir que en 2008 se publicaron más libros (un 19% más), pero las librerías devolvieron bastantes más (el 30%).

«Algunas librerías comienzan a dar la voz de alarma: "Ya no podemos absorber 50 novedades a la semana", admite Aldo García, de la librería Antonio Machado de Madrid. Como apostilla el editor Pote Huerta, de Lengua de Trapo, "hay voces que dicen que el sector del libro está bien, pero no es así. Estas cifras indican que hay una hiperinflación del libro y esto está produciendo una pérdida de bastante dinero en las librerías". [...] "Los servicios de novedades de las editoriales, para intentar vender más, han pasado de enviar 10 a enviar 20 libros a las librerías, pero no se dan cuenta que, por mucho que se empeñen, sólo se venden 10". El resto se devuelve y eso ya supone un gasto para la librería, la distribuidora y la editorial».

¿Cómo interpretar estas cifras, a la luz de Internet? Quizás recuerden The Long Tail. Es la teoría de que Internet permite vender una cantidad enorme de productos, porque no existen problemas para publicar un catálogo innumerable de productos: los super-éxitos siguen siendo super-éxitos, pero los productos pocos conocidos también encuentran un pequeño mercado (que en conjunto suman un buen volumen de ventas). Chris Anderson, en su artículo sobre La Cola Larga decía: «Más de la mitad de las ventas de libros en Amazon provienen de aquellos libros que no están en el grupo de los 130.000 más vendidos».

Lo debatía esta semana con pjorge: hoy en día ir a una librería sin una conexión a Internet es casi perder el tiempo. La ayuda que pueden ofrecer los libreros es cada vez más limitada, no pueden saber todo sobre todo. Si queremos saber cuál es el mejor libro sobre Roma, la mejor opción es sin duda bucear por la Red y leer reseñas, echar un vistazo al índice, a las primeras páginas, incluso preguntar en un foro de historiadores, hasta encontrar el libro adecuado. ¿Cómo puede competir con eso una librería? (Desde luego, reconvirtiéndose y ofreciendo otros servicios, que es lo que están haciendo las librerías dedicadas a juegos de mesa y de rol). The Economist publicó días atrás un interesante artículo sobre el impacto de las reseñas de libros y otros productos en la Red, Fair comment:

«Visitors are more reluctant to buy until a product attracts a reasonable number of reviews and picks up momentum. [...] Yet even when a product has attracted hundreds or even thousands of reviews, they keep coming in».

Entonces, ¿es cierto que la burbuja editorial ya no aguanta más? Desde el punto de vista de los libreros, que tienen una cantidad limitada de estanterías esa afirmación puede tener sentido. Pero si la teoría de la Cola Larga es cierta, la estrategia de las editoriales de publicar más novedades que nunca tiene sentido si están pensando en un mercado dominado por las ventas a través de Internet. Y no no sé si es el caso, porque en España no contamos con una tienda electrónica comparable a Amazon.com -y con el advenimiento de los libros electrónicos, es algo que puede pasar factura.

Me quedo con la duda de qué está ocurriendo realmente en el mercado editorial. Según Público: «En el otro lado de la balanza, están las ventas que, según Antonio María Ávila, de la Federación de Gremios de Editores de España, en 2008 bajaron un 2%». Pero en enero, se descorchaba el champán cuando se anunció que 2008 fue récord de ventas de libros, con un crecimiento del 30% según datos de Nielsen. ¿Más libros pero menos beneficios? No parece en todo caso que pueda hablarse de burbuja editorial o crisis, con un crecimiento del 30% o un descenso de un 2%. Que el modelo de distribución actual de libros quizás no es eficiente para las librerías, es otro cantar, pero muy a su pesar, la publicación de muchas novedades es solo uno de los problemas que van a tener que afrontar, y probablemente no el más serio.

PD: A todas estas, la revista de Carrefour anuncia la venta del Papyre, el libro electrónico de firmware español. ¿Malos tiempos para los negocios impresos?

13/03/2009

Feliz cumpleaños, WWW

  • El World Wide Web cumple dos décadas entre nosotros.
  • La aparición de los navegadores web impulsó la popularidad de Internet.
  • La sencillez de los protocolos han promovido su adopción y expansión.

De la Wikipedia:

«En marzo de 1989, Tim Berners Lee, ya como personal de la divisón DD del CERN, redacta la propuesta, que referenciaba a ENQUIRE y describía un sistema de gestión de información más elaborado. No hubo un bautizo oficial o un acuñamiento del término web en esas referencias iniciales utilizándose para tal efecto el término mesh. Sin embargo, el World Wide Web ya había nacido. Con la ayuda de Robert Cailliau, se publicó una propuesta más formal para la world wide web el 12 de noviembre de 1990».

Nuestra vida actual sería muy diferente sin el web. Mi primera página web probablemente fue mi página personal, en la ULPGC. La segunda y la tercera fueron páginas de asociaciones astronómicas, que casi 15 años después todavía siguen vivas. En aquellos días, crear una página web se hacía a golpe de vi o emacs, en una terminal UNIX de fósforo naranja (o en una terminal gráfica HP-UX si tenías la suerte de encontrarla libre). Hoy en día se puede enviar un correo electrónico para actualizar un weblog desde un telefóno móvil y no se hace falta pelearnos con el código HTML. Hoy en día es difícil que un internauta distinga entre Internet y web.

Claves del éxito

¿Cuál fue el secreto del éxito del WWW? Además del hiperenlace, sin duda alguna el navegador gráfico. Ya existían otros protocolos en la Red para compartir y enlazar información relacionada, aunque de forma rudimentaria. Pero gracias a los navegadores Mosaic y a Netscape Internet mostró por fin una imagen atractiva. Las empresas por fin podían mostrar sus productos en la Red.

Pero hay otra idea, que tiene sus raíces en el nacimiento de Internet hace 40 años, que también ha ayudado a que el WWW se convierta en el rey de los servicios: apertura, simplicidad y escalabilidad. Internet no es como la televisión o el teléfono, que solo permite la comunicación mediante una serie muy limitada de protocolos: con una antena de TV solo se reciben señales en vídeo y en audio y ya está. La familia de protocolos en Internet están abiertos a la aportación de los propios internautas (fé de ello son los RFCs). Internet permite que los servicios evolucionen sin modificar la infraestructura básica de la Red. Los estándares en los que se basaba el WWW eran relativamente sencillos: HTTP (para la comunicación entre servidores y navegadores) y HTML (para la estructura de los documentos).

La sencillez del HTTP permitió que los programadores los adoptaran rápidamente para implementar servidores y navegadores. La sencillez del HTML permitió que las universidades y empresas publicaran rápidamente información en la Red, y además de forma relacionada. Cuanta más información había en el WWW, tanto más aumentaba su valor. Con el paso del tiempo, el HTML y el HTTP ha ido evolucionando para acomodarse a necesidades más dispares (CSSs, sesiones, etc). Tal es la popularidad del web, y la flexibilidad del HTTP, que muchos otros protocolos han ido cayendo en desgracia. Por ejemplo, el streaming de vídeo se realiza cada vez más en HTTP y menos en protocolos propietarios.

Unix, TCP/IP, HTTP y HTML no serán probablemente las obras cumbre de la ingeniería computacional. Pero lo que han permitido construir en base a ellos han cambiado para siempre la forma en la que los humanos nos relacionamos.

Digitaliza el planeta

¿Cuál es el futuro del WWW? Sin duda alguna, la digitalización de casi todo soporte físico y su puesta a disposición en Internet: imágenes, música, libros, personas, calles... De ello habla su creador. Vía Denken Über, descubrí esta charla de Tim Berners Lee que grita Raw data now!

28/02/2009

Facebook vs Twitter: ¿Cuántos amigos tienes?

Resumen

  • Parece existir un número limitado de contactos que podemos mantener.
  • Estudiando la interacciones en las redes sociales parece comprobarse este límite.
  • El límite, sin embargo, no vendría por el número de contactos, sino por las interacciones regulares.


Ateniendo al número y la cantidad y diversidad de personas que andan por Tuenti, Facebook o Hi5, el éxito de las redes sociales en España y Latinoamérica parece innegable. Millones de personas han establecido contacto, y se escriben diariamente en sus muros. Nunca fue tan fácil tener amigos (aunque por desgracia, el grupo de Facebook SOY ROBERTO CARLOS Y QUIERO TENER UN MILLON DE AMIGOS solo tiene 65 contactos). Lo interesante es que es relativamente sencillo estudiar las relaciones en estos servicios, así que las preguntas que varios se han hecho son obvias: ¿cuántos amigos tenemos en las redes sociales? ¿son más que los que tenemos en nuestra vida analógica?


El Número de Dunbar

José Miguel Santos me pasó hace unos días un enlace a un artículo de The Economist titulado Primates on Facebook: The size of social networks:

«Several years ago, therefore, Robin Dunbar, an anthropologist who now works at Oxford University, concluded that the cognitive power of the brain limits the size of the social network that an individual of any given species can develop. Extrapolating from the brain sizes and social networks of apes, Dr Dunbar suggested that the size of the human brain allows stable networks of about 148. Rounded to 150, this has become famous as “the Dunbar number”».


En español, y según la Wikipedia, el Número de Dunbar es «la cantidad de individuos con los que una persona puede mantener una relación estable. Dunbar teoriza que este valor, aproximadamente 150, está relacionado con el tamaño del neocórtex cerebral». Dunbar realizó varias investigaciones que confirmarían ese límite en diversas épocas de la historia humana. ¿Ha cambiado con el advenimiento de las redes sociales?


Facebook

El artículo de The Economist cita números de Cameron Marlow, de Facebook. Según Marlow, el número medio de contactos en Facebook es de 120 amigos, y las mujeres tienen algo más de contactos que los hombres. Sin embargo, destaca el artículo, hay personas con 500 o más contactos. ¿Significa eso que sobrepasamos ya el límite de Dunbar? No, si atendemos a los detalles. Una cosa es el número de contactos y otra las personas con las que realmente interactuamos en las redes sociales. Según Marlow, los hombres con una media de 120 contactos solo interactúan regularmente con 7 amigos; las mujeres, con 10. Los hombres con 500 contactos interactúan con 17 personas, y en cambio si se tratan de mujeres, con 26.


Twitter

Curiosamente hay un estudio sobre Twitter que nos sirve para comparar las dos redes sociales Publicado en First Monday por Bernardo Huberman et al, Twitter under the microscope (Fernando Tricas lo reseñó en Twitter bajo el microscopio). Este estudio utilizó un conjunto de datos compuesto por casi 310 mil usuarios. El usuario medio de Twitter ha escrito 255 entradas, posee 85 seguidores y sigue a 80 usuarios, lo que supone una media inferior a la de Facebook.

La pregunta de Twitter es qué estamos haciendo, pero una buena parte de los usuarios lo usamos más bien como un lugar para charlar. El 25% de los mensajes en Twitter están dirigidos a otros usuarios (contienen el @fulanito). Esta funcionalidad es relevante para la comparación con Facebook, porque Huberman et al. definieron como amigo aquel contacto al que al menos nos hemos dirigido en dos mensajes. En la siguiente gráfica muestran el número de amigos según el número de contactos:

20090229huberman-twitter

Como se puede ver, aunque una persona tenga 1000 contactos, realmente hay un límite de entre 30 y 40 amigos con los que mantiene una comunicación regular. Para 120 contactos, el número de amigos en Twitter es de unos 20, duplicando la cantidad en Facebook.


¿Para qué sirven las redes sociales?

En el artículo de The Economist, Lee Rainie, director de la empresa de encuestas Pew Internet, sugiere que en las redes sociales hacemos pública nuestra vida a un círculo más extenso de personas, pero que no formarían parte del entorno de amistades más cercanas de Dunbar. Por su parte, Juan Ignacio Martínez, del Instituto de Empresa, en su entrada sobre El número de Dunbar nos deja con algunas preguntas para reflexionar:

«¿Para qué vale tener cientos de contactos en cualquier red social? ¿por qué los tenemos? Si es cierto lo que Robin Dunbar nos indica ¿para qué la redes sociales? Total nos saturaremos enseguida; si tenemos muchos contactos con los que no interactuamos, entonces, ¿cuál es su función final?»

Una respuesta interesante, como siempre, de la mano de Many 2 Many: Are social networks a collecting game?

«Social networks show you the number of friends you have, and the number of connections you've 'earned' by having those friends. This simple feedback mechanism encourages some people to think of a social network as a 'game' with the goal of 'collect the most friends with the greatest number of connections».

Según esta proposición, nos tomaríamos las redes sociales como juegos donde los puntos serían el número de conexiones, y competiríamos por ver quiénes consiguen mayor puntuación (mayor cantidad de contactos).

¿Diversidad cultural?

¿Por qué hay diferencias entre el núcleo de amigos en Twitter y en Facebook? ¿Es una cuestión de cómo se hacen las cuentas, Twitter es más sencillo de usar o hay diferencias entre la cultura de Facebook y la de Twitter? Sería interesante realizar una comparativa entre países, y comparar países nórdicos con países del mediterráneo, donde (al menos según el tópico) somos más abiertos.

El artículo de The Economist no terminó por responder la cuestión de fondo, es decir, si Internet y las redes sociales nos hacen más amistosos. Tengo la impresión de que, aunque es posible que existan ciertas limitaciones neurológicas, y que realmente mantengamos un círculo pequeño y controlable de amistades cercanas, Internet nos está permitiendo añadir muchos niveles adicionales de amistad (desde el amigo/enemigo íntimo, hasta el simple conocido). Se me ocurren beneficios evidentes de que esto fuese así, como hacer más complicada la identificación de el otro, el diferente, el extraño. Pero, ya se sabe, que no siempre exprimimos el potencial de las herramientas y que la mente humana tampoco es un prodigio de la coherencia. Y sin embargo...

21/02/2009

Educación y pirateo de software

Una parte de nuestra sociedad recibe su primer contacto con las nuevas tecnologías en las aulas. Conscientes de ello, varios colegas del Grupo de Usuarios de Linux de Canarias llevan más de una década promocionando el uso de software libre en las aulas de diferentes institutos, convencidos de que lo que usen los alumnos tendrá impacto en su futuro (La primera generación canaria sin Windows). Pero tan importante como las licencias del software que usan es la cultura informática que les transmiten sus profesores.

Personalmente, me preocupa que los profesores fomenten el pirateo de software, con el argumento de que si es para uso personal, no hay problema alguno. En mi opinión, esa cultura informática, que obviamente no es exclusiva del ámbito educativo, a la larga resulta perjudicial. Por eso me ha interesado el artículo que Fernando Tricas enlaza en su bitácora:

«Una interesante reflexión de José Luis Murillo en Con las TICs en Aragón, ¿educamos en la discriminación y el pirateo o en compartir? sobre el modelo adoptado en esta comunidad para la educación de los niños con las 'pizarras digitales'»


En él, José Luis escribe:

«Pero la introducción de las nuevas tecnologías en las aulas no es algo neutro desde el punto de vista ideológico y ético sino que, dependiendo del modelo tecnológico por el que optemos y de los usos que les demos, estaremos difundiendo un determinado modelo educativo, sociocultural y económico. En primer lugar encontramos la idea de que el software que da vida a las TICs es un software que: debe ser propietario de la empresa que lo patenta, debe ser cerrado para que nadie pueda acceder a su código por cuestiones de propiedad o de seguridad, debe ser de pago, características todas ellas que surgen de la idea de las TICs como negocio puro y duro y que no tiene en cuenta a las personas ni su desarrollo.

» Este es un modelo que provoca el uso y el fomento de las TICs como una herramienta discriminatoria pues sólo tendrán acceso a esas herramientas quienes puedan pagarlas, tanto a nivel individual como empresarial o institucional, dejando el pirateo, algo que es ilegal, como la única alternativa para quien no pueda hacerlo, y que además concentra el control de la tecnología en manos de unas pocas empresas y no de quienes las pagan».


Estoy de acuerdo con la premisa de José Luis, la introducción de nuevas tecnologías en las aulas no es algo neutro desde el punto de vista ideológico y ético, pero no estoy de acuerdo ni con el desarrollo ni con la conclusión.

  1. El software libre y el cerrado no son opciones éticas incompatibles.
  2. El software libre también es un negocio puro y duro.
  3. El software libre no es software gratuito: su desarrollo necesita recursos.
  4. El beneficio económico también es beneficio social.

Creo que los que me conozcan tendrán pocas dudas de mi apoyo incondicional por el software libre. Las ventajas sociales se unen a las técnicas, y me parece que en el ámbito de la educación y la administración pública no debería haber ninguna duda sobre su uso.

Ahora bien, el software libre no ha venido el mundo a destruir el modelo capitalista ni la industria del software, sino a reconvertirla: los informáticos también tienen familias que alimentar.  Efectivamente, el pirateo de software beneficia a empresas que pueden costeárselo, y no ayuda en nada a las pequeñas y medianas empresas cuyo modelo de negocio es la venta de licencias. Pero hay nichos en los que todavía al software libre le cuesta llegar. Que el software libre llegue a las aulas de la mano de los profesores es tan importante como que transmitan un respeto no solo por las licencias, sino por los creadores que los hacen posible. Si damos a entender que no se puede vivir haciendo programas, porque se crean y usan al gusto exclusivo del consumidor, que hay algo de perverso por cobrar por los programas, no estaremos en un mundo mucho mejor que el actual: a la larga no habrán chavales interesados en hacer una carrera como ingenieros.

PD: En Ecos del Futuro, Educación...pero no la del siglo XIX: «Quizás la tensión --que siempre ha existido en la educación-- entre orden y método por una lado y desorden y creatividad --bien ejemplificada en el film The History Boys-- tenga que acabar necesariamente del lado del segundo, en una sociedad que demanda multitarea e innovación constante».

PD2: En Catarsis, Educación para la mediocridad: «No educar a los niños sobre el software libre, al menos en igualdad de condiciones respecto del software privativo, no solo tiene los problemas que ahí se mencionan [...] Lo peor es que basar la educación en las "herramientas privativas más extendidas" va a entorpecer que los jóvenes más brillantes desarrollen sus habilidades».

19/02/2009

Concurso de blogs Espacio Europa 2009

A través de plataforma Sinc he descubierto un concurso de blogs promocionado por la Comisión Europea. Se trata de la iniciativa Concurso de blogs Espacio Europa 2009. El objetivo es promocionar aquellos blogs escritos en español que hablen sobre Europa. El premio es un viaje a Bruselas. Las categorías son:

  • Blog de Actualidad Europea.
  • Post sobre Actualidad Europea.
  • Blog Erasmus.
  • Blog o Post sobre el Año Europeo de la Creatividad y la Innovación.
  • Blog o post sobre Medio Ambiente y Cambio Climático.
  • Video en Internet.
  • Iniciativas en Redes Sociales.
  • Iniciativas de Debate Europeo.

Las bases del concurso (PDF).

Espacio Europa es una página de la Representación Española de la Comisión Europea con bastante información en nuestro idioma sobre las iniciativas de la Unión Europea. Poseen blogs, wiki, podcasts y vídeos. Es evidente que se trata de un esfuerzo para intentar acercar Bruselas a los ciudadanos de la Unión Europea. Y quizás sean necesario un mayor empeño. Aunque en España seamos pro-europeos, existen aún pocos elementos de unión cultural entre los países de la UE. Hay pocos medios paneuropeos, como el caso de EuroNews. De hecho nuestras referencias culturales suelen ser las estadounidenses (prensa, televisión, cine, Internet...) pero los medios estadounidenses miran a la actualidad según su propia agenda. En Internet al menos tenemos Le Web, la cita anual en París sobre negocios 2.0. Y precisamente, tras el Le Web del pasado año, Loic Le Meur se quejaba de que los medios estadounidenses no tuvieran en cuenta las iniciativas europeas. Quizás habría que poner más énfasis en la solución que en el problema.

Recordemos que este año hay elecciones europeas.

04/02/2009

Blogs, política y pesca de votos

Me han resultado bastante curiosas unas declaraciones de Esteban González Pons (Partido Popular). Según recoge una nota de prensa de Europa Press, González Pons utiliza el Facebook para enviarle mensajes a Rajoy. Lo interesante, para mi, no es el asunto que destaca dicho titular, sino justamente los dos párrafos finales:

«Dijo preferirlo [Facebook] antes que los blogs, porque "no son para los políticos, sino para los periodistas o intelectuales porque requieren de una lectura detenida y una atención en horas que el político no puede dedicar".

«González Pons subrayó que es "imposible pescar votos" en Internet y en las redes sociales, porque una de las principales características de los usuarios es "su olfato para saber si se les engaña"».

El último párrafo seguramente es un desliz, porque podría interpretarse que los políticos utilizan el resto de medios de comunicación para engañar a los ciudadanos ;-P En todo caso, puede que tenga razón y que en realidad los internautas estemos poco interesados en prestar atención lo que los políticos dicen en Internet. O bien, a quienes les interesa la política en la Red, ya tienen decidido su voto. En un análisis de la blogosfera política estadounidense durante las elecciones de 2004 se ve que los blogs se agrupan en dos grandes grupos (republicanos y demócratas). Lo cierto es que pocos blogs de políticos en España consiguen ser realmente populares, y raramente son merecedores de atención mediática. Solo recuerdo un caso que llegó a ser titular en periódicos, un artículo de Iñaki Anasagasti en su bitácora.

Pero también puede ser que no lo estén haciendo bien, y que traten de aplicar la comunicación simplista y tribal a la que han estado acostumbrados hasta ahora, la de los medios de comunicación de masas. En las últimas elecciones presidenciales de EEUU, Internet se utilizó no solo para organizar a las bases del partido y recaudar dinero, sino también para hacer propaganda viral que gustó a propios y extraños, como fue el caso del famoso vídeo Yes, we can o el cartel Hope creado por Shepard Fairey. (Claro, que en este caso, contaban con un candidato carismático y un mensaje atractivo para el electorado, independientemente del medio).

Internet es un reflejo de la sociedad. Los que están en Facebook y escriben en blogs no son personas (tan) distintas de las que ven los telediarios y hojean el periódico. Si a González Pons no le interesa la materia gris que hay en la blogosfera, está haciendo oídos sordos a la sociedad y desperdiciendo ideas y talento. Porque la política es, entre otras cosas, confrontación de ideas ¿y qué mejor lugar para explicarlas y debatirlas en detalle que con blogs? Por supuesto, no todos los políticos tienen por qué tener tiempo para debatir en la Red, pero si no tienen a nadie capaz de inspirar debates en la Red, o peor, no les interesa elevar el nivel de debate, ellos tienen un problema. Y nosotros, la ciudadanía, también.

Más en El poder de muchos en el discurso presidencial de Obama, de Alfredo Romeo.

Eventos

  • [Maratón Podcastblog]

Acerca de

Twitter / vrruiz

Flickr

  • www.flickr.com