miércoles, 21 de agosto de 2013

¿Se nos desinfla el hype del Big Data?

En dos líneas: como todos los veranos, nos ha llegado el nuevo "Hype Cycle" de Gartner y el Big Data no sale tan bien parado como se podría esperar. 

Lo podéis observar en los tres últimos Hype Cycle de Gartner, en el de este año el período de maduración (el tiempo que una determinada tecnología tarda en llegar a la denominada "meseta de productividad") del Big Data ha pasado de ser de "entre 3 y 5 años" a "entre 5 y 10 años".

Fijaos en como ha cambiado el Hype Cycle, los más curiosos pueden comparar estas tecnologías con las que propone Mckinsey en un documento reciente:

Fuente: Gartner - Hacer clic en la imagen para aumentar su tamaño

Fuente: Gartner - Hacer clic en la imagen para aumentar su tamaño

Fuente: Gartner - Hacer clic en la imagen para aumentar su tamaño


Las razones para este cambio de opinión en mi opinión podrían estar en:

  1. Las soluciones de Big Data todavía no son los suficientemente maduras y están creando confusión en el mercado.

  2. Desde el punto de vista de los directivos de gran parte de empresas no está claro para qué pueden utilizar el Big Data a la hora de conseguir insights que aporten valor al negocio.

  3. A todo lo anterior se une la falta de profesionales cualificados en todo el ciclo operativo del Big Data, lo que está llevando a una significativa inflación salarial en perfiles como el de "Data Scientist".

  4. Actualmente todavía está por definir de un modo más o menos definitivo el ecosistema de vendors y soluciones de Big Data.

  5. De hecho, los vendors de BI y BA se han visto perjudicados en sus resultados por el fenómeno del Big Data, que ha tenido como consecuencia una ralentización de las inversiones por parte de las empresas, después de la gran fiesta de inauguración llega la resaca y tras algunos proyectos piloto muy caros parece que toca tomarse las cosas con más calma. 

  6. Los proyectos de Big Data son caros (por ahora reservados a la gran empresa) y no tienen por el momento una tasa de éxito elevado (pues si, en esto también se usa el ROI), algo normal dada la madurez de esta tecnología.

  7. Las empresas se están planteando si apostar fuerte por el Big Data cuando aún les queda mucho por hacer en BI y Analytics.

  8. El equivoco continuo entre los conceptos de "correlación" y "causalidad", que ya cansa.

  9. Pocos serán los que puedan aprovecharse del fenómeno de los datos como "el nuevo petróleo", la gran mayoría de empresas y organizaciones serán meros observadores y "paganos" de dicho fenómeno, por otro lado está por ver la evolución del Open Data por muchos ejemplos parciales que vayan surgiendo.

  10. Hay tecnologías que están íntimamente asociadas al Big Data y que todavía necesitan de cierta madurez: el Internet of Things (IoT), el Cloud Computing, la análitica predictiva y sobre todo la prescriptiva, el lenguaje natural, etc...

Y sin embargo se mueve, como diría Galileo, detrás del Big Data hay muchas posibilidades (buenas y malas para la sociedad en su conjunto) y seguramente llegará, pero no en la forma actual y sin bastantes de los jugadores actuales.

Creo que nos vamos acercando a ese momento de todo hype en el que las enormes expectativas creadas no se cumplen, entonces llega cierta desilusión y todo se calma a la espera del siguiente bombazo a preparar por la industria.

No se qué os parece esta desaceleración de las expectativas por parte de Gartner, que ha sido quizás el mayor impulsor del hype del Big Data, yo creo que tienen razón en reconsiderar su posición.

Si os ha parecido interesante este post, por favor, compartidlo en las redes sociales, y, como siempre, estoy abierto a vuestras opiniones.



1 comentario:

Oscar Marín dijo...

Muy de acuerdo... Añadiría dos pinceladas: en general se habla poco de análisis de datos y mucho de gestión de grandes volúmenes, cuando el valor en mi opinión está en lo primero. Otra: creo que hay mucha 'ciencia' de datos y poca Ingeniería, con lo cual se crean modelos mastodónticos que son imposibles de aplicar en la práctica sin despilfarrar recursos. Venga, y finalmente pienso que es mucho más rentable concentrarse en una pequeña muestra, pero significativa, que siempre buscar un gran volumen (Pareto era un hombre sabio!). He visto montar clusters Hadoop para tardar 2 dias en resolver un problema que con un script Perl optimizado a nivel de algoritmia (ingeniería) tardaba 9 minutos.