De Big Data a big brother
Lluís Cucarella
En el año 2002, Billy Beane, director técnico de los Oakland Athletics, un equipo de béisbol estadounidense, tuvo que afrontar un doble problema: la marcha de sus principales estrellas a otros clubes más poderosos y un escaso presupuesto para recomponer la plantilla. Lejos de resignarse, Beane contrató como ayudante a Paul DePodesta, un joven licenciado en Económicas por Harvard que había desarrollado un sistema de análisis de datos que permitía saber qué jugadores tenían un enorme potencial para armar un equipo ganador. El sistema analizaba lo que cada uno podía aportar al conjunto, aunque fueran desconocidos o estuvieran devaluados económicamente.
El resultado de aquel experimento lo describe, con algunas licencias sobre la historia real, la película Moneyball, protagonizada por Brad Pitt: los Oakland Athletics acabaron funcionando como un reloj suizo gracias al método de DePodesta y establecieron un récord en la MLB, llevándoles a ganar aquel año la liga regular de la división oeste. Aquel episodio es tal vez la demostración más palpable del poder del análisis de grandes volúmenes de datos para crear modelos predictivos, una tendencia en el sector de la tecnología de la información que crece de manera vertiginosa.
Un ejemplo sencillo del uso del Big Data lo tenemos hoy en día, por ejemplo, en Amazon, que es capaz de relacionar su mastodóntica base de datos, para extraer patrones conductuales y, tras una compra, sugerirnos otros libros o productos relacionados. Otro ejemplo lo tenemos en el análisis informático de datos públicos y propios que el equipo de Obama hizo en las pasadas elecciones presidenciales, aunando estadística e inteligencia artificial para obtener patrones de conducta y lograr trasladar un mensaje personalizado a cada ciudadano.
O el caso, por poner otro ejemplo entre miles, de la filial de T-Mobile en EEUU, que para reducir la portabilidad, analizó los millones de datos que poseía sobre la actividad de sus clientes y extrajo modelos de comportamiento que le alertaban de cuándo un usuario estaba a punto de irse a otra compañía y poder anticiparse a su decisión. Analizando patrones de conducta de millones de personas y cruzando datos es posible desde mejorar la coordinación tras una catástrofe hasta incluso poner en marcha métodos de reducción de la delincuencia o el terrorismo. Pero como decía, el Big Data lleva consigo la otra cara de la moneda, unos riesgos que afectan fundamentalmente en dos cuestiones.
Una, de raíz más antropológica, centrada en el peligro de lo que Evgeny Morozov denomina la «renuncia al porqué»: ya no necesitamos comprender por qué sucede algo, sino simplemente, con las correlaciones de datos, incidir en la conducta preventiva para evitar a tiempo que cometa algún acto de delincuencia; conectar el comportamiento de los terroristas de hoy con los de mañana para incidir en la localización de un sospechoso.
El problema de la prevalencia del cuándo y el cómo sobre el porqué es que se renuncia a atacar las causas: una acción preventiva sobre delincuencia en un barrio alejará a los sospechosos a otras zonas o dificultará más su acción, pero no se atacará el problema de raíz. Nunca se comprenderán las causas de la delincuencia. Este tipo de solución lleva, según sostiene Mark Andrejevic en su libro Infloglut, a una ceguera que los gobiernos democráticos no pueden permitirse, porque imposibilita cualquier reforman política seria.
Y el otro problema es el de la privacidad. Para poder interpretar millones de datos, primero hay que poseerlos y la verdadera lucha de las empresas dedicadas a obtener datos estará en conseguir el mayor volumen; llegar donde los demás aún no han llegado. Y cuántos más datos se acumulan de nosotros, más posibilidades existen de ser vendidos o robados o de que alguien haga mal uso de ellos. Las relevaciones de Snowden, de ser ciertas, ponen de manera evidente sobre la mesa el alcance del riesgo: la ruptura absoluta del equilibrio entre seguridad y privacidad. De no acotar este riesgo, el Big Data puede convertirse en poco tiempo en un verdadero Gran Hermano, en un modernizado Big Brother orwelliano. Eso, si no ha empezado a serlo ya.
El resultado de aquel experimento lo describe, con algunas licencias sobre la historia real, la película Moneyball, protagonizada por Brad Pitt: los Oakland Athletics acabaron funcionando como un reloj suizo gracias al método de DePodesta y establecieron un récord en la MLB, llevándoles a ganar aquel año la liga regular de la división oeste. Aquel episodio es tal vez la demostración más palpable del poder del análisis de grandes volúmenes de datos para crear modelos predictivos, una tendencia en el sector de la tecnología de la información que crece de manera vertiginosa.
Un ejemplo sencillo del uso del Big Data lo tenemos hoy en día, por ejemplo, en Amazon, que es capaz de relacionar su mastodóntica base de datos, para extraer patrones conductuales y, tras una compra, sugerirnos otros libros o productos relacionados. Otro ejemplo lo tenemos en el análisis informático de datos públicos y propios que el equipo de Obama hizo en las pasadas elecciones presidenciales, aunando estadística e inteligencia artificial para obtener patrones de conducta y lograr trasladar un mensaje personalizado a cada ciudadano.
O el caso, por poner otro ejemplo entre miles, de la filial de T-Mobile en EEUU, que para reducir la portabilidad, analizó los millones de datos que poseía sobre la actividad de sus clientes y extrajo modelos de comportamiento que le alertaban de cuándo un usuario estaba a punto de irse a otra compañía y poder anticiparse a su decisión. Analizando patrones de conducta de millones de personas y cruzando datos es posible desde mejorar la coordinación tras una catástrofe hasta incluso poner en marcha métodos de reducción de la delincuencia o el terrorismo. Pero como decía, el Big Data lleva consigo la otra cara de la moneda, unos riesgos que afectan fundamentalmente en dos cuestiones.
Una, de raíz más antropológica, centrada en el peligro de lo que Evgeny Morozov denomina la «renuncia al porqué»: ya no necesitamos comprender por qué sucede algo, sino simplemente, con las correlaciones de datos, incidir en la conducta preventiva para evitar a tiempo que cometa algún acto de delincuencia; conectar el comportamiento de los terroristas de hoy con los de mañana para incidir en la localización de un sospechoso.
El problema de la prevalencia del cuándo y el cómo sobre el porqué es que se renuncia a atacar las causas: una acción preventiva sobre delincuencia en un barrio alejará a los sospechosos a otras zonas o dificultará más su acción, pero no se atacará el problema de raíz. Nunca se comprenderán las causas de la delincuencia. Este tipo de solución lleva, según sostiene Mark Andrejevic en su libro Infloglut, a una ceguera que los gobiernos democráticos no pueden permitirse, porque imposibilita cualquier reforman política seria.
Y el otro problema es el de la privacidad. Para poder interpretar millones de datos, primero hay que poseerlos y la verdadera lucha de las empresas dedicadas a obtener datos estará en conseguir el mayor volumen; llegar donde los demás aún no han llegado. Y cuántos más datos se acumulan de nosotros, más posibilidades existen de ser vendidos o robados o de que alguien haga mal uso de ellos. Las relevaciones de Snowden, de ser ciertas, ponen de manera evidente sobre la mesa el alcance del riesgo: la ruptura absoluta del equilibrio entre seguridad y privacidad. De no acotar este riesgo, el Big Data puede convertirse en poco tiempo en un verdadero Gran Hermano, en un modernizado Big Brother orwelliano. Eso, si no ha empezado a serlo ya.