S�bado 20 de abril 2024 Contacto

Big Data: cómo está ocurriendo la revolución de los datos ocultos y los secretos más íntimos




18/11/2017 - 10:40:27
Si nos detenemos a imaginar a d�nde se dirige el mundo en los pr�ximos veinte -o incluso diez- a�os, podemos decir que nos encontramos en la segunda etapa de una revoluci�n que abarca desde mediados del siglo XX, pero que reci�n hoy comienza a vislumbrar sus consecuencias m�s intr�nsecas.

As� como la m�quina de vapor y el ferrocarril marcaron el detonante de la primera revoluci�n industrial, en nuestros tiempos la computadora se ha convertido en s�mbolo de una etapa hist�rica tan abarcativa y transformadora que una sola palabra no ha sido suficiente para describirla. Hablamos de la revoluci�n tecnol�gica, digital y de la era de la informaci�n para referirnos a distintos movimientos y transiciones, pero los tres t�rminos remiten a una �poca actual cuyo exponente puede identificarse con la invenci�n de la computadora y el desarrollo del Internet.

Nos encontramos en la segunda etapa de la revoluci�n porque esta tecnolog�a, que ha sido marcada por hitos hist�ricos como el desarrollo de ARPANET en 1969 y el del World Wide Web en 1989, ha iniciado un proceso de nuevos descubrimientos que prometen cambiar todos los aspectos de nuestra vida diaria.

As� como la m�quina de vapor fue la tecnolog�a detr�s del ferrocarril, cada vez m�s expertos concuerdan que la tecnolog�a detr�s de la moneda virtual Bitcoin �blockchain� con el tiempo modificar� el funcionamiento del Internet as� como el autom�vil revolucion� el transporte y sustituy� al ferrocarril en el siglo XX. Una din�mica similar tambi�n se desenvuelve con la rob�tica, que hasta ahora ha sido fundamental para el progreso de varias industrias pero que en los pr�ximos a�os, con el continuo avance de la inteligencia artificial, probablemente seamos testigos de la emigraci�n de los robots desde las f�bricas y los laboratorios cient�ficos a nuestro mundo cotidiano.

Otro componente esencial de esta revoluci�n es el progresivo avance en el campo de la informaci�n en forma de Big Data. En una columna de opini�n para este portal, Mario Bolo, director adjunto del Departamento de Ingenier�a Inform�tica del ITBA (Instituto Tecnol�gico de Buenos Aires), define Big Data como el conjunto de datos e informaci�n "que existen en el mundo o los que se crean diariamente".

"Big Data significa todos los datos, en todas sus formas, que incluyen no s�lo los datos tradicionales sino tambi�n correos electr�nicos, comentarios en redes sociales, fotos, audio y video, datos de instrumentos y sensores, y hasta el tono emocional de una comunicaci�n verbal o escrita. Pero Big Data es m�s: tambi�n incluye el variado conjunto de tecnolog�as que permiten analizar esos datos", precisa Bolo.

En su libro "Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are" (Todos mienten: Big Data, nueva data y lo que Internet puede decirnos sobre qui�nes realmente somos), Seth Stephens-Davidowitz argumenta que Big Data est� convirtiendo a las ciencias sociales en una verdadera ciencia, "y esta nueva y verdadera ciencia est� preparada para mejorar nuestras vidas".

"Estoy ahora convencido de que las b�squedas en Google son el conjunto de datos m�s importante jam�s recopilado sobre la psiquis humana", dice Stephens-Davidowitz, un cient�fico de datos que trabaj� como analista cuantitativo en Google y actualmente es columnista para el peri�dico estadounidense The New York Times.

As� como Bitcoin es la primera aplicaci�n pr�ctica de la revolucionaria tecnolog�a blockchain, la herramienta de b�squeda Google Trends introdujo al mundo por primera vez un m�todo eficiente de analizar parte del gran universo que es Big Data. "Google Trends, una herramienta lanzada con poca fanfarria en 2009, informa a los usuarios con que frecuencia una palabra o frase ha sido buscada en diferentes lugares y en diferentes momentos", explica el cient�fico.


"En aquel momento, los datos de b�squeda de Google no parec�an ser una fuente de informaci�n adecuada para una investigaci�n acad�mica "seria". A diferencia de las encuestas, los datos de b�squeda de Google no fueron creados para ayudarnos a entender la psiquis humana. Google se invent� para que la gente pudiera aprender sobre el mundo, no para que los investigadores pudieran aprender sobre las personas", escribe en la introducci�n de su libro.

"Pero resulta que los rastros que dejamos mientras buscamos conocimiento en Internet son tremendamente reveladores. En otras palabras, la b�squeda de informaci�n es, en s� misma, informaci�n", agrega.

Veamos algunos ejemplos.


Una de las grandes ventajas de algunas fuentes de Big Data como el buscador de Google es que, al ser herramientas impersonales que se pueden utilizar en anonimato, suelen funcionar como un confesionario al que muchas personas recurren para expresar lo que no quieren o pueden admitir en p�blico. "El poder de los datos de Google es que la gente le dice a los grandes buscadores cosas que no le dir�an a nadie m�s", advierte Stephens-Davidowitz.

No es el caso de las redes sociales como Facebook, Twitter e Instagram, -otra gran fuente de Big Data-, ya que, al ser plataformas que uno utiliza para relacionarse con la sociedad, existe un incentivo para mostrarse de una manera que uno realmente no es. "No hay manera de que todos sean tan exitosos, ricos, atractivos, relajados, intelectuales y alegres como aparentan ser en Facebook", afirm� Stephens-Davidowitz en una de sus columnas para el peri�dico neoyorquino.

Si utilizamos los datos presuntamente honestos de buscadores como Google y aprovechamos la transparencia con la cual podemos acceder a ellos, podemos descubrir comportamientos, deseos o preocupaciones que quiz� nunca consideramos como caracter�sticas generales de los seres humanos. Por ejemplo, si buscamos la expresi�n "mi esposo quiere�" en Google Trends, descubrimos que en India, la b�squeda m�s com�n con esta f�rmula es "mi esposo quiere que lo amamante".

De hecho, las b�squedas pornogr�ficas de im�genes de mujeres que amamantan a los hombres son cuatro veces m�s altas en la India y en Bangladesh que en cualquier otro pa�s del mundo, una observaci�n que quiz� nunca hubi�semos registrado sin que los datos de Google la saquen a la luz.

Otra observaci�n: mientras que los hombres inundan a Google con consultas sobre el tama�o de sus penes, la mayor inseguridad corporal de las mujeres, seg�n el buscador, es el olor de su vagina. De hecho, las mujeres tienen casi tantas preguntas sobre sus vaginas como los hombres sobre sus penes. Quieren saber c�mo afeitarla, apretarla y hacer que su sabor sea mejor. El olor de su vagina es realmente una inquietud seria: algunas de las b�squedas de Google m�s frecuentes se preocupan que sus vaginas huelen a pescado, seguido por vinagre, cebolla, amon�aco, ajo, queso, olor corporal, orina, pan, blanqueador, heces fecales, sudor, metal, pies, basura y carne podrida.


Como advertimos al principio de esta nota, Stephens-Davidowitz sostiene que una de las grandes ventajas de Big Data es que puede convertir a las ciencias sociales en una verdadera ciencia. Es decir, puede producir conocimiento susceptible a la experimentaci�n y a la prueba con datos concretos.

Cuando las teor�as de Freud atrajeron por primera vez a la atenci�n p�blica, muchos intelectuales se preguntaron si sus hip�tesis pod�an ser demostradas. Frente a esta inc�gnita, el gran fil�sofo Karl Popper se inclinaba a decir que no: las teor�as de Freud simplemente no eran falsificables; no hab�a forma de probar si eran verdaderas o falsas.

"Hasta ahora", afirma Stephens-Davidowitz.

Aunque en sus investigaciones el analista cuantitativo refuta algunas de las teor�as freudianas, uno de sus descubrimientos m�s alarmantes fue que un impactante n�mero de personas que visitan los principales sitios pornogr�ficos buscan satisfacer sus fantas�as incestuosas.

De las cien b�squedas m�s populares por hombres en PornHub, uno de los sitios pornogr�ficos m�s populares, diecis�is de ellas buscan videos de incesto, como "hermano y hermana", "madre e hijo" y "hermana y hermano verdadero". Por su parte, nueve de las principales cien b�squedas por mujeres en el mismo sitio buscan la misma tem�tica, como "padre e hija".

En Google Trends, de todas las b�squedas que comienzan con el formato "quiero tener sexo con mi�" o "estoy atra�do a mi�", la forma m�s com�n de completar la frase incluye la palabra "mam�".

Podemos concluir, -quiz� definitivamente-, entonces, que al menos un tenue eco del Complejo de Edipo de Freud forma parte de la psicolog�a humana.

�Podemos apostar al ganador en una carrera de caballos gracias a Big Data?

En 2013, un empresario cervecero egipcio llamado Ahmed Zayat viaj� a Nueva York para participar en un remate de 151 caballos en el cual pretend�a vender un animal propio y comprar algunos m�s. Para ello contrat� a una peque�a firma de expertos, EQB, cuyo director, Jeff Seder, no era un hombre de campo con a�os de experiencia sino un graduado de Harvard nacido en Filadelfia.

Durante dos d�as, los expertos analizaron a todos los caballos del remate con la intenci�n de seleccionar a cuatro o cinco para reemplazar al de Zayat, el n�mero 85.

Sin embargo, los expertos regresaron con una recomendaci�n inesperada: "No podemos cumplir con su petici�n", dijeron. "Simplemente no puedes vender el caballo n�mero 85. Venda su casa, pero no venda este caballo".

Con poco entusiasmo, el caballo n�mero 85 fue comprado por USD 300.000 por un tal "Incardo Bloodstock". Bloodstock, se revel� despu�s, era un pseud�nimo utilizado por Zayat, qui�n por reglas que no permit�an retirar a "n�mero 85" del remate, compr� su propio caballo en un acto casi sin precedentes.

Lo bautiz� con el nombre "American Pharoah". Dieciocho meses despu�s, en 2015, se convirti� en el primer caballo en m�s de tres d�cadas en ganar la Triple Corona.

�Qu� sab�a Jeff Seder sobre el caballo n�mero 85 que nadie m�s sab�a?

Luego de a�os de investigar c�mo predecir el �xito de un caballo con datos que exceden el pedigr� del animal, Seder decidi� medir el tama�o de los �rganos internos de los caballos.


Entonces, descubri� una correlaci�n asombrosa: encontr� que el tama�o del coraz�n, y en particular el tama�o del ventr�culo izquierdo, era un predictor sumamente efectivo para medir el �xito de un caballo. Tambi�n not� que otra variable importante era el tama�o del bazo: los caballos con bazo peque�o no ganaban pr�cticamente nada.

Cuando Seder analiz� a American Pharoah, parec�a ser un caballo normal. En su primer a�o de vida, registraba una altura dentro del percentil 56, un peso de percentil 61 y un pedigr� de percentil 70.

�Pero su ventr�culo izquierdo? Percentil 99,61. �Qu� m�s? El resto de sus �rganos, incluyendo su coraz�n y el bazo, tambi�n eran extraordinariamente grandes. American Pharoah era un caballo �nico.


Como demuestra est� experiencia, cuando analizamos Big Data no es tan importante identificar la explicaci�n detr�s de nuestras observaciones (Seder no pod�a explicar exactamente por qu� el ventr�culo izquierdo es tan importante para predecir el �xito del caballo), sino percibir que cierta correlaci�n efectivamente existe y funciona en el mundo real.

Lo dem�s es objeto de estudio del cardi�logo o el hemat�logo.

�Era posible predecir que Donald Trump ganar�a las elecciones presidenciales de Estados Unidos en 2016?


Cuando Barack Obama gan�, con cierta facilidad, las elecciones presidenciales estadounidenses de 2008 y luego un segundo mandato en 2012, varias encuestadoras profesionales suger�an que la raza ya no era un factor determinante en c�mo votaban los estadounidenses. La Encuesta Gallup, por ejemplo, concluy� de sus investigaciones que a los votantes estadounidenses no les importaba que su presidente sea negro.

Durante la presidencia de Obama, la creencia popular parec�a indicar que Estados Unidos, un pa�s cuya historia traza una larga �poca de esclavitud y leyes de Jim Crow que culminaron en la Guerra de Secesi�n y el Movimiento por los derechos civiles, finalmente se hab�a librado de su larga tradici�n de discriminaci�n y disfrutaba de una �poca post-racial en la cual los prejuicios remanentes se limitaban a un peque�o porcentaje de los estadounidenses � la mayor�a de ellos Republicanos conservadores viviendo en el Sur del pa�s.

Cuatro a�os despu�s, las mismas encuestadoras pronosticaban una y otra vez que Donald Trump, un magnate inmobiliario y presentador de televisi�n, no ten�a chances de ganar las Primarias Republicanas ni las elecciones presidenciales de 2016 contra Hillary Clinton.


Pero Google Trends ten�a otra historia que contar.

"Las b�squedas en Google presentaban una imagen de Estados Unidos que era sorprendentemente diferente a la utop�a post-racial esbozada por las encuestas", afirma Stephens-Davidowitz en su libro. "En Estados Unidos, la palabra "nigger" [una palabra para referirse a las personas negras que ha adquirido una connotaci�n profundamente peyorativa] -o su plural, "niggers"- se incluy� en aproximadamente el mismo n�mero de b�squedas que las palabras "migra�a(s)", "economista" y "Lakers"".

"En la noche de las elecciones", contin�a el autor, "las b�squedas y las inscripciones a Stormfront, un sitio supremacista blanco con una popularidad sorprendentemente alta en los Estados Unidos, fueron m�s de diez veces superiores a lo normal. En algunos estados, hubo m�s b�squedas de "presidente nigger" que "primer presidente negro"".

A�n m�s alarmante, estas b�squedas no se confinaban a los estados mayormente republicanos y conservadores del Sur. "Los lugares con las tasas m�s altas de b�squedas racistas inclu�an al norte del estado de Nueva York, el oeste de Pensilvania, el este de Ohio, Michigan industrial e Illinois rural, junto con Virginia Occidental, el sur de Luisiana y Misisipi".

"La verdadera divisi�n, suger�an los datos de b�squeda de Google, no era Sur contra Norte, sino Este contra Oeste. No se ve este fen�meno mucho m�s al oeste del r�o Misisipi y el racismo no se limitaba a los Republicanos. De hecho, las b�squedas racistas no fueron m�s altas en lugares con un alto porcentaje de Republicanos que en lugares con un alto porcentaje de Dem�cratas", escribe Stephens-Davidowitz.

En total, "Obama perdi� aproximadamente 4 puntos porcentuales en todo el pa�s debido �nicamente al racismo expl�cito", calcul� el analista cuantitativo.

"Hab�a una oscuridad y un odio que estaba oculto a las fuentes tradicionales de informaci�n, pero que era bastante evidente en las b�squedas que la gente hac�a" en Google. "Pero esas horribles b�squedas no son dif�ciles de reconciliar con el �xito de un candidato que -en sus ataques contra los inmigrantes, en sus c�leras y resentimientos- a menudo apelaba a las peores inclinaciones de la gente", opina el columnista de The New York Times.

M�s all� de revelaciones sobre los prejuicios raciales de la sociedad, Big Data tambi�n puede ayudar a pronosticar los resultados de una elecci�n utilizando m�todos de an�lisis poco convencionales y no accesibles a las encuestas tradicionales, como descifrar el n�mero de electores que ejercer�n su derecho a votar el d�a de las elecciones. "M�s de la mitad de los ciudadanos que no votan le dicen a las encuestas inmediatamente antes de una elecci�n que piensan hacerlo, distorsionando nuestra estimaci�n de la participaci�n electoral, mientras que b�squedas en Google sobre "c�mo votar" o "d�nde votar" semanas antes de una elecci�n pueden predecir con precisi�n qu� partes del pa�s van a tener una gran presencia en las urnas", se�ala el graduado en filosof�a de la Universidad de Stanford y en econom�a de Universidad Harvard.


No solo eso: las b�squedas en Google tambi�n pueden revelar informaci�n sobre el candidato a quien probablemente votar� un votante indeciso. Analizando los datos de las elecciones, el profesor de finanzas en la Universidad de California, Stuart Gabriel, y Stephens-Davidowitz descubrieron que "un gran porcentaje de las b�squedas relacionadas con las elecciones contienen consultas con los nombres de ambos candidatos. Durante las elecciones de 2016 entre Trump y Hillary Clinton, algunas personas buscaron "Encuestas Trump Clinton". Otros buscaron lo m�s destacado del "Debate de Clinton Trump". De hecho, el 12 por ciento de las b�squedas con "Trump" inclu�an tambi�n la palabra
Entonces, �C�mo pueden unas b�squedas aparentemente neutrales darnos algunas pistas sobre el candidato a qui�n votar�n algunos electores indecisos?

Por "el orden en que aparecen los candidatos", concluyeron los analistas. "Nuestra investigaci�n sugiere que en una b�squeda que incluye los nombres de ambos candidatos, una persona es significativamente m�s propensa a poner al candidato que apoya primero".

Este �ltimo ejemplo nos ayuda a apreciar los primeros tres de los cuatro poderes de Big Data y de su an�lisis que destaca Stephens-Davidowitz en su libro, aunque a continuaci�n enumeramos su lista completa:

Si pretendemos integrarnos a la econom�a del futuro, es importante entender que, indudablemente, Big Data conformar� una parte central de ella. Cada vez m�s y m�s datos inundan el mundo (un promedio de 2,5 trillones de bytes por d�a, para ser exactos), y el abanico de posibilidades que se abre con nuestra capacidad de analizarlos es realmente inagotable.

La revoluci�n de las ciencias sociales ha comenzado.

Estimados lectores: recuerden que estas noticias las pueden encontrar en nuestro Canal de Whastapp al momento de su publicación.

Sigue el canal de Hoybolivia.com en WhatsApp:
whatsapp.com/channel/0029Va8B7PQ3GJOyC41B2Q1a

Noticias Recientes de Especiales

Copyright © Hoybolivia.com Reservados. 2000- 2024