//
estás viendo...
Comunicación, DDHH

Big Data: un problema de Derechos Humanos

View this document on Scribd

¿Qué implica narrar una historia cuando se trata de la descripción masiva de características, gustos, opiniones, diálogos, infinidad de datos geolocalizados de los habitantes de un territorio específico del planeta, o de todo el orbe? ¿O estamos ante una tecnología capaz de moldear sociedades?

Esta columna empezó con la hipótesis de si el BigData puede ser un instrumento para el periodismo de datos, o mejor dicho, para el ejercicio de la acción ciudadana en la “era de la globalización”. Pero concluye en que esta tecnología puede llevar a nuevas y sutiles formas de violar los derechos humanos.

Como concepto, Big Data implica extraer información de datos inciertos. Dicho de otro modo, es analizar bases de datos supermasivas donde el volumen de datos es tal que su principal uso es la determinación de una probabilidad. Su utilidad, es decir el resultado del análisis estructurado de esa totalidad, depende de la capacidad de pensar modelos que puedan inferir probabilidades, trazar tendencias y delimitar supuestos próximos a la realidad, o que reconstruyan una complejidad de acciones realizadas por individuos, grupos y/o sociedades.

Desde hace décadas “todos” formamos parte de mercados, o grupos sociales, o culturas, o electores, o como quiera llamarse al agrupamiento de sujetos que viven, comparten, producen, consumen, hacen y eligen todo el tiempo en internet. La historia de la civilización es también el registro de actividades y percepciones que construyen una Historia y como tal hay datos que se estabilizan y validan, y otros que no, se desechan por falaces, ambiguos o inexactos. Pues bien, el desarrollo tecnológico es tal que estamos muy cerca de que toda la comunicación no encriptada del planeta pueda registrarse y analizarse. La pregunta es quiénes pueden hacerlo y con qué finalidad.

¿Dicho esto, quién tiene la capacidad de hacer Big Data? Para responderlo, primero hay que delimitar cómo se consiguen los datos y luego cómo analizarlos. A mi modo de ver, la hipermasividad de información se logra de cuatro maneras: 1) por medio de la captura de datos de las APIs, 2) mediante el registro en base de datos de una institución formal, 3) por medio de ingeniería de software de internet, como los buscadores y 4) por el acceso directo a las conexiones físicas de internet.

En el primer caso, las APIs (Interfaz de Programación de Aplicaciones es lo que se llama al sistema que sirve de llave de acceso a los datos en bruto de un servicio web) son la principal herramienta de uso libre para hacer BigData. Cada vez más, periodistas, investigadores sociales, hackers y nerds de todo el mundo se encuentran con la posibilidad de indagar en estos servicios informáticos libres para conocer más de la sociedad que los usa. También empresas y administraciones gubernamentales, sin desplegar ningún sistema de espionaje especial, recurre a estos servicios de datos parcialmente libres y parcialmente abiertos, porque las APIs permiten acceder tan solo a una parte de la información que el dueño de la base de datos desea liberar. Pero usarlas requiere conocimiento informático para programar la interacción con la API, capturar los datos, almacenarlos y programar la búsqueda y análisis posterior. Y hay más de 9500 APIs funcionando según el sitio especializado Programableweb (http://www.programmableweb.com/apis). Para las protestas del 8N contra el gobierno de CFK, el colectivo HHBA realizó un hackathón relámpago para “visualizar un acontecimiento público mientras éste ocurre, y poder encontrar patrones de comportamiento y perfiles de manifestantes”, lo que implicó capturar en tiempo real miles de tuits con el hashtag #8N y almacenar 24 horas de esta interacción mediante la API de Twitter. Programadores, periodistas y politólogos desarrollaron en forma voluntaria la visualización http://bit.ly/hhba8n que permitió determinar que la protesta fue mayormente urbana y asentada sobre barrios de alto poder adquisitivo) pero faltó terminar un análisis más detallado. Si esto pudo hacerse sin recursos, ¿cuál es el costo de desarrollar herramientas de Big Data?.

La segunda forma, tal vez la más formal, para capturar datos es la de las empresas, industrias e instituciones estatales de administración y análisis estadístico (como la AFIP, ANSES, INDEC, etc). Las estatales fueron creadas por el propio Estado para proveer a la Sociedad conocimiento científico sobre sí misma. En la actualidad, la iniciativa de Agenda Digital de la Jefatura de Gabinete de Ministros discute en sus foros abiertos cuestiones como la “interoperabilidad”, un aspecto clave para el BigData. Es que si las bases de datos no pueden interactuar entre sí, su análisis y contextualización sería una misión casi imposible. Pero son las empresas e industrias las que impulsan hoy el BigData porque saben que esta tecnología les provee un servicio vital para la competencia. Mientras los estados de la UNASUR se alarman por la dimensión del espionaje global revelado por Wikileaks y Edward Snowden, las industrias se dan una panzada gracias a la falta de control de los Estados, pero sobre todo gracias al renunciamiento automático de derechos que todos hacemos al consumir un producto por internet, usar el homebanking, abrir una cuenta de email, twitter, facebook, flikr, Mercado Libre, etc.

El concepto de privacidad se está redefiniendo y no de manera equitativa. Lo sería si los ciudadanos o las instituciones que nos representan tuviesen la posibilidad de controlar y navegar sobre los registros que las empresas e industrias hacen de nosotros. ¿Acaso debería serlo? ¿Debemos confiar en las lecturas que las empresas hacen del comportamiento humano? ¿Ese conocimiento debería socializarse?

En tercer lugar, parto del supuesto que desde la explosión de internet, existe la tendencia a que todo lo que se publica y conecta a la red se indexa en bases de datos. No es ilógico pensar que ésto se haga. La iniciativa Internet Archive (www.archive.org) es una fundación sin fines de lucro “destinada a la preservación de historiales Web y recursos multimedia” de todo el mundo. Pero los buscadores como Google hicieron del rastreo e indexación de contenidos la construcción de la web que hoy conocemos. Google empezó con la idea de localizar contenido a partir de su reputación (http://www.google.com/insidesearch/). Hoy Google lleva esa lógica a un nuevo nivel con su producto FusionTables que permite subir una tabla o base de datos (independientemente de su tamaño) y analizarla trazando mapas y gráficos de relaciones sobre tus datos… que gentilmente subiste a los servidores de Google, por supuesto.

Si no fuera porque todas estas extraordinarias y potentes herramientas tecnológicas (existen miles más de las citadas en este artículo) operan en su mayoría en datacenters repartidos en 91 países, de los cuales sólo EEUU aglutina el 40.9%, seguido por el Reino Unido 6,8%, Alemania 5,1%, Francia 4,4%, Canadá 3,1% y Australia, India y Holanda con el 2,6% (http://www.datacentermap.com/). El 60% de toda la conexión latinoamericana a Internet se hace por una sola ciudad: Miami. (http://global-internet-map-2012.telegeography.com/)

Y en cuarto lugar, se encuentra la más temida, ilegal y desconocida de las opciones para acceder a datos supermasivos: el acceso físico a las conexiones de internet. “¿Qué revelaciones ha hecho Snowden?” se pregunta Ignacio Ramonet (“¡Todos fichados!”, pag 28 y 29, Le Monde Diplomatique, Ed. 169, Cono Sur). Revisando las recientes publicaciones de The Guardian, The Washington Post el periodista aporta una lista escalofriante: a) que la red Echelon que después de la Segunda Guerra Mundial instaló EEUU, Reino Unido, Canadá, Australia y Nueva Zelanda en todo el mundo para espiar las telecomunicaciones aéreas se orientó a la intercepción de las comunicaciones satelitales llegando a captar hasta 2 millones de conversaciones por minuto; b) que las agencias de espionaje como la NSA, el FBI y la CIA (en un modelo de gestión que podrían copiar otras potencias) subcontratan empresas como la Booz Allen Hamilton quien recibió sólo en 2012 unos 1300 millones de dólares para realizar análisis de datos e informes de inteligencia; c) que existen varios programas secretos de inteligencia de datos como PRISM, que habilita al acceso directo en EEUU a los servidores que poseen la principales empresas de internet en ese país para recolectar datos enviados por extranjeros en el resto del planeta; d) que la Government Communications Headquarters británica (GCHQ), hermana de la NSA, se aprovecha de que gran parte de los cables de fibra óptica que conducen las telecomunicaciones planetarias pasan por el Reino Unido para acceder a ellos de manera ilegal (http://www.submarinecablemap.com).

BigData. No cualquiera. La Declaración Universal de Derechos Humanos dice en su artículo 12 que “Nadie será objeto de injerencias arbitrarias en su vida privada, su familia, su domicilio o su correspondencia, ni de ataques a su honra o a su reputación. Toda persona tiene derecho a la protección de la ley contra tales injerencias o ataques”. Y en el art 28 sostiene que “Toda persona tiene derecho a que se establezca un orden social e internacional en el que los derechos y libertades proclamados en esta Declaración se hagan plenamente efectivos”.

Cómo el mundo va a dar cuenta de ello es una gran incógnita.

Anuncios

Acerca de pollatos

Una melange entre DDHH y TICs

Comentarios

Aún no hay comentarios.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

Si querés recibir las actualizaciones que cada tanto hago de este blog, poné tu mail.

Únete a otros 484 seguidores


Una melange entre Derechos humanos y TICs

Member of The Internet Defense League

A %d blogueros les gusta esto: