Innovación pública con ciencia de datos

La ciencia de datos, como una de las diversas herramientas que componen la Inteligencia Artificial, es un acelerador de la transformación digital. Desde los años 50, la terminología que se ha utilizado para referirse a estas técnicas ha evolucionado a pasos agigantados con la llegada de la Cuarta Revolución Industrial (4RI). Ya no solo nos referimos a la estadística y a los modelos clásicos sino que, cada vez más, el aprendizaje de máquina se ha convertido en una herramienta fundamental para dar respuesta a problemas públicos mundiales. Por ello, varios países ya cuentan con marcos de política que integran estas metodologías como vehículos para diseñar política pública basada en evidencia y, de este modo, tomar mejores decisiones.

Con base en esto, la ciencia de datos también es una herramienta de la innovación pública. Esta facilita adoptar enfoques de experimentación para darle respuesta a los dolores colectivos que nos aquejan como sociedad, de una manera más ágil e iterativa.

¿Por qué la ciencia de datos es importante para la innovación pública?

La ciencia de datos se combina con pilares fundamentales de la innovación pública como el diseño centrado en usuarios, el uso de metodologías ágiles o la gestión del conocimiento y aprendizajes, con el objetivo de generar productos que sean útiles y respondan realmente a las necesidades de las personas. Un ejemplo que ilustra esto es el dolor que resienten muchos países frente a la relación fracturada entre el gobierno y la ciudadanía, generando así altos niveles de desconfianza y deslegitimidad. Este problema a través de iniciativas de visualización de datos, por ejemplo, puede solventarse, o al menos disminuirse, si se combinan enfoques de diseño centrado en usuarios, programas de datos abiertos y servidores públicos capacitados en analítica de datos.

De igual forma, la ciencia de datos ha demostrado ser un catalizador importante en dar respuesta a problemas públicos y la evidencia señala su aporte invaluable en sectores como la medicina, la economía o las finanzas. En ese sentido, por ejemplo, el Banco Mundial reconoce varias áreas donde el Big Data, otra herramienta de la Inteligencia Artificial, ha tenido un impacto significativo en áreas tales como la pobreza, la criminalidad, y el transporte.

De este modo, el reciente interés por los datos reposa en su carácter innovador, donde no necesariamente se caracteriza por la novedad, sino por los procesos que ya funcionan en un área y se transmiten hacia otras. Un caso de lo anterior son las iniciativas impulsadas en Estados Unidos e Inglaterra, dos países muy adelantados en regulación en materia de Inteligencia Artificial, donde se ha logrado la coordinación entre gobiernos, empresas y academia para desarrollar proyectos de manera colaborativa.

Algunos proyectos que ilustran esta sinergia

Desde el EiP, hemos adelantado diversos trabajos que utilizan diferentes aspectos de la ciencia de datos para validar este enfoque. A continuación algunos de ellos:

  1. Respuestas al Pacto por Colombia en el Portal de Presidencia

Problema público: hacer a la ciudadanía partícipe en la construcción del Plan Nacional de Desarrollo 2018–2022 e identificar lo que se entiende por innovación pública.

Enfoque de ciencia de datos utilizado: minería de texto (agrupamiento y similitud entre respuestas).

Software libre utilizado: lenguaje de programación R.

Análisis: este proyecto consistió en analizar las 106 respuestas de los ciudadanos sobre la pregunta hecha en materia de innovación pública, ubicada en el portal web que tenía como objetivo construir con la ciudadanía el Plan Nacional de Desarrollo. El análisis indicó que hay interés sobre 8 temas puntuales, como se ve en el siguiente gráfico:

Image for post
Fuente: EiP — DNP.

Así, no solo es posible revisar una gran cantidad de textos, sino que también permite mantener una conversación más cercana con los ciudadanos y con las opiniones que desean expresar. La gran mayoría de comentarios recibidos daban cuenta de los dolores colectivos que se plasmaron en el capítulo de innovación pública y que como ecosistema estamos intentando abordar.

Aprovechando las ventajas que brinda el controlador de versiones GitHub, el desarrollo de este proyecto puede consultarse libremente en el siguiente enlace: https://github.com/FoxHound112263/Colombia-Pact-Text

2. Índice de capacidades de innovación para entidades públicas en Colombia

Problema público: construir un índice que mida las capacidades para innovar de las entidades públicas de Colombia.

Enfoque de ciencia de datos utilizado: construcción de algoritmos con programación funcional.

Software libre utilizado: lenguaje de programación R.

Análisis: se está construyendo este índice que mide las capacidades para innovar en el sector público, en entidades de orden nacional y de orden departamental. Se calcula a través de la ponderación de diferentes preguntas, provenientes del Formulario Único de Reporte de Avances de la Gestión (FURAG) de Función Pública y la Encuesta de Desempeño Institucional (EDI) del DANE. Estas preguntas corresponden a los cuatro pilares que componen el índice, como lo muestra la figura a continuación.

Image for post
Fuente: EiP — DNP.

El progreso de este proyecto se ha estado documentando también en GitHub:
https://github.com/FoxHound112263/Innovation-Index-Algorithms.

3. Medición de la calidad de las bases del Portal de Datos Abiertos de Colombia

Problema público: según el índice OurData de la OCDE, Colombia es país líder en la publicación de datos abiertos, pero la calidad de esta información no es la mejor y por ende su uso es más bajo. El objetivo entonces fue crear un prototipo de herramienta que permita analizar la calidad del Portal de Datos Abiertos de Colombia o la salud de cualquier base de datos que quiera publicarse en formato abierto.

Enfoque de ciencia de datos utilizado: programación funcional y construcción de una aplicación.

Software libre utilizado: lenguajes de programación R y Python.

Análisis: hablando de cooperación, este proyecto es un esfuerzo conjunto entre la Unidad de Científicos de Datos y el Equipo de Innovación Pública del DNP, que trata de evaluar la utilidad de conjuntos de datos específicos para los propósitos de cualquier persona (académico/a, emprendedor/a, etc.). Este proyecto nace ante la falta de un filtro en el Portal de Datos Abiertos y ante la continua disminución en apertura de datos que reporta el Open Data Index para el país desde 2015, pues no se puede tener una real apertura sin datos de calidad. En el momento, el Ministerio TIC, la Alta Consejería para la Transformación Digital, Prosperidad Social y Presidencia han mostrado interés y apoyo en la iniciativa. Se tienen planteados dos productos: un ‘módulo’ escrito en Python para programadores y una aplicación escrita en R cuya interfaz permite que cualquier usuario pueda realizar consultas. El primer prototipo de la aplicación luce de la siguiente manera:

Image for post
Fuente: EiP — DNP.

¿Cómo se da la gobernanza de los datos en Colombia?

En el año 2018, Colombia fue el primer país de América Latina con una política para la explotación de datos, con la aprobación del documento CONPES 3920 de Big Data. Un hecho que ha marcado un antes y un después en materia de aprovechamiento de datos para la generación de valor público, gracias a los cuatro ejes que quedaron consagrados: generación de datos, cultura de datos, capital humano y un marco jurídico, ético e institucional.

En las bases del Plan Nacional de Desarrollo 2018–2022, el capítulo de transformación digital enfatiza en la importancia de masificar las TIC, acelerar la inclusión social digital y de empoderar a los ciudadanos y hogares en el entorno digital, tanto en las ciudades como en territorio. Como estrategias para cumplir dichos objetivos se encuentran la formación de capitual humano, la masificación de la banda ancha y por supuesto, generar valor social y económico con la infraestructura de datos.

“Colombia debe encaminarse hacia una sociedad digital y hacia la industria 4.0”.

De igual manera, en el PND se encuentra publicado el capítulo de innovación pública donde se constata el valor de la unión entre innovación y ciencia de datos para la generación de políticas públicas. Uno de los objetivos planteados en esta sección es el de promover una mentalidad y cultura afines a la innovación, donde la cultura de datos es clave para fortalecer la toma de decisiones basadas en evidencia; pues, qué mejor timón de esta estrategia que el petróleo del siglo XXI: los datos.

Finalmente, en noviembre 2019, se aprobó el CONPES 3975 de transformación digital e inteligencia artificial, otro documento que contribuye en la carrera por impulsar la productividad y favorecer el bienestar de los ciudadanos. Esta política demuestra que el gobierno no ha perdido el impulso en la disminución de brechas digitales y en la preparación del país para enfrentar los cambios que traerá consigo la inteligencia artificial. Este documento apenas marca el comienzo del futuro digital del país.

Las habilidades sí importan

Como respuesta a los avances tecnológicos que hemos tenido como país, Colombia ha entendido la importancia de que en todos los sectores, incluido el sector público, los empleados se capaciten y fortalezcan sus competencias de cara a la 4RI. En Colombia, por ejemplo, se ha evidenciado la voluntad de conformar equipos de trabajo pluridisciplinarios, con un componente fuerte de ciencia de datos, tanto en el gobierno como en la academia, la sociedad civil y el sector privado.

Un claro ejemplo que ilustra esto en el sector público es la conformación de la Unidad de Científicos de Datos (UCD) del Departamento Nacional de Planeación (DNP), que desde el 2017 y hasta la fecha, ha impulsado numerosos proyectos de analítica de datos para la creación de políticas públicas. También, el enfoque voluntario del Equipo de Innovación Pública (EiP) del DNP que ha seguido la tendencia y se ha sumado a los esfuerzos de aprovechar los datos y co-crear soluciones a los dolores colectivos que enfrentamos. Por otro lado, el programa que MinTic está financiando llamado “Data Science 4 All”, llevado a cabo por la empresa Correlation One, está capacitando a 350 personas en ciencia de datos provenientes de todos los sectores. No sobra mencionar, que aproximadamente un 10% de las personas tomando las capacitaciones son mujeres, lo cual refleja la misma proporción que en las carreras STEM ( Science, Technology, Engineering and Mathematics), un problema que todavía tenemos que resolver como sociedad.

Image for post
Foto tomada de Twitter.

Además, en el ecosistema más amplio, Colombia cuenta con iniciativas más avanzadas y maduras provenientes de otros sectores como DataSketch, los grupos de investigación de las Universidades de Los Andes, Nacional y Distrital, la alianza pública privada Alianza CAOBA, o, incluso, la apertura de Landing AI en Medellín, empresa de Andrew Ng, fundador de Coursera y co-fundador de Google Brain, confiando en el talento que demostró el país para la ciencia de datos.

Desafíos latentes

Así como la ciencia de datos ha demostrado ser una solución a múltiples problemas, es necesario acotar sus alcances. Es común que se defina como una promesa capaz de solucionarlo todo: cuando no es así. Lo anterior se ve reflejado especialmente en las populares competencias de Hackathones, DataJams y similares, donde se ha convertido en prácticamente una moda utilizar ciencia de datos por el simple hecho de hacerlo, sin entender sus limitaciones o el contexto real de los problemas.

Desconocer al usuario

Para un reto donde el beneficiado es un campesino, no se puede pensar en construir aplicaciones para celular cuando en primer lugar, todavía enfrentamos problemas de conectividad, y, en segundo lugar, seguramente el campesino tendrá necesidades básicas prioritarias que no solventan una aplicación. De este modo, no tiene que pensarse en la ciencia de datos como una navaja suiza, sino en una herramienta más del repertorio que tiene propósitos específicos, pero generalizables dependiendo de las circunstancias.

La experiencia de todos los sectores a lo largo de los últimos años dejan varias lecciones sobre las oportunidades de innovación que existen: articulación entre entidades, infraestructura, calidad y acceso a los datos, un mejor marco legal, principios éticos, entre otras que demuestran la falta de madurez en la política de datos.

En Colombia todavía existen muchas barreras y fricciones para la cooperación, donde muchas iniciativas se hacen de manera individual y terminan convirtiéndose en una carrera para demostrar supremacía en el tema. Sumado a esa dificultad entre entidades, dentro de muchas organizaciones prima la cultura de lo tradicional, con resistencia a los beneficios del cambio e incluso temor a la tecnología. La innovación pública se encarga de mitigar este problema a través de la cultura de datos y la difusión de sus beneficios.

Marco ético

El marco ético es uno de los aspectos de mayor preocupación dada la incertidumbre actual sobre el futuro de varios empleos, la desinformación sobre la Inteligencia Artificial y el uso de la información personal. Algo que es seguro de afirmar es que los principios éticos no bastan para afrontar los desafíos sobre uso ético de IA cuando existen de por medio diferencias normativas y políticas, limitando su impacto en el diseño de políticas públicas. Cada vez es más común que se escriban documentos sobre IA responsable, confiable, beneficiosa, entre otros, pero detrás de la filantropía hay movimientos financieros y agendas económicas que bien podrían ignorar los consensos.

En la materia los desafíos son latentes, hay que: encontrar acuerdos comunes a través de consensos, demostrar a través de evidencia que los principios se ponen en práctica, y mecanismos legales robustos. ¿Qué hace falta para lograr esto? Entender la ética como un proceso que debe ir de la mano de regulaciones, pues la tecnología debe entenderse es muchos casos como una herramienta, no una solución.

El panorama no es tan sombrío, a fin de cuentas son las personas e instituciones quienes cuentan con la capacidad de darle un uso adecuado a la IA. Habrá bastante trabajo durante el futuro próximo que involucre no solo la solución a estos retos, sino el compromiso de quienes trabajamos en el área por generar propuestas con visión de largo plazo y sostenibles, que no se estanquen en el hecho de tener buenas intenciones, y en su lugar actuar por transformar nuestro país.

Equipo de Innovación Pública (EiP)
Departamento Nacional de Planeación (DNP)
Nota: este artículo fue producido por personas que prestan o prestaron sus servicios profesionales al DNP y no compromete en ningún sentido a la organización.

Texto: Camilo Mayorquin / Co-creación EiP

Written by

Habilitamos la innovación en respuesta a retos públicos. Grupo Modernización del Estado, Departamento Nacional de Planeación (DNP), Colombia.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store