Description
PyconAR 2016 - Bahía Blanca
Procesamiento del Lenguaje Natural en el Congreso de la Nación por Ignacio Heredia, Martin Elias Costa
Audience level: Intermedia
Descripción
En esta charla contaremos cómo implementamos una herramienta en Python que permite categorizar de forma sugerida (mediante aprendizaje automático), y reconocer temáticas repetidas (mediante procesamiento del lenguaje natural) aplicado al manejo de información de los informes mensuales que envía el Congreso Nacional al Poder Ejecutivo.
Resumen
El Congreso de la Nación envía cada mes un pedido de informe al Poder Ejecutivo Nacional con 1.000 preguntas. Estas deben ser organizadas y categorizadas para recolectar toda la información relevante, repartida entre todas las dependencias del Estado.
Al no estar estructurada, el manejo de este tipo de información es costoso y consume mucho esfuerzo humano. Hay que identificar manualmente temáticas y asignar áreas responsables que se encarguen de redactar las respuestas.
Las técnicas actuales del procesamiento del lenguaje natural (NLP) y aprendizaje automático (machine learning) permiten agilizar estos procesos y lograr una mejor dinámica al momento de generar los informes.
En esta charla contaremos cómo implementamos una herramienta en Python que permite categorizar de forma sugerida (mediante aprendizaje automático), y reconocer temáticas repetidas (mediante procesamiento del lenguaje natural).
Slides
https://github.com/datosgobar/presentacion-nlp-congreso-nacion