Reconocimiento de Entidades en Relatos de Denuncias mediante Aprendizaje Automático y Procesamiento de Lenguaje Natural

Edgar A. Rivera, Gustavo A. Rivera, Diego A. Rodriguez, Eduardo Xamena

Abstract


En el presente trabajo se muestran las fases del desarrollo de una plataforma de reconocimiento, clasificación y visualización de entidades en relatos de denuncias. Estos relatos fueron provistos por el Ministerio Público Fiscal de la provincia de Salta. Los cinco tipos de entidades identificadas y clasificadas son: Persona, Barrio, Documento Nacional de Identidad (DNI), Teléfono y Patente. Para el desarrollo del módulo de visualización se emplearon tecnologías web, y para las tareas de procesamiento del lenguaje natural se empleó la librería spaCy. Fueron entrenados distintos modelos machine learning para la tarea de extracción y clasificación de entidades sobre los relatos suministrados mediante el uso de spaCy. En cuanto a la performance del proceso de clasificación de entidades, los resultados obtenidos cumplen con los objetivos y criterios de éxito propuestos en las fases iniciales, por lo cual la implementación del sistema es factible, o al menos de los modelos entrenados, en fiscalías y dependencias policiales.

Full Text:

PDF



Asociación Argentina de Mecánica Computacional
Güemes 3450
S3000GLN Santa Fe, Argentina
Phone: 54-342-4511594 / 4511595 Int. 1006
Fax: 54-342-4511169
E-mail: amca(at)santafe-conicet.gov.ar
ISSN 2591-3522