Reconocimiento de Entidades en Relatos de Denuncias mediante Aprendizaje Automático y Procesamiento de Lenguaje Natural
Abstract
En el presente trabajo se muestran las fases del desarrollo de una plataforma de reconocimiento, clasificación y visualización de entidades en relatos de denuncias. Estos relatos fueron provistos por el Ministerio Público Fiscal de la provincia de Salta. Los cinco tipos de entidades identificadas y clasificadas son: Persona, Barrio, Documento Nacional de Identidad (DNI), Teléfono y Patente. Para el desarrollo del módulo de visualización se emplearon tecnologías web, y para las tareas de procesamiento del lenguaje natural se empleó la librería spaCy. Fueron entrenados distintos modelos machine learning para la tarea de extracción y clasificación de entidades sobre los relatos suministrados mediante el uso de spaCy. En cuanto a la performance del proceso de clasificación de entidades, los resultados obtenidos cumplen con los objetivos y criterios de éxito propuestos en las fases iniciales, por lo cual la implementación del sistema es factible, o al menos de los modelos entrenados, en fiscalías y dependencias policiales.
Full Text:
PDFAsociación Argentina de Mecánica Computacional
Güemes 3450
S3000GLN Santa Fe, Argentina
Phone: 54-342-4511594 / 4511595 Int. 1006
Fax: 54-342-4511169
E-mail: amca(at)santafe-conicet.gov.ar
ISSN 2591-3522