Aplicaciones de Aprendizaje Automático sobre Clusters de Compuestos Químicos

Axel J. Soto, Damián Palomba, Mónica F. Diaz, Gustavo E. Vazquez, Ignacio Ponzoni

Abstract


Las técnicas de inteligencia computacional o aprendizaje automático (machine learning) son de actual relevancia para el análisis y estudio de propiedades en compuestos químicos. En particular, para aquellos compuestos que son medicamentos, drogas o candidatos a drogas, resulta de vital importancia contar con técnicas computarizadas que asistan en la predicción de propiedades farmacocinéticas.
Una de las técnicas de vigente estudio y aplicación en el área de quimioinformática es QSAR/QSPR (Quantitative Structure Activity/Property Relationships). La misma consiste en el análisis de las relaciones existentes entre la estructura molecular de un compuesto químico y una determinada actividad o propiedad biológica. En este tipo de técnicas un compuesto químico tiene asociado un número de descriptores
moleculares, en donde cada descriptor representa una determinada característica del compuesto.
Por otra parte, dado que el espacio de posibles compuestos químicos capaces de ser sintetizados es extremadamente grande, las técnicas de análisis de agrupamientos (cluster analysis) resultan ser una herramienta de interés para la mejora en el entendimiento de las relaciones entre estructura y propiedad.
El presente trabajo tiene por objetivo analizar y mostrar las ventajas en la incorporación de clustering como parte del proceso de predicción de la hidrofobicidad de un compuesto. Se realizaron distintas alternativas de agrupamiento, procurando que dicha asociación sea de relevancia para la propiedad a modelar.
Para la tarea de predicción numérica de la hidrofobicidad, las redes neuronales es la herramienta mayormente usada. Los resultados obtenidos ponen en evidencia las ventajas de la división del conjunto muestral de datos en subconjuntos de menor tamaño, y la utilización de esa división en la tarea de
predicción.

Full Text:

PDF



Asociación Argentina de Mecánica Computacional
Güemes 3450
S3000GLN Santa Fe, Argentina
Phone: 54-342-4511594 / 4511595 Int. 1006
Fax: 54-342-4511169
E-mail: amca(at)santafe-conicet.gov.ar
ISSN 2591-3522