Identification of biological properties in organismsusing Machine Learning techniques on wholegenome sequences

Ferella, Nicolas; Pizio, Pablo

Documento de conferencia

Acceso Abierto

Identification of biological properties in organismsusing Machine Learning techniques on wholegenome sequences

Ferella, Nicolas

|

Pizio, Pablo

Título alternativo

Identificación de propiedades biológicas en organismos utilizando técnicas de Machine Learning sobre secuencias de genoma completo

Fecha de publicación

2023

Lugar de desarrollo

Laboratorio de Investigación y Formación en Informática Avanzada (LIFIA)

Centro CIC

Laboratorio de Investigación y Formación en Informática Avanzada (LIFIA)

Evento

Concurso de Trabajos Estudiantiles (EST 2023) - Jornadas Argentinas de Informática e Investigación Operativa J(AIIO 52) (Universidad Nacional de Tres de Febrero, 4 al 8 de septiembre de 2023)

Idioma

Español

Materia

Ciencias de la Computación e Información

Extensión

218-234

HDL 11746/12460

ISSN 2451-7496

Descargas

Documento completo (3.04 MB)

Enlace externo

https://revistas.unlp.edu.ar/JAIIO/article/view/18207/17875

Resumen

The advance in technology and genome sequencing processes in the recentdecades have made large volumes of biological data available to researchers fromall over the world, which, due to the large scales, are difficult to analyze in theirentirety. Therefore, it is intuitive to think of Artificial Intelligence to work withsuch information.In order to reduce the existing gap between the researchers and the ArtificialIntelligence tools, a software was developed that allows the creation of a works-pace for biological organisms, the processing of its corresponding genomes, andthe creation and training of models of Machine Learning, everything using asimple (yet powerful) graphical interface.The trained models are then analyzed to find which patterns determine theresult of the property that is being investigated on the biological organism,finding in the process the genes with the greatest impact on the model’s predic-tions, allowing the researcher to subsequently analyze the desired genes in thelaboratory, saving time and resources in the process

El avance de la tecnología y los procesos de secuenciación de genomas de las últimas décadas ha logrado poner al alcance de investigadores de todo el mundo grandes volúmenes de datos biológicos, que debido a su gran escala, los mismos resultan difíciles de analizar en su totalidad, por lo cual es intuitivo pensar en Inteligencia Artificial para trabajar con dicha información. Con el objetivo de disminuir la brecha existente entre el investigador y las herramientas de Inteligencia Artificial, se desarrolló un software que permite crear un espacio de trabajo para un organismo biológico, realizar el procesamiento de los genomas correspondientes y permitir la creación y entrenamiento de modelos de Machine Learning desde una interfaz gráfica. Los modelos entrenados luego se analizan para buscar qué patrones determinan el resultado de la propiedad biológica a investigar sobre el organismo biológico en cuestión, y así encontrar los genes de mayor impacto en las predicciones del modelo, permitiendo al investigador el posterior análisis en laboratorio de un gen deseado.

Palabras clave

Artificial Intelligence

Genetics

Big Data

DNA

Machine Learning

Inteligencia Artificial

Genética

Esta obra se publica con la licencia Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (BY-NC-SA 4.0)

Página completa del ítem

Identification of biological properties in organismsusing Machine Learning techniques on wholegenome sequences

Título alternativo

Título de investigación

Directores

Compiladores

Editores

Editorial

Fecha de publicación

Descripción

Emisor del título

Lugar de desarrollo

Centro CIC

Libro/Informe

Recursos relacionados

Evento

Nombre del evento

Idioma

Materia

Area temática

Clasificación FORD

Cobertura Espacial

Extensión

Descargas

Enlace externo

Resumen

Palabras clave

item.page.license