Aplicacion de algoritmos de Inferencia Gramatical a la Prediccion de Sitios de Clivaje en Poliproteinas de la Familia Potyviridae.

  • Alvarez Vargas, Gloria Ines (Investigador principal)
  • Benitez Restrepo, Hernan Dario (Coinvestigador)
  • Jordan Osorio, Rafael Armando (Coinvestigador)
  • Linares Ospina, Diego Luis (Coinvestigador)
  • Bravo Montaño, Enrique (Asesor)
  • Garcia Gomez, Pedro (Asesor)
  • Lopez Rodriguez, Damian (Asesor)

Proyecto: Investigación

Detalles del proyecto

Descripción

Este proyecto se enfoca en el problema de prediccion de sitios de clivaje en poliproteinas de virus de la familia Potyviridae aplicando la tecnica de inferencia gramatical y comparandola con otras tecnicas comunmente usadas en problemas bioinformaticos. La prediccion de sitios de clivaje en polipeptidos y proteinas consiste en establecer las posiciones exactas sobre la cadena de aminoacidos en que estas macromoleculas son cortadas por peptidasas y proteinasas especificas, en los procesos de maduracion para la obtencion de productos funcionales. Estamos interesados en estudiar los sitios de clivaje en virus de la familia Potyviridae, que son virus de plantas, porque ellos son patogenos de cultivos de gran importancia economica y alimentaria para Colombia y predecir dichos sitios puede aportar al mejor entendimiento y el control de las enfermedades que estos virus causan, cuyos efectos van desde la baja en la produccion hasta la muerte de las plantas. al considerar las tecnicas computacionales mas adecuadas para resolver el problema de prediccion de sitios de clivaje, aparecen en primer termino metodos de aprendizaje automatico muy tradicionales en bioinformatica, como son los modelos ocultos de Markov o las redes neuronales. Sin embargo, la experiencia del grupo Destino en el campo de la inferencia gramatical le llevan a pensar que ella puede igualar o superar el desempeño de las tecnicas mas tradicionales en este problema de prediccion. Por las razones antes expresadas, queremos emprender este proyecto con el proposito de responder la siguiente pregunta: Pueden los algoritmos de inferencia gramatical predecir sitios de clivaje en poliproteinas de potyvirus con igual o mayor precision que tecnicas tradicionales en bioinformatica como redes neuronales o modelos ocultos de Markov? Nuestro objetivo es entonces desarrollar modelos para la prediccion de los nueve sitios de clivaje en la poliproteina de los virus pertenecientes a la familia Potyviridae, usando algoritmos de inferencia gramatical y comparar el desempeño de esta tecnica con los modelos ocultos de Markov y las redes neuronales. En este proceso vamos a aplicar algoritmos de inferencia gramatical como HyRPNI y OIL que nos permiten obtener modelos de los sitios. Posteriormente vamos a comparar el desempeño de los modelos obtenidos con inferencia gramatical contra otros obtenidos mediante redes neuronales y modelos ocultos de Markov, que han demostrado eficacia para la prediccion de sitios de clivaje en otros sistemas moleculares. Finalmente, vamos a construir una herramienta software para la segmentacion automatica de poliproteinas potyvirales. El programa usara los mejores modelos desarrollados durante el proyecto. El metodo propuesto es experimental: partiendo de las secuencias disponibles en bases de datos de dominio publico, diseñaremos y realizaremos experimentaciones conducentes a validar o refutar nuestra hipotesis de trabajo, la cual dice que los algoritmos de inferencia gramatical, en cuyo desarrollo hemos participado en los años anteriores, pueden ser aplicados exitosamente a la deteccion de los patrones que permitan predecir la ubicacion de los sitios de clivaje en poliproteinas provenientes de genomas de virus de la familia Potyviridae. Los criterios de evaluacion de los modelos obtenidos por las distintas tecnicas seran los que normalmente se aplican en estos casos: sensibilidad, especificidad, precision y coeficiente de correlacion. adicionalmente, adelantaremos un proceso de desarrollo de software con el fin de construir una la aplicacion que haga prediccion automatica, la cual tendra una version web. Para esta parte del proyecto, las etapas de trabajo seran las de analisis, diseño, implementacion, pruebas y optimizacion. Esta aplicacion de software sera uno de los principales resultados del proyecto, ella sera liberada como software libre en los sitios web de los tres grupos de investigacion participantes: Destino (Universidad Javeriana Cali), Grupo de Microbiologia y Biotecnologia ambiental (Universidad del Valle) y Grupo TLCC (Universidad Politecnica de Valencia, España) y tambien sera socializada entre grupos pares en el tema a nivel nacional e internacional. Esta aplicacion facilitara el analisis, la comparacion y la anotacion de secuencias de potyvirus depositadas en los bancos de datos u obtenidas por investigadores en el campo de la virologia vegetal. ademas, el producto de esta investigacion puede contribuir al desarrollo de herramientas informaticas para el diagnostico y la ubicacion taxonomica de aislados de estos virus. Otros resultados del proyecto seran la generacion de dos articulos cientificos, una ponencia y la formacion de dos estudiantes a nivel de maestria. De otro lado, el proyecto permitira el fortalecimiento de la linea de investigacion en bioinformatica del Grupo Destino de la Pontificia Universidad Javeriana Cali y el estrechamiento de las relaciones academicas y cientificas de este grupo con el Grupo de Microbiologia y Biotecnologia ambiental de la Universidad del Valle y con el grupo TLCC de la Universidad Politecnica de Valencia en España.
EstadoFinalizado
Fecha de inicio/Fecha fin08/11/1108/11/13

Estado del Proyecto

  • Terminado