Identificación de propiedades algebraicas en secuencias biológicas (DNA, mRNA, proteínas) a través de códigos correctores de errores.

Proyecto: Investigación

Detalles del proyecto

Descripción

Entender la manera en que la información genética es almacenada, como mensajes hereditarios, y procesada para realizar la síntesis de proteínas funcionales, es un desafío de alto interés para áreas como la: farmacéutica (producción de medicamentos) y biotecnología (nuevas enzimas), entre otras. Esto se basa en el hecho de que la información genética permite la variabilidad y el correcto funcionamiento de los organismos vivos donde las proteínas funcionales participan, directa e indirectamente, en todos los procesos dentro de la célula y son responsables por: la catálisis de reacciones bioquímicas, transporte de moléculas y por la formación de estructuras básicas como: piel, cabello, entre otras [4, 20. En [14, 12, 23, 11, se mostró que algunos genomas y algunas secuencias de nucleótidos (ADN y mARN) y aminoácidos tienen una estructura relacionada con códigos correctores de errores, estructura utilizada en los sistemas tradicionales de comunicación digital. En estos trabajos se utilizan códigos BCH para identificar dichas secuencias biológicas dado que estos códigos tienen una estructura bien conocida y son fáciles de diseñar, a pesar que el modelo permite el uso de otro tipo de códigos correctores de errores [13. Sin embargo, los códigos BCH son limitados en tamaño y son cíclicos, propiedades que las secuencias biológicas no satisfacen. Dado lo anterior se propone diseñar un algoritmo que sea capaz de identificar secuencias biológicas como palabras-código de códigos de diferentes tamaños (al menos tamaño impar), es decir, se pretende flexibilizar la restricción del tamaño, para así, poder analizar una mayor cuantía de secuencias biológicas que las estudiadas en los algoritmos introducidos en la literatura; esto permitirá explorar, utilizando diferentes proteínas, las implicaciones biológicas de la estructura matemática de las secuencias de aminoácidos y nucleótidos. Adicionalmente, se propone el uso de otro tipo de códigos como lo son los códigos anidados y multinivel. En [2, 3 se sugiere que la información genética, codificada en el ADN, tiene una estructura similar a la de códigos correctores de errores anidados, sin embargo, según el conocimiento del autor, en la literatura no se encuentran construcciones de tales códigos que sean capaces de identificar secuencias de ADN. Por lo tanto, en este proyecto de investigación se pretende construir por primera vez códigos anidados que sean capaces de identificar secuencias de ADN, para así, verificar la hipótesis establecida en [2, 3. En [11, se utiliza el concepto de códigos concatenados para identificar proteínas como palabras código de códigos cíclicos sobre alfabetos Z_20 y ¿¿_4 "x" Z¿_5. En esta dirección, los códigos multi-nivel pertenecen a la clase de códigos concatenados, los cuales pueden ser utilizados para representar proteínas y permiten un mapa casado con el código genético. Este enfoque aún no ha sido utilizado en la literatura (según el conocimiento del autor). En [7, por primera vez, se intenta dar un significado biológico a los resultados obtenidos a través de la teoría de codificación. A pesar de lo mostrado en dicho trabajo, el uso de códigos correctores de errores continúa siendo un enfoque teórico. En este proyecto, se intentará explicar los resultados matemáticos obtenidos en un contexto biológico, para esto, se realizarán análisis taxonómicos, filogenéticos y de mutaciones.}
EstadoFinalizado
Fecha de inicio/Fecha fin01/08/1730/06/19

Financiación de proyectos

  • Interna
  • PONTIFICIA UNIVERSIDAD JAVERIANA