HomoloGene

HomoloGene es una herramienta del Centro Nacional para la Información Biotecnológica (NCBI) que es utilizada como sistema de detección automática de homólogos (similitud atribuible a la descendencia de un ancestro común) entre los genes anotados de varios genomas eucariotas completamente secuenciados.[1][2][3]

El procesamiento de HomoloGene consiste en el análisis de proteínas de los organismos de entrada. Las secuencias se compararon mediante blastp,[4]​ a continuación, los empareja y agrupa, utilizando un árbol taxonómico construido a partir de la similitud de secuencias, donde los organismos más estrechamente relacionados se emparejan primero, y luego los siguientes son añadidos al árbol. Las alineaciones de proteínas se asignan a sus secuencias de ADN correspondientes; luego, las distancias métricas tales como las de Jukes & Cantor (1969) o la tasa Ka/Ks se pueden calcular.[2]

Las secuencias se emparejan utilizando un algoritmo heurístico para maximizar la puntuación global en una coincidencia bipartita (véase grafo bipartito completo), más que a nivel local. Y luego, se calcula la significación estadística de cada pareja. En cada posición se realizan puntos de corte, y se establecen valores de Ks para evitar falsos ortólogos cuando sean agrupados; además, los parálogos son identificados a través de la búsqueda de secuencias entre aquellas especies más relacionadas.[5]

  1. Vize, Peter D. (2004). «Internet tools for cell and developmental biologists». En Sansom, Clare; Horton, Robert M., eds. The Internet for Molecular Biologists: A Practical Approach (en inglés). Oxford University Press. p. 249. ISBN 978-01-9963-888-8. 
  2. a b Pevsner, Jonathan (2009). Bioinformatics and Functional Genomics (en inglés). John Wiley & Sons. pp. 951. ISBN 978-04-7008-585-1. 
  3. Baxevanis, Andreas D.; Ouellette, B. F. Francis (2004). Bioinformatics: A Practical Guide to the Analysis of Genes and Proteins (en inglés). John Wiley & Sons. p. 488. ISBN 978-04-7146-101-2. 
  4. «Blastp». 
  5. Schriml, Lynn M.; Sprague, Judy (2004). «Data Mining the Zebrafish Genome». En Detrich, H. William; Westerfield, Leonard I.; Zon, eds. The Zebrafish: Genetics, Genomics, and Informatics (en inglés). Academic Press. pp. 686. ISBN 978-01-2564-172-2. 

Developed by StudentB