HomoloGene é unha ferramenta do Centro Nacional para a Información Biotecnolóxica (NCBI) utilizada como sistema de detección automática de homólogos (similitude atribuible á descendencia dun antepasado común) entre os xenes anotados de varios xenomas eucariotas completamente secuenciados.[1][2][3]
O procesamento que fai HomoloGene consiste na análise de proteínas dos organismos con entrada. As secuencias compáranse por medio de blastp, despois emparéllanse e agrúpanse utilizando unha árbore taxonómica construída a partir da similitude de secuencias, na que os organismos máis estreitamente relacionados se emparellan primeiro e logo engádense os seguintes á árbore. As aliñacións de proteínas asígnanse ás súas secuencias de ADN correspondentes; logo, as distancias métricas tales como as de Jukes & Cantor (1969) ou a taxa Ka/Ks tamén se poden calcular.[2]
As secuencias emparéllanse utilizando un algoritmo heurístico para maximizar a puntuación global nunha coincidencia bipartita (véxase grafo bipartito completo), máis que a nivel local. E logo,calcúlase a significación estatística de cada parella. En cada posición realízanse puntos de corte e establécense valores de Ks para evitar falsos ortólogos cando sexan agrupados; ademais, os parálogos son identificados pola busca de secuencias entre as especies máis relacionadas.[4]