GenBank | ||
---|---|---|
Tipo | Base de datos de secuencias de nucleótidos con información bibliográfica y anotación biológica | |
Fundación | 1982 | |
Sede central | Centro Nacional para la Información Biotecnológica (NCBI) | |
Sitio web | www.ncbi.nlm.nih.gov/genbank | |
[1] | ||
GenBank es la base de datos de secuencias genéticas del NIH (National Institutes of Health de Estados Unidos), una colección de disponibilidad pública de secuencias de ADN. Realiza una puesta al día cada dos meses.[2]
GenBank es parte de International Nucleotide Sequence Database Collaboration, que está integrada por la base de datos de ADN de Japón (DNA DataBank of Japan (DDBJ)), el Laboratorio Europeo de Biología Molecular (European Molecular Biology Laboratory (EMBL)), y GenBank en el National Center for Biotechnology Information (NCBI). Estas organizaciones intercambian datos diariamente. GenBank y sus colaboradores reciben secuencias genéticas producidas en laboratorios de todo el mundo, procedentes de más de 500 000 especies formalmente descritas.[3] GenBank continua creciendo a ritmo exponencial, doblando la cantidad de información contenida cada 18 meses.[3][4] Según la documentación de la versión 250.0 de GenBank, a fecha de junio de 2022, la base de datos contiene más de 2 450 millones de secuencias, comprendiendo más de 17 billones de bases de nucleótidos.[5]
Las comunicaciones directas con GenBank se hacen utilizando BankIt, que es un formato basado en la Web, o el programa independiente Sequin. Tras la recepción de una secuencia, el personal de GenBank asigna un número de acceso a la secuencia y realiza controles de calidad. Luego, las presentaciones son publicadas en la base de datos pública, en donde las entradas son recuperables por Entrez o se puede descargar por FTP. La mayoría de las presentaciones de Expressed Sequence Tag (EST), Sequence Tagged Site (STB), Genome Survey Sequence (SSG) y High-Throughput Genome Sequence (HTGS) son presentadas por los grandes centros de secuenciación. El grupo de presentaciones directas de GenBank también procesa las secuencias completas del genoma microbiano.