RefSeq | ||
---|---|---|
Tipo | Base de datos de secuencias genómicas curadas y no redundantes | |
Sede central | Centro Nacional para la Información Biotecnológica (NCBI) | |
Sitio web | https://www.ncbi.nlm.nih.gov/RefSeq | |
RefSeq (de The Reference Sequence en Inglés) es la base de datos pública de secuencias de ácidos nucleicos (ADN y ARN) y proteínas, anotadas y curadas, del Centro Nacional para la Información Biotecnológica (NCBI).[1] RefSeq comenzó a funcionar en el año 2000[2][3] y, a diferencia de GenBank, solo ofrece un registro por cada biomolécula, ya sea ADN, ARN o proteína, para los organismos más relevantes desde virus hasta bacterias y eucariotas.
Para cada organismo modelo, RefSeq guarda registros separados y enlazados para el ADN genómico, los transcritos y las proteínas resultantes de estos. Esta base de datos está limitada a los organismos más importantes, para los que hay disponible la suficiente información (121 461 organismos diferentes a fecha de julio de 2022)[4], mientras que GenBank incluye secuencias para cualquier organismo subido a la base de datos (aproximadamente 504 000 especies formalmente descritas).[5]