RefSeq

RefSeq é unha base de datos pertencente ao NCBI.

A base de datos RefSeq (Reference Sequence, Secuencia de referencia)^[1] é unha colección de acceso aberto, anotada e revisada de secuencias de nucleótidos (de ADN e ARN) dispoñibles publicamente e dos seus produtos proteicos. Esta base de datos está sendo desenvolvida polo NCBI (National Center for Biotechnology Information dos Estados Unidos), e, a diferenza de GenBank, proporciona soamente un só rexistro para cada molécula biolóxica natural (é dicir, ADN, ARN, ou proteína) para organismos que van desde os virus ás bacterias e os eucariota.

Para cada organismo modelo, RefSeq pretende proporcionar rexistros separados e ligados do seu ADN xenómico, os transcritos dos xenes e as proteínas que se orixinan a partir deses transcritos. RefSeq está limitada a organismos para os cales hai datos suficientes (había datos de máis de 66.000 organismos especificamente “nomeados" en setembro de 2011),^[2] mentres que GenBank inclúe secuencias de calquera organismo do que se envíe información (aproximadamente 250.000 organismos especificamente nomeados).

↑ Pruitt KD, Tatusova T, Maglott DR (2005). "NCBI Reference Sequence (RefSeq): a curated non-redundant sequence database of genomes, transcripts and proteins.". Nucleic Acids Res 33 (Database issue): D501–4. PMC 539979. PMID 15608248. doi:10.1093/nar/gki025.
↑ RefSeq Release 80 Statistics (Informe). National Library of Medicine. 2017. Consultado o 13 de xaneiro de 2017.

[pmid15608248-1] Pruitt KD, Tatusova T, Maglott DR (2005). "NCBI Reference Sequence (RefSeq): a curated non-redundant sequence database of genomes, transcripts and proteins.". Nucleic Acids Res 33 (Database issue): D501–4. PMC 539979. PMID 15608248. doi:10.1093/nar/gki025.

[2] RefSeq Release 80 Statistics (Informe). National Library of Medicine. 2017. Consultado o 13 de xaneiro de 2017.

[1]

[2]