A base de datos de secuencias GenBank é unha colección anotada de acceso aberto de todas as secuencias de nucleótidos dispoñibles publicamente e as súas traducións a proteínas. É elaborada e mantida polo National Center for Biotechnology Information (NCBI; que forma parte dos National Institutes of Health dos Estados Unidos) como parte da International Nucleotide Sequence Database Collaboration (INSDC, Colaboración de bases de datos de secuencias de nucleótidos internacional).
GenBank e os seus colaboradores reciben secuencias producidas en laboratorios de todo o mundo de máis de 100.000 organismos vivos distintos, cuxo número crece constantemente. Esta base de datos fundárona en 1982 Walter Goad e o Los Alamos National Laboratory. GenBank converteuse nunha importante base de datos para a investigación no eido da bioloxía e está tendo un crecemento nos últimos anos a unha taxa exponencial, duplicándose aproximadamente cada 18 meses.[1][2]
A entrega 242.0, realizada en febreiro de 2021, contiña uns 12 billóns de bases nucleotídicas en máis de 2 mil millóns de secuencias.[3] GenBank vaise construíndo cos envíos de datos dos máis diversos laboratorios e polos envíos dos centros de secuenciación de ADN a grande escala.