CpG-Inseln (engl. CpG islands, abgekürzt CGIs, gelegentlich auch als CG-Inseln bzw. CG islands bezeichnet) sind Regionen im Genom von Eukaryoten mit statistisch erhöhter CpG-Dinukleotid-Dichte. Diese Dichte wird auf die Einzelnukleotid- und Dinukleotidfrequenzen im gesamten betrachteten Genomausschnitt bezogen.
„CpG“ bezeichnet ein Zwei-Basen-Sequenzmotiv. Das „p“ (für Phosphorsäure oder bei einem pH-Wert von 7 Phosphat) wird häufig mit angegeben, um z. B. besser zwischen dem hier gemeinten CG innerhalb eines DNA-Strangs und der CG-Basenpaarung eines DNA-Doppelstranges zu unterscheiden (siehe CpG-Stelle).
Typische Definitionen für eine CpG-Insel verlangen einen Genomabschnitt von mindestens 400 bis 500 bp Länge, der einen durchschnittlichen G+C-Gehalt von mindestens 50 % aufweist und in dem ein CpG-Verhältnis (beobachtet zu erwartet) von mindestens 60 % vorliegt.[1] Der GC-Gehalt des menschlichen Gesamtgenoms liegt beispielsweise bei ungefähr 42 %[2] und ist somit deutlich geringer als der in den CpG-Inseln.
CpG-Inseln entstehen durch Mechanismen, die mit der Nutzung der Erbsubstanz als Informationsträger zu tun haben. Dadurch sind CpG-Inseln wichtige Markierungen, die z. B. für die Genetik, Medizin und Bioinformatik Bedeutung haben.
Sie sind nicht zu verwechseln mit der GC-Box, die 60–100 bp vor Beginn des Transkripts liegt.