SSE4 (Streaming SIMD Extensions 4) este un set de instrucțiuni SIMD pentru CPU utilizat în microarhitectura Intel Core(d) și AMD K10 (K8L)(d). Acesta a fost anunțat la 27 septembrie 2006, la Forumul dezvoltatorilor Intel(d) din toamna anului 2006, cu detalii vagi într-o carte albă(d);[1] detalii mai precise despre 47 de instrucțiuni au devenit disponibile la Forumul dezvoltatorilor Intel din primăvara anului 2007 de la Beijing, în prezentare.[2] SSE4 a extins setul de instrucțiuni SSE3(d) care a fost lansat la începutul anului 2004. Toate programele care utilizează instrucțiunile Intel SIMD anterioare (ex. SSE3) sunt compatibile cu microprocesoarele moderne care acceptă instrucțiunile SSE4. Toate programele existente continuă să ruleze corect, fără modificări, pe microprocesoarele care încorporează SSE4, precum și în prezența aplicațiilor existente și noi care încorporează SSE4.[3]
La fel ca alte seturi de instrucțiuni SIMD CPU din generația anterioară, SSE4 acceptă până la 16 registre, fiecare cu o lățime de 128 de biți, care pot încărca patru numere întregi pe 32 de biți, patru numere în virgulă mobilă cu precizie simplă pe 32 de biți sau două numere în virgulă mobilă cu precizie dublă pe 64 de biți.[1] Operațiile SIMD, cum ar fi adunarea/multiplicarea vectorială a elementelor și adunarea/multiplicarea vectorială scalară, procesează mai mulți biți de date într-o singură instrucțiune CPU. Operația paralelă împachetează creșteri notabile ale performanței. SSE4.2 a introdus noi operații SIMD pentru șiruri de caractere, inclusiv o instrucțiune pentru compararea a două fragmente de șir de caractere de până la 16 octeți fiecare.[1] SSE4.2 este un subset al SSE4 și a fost lansat la câțiva ani după lansarea inițială a SSE4.