Big data[1][2] er et begreb indenfor datalogi, der bredt dækker over indsamling, opbevaring,[3] analyse,[4] processering og fortolkning af enorme mængder af data. Som mange andre IT-ord har big data ingen dansk oversættelse.
Rammerne for big data har gennem årene rykket sig kraftigt. Man har således bevæget sig fra en opfattelse af gigabyte data som værende store datamængder, til at man i 2012 snakkede om petabyte og exabyte som store mængder.[5][6] Tendensen i retning af større datasæt har grundlag i muligheden for at trække supplerende information fra analyse af et enkelt sæt af stor mængde sammenhængende data, i sammenligning med adskilte, mindre sæt med den samme totale mængde data, der giver mulighed for at finde sammenhænge så man kan "spotte forretningstrends, fastslå forskningskvalitet, forebygge sygdomme, sammenholde juridiske citater, bekæmpe kriminalitet og holde øje med trafikforhold i realtid."[7][8]
I 2012 produceredes der på internettet enorme mængder af data, for eksempel via sociale tjenester som Facebook og Flickr.
Big data produceres ofte i real-tid, af f.eks. GPS-enheder og digitale sensorer som er indlejret i biler, sygehusudstyr mm.
Man kan også have big data, som man ikke selv har en kopi af, men blot adgang til via API'er.
^Reichman, O.J.; Jones, M.B.; Schildhauer, M.P. (2011). "Challenges and Opportunities of Open Data in Ecology". Science. 331 (6018): 703-5. doi:10.1126/science.1197962. (engelsk)