Ang datos (Ingles: data) ay isang koleksyon ng mga magkakahiwalay o tuloy-tuloy na halaga na nagdadala ng impormasyon, na isinasalarawan ang kantidad, kalidad, katunayan, estadistika, ibang pangunahing yunit ng kahulugan, o simpleng mga pagkakasunod-sunod ng mga simbolo na maaari pang pormal na mabigyan ng kahulugan. Ang dato (Ingles: datum) ay isang indibiduwal na halaga sa isang koleksyon ng datos. Kadalasang nakaayos ang datos sa mga istraktura tulad ng talahanayan na nagbibigay ng karagdagang konteksto at kahulugan, at maaring gamitin ang mga ito mismo bilang datos sa mas malaking istraktura. Maaaring gamitin ang datos bilang mga baryable sa mga prosesong pangkompyutasyon.[1][2] Maaaring ikatawan ng datos ang mga ideyang komplikado o mga konkretong sukat.[3][4] Karaniwang ginagamit ang datos sa siyentipikong pananaliksik, ekonomika, at halos lahat ng iba pang anyo ng aktibidad ng organisasyon ng tao. Kabilang sa mga pangkat ng datos ang mga indeks ng presyo (tulad ng indeks ng presyong pangkonsyumer), antas ng kawalang trabaho, antas ng literasi, at datos ng senso.
Kinokolekta ang datos gamit ang mga pamamaraan tulad ng pagsukat, pagmamasid, pagtanong, o pagsusuri, at karaniwang kinakatawan bilang mga numero o karakter na maaaring maproseso pa. Ang datos sa field ay mga datos na kinokolekta sa isang hindi nakokontrol, in-situ na kapaligiran. Ang pang-eksperimentong datos ay datos na nabuo sa kurso ng isang kontroladong siyentipikong eksperimento. Sinusuri ang datos gamit ang mga diskarte gaya ng pagkalkula, pangangatwiran, talakayan, presentasyon, biswalisasyon, o iba pang anyo ng pagkatapos na pagsusuri. Bago ang pagsusuri, ang hilaw na datos (o hindi naprosesong datos) ay karaniwang nililinis: Inaalis ang mga outlier o datos na nasa labas ng katamtamang halaga, at itinatama ang mga halatang kamalian sa instrumento o pagpasok ng datos.
Nakikita ang datos bilang ang pinakamaliit na yunit ng makatotohanang impormasyon na maaaring gamitin bilang batayan para sa pagkalkula, pangangatwiran, o talakayan. Maaaring mula ang datos sa ideyang komplikado hanggang sa mga konkretong sukat, kabilang ang, subalit hindi limitado sa, mga estadistiko. Ang datos na tematikong konektado na ipinapakita sa ilang nauugnay na konteksto ay maaaring tingnan bilang impormasyon. Ang mga piraso ng impormasyon na konektado sa konteksto ay maaaring ilarawan bilang mga pananaw sa datos o katalinuhan. Ang istak ng mga pananaw at katalinuhan na naipon sa paglipas ng panahon na nagreresulta mula sa sintesis ng datos sa impormasyon, ay maaaring ilarawan bilang kaalaman. Inilarawan ang datos bilang "ang bagong langis ng dihital na ekonomiya".[5][6] Tumutukoy ang datos, bilang pangkalahatang konsepto, sa katotohanang ang ilang umiiral na impormasyon o kaalaman ay kinakatawan o nakakodigo sa ilang anyo na angkop para sa mas mahusay na paggamit o pagproseso.
Ang mga pag-unlad sa mga teknolohiya sa kompyutasyon ay humantong sa pagdating ng malaking datos, na karaniwang tumutukoy sa napakalaking dami ng datos, kadalasan sa sukat ng petabyte. Gamit ang mga tradisyunal na pamamaraan ng pagsusuri ng datos at kompyutasyon, mahirap ang pagtatrabaho sa ganoong malalaki (at lumalaki) na mga dataset o pangkat ng datos, kahit imposible. (Sa teorya, magbubunga ang walang katapusan na datos ng walang katapusang impormasyon, na magiging dahilan ng pagkuha ng mga pananaw o katalinuhan na imposible.) Bilang tugon, gumagamit ang medyo bagong larangan ng agham ng datos ng pagkatuto ng makina (at iba pang artipisyal na intelihensiya) na mga pamamaraan na nagbibigay-daan para sa mahusay na paglapat ng mga analitikong pamamaraan sa malaking datos.