El benchmark és un índex de referència que serveix per mesurar el rendiment d'un sistema, una organització o component d'aquest, per comparar-lo amb altres sistemes o organitzacions que tenen el mateix objectiu. La paraula benchmark és un anglicisme que es pot traduir com a «índex de referència».[1] L'operació de comparar mitjançant tal índex es diu benchmarking.
En informàtica es pot entendre que un benchmark és el resultat de l'execució d'un programa informàtic o un conjunt de programes en una màquina, amb l'objectiu d'estimar el rendiment d'un element concret, i poder comparar els resultats amb màquines similars. En termes d'ordinadors, una indexació de referència podria ser realitzada en qualsevol dels components, ja sigui CPU, RAM, targeta gràfica, etc. També pot ser dirigit específicament a una funció dins d'un component, per exemple, la unitat de coma flotant de la CPU, o fins i tot a altres programes.
La tasca d'executar un benchmark originalment es reduïa a estimar el temps de procés que porta l'execució d'un programa (mesura en general en milers o milions d'operacions per segon). Amb el transcurs del temps, la millora en els compiladors i la gran varietat d'arquitectures i situacions existents van convertir a aquesta tècnica en tota una especialitat. L'elecció de les condicions sota la qual dos sistemes diferents poden comparar entre si és especialment àrdua, i la publicació dels resultats sol ser objecte de candents debats quan aquests s'obren a la comunitat. Es converteix en una poderosa arma competitiva, mal realitzat pot fer perdre molts diners. Actualment es disposa de molts documents sobre com realitzar eficaçment estudis benchmarking. Si al llarg de l'estudi de benchmarking també pot realitzar-se un "benchmark de programari", és a dir comparar el rendiment d'un programari contra un altre o de part d'aquest, per exemple, comparar diferents consultes a una base de dades per saber quina és la més ràpida o directament parts de codi.