Développé par | Apache Software Foundation |
---|---|
Première version | [1] |
Dernière version | 1.12.0 ()[2] |
Dépôt | github.com/apache/avro |
Écrit en | Java, C, C++, C#, PHP, Python, Ruby, JavaScript, Perl et Rust |
Formats lus | Avro Object Container File (d), Apache Avro Schema file format (d), Apache Avro IDL Data (d) et Apache Avro Protocol Data (d) |
Formats écrits | Avro Object Container File (d), Apache Avro Schema file format (d), Apache Avro IDL Data (d) et Apache Avro Protocol Data (d) |
Type | Format de sérialisation de données (d) |
Licence | Licence Apache 2.0 |
Site web | avro.apache.org |
Avro est un framework de remote procedure call et de sérialisation de données élaboré au sein du projet Apache Hadoop. Il utilise JSON pour la définition des types de données et des protocoles, et sérialise les données dans un format binaire plus compact. La principale utilisation est dans Apache Hadoop, où il peut fournir à la fois un format de sérialisation pour les données persistantes, et un format "filaire" pour la communication entre les nœuds Hadoop, et de programmes client pour services Hadoop.
Il est similaire à Apache Thrift et Protocol Buffers, mais ne nécessite pas d'exécuter un programme de génération de code lors d'un changement de schéma (sauf si désiré pour les langages statiquement-typés).
Avro est reconnu et accepté par Apache Spark SQL comme source de données[3].