Comma-separated values
Un article de Wikipédia, l'encyclopédie libre.
Comma-separated values | |
.csv |
|
text/csv |
|
Type de format : |
fichier texte |
Standard(s) : |
(en) RFC 4180 |
Spécification : |
Format ouvert |
Comma-separated values (CSV) est un format informatique ouvert représentant des données tabulaires sous forme de « valeurs séparées par des virgules ».
Ce format n'a jamais vraiment fait l'objet d'une spécification formelle. Toutefois, la RFC 4180 décrit la forme la plus courante et établit son type MIME "text/csv", enregistré auprès de l'IANA.
Un fichier CSV est un fichier texte (par opposition aux formats dit « binaires »). Chaque ligne correspond à une rangée du tableau et les cellules d'une même rangée sont séparées par une virgule.
Par exemple :
Sexe, Prénom, Année de naissance M,Alphonse,1932 F,Béatrice,1964 F,Charlotte,1970
représente les données suivantes :
Sexe | Prénom | Année de naissance |
---|---|---|
M | Alphonse | 1932 |
F | Béatrice | 1964 |
F | Charlotte | 1970 |
[modifier] Variantes
Le fait que les fichiers CSV soient essentiellement utilisés autour du logiciel Microsoft Excel, et que les séparateurs ne soient pas standardisés (virgules, points-virgules (sous certaines localisations dont la française), etc.) rend ce format peu pratique pour une utilisation autre que des échanges de données ponctuelles. Ce format est toutefois assez populaire parce qu'il est relativement facile à générer.
Les champs texte peuvent également être délimités par des guillemets (1). Lorsqu'un champ contient lui-même des guillemets (2), ils sont doublés afin de ne pas être considérés comme début ou fin du champ. Si un champ contient le séparateur (3) (virgule, points-virgules, etc.), il est obligatoire d'ajouter des guillemets afin que le séparateur soit échappé.
Exemple, avec des champs séparés par des points-virgules et des guillemets :
Robert;Dupont;rue du Verger, 12;... (1) " Michel " ; " Durand " ; " av. de la Ferme, 89 ";... (2) " Michel ""Michele"" " ; Durand ; " av. de la Ferme, 89 ";... (3) " Michel;Michele " ; " Durand ";" av. de la Ferme, 89 ";...
[modifier] Alternatives
Le format SYLK présente l'avantage d'être un format texte et d'être indépendant de la langue d'Excel. Il peut intégrer des formules mathématiques simples et contrôler certaines propriétés des cellules. De plus, les cellules du tableur peuvent être remplies dans le désordre.
Dans certains cas, il peut être remplacé par des fichiers XML ou de tableurs bureautique (ODS, format propriétaire XLS).
Il est cependant utile pour échanger des données entre des tableurs et des bases de données n'ayant pas d'autre format de fichier en commun.
[modifier] Voir aussi
- (en) RFC 4180: Common Format and MIME Type for Comma-Separated Values (CSV) Files
- csvdiff
- CSVed
- Format TSV