CSV全称Comma Separated Values是”逗号分隔值”的英文缩写.通常是纯文本文件,可以被文本编辑软件,Excel或WPS表格打开.
基本规则
- 开头不留空,以行为单位;
- 列名(标题)放在第一行(可忽略不加列名);
- 每一行数据以换行结束,无空行;
- 以半角逗号作分隔符,列为空也要表达其存在;
- 列内容如存在半角逗号则用半角引号(“”)将该字段值包含起来;
- 列内容如存在半角引号则需要使用半角双引号(“”)转义,并用半角引号(“”)将该字段值包含起来;
- 文件读写时引号,逗号操作规则互逆;
- 内码格式不限,可为 ASCII、Unicode 或者其他;
- 不支持特殊字符.
示例
- 商品.csv
1 | 商品,分类,备注 |
- 解析结果
商品 | 分类 | 备注 |
---|---|---|
西红柿 | 水果, 蔬菜 | 有营养的水果蔬菜 |
苹果 | 水果 | 当地瓜农”吴大妈”都说好 |
哈密瓜 | 水果 | 来自新疆新鲜的哈密瓜, 当地瓜农刘大爷”都说好” |
总结
- 包含逗号,双引号,或是换行符的字段必须放在引号内;
- 字段内部的引号必须在其前面增加一个引号来实现文字引号的转码,如苹果商品这一行;
- 分隔符逗号前后的空格可能不会被修剪掉(RFC 4180要求),如西红柿商品这一行.
- 元素中的换行符将被保留下来,如哈密瓜商品这一行.