CSV逗号分隔值格式文件(示例分析)

CSV全称Comma Separated Values是”逗号分隔值”的英文缩写.通常是纯文本文件,可以被文本编辑软件,Excel或WPS表格打开.

基本规则

  1. 开头不留空,以为单位;
  2. 列名(标题)放在第一行(可忽略不加列名);
  3. 每一行数据以换行结束,无空行;
  4. 以半角逗号作分隔符,列为也要表达其存在;
  5. 列内容如存在半角逗号则用半角引号(“”)将该字段值包含起来;
  6. 列内容如存在半角引号则需要使用半角双引号(“”)转义用半角引号(“”)将该字段值包含起来;
  7. 文件读写时引号,逗号操作规则互逆;
  8. 内码格式不限,可为 ASCII、Unicode 或者其他;
  9. 不支持特殊字符.

示例

  • 商品.csv
1
2
3
4
5
商品,分类,备注
西红柿,"水果, 蔬菜",有营养的水果蔬菜
苹果,水果,"当地瓜农""吴大妈""都说好"
哈密瓜,水果,"来自新疆新鲜的哈密瓜,
当地瓜农""刘大爷""都说好"
  • 解析结果
商品 分类 备注
西红柿 水果,   蔬菜 有营养的水果蔬菜
苹果 水果 当地瓜农”吴大妈”都说好
哈密瓜 水果         来自新疆新鲜的哈密瓜,
当地瓜农刘大爷”都说好”

总结

  • 包含逗号,双引号,或是换行符的字段必须放在引号内;
  • 字段内部的引号必须在其前面增加一个引号来实现文字引号的转码,如苹果商品这一行;
  • 分隔符逗号前后的空格可能不会被修剪掉(RFC 4180要求),如西红柿商品这一行.
  • 元素中的换行符将被保留下来,如哈密瓜商品这一行.