分隔符的使用

分隔符的使用制表符分隔值 TSV 文件格式表示用纯文本格式的制表符分隔的数据



一、制表符 ‘\t’:通常用于TSV(制表符分隔值)文件

pd.read_csv('data.tsv', sep = '\t')

什么是TSV文件?
制表符分隔值 (TSV) 文件格式表示用纯文本格式的制表符分隔的数据。该文件格式类似于 CSV,用于以结构化方式组织数据,以便在不同应用程序之间导入和导出。该格式主要用于电子表格应用程序和数据库中的数据导入/导出和交换。 TSV 文件中的每条记录都包含在单行文本文件中,其中每个字段值由制表符分隔。 TSV 文件格式的媒体类型是文本/制表符分隔值。
在这里插入图片描述

二、空格 (’ '):有时数据列之间仅用单个空格分隔。

pd.read_csv('data.txt', sep = ' ')

三、逗号 (,):这是 CSV 文件中最常见的分隔符。

pd.read_csv('data.csv', sep = ',')

四、正则表达式:如果数据文件中使用了不规则的空白(如多个空格或组合空格和制表符),可以使用正则表达式来指定 sep。

pd.read_csv('data.txt', sep = '\s+')

编程小号
上一篇 2025-01-08 16:01
下一篇 2025-01-08 15:51

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/bian-cheng-ji-chu/105355.html