Python删除文件中重复的内容「建议收藏」

编程汇总 • 2025-04-18 22:30 • 阅读 60

Python删除文件中重复的内容「建议收藏」1 背景在将多个文件进行合并时存在一个问题是许多文件中含有相同的内容但是希望合并后的文件内容具有唯一性即文件中的数据唯一不会有重复的情况 txt1 内容为 txt2 内容为希望合并后的文件内容为 123 234 456 123 254 456 123 234 456 254 2 程序核心代码 class train txt 文件中包含许多重复的内容

1.背景：在将多个文件进行合并时，存在一个问题是许多文件中含有相同的内容，但是希望合并后的文件内容具有唯一性，即文件中的数据唯一，不会有重复的情况

#txt1内容为：	#txt2内容为：	#希望合并后的文件内容为：
123 234 456	123 254 456	123 234 456 254

2.程序核心代码：

"""

class_train.txt文件中包含许多重复的内容，因此

剔除class_train.txt文件中重复的内容

input: class_train.txt

output: train.txt

"""



train_list = ['bottle_train.txt','chair_train.txt','diningtable_train.txt',

              'pottedplant_train.txt','sofa_train.txt','tvmonitor_train.txt']

train = 'train.txt'



train_data = set()



for i in train_list:

  

    f = open(i,'r')



    for line in f:

        if line[12:14] == ' 1': 

            train_data.add(line)

            

    f.close()



outfile=open(train,'w')



for i in list(train_data):

    outfile.write(i)



outfile.close()

编程小号

二进制减法运算算法,基本逻辑实现法_二进制减法法则

上一篇 2025-08-21 07:57

解决windowlocationhref不跳转的 BUG「建议收藏」

下一篇 2025-01-26 11:01

二进制减法运算算法,基本逻辑实现法_二进制减法法则 1737013036
2025年Netty in action—Netty中的ByteBuf[通俗易懂] 1737013035
linux命令chmod 777_chmod无法访问没有那个文件或目录 1737013028
2025年Python中通过PyPDF2实现PDF拆分「建议收藏」 1737013022
eclipse中svn_git打补丁解决冲突 1737013017
c++二叉树的先序,中序,后序遍历_二叉树的构造 1737013012
2025年CAS原理图_cas机制原理 1737013007
2025年OCR截图文字识别提取(无需安装)「建议收藏」 1737013005
ARM体系架构_armv7l是什么架构 1737013001
解决windowlocationhref不跳转的 BUG「建议收藏」 1737013041
2025年CD版本上线流程部署 1737013043
计算机修改虚拟ip,怎么样在电脑中设置虚拟IP地址？ 1737013045
2025年js三目运算符多条表达式_递归算法js 1737013051
常见的测试用例设计方法有哪些呢？「建议收藏」 1737013055
2025年MySQL数据库基础知识_MySQL数据库的特点 1737013058
UE4-＞Plugin 认识UE4插件 1「建议收藏」 1737013064
2025年java局域网发送文件_Java如何实现局域网文件传输代码案例分享 1737013069
2025年CDMA是什么网络类型_TD_LTE移动电话机 1737013077

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。
如需转载请保留出处：https://bianchenghao.cn/hz/125815.html

Python删除文件中重复的内容「建议收藏」

1.背景：在将多个文件进行合并时，存在一个问题是许多文件中含有相同的内容，但是希望合并后的文件内容具有唯一性，即文件中的数据唯一，不会有重复的情况

2.程序核心代码：

相关推荐