pandas根据某列去重

张

张建站

2026/4/24 11:59:51

10分钟阅读

pandas根据某列去重drop_duplicates(subset[‘comment’], keep‘first’, inplaceTrue)参数subset 列表的形式填写要进行去重的列名默认为 None 表示根据所有列进行。keep 可选参数有三个first、 last、 False 默认值 first。其中1first 表示保留第一次出现的重复行删除后面的重复行。2last 表示删除重复项保留最后一次出现。3False 表示删除所有重复项。inplace默认为 False 删除重复项后返回副本。True直接在原数据上删除重复项。使用 drop_duplicates 去除重复值如果不指明 subset 那么默认根据所有列来考虑即当某两行数据所有列都重复时进行去重。df df.drop_duplicates(keepfirst, inplaceTrue)现在设置 subset 为 comment 即可删除该列重复值。df df.drop_duplicates(subset[comment], keepfirst, inplaceTrue)注意:此时索引没有重置如有需要可使用 reset_index() 重置索引。df df.reset_index(dropTrue, inplaceTrue)

Java八股2000道！高频经典难题，实力解读（面试成功率达95%，涵盖Java全知识体系+Leetcode算法题+项目实战

多数的公司总体上面试都是以自我介绍项目介绍项目细节/难点提问基础知识点考核算法题这个流程下来的。有些公司可能还会问几个实际的场景类的问题，这个环节阿里是必问的，这种问题通常是没有正确答案的，就看个人的理解，个人的积累了…...

2026/4/24 11:59:14 阅读更多 →

BetterNCM插件管理器深度实战：解锁网易云音乐无限可能

BetterNCM插件管理器深度实战：解锁网易云音乐无限可能【免费下载链接】BetterNCM-Installer 一键安装 Better 系软件项目地址: https://gitcode.com/gh_mirrors/be/BetterNCM-Installer 在音乐流媒体体验日益重要的今天，网易云音乐作为国内领先…...

2026/4/24 11:56:45 阅读更多 →

完全开源的语言模型学习记录--Lora-Pre低秩优化器

文章目录一、一段话总结二、思维导图三、详细总结1. 研究背景与动机2. 核心理论突破3. LoRA-Pre方法设计3.1 低秩动量压缩3.2 优化器适配4. 实验结果4.1 预训练效果（C4数据集，困惑度越低越好）4.2 微调效果（MetaMathQA，…...

2026/4/24 11:54:48 阅读更多 →

前端三剑客 vs Vue.js：核心区别解析

好的，这是一个关于前端技术的常见问题。我们来理清 HTML CSS JavaScript（通常称为“前端三剑客”）与 Vue.js（一个流行的 JavaScript 框架）之间的区别：核心概念不同HTML CSS JavaScript： 这是…...

2026/4/20 15:14:20 阅读更多 →

【SAP Basis】从SU01出发：深入解析SAP用户账号管理的核心配置与实战

1. SU01入门：SAP用户管理的核心入口第一次接触SAP Basis管理时，我被满屏的事务码搞得晕头转向。直到导师指着SU01说："这是你未来每天都要打交道的老朋友"，我才意识到用户管理的重要性。SU01就像SAP系统的门禁控制台&am…...

2026/4/23 4:18:42 阅读更多 →

AI代码配额管理实战指南：7大行业真实配额模型+3类超限预警SOP（附2026大会未发布白皮书节选）

第一章：AI代码配额管理的范式跃迁与大会使命 2026奇点智能技术大会(https://ml-summit.org) 传统资源配额模型正面临根本性挑战：当大语言模型驱动的代码生成器每秒产出数百行可执行逻辑，静态CPU/内存阈值已无法表征真实开发意图与语义负载。…...

2026/4/20 13:56:02 阅读更多 →

7-Zip终极指南：免费开源的文件压缩神器如何改变你的文件管理方式

7-Zip终极指南：免费开源的文件压缩神器如何改变你的文件管理方式【免费下载链接】7z 7-Zip Official Chinese Simplified Repository (Homepage and 7z Extra package) 项目地址: https://gitcode.com/gh_mirrors/7z1/7z 你是否曾为电脑空间不足而烦恼&…...

2026/4/23 2:47:31 阅读更多 →