Python 清除重复值

2023-02-28 06:04:01Python019

Python 清除重复值,第1张

from pandas import read_csv

df = read_csv('D://PDA//4.3//data.csv')

#找出行重复的位置

dIndex = df.duplicated()

#根据某些列，找出重复的位置

dIndex = df.duplicated('id')

dIndex = df.duplicated(['id', 'key'])

#根据返回值，把重复数据提取出来

df[dIndex]

id key value

4 1251147 品牌 Apple

5 1251147 商品名称苹果iPad mini 3

#直接删除重复值

#默认根据所有的列，进行删除

newDF = df.drop_duplicates()

#当然也可以指定某一列，进行重复值处理

newDF = df.drop_duplicates('id')

今天笔者想对pandas中的行进行去重操作，找了好久，才找到相关的函数

先看一个小例子

[python] view plain copy

from pandas import Series, DataFrame

data = DataFrame({'k': [1, 1, 2, 2]})

print data

IsDuplicated = data.duplicated()

print IsDuplicated

print type(IsDuplicated)

data = data.drop_duplicates()

print data

执行结果是：

[python] view plain copy

0 1

1 1

2 2

3 2

[python] view plain copy

0 False

1 True

2 False

3 True

[python] view plain copy

0 1

2 2

DataFrame的duplicated方法返回一个布尔型Series,表示各行是否重复行。

而 drop_duplicates方法，它用于返回一个移除了重复行的DataFrame

这两个方法会判断全部列，你也可以指定部分列进行重复项判段。

例如，希望对名字为k2的列进行去重，

data.drop_duplicates(['k2'])

根据位置有的方法这两个

# 上一篇：电脑怎么更改密码

# 下一篇：浅谈nodejs文件操作中的相对路径问题

给您推荐相同类型的内容：

html 中怎么画斜线？
可以用不同的方式画，一种是使用css样式：先画一条横线或竖线，然后将这条线旋转一定角度得到斜线。代码如下：&ltstyle&gt#book{width:300pxheight:20pxborder-bottom:1px so
新手如何买电脑？
1.第一，根据自己的需求选择。有人买电脑是为了玩游戏，有人买电脑是为了工作，有人买电脑只是为了上网看电影和综艺，有人买电脑是为了下载大型办公软件和视频软件，所以你需要明确自己的需求再去购买。2.选择笔记本类型。不同的笔记本有不同的尺寸，包括
Python 入门书籍有哪些推荐？
1、Python基础教程：是经典的Python入门教程书籍，本书层次鲜明，结构严谨。这本书既适合初学者夯实基础，又能帮助Python程序员提升技能，即使是Python方面的技术专家，也能从书里找到实用性极强的内容。2、Python数据分析
电脑开机密码怎么破
人们一般对自己的私人电脑都会设置密码，这是对自己隐私保护的一种表现方式，可是相对的也会经常碰到一个尴尬的问题，那就是经常忘了电脑开机密码，碰到这么纠结的问题该怎么办呢，今天笔者就详细的来为大家讲解电脑开机密码忘记怎么办。具体来说，根据使用者
js正则表达式怎么写
我这里给你写了一个例子var reg = ^[a-zA-Z]$ 这里是正则表达式，大小写英文字母都可以if (reg.test(userName.value) != true) {alert("用户应为全英文"
c语言的cast()怎么用，新手求教
您好，对于具有标准定义转换的简单类型而言工作的很好。然而，这样的转换符也能不分皂白的应用于类（class）和类的指针。ANSI-C++标准定义了四个新的转换符：'reinterpret_cast'， 'sta
Python怎样抓取当前页面HTML内容？
Python用做数据处理还是相当不错的，如果你想要做爬虫，Python是很好的选择，它有很多已经写好的类包，只要调用，即可完成很多复杂的功能，此文中所有的功能都是基于BeautifulSoup这个包。1 Pyhton获取网页的内容(也就是源
电脑怎样还原系统
1、先打开我们的电脑，然后点击电脑桌面左下角的开始按钮；2、然后我们点击设置；3、之后我们点击更新和安全；4、然后我们点击恢复；5、之后我们可以看到重置此电脑，我们需要点击下方的开始；6、弹出的界面，我们点击删除所有内容，这样就可以还原系统
css有官方网站吗？
css的官方网站为：http:www.w3.orgcss是国际非营利组织w3c制定和完善的，级联样式表（css）是一种用来表现HTML（标准通用标记语言的一个应用）或XML（标准通用标记语言的一个子集）等文件样式的计算机语言。CSS目前
高中要上python吗
2017年初消息：浙江省信息技术新教材，即将在2017级（2017年9月入学）高中新生中开始使用。（推荐学习：Python视频教程）据了解，与目前的选考（可以理解为高考科目）要求的信息技术教材由3本《信息技术基础》、《多媒体技术应用》、《算
什么是伪静态？伪静态有何作用
什么是伪静态伪静态是相对真实静态来讲的，通常为了增强搜索引擎的友好面，都将文章内容生成静态页面，但是有的朋友为了实时的显示一些信息。或者还想运用动态脚本解决一些问题。不能用静态的方式来展示网站内容。但是这就损失了对搜索引擎的友好面。怎么样在
viewer.js动态生成的img 显示不了
首先讲下这个bug的出现的情况，页面中有&lta href="JavaScript:void(0)" onclick="document.getElementById('current
电脑怎么装系统
电脑装系统的方法如下：电脑：联想电脑天逸510S。系统：Windows10。软件：小白一键重装系统11.5.47.1530。1、打开“小白一键重装系统”，点击“我知道了”。2、点击“系统重装”。3、点击“下一步”按键。4、选择要安装
两台电脑怎么共享文件
两台电脑共享文件的方法如下：电脑：联想电脑天逸510S。系统：Windows7。软件：本地设置。1、右键点击需要共享的文件夹或文件，选择“属性”。2、点击“共享”，打开“网络和共享中心”。3、启用如图共享的三个设置。4、关闭密码保护
浅谈nodejs文件操作中的相对路径问题
查看以下场景：在 js 目录下执行 node fooindex.js ，会出现文件找不到的情况，原因： jsfooindex.js 文件中读文件是写的相对路径也即： .a.txt ，而这个相对路径实际上是相对于执行 nod
html中设置圆形头像这里的css分别表示了什么 <html> <head> <title>圆形头像
.imgtest{margin:10px 5px*设置总的距离边距*overflow:hidden}*超出部分隐藏*.list_ul figcaption p{*html代码中没有*font-size:12pxcolor:#aa
css 文字加粗字体加粗代码有哪些加粗方式
css里文字加粗的步骤如下：1、首先新建一个17.html。2、然后输入html5标准声明。3、输入后可以看到html网页的结构。4、再在header标签中添加style层叠样式。5、把body标签的文字加粗。6、最后使用浏览器打开网页就
C语言 isdigit()
isdigit是头文件ctype.h中声明的一个函数。原型为：int isdigit(int c)作用：判断c指定的字符是否为数字字符，即'0'-'9'，如果是，则返回1；否则返回0。isdi
css 文字加粗字体加粗代码有哪些加粗方式
css里文字加粗的步骤如下：1、首先新建一个17.html。2、然后输入html5标准声明。3、输入后可以看到html网页的结构。4、再在header标签中添加style层叠样式。5、把body标签的文字加粗。6、最后使用浏览器打开网页就
在网页制作中如何使用Css
CSS是英语Cascading Style Sheets（层叠样式表单）的缩写，它是一种用来表现HTML或 XML 等文件式样的计算机语言。 CSS目前最新版本为CSS3,能够真正做到网页表现与内容分离的一种样式设计语言。相对于传统HTML
js怎么编写鼠标的右击事件
js右击事件先贴代码：注意的两个点是：①：先取消默认右击事件,event.preventDefault()②：判断event.Button:0:左键，1：滚轮，2：右键。值得一说的的是"oncontextmenu"
python中什么方法用于接收一个元祖并返回一个列表
元祖转列表方法:list( tup),tup要转换为列表的元组返回值:返回转换后的列表。列表转元祖方法:tuple(list),list要转换成元组的列表返回值:转换后的元组。序列分为三种，字符串，元祖，列表。元祖是用（）来定义。
linux 中怎么设置java
三种配置环境变量的方法1. 修改etcprofile文件如果你的计算机仅仅作为开发使用时推荐使用这种方法，因为所有用户的shell都有权使用这些环境变量，可能会给系统带来安全性问题。 ·用文本编辑器打开etcprofile ·在
浅谈nodejs文件操作中的相对路径问题
查看以下场景：在 js 目录下执行 node fooindex.js ，会出现文件找不到的情况，原因： jsfooindex.js 文件中读文件是写的相对路径也即： .a.txt ，而这个相对路径实际上是相对于执行 nod
苹果ipad如何与电脑连接
通过itunes软件可以将苹果ipad与电脑连接，具体操作如下：1.百度搜索itunes，打开官网2.点击下载itunes并安装3.将ipad用数据线连接电脑usb接口4.自动弹出窗口如下：“要信任此电脑吗”，选择信任。5.打开itune
如何在js中下拉列表选中某个值？
&ltselect name="r_house" id="r_house"&gt&ltoption value="选项1"&gt选项1&l
golang 有哪些比较稳定的 web 开发框架
第一个：Beego框架Beego框架是astaxie的GOWeb开发的开源框架。Beego框架最大的特点是由八个大的基础模块组成，八大基础模块的特点是可以根据自己的需要进行引入，模块相互独立，模块之间耦合性低。相应的Beego的缺点就是
电脑一键还原怎么操作步骤
电脑一键还原的操作步骤：工具／原料：电脑联想、window71、首先点击进入电脑，然后单击鼠标右键，选择其中的个性化即可。2、然后点击左特艺上角的控制面板，点击打开。3、然后选择其中的恢复即可。4、然后点击其中的打开系统还原即可。5、最
如何正确使用电脑？
以我撸电脑7年的经验告诉你，应该如何正确使用电脑。本人理解的正确是这样的，电脑使用寿命长，电脑能保持正常运转，不出现卡顿情况。本人的电脑是2013年10月初购买的，到现在也已经使用了差不多7年的，7年使用过程中没有出现过卡顿，没有出现
css3圆环旋转效果动画怎么做
1、首先新建一个html空白文档，取名字叫做css3动画，保存一下。2、然后写html结构，只需要一个div元素即可，class名字叫做img3、设置其边框为不同的颜色，边框宽度设置成100px。4、因为是圆环，所以我们用到了css3的圆角

推荐阅读

热门文章

最新发布

标签列表

Python 清除重复值

给您推荐相同类型的内容：