Python 去重，统计，lambda函数

2023-02-26 10:52:02Python018

Python 去重，统计，lambda函数,第1张

df.drop_duplicates('item_name')

方法一：

df.drop_duplicates('item_name').count()

方法二：

df['item_name'].nunique()

结果：50

附：nunique()和unique()的区别：

unique()是以数组形式（numpy.ndarray）返回列的所有唯一值（特征的所有唯一值）

nunique()即返回的是唯一值的个数

比如：df['item_name'].unique()

要求：将下表中经验列将按周统计的转换为经验不限，保留学历

df1['经验'] = df1['经验'].apply(lambda x: '经验不限'+ x[-2:] if '周' in x else x)

#解释：将‘5天/周6个月’变成‘经验不限’，然后保留学历‘本科’

方法二：定义函数

def dataInterval(ss):

if '周' in ss:

return '经验不限'+ ss[-2:]

return ss

df1['经验'] = df1['经验'].apply(dataInterval)

case1:用集合的特性set()，去重后顺序会改变

case1.1：可以通过列表中索引（index）的方法保证去重后的顺序不变

case2:使用循环查找的方式，不改变顺序

case3:通过删除索引

case4:itertools.groupby

case5:fromkeys

case6:reduce方法

如：arr =['a','d','e','a']

用： arr= sorted(set(arr), key=arr.index)

同： arr = list(set(arr))

arr.sort(key=arr.index)

⚠️直接set(arr)也可以去除重复元素，只是新数组的顺序就不是原来的顺序了。

如：arr=[{'text':wuyuan,'value':1},{'text':默认,'value':2},{'text':默认,'value':2},

{'text':wyy,'value':4}]

用： f = lambda x,y:x if y in x else x + [y]

arr = reduce(f, [[], ] + arr)

⚠️这里去除的字典里面的键值对必须是完全一样的。

经验顺序方法数组函数

# 上一篇：Go语言的优势有哪些

# 下一篇：回归分析 | R语言 -- 多元线性回归

给您推荐相同类型的内容：

学习java的心得
Java前景是很不错的，像Java这样的专业还是一线城市比较好，师资力量跟得上、就业的薪资也是可观的，学习Java可以按照路线图的顺序，0基础学习Java是没有问题的，关键是找到靠谱的Java培训机构，你可以深度了解机构的口碑情况，问问周围
C语言问题的
scanf(“%d”,&ampx)结果12被赋给了变量x。y=x&gt12?x+10:x-12是条件判断语句。？前面的x&gt12如果满足就把？后的x+10赋给y，如果不满足就把：后的x-12赋给y。由于x＝12不大
python是动态语言，是不是弱类型语言
不是。python是强类型语言，一个变量不经过强制转换，它永远是这个数据类型，不允许隐式的类型转换。例如：1+"2" 在python中会报错，因为一个数字，一个是字符串，python是强类型语言，不会默认进行转换，所以报
R语言基础汇总
%&gt%是管道符的意思，把左边的输出（不包括&lt- 之前的）当成右边的输入。都可以shift + alt + 上下：快速复制粘贴 alt + 上下：移动行 ctrl + alt + 上下：多重光
golang怎么实现psd
您好，Go语言可以实现PSD，它是一种静态类型的编程语言，可以用来开发各种应用程序。Go语言拥有简单的语法，可以让开发者快速地实现PSD。Go语言支持多种编程范式，可以用来实现面向对象、函数式编程和过程式编程等。Go语言拥有强大的标准库，可
mk包包哪款最好看？mk包包有哪几个系列？
Mk包是奢侈品包中比较受欢迎的品牌。有很多大家都非常熟悉的经典款式。今天就来看看经典系列的mk包吧。mk包包有哪些系列？1.Mercer系列Mercer分为几个系列，是经典的包包品牌。美世也是入门级品牌，被网友称为锁包。这款包有三种，颜
python的pillow库怎么处理灰度图像
Pillow是Python里的图像处理库（PIL：Python Image Library），提供了了广泛的文件格式支持，强大的图像处理能力，主要包括图像储存、图像显示、格式转换以及基本的图像处理操作等。1）使用 Image 类PIL最重要
你觉得C语言与C 的差异是什么？
C++比C多了些东西，比如引用，异常，带方法的struct，构造函数，析构函数，函数重载，template，右值，functonal等等，如果正真精通了C，完全可以在理解C++，没什么难的，难的是C++太强大，重载，模板，宏等组合起来后，一
java解析word文档有哪些方法
java读取word文档时，虽然网上介绍了很多插件poi、java2Word、jacob、itext等等，poi无法读取格式(新的API估计行好像还在处于研发阶段，不太稳定，做项目不太敢用)；java2Word、jacob容易报错找不到注册
go语言中的面向对象
类的成员函数有时也称为方法。因此，方法可以认为是传统面向对象中类的成员函数。不同的是，go中方法可以绑定到任何类型上，但是成员函数只能属于类。用来描述主调方法，就像向对象发送消息。不允许本身是指针的类型进行方法声明
R方(R-squared)
R2是一种易于计算和非常直观的用于度量相关性的指标我们中的大多数人已经熟悉了相关性和它的度量标准R，就是常说的Pearson相关系数。如果相关系数R接近1或者-1，则说明这两个变量是密切相关的, 比如身高与体重。其实R平方
学java的人太多了，现在学java还有就业前景吗？
有就业前景。因为Java一直在更新换代，java诞生二十几年依然久居编程语言排行榜前三位，除非有一项很大的技术突破能够替代Java。在当下，Java被使用的场景非常多，网站、游戏、办公软件、新零售、云计算、芯片技术、数字经济等多个互联网领域
C语言程序设计课程讲什么内容？
C语言程序设计课程是入门级的程序设计课程，针对没有或很少具有编程经验的在职人员。课程通过学习C语言编程的基础语法，对程序设计有一个基本的认识，为后续计算机专业课程以及面向对象程序设计课程的学习打下基础。课程主要内容：C语言程序基本结构及相
go分析要多久
Go语言的分析取决于多方面的因素，如代码量、理解深度、复杂性等。如果是一般的小规模项目，比如几百行代码，那么通常需要几个小时来分析。但对于大规模项目，比如几万行以上，则需要更多的时间来分析，可能会有几天或更长的时间。同时，如果开发者对代码深
R语言中rt(5,df=10)什么意思？
R语言中，rt(n, df) 表示 t分布,t分布：t分布曲线形态与n（确切地说与自由度v）大小有关。与标准正态分布曲线相比，自由度v越小，t分布曲线愈平坦，曲线中间愈低，曲线双侧尾部翘得愈高；自由度v愈大，t分布曲线愈接近正态分布曲线，当
CTF干货分享系列——工具资源
这里就是我很喜欢的部分了哈哈。但是气不气，就是没时间写。继续挖大坑。以后会放出工具和资源，作为整合帖。也会另开文单独介绍。 Burp Suite是用于攻击Web应用程序的集成平台。它包含了很多工具，并为这些工具设计了许多接口
go语言oracle需要获取多行数据信息用什么命令?mysql的为db.Select(),oracle的为什么？
查看表结构的：desc （表名）；创建表的create语句就是在plsql上按住Ctrl键点击该表名然后在点击这个页面右下角的“查看sql“按钮就可以看到了不使用工具的话，先把表导出来然后在导进去，导进去的时候使用show=y、log这两
Golang 线程和协程的区别
线程：多线程是为了解决CPU利用率的问题，线程则是为了减少上下文切换时的开销，进程和线程在Linux中没有本质区别，最大的不同就是进程有自己独立的内存空间，而线程是共享内存空间。在进程切换时需要转换内存地址空间，而线程切换没有这个动作，所以
R语言常用函数（基本）
vector：向量 numeric：数值型向量 logical：逻辑型向量 character；字符型向量 list：列表data.frame：数据框 c：连接为向量或列表 sequence：等差序列 rep：重复 length
consul入门篇
consul是google开源的一个使用go语言开发的服务发现、配置管理中心服务。内置了服务注册与发现框架（类似zookeeper）、分布一致性协议实现、健康检查、KeyValue存储、多数据中心方案。服务部署简单，只有一个可运行的二进
《R语言实战》自学笔记71-主成分和因子分析
主成分分析主成分分析（(Principal Component Analysis，PCA）是一种数据降维技巧，它能将大量相关变量转化为一组很少的不相关变量，这些无关变量称为主成分（原来变量的线性组合）。整体思想就是化繁为简，
现在报的湖南省计算机二级(C语言)什么时候考试，那个考试一年可以考几次？
湖南省计算机每年有两次考试，上半年一般是4-5月份，下半年一般是11月份。具体到哪天也就要看每年的安排了，一般会有几天的差异的。反正每次的湖南省二级考试是在国家二级考试的后面。应该是11月份考试的如果平时认真学的话C 语言绝对简单。V
golang 怎么定义可变参数的函数
golang定义可变参数的函数方法是： —- 采用ANSI标准形式时，参数个数可变的函数的原型声明是：type funcname(type para1, type para2, …) —- 这种形式至少需要一个普通的形式参数，后面的省略
go语言循环队列的实现
队列的概念在顺序队列中，而使用循环队列的目的主要是规避假溢出造成的空间浪费，在使用循环队列处理假溢出时，主要有三种解决方案本文提供后两种解决方案。顺序队和循环队列是一种特殊的线性表，与顺序栈类似，都是使用一组地址连续的存储单
python文本加密是什么？?
python文本加密是Python 提供了诸如 hashlib，base64 等便于使用的加密库，我们可以借助异或操作，实现一个简单的文件加密程序。通过了解异或操作的性质，加密原理就非常清晰了。首先将文件转换成二进制数，再生成与该二进制
GO(Gene Ontology)
Ontology 首先是出现于哲学领域的一个词汇，后来广泛用于计算机领域，发挥了很重要的作用，再后来这个概念被引入生物领域。 gene Ontology 是生物中Ontology中一个重要应用。go项目最初是由研究三种模式生物（果蝇、小
golang 跨平台编译
只需要指定目标操作系统的平台和处理器架构即可：因为不支持CGO，所以要禁用CGO 然后再执行go build命令，得到的就是能够在Linux平台运行的可执行文件了。 Mac 下编译 Linux 和 Windows 平台 64位
c语言的输入字母表
我猜你是在找ASCII表ASCII表------------------------------------------------------------- ASCII CharactersDec Hex CharCode D
python 输出列表（list）的倒序的三种方法
lists = [1,3,4,5,6,7,9,2] # 切片 print lists[::-1] # 函数reverse 对数组进行操作 lists.reverse() print lists # 函数reverse
穷举法用C语言怎么写？
共有156种方案：#include&ltstdio.h&gtint main(){ int a,b,c,n=0for(a=1a&lt27a++)for(b=a+1b&lt(800-30*a)20b++)

推荐阅读

热门文章

最新发布

标签列表

Python 去重，统计，lambda函数

给您推荐相同类型的内容：