python--pandas合并与连接

2023-02-25 01:27:01Python016

python--pandas合并与连接,第1张

append 方法根据行在原数据框添加新的数据框。

如果想要合并后的数据框索引重写排序，可以设置参数 ignore_index=True 。

concat 函数是panda自带的，可以按行或按列合并多个pandas数据框。

按行合并多个数据框，需要注意的是 objs参数接受一个可迭代对象 。concat函数默认按行合并。

设置 ignore_index=True ，使合并后的数据框索引重新排序。

按行合并时，concat对所有的列进行全连接(参数 join='outer' )，没有的列会填充为NaN。

设置参数 join='inner' ，可以只保留共有的列。

设置参数 axis=1 或 axis='columns' ，可以按列合并多个数据框。

merge 方法根据列或索引连接数据框。

当两个数据框只有一个相同列时， merge 方法会自动根据相同列进行内连接， on 参数可以省略。

设置参数 how=['left','right','outer','inner','cross'] ，可以完成不同类型的连接。

当两个数据框没有相同列时，需要设置 left_on 和 right_on 参数，表示按这两列进行连接。

如果需要根据数据框的索引进行连接，需要根据需求设置参数 left_index=True 或者 right_index=True 。

设置 suffixes ，可以给相同的列名添加后缀。默认后缀是 _x , _y 。

join 方法与 merge 方法作用相同，基本上 merge 方法已经可以完成所有的连接操作。

join 方法对按索引连接更方便而已。

当连接的两个数据框中没有相同列时，可以直接按索引进行左连接。

同样，可以设置 how 参数，控制连接的行为。

当数据框中有相同列时，需要设置后缀。

假设我有3个不同的清单

col1 = ['2006-03-28','2006-04-05','2006-04-06']col2 = ['IBM', 'MSFT', 'IBM']col3 = [1000, 1000, 500]

将这些列表合并到另一个列表中的最有效方法是：

col = [('2006-03-28', 'IBM', 1000),

('2006-04-05', 'MSFT', 1000),

('2006-04-06', 'IBM', 500)]

解决方案

>>>col1 = ['2006-03-28','2006-04-05','2006-04-06']>>>col2 = ['IBM', 'MSFT', 'IBM']>>>col3 = [1000, 1000, 500]>>>zip(col1, col2, col3)[('2006-03-28', 'IBM', 1000), ('2006-04-05', 'MSFT', 1000), ('2006-04-06', 'IBM', 500)]

如果您的列已在一个列表中，则可以使用 zip(*cols)

由于集合元素顺序的不确定性

下面程序合并后的行顺序不确定，但符合同一值只取一个的要求

originfile=open(r'origin.txt') #打开储存数据的文件

myset=set() #建立集合myset

for line in originfile.readlines(): #读取文件每一行

line=line.strip() #去掉每行前面和后面的空格和换行符

myset.add(line) #将数字加人集合，由于集合的唯一性，已有值不会添加

result=','.join(myset)#逗号隔开，合并集合为一个字符串

targetfile=open(r'target.txt','w')#打开目标文件写入

targetfile.write(result) #将结果写入目标文件

originfile.close() #关闭原始文件

targetfile.close() #关闭目标文件

数据参数有的方法索引

# 上一篇：如何在R语言中读入数据和导出存储数据

# 下一篇：JAVA中的内锁机制是什么

给您推荐相同类型的内容：

go语言可以做什么
1、服务器编程：以前你如果使用C或者C++做的那些事情，用Go来做很合适，例如处理日志、数据打包、虚拟机处理、文件系统等。2、分布式系统、数据库代理器、中间件：例如Etcd。3、网络编程：这一块目前应用最广，包括Web应用、API应用、
r语言如何同时求几列数据的均值和方差
如下：数据集a有变量：x1，x2，x3等等求各变量的均值方差，代码如下：mean(a$x1) var(a$x1)。mean(a$x2) var(a$x2)。mean(a$x3) var(a$x3)。……如果有无效值，需要在括号
Java异常机制是什么？
异常指不期而至的各种状况，如：文件找不到、网络连接失败、非法参数等。异常是一个事件，它发生在程序运行期间，干扰了正常的指令流程。Java通过API中Throwable类的众多子类描述各种不同的异常。因而，Java异常都是对象，是Throw
Ruby,JavaScript,Python,Apis,PHP先学哪个好？哪个适用范围广？
你如果想找工作。初学者，最好学学javascript，这个通常在刚工作的时候，容易找到属于自己的岗位，而且工资还不算低。如果你只是想做网站，自己做，给别人做。当然就是学习php啦。如果你不满足现状，想在网站上更进一步。可以针对某个公司做准
想学C语言，去哪儿学比较好
C语言其实不难学，就是一门高级计算机语言，入门很简单，就是谭浩强那本书就好。但是C语言其实也不好学，如果要学好还是需要大量的代码基础的，多练总是好的。然后就是学的时候注意C语言中空间的概念。1、程语语言其实是一个很初级的工具，但是又必须熟练
R语言中如何根据给出的根，求多项式！！！！！！
r &lt- uniroot(function(x) cos(x) - x, lower = -pi, upper = pi, tol = 1e-9)上式计算函数f(x) = cosx - x 在-pi到pi之间的根，精度10的负
写好的Markdown怎么生成HTML
3个步骤1、task ‘generate’把README.md编译成html，并带有左侧目录功能。这里使用tocmd命令（tocmd 是一个ruby gem，用于把markdown文件生成带有toc目录的html文档。）tocmd_conf
达内培训 java 培训多少钱
达内培训Java培训费用大概在1-3万元左右，每个人根据个人不同的基础决定学习的课程，基础差点的学习的是基础课程，费用相对低一点。【Java培训】的时间是4个月左右，具体看个人学习情况，如果学习学的好，4个月就能毕业，如果是觉得学习完了后自
java的三个基本特征是什么？
Java有封装、继承、堕胎三大特征，特点分别如下：封装：面向对象编程的核心就是将对象的属性和方法封装起来。。。继承：允许通过继承原有类的某些特性或全部特性而产生全新的类，原有的累称为父类，产生的新类称为子类。子类不仅可以直
ICC中进行P&R后导出网表并导入Cadence中进行仿真的流程（转）
在ICC中输出门级网表，记得 write_verilog 的时候加 -pg 选项，并且在 write_verilog 之前加 hdl verilog -hierachy ，使得生成的网表层次关系正确。使用 V2LVS 命令将门级网表转
python中a[1][2]是什么意思
python中a[1][2]意思是一种跨平台的计算机程序设计语言中的字符串开始索引1-2行。python是一种跨平台的计算机程序设计语言，是ABC语言的替代品，属于面向对象的动态类型语言。a[1][2]意思是a为字符串,1、2为开始索引,指
ruby安装：‘D:Program’不是内部或者外部命令，也不是可运行的程序
您好，这样的：Sass的安装:1.安装：SASS是Ruby语言写的，但是两者的语法没有关系。不懂Ruby，照样使用。只是必须先安装Ruby，然后再安装SASS。假定你已经安装好了Ruby，接着在命令行输入下面的命令：gem install
求n的阶乘c语言
求n的阶乘c语言如下：第一步、编程的第一步就是写头文件，对于初学者来说，只写一个头文件就可以了，即#include&ltstdio.h&gt。第二步、就是定义我们的变量，我们需要定义一个n，用来求他的阶乘，sum用来保存结
JAVA中的内锁机制是什么
多线程同步的实现最终依赖锁机制。我们可以想象某一共享资源是一间屋子，每个人都是一个线程。当A希望进入房间时，他必须获得门锁，一旦A获得门锁，他进去后就立刻将门锁上，于是B,C,D...就不得不在门外等待，直到A释放锁出来后，B,C,D...
java程序员有前途吗
java的就业前景还是非常好的，虽然很多人都在说java饱和了，但事实上，java运用更加广泛，而且可以被看作是一项基础来学。不论学大数据、web、全栈、人工智能、前后端，小程序都需要学java！而且当你学完java后，再学C#，pytho
Go语言排序与搜索切片
Go语言标准库中提供了sort包对整型，浮点型，字符串型切片进行排序，检查一个切片是否排好序，使用二分法搜索函数在一个有序切片中搜索一个元素等功能。关于sort包内的函数说明与使用，请查看 https:godoc.orgsort
go语言语法(基础语法篇)
import "worknamepacketfolder"导入多个包方法调用包名.函数不是函数或结构体所处文件或文件夹名 packagename.Func()前面加个点表示省略调用，那么调用
ruby怎么读取文件的列数
简单说一下吧，假设你有一个名为example.txt的文件，里面的内容如下：bbb ccc 123ddd aaa 456abc efg 789695 aaa uwi注意，这里我举的例子每一列是用空格分隔的。用ruby读取的代码如下：f =
如何学习C语言?
学习方法是：1、课前预习，课后复习，认真做课堂、课后的作业，理解理论知识。2、记住语法规则。3、加强逻辑思维。4、多动手，通过练习上机了解它的运行过程。5、实践—&gt理论—&gt再实践，刚开始学习C语言时，按示例
python逻辑回归怎么求正系数
Python 逻辑回归求正系数的方法可以分为两种：1. 使用线性模型的求解方法：可以使用sklearn中的LogisticRegression类来求解正系数，调用其中的fit()方法就可以求解出正系数。2. 使用梯度下降法：可以自己实现梯度
你好想问你C语言用*打出A，K，M，N，V，W都怎么打考试题 555。。。
由于马上要出去，先写了打印A,K的给你，你可以照着写出后面的，如果不急我晚上10点的时候再给你补充#include&ltstdio.h&gtint main(){char a[7][14]={ "*&
Python数据分析笔记#8.2.2 索引上的合并
「目录」数据规整：聚合、合并和重塑Data Wrangling: Join, Combine, and Reshape --------&gt数据库风格的DataFrame合并
Python在交互环境敲代码时怎么换行，每次一按Enter键就直接执行程序了，可是代码还没有写完啊
可以使用符号来换行，表示本行代码未完成。以下代码为例（在打print时换行），a=1b=1printa+b具体操作步骤如下：1、在cmd中输入python按回车，打开python的交互环境：2、输入a=1，按回车输入完成一行：
python多线程配合键盘监听,为什么键盘监听不了
1、没有在设置中打开键盘监听的功能。2、接触不良导致键盘监听不了。Python由荷兰数学和计算机科学研究学会的GuidovanRossum于1990年代初设计，作为一门叫做ABC语言的替代品。你这里的time.sleep的时间太短的。这个
java如何确定线程池最多线程的大小
corePoolSize（线程池的基本大小）：当提交一个任务到线程池时，线程池会创建一个线程来执行任务，即使其他空闲的基本线程能够执行新任务也会创建线程，等到需要执行的任务数大于线程池基本大小时就不再创建。如果调用了线程池的prestart
go语言tcp协议push指令怎么用
PUSH指令主要用于编写子程序和中断服务程序，可以临时保存程序状态字PSW和累加器ACC的内容或其它寄存器和存储器单元的内容。在子程序和中断服务程序结束返回主程序前，要用POP弹栈指令，从堆栈中取出被保护的数据，恢复程序状态字PSW
R语言的ggtree展示进化树的一些常用操作
现在假设你已经拿到了nwk格式的进化树文件，如下现在进化树的所有信息都存储在了 tree 这个变量里用到的的 geom_tiplab()可以首先加上 theme_tree2() 函数显示出坐标轴范围，然后用 xlim()
python文件后缀是什么
python文件后缀总结：（1）.py：这通常是您编写的输入源代码。（2）.py3：Python3脚本（Python3脚本通常以.py而不是.py3结尾，很少使用）。（3）.pyc：这是编译好的字节码。如果导入一个模块，python将
为什么我不喜欢Go语言式的接口
所谓Go语言式的接口，就是不用显示声明类型T实现了接口I，只要类型T的公开方法完全满足接口I的要求，就可以把类型T的对象用在需要接口I的地方。这种做法的学名叫做Structural Typing，有人也把它看作是一种静态的Duck Typi
JAVA语言如何进行异常处理？
throws捕获并向外抛出异常x0dx0athrow抛出异常x0dx0atry catch是内部捕获异常并做自定义处理x0dx0afinally是无论是否有异常都会被处理的语句，除非在finally前存在被执行的System.e

推荐阅读

热门文章

最新发布

标签列表

python--pandas合并与连接

给您推荐相同类型的内容：