python填充缺失值

2023-02-27 07:29:02Python013

python填充缺失值,第1张

对于大多数情况而言，fillna方法是最主要的函数。通过一个常数调用fillna就会将缺失值替换为那个常数值。

fillna(value)

参数：value

说明：用于填充缺失值的标量值或字典对象

#通过常数调用fillna

书写方式：df.fillna(0) #用0替换缺失值

#通过字典调用fillna

书写方式：df.fillna({1:0.5,3:-1})

fillna(value,inplace=True)

参数：inplace

说明：修改调用者对象而不产生副本

#总是返回被填充对象的引用

书写方式：df.fillna(0,inplace=True)

fillna(method=ffill)

参数：method

说明：插值方式。如果函数调用时未指定其他参数的话，默认为“ffill”

对reindex有效的那些插值方法也可用于fillna：

In [23]: from numpy import nan as NA

In [21]: df=DataFrame(np.random.randn(6,3))

In [24]: df.ix[2:,1]=NAdf.ix[4:,2]=NA

In [25]: df

Out[25]:

0 1 2

0 -0.863925 1.005127 -0.529901

1 0.701671 -0.501728 -0.617387

2 -0.951060 NaN -0.263626

3 0.810230 NaN -0.277401

4 -0.403899 NaN NaN

5 -0.081091 NaN NaN

In [26]: df.fillna(method='ffill')

Out[26]:

0 1 2

0 -0.863925 1.005127 -0.529901

1 0.701671 -0.501728 -0.617387

2 -0.951060 -0.501728 -0.263626

3 0.810230 -0.501728 -0.277401

4 -0.403899 -0.501728 -0.277401

5 -0.081091 -0.501728 -0.277401

fillna(limit=2)

参数：limit

说明：（对于前向和后向填充）可以连续填充的最大数量

In [27]: df.fillna(method='ffill',limit=2)

Out[27]:

0 1 2

0 -0.863925 1.005127 -0.529901

1 0.701671 -0.501728 -0.617387

2 -0.951060 -0.501728 -0.263626

3 0.810230 -0.501728 -0.277401

4 -0.403899 NaN -0.277401

5 -0.081091 NaN -0.277401

fillna(data.mean())

只要稍微动动脑子，就可以利用fillna实现许多别的功能。比如说，可以传入Series的平均值或中位数：

In [28]: data=Series([1,NA,3.5,NA,7])

In [29]: data.fillna(data.mean())

Python-for-data-重新采样和频率转换

重新采样指的是将时间序列从一个频率转换到另一个频率的过程。

但是也并不是所有的采样方式都是属于上面的两种

pandas中使用resample方法来实现频率转换，下面是resample方法的参数详解：

将数据聚合到一个规则的低频上，例如将时间转换为每个月，"M"或者"BM"，将数据分成一个月的时间间隔。

每个间隔是半闭合的，一个数据只能属于一个时间间隔。时间间隔的并集必须是整个时间帧

默认情况下，左箱体边界是包含的。00:00的值是00：00到00：05间隔内的值

产生的时间序列按照每个箱体左边的时间戳被标记。

传递<span class="mark">label="right"</span>可以使用右箱体边界标记时间序列

向loffset参数传递字符串或者日期偏置

在金融数据中，为每个数据桶计算4个值是常见的问题：

通过<span class="girk">ohlc聚合函数</span>能够得到四种聚合值列的DF数据

低频转到高频的时候会形成缺失值

ffill() ：使用前面的值填充， limit 限制填充的次数

时间参数缺失间隔数据

# 上一篇：mac russian red和ruby woo哪个好看_试色对比

# 下一篇：C语言求5的阶乘？？？？

给您推荐相同类型的内容：

Python pandas用法
在Python中，pandas是基于NumPy数组构建的，使数据预处理、清洗、分析工作变得更快更简单。pandas是专门为处理表格和混杂数据设计的，而NumPy更适合处理统一的数值数组数据。使用下面格式约定，引入pandas包：
rush是什么东西 rush诞生于哪里呢
1、rush是一种药物，这种药物最初诞生于美国。但是，其的诞生距今已经有超过三十年的历史了。而且，其现在所谓的美版、英版也只不过是那时的剩余产品。而且，至于说加拿大版的话，其实加拿大从未生产过RUSH，最主要的还是美国的剩货。2、rus
python是gpl软件，是不是意味着用它编写的软件都不能是商业软件？
GPL协议只是针对Python本身的源码而对使用Python编写出的代码没有任何的限制所以你用Python编写的程序可以以任何你希望的形式发布另外，即便是改写或借鉴Python的代码也不是完全不能以商业软件形式发布（虽然可能性不大，但还是有
C语言编程计算闰年
一、闰年判断方法：1、非整百年：能被4整除的为闰年。（如2004年就是闰年,2100年不是闰年）2、整百年：能被400整除的是闰年。(如2000年是闰年，1900年不是闰年)二、算法设计：1、输入年份；2、根据年份，判断是否为闰年；3、输出
R语言 seq函数
seq函数是R语言中的基本函数，其功能是生成一个向量。使用方法如下：seq(0,1,length.out=100)上一行语句生成一个100个值的等差数列，首项为0，末项为1拓展：你还可以使用rep函数生成向量。用法如下：rep(0,100)
python 计算程序运行了多长时间
python 计算程序运行时间：6.760052s一、import time二、start =time.clock()三、#执行程序，比如计算1到100的和。sum=0for i in range(1,101):sum=sum+i
java des加密，密钥的长度是多少
3des算法是指使用双长度（16字节）密钥k=（kl||kr）将8字节明文数据块进行3次des加密解密。如下所示：y=des(kl)[des-1(kr)[des(kl[x])]]解密方式为：x=des-1(kl)[des(kr)[des-
R语言包安装成功但使用不了怎么办
R是不断更新的一个工具,里面的扩展包的使用是和R的版本还有byte相关的,所以这里根据你的报错信息来看, 你要检查一下你的R版本,保证在3.2以上能够使用这个扩展包.R里的复杂扩展包一般都是有依赖包存在的,一般使用install.pack
自学Java可以找到工作吗？
自学Java可以找到工作，但是相对来说非常难。因为Java自学相对比较难，正确的学习资料的获取、学习中遇到的问题以及如何合理运用学到的知识等都是自学中常会遇到的问题，最主要的还是作为初学者没有人指导带着入门，而且也没有足够的项目经验，所以找
这个外国人是谁？？？？求大神介绍一下
Ruby Rose，1986年3月20日出生于澳大利亚墨尔本。模特，主持人。个人经历：鲁比·洛斯 (Ruby Rose) 全名Ruby Rose Langenheim，是澳大利亚MTV音乐电视台主持人、电台DJ、模特，更是少数公开出柜的明星
RUBY是什么样的牌子
居我所知，Ruby是一种功能强大的面向对象的脚本语言,她可以使您方便快捷地进行面向对象编程.Ruby使文本处理和系统管理变得简单，与Perl非常相似.一句话：简单明了，扩展性强，移植性好.你说的是RUBY CELL吧？一个化妆品牌子澳洲最流
Ruby 0n Rails 在网站开发上有什么优势？相对于其他的语言php java等
1.扩展很方便，功能很齐全。开发的时候会有很多很多不同需求，但是这个东西已经有人写过了，你可以直接拿来就用，比如nokogiri，paginate等等。而且很方便获取，用gem install就可以。2.开发效率快，因为你不用注重底层代码构
JAVA软件开发使用的框架有哪些？
JAVA软件开发开发框架多达几十种，瑭锦Tanjurd总结列举了3种最常见也是最常用方便的3种工具：x0dx0a1、Struts：Struts是一个基于Sun J2EE平台的MVC框架，主要是采用Servlet和JSP技术来实现的x0
什么是随机化快排
随机快速排序算法是对快速算法的一种优化，本质没什么区别，随机快速排序的最坏情况就是和快速排序一样。快速排序的最坏情况基于每次划分对主元的选择。基本的快速排序选取第一个元素作为主元。这样在数组已经有序的情况下，每次划分将得到最坏的结果。一种比
java怎么给窗体或者面板设置背景图片？
1利用标签组件来设置x0dx0a标签本来是一种最简单的组件,为什么可以将它设置成为一个窗体的背景呢?首先还是要了解框架JFrame中的层次结构。JFrame中的层次分布及相对关系是:最底层是JRootPane,第二层是JlayerPan
Go语言怎么样？
根据Go趋势报告显示，全球范围内有 110 万专业开发者选择Go作为其主要开发语言。如果把以其他编程语言作为主要开发语言，同时也在使用Go的开发者计算在内，这一数字将高达270万，中国的Go语言开发者排名第一，全球占比超过16%。Go 语
R语言_legend()函数用法
x, y:用于定位图例，也可用单键词"bottomright", "bottom", "bottomleft", "left", "topleft&q
如何用VC6.0编写C语言程序
1.双击桌面上的Visual C++6.0快捷图标，打开编程环境，2.在打开的界面中，单击“文件”菜单项。选择里面的子菜单“新建”，单击此项（也可以直接使用快捷键：Ctrl+N）3.在打开的新建选项卡中，单击“文件”，然后选中“文件”选项卡
Ruby 中哈希的一些骚操作
字面量方式创建哈希clear方法可以清除哈希里面的数据delete delete_if可以删除和删除指定条件的键值对reject reject!也可以删除指定的键值对invert方法可
JAVA的编译器有哪些？
推荐Jcreator，它对于初学者是个很好的开发工具，又小运行也很快。它要用到JDK，大的IDE有JBuilder,netbean,sun stdio,eclipse。编译器就是将"一种语言(通常为高级语言)"翻译为&q
北大青鸟java培训：北大青鸟和北大什么关系？
这两天逛知乎、知道这些地方，发现突然冒出来了很多北大青鸟和北大什么关系、北大青鸟和北大有关系吗这类问答、提问出来，还以为是马上中高考，北大青鸟品牌http:www.kmbdqn.cn被大家广泛关注，仔细看了下觉得特别诧异，热度高的评论
防止 python deamon 进程被干掉
最近需要在一台 remote 的 gpu 机器上跑 training 的脚本，terminal 不可能一直开着，所以肯定都是要以 daemon 方式来跑。众所周知，最简单的 daemon 运行的方式就是在命令后加 &amp，再
2016年学java前景怎么样
JAVA是什么?Java是一种简单的，面向对象的，分布式的，说明型的，健壮安全的，结构中立的，可移植的，性能优异、多线程的动态语言。一般Java培训也分为J2SE，J2EE，J2ME培训，各个体系的方向有所不同，JAVA培训的内容也有所不同
java如何实现替换指定位置的指定字符串的功能
可以使用StringBuffer定义字符串，之后使用replace方法替换指定位置的字符串为指定的字符串内容，如下代码：publicclassDemo1{publicstaticvoidmain(String[]args){StringBu
python inspyred怎么用
帮你搜索了一下。PSSPY似乎是一个Python for PSSE的模块。你可以搜索然后下载这个模块，解压后在命令行里cd到它的目录里，然后运行python setup.py install
Go微服务--常见的微服务框架
近几年诞生了很多微服务框架，比如JAVA的Spring Cloud、DubboGolang的GoKit和GoMicro以及NodeJs的Seneca。几乎每种主流语言都有其对应的微服务框架。 Go在微服务框架中有其独特的优势，至于优势在
c语言程序设计怎样分析数据
你的问题问的太笼统了。程序的灵魂—算法一个程序应包括：对数据的描述：在程序中要指定数据的类型和数据的组织形式，即数据结构（data structure）。对操作的描述：即操作步骤，也就是算法（algorithm）。Nikiklaus Wir
java如何实现替换指定位置的指定字符串的功能
可以使用StringBuffer定义字符串，之后使用replace方法替换指定位置的字符串为指定的字符串内容，如下代码：publicclassDemo1{publicstaticvoidmain(String[]args){StringBu
如何安装配置JAVA环境变量
1.在电脑上安装JDK软件之后，双击“我的电脑”图标，点击右上方的“系统属性”。在“系统”页面，点击“高级系统设置”。打开“高级系统设置”页面之后，在“系统属性”页面下方点击“环境变量”。然后在“系统变量”的方框下面单击“新建”按钮。2.
C语言：数组中进行查找操作什么意思
查找的意义是在一堆数据中，使用方法找到你想要找的数据。一般为分：顺序和折半（又叫二分）查找两种方法。存放在数组中的数据就可以看成一堆数据，在有限数组内存放一些数据，通过使用查找方法进行查找想要找的数。顺序方法：这种查找方法不需要数组排序，数

推荐阅读

热门文章

最新发布

标签列表

python填充缺失值

给您推荐相同类型的内容：