python 用groupby之后生成新的数据框

2023-02-27 00:47:02Python014

python 用groupby之后生成新的数据框,第1张

最近在做一点点风控的东西，想把toad中的ks_bucket改修正下，原码里面是按得分的最大最小值划分的bucket，但我在实际的应用中想更个性化的划分节点去统计。

首先需要解决的一个问题是把0~1上的概率给划分到不同的区间，然后分别统计即可。

之前一直用groupby，分组后想count, sum，后变成df。在网上找了好几种方法，都没有成功，最后还是英文文档解决了我的问题。

这是划分好后的各列情况，第一列：概率，第二列：所属的区间，第三列：实际的label

我主要是想把这三列，按第二列分组，统计各区间的总数，和label为1的数

用NamedAgg 即可把原来的分组变为数据框。

1、Series的创建

序列的创建主要有三种方式：

1）通过一维数组创建序列

import numpy as np, pandas as pd

arr1 = np.arange(10)

arr1

type(arr1)

s1 = pd.Series(arr1)

type(s1)

2）通过字典的方式创建序列

dic1 = {'a':10,'b':20,'c':30,'d':40,'e':50}

dic1

type(dic1)

s2 = pd.Series(dic1)

type(s2)

3）通过DataFrame中的某一行或某一列创建序列

这部分内容我们放在后面讲，因为下面就开始将DataFrame的创建。

2、DataFrame的创建

数据框的创建主要有三种方式：

1）通过二维数组创建数据框

arr2 = np.array(np.arange(12)).reshape(4,3)

arr2

type(arr2)

df1 = pd.DataFrame(arr2)

df1

type(df1)

2）通过字典的方式创建数据框

以下以两种字典来创建数据框，一个是字典列表，一个是嵌套字典。

dic2 = {'a':[1,2,3,4],'b':[5,6,7,8],

'c':[9,10,11,12],'d':[13,14,15,16]}

dic2

type(dic2)

df2 = pd.DataFrame(dic2)

df2

type(df2)

字典数据序列方式数组

# 上一篇：R-统计分析的一些R包和函数

# 下一篇：二级C语言编程题怎么用黑客编程做?

给您推荐相同类型的内容：

细说Ruby工程的Bundle以及怎么加快bundle install
细说Ruby工程的Bundle以及如何加快bundle install做过Ruby项目的人可能有过我一样的感受，rubygems.org在中国的访问太慢了，每次我们bundle install都要等老长时间，而我们通过浏览器去下载对应的ge
二级C语言编程题怎么用黑客编程做?
学习黑客的编程，就需要你会c++和vb了。没有基础是很难学会的！C语言之所以命名为C，是因为C语言源自Ken Thompson发明的B语言，而B语言则源自BCPL语言。1967年，剑桥大学的Martin Richards对CPL语言进行了
Go语言做Web应用开发的框架，哪一个更适合入门
可以先直接使用go自带的http server 框架，这个框架涵盖了绝大多数的功能，比如request response 的基本封装，简单的路由管理，文件上传处理。如果发现Go 自带的框架解决不了问题，可以引入相应的第三方组件，比如OR
C语言中，如何把几个数组的值保存到一个数组里
这个问题不难!这个很简单嘛。不过建议不要用数组，数组的话，太大浪费，太小会越界。可以用vector容器。你首先自己写个判断水仙花数的函数先，这里我假设就是boolhanshu(int)再定义一个足够大的数组.例如inta[1000]intn
如何用ruby调用另一个ruby脚本？
system（“.ruby”）或者load 'another.rb'具体代码如下：# 返回ls的输出s=`ls`cmd= "ls"s= `#{cmd}`# 返回true or false s= sys
在Linux C语言下，可执行的Shell脚本文件与编译之后的C可执行文件的区别有哪些？
shell脚本是shell的一种扩展功能，也就是shell会根据你所写的脚本一条一条的去执行，C写的程序是直接给CPU执行的。一般来说做一些简单功能，特别是和shell有关的。我们会用shell脚本，如系统环境的设定，开机后执行系统的初始化
r语言如何导入excel数据
R语言可以使用read.xlsx()函数来读取excel数据文件，也可以使用read.csv()函数来读取csv格式的数据文件。此外，还可以使用R包RODBC来连接数据库，从而将数据文件存储在数据库中，便于管理和操作。另外，还可以使用R语言
java用for循环将字节数组里每位字节相加，列如[1,2,3,4].结果是10.求代码。
public static void main(String[] args) { ava用for循环将字节数组里每位字节相加，列如[1,2,3,4].结果是10.求代码。char[] c = { 1, 2, 3, 4 }int sum
Ruby调用DLL函数的问题，无法正常显示字符串；DLL编程如何引用需要的DLL？
Win32API.new('DemoDLL','AddStringX','p','p').call(a)先检查看看参数a是否是字符串，有必要的话就a.to_s.
在java中如何把字节数组存储到数据库？
保存字节数组到数据库分两步：第一、利用FileInputStream.read(byte[])方法把内容读取到byte[]数组中，比如图片是由二进制数组成的，就可以定义为一个字节数组。第二、在数据库中对应记录字段应该设置为blob类型，这样
Java中的强制类型转换是如何转换的?
java中数据类型的强制转换是通过强制转换语句完成的，强制转换语句的格式为“目标数据类型变量=(目标数据类型)数据；”。下面给出例子：1、定义两个字节数据类型a、b、c，分别赋予1和2和a+b的值，进行加法运算的式子a+b=3，得出的结
rubychina是干什么的
一直以来，Ruby 在中国都没有一个靠谱的社区，如今，Ruby China Group 出现了，Ruby China Group 是一个非营利组织，它旨在为中国的 Ruby 和 Rails 爱好者提供一个自由，开放的交流平台。楼下说得对，技
Java中几种常用数据类型之间转换的方法
下面给你例举10种Java中几种常用的数据类型之间转换方法：1. short--&gtint 转换exp: short shortvar=0int intvar=0shortvar= (short) intvar2. int
想写个web服务器，用Go语言实现，需要有哪些前提知识
以我就说只会 JavaScript 啊 Java EE 啊 PHP 的就不要冒充程序员了……先看看 Go 的 net 包和 nethttp 包。基于 net 包里相对低级的接口，用 TCP 写基本的 CS 通信程序。如果需要权威参考书，
新手上路，安装ruby，gem遭遇如此困境求助 · Ruby China
不过安装Ruby On Rails的过程中遇到一个问题，花了点时间。找到问题根源后发现自己挺可笑的，所以记录在这里，希望大家不要象我这么傻。问题的现象是我安装Ruby On Rails的时候系统没有响应。在安装完Ruby 2.0.0后运行“
在Ruby中为什么$a和@a返回的是nil？
ruby中带“!"和不带"!"的方法的最大的区别就是带”!"的会改变调用对象本身了。比方说str.gsub(a,'b')，不会改变str本身，只会返回一个新的str。而str.
驳狗屎文 "我为什么放弃Go语言
此篇文章流传甚广, 其实里面没啥干货，而且里面很多观点是有问题的. 这个文章在 golang-china 很早就讨论过了.最近因为 Rust 1.0 和 1.1 的发布, 导致这个文章又出来毒害读者.所以写了这篇反驳文章, 指出其中的问题
java转as3.0是否可行？as3.0做游戏客户端的，貌似会没那么无聊，请问那位大侠指导下小弟？
语言的语法类似而且都是面向对象。但是只要你要学习什么语言这也算是人生的规划，首先必须知道你选择了后，要做什么。java的用途我不必献丑拙言，as 3.0目前主要的趋势也是游戏和视频。编程没有那一门语言枯燥，只有自己是否热爱编程。我个人推荐
2019-10-22 R语言Seurat包下游分析-1
下游分析 cellranger count 计算的结果只能作为错略观测的结果，如果需要进一步分析聚类细胞，还需要进行下游分析，这里使用官方推荐 R 包（Seurat 3.0）流程参考官方外周血分析标准流程（ https:sat
如何让Hadoop结合R语言做大数据分析？
R语言和Hadoop让我们体会到了，两种技术在各自领域的强大。很多开发人员在计算机的角度，都会提出下面2个问题。问题1: Hadoop的家族如此之强大，为什么还要结合R语言？x0dx0a问题2: Mahout同样可以做数据挖掘和机器学习
如何使用Go语言实现远程执行命令
一般命令所谓一般命令，就是在一定时间内会执行完的命令。比如 grep, cat 等等。执行命令的步骤是：连接，执行，获取结果连接连接包含了认证，可以使用 password 或者 sshkey 2种方式来认证。下面的示例为了简单，使用了密码
R语言下的subset()函数
subset()函数： subset(dataset , subset , select ) dataset 是要进行操作的数据集， subset 是对数据的某些字段进行操作 select 显示指定列（如果不选择则所有列全部
PHP在最近一年在编程语言排行榜上下滑的原因是什么
主要从两个方面发表一下个人看法：行业变迁最近两年，我们耳熟能详的技术热词比如：云计算、machine learning、TensorFlow、AI……，基本与PHP都没太大的关系，再比如：（自然语言处理）NLP、（物联网）IoT、big
java 类型转换
if(null != n ){} 就行了。n都为null 也，你还让它n.toString?肯定报错.在java项目的实际开发和应用中，常常需要用到将对象转为String这一基本功能。常用的方法有Object.toString()，（Str
加权后的数据怎么用r转换出来
地理加权回归（GWR）在R里面怎么实现？121 人关注0 条评论写回答查看全部 5 个回答写回答叶山Shan YeGIS地质人文地理可持续发展A2A 谢邀，我和我认识的一些人，刚开始用R做空间分析的时候，也遇到过这个问题。R这种开源的
R语言如何修改坐标轴
用最基础的axis()函数，假设横轴是5月的每一天，纵轴是每天的销售量从0到100首先你把横轴纵轴要打的东西分别放在2个向量month和salesmonth&lt-paste(5,1:31,sep="")sal
C语言中怎么用键盘控制界面的物体移动？
这里有个用C语言控制屏幕上小飞机运动的代码，供参考：x0dx0a#includex0dx0a#includex0dx0a#includex0dx0a#include"stdio.h"x0dx0a#in
r语言的下移命令
1.getwd（）#查看当前工作目录2.setwd（'E:graduation-designOCsctransform'）#设置工作路径，引号内的内容是一个例子，注意路径最好不要有中文和特殊符号。3.install.
java中什么叫迭代，什么叫迭代器
迭代：是重复反馈过程的活动，其目的通常是为了逼近所需目标或结果。每一次对过程的重复称为一次“迭代”，而每一次迭代得到的结果会作为下一次迭代的初始值。重复执行一系列运算步骤，从前面的量依次求出后面的量的过程。此过程的每一次结果，都是由对前
武汉java培训机构排名榜
武汉java培训机构排名榜：1.武汉动力节点上榜理由：我相信大家对于动力节点的上榜不会有所争议，毕竟动力节点在Java的教育上面做到了极致，10年来不断的在对Java的课程研发上下苦功，最后研发出了一套自己独家的教学方法。师资方面也是非

推荐阅读

热门文章

最新发布

标签列表

python 用groupby之后生成新的数据框

给您推荐相同类型的内容：