怎么利用pandas做数据分析

2023-02-27 07:53:02Python011

怎么利用pandas做数据分析,第1张

Pandas是Python下一个开源数据分析的库，它提供的数据结构DataFrame极大的简化了数据分析过程中一些繁琐操作。

1. 基本使用：创建DataFrame. DataFrame是一张二维的表，大家可以把它想象成一张Excel表单或者Sql表。Excel 2007及其以后的版本的最大行数是1048576，最大列数是16384，超过这个规模的数据Excel就会弹出个框框“此文本包含多行文本，无法放置在一个工作表中”。Pandas处理上千万的数据是易如反掌的sh事情，同时随后我们也将看到它比SQL有更强的表达能力，可以做很多复杂的操作，要写的code也更少。

说了一大堆它的好处，要实际感触还得动手码代码。首要的任务就是创建一个DataFrame，它有几种创建方式：

（1）列表，序列(pandas.Series), numpy.ndarray的字典

二维numpy.ndarray

别的DataFrame

结构化的记录(structured arrays)

（2）其中，二维ndarray创建DataFrame，代码敲得最少：

import pandas as pd

import numpy as np

df = pd.DataFrame(np.random.randn(10, 4))

0 1 2 3

0 0.927474 0.127571 1.655908 0.570818

1 -0.425084 -0.382933 0.468073 -0.862898

2 -1.602712 -0.225793 -0.688641 1.167477

3 -1.771992 -0.692575 -0.693494 -1.063697

4 -0.456724 0.371165 1.883742 -0.344189

5 1.024734 0.647224 1.134449 0.266797

6 1.247507 0.114464 2.271932 -0.682767

7 -0.190627 -0.096997 -0.204778 -0.440155

8 -0.471289 -1.025644 -0.741181 -1.707240

9 -0.172242 0.702187 -1.138795 -0.112005

（3）通过describe方法，可以对df中的数据有个大概的了解：

df.describe()

0 1 2 3

count 10.000000 10.000000 10.000000 10.000000

mean -0.189096 -0.046133 0.394722 -0.320786

std 1.027134 0.557420 1.258019 0.837497

min -1.771992 -1.025644 -1.138795 -1.707240

25% -0.467648 -0.343648 -0.692281 -0.817865

50% -0.307856 0.008734 0.131648 -0.392172

75% 0.652545 0.310266 1.525543 0.172096

max 1.247507 0.702187 2.271932 1.167477

2. 改变cell。

3. group by。

4. 读写文件。

zip函数接受任意多个（包括0个和1个）序列作为参数，返回一个tuple列表。具体意思不好用文字来表述，直接看示例：

a = [100, 200, 300]

b = [400, 500, 600]

c = [700, 800, 900]

abc = zip(a, b, c)

print(xyz)

结果是:[(100, 400, 700), (200, 500, 800), (300, 600, 900)]

所以对Series组合成DataFrame用zip函数就可以，代码示例：

DataFrame(list(zip(a, b)))

结果演示：

数据代码示例以对序列

# 上一篇：java怎么读取上传的excel文件

# 下一篇：java获取文本文件中的某行

给您推荐相同类型的内容：

如何在Windows下安装配置python接口的caffe
1、首先先生成两个python文件，在srccaffeprotoextract_proto.bat 里生成caffe_pb2.py 这个之后有用。2、然后打开已经给好的caffebuildVS2013，打开里面已经有的工程文件，正常
C语言中如何读取文件里的行数？
#include&ltstdio.h&gtint main(){char temp[255]int i=0FILE *fp=NULL if((fp=fopen("file.txt","r
python为何会内存超限，应该怎么改？
分区表错误是硬盘的严重错误，不同错误的程度会造成不同的损失。如果是没有活动分区标志，则计算机无法启动。但从软区或光区引导系统后可对硬盘读写，可通过fdisk重置活动分区进行修复。如果是某一分区类型错误，可造成某一分区的丢失。分区表的第四个字
用Ruby可以写游戏不？有没有已经用Ruby写的游戏，我能参考一下，求网址。
我的第一次回答似乎没出现。Ruby可以写游戏。基本上Ruby可以调用Windows API和DirectX API或者使用.net，在开发能力和开发速度上拥有优势。著名的RPG制作大师(RPG Maker VX)就是使用Ruby作为核心的(
《C语言入门经典第五版》pdf下载在线阅读全文，求百度网盘云资源
《C语言入门经典第五版》百度网盘pdf最新全集下载:链接：https:pan.baidu.coms1VIVxkyi7xB-jgU-RnXQuHQ?pwd=oth0 提取码：oth0简介：C语言是每一位程序员都应该掌握的基础语言。C
Go语言的吉祥物为什么是地鼠？
Go 语言之所以叫 Go，是想表达这门语言的运行速度、开发速度、学习速度（develop）都像 gopher 一样快。gopher 是一种生活在加拿大的小动物，Go 语言的吉祥物就是这个小动物，它的中文名叫作囊地鼠，他们最大的特点就是挖洞
python如何实现条形码和二维码制作？
python中专门有生成条形码和二维码的库，这里简单介绍一下实现过程，代码量不多，也很好理解，实验环境win10+python3.6+pycharm5.0，主要内容如下：制作条形码这里有2个库，分别是pybarcode和py
java读txt方法
1).按行读取TXT文件package zcimport java.io.BufferedReaderimport java.io.Fileimport java.io.FileNotFoundExceptionimport java.io
android开发和java开发有什么区别
android开发和java开发有什么区别安卓是用Java语言开发的！ Java开发有后台有前端，内容就多了。第一、平台不一样。java开发是桌面或者企业级的电脑上执行的，一个是在Android系统上执行的。两者的程式码不能互通
如何在windows下安装GIT
本文在Windows7下测试成功。安装和设置Git下载Git for Windows，采用默认安装，安装完成后就可以在本地使用Git了。但要将内容放到Github上，必须先在Github网站上注册个账户，然后在本机使用Git创建SSH Ke
C语言中a【10】什么意思？
如果在类型后面的话，就是定义数组a大小维度10的意思。比如 int a[10] 就是定义整型数组a，大小10个整型数据大小（1个int占 4字节的话，就是占40个字节大小的内存）。如果是在表达式中，比如 a[10]=1 这里a[10]就表示
开发框架是什么
问题一：程序开发中的框架是什么我们目前先不要了解那么多框架是为了方便我们程序员开发减贰代码量及代码质量的工具框架（Framework）是整个或部分系统的可重用设计，表现为一组抽象构件及构件实例间交互的方法另一种定义认为，框架
Python如何下载请求的url指向文件，例如这样的： http:edi.chiPrint.do?fileId=123
#!usrbinenv python#-*- coding:utf-8 -*-import requestsprint('start')url = r'问号前面的网址'parms = {
R 和 Python 在金融界的发展前景怎样
美国大型金融机构几乎前篇一律的用SAS。最重要原因的在于用SAS省却了尽职调查。R作为一款免费软件，有大量第三方的library或者package。你说你用吧，挺方便，但是每用一次你就得给这个来一次尽职调查。不然银行内的model vali
C语言客房管理系统，求大神
in head.h #include"stdio.h"#include"string.h"#include"stdlib.h"#include "ctype.h&q
c语言函数返回数组指针？
由于你在子函数int *shuzu(void)中定义的数组 a[4]；属于局部变量，在子函数结束时会被释放，所以返回的指针变成野指针，会乱码；简单的解决方法有两种，1. 将数组定义在主函数之前（#include &ltstdio.h
露露开大招说的什么?
露露开大招说的是：“快快变大”露露台词有：特特嗡嗡脚烫烫卖萌术毛毛球跑快快小可爱小淘气宝贝现身大巨人出现快快变大我们上喽大鼻子露珠哦~快晕了在气势上压倒我建议，滑着走那个松鼠看上去很眼熟恩~尝起来很上流
java中垃圾回收机制的原理是什么？
回收机制就是当一些资源被创建使用之后或不在调用的话就会变成垃圾，垃圾的话会占用空间，这时候就需要释放空间给其他程序使用，所以JAVA拥有自动垃圾回收机制。GC的工作原理: 引用计数,标记复制"引用计数"是一种简单但速
“java”中什么是全局变量？
其实在java中是没有真正的全局变量的，因为一个java程序其实就是由多个类方法堆积起来的，而每个类、方法中的变量实际上都是属于它自己的“全局变量”，相对于其他类、方法来说这些变量就成了局部变量（因为他们可能不能调用）。x0dx0a简单
【每天一个Go知识点】(7) go：map转结构体
可以通过github.commitchellhmapstructure包的mapstructure.Decode(map[string]interface,*struct)方法将map转换成结构体，该方法的参数有两个，第一个参数是
java中悲观锁和乐观锁的区别
乐观锁和悲观锁的区别如下：1、悲观锁是当线程拿到资源时，就对资源上锁，并在提交后，才释放锁资源，其他线程才能使用资源。2、乐观锁是当线程拿到资源时，上乐观锁，在提交之前，其他的锁也可以操作这个资源，当有冲突的时候，并发机制会保留前一个提交，
求七年级英语上册的单词表（7A）上海版di
chapter 1ruby橄榄球运动title 标题greeting 问候signature签名adress地址penfriend笔友Walker沃克Newcastle纽卡斯尔magazine杂志own拥有architect建筑师for
结构体数据大小端转换 C语言
可以使用位域来定义，同时来转换。例如一个32位int型可以如下定义：struct test{union {int bits_4struct {int bit1 : 8int bit2 : 8int bit
Java的概念和定义是什么？
Java是一种高级的、基于类的、面向对象的编程语言，它被设计为具有尽可能少的实现依赖性。它是一种通用编程语言，旨在让应用程序开发人员编写一次，随时随地运行（WORA），这意味着编译后的Java代码可以在所有支持Java的平台上运行，而无需重
数据分析员用python做数据分析是怎么回事，需要用到python中的那些内容，具体是怎么操作的?
最近，Analysis with Programming加入了Planet Python。我这里来分享一下如何通过Python来开始数据分析。具体内容如下：数据导入导入本地的或者web端的CSV文件；数据变换；数据统计描述；假设检验
c语言怎么将输入一个数输出其位数
将它作为字符串读入，测长度即可。char s[80]scanf("%s",s)printf("%d",strlen(s))例如：输入-123.987654321输出 14（含符号，小数点，数字
惠子为什么消失了？
惠子消失的原因是因为惠子ssica身上有太多黑料了，对公司和平台都有不利的影响。所以被平台封号。惠子ssica是西安人，同时她的职业是小护士。相比护士来说网红的流量会更多，所以钱也更挣吧。但是网红圈比较乱，谁也不知道她能不能一直火下去。
go和c++的区别
Go（又称 Golang）是 Google 的 Robert Griesemer，Rob Pike 及 Ken Thompson 开发的一种静态强类型、编译型语言。Go 语言语法与 C 相近，但功能上有：内存安全，GC（垃圾回收），结构形态
java转go还是大数据
大数据。拿GO语言和JAVA相比，本身就存在错位的问题，考虑Java转到Go必要性不大。但是做java的转行大数据方向，这是一个非常明智的选择，因为我国大数据产业发展进入了爆发期，人才短缺的问题日益突出。Java是一门面向对象编程语言，不仅
java获取当前时间的前一天
代码如下：String basePath = request.getScheme()+":"+request.getServerName()+":"+request.getServerPort(

推荐阅读

热门文章

最新发布

标签列表

怎么利用pandas做数据分析

给您推荐相同类型的内容：