Python Pandas 依据标签或者位置选取特定行列 loc和iloc两种方式

Python015

Python Pandas 依据标签或者位置选取特定行列 loc和iloc两种方式,第1张

Pandas中有两种方式可以进行特定行列的选取,一种是在知道每一列的名称(label)的情况下(df.loc),一种是在只知道列的位置(integer-location)的情况下(df.iloc)。

可以看出,上述的冒号(:)意味着选取所有的行,所以只需在此处进行改动即可选取特定行(前开后闭)

同样在选取特定行的时候,依然存在基于label或者是基于integer-location的选择

选取行采用df.iloc方式,具体如下

除此之外,在采用非标签的方式选择的时候,可以通过输入布尔型变量进行筛选,比如 df.iloc[[True, False, True]] ,或者是 df.iloc[lambda x: x.index % 2 == 0]

完结撒花,反正知道了df.loc和df.iloc的差别之后自由组合就好了~

参考资料: https://pandas.pydata.org/pandas-docs/stable/reference/frame.html#indexing-iteration

微信群又双叕有新问题了,如图所示,两个表格的转换。

首先跟大家分享一下我的记忆口诀:行转列逆透视

列转行透视

我们用Excel、Python、SQL分别实现一下上图的要求。

Excel

使用到Excel中的Power Query,只有Excel2016以上的版本才有,注意版本号。

行转列

全选数据>数据选项卡>自表格/区域

由于要转换的列是由"/"分割的,所以我们需要先拆分列。选中需要拆分的列>右键>拆分列>按分隔符。

选择自定义>输入"/">选择每次出现分隔符时>确定

选中标题行>右键>逆透视其他列 也可以多选中值列选择逆透视

删除多于列>关闭并上载,完成。

列转行

这边暂且只想到添加辅助列来实现该效果,有更好的方法欢迎在评论区留言。

同样多选进入Power Query界面,添加列>自定义列>输入"=[值]">确定相当于是复制一列值,列名自定义,自定义公式内的值根据原表列名来。

选中“值”>透视列>“值列”选择自定义>聚合值函数选择不要聚合>确定第一步也可以选择“自定义”列,如果这样操作的话,在第三步就要选择"值",这里列名没有起好,请大家看清楚。

选中透视出来的列>右键>合并列>自定义分隔符>确定

选中合并后的列>右键>替换值>要查找的列输入"//">确定>关闭并上载

完成 。

Python

行转列

import pandas as pd

df = pd.DataFrame([['流浪地球', '科幻/冒险/灾难'], ['唐山大地震', '剧情/亲情/灾难']],

columns=['name', 'type'])

df

# 根据'/'拆分为列表

df['type'] = df.type.str.split("/")

df_new = df.explode('type')

df_new

列转行

df_new.groupby(by='name', as_index=False).agg("/".join)explode()函数在pandas0.25.0之后才支持,除了这个方法俺想不到别的方法了。

SQL

行转列

-- 建表,插入数据DROP TABLE IF EXISTS temp

CREATE TABLE temp ( name varchar(10), type varchar(20) )

INSERT INTO temp VALUES ('流浪地球', '科幻/冒险/灾难'), ('唐山大地震', '剧情/亲情/灾难')

select * from temp

SELECT a.name

, substring_index(substring_index(a.type, '/', b.help_topic_id + 1), '/', -1) AS type

FROM temp a

JOIN mysql.help_topic b ON b.help_topic_id <length(a.type) - length(replace(a.type, '/', '')) + 1

列转行

用刚刚查询出来的结果我们再创建一个temp2。

DROP TABLE IF EXISTS temp2

CREATE TABLE temp2

(SELECT a.name , substring_index(substring_index(a.type, '/', b.help_topic_id + 1), '/', -1) AS type FROM temp a JOIN mysql.help_topic b ON b.help_topic_id <length(a.type) - length(replace(a.type, '/', '')) + 1)

-- 使用group_concat函数实现列转行拼接SELECT name, GROUP_CONCAT(type SEPARATOR '/') AS type

FROM temp2