可以看出,上述的冒号(:)意味着选取所有的行,所以只需在此处进行改动即可选取特定行(前开后闭)
同样在选取特定行的时候,依然存在基于label或者是基于integer-location的选择
选取行采用df.iloc方式,具体如下
除此之外,在采用非标签的方式选择的时候,可以通过输入布尔型变量进行筛选,比如 df.iloc[[True, False, True]] ,或者是 df.iloc[lambda x: x.index % 2 == 0]
完结撒花,反正知道了df.loc和df.iloc的差别之后自由组合就好了~
参考资料: https://pandas.pydata.org/pandas-docs/stable/reference/frame.html#indexing-iteration
微信群又双叕有新问题了,如图所示,两个表格的转换。首先跟大家分享一下我的记忆口诀:行转列逆透视
列转行透视
我们用Excel、Python、SQL分别实现一下上图的要求。
Excel
使用到Excel中的Power Query,只有Excel2016以上的版本才有,注意版本号。
行转列
全选数据>数据选项卡>自表格/区域
由于要转换的列是由"/"分割的,所以我们需要先拆分列。选中需要拆分的列>右键>拆分列>按分隔符。
选择自定义>输入"/">选择每次出现分隔符时>确定
选中标题行>右键>逆透视其他列 也可以多选中值列选择逆透视
删除多于列>关闭并上载,完成。
列转行
这边暂且只想到添加辅助列来实现该效果,有更好的方法欢迎在评论区留言。
同样多选进入Power Query界面,添加列>自定义列>输入"=[值]">确定相当于是复制一列值,列名自定义,自定义公式内的值根据原表列名来。
选中“值”>透视列>“值列”选择自定义>聚合值函数选择不要聚合>确定第一步也可以选择“自定义”列,如果这样操作的话,在第三步就要选择"值",这里列名没有起好,请大家看清楚。
选中透视出来的列>右键>合并列>自定义分隔符>确定
选中合并后的列>右键>替换值>要查找的列输入"//">确定>关闭并上载
完成 。
Python
行转列
import pandas as pd
df = pd.DataFrame([['流浪地球', '科幻/冒险/灾难'], ['唐山大地震', '剧情/亲情/灾难']],
columns=['name', 'type'])
df
# 根据'/'拆分为列表
df['type'] = df.type.str.split("/")
df_new = df.explode('type')
df_new
列转行
df_new.groupby(by='name', as_index=False).agg("/".join)explode()函数在pandas0.25.0之后才支持,除了这个方法俺想不到别的方法了。
SQL
行转列
-- 建表,插入数据DROP TABLE IF EXISTS temp
CREATE TABLE temp ( name varchar(10), type varchar(20) )
INSERT INTO temp VALUES ('流浪地球', '科幻/冒险/灾难'), ('唐山大地震', '剧情/亲情/灾难')
select * from temp
SELECT a.name
, substring_index(substring_index(a.type, '/', b.help_topic_id + 1), '/', -1) AS type
FROM temp a
JOIN mysql.help_topic b ON b.help_topic_id <length(a.type) - length(replace(a.type, '/', '')) + 1
列转行
用刚刚查询出来的结果我们再创建一个temp2。
DROP TABLE IF EXISTS temp2
CREATE TABLE temp2
(SELECT a.name , substring_index(substring_index(a.type, '/', b.help_topic_id + 1), '/', -1) AS type FROM temp a JOIN mysql.help_topic b ON b.help_topic_id <length(a.type) - length(replace(a.type, '/', '')) + 1)
-- 使用group_concat函数实现列转行拼接SELECT name, GROUP_CONCAT(type SEPARATOR '/') AS type
FROM temp2