网站建设 >

查看其它板块

pandas子集选取的三种方法：[]、.loc[]、.iloc[]

pandas读取Excel、csv文件中的数据时，得到的大多是表格型的二维数据，在pandas中对应的即为DataFrame数据结构。在处理这类数据时，往往要根据据需求先获取数据中的子集，如某些列、某些行、行列交叉的部分等。可以说子集选取是一个非常基础、频繁使用的操作，而DataFrame的子集选取看似简单却有一定复杂性。本文聚焦DataFrame的子集选取操作逻辑，力求在实战中遇到子集选取操作的需求时"不迷路"。

创新互联坚持“要么做到，要么别承诺”的工作理念，服务领域包括：成都做网站、成都网站设计、成都外贸网站建设、企业官网、英文网站、手机端网站、网站推广等服务，满足客户于互联网时代的东乡族网站设计、移动媒体设计的需求，帮助企业找到有效的互联网解决方案。努力成为您成熟可靠的网络建设合作伙伴！

主目录

一、图解`DataFrame`

DataFrame是一种二维的表格型数据结构，每一行/列都有对应的标签和位置序号。行列标签、位置序号的对应关系如下图所示：

图解DataFrame行列标签、位置序号

列标签（也叫列名：columns）
行标签（也叫行索引：index）默认为(0, 1, 2, …, n)。这里与位置序号恰好一致。

针对DataFrame的数据结构，pandas提供了三种获取子集的索引器：[]、.loc[]、.iloc[]。

df[]：快捷的整行整列选取
df.loc[]：按标签的行列交叉选取
df.iloc[]：按位置序号的行列交叉选取

二、整行整列选取：`df[]`

`df['列标签']`，选取单个整列

#选取“日期”列
df['日期']

`df[标签列表]`，选取多个整列

#选取“最高温”，“最低温”，“风力风向”三列
df[['最高温','最低温','风力风向']]

`df[切片]`，选取整行

#选取行索引值1、2、3的整行。切片左闭右开
df[1:4]

切片语法也支持字符串的索引标签值，如将"日期"列修改为行索引（index）

df1=df.set_index("日期")

#下面两个切片选取的行是一样的
df1[1:4]#按位置序号的切片，左闭右开
df1['2021-12-02周四':'2021-12-04周六']#按行标签的切片，左闭右闭

df[]语法小结：

df[]语法中，方括号内输入标签名或列表选取的是列；而方括号内输入切片、条件选取的是行（条件筛选在下文单独介绍）。
df[]输入切片选取整行时，如果是按照位置序号的切片，左闭右开；按行标签的切片，左闭右闭。

三、行列交叉选取

行列交叉选择，可以通过df.loc[]和df.iloc[]两个索引器来实现，两者都需要输入两组参数，先行选择，后列选择。行、列选择都可以是单个标签（序号）、列表和切片。根据需求组合使用，威力强大！

df.loc[行选择,列选择]。参数面向的是标签。

df.iloc[行位置序号,列位置序号]。参数面向的是位置序号。

行：单个数值，列：单个数值

df1.loc['2021-12-05周日','空气质量指数']
df1.iloc[4,4]

image-

行：列表，列：列表

df1.loc[['2021-12-05周日','2021-12-07周二'],['最高温','最低温','风力风向']]
df1.iloc[[4,6],[0,1,3]]

image-

行：切片，列：切片

df1.loc['2021-12-01周三':'2021-12-03周五','天气':'空气质量指数']
df1.iloc[:3,2:5]

image-

行：切片(全选)，列：列表

df1.loc[:,['最高温','最低温']]
df1.iloc[:,[0,1]]

image-

四、按条件筛选子集

df.[]、df.loc[]、df.iloc[]除了按照行列的标签和位置序号选取子集，还可以使用条件（布尔表达式）筛选子集。

筛选最高温、最低温

将最高温、最低温处理成数值型：

df1.loc[:,'最高温']=df1['最高温'].str.replace('°','').astype('float32')
df1.loc[:,'最低温']=df1['最低温'].str.replace('°','').astype('float32')

温度处理成数值

获取最高温大于10度，最低温小于6度的数据

#df.[]的写法
df1[(df1['最高温']>10)&(df1['最低温']<6)]
#df.loc[]的写法
df1.loc[(df1['最高温']>10)&(df1['最低温']<6),:]
#&与、|或、~非
df1.loc[(df1['最高温']>10)&~(df1['最低温']>=6),:]

基于温度的条件筛选

五、函数筛选子集

#匿名函数lambda表达式，获取最高温大于10度，最低温小于6度的数据
df1.loc[lambdadf:(df['最高温']>10)&(df['最低温']<6)]

获取前9天并且空气质量指数为优

#自定义函数，返回值是布尔数组
defqueryData(df):
returndf.index.str.startswith('2021-12-0')&df['空气质量指数'].str.endswith('优')

df1.loc[queryData,:]

函数查询

小结

在pandast提供的df[]、df.loc[]、df.iloc[]这个三种索引器，前两个更为常用。df[]在整行或者整列获取时更为方便。整行整列选取可以看作是行列交叉选取的一个特例，故df.loc[]是更为通用的方法，它支持单个标签值、列表多选、切片区间、条件（布尔）表达式、函数调用五种方式索引子集，功能强大。

文章标题：pandas子集选取的三种方法：[]、.loc[]、.iloc[]
网站路径：http://www.cdkjz.cn/article/dsogpsd.html

返回首页了解更多建站资讯

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

大客户专线成都：13518219792 座机：028-86922220

在线咨询提交需求

友情链接交换友情链接

成都网站建设合江网站建设成都做网站营山母婴护理成都微信小程序开发网站免费收录关键词排名外贸营销网站建设成都橡塑保温板网站制作

成都网站建设公司地址：成都市青羊区太升南路288号锦天国际A座10层建设咨询028-86922220

专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网！ | 成都网站建设哪家好？ | 网站建设地图

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

pandas子集选取的三种方法：[]、.loc[]、.iloc[]

一、图解`DataFrame`

二、整行整列选取：`df[]`

`df['列标签']`，选取单个整列

`df[标签列表]`，选取多个整列

`df[切片]`，选取整行

三、行列交叉选取

四、按条件筛选子集

筛选最高温、最低温

五、函数筛选子集

获取前9天并且空气质量指数为优

小结

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

pandas子集选取的三种方法：[]、.loc[]、.iloc[]

一、图解DataFrame

二、整行整列选取：df[]

df['列标签']，选取单个整列

df[标签列表]，选取多个整列

df[切片]，选取整行

三、行列交叉选取

四、按条件筛选子集

筛选最高温、最低温

五、函数筛选子集

获取前9天并且空气质量指数为优

小结

相关资讯

怎么样子盒子能撑起父盒子？浮动,BFC,边距重叠

PyQt5 GUI &amp;&amp; Requests Api 做一个天气查询系统（文末领取完整代码）

【python】大写金额转换为数字的简单算法

form里面有的select框需要设置成固定值展示给用户看，但是又不让用户进行变更。

用python爬点高质量的壁纸换换，每天保持心情愉悦！

matplotlib 中文问题

luminati代理快速使用教程

1.1&amp;1.2 解压可迭代对象赋值给多个变量

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

一、图解`DataFrame`

二、整行整列选取：`df[]`

`df['列标签']`，选取单个整列

`df[标签列表]`，选取多个整列

`df[切片]`，选取整行

PyQt5 GUI && Requests Api 做一个天气查询系统（文末领取完整代码）

1.1&1.2 解压可迭代对象赋值给多个变量

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接