Python Pandas 对列/行进行选择,增加,删除操作
一、列操作
1.1 选择列
d = {’one’ : pd.Series([1, 2, 3], index=[’a’, ’b’, ’c’]), ’two’ : pd.Series([1, 2, 3, 4], index=[’a’, ’b’, ’c’, ’d’])}df = pd.DataFrame(d)print (df [’one’])# 选择其中一列进行显示,列长度为最长列的长度# 除了 index 和 数据,还会显示 列表头名,和 数据 类型
运行结果:
a 1.0b 2.0c 3.0d NaNName: one, dtype: float64
1.2 增加列
d = {’one’ : pd.Series([1, 2, 3], index=[’a’, ’b’, ’c’]), ’two’ : pd.Series([1, 2, 3, 4], index=[’a’, ’b’, ’c’, ’d’])}df = pd.DataFrame(d)# Adding a new column to an existing DataFrame object with column label by passing new seriesprint ('Adding a new column by passing as Series:')df[’three’]=pd.Series([10,30,20],index=[’a’,’c’,’b’])print(df)# 增加列后进行显示,其中 index 用于对应到该列 元素 位置(所以位置可以不由 列表 中的顺序进行指定)print ('Adding a new column using the existing columns in DataFrame:')df[’four’]=df[’one’]+df[’two’]+df[’three’]print(df)# 我们选定列后,直接可以对整个列的元素进行批量运算操作,这里 NaN 与其他元素相加后,还是 NaN
运行结果:
Adding a new column by passing as Series: one two threea 1.0 1 10.0b 2.0 2 20.0c 3.0 3 30.0d NaN 4 NaNAdding a new column using the existing columns in DataFrame: one two three foura 1.0 1 10.0 12.0b 2.0 2 20.0 24.0c 3.0 3 30.0 36.0d NaN 4 NaN NaN
1.3 删除列(del 和 pop 函数)
d = {’one’ : pd.Series([1, 2, 3], index=[’a’, ’b’, ’c’]), ’two’ : pd.Series([1, 2, 3, 4], index=[’a’, ’b’, ’c’, ’d’]), ’three’ : pd.Series([10,20,30], index=[’a’,’b’,’c’])}df = pd.DataFrame(d)print ('Our dataframe is:')print(df)# 使用 del 函数print ('Deleting the first column using DEL function:')del(df[’one’])print(df)# 使用 pop 函数print ('Deleting another column using POP function:')df_2=df.pop(’two’) # 将一列 pop 到新的 dataframeprint(df_2)print(df)
运行结果:
Our dataframe is: one two threea 1.0 1 10.0b 2.0 2 20.0c 3.0 3 30.0d NaN 4 NaNDeleting the first column using DEL function: two threea 1 10.0b 2 20.0c 3 30.0d 4 NaNDeleting another column using POP function: threea 10.0b 20.0c 30.0d NaNPOP column:a 1b 2c 3d 4Name: two, dtype: int64
二、行操作
2.1 选择行
2.1.1 通过 label 选择行(loc 函数)
d = {’one’ : pd.Series([1, 2, 3], index=[’a’, ’b’, ’c’]), ’two’ : pd.Series([1, 2, 3, 4], index=[’a’, ’b’, ’c’, ’d’])}df = pd.DataFrame(d)print(df.loc[’b’]) # 显示这一行中,对应表头 下的 对应数据,同时显示 行 index 和 数据类型
运行结果:
one 2.0two 2.0Name: b, dtype: float64
2.1.2 通过序号选择行(iloc 函数)
d = {’one’ : pd.Series([1, 2, 3], index=[’a’, ’b’, ’c’]), ’two’ : pd.Series([1, 2, 3, 4], index=[’a’, ’b’, ’c’, ’d’])}df = pd.DataFrame(d)print(df.iloc[2]) # 序号 2 对应的是第 3 行的数据
运行结果:
one 3.0two 3.0Name: c, dtype: float64
2.1.3 通过序号选择行切片
d = {’one’ : pd.Series([1, 2, 3], index=[’a’, ’b’, ’c’]), ’two’ : pd.Series([1, 2, 3, 4], index=[’a’, ’b’, ’c’, ’d’])}df = pd.DataFrame(d)print(df[2:4]) # 这里选择第 3 到 第 4 行,与 Python 切片一致,不需要函数,直接切片即可
运行结果:
one twoc 3.0 3d NaN 4
2.2 增加行(append 函数)
# 通过 append 函数df = pd.DataFrame([[1, 2], [3, 4]], columns = [’a’,’b’])df2 = pd.DataFrame([[5, 6], [7, 8]], columns = [’a’,’b’])df = df.append(df2)print(df) # 这里相当于把 第二个 dataframe 与第一个进行拼接,默认的 index 都是 0 1print(df.loc[0]) # 这里有两行的 index 是 0
运行结果:
a b0 1 21 3 40 5 61 7 8 a b0 1 20 5 6
2.3 删除行(drop 函数)
# 通过 drop 函数df = pd.DataFrame([[1, 2], [3, 4]], columns = [’a’,’b’])df2 = pd.DataFrame([[5, 6], [7, 8]], columns = [’a’,’b’])df = df.append(df2)df = df.drop(0) # 这里有两个行标签为 0,所以直接删除了 2 行print(df)
运行结果:
a b1 3 41 7 8
到此这篇关于Python Pandas 对列/行进行选择,增加,删除操作的文章就介绍到这了,更多相关Python Pandas行列选择增加删除内容请搜索好吧啦网以前的文章或继续浏览下面的相关文章希望大家以后多多支持好吧啦网!
相关文章:
1. Django给表单添加honeypot验证增加安全性2. Python如何给函数库增加日志功能3. spring cloud zuul增加header传输的操作4. JavaScript 双向链表操作实例分析【创建、增加、查找、删除等】5. django restframework serializer 增加自定义字段操作6. 在django中使用post方法时,需要增加csrftoken的例子7. Python如何使用logging为Flask增加logid8. vue-preview动态获取图片宽高并增加旋转功能的实现9. Spring发送邮件如何内嵌图片增加附件10. Spring Security如何优雅的增加OAuth2协议授权模式