Pandas 筛选数据 发表于 2018-04-18 | 分类于 编程 | 1. 对Series中数据进行筛选操作1234567import numpy as npfrom pandas import Series, DataFrameseries_obj = Series(np.arange(8),index = ['row 1', 'row 2','row 3','row 4','row 5', 'row 6', 'row 7', 'row 8'])#选择单行数据series_obj['row6']5 12345678910111213141516171819#选择多行数据series_obj[[0,7]]row 1 0row 8 7#切片series_obj['row 3':'row 7']row 3 2row 4 3row 5 4row 6 5row 7 6#条件筛选series_obj[series_obj > 6]row 8 7#对数据进行更新或设置series_obj['row 1', 'row 5', 'row 8'] = 8 2. 对dataFrame中数据进行操作1234567891011121314151617181920212223242526#新建一个随机dataFramenp.random.seed(30) #保证产生的随机数都是相同的DF_obj = DataFrame(np.random.rand(25).reshape((5,5)), index = ['row 1', 'row 2', 'row 3', 'row 4', 'row 5'], columns = ['column 1', 'column 2', 'column 3', 'column 4', 'column 5'])#使用行index和列column信息获取数据DF_obj.loc[['row 1', 'row 3'],['column 2', 'column 5']] column 2 column 5row 1 0.380748 0.962608row 3 0.544136 0.933850#使用行和列位置信息获取数据DF_obj.iloc[[2, 4],[1, 4]] column 2 column 5row 3 0.544136 0.933850row 5 0.734953 0.902514#筛选或判断数据DF_obj>.3 column 1 column 2 column 3 column 4 column 5row 1 True True True False Truerow 2 True True False True Truerow 3 False True True True Truerow 4 False False True False Falserow 5 True True True False True