sr3 = pd.Series([11,20,10,14], index=['d','c','a','b']) sr1+sr3 如何在两个Series对象相加时将缺失值设为0? sr1.add(sr2, fill_value=0) 灵活的算术方法:add, sub, div, mul 缺失数据:使用NaN(Not a Number)来表示缺失数据。其值等于np.nan。内置的None值也会被当做NaN处理。 处理缺...
sort_index、sort_values,既适用于series也适用于dataframe,sort_index是对标签列执行排序,如果是dataframe可通过axis参数设置是对行标签还是列标签执行排序;sort_values是按值排序,如果是dataframe对象,也可通过axis参数设置排序方向是行还是列,同时根据by参数传入指定的行或者列,可传入多行或多列并分别设置升序降序参数,...
value_counts方法 pandas.DataFrame按照某几列分组并统计:groupby+count pandas.DataFrame按照某列分组并求和 pandas.DataFrame按照某列分组并取出某个小组:groupby+get_group pandas.DataFrame排序 pandas.DataFrame按照行标签或者列标签排序:sort_index方法 pandas.DataFrame按照某列值排序:sort_values方法by参数 pandas....
get_value, set_value方法 根据行和列的标签设置单个值 灵活运用前9个方法对后续批量数据清洗和处理有很大的帮助。 4.3 对象的相加和使用填充值算法 不同对象(Series和DataFrame)之间的算术行为是pandas提供的一项重要功能。在pandas库的简单介绍(1)已经介绍过Series对象相加的例子,这里说明一下DataFrame对象的加减。
1.Index 对于Index对象,可以通过[]来选取数据,它类似于一维ndarray的索引。下标可以为下列几种下标对象: 一个整数下标。此时返回对应的label 一个整数slice。此时返回对应的Index(根据一维labels先切片,再组装成Index) 一个array-like对象(元素可以为下标或者布尔值)。此时返回对应的Index。(根据一维labels先索引,再组...
df.index # 3.6 查看索引、数据类型和内存信息 df.info()# 3.7 查看数值型列的汇总统计 df.describe()# 3.8 查看每一列的唯一值和计数 df.apply(pd.Series.value_counts)4. 数据处理 4.1 重命名列名 4.2 选择性更改列名 4.3 批量更改索引 4.4 批量更改列名 4.5 设置姓名列为行索引 4.6 检查...
get(key) is not None: # 找到数据框中列为 key 且数值等于 num_null[key] 的行的索引,并转换为列表形式。 例如 [0, 1, 2] 此处代表找出和json文件中缺失值一样的数据对应的索引 null_ind2 = list(df[df[key] == num_null[key]].index) # 主要是找出 不正常的数据 脏数据, 如果数据质量不错...
(字典的键key),右侧一列是列表数据(字典的值value) print(b.index) # Index(['a', 'b', 'c', 'd'], dtype='object') print(b.values) # array([11, 12, 13, 14]) # 查询series的数据,这里和Python的字典一致 print(b['d']) # 14 print(b[['c','d']]) # 可以同时打印出索引c和...
by参数指向要排列的列,ascending参数指向排序的方式(升序还是降序)frame.sort_values(by='c', ascending=True)# 让行索引升序排序frame.sort_index()# 让列索引升序排序frame.sort_index(axis=1)# 让列索引降序排序frame.sort_index(axis=1, ascending=False)# 让任选两列数据同时降序排序frame.sort_values(by...
[label] 1236 # Similar to Index.get_value, but we do not fall back to positional -> 1237 loc = self.index.get_loc(label) 1239 if is_integer(loc): 1240 return self._values[loc] File ~/work/pandas/pandas/pandas/core/indexes/base.py:3812, in Index.get_loc(self, key) 3807 if ...