df = pd.DataFrame(data)# 获取 DataFrame 的所有值values = df.get_values() print(values)
ValueError: cannot index with vector containing NA / NaN values 原因: fuel中存在NaN值,所以得到的结果也是缺失值,而缺失值是不能直接作为索引的。你可以考虑在contains中更改na参数值,让其变为False——Series.str.contains(pat, case=True, flags=0, na=nan, regex=True) 解决: 你可以考虑在contains中更改...
sort_values():对Series按照值排序,生成一个新的Series对象; rank():对值进行排名,从1开始,对于相同的值默认采用平均排名; reindex():重新设置索引,生成一个新的Series对象。新的索引长度和原始索引长度可以不相同,如果新的索引不在原始数据中,则对应的值为NaN,如果在原始数据中,则值保持不变,可通过method参数指...
where,仍然是执行条件查询,但会返回全部结果,只是将不满足匹配条件的结果赋值为NaN或其他指定值,可用于筛选或屏蔽值 query,按列对dataframe执行条件查询,一般可用常规的条件查询替代 get,由于series和dataframe均可以看做是类字典结构,所以也可使用字典中的get()方法,主要适用于不确定数据结构中是否包含该标签时,与字典...
ValueError: Cannot mask with non-boolean array containing NA / NaN values 后来发现是因为这列中既有字符串,还有浮点类型的数据,所以出现了错误! 开始我还想着要不要写个函数再apply处理一下,但是后来发现一个更简单更方便的解决方案! 解决方案是:在筛选中加上"na=False",这意思是:遇到非字符串的情况,直接...
NaN是指在Pandas库中表示缺失值或异常值的特殊标记。NaN代表"not a number",用于表示缺失的数据或无法计算的结果。 在数据分析和处理过程中,经常会遇到缺失值或异常值的情况。为了保...
df.values 9、查看列名称: 代码语言:javascript 代码运行次数:0 运行 AI代码解释 df.columns 10、查看前5行数据、后5行数据: 代码语言:javascript 代码运行次数:0 运行 AI代码解释 df.head() #默认前5行数据 df.tail() #默认后5行数据 三、数据表清洗 1、用数字0填充空值: 代码语言:javascript 代码运行...
groupby默认会去掉空值)def get_max(g):df = g.sort_values('语文',ascending=True)print(df)return df.iloc[-1,:]df2.groupby('性别').apply(get_max)# 7.17 按列省份、城市进行分组,计算语文、数学、英语成绩最大值的透视表df.pivot_table(index=['省份','城市'], values=['语文','数学','...
missing_df = missing_df.sort_values('missing_pct',ascending=False).reset_index(drop=True) return missing_df missing_cal(df) 如果需要计算样本的缺失率分布,只要加上参数axis=1. 2.获取分组里最大值所在的行方法 分为分组中有重复值和无重复值两种。 无重复值的情况: df = pd.DataFrame({'Sp':['...
+ 传递一个整数来引用工作表的索引。索引遵循 Python 约定,从 0 开始。+ 传递一个字符串或整数列表,返回指定工作表的字典。+ 传递`None`返回所有可用工作表的字典。```py# Returns a DataFramepd.read_excel("path_to_file.xls", "Sheet1", index_col=None, na_values=["NA"])...