# 根据条件过滤行df_filtered = df[df['column_name'] > 5]# 按单列对DataFrame进行排序df_sorted = df.sort_values('column_name')# 按多列对DataFrame进行排序df_sorted = df.sort_values(['column_name1', 'column_name2'], ascending=[
to_replace:被替换的值value:替换后的值inplace:是否要改变原数据,False是不改变,True是改变,默认是Falselimit:控制填充次数regex:是否使用正则,False是不使用,True是使用,默认是Falsemethod:填充方式,pad,ffill,bfill分别是向前、向前、向后填充创建一个df:values_1 = np.random.randint(10, size=10)v...
(1)replace()函数:替换元素 使用replace()函数,对values进行替换操作 index = ["张三","张三丰","李白","杜甫"] columns = ["Python","Java","H5","UI"] data = np.random.randint(0,100,size=(4,4)) df = pd.DataFrame(data=data,index=index,columns=columns) df PythonJavaH5UI 张三 35 35...
replace() 函数:替换元素,使用replace()函数,对values进行映射操作 DataFrame替换操作 单值替换 普通替换: 替换所有符合要求的元素:to_replace=15,value='e' 按列指定单值替换: to_replace={列标签:替换值} value='value' df.replace(to_replace=5,value='five')# 把值为5的元素值替换为five 多值替换 列表...
s.values # 值 s.index # 索引 3)Series的索引 (1) 显式索引(闭区间): s[ key ] # 使用index中的元素作为索引值 s.loc[ key ] # 使用index中的元素作为索引值 (2) 隐式索引(半开区间): s[ n ] # 使用整数作为索引值 s.iloc[ n ] # 使用整数作为索引值 ...
...# 2、upper() 将Series/Index中的字符串转换为大写。 # 3、len() 计算字符串长度。 # 4、strip() 帮助从两侧的系列/索引中的每个字符串中删除空格(包括换行符)。...# 7、get_dummies() 返回具有单热编码值的数据帧(DataFrame)。...# 9、replace(a,b) 将值a替换为值b。 # 10、repeat(va...
df.replace(to_replace={0:'zero'}) 2、映射操作map() 概念:创建一个映射关系列表,把values元素和一个特定的标签或者字符串绑定(给一个元素值提供不同的表现形式) 创建一个df,两列分别是姓名和薪资,然后给其名字起对应的英文名 python dic = {'name':['张三','李四','张三'],'salary':[15000,20000,...
df["手机号码"] = df["手机号码"].str.slice_replace(3,7,"*"*4) 输出: df["地址"].str.extract("([\u4e00-\u9fa5]+)") 输出: 行/列操作 数据清洗时,会将带空值的行删除,此时DataFrame或Series类型的数据不再是连续的索引,可以使用reset_i...
index/columns/values,分别对应了行标签、列标签和数据,其中数据就是一个格式向上兼容所有列数据类型的array。为了沿袭字典中的访问习惯,还可以用keys()访问标签信息,在series返回index标签,在dataframe中则返回columns列名;可以用items()访问键值对,但一般用处不大。
df.replace('old_value', 'new_value') # 检查是否有重复的数据 df.duplicated() # 删除重复的数据 df.drop_duplicates()数据选择和切片函数说明 df[column_name] 选择指定的列; df.loc[row_index, column_name] 通过标签选择数据; df.iloc[row_index, column_index] 通过位置选择数据; df.ix[row_index...