# 使用ix进行下表和名称组合做引 data.ix[0:4, ['open', 'close', 'high', 'low']] # 推荐使用loc和iloc来获取的方式 data.loc[data.index[0:4], ['open', 'close', 'high', 'low']] data.iloc[0:4, data.columns.get_indexer(['open', 'close', 'high', 'low'])] open close hig...
pivot()方法可以将长表转宽表,即树形数据转为表格型数据。 df.pivot(index='姓名', columns='科目', values='成绩') 输出: pivot()其实就是用set_index()创建层次化索引,再用unstack()重塑 df1.set_index(['姓名','科目']).unstack('科目') 数据...
max(), x.mean(), x.max()-x.min()], index = ['最小值', '最大值', '平均值', '极差']) frame.apply(f) 4.5 排序 排序时对数据集的重要操作,有时候我们把数据输出到excel并要求排序,我们就需要用到该操作。 Series对象用sort_index排序;而DataFrame利用sort_index方法和sort_values方法排序,...
from scipy.interpolate import make_interp_spline x_smooth = np.linspace(elbow_cal.index.values.min(),elbow_cal.index.values.max(),10*len(elbow_cal.percentage.values)) y_smooth = make_interp_spline(elbow_cal.index.values, elbow_cal.percentage.values)(x_smooth) elbow_cal = pd.Series(y_sm...
s = pd.Series(val, index = idx)# 通过append 方法添加,传入一个新的series 对象即可s = s.append(pd.Series({"this":9})) s = s.append(pd.Series({"this":10}))# 或者通过set_value 方法添加数据,比较append 方法set_value更便捷s.set_value("this",8)# 删除数据# 一般删除使用不多,更多是...
def get_max(g):df = g.sort_values('语文',ascending=True)print(df)return df.iloc[-1,:]df2.groupby('性别').apply(get_max)# 7.17 按列省份、城市进行分组,计算语文、数学、英语成绩最大值的透视表df.pivot_table(index=['省份','城市'], values=['语文','数学','英语'], aggfunc=max)...
除了数据,你还可以选择传递 index(行标签)和 columns(列标签)参数。如果传递了索引和/或列,你将保证结果 DataFrame 的索引和/或列。因此,一个 Series 字典加上一个特定索引将丢弃所有与传递索引不匹配的数据。 如果没有传递轴标签,它们将根据常识规则从输入数据中构建。 从Series 或字典的字典 结果的 索引 将是...
df1=pd.read_sql("cp",con=eng,index_col='id') 参数解释: sql:SQL命令字符串 con:连接sql数据库的engine,一般可以用SQLalchemy或者pymysql之类的包建立 index_col: 选择某一列作为index coerce_float:非常有用,将数字形式的字符串直接以float型读入 ...
使用pdi.insert (df。columns, 0, ' new_col ', 1)用CategoricalIndex正确处理级别。 操作级别 除了前面提到的方法之外,还有一些其他的方法: pdi.get_level(obj, level_id)返回通过数字或名称引用的特定级别,可用于DataFrames, Series和MultiIndex pdi.set_level(obj, level_id, labels)用给定的数组(list, ...
df.pivot(index='姓名',columns='科目',values='成绩') 输出: pivot()其实就是用set_index()创建层次化索引,再用unstack()重塑 df1.set_index(['姓名','科目']).unstack('科目') 数据分组与数据透视表更是一个常见的需求,groupby()方法可以用于数据分组。