max(), x.mean(), x.max()-x.min()], index = ['最小值', '最大值', '平均值', '极差']) frame.apply(f) 4.5 排序 排序时对数据集的重要操作,有时候我们把数据输出到excel并要求排序,我们就需要用到该操作。 Series对象用sort_index排序;而DataFrame利用sort_index方法和sort_
to_excel('example.xlsx', index=False) # 从数据库中读取数据 import sqlite3 conn = sqlite3.connect('example.db') df = pd.read_sql('select * from table1', conn) 16. 编码和解码数据 Pandas提供了多种方法来进行编码和解码数据,例如可以使用get_dummies()方法对某一列进行独热编码,使用factorize(...
In [31]: df[["foo", "qux"]].columns.to_numpy() Out[31]: array([('foo', 'one'), ('foo', 'two'), ('qux', 'one'), ('qux', 'two')], dtype=object) # for a specific level In [32]: df[["foo", "qux"]].columns.get_level_values(0) Out[32]: Index(['foo', 'f...
pivot()方法可以将长表转宽表,即树形数据转为表格型数据。 df.pivot(index='姓名', columns='科目', values='成绩') 输出: pivot()其实就是用set_index()创建层次化索引,再用unstack()重塑 df1.set_index(['姓名','科目']).unstack('科目') 数据...
from scipy.interpolate import make_interp_spline x_smooth = np.linspace(elbow_cal.index.values.min(),elbow_cal.index.values.max(),10*len(elbow_cal.percentage.values)) y_smooth = make_interp_spline(elbow_cal.index.values, elbow_cal.percentage.values)(x_smooth) elbow_cal = pd.Series(y_sm...
def get_max(g):df = g.sort_values('语文',ascending=True)print(df)return df.iloc[-1,:]df2.groupby('性别').apply(get_max)# 7.17 按列省份、城市进行分组,计算语文、数学、英语成绩最大值的透视表df.pivot_table(index=['省份','城市'], values=['语文','数学','英语'], aggfunc=max)...
this online data set just to make things easier for you guysurl = "https://raw.github.com/vincentarelbundock/Rdatasets/master/csv/datasets/AirPassengers.csv"s = requests.get(url).content# read only first 10 rowsdf = pd.read_csv(io.StringIO(s....
s = pd.Series(val, index = idx)# 通过append 方法添加,传入一个新的series 对象即可s = s.append(pd.Series({"this":9})) s = s.append(pd.Series({"this":10}))# 或者通过set_value 方法添加数据,比较append 方法set_value更便捷s.set_value("this",8)# 删除数据# 一般删除使用不多,更多是...
使用pdi.insert (df。columns, 0, ' new_col ', 1)用CategoricalIndex正确处理级别。 操作级别 除了前面提到的方法之外,还有一些其他的方法: pdi.get_level(obj, level_id)返回通过数字或名称引用的特定级别,可用于DataFrames, Series和MultiIndex pdi.set_level(obj, level_id, labels)用给定的数组(list, ...
s=pd.Series( data, index, dtype, copy)#参数说明:#data 输入的数据,可以是列表、常量、ndarray 数组等。#index 索引值必须是惟一的,如果没有传递索引,则默认为 #np.arrange(n)。#dtype dtype表示数据类型,如果没有提供,则会自动判断得出。#copy 表示对 data 进行拷贝,默认为 False。