In [1]: dates = pd.date_range('1/1/2000', periods=8) In [2]: df = pd.DataFrame(np.random.randn(8, 4), ...: index=dates, columns=['A', 'B', 'C', 'D']) ...: In [3]: df Out[3]: A B C D 2000-01-01 0.469112 -0.282863 -1.509059 -1.135632 2000-01-02 1.212112...
import polars as pl import time # 读取 CSV 文件 start = time.time() df_pl_gpu = pl.read_csv('test_data.csv') load_time_pl_gpu = time.time() - start # 过滤操作 start = time.time() filtered_pl_gpu = df_pl_gpu.filter(pl.col('value1') > 50) filter_time_pl_gpu = time.t...
In [32]: %%time ...: files = pathlib.Path("data/timeseries/").glob("ts*.parquet") ...: counts = pd.Series(dtype=int) ...: for path in files: ...: df = pd.read_parquet(path) ...: counts = counts.add(df["name"].value_counts(), fill_value=0) ...: counts.astype(in...
df.head(3)# 3.2 查看后n行 df.tail(3)# 3.3 查看行数和列数 df.shape # 3.4查看列索引 df.columns # 3.5 查看行索引 df.index # 3.6 查看索引、数据类型和内存信息 df.info()# 3.7 查看数值型列的汇总统计 df.describe()# 3.8 查看每一列的唯一值和计数 df.apply(pd.Series.value_co...
Use .index[position] to get a specific index value by position. Use .get_loc(value) on .index to find the position of a specific index value. Use in keyword (e.g., value in df.index) to verify if a value exists in the index.Quick...
df.head(n = 3) # 显示前N个,默认N = 5df.tail(3) # 显示后n个,默认N=5df.dtypes # 数据类型 Python int32Math int32En int32dtype: object df.info() # 比较详细信息 <class 'pandas.core.frame.DataFrame'>RangeIndex: 100 entries, 0 to 99 #共有三行,行索引从0到99Data columns (total ...
print(df) print('='*60,'\n') # 直接通过.str调用字符串方法 # 可以对Series、Dataframe使用 # 自动过滤NaN值 print(s.str.count('b')) print(df['key2'].str.upper()) print('='*60,'\n') # df.columns是一个Index对象,也可使用.str ...
s=pd.Series( data, index, dtype, copy)#参数说明:#data 输入的数据,可以是列表、常量、ndarray 数组等。#index 索引值必须是惟一的,如果没有传递索引,则默认为 #np.arrange(n)。#dtype dtype表示数据类型,如果没有提供,则会自动判断得出。#copy 表示对 data 进行拷贝,默认为 False。
默认情况下,返回的 Series 中显示 DataFrame 索引的内存使用情况,可以通过传递 index=False 参数来抑制索引的内存使用情况: In [10]: df.memory_usage(index=False) Out[10]: int64 40000 float64 40000 datetime64[ns] 40000 timedelta64[ns] 40000 complex128 80000 object 40000 bool 5000 categorical 9968 dt...
获取值数组和索引数组:values属性和index属性。 Series比较像列表(数组)和字典的组合体。 三、pandas:Series特性 1.Series支持NumPy模块的特性(下标): 从ndarray创建Series:Series(arr) 与标量运算:sr*2 两个Series运算:sr1+sr2 索引:sr[0], sr[[1,2,4]] ...