import pandas as pd # 读取CSV文件 df = pd.read_csv('data.csv') # 按列名选择 selected_columns_by_name = df[['Name', 'Salary']] print(selected_columns_by_name) # 按索引选择(假设'Name'是第一列,'Salary'是第四列) selected_columns_by_
Pandas的索引对象负责管理轴标签和其他元数据,索引对象不能修改,否则会报错。也只有这样才能保证数据的准确性,并且保证索引对象在多个数据结构之间进行安全共享。 我们可以直接查看索引有哪些。 代码语言:javascript 代码运行次数:0 运行 AI代码解释 df2=pd.DataFrame(data,columns=['city','year','name'],index=['a...
(不信?试试合并100个Excel文件:pd.concat([pd.read_excel(f) for f in files]),深藏功与名😂) 工具只是武器,真正的战力在于数据思维。Pandas给了你一把瑞士军刀——切数据如黄油,但炒出什么菜,还得看厨子啊! 🚀 行动建议: 1. 马上用pd.read_csv()加载手头的数据 2. 试试.groupby()+.agg()做分...
pd.read_csv("stock_day2.csv", names=["open","high","close","low","volume","price_change","p_change","ma5","ma10","ma20","v_ma5","v_ma10","v_ma20","turnover"]) 2.写入CSV文件:datafram.tocsv() DataFrame.to_csv(path_or_buf=None,sep=',',columns=None,header=True,in...
1:5]# 根据列名筛选数据selected_columns=['column1','column2']filtered_df=df[selected_columns...
访问数据通常是数据分析过程的第一步,而将表格型数据读取为DataFrame对象是pandas的重要特性。 常见pandas解析数据函数pd.read_csv() # 从文件、url或文件型对象读取分割好的数据,英文逗号是默认分隔符 pd.read_…
df = df.set_index(pd.to_datetime(df['raw_time'])).drop(columns=['raw_time']) 1. 2. 3. 4. 5. 2.2 智能切片操作 # 部分字符串匹配(自动解析) jan_data = df['2025-01'] # 提取2025年1月所有数据 # 跨频率切片(日->月) q1_data = df['2025-01':'2025-03'] # 自动识别季度边界...
meter_data = pd.read_csv('smart_meter.csv', parse_dates=['record_time'], index_col='record_time') 缺失值处理(前向填充) meter_data = meter_data.resample('15T').asfreq().fillna(method='ffill') 6.2 特征工程 创建时间特征 meter_data['hour'] = meter_data.index.hour ...
Using the read_csv() function, you can select only the columns you need after loading the file, but this means you must know what columns you need prior to loading the data if you wish to perform this operation from within the read_csv() function. If you do know the columns you need...
read_excel可以通过将sheet_name设置为工作表名称列表、工作表位置列表或None来读取多个工作表。可以通过工作表索引或工作表名称指定工作表,分别使用整数或字符串。 ### 读取MultiIndex read_excel可以通过将列列表传递给index_col和将行列表传递给header来读取MultiIndex索引。如果index或columns具有序列化级别名称,也可以...