column_names = ['Column1', 'Column2'] # 使用pd.read_excel()函数读取xls文件,并指定要读取的列名 df = pd.read_excel(file_path, usecols=column_names) 在usecols参数中,你可以指定要读取的列名列表。这将只读取这些列的数据。如果你只需要读取一列数据,可以将column_names设置为一个包含单一列名的列表。
1)获取行数:df.index pandas会默认给一个excel文件的行设置数字索引,从0开始算;如果一个excel多个列的行数不同则按照行数最多的那一列计算。 # -*- coding: utf-8 -*- importpandasaspd df=pd.read_excel('kwd.xlsx') print(df.index)# 行索引 RangeIndex(start=0,stop=3747,step=1) 2)同时获取行...
pd.read_excel('fake2excel.xlsx', index_col=None)2、指定sheet读取 见名知意。pd.read_excel(open('fake2excel.xlsx', 'rb'), sheet_name='Sheet2')# 使用sheet_name=0,指定读取sheet2里面的内容。我们在原表里加入了sheet2,结果如下图所示:这种情况下,不会读取sheet1里面的内容 3、取消header读取...
data=df.loc[[1,2]].values#读取指定多行的话,就要在loc[]里面嵌套列表指定行数print("读取指定行的数据:\n{0}".format(data))print("\n---读取指定的行列---") df=pd.read_excel('测试.xlsx') data=df.iloc[1,2]#读取第一行第二列的值,这里不需要嵌套列表print("读取指定行的数据:\n{0}"...
Pandas读取excel表并新增一列后存储 import pandas as pd 定义一个获取新列数据的方法 def get_new_col(input) str1 =f“我是{input}” return str1 file_name=“文件路径写在这里” 根据列a新增一列new_column df=pd.read_excel(file_name) df[“new_column”]=df[“列a”].apply(get_new_col)...
读取表格并得到表格行列信息 df=pd.read_excel('test.xlsx') height,width = df.shape print(height,width,type(df)) 1. 2. 3. 表格如下: 得到如下输出,为一个4行5列的数据块,为DataFrame格式: 直接print(df)得到的结果: 对比结果和表格,很显然表格中的第一行(黄色高亮部分)被定义为数据块的列下标,而...
import pandas as pd def test(): # 读取Excel文件 df = pd.read_excel('测试数据.xlsx') # 插入列 df.insert(loc=2, column='爱好', value=None) # 保存修改后的DataFrame到新的Excel文件 df.to_excel('结果.xlsx', index=False) test() 3、插入多列 假设我需要在D列(班级)后面插入5列,表头名...
或者自己添加吧,方法简单,读取excel文件时直接加index_col 代码示例: importpandasaspd#导入pandas库excel_file='./try.xlsx'#导入excel数据data=pd.read_excel(excel_file,index_col='姓名')#这个的index_col就是index,可以选择任意字段作为索引index,读入数据print(data.loc['李四']) ...
其中的Sheet1是我们要读取的工作表的名称。read_excel()函数的另一个重要参数是header,它设置是否使用文件中的首行作为列名称。默认情况下,它会使用文件中的第一行作为列名称。运行效果如下:我们使用print(type(df))看下这个返回对象实例类型 <class 'pandas.core.frame.DataFrame'> 这里返回了一个DataFrame对象...