import pandas as pd # 读取CSV文件 data = pd.read_csv('data.csv') # 指定行列 # 获取第一行数据 first_row = data.iloc[0] # 获取第一列数据 first_column = data.iloc[:, 0] # 获取指定行列数据 specific_data = data.iloc[0, 2] print(first_row) print(first_column) print(specific_dat...
数据处理过程中csv文件用的比较多。 import pandas as pd data = pd.read_csv('F:/Zhu/test/test.csv') 1. 2. 下面看一下pd.read_csv常用的参数: pandas.read_csv(filepath_or_buffer, sep=', ', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, pref...
1.读取csv文件 import pandas as pd file="E:\data\test.csv" csvPD=pd.read_csv(file) 1. 2. 3. 4. 2.查找指定列及指定单元格 2.1指定列:通过索引指定列名为hour的列 通过索引找到列的方式:csvPD['hour'] 在hour列中找到时间为23的行: for i in range(len(csvPD)): if str(csvPD['hour']...
1importpandas as pd2importos3# 获取文件名4file_path = r'D:\测试数据信息库\2021'5file_name =os.listdir(file_path)6print(file_name)78forfile_nameinfile_name:9# 分析并读取csv文件数据10df = pd.read_csv(r'D:\测试数据信息库\2021\{0}'.format(file_name), encoding='gbk')11# 修改指定...
1. 通过pandas读取csv文件 2. 获取某一列的值并进行类型转换 3. 通过apply方法中的匿名函数进行数据的处理 4. 输出到原始文件中 1 2 3 4 5 6 importpandas as pd file="2019/万网2019.csv" data=pd.read_csv(file,encoding='utf-8') data[u'作者单位名称']=data[u'作者单位名称'].astype(str) ...
python查看数据集中指定列的数据 使用pandas库可以很方便地查看数据集中指定列的数据。首先,需要使用pandas的read_csv()方法读取数据集: import pandas as pd data = pd.read_csv('data.csv') 其中,'data.csv'是数据集的文件路径。假设数据集中有以下几列:'col1'、'col2'、'col3'、'col4',想要查看'col2...
1.导入pandas模块 >>>importpandasaspd 2.导入数据 >>>titanic=pd.read_csv(r'C:\Users\Administrator\Desktop\titanic.csv') 3.选择单列 >>>ages=titanic["Age"]>>>ages.head()022.0138.0226.0335.0435.0Name:Age,dtype:float64>>>type(ages)<class'pandas.core.series.Series'> ...
1.导入pandas模块 >>>importpandasaspd 2.导入数据 >>>titanic=pd.read_csv(r'C:\Users\Administrator\Desktop\titanic.csv') 3.选择单列 >>>ages=titanic["Age"]>>>ages.head()022.0138.0226.0335.0435.0Name:Age,dtype:float64>>>type(ages)<class'pandas.core.series.Series'> ...
import pandas as pd # 根据你自己的文件设置编码 df = pd.read_csv("test.csv", encoding="gbk") print(df.head()) # 按照“总价”列降序,并重置索引 # 一列,一种排序方式也可以不写方括号。 # 如果想按照多列排序可以把列名都写进 by 参数列表中,并把它们的排序方式也写进 ascending 参数列表) ...
pandas,xlrd , openpyxl 5.找出指定的行和指定的列 主要使用的就是函数iloc data.iloc[:,:2]#即全部行,前两列的数据 逗号前是行,逗号后是列的范围,很容易理解 6.在规定范围内找出符合条件的数据 data.iloc[:10,:][data.工资>6000] 这样即可找出前11行里工资大于6000的所有人的信息了...