data.index # 结果 Index(['同学0', '同学1', '同学2', '同学3', '同学4', '同学5', '同学6', '同学7', '同学8', '同学9'], dtype='object') (3)columns DataFrame的列索引列表 data.columns # 结果 Index(['语文', '数学', '英语', '政治', '体育'], dtype='object') (4)va...
这里提到了index和columns分别代表行标签和列标签,就不得不提到pandas中的另一个数据结构:Index,例如series中标签列、dataframe中行标签和列标签均属于这种数据结构。既然是数据结构,就必然有数据类型dtype属性,例如数值型、字符串型或时间类型等,其类型绝大多数场合并不是我们关注的主体,但有些时候值得注意,如后文中...
month=x // 100 % 100, day=x % 100, freq="D") ...: In [430]: s.apply(conv) Out[430]: 0 2012-12-31 1 2014-11-30 2 9999-12-31 dtype: period[D]
字典中的键作为列标签(columns) 键对应的值作为该列的数据内容 df2 = pd.DataFrame( {"A":1.0,"B": pd.Timestamp("20130102"),"C": pd.Series(1, index=list(range(4)), dtype="float32"),"D": np.array([3] *4, dtype="int32"),"E": pd.Categorical(["test1","train1","test2","tra...
DtypeWarning: Columns (2) have mixed types. Specify dtype option on import or set low_memory=False 意思是第二列出现类型混乱,原因如下 pandas读取csv文件默认是按块读取的,即不一次性全部读取; 另外pandas对数据的类型是完全靠猜的,所以pandas每读取一块数据就对csv字段的数据类型进行猜一次,所以有可能pandas...
In [56]: df1.loc['a'] > 0 Out[56]: A True B False C False D False Name: a, dtype: bool In [57]: df1.loc[:, df1.loc['a'] > 0] Out[57]: A a 0.132003 b 1.130127 c 1.024180 d 0.974466 e 0.545952 f -1.281247 布尔数组中的 NA 值会传播为False: 代码语言:javascript ...
columns Index(['姓名', '语文', '数学', '英语', '物理', '化学', '生物', '政治', '历史', '地理'], dtype='object') 3、行列数据置换 >>> df.T 0 1 2 3 4 5 6 7 姓名 张三 李四 王五 赵六 孙七 周八 吴九 郑十 语文 87 63 88 88 66 73 66 62 数学 60 86 64 98 85 88...
初始数据为: a b c d 0 2.0 kl 4.0 7.0 1 2.0 kl 6.0 9.0 2 NaN kl 5.0 NaN 3 5.0 NaN NaN 9.0 4 6.0 kl 6.0 8.0 columns= Index(['a', 'b', 'c', 'd'], dtype='object') index= RangeIndex(start=0, stop=5, step=1) values= [[2.0 'kl' 4.0 7.0] [2.0 'kl' 6.0 9.0] ...
In [7]: df.info(memory_usage="deep") <class 'pandas.core.frame.DataFrame'> RangeIndex: 5000 entries, 0 to 4999 Data columns (total 8 columns): # Column Non-Null Count Dtype --- --- --- --- 0 int64 5000 non-null int64 1 float64 5000 non-null float64 2 datetime64[ns] 5000...
[12]: df_sale.columns#返回DataFrame的列名 Index(['日期', '订单号', '区域', '客户性别', '客户年龄', '商品品类', '进货价格', '实际售价', '销售数', '销售额', '利润'], dtype='object') 收藏评论 In [13]: df_sale['商品品类'].value_counts()#对于Series中的唯一值,返回其计数,...