| 1 | transient_lastDdlTime | 1599283269 | | 2 | COLUMN_STATS_ACCURATE | true | | 2 | numFiles | 1 | | 2 | numRows | 0 | | 2 | rawDataSize | 0 | | 2 | totalSize | 423 | | 2 | transient_lastDdlTime | 1599283402 | | 3 | COLUMN_STATS_ACCURATE | true | | 3 | num...
TAB_COL_STATS 数据表的列信息统计 通过tbl_id使得TAB_COL_STATS与tbls关联。 相关的thrift类有:BooleanColumnStatsData、DoubleColumnStatsData、LongColumnStatsData、StringColumnStatsData、BinaryColumnStatsData、 Decimal、DecimalColumnStatsData、ColumnStatisticsData、ColumnStatisticsObj、ColumnStatisticsDesc、ColumnStatis...
Statistics: Num rows: 1 Data size: 227 Basic stats: PARTIAL Column stats: NONE Select Operator expressions: gender_age (type: struct<gender:string,age:int>) outputColumnNames: gender_age Statistics: Num rows: 1 Data size: 227 Basic stats: PARTIAL Column stats: NONE Reduce Output Operator ke...
COLUMN_STATS_ACCURATE {\"BASIC_STATS\":\"true\",\"COLUMN_STATS\":{\"id\":\"true\",\"prod_name\":\"true\",\"sale_date\":\"true\",\"sale_nums\":\"true\"}} comment Imported by sqoop on 2020/11/25 19:14:01 numFiles 4 numRows 767830000 rawDataSize 30653263662 totalSize 31421...
COLUMN_STATS_ACCURATE 是否精确统计列,布尔值 numFiles 文件个数 numRows 行数 rawDataSize 原始数据大小,未压缩前的数据大小 totalSize 占用HDFS空间大小 transient_lastDdlTime 最近一次操作的时间戳 external 是否外部表,布尔值 comment 表说明,字符串 5.2 TBLS 记录数据表的信息 字段解释 TBL_ID 在hive中创建表...
| | COLUMN_STATS_ACCURATE | {"BASIC_STATS":"true"} | | | bucketing_version | 2 | | | numFiles | 1 | | | numRows | 14 | | | rawDataSize | 643 | | | totalSize | 656 | | | transient_lastDdlTime | 1655113125 | | | NULL | NULL | ...
Table Type:EXTERNAL_TABLETable Parameters:COLUMN_STATS_ACCURATE{\"BASIC_STATS\":\"true\"}EXTERNALTRUEnumFiles0numRows0rawDataSize0totalSize0transient_lastDdlTime1513073773# Storage Information SerDe Library:org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDeInputFormat:org.apache.hadoop.mapred.TextInput...
'COLUMN_STATS_ACCURATE'='{\"BASIC_STATS\":\"true\"}', 'numFiles'='0', 'numRows'='0', 'rawDataSize'='0', 'totalSize'='0', 'transient_lastDdlTime'='1533563293') Time taken:0.041seconds, Fetched:21row(s) 由返回的数据可以看出该表格中的数据存储格式为 orc。
COLUMN_STATS_ACCURATE {\"BASIC_STATS\":\"true\"} numFiles 1 numRows 2379 rawDataSize 4329780 totalSize 127832 transient_lastDdlTime 1646036434 查询表分析数据+指定字段 字段的统计信息包括字段的最大值,最小值,null 的数量,distinct 的数量等。如一个表的字段统计信息已经收集,在 desc formatted table_na...
45857COLUMN_STATS_ACCURATEtrue 这里的rawDataSize是指原始数据的大小,totalSize是指占用HDFS存储空间大小。 如果再次使用INSERT OVERWRITE方式覆盖该表数据,那么统计信息将会更新。 新分区的统计信息 对于INSERT OVERWRITE方式新增的分区,统计信息同新创建的表,只不过在元数据中存放的表不一样。