本文将简要介绍如何轻松使用 StarRocks,主要涵盖分区分桶、数据导入、数据转换以及表结构优化几个方面的内容: 分区分桶:直接使用 date_trunc() 函数来指定分区方式,同时无需再考虑分桶键和分桶数量; 数据导入:从 HDFS 或云存储上导入数据时,可以使用更简单、更符合普通 SQL 语法的 INSERT from FILES 来实现; 数...
- 分区分桶:直接使用 date_trunc() 函数来指定分区方式,同时无需再考虑分桶键和分桶数量; - 数据导入:从 HDFS 或云存储上导入数据时,可以使用更简单、更符合普通 SQL 语法的 INSERT from FILES 来实现; - 数据转换:通过支持通用的 SELECT 和 JOIN 操作的 INSERT from FILES,能够更轻松、更通用地进行所需的...
datekey DATETIME, k1INT, item_id STRING, v2INT)PRIMARYKEY (`datekey`,`k1`)PARTITIONBYdate_trunc('day', `datekey`);CREATETABLEIFNOTEXISTStest.par_tbl3 ( datekey DATETIME, k1INT, item_id STRING, v2INT)PRIMARYKEY (`datekey`,`k1`); ...
PARTITION BY date_trunc('day', `datekey`); CREATE TABLE IF NOT EXISTS test.par_tbl3 ( datekey DATETIME, k1 INT, item_id STRING, v2 INT ) PRIMARY KEY (`datekey`,`k1`); 但我们有三张基表,其中 1 和 2 都是分区表,但是 3 是非分区表。
在数据导入时,我们可以使用date_trunc()函数来指定分区方式,无需再考虑分桶键和分桶数量。例如,我们可以按照日期对数据进行分区,每天一个分区,这样查询时就可以只扫描需要的分区,提高查询效率。 CREATE TABLE sales ( sale_date DATE, sale_amount BIGINT ) PARTITION BY RANGE(date_trunc('day', sale_date))...
SQLCREATETABLEsite_access(event_dayDATE,site_idINTDEFAULT'10',...)DUPLICATEKEY(event_day,site_id)PARTITIONBYdate_trunc('day',event_day)DISTRIBUTEDBYHASH(event_day,site_id)BUCKETS10;--可以不再需要指定 在导入数据时,如果数据是存储在 AWS S3/HDFS上的 Parquet/ORC 格式文件,用户可以很简单地直接采...
SQLCREATETABLEsite_access(event_dayDATE,site_idINTDEFAULT'10',...)DUPLICATEKEY(event_day, site_id)PARTITIONBYdate_trunc('day', event_day)DISTRIBUTEDBYHASH(event_day,site_id) BUCKETS10;-- 可以不再需要指定 在导入数据时,如果数据是存储在 AWS S3/HDFS 上的 Parquet/ORC 格式文件,用户可以很简单...
state tinyintNOTNULL)PRIMARYKEY (order_id,dt,merchant_id)PARTITIONBYdate_trunc('day', dt) DISTRIBUTEDBYHASH (merchant_id)ORDERBY(dt,merchant_id) PROPERTIES ( "enable_persistent_index"="true" ); 主键 主键用于唯一标识表中的每一行数据,组成主键的一个或多个列在PRIMARY KEY中定义,具有非空唯一性...
本文将简要介绍如何轻松使用 StarRocks,主要涵盖分区分桶、数据导入、数据转换以及表结构优化几个方面的内容: 分区分桶:直接使用 date_trunc() 函数来指定分区方式,同时无需再考虑分桶键和分桶数量; 数据导入:从 HDFS 或云存储上导入数据时,可以使用更简单、更符合普通 SQL 语法的 INSERT from FILES 来实现; 数...
没有特殊要求,尽量用 int 类型,减少字符串使用; DATE 、DATETIME,不必要时尽量不要转换成字符串; 特别是会作为 join condition 的列,更应该使用 int、DATE 等简单类型。 在CASE-A 中,有一个 join 的 on condition 中,原本是“将 DATE 转化成字符串来比较”,而修改成“使用 date_trunc() 函数直接进行比较...