⑦ split(string str,string par):返回值为array类型。select split('atguigu','g');["at","ui","u"]⑧concat_ws(string spl,string s1,string s2,...):返回值为string类型。select concat_ws('-','a','b','c');a-b-c ⑨ get_json_object(string json,string path):返回值为string类型。s...
当然当split包含在 "" 之中时 需要加4个\ 如hive -e "... split('192.168.0.1','\\\.') ... " 不然得到的值是null 同样的 | 等特殊符号也需要做类似 处理。
进制转换函数: conv(bigint num, int from_base, int to_base) 说明: 将数值num从from_base进制转化到to_base进制 此外还有很多数学函数:绝对值函数: abs()、正取余函数: pmod()、正弦函数: sin()、反正弦函数: asin()、余弦函数: cos()、反余弦函数: acos()、positive函数: positive()、negative函数:...
context_ngrams 第一个参数字符串数组、字符串数组数组 第二个参数将估计主要表达式中ab之后的前'k'个单词 第四个参数是内存 出来结果是NULL 看不懂这个函数 SELECT context_ngrams(sentences(user_id), array('a','b',null), 3).estfrequency FROM data; get_splits 暂时不知道这个函数用法 没有tez引擎 ...
get_splitsget_splits(string,int) - Returns an array of length int serialized splits for the referenced tables string. greatestgreatest(v1, v2, ...) - Returns the greatest value in a list of values Example: > SELECT greatest(2, 3, 1) FROM src LIMIT 1; ...
3.2 创建永久函数(Hive 3.x及更高版本) 在Hive 3.x及更高版本中,您可以使用CREATE FUNCTION语句来创建基于脚本的UDF。以下是示例: CREATE TEMPORARY FUNCTION upper_case AS 'org.apache.hadoop.hive.ql.udf.generic.GenericUDTFGetSplits' USING 'python /user/hive/udfs/upper_case_udf.py'; ...
2.日期增加/减少函数: date_add/date_sub 语法: date_add(string startdate, int days),date_sub (string startdate, int days) 返回值: string 说明: 返回开始日期startdate增加days天后的日期,返回开始日期startdate减少days天后的日期。hive> select date_add('2012-12-08',10) 2012-12-18 hive> ...
右边去空格函数:rtrim 正则表达式替换函数:regexp_replace 正则表达式解析函数:regexp_extract URL解析函数:parse_url json解析函数:get_json_object 空格字符串函数:space 重复字符串函数:repeat 首字符ascii函数:ascii 左补足函数:lpad 右补足函数:rpad 分割字符串函数: split ...
get_json_object get_splits greatest grouping hash hex histogram_numeric hour if in in_file index initcap inline instr internal_interval isnotnull isnull java_method json_tuple lag last_day last_value lcase lead least length levenshtein like ln locate log log10 log2 logged_in_user lower lpad...
split将字符串按指定分隔符,拆分为数组用法: select split('a,b,c,d',',') --返回:["a","b","c","d"] lpad返回指定长度字符串,不足指定的长度的字符串,则用指定字符从左边补全用法:lpad('AAAAA',10,'d') 例如: select lpad('AAAAA',10,'d') --返回:dddddAAAAA rpad返回指定长度字符串,不足...