最近在进行测试时,遇到了hive特殊分隔符的问题:--oracle导出的数据文件的分隔符以0x1B导入。0x1B是不可见字符,测试了很久之后让hive识别。
这是因为,hive中指定的分隔符无法识别十六进制0x1B转换为八进制表示形式,必须在前面添加0,除非直接写入显式分隔符
给定的分隔符为十六进制0x1B,对应于十进制27,转换为八进制时为33,因此分隔符为033。 请注意,前面的0必须减少才能识别
指定分隔符语法为:FIELDS TERMINATED BY ' 33 '
附样品:
样本数据
2012-10-310007010012610402170100 * * 104020001人通知***项利息支出6012012-10-311
2012-08-310007010012610601170100 * * * 6106010001应付活动****存款利息6012012-08-311
2012-08-310007010012610701170100 * * 26107010001三个月***储蓄存款利息支出6012012-08-311
从ue来看,
复制到UE ctrl H上查看
建表文/