现象:
一个hive SQL:在 root.queue1 和 root.queue2 执行出来的结果不一样 。
select count(clue_id),count(distinct clue_id) from xxx1 left join xxx2
原因:
hive 默认开启了 map join 优化,这个优化有时会出现一些bug(具体什么情况,没搞懂,反正就是莫名奇妙的bug)
解决: 关闭map join 优化。
set hive.auto.convert.join=false;
2020-12-24 00:31:51 佚名
现象:
一个hive SQL:在 root.queue1 和 root.queue2 执行出来的结果不一样 。
select count(clue_id),count(distinct clue_id) from xxx1 left join xxx2
原因:
hive 默认开启了 map join 优化,这个优化有时会出现一些bug(具体什么情况,没搞懂,反正就是莫名奇妙的bug)
解决: 关闭map join 优化。
set hive.auto.convert.join=false;