标签搜索

HIVE 中的 count 记录

海绵
2022-04-14 / 0 评论 / 3 阅读 / 正在检测是否收录...

HIVE 中的 count 记录

count(*) 和 count(1) 都是对表中的数据进行统计计算,其中包括空值。这两个貌不走 mr 过程。

count(字段)也是对该表进行统计,但是会排除 null 值。空字符串也会计算的。这个会有 mr 过程。

还有一点区别就是:

在 内部表的时候 没走 mr 的流程,直接从元数据中获取了。这里配置了 mysql 存元数据,所以直接去mysql中获取了。这里假如分10次写入了100条文件,然后hdfs上会产生10个文件的,这时候如果手动删除的话,在做 count 的操作就会出错。

但是如果是外部表的话,都会走 mr 的过程的。只要走了 mr 的过程,就不会发生错误。

0

打赏

海报

正在生成.....

评论 (0)

取消