数仓工具—Hive语法之常见排序方式(7)

数仓工具—Hive语法之常见排序方式(7)1.orderby是全局排序,可能性能会比较差2.sortby分区内有序,往往配合distributeby来确定该分区都有那些数据3.distributeby确定了数据分发的规则,满足相同条件的数据被分发到一个reducer4.clusterby当distributeby和sortby字段相同时,可以使用clusterby代替distributeby和sortby,但是clusterby默认是升序,不能指定排序方向…

hive 中的四种排序

排序操作是一个比较常见的操作,尤其是在数据分析的时候,我们往往需要对数据进行排序,hive 中和排序相关的有四个关键字,今天我们就看一下,它们都是什么作用。

Hive排序

数据准备

下面我们有一份温度数据,tab 分割

2008	32.0
2008	21.0
2008	31.5
2008	17.0
2013	34.0
2015	32.0
2015	33.0
2015	15.9
2015	31.0
2015	19.9

今天的文章数仓工具—Hive语法之常见排序方式(7)分享到此就结束了,感谢您的阅读。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:http://bianchenghao.cn/4635.html

(0)
编程小号编程小号

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注