pivot函数hive(pivot函数的定义)

pivot函数hive(pivot函数的定义)1 pivot 函数的定义 2 pivot 函数的说明 通过给定的索引 index 和列 column 的值重新生一个 DataFrame 对象 根据列值对数据进行整形 生成一个 透视 表 从指定的索引 列中使用唯一的值来形成结果数据帧的轴 此函数不支持数据聚合 多个值将导致列中的多索引 3 pivo 函数的参数 index 指定一列做为生成 DataFrame 对象的索引 如果为空则默认为原来的索引 columns 指定一列的值作为列名 必须传值 values




1、pivot函数的定义
2、pivot函数的说明

通过给定的索引(index)和列(column)的值重新生一个DataFrame对象。
根据列值对数据进行整形(生成一个“透视”表)。从指定的索引/列中使用唯一的值来形成结果数据帧的轴。此函数不支持数据聚合,多个值将导致列中的多索引。

3、pivo函数的参数

index:指定一列做为生成DataFrame对象的索引,如果为空则默认为原来的索引。
columns:指定一列的值作为列名,必须传值。
values:指定一列作为生成DataFrame对象的值。可以为空。

4、pivot函数实例

hive的avg函数 hive pivot函数_数据帧

hive的avg函数 hive pivot函数_调用函数_02

hive的avg函数 hive pivot函数_python_03

hive的avg函数 hive pivot函数_hive的avg函数_04

hive的avg函数 hive pivot函数_hive的avg函数_05

hive的avg函数 hive pivot函数_python_06

hive的avg函数 hive pivot函数_hive的avg函数_07

hive的avg函数 hive pivot函数_调用函数_08

5、pivot函数在实际工作中解决的案例

hive的avg函数 hive pivot函数_python_09


现在要上图中的不同code之间从2020-11-16到2020-11-18三天内num序列数的相关性。

首先,dataframe对象可以直接调用函数corr()计算不同列之间的相关性,所以现在需要将原始的dataframe对象转换成以code为列,date为索引,num为值的dataframe。

第一种比较笨的方法就是循环,此方法不但代码量较多而且在数据量很大时会比较耗时。不建议使用。

hive的avg函数 hive pivot函数_数据帧_10


第二种方法就是使用pivot函数,一行代码解决,运行快速。

hive的avg函数 hive pivot函数_python_11


想要的形式的dataframe生成了就可以直接调用corr()函数直接求出code之间的相关性了

hive的avg函数 hive pivot函数_数据_12


编程小号
上一篇 2026-02-17 10:11
下一篇 2026-02-17 10:57

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/bian-cheng-ri-ji/45086.html