疫情期间各类政府媒体及社交网站,均发布了相关疫情每日统计数据,下面基于数据仓库工具Hive请你统计分析相关疫情数据。
数据字段为:日期、省份、城市、新增确诊、新增出院、新增死亡、消息来源、来源1,来源2,来源3
首先启动 hdfs hadoop hive
请在hdfs根目录下中创建一个目录,以小组名称英文全拼命名_data,并将以上疫情数据上传到这个目录中,截图成功后结果
请你在hive中创建数据库名为: ods_yiqing_data,并切换使用这个数据库,截图成功后结果
创建一个hive外部表,字段为以上疫情数据全部字段(自行命名字段),数据存储位置为第1小题创建的hdfs目录,请粘贴建表语句及运行成功截图
统计湖北省各市2月新增确诊病例总数,按照总数降序排列,请提供SQL语句及运行结果截图
统计文件中安徽省合肥市每月新增确诊病例总数,按照降序排列,请提供SQL语句及运行结果截图
统计文件中湖北每月新增出院病例总数最多的前2个城市,请提供SQL语句及运行结果截图
今天的文章大数据实战疫情分析项目分享到此就结束了,感谢您的阅读,如果确实帮到您,您可以动动手指转发给其他人。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/33289.html