第一篇解释
大数据处理系统可分为批式(batch)大数据和流式(streaming)大数据两类。其中,批式大数据又被称为历史大数据,流式大数据又被称为实时大数据。
流数据是一组顺序、大量、快速、连续到达的数据序列,一般情况下,数据流可被视为一个随时间延续而无限增长的动态数据集合。应用于网络监控、传感器网络、航空航天、气象测控和金融服务等领域。即是实时的数据,又被称为实时大数据。
例如手机的定位功能,在你使用高德地图导航的时候,高德地图采集你现在所处位置的经纬度或者位置编码,这类就是属于流数据,这种数据实时更新,一直在变化。一般以二进制数据流形式(bytes流)进行传输。而大数据相对而言是静态的,数据量比较大,有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
作者:Dr.Whale
链接:https://www.zhihu.com/question/266389397/answer/2254761566
第二篇解释
第一种是实时流数据(大概就是你说流式大数据)即是实时的数据,例如手机的定位功能,在你使用高德地图导航的时候,高德地图采集你现在所处位置的经纬度或者位置编码,这类就是属于实时流数据,这种数据实时更新,一直在变化。
第二种是离线数据,简单一点说就是不是现在的数据,例如你使用高德地图查看你昨天保存的骑行轨迹,这就是离线数据。离线数据就是已经生成好的记录性数据
同时对数据的处理也是分为两种:
第一种对实时数据的处理(可能就是你说的大数据流处理),例如,你使用高德地图输入你的目的地让其为你导航,他会根据你的实时位置告诉你,你离目的地还有多远,这个计算距离的过程就是大数据的实力处理也就是流式处理吧。
第二种对离线数据的处理,应用程序采集的数据不一定都是结构话的数据,好多都是半结构化的数据或者复杂的数据还包括一些脏数据,因此要做一些处理剔除没用的数据,让数据更加有效,整洁,离线数据一般整理后会用于数据分析
作者:赵昆鹏
链接:https://www.zhihu.com/question/266389397/answer/312691037
今天的文章什么是大数据流式计算_大数据分为哪三类[通俗易懂]分享到此就结束了,感谢您的阅读。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/84314.html