大数据:传统PC无法处理的。数据大、数据类型繁多、处理速度快、价值密度低。
Hadoop:能够对大数据进行分布式处理的软件框架、这种处理具有高效、可靠、可伸缩的特点。Hadoop的特点:高效率、高可靠、高容错、高可拓展。成本低、Linux运行支持多语言。
SSH:建立在应用层和传输层之间的传输协议。SSH可以防止远程管理过程中的信心泄露问题。
HDFS:是Hadoop的一种分布式文件系统。用于分布式储存大规模数据。将数据分割为小块存储在集群的多个节点上。
HDFS缺点:不适合低延迟数据访问、不能高效存储大量小文件、不支持多用户修改/写入。
HBase:是一个高可靠、高性能、可伸缩、面向列的分布式数据库。用来存储非/半结构化数据。可以水平拓展、用廉价计算机存储亿级行和百万列组成的表。
MapReduce:是一种用来处理和生成大数据的编程模型。Map阶段将输入数据映射为键值对;Reduce将相同的键值对进行合并和计算。
Spark:基于内存的分布式计算框架。RDD为其数据结构,代表弹性分布式数据集。
特点:处理数据快、支持多种数据处理。性能高(存储在内存),适用迭代算法、复杂计算。
Scala:多范式编程语言,语法简洁提供API、运行在JVM,兼容JAVA语言。
特点:强大并发性、函数式编程、支持分布式系统、语法简洁、兼容Java运行速度快。
NoSQL:非关系型数据库,适用于大规模和动态数据、与云计算紧密融合。
特点:数据库灵活、可拓展ÿ
一句话介绍大数据各种名词及其特点
一句话介绍大数据各种名词及其特点大数据 传统 PC 无法处理的
关于各家6410开发板的分析比较
上一篇
2024-12-15 23:27
相关业务问题+系统问题+设计问题整理统计
下一篇
2024-12-15 23:21
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/bian-cheng-ji-chu/86827.html