A、 HadoopMapReduce是MapReduce的开源实现,后者⽐前者使⽤门槛低很多
B、 MapReduce⾮共享式,容错性好
C、 MapReduce批处理、实时、数据疏散型
D、 MapReduce采⽤”分⽽治之”策略
答案:C
A、 HadoopMapReduce是MapReduce的开源实现,后者⽐前者使⽤门槛低很多
B、 MapReduce⾮共享式,容错性好
C、 MapReduce批处理、实时、数据疏散型
D、 MapReduce采⽤”分⽽治之”策略
答案:C
A. 整合性:Storm可⽅便地与队列系统和数据库系统进⾏整合
B. 简易的API:Storm的API在使⽤上即简单⼜⽅便
C. 容错性:Storm可⾃动进⾏故障节点的重启、任务的重新分配
D. 可扩展性:Storm的并⾏特性使其可以运⾏在分布式集群中
A. 数据质量问题
B. 数据安全问题
C. 数据传输速度问题
D. 数据类型单一问题
A. 数据存储
B. 数据加密
C. 数据理解与分析
D. 数据传输
A. 关系数据库以完善的关系代数理论作为基础,有严格的标准
B. 关系数据库可扩展性较差,⽆法较好⽀持海量数据存储
C. NoSQL可以⽀持超⼤规模数据存储
D. NoSQL数据库缺乏数学理论基础,复杂查询性能不⾼
A. 泊松相关系数
B. 余弦相似度
C. 调整余弦相似度
D. 调整正弦相似度
A. 为海量数据提供存储的HDFS和对数据进⾏计算的MapReduce
B. 提供整个HDFS⽂件系统的NameSpace(命名空间)管理、块管理等所有服务
C. Hadoop不仅可以运⾏在企业内部的集群中,也可以运⾏在云计算环境中
D. Hadoop被视为事实上的⼤数据处理标准
A. ⼀个RDD就是⼀个分布式对象集合,本质上是⼀个只读的分区记录集合
B. 每个RDD可分成多个分区,每个分区就是⼀个数据集⽚段
C. RDD是可以直接修改的
D. RDD提供了⼀种⾼度受限的共享内存模型
A. 数据类型
B. 数据操作
C. 存储模式
D. 数据维护
A. ⽂本⽂件
B. 关系数据库
C. 键值数据库
D. 语⾳⽂件