A、 数据的”⼤量化”
B、 数据的”快速化”
C、 数据的”多样化”
D、 数据的”价值化”
答案:ABCD
A、 数据的”⼤量化”
B、 数据的”快速化”
C、 数据的”多样化”
D、 数据的”价值化”
答案:ABCD
A. Pregel将PageRank处理对象看成是连通图,⽽MapReduce则将其看成是键值对
B. Pregel将计算细化到顶点,同时在顶点内控制循环迭代次数
C. apReduce将计算批量化处理,按任务进⾏循环迭代控制
D. 图算法如果⽤Pregel实现,需要⼀系列的Pregel的调⽤
A. 单⼀名称节点,存在单点失效问题
B. 单⼀命名空间,⽆法实现资源隔离
C. 资源管理效率低
D. 很难上⼿
A. 为海量数据提供存储的HDFS和对数据进⾏计算的MapReduce
B. 提供整个HDFS⽂件系统的NameSpace(命名空间)管理、块管理等所有服务
C. Hadoop不仅可以运⾏在企业内部的集群中,也可以运⾏在云计算环境中
D. Hadoop被视为事实上的⼤数据处理标准
A. Spark最初由美国加州伯克利⼤学(UCBerkeley)的AMP实验室于2009年开发
B. Spark在2014年打破了Hadoop保持的基准排序纪录.
C. Spark⽤⼗分之⼀的计算资源,获得了⽐Hadoop快3倍的速度
D. Spark运⾏模式单⼀
A. 实时性差(适合批处理,不⽀持实时交互式)
B. 资源浪费(Map和Reduce分两阶段执⾏)
C. 执⾏迭代操作效率低
D. 难以看到程序整体逻辑
A. 开发⼯具
B. 开源软件
C. 商业化⼯具
D. 数据采集
A. ⼤数据成为⼀种新的决策⽅式
B. ⼤数据应⽤促进信息技术与各⾏业的深度融合
C. ⼤数据开发推动新技术和新应⽤的不断涌现
D. ⼤数据使得数据科学家成为热门职业
A. Hadoop⽣态系统中各个组件和其他产品之间缺乏统⼀的、⾼效的数据交换中介
B. 不同的MapReduce任务之间存在重复操作,降低了效率
C. 延迟⾼,⽽且不适合执⾏迭代计算
D. 抽象层次低,需要⼿⼯编写⼤量代码
A. CA:也就是强调⼀致性(C)和可⽤性(A),放弃分区容忍性(P)
B. CP:也就是强调⼀致性(C)和分区容忍性(P),放弃可⽤性(A)
C. AP:也就是强调可⽤性(A)和分区容忍性(P),放弃⼀致性(C)
D. CAP:也就是同时兼顾可⽤性(A)、分区容忍性(P)和⼀致性(C),当时系统性能会下降很多