A、 Spark最初由美国加州伯克利⼤学(UCBerkeley)的AMP实验室于2009年开发
B、 Spark在2014年打破了Hadoop保持的基准排序纪录.
C、 Spark⽤⼗分之⼀的计算资源,获得了⽐Hadoop快3倍的速度
D、 Spark运⾏模式单⼀
答案:D
A、 Spark最初由美国加州伯克利⼤学(UCBerkeley)的AMP实验室于2009年开发
B、 Spark在2014年打破了Hadoop保持的基准排序纪录.
C、 Spark⽤⼗分之⼀的计算资源,获得了⽐Hadoop快3倍的速度
D、 Spark运⾏模式单⼀
答案:D
A. 只⽀持少数⼏种编程语⾔
B. 可扩展性⾼
C. 成本低
D. 能在linux上运⾏
A. 灵活的可扩展性
B. 灵活的数据模型
C. 与云计算紧密融合
D. ⼤型的数据库
A. ⼀个作业(Job)是对⼀组输⼊流进⾏处理转化成输出流的程序
B. Samza的流数据单位既不是Storm中的元组,也不是SparkStreaming中的DStream,⽽是⼀条条消息
C. ⼀个作业会被进⼀步分割成多个任务(Task)来执⾏
D. 分区之间没有定义顺序,从⽽允许每⼀个任务独⽴执⾏
A. 识别和感知技术
B. ⽹络与通信技术
C. 数据挖掘与融合技术
D. 信息处理⼀体化技术
A. 能够解决单点故障问题
B. HDFS集群扩展性
C. 性能更⾼效
D. 良好的隔离性
A. 数据的”⼤量化”
B. 数据的”快速化”
C. 数据的”多样化”
D. 数据的”价值化”
A. 帮助NameNode收集⽂件系统运⾏的状态信息
B. 负责执⾏由JobTracker指派的任务
C. 协调数据计算任务
D. 负责协调集群中的数据存储
A. 兼容廉价的硬件设备
B. 流数据读写
C. ⼤数据集
D. 复杂的⽂件模型
A. 实现⼀键式安装和配置、线程级别的任务监控和告警
B. 降低硬件集群、软件维护、任务监控和应⽤开发的难度
C. 便于做成统⼀的硬件、计算平台资源池
D. 不⽤负载应⽤混搭,集群利⽤率⾼
A. 矩形
B. 圆形
C. 线条
D. 图⽚