A、 ⽤户编写的MapReduce程序通过Client提交到JobTracker端
B、 JobTracker负责资源监控和作业调度
C、 TaskTracker监控所有TaskTracker与Job的健康状况
D、 TaskTracker使⽤”slot”等量划分本节点上的资源量(CPU、内存等)
答案:ABD
A、 ⽤户编写的MapReduce程序通过Client提交到JobTracker端
B、 JobTracker负责资源监控和作业调度
C、 TaskTracker监控所有TaskTracker与Job的健康状况
D、 TaskTracker使⽤”slot”等量划分本节点上的资源量(CPU、内存等)
答案:ABD
A. 使⽤DAG执⾏引擎以⽀持循环数据流与内存计算
B. 可运⾏于独⽴的集群模式中,可运⾏于Hadoop中,也可运⾏于AmazonEC2等云环境中
C. ⽀持使⽤Scala、Java、Python和R语⾔进⾏编程,但是不可以通过SparkShell进⾏交互式编程
D. Spark提供了内存计算,可将中间结果放到内存中,对于迭代计算效率更⾼
A. CPU性能
B. 内存
C. ⽹络
D. 存储容量
A. ⾼可扩展性
B. ⽀持多种编程语⾔
C. 成本低
D. 运⾏在Linux平台上
A. 数据挖掘
B. 离线分析
C. 实时查询
D. BI分析
E.
F.
G.
H.
I.
J.
解析:
A. ⽀持各种编程语⾔:Storm⽀持使⽤各种编程语⾔来定义任务
B. 容错性:Storm需要⼈⼯进⾏故障节点的重启、任务的重新分配
C. 可扩展性:Storm的并⾏特性使其可以运⾏在分布式集群中
D. 免费、开源:Storm是⼀款开源框架,可以免费使⽤
A. ”摩尔定律”,CPU性能⼤约每隔18个⽉翻⼀番
B. 分布式程序运⾏在⼤规模计算机集群上
C. ⾕歌公司最先提出了分布式并⾏编程模型MapReduce
D. MapReduce是Hadoop的开源实现
A. 利⽤分布式⽂件系统、数据仓库、关系数据库等实现对结构化、半结构化和⾮结构化海量数据的存储和管理
B. 利⽤分布式并⾏编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析
C. 构建隐私数据保护体系和数据安全体系,有效保护个⼈隐私和数据安全
D. 把实时采集的数据作为流计算系统的输⼊,进⾏实时处理分析
A. Web2.0⽹站系统通常不要求严格的数据库事务
B. Web2.0⽹站系统基本上不⽤数据库来存储
C. Web2.0并不要求严格的读写实时性
D. Web2.0通常不包含⼤量复杂的SQL查询
A. 全局计算
B. 局部计算
C. 通讯
D. 栅栏同步