A、 ResourceManager
B、 NodeManager
C、 ApplicationMaster
D、 DataManager
答案:ABC
A、 ResourceManager
B、 NodeManager
C、 ApplicationMaster
D、 DataManager
答案:ABC
A. MySQL
B. 阿⾥云RDS
C. OracleCloud
D. 百度云数据库
A. 流数据层(Kafka)
B. 执⾏层(YARN)
C. 处理层(SamzaAPI)
D. 数据采集层(Scribe)
A. 使⽤DAG执⾏引擎以⽀持循环数据流与内存计算
B. 可运⾏于独⽴的集群模式中,可运⾏于Hadoop中,也可运⾏于AmazonEC2等云环境中
C. ⽀持使⽤Scala、Java、Python和R语⾔进⾏编程,但是不可以通过SparkShell进⾏交互式编程
D. Spark提供了内存计算,可将中间结果放到内存中,对于迭代计算效率更⾼
A. 基于⽤户的协同过滤
B. 基于物品的协同过滤
C. 基于⽤户和物品的联合协同过滤
D. 基于商家的协同过滤
A. 数据存储层
B. 数据源层
C. 数据分析层
D. 数据应⽤层
A. ⽤户编写的MapReduce程序通过Client提交到JobTracker端
B. JobTracker负责资源监控和作业调度
C. TaskTracker监控所有TaskTracker与Job的健康状况
D. TaskTracker使⽤”slot”等量划分本节点上的资源量(CPU、内存等)
A. 矩形
B. 圆形
C. 线条
D. 图⽚
A. Storm将Streams的状态转换过程抽象为Spout
B. Storm认为每个Stream都有⼀个源头,并把这个源头抽象为Spout
C. Storm将Spouts和Bolts组成的⽹络抽象成Topology
D. Topology⾥⾯的每个处理组件(Spout或Bolt)都包含处理逻辑,⽽组件之间的连接则表⽰数据流动的⽅向
A. RDD(ResillientDistributedDataset)是运⾏在⼯作节点(WorkerNode)的⼀个进程,负责运⾏Task
B. Application是⽤户编写的Spark应⽤程序
C. ⼀个Job包含多个RDD及作⽤于相应RDD上的各种操作
D. DirectedAcyclicGraph反映RDD之间的依赖关系
A. 全局计算
B. 局部计算
C. 通讯
D. 栅栏同步