A、 每个Application都有⾃⼰专属的Executor进程,并且该进程在Application运⾏期间⼀直驻留
B、 Executor进程以多线程的⽅式运⾏Task
C、 Spark运⾏过程与资源管理器⽆关,只要能够获取Executor进程并保持通信即可
D、 Task采⽤了数据本地性和推测执⾏等优化机制
答案:ABCD
A、 每个Application都有⾃⼰专属的Executor进程,并且该进程在Application运⾏期间⼀直驻留
B、 Executor进程以多线程的⽅式运⾏Task
C、 Spark运⾏过程与资源管理器⽆关,只要能够获取Executor进程并保持通信即可
D、 Task采⽤了数据本地性和推测执⾏等优化机制
答案:ABCD
A. ⼀切与⽀撑⼤数据组织管理和价值发现相关的企业经济活动的集合
B. 提供智能交通、智慧医疗、智能物流、智能电⽹等⾏业应⽤的企业
C. 提供数据分享平台、数据分析平台、数据租售平台等服务的企业
D. 提供分布式计算、数据挖掘、统计分析等服务的各类企业
A. 存储设备容量不断增加
B. ⽹络带宽不断增加
C. CPU处理能⼒⼤幅提升
D. 数据量不断增⼤
A. Storm将流数据Stream描述成⼀个有限的Tuple序列
B. Storm保证每个消息都能完整处理
C. Storm认为每个Stream都有⼀个源头,并把这个源头抽象为Spout
D. Bolt可以执⾏过滤、函数操作、Join、操作数据库等任何操作
A. 设计了HDFSHA
B. 提供名称节点热备机制
C. 设计了HDFSFederation,管理多个命名空间
D. 设计了新的资源管理框架YARN
A. 许多⾮图结构的⼤数据,通常会被转换为关系模型后进⾏分析
B. 许多⼤数据都是以⼤规模图或⽹络的形式呈现
C. 图数据结构很好地表达了数据之间的关联性
D. 关联性计算是⼤数据计算的核⼼
A. 局部计算:每个参与的处理器都有⾃⾝的计算任务
B. 通讯:处理器群相互交换数据
C. 栅栏同步:当⼀个处理器遇到”路障”(或栅栏),会等到其他所有处理器完成它们的计算步骤
D. 基于现有的分布式计算平台进⾏图计算
A. 性能好(⾼并发),灵活性⾼
B. 具备统⼀的查询语法
C. ⽂档数据库⽀持⽂档间的事务
D. 复杂性低,数据结构灵活
A. worker:每个worker进程都属于⼀个特定的Topology
B. executor:executor是产⽣于worker进程内部的线程
C. task:实际的数据处理由task完成
D. 在Topology的⽣命周期中,每个组件的task数⽬是不会发⽣变化的,⽽executor的数⽬却不⼀定
A. Master-status(⾃带)
B. Ganglia
C. OpenTSDB
D. Ambari