A、 不存在单点故障
B、 JobTracker”⼤包⼤揽”导致任务过重
C、 容易出现内存溢出(分配资源只考虑MapReduce任务数,不考虑CPU、内存)
D、 资源划分不合理(强制划分为slot,包括Mapslot和Reduceslot)
答案:A
A、 不存在单点故障
B、 JobTracker”⼤包⼤揽”导致任务过重
C、 容易出现内存溢出(分配资源只考虑MapReduce任务数,不考虑CPU、内存)
D、 资源划分不合理(强制划分为slot,包括Mapslot和Reduceslot)
答案:A
A. ⽂本⽂件
B. 关系数据库
C. 键值数据库
D. 语⾳⽂件
A. 数据实时采集
B. 数据批量采集
C. 数据实时计算
D. 实时查询服务
A. 数值数组
B. 字符串
C. 对象(本⾝包含其他数组或键/值对)
D. JSON和GeoJSON
A. 负责资源监控和作业调度,监控所有TaskTracker与Job的健康状况
B. 使⽤”slot”等量划分本节点上的资源量(CPU、内存等)
C. 会周期性地通过”⼼跳”将本节点上资源的使⽤情况和任务的运⾏进度汇报给TaskTracker
D. 会跟踪任务的执⾏进度、资源使⽤量等信息,并将这些信息告诉任务(Task)
A. 每个Application都有⾃⼰专属的Executor进程,并且该进程在Application运⾏期间⼀直驻留
B. Executor进程以多线程的⽅式运⾏Task
C. Spark运⾏过程与资源管理器⽆关,只要能够获取Executor进程并保持通信即可
D. Task采⽤了数据本地性和推测执⾏等优化机制
A. 存储设备容量不断增加
B. ⽹络带宽不断增加
C. CPU处理能⼒⼤幅提升
D. 数据量不断增⼤
A. RDBMS有关系代数理论作为基础,NoSQL没有统⼀的理论基础
B. NoSQL很难实现横向扩展,RDBMS可以很容易通过添加更多设备来⽀持更⼤规模的数据
C. RDBMS需要定义数据库模式,严格遵守数据定义,NoSQL不存在数据库模式,可以⾃由灵活定义并存储各种不同类型的数据
D. RDBMS借助于索引机制可以实现快速查询,很多NoSQL数据库没有⾯向复杂查询的索引
A. 基于历史数据的数据挖掘
B. 图结构数据的处理
C. 基于历史数据的交互式查询
D. 基于实时数据流的数据处理