A、 利⽤多线程来执⾏具体的任务,减少任务的启动开销
B、 Executor中有⼀个BlockManager存储模块,有效减少IO开销
C、 提供了⼀种⾼度受限的共享内存模型
D、 不同场景之间输⼊输出数据能做到⽆缝共享
答案:AB
A、 利⽤多线程来执⾏具体的任务,减少任务的启动开销
B、 Executor中有⼀个BlockManager存储模块,有效减少IO开销
C、 提供了⼀种⾼度受限的共享内存模型
D、 不同场景之间输⼊输出数据能做到⽆缝共享
答案:AB
A. HTML:⽂档对象模型,⽤于修改⽂档的内容和结构
B. CSS:层叠样式表,⽤于设定⽹页的样式
C. SVG:可缩放⽮量图形,⽤于绘制可视化的图形
D. JavaScript:⼀种直译式脚本语⾔,⽤于设定⽹页的⾏为
A. 不存在单点故障
B. JobTracker”⼤包⼤揽”导致任务过重
C. 容易出现内存溢出(分配资源只考虑MapReduce任务数,不考虑CPU、内存)
D. 资源划分不合理(强制划分为slot,包括Mapslot和Reduceslot)
A. Hadoop⾃⾝核⼼组件MapReduce的架构设计改进
B. Hadoop⾃⾝核⼼组件HDFS的架构设计改进
C. Hadoop⽣态系统其它组件的不断丰富
D. Hadoop⽣态系统减少不必要的组件,整合系统
A. 存储被拆分的数据块
B. 协调数据计算任务
C. 负责协调集群中的数据存储
D. 负责执⾏由JobTracker指派的任务
A. 顶点的当前值
B. 以该顶点为起点的出射边列表,每条出射边包含了⽬标顶点ID和边的值
C. 消息队列,包含了所有接收到的、发送给该顶点的消息
D. 标志位,⽤来标记顶点是否处于活跃状态
A. HadoopMapReduce是MapReduce的开源实现,后者⽐前者使⽤门槛低很多
B. MapReduce⾮共享式,容错性好
C. MapReduce批处理、实时、数据疏散型
D. MapReduce采⽤”分⽽治之”策略
A. 顶点的出度
B. 顶点
C. 边
D. 消息
A. 命名空间的限制
B. 性能的瓶颈
C. 隔离问题
D. 集群的可⽤性
A. 从编程的灵活性来讲,Storm是⽐较理想的选择,它使⽤ApacheThrift,可以⽤任何编程语⾔来编写拓扑结构(Topology)
B. 当有⼤量的状态需要处理时,⽐如每个分区都有数⼗亿个元组,则可以选择Storm和SparkStreaming
C. SparkStreaming⽆法实现毫秒级的流计算
D. 在Spark上可以统⼀部署SparkSQL,SparkStreaming、MLlib,GraphX等组件,提供便捷的⼀体化编程模型
A. 实时性差(适合批处理,不⽀持实时交互式)
B. 资源浪费(Map和Reduce分两阶段执⾏)
C. 执⾏迭代操作效率低
D. 难以看到程序整体逻辑