A、 结构化数据
B、 半结构化数据
C、 非结构化数据
D、 所有类型数据
答案:B
A、 结构化数据
B、 半结构化数据
C、 非结构化数据
D、 所有类型数据
答案:B
A. ⽀持各种编程语⾔:Storm⽀持使⽤各种编程语⾔来定义任务
B. 容错性:Storm需要⼈⼯进⾏故障节点的重启、任务的重新分配
C. 可扩展性:Storm的并⾏特性使其可以运⾏在分布式集群中
D. 免费、开源:Storm是⼀款开源框架,可以免费使⽤
A. Spark在借鉴HadoopMapReduce优点的同时,很好地解决了MapReduce所⾯临的问题
B. Spark的计算模式也属于MapReduce,但不局限于Map和Reduce操作
C. HadoopMapReduce编程模型⽐Spark更灵活
D. HadoopMapReduce提供了内存计算,可将中间结果放到内存中,对于迭代运算效率更⾼
A. CAP
B. 最终⼀致性
C. BASE
D. DN8
A. 顶点的当前值
B. 以该顶点为起点的出射边列表,每条出射边包含了⽬标顶点ID和边的值
C. 消息队列,包含了所有接收到的、发送给该顶点的消息
D. 标志位,⽤来标记顶点是否处于活跃状态
A. 存储被拆分的数据块
B. 协调数据计算任务
C. 负责协调集群中的数据存储
D. 负责执⾏由JobTracker指派的任务
A. 表达能⼒有限
B. 磁盘IO开销⼤
C. 延迟⾼
D. 在前⼀个任务执⾏完成之前,其他任务就⽆法开始,难以胜任复杂、多阶段的计算任务
A. 数据挖掘
B. 离线分析
C. 实时查询
D. BI分析
E.
F.
G.
H.
I.
J.
解析:
A. AllGrouping:⼴播发送,每⼀个Task都会收到所有的Tuple
B. GlobalGrouping:全局分组,所有的Tuple都发送到同⼀个Task中
C. FieldsGrouping:按照字段分组,保证相同字段的Tuple分配到同⼀个Task中
D. DirectGrouping:随机分组,随机分发Stream中的Tuple,保证每个Bolt的Task接收Tuple数量⼤致⼀致
A. 从分布式⽂件系统读⼊数据
B. 执⾏Map任务输出中间结果
C. 通过Shuffle阶段把中间结果分区排序整理后发送给Reduce任务
D. 执⾏Reduce任务得到最终结果并写⼊分布式⽂件系统