A、 把⽂件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群
B、 ⽤于在Hadoop与传统数据库之间进⾏数据传递
C、 ⼀个⾼可⽤的,⾼可靠的,分布式的海量⽇志采集、聚合和传输的系统
D、 ⼀种⾼吞吐量的分布式发布订阅消息系统,可以处理消费者规模的⽹站中的所有动作流数据
答案:A
A、 把⽂件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群
B、 ⽤于在Hadoop与传统数据库之间进⾏数据传递
C、 ⼀个⾼可⽤的,⾼可靠的,分布式的海量⽇志采集、聚合和传输的系统
D、 ⼀种⾼吞吐量的分布式发布订阅消息系统,可以处理消费者规模的⽹站中的所有动作流数据
答案:A
A. 关于出度分布的柱状图
B. 处于活跃状态的边数量
C. 在当前超步的时间信息和消息流量
D. 所有⽤户⾃定义Aggregator的值
A. 数据存储方式
B. 数据传输速度
C. 数据查询语言
D. 数据安全性
A. DataNode:存储被拆分的数据块
B. JobTracker:协调数据计算任务
C. TaskTracker:负责执⾏由JobTracker指派的任务
D. SecondaryNameNode:帮助NameNode收集⽂件系统运⾏的状态信息
A. Client
B. JobTracker
C. TaskTracker
D. Task
A. 复杂性:部署、管理、配置很复杂
B. 数据库复制:MySQL主备之间采⽤复制⽅式,只能是异步复制
C. 扩容问题:如果系统压⼒过⼤需要增加新的机器,这个过程涉及数据重新划分
D. 动态数据迁移问题:如果某个数据库组压⼒过⼤,需要将其中部分数据迁移出去
A. ⾼效的容错性
B. 中间结果持久化到内存,数据在内存中的多个
C. 存放的数据可以是Java对象,避免了不必要的对象序列化和反序列化
D. 现有容错机制:数据复制或者记录⽇志
A. pplicationMaster分配资源
B. 把获得的资源进⼀步分配给内部的各个任务(Map任务或Reduce任务),实现资源的”⼆次分配”
C. 定时向ResourceManager发送”⼼跳”消息,报告资源的使⽤情况和应⽤的进度信息
D. 向ResourceManager汇报作业的资源使⽤情况和每个容器的运⾏状态
A. 数值数组
B. 字符串
C. 对象(本⾝包含其他数组或键/值对)
D. JSON和GeoJSON
A. 主从结构模型
B. 分层模式
C. 管道-过滤器模式
D. 点对点模式