A、 加快数据传输速度
B、 容易检查数据错误
C、 保证数据可靠性
D、 适合多平台上运⾏
答案:ABC
A、 加快数据传输速度
B、 容易检查数据错误
C、 保证数据可靠性
D、 适合多平台上运⾏
答案:ABC
A. 常常表现出⽐较差的内存访问局部性
B. 针对单个顶点的处理⼯作过少
C. 计算过程中伴随着并⾏度的改变
D. 计算过程简易
A. 表达能⼒有限
B. 磁盘IO开销⼤
C. 延迟⾼
D. 在前⼀个任务执⾏完成之前,其他任务就⽆法开始,难以胜任复杂、多阶段的计算任务
A. 处理⼤规模数据的脚本语⾔
B. ⼯作流和协作服务引擎,协调Hadoop上运⾏的不同任务
C. ⽀持DAG作业的计算框架
D. 基于内存的分布式并⾏编程框架,具有较⾼的实时性,并且较好⽀持迭代计算
A. Amazon是云数据库市场的先⾏者
B. GoogleCloudSQL是⾕歌公司推出的基于MySQL的云数据库
C. 从数据模型的⾓度来说,云数据库并⾮⼀种全新的数据库技术
D. 云数据库并没有专属于⾃⼰的数据模型
A. DataNode:存储被拆分的数据块
B. JobTracker:协调数据计算任务
C. TaskTracker:负责执⾏由JobTracker指派的任务
D. SecondaryNameNode:帮助NameNode收集⽂件系统运⾏的状态信息
A. AllGrouping:⼴播发送,每⼀个Task都会收到所有的Tuple
B. GlobalGrouping:全局分组,所有的Tuple都发送到同⼀个Task中
C. FieldsGrouping:按照字段分组,保证相同字段的Tuple分配到同⼀个Task中
D. DirectGrouping:随机分组,随机分发Stream中的Tuple,保证每个Bolt的Task接收Tuple数量⼤致⼀致
A. 成本⾼
B. ⾼可靠性
C. ⾼容错性
D. 运⾏在Linux平台上
A. HBase采⽤表来组织数据,表由⾏和列组成,列划分为若⼲个列族
B. 每个HBase表都由若⼲⾏组成,每个⾏由⾏键(rowkey)来标识
C. 列族⾥的数据通过列限定符(或列)来定位
D. 每个单元格都保存着同⼀份数据的多个版本,这些版本采⽤时间戳进⾏索引
A. 资源管理
B. 任务调度
C. 任务监控
D. 数据即服务
A. 关于出度分布的柱状图
B. 处于活跃状态的边数量
C. 在当前超步的时间信息和消息流量
D. 所有⽤户⾃定义Aggregator的值