A、 每个Region服务器都有⼀个⾃⼰的HLog⽂件
B、 每次刷写都⽣成⼀个新的StoreFile,数量太多,影响查找速度
C、 合并操作⽐较耗费资源,只有数量达到⼀个阈值才启动合并
D、 Store是Region服务器的核⼼
答案:ABCD
A、 每个Region服务器都有⼀个⾃⼰的HLog⽂件
B、 每次刷写都⽣成⼀个新的StoreFile,数量太多,影响查找速度
C、 合并操作⽐较耗费资源,只有数量达到⼀个阈值才启动合并
D、 Store是Region服务器的核⼼
答案:ABCD
A. 分布式环境必须要考虑系统出错。HBase采⽤HLog保证
B. HBase系统为每个Region服务器配置了⼀个HLog⽂件
C. Zookeeper会实时监测每个Region服务器的状态
D. Master⾸先会处理该故障Region服务器上⾯遗留的HLog⽂件
A. 常常表现出⽐较差的内存访问局部性
B. 针对单个顶点的处理⼯作过少
C. 计算过程中伴随着并⾏度的改变
D. 计算过程简易
A. 为特定的图应⽤定制相应的分布式实现:通⽤性不好
B. 基于现有的分布式计算平台进⾏图计算:在性能和易⽤性⽅⾯往往⽆法达到最优
C. 使⽤单机的图算法库,但是,在可以解决的问题的规模⽅⾯具有很⼤的局限性
D. 使⽤已有的并⾏图计算系统,但是,对⼤规模分布式系统⾮常重要的⼀些⽅⾯(⽐如容错),⽆法提供较好的⽀持
A. 局部计算:每个参与的处理器都有⾃⾝的计算任务
B. 通讯:处理器群相互交换数据
C. 栅栏同步:当⼀个处理器遇到”路障”(或栅栏),会等到其他所有处理器完成它们的计算步骤
D. 基于现有的分布式计算平台进⾏图计算
A. ⽂本⽂件
B. 关系数据库
C. 键值数据库
D. 语⾳⽂件
A. 选择集群中的多台机器执⾏图计算任务,每台机器上运⾏⽤户程序的⼀个副本
B. Master把⼀个图分成多个分区,并把分区分配到多个Worker
C. ster会把⽤户输⼊划分成多个部分,通常是基于⽂件边界进⾏划分
D. ster向每个Worker发送指令,Worker收到指令后,开始运⾏⼀个超步
A. 顶点的当前值
B. 以该顶点为起点的出射边列表,每条出射边包含了⽬标顶点ID和边的值
C. 消息队列,包含了所有接收到的、发送给该顶点的消息
D. 标志位,⽤来标记顶点是否处于活跃状态
A. 该顶点的当前值
B. ⼀个接收到的消息的迭代器
C. ⼀个出射边的迭代器
D. 标志位,⽤来标记顶点是否处于活跃状态
A. 在Pregel中,为了获得更好的性能,”标志位”和输⼊消息队列是分开保存的
B. 在超步S中,当⼀个Worker在进⾏顶点处理时,⽤于当前超步的消息会被处理
C. 需要两个消息队列⽤于存放作⽤于当前超步S的消息和作⽤于下⼀个超步S+1的消息
D. 每个Worker上都保存了⼀个或多个分区的状态信息,当⼀个Worker发⽣故障时,它所负责维护的分区的当前状态信息就会丢失
A. 增加数据量
B. 删除重复数据
C. 提高数据质量
D. 降低存储空间