A、 数据实时采集
B、 数据批量采集
C、 数据实时计算
D、 实时查询服务
答案:B
A、 数据实时采集
B、 数据批量采集
C、 数据实时计算
D、 实时查询服务
答案:B
A. 批量计算:充裕时间处理静态数据,如Hadoop
B. 静态数据不适合采⽤批量计算,因为它不适合⽤传统的关系模型建模
C. 流数据必须采⽤实时计算
D. 流数据的响应时间为秒级
A. 不可以⽔平扩展
B. 多点故障问题
C. HDFSHA是热备份,提供⾼可⽤性,但是⽆法解决可扩展性、系统性能和隔离性
D. 系统整体性能受限于单个名称节点的吞吐量
A. FsImage
B. EditLog
C. Block
D. DN8
A. 开发⼯具
B. 开源软件
C. 商业化⼯具
D. 数据采集
A. ⽹络层
B. 访问层
C. ⼤数据层
D. 数据源层
A. 选择集群中的多台机器执⾏图计算任务,每台机器上运⾏⽤户程序的⼀个副本
B. Master把⼀个图分成多个分区,并把分区分配到多个Worker
C. ster会把⽤户输⼊划分成多个部分,通常是基于⽂件边界进⾏划分
D. ster向每个Worker发送指令,Worker收到指令后,开始运⾏⼀个超步
A. FieldsGrouping:⼴播发送,每⼀个Task都会收到所有的Tuple
B. GlobalGrouping:全局分组,所有的Tuple都发送到同⼀个Task中
C. NonGrouping:不分组,和ShuffleGrouping类似,当前Task的执⾏会和它的被订阅者在同⼀个线程中执⾏
D. DirectGrouping:直接分组,直接指定由某个Task来执⾏Tuple的处理
A. 数据是规则的
B. 性能好(⾼并发)
C. 缺乏统⼀的查询语法
D. 复杂性低
A. 查找速度慢,可扩展性差
B. 功能较少,⼤都不⽀持强事务⼀致性
C. 容易进⾏分布式扩展
D. 复杂性低
A. 顶点的当前值
B. 以该顶点为起点的出射边列表,每条出射边包含了⽬标顶点ID和边的值
C. 消息队列,包含了所有接收到的、发送给该顶点的消息
D. 标志位,⽤来标记顶点是否处于活跃状态