A、 在传统的数据处理流程中,存储的数据是旧的
B、 在传统的数据处理流程中,需要⽤户主动发出查询来获取结果
C、 传统的数据处理流程,需要先采集数据并存储在关系数据库等数据管理系统中
D、 流计算的处理流程⼀般包含三个阶段:数据实时采集、数据批量计算、实时查询服务
答案:D
A、 在传统的数据处理流程中,存储的数据是旧的
B、 在传统的数据处理流程中,需要⽤户主动发出查询来获取结果
C、 传统的数据处理流程,需要先采集数据并存储在关系数据库等数据管理系统中
D、 流计算的处理流程⼀般包含三个阶段:数据实时采集、数据批量计算、实时查询服务
答案:D
A. 第⼀阶段:解析⽹页
B. 第⼆阶段:PageRank分配
C. 第三阶段:收敛阶段
D. 第⼀阶段:收集⽹页
A. 在Pregel中,为了获得更好的性能,”标志位”和输⼊消息队列是分开保存的
B. 在超步S中,当⼀个Worker在进⾏顶点处理时,⽤于当前超步的消息会被处理
C. 需要两个消息队列⽤于存放作⽤于当前超步S的消息和作⽤于下⼀个超步S+1的消息
D. 每个Worker上都保存了⼀个或多个分区的状态信息,当⼀个Worker发⽣故障时,它所负责维护的分区的当前状态信息就会丢失
A. 较低可扩展性
B. 只⽀持java语⾔
C. 成本低
D. 运⾏在Linux平台上
A. ⽤户可通过Client提供的⼀些接⼝查看作业运⾏状态
B. ⽤户编写的MapReduce程序通过Client提交到JobTracker端
C. JobTracker负责资源监控和作业调度
D. JobTracker会跟踪任务的执⾏进度、资源使⽤量等信息,并将这些信息告诉任务调度器(TaskScheduler)
A. Amazon是云数据库市场的先⾏者
B. GoogleCloudSQL是⾕歌公司推出的基于MySQL的云数据库
C. 从数据模型的⾓度来说,云数据库并⾮⼀种全新的数据库技术
D. 云数据库并没有专属于⾃⼰的数据模型
A. 为海量数据提供存储的HDFS和对数据进⾏计算的MapReduce
B. 提供整个HDFS⽂件系统的NameSpace(命名空间)管理、块管理等所有服务
C. Hadoop不仅可以运⾏在企业内部的集群中,也可以运⾏在云计算环境中
D. Hadoop被视为事实上的⼤数据处理标准
A. 帮助NameNode收集⽂件系统运⾏的状态信息
B. 负责执⾏由JobTracker指派的任务
C. 协调数据计算任务
D. 负责协调集群中的数据存储
A. 每个Region服务器都有⼀个⾃⼰的HLog⽂件
B. 每次刷写都⽣成⼀个新的StoreFile,数量太多,影响查找速度
C. 合并操作⽐较耗费资源,只有数量达到⼀个阈值才启动合并
D. Store是Region服务器的核⼼
A. 流处理系统处理的是实时的数据,⽽传统的数据处理系统处理的是预先存储好的静态数据
B. ⽤户通过流处理系统获取的是实时结果,⽽通过传统的数据处理系统,获取的是过去某⼀时刻的结果
C. 流处理系统⽆需⽤户主动发出查询,实时查询服务可以主动将结果推送给⽤户
D. 传统的数据处理系统系统⽆需⽤户主动发出查询,批量查询服务可以主动将结果推送给⽤户
A. 存储被拆分的数据块
B. 协调数据计算任务
C. 负责协调集群中的数据存储
D. 负责执⾏由JobTracker指派的任务