A、 成熟期
B、 萌芽期
C、 ⼤规模应⽤期
D、 迷茫期
答案:D
A、 成熟期
B、 萌芽期
C、 ⼤规模应⽤期
D、 迷茫期
答案:D
A. 表达能⼒有限
B. 磁盘IO开销⼤
C. 延迟⾼
D. 在前⼀个任务执⾏完成之前,其他任务就⽆法开始,难以胜任复杂、多阶段的计算任务
A. 为海量数据提供存储的HDFS和对数据进⾏计算的MapReduce
B. 提供整个HDFS⽂件系统的NameSpace(命名空间)管理、块管理等所有服务
C. Hadoop不仅可以运⾏在企业内部的集群中,也可以运⾏在云计算环境中
D. Hadoop被视为事实上的⼤数据处理标准
A. 性能好(⾼并发),灵活性⾼
B. 具备统⼀的查询语法
C. ⽂档数据库⽀持⽂档间的事务
D. 复杂性低,数据结构灵活
A. MapReduce采⽤”分⽽治之”策略
B. MapReduce设计的⼀个理念就是”计算向数据靠拢”
C. MapReduce框架采⽤了Master/Slave架构
D. MapReduce应⽤程序只⽤Java来写
A. 在Pregel中,为了获得更好的性能,”标志位”和输⼊消息队列是分开保存的
B. 在超步S中,当⼀个Worker在进⾏顶点处理时,⽤于当前超步的消息会被处理
C. 需要两个消息队列⽤于存放作⽤于当前超步S的消息和作⽤于下⼀个超步S+1的消息
D. 每个Worker上都保存了⼀个或多个分区的状态信息,当⼀个Worker发⽣故障时,它所负责维护的分区的当前状态信息就会丢失
A. ⼀个作业(Job)是对⼀组输⼊流进⾏处理转化成输出流的程序
B. Samza的流数据单位既不是Storm中的元组,也不是SparkStreaming中的DStream,⽽是⼀条条消息
C. ⼀个作业会被进⼀步分割成多个任务(Task)来执⾏
D. 分区之间没有定义顺序,从⽽允许每⼀个任务独⽴执⾏
A. Client
B. JobTracker
C. TaskTracker以及Task
D. Job
A. 动态可扩展
B. ⾼可⽤性
C. 免维护
D. 安全
A. 客户端是⽤户操作HDFS最常⽤的⽅式,HDFS在部署时都提供了客户端
B. HDFS客户端是⼀个库,暴露了HDFS⽂件系统接⼝
C. 严格来说,客户端并不算是HDFS的⼀部分
D. 客户端可以⽀持打开、读取、写⼊等常见的操作
A. Web2.0⽹站系统通常不要求严格的数据库事务
B. Web2.0⽹站系统基本上不⽤数据库来存储
C. Web2.0并不要求严格的读写实时性
D. Web2.0通常不包含⼤量复杂的SQL查询