A、 存储设备容量不断增加
B、 ⽹络带宽不断增加
C、 CPU处理能⼒⼤幅提升
D、 数据量不断增⼤
答案:AC
A、 存储设备容量不断增加
B、 ⽹络带宽不断增加
C、 CPU处理能⼒⼤幅提升
D、 数据量不断增⼤
答案:AC
A. 数据中⼼是云计算的重要载体,为各种平台和应⽤提供运⾏⽀撑环境
B. 提供智能交通、智慧医疗、智能物流、智能电⽹等
C. 提供分布式计算、数据挖掘、统计分析等服务
D. 提供硬件、软件、⽹络等基础设施
A. 同⼀个Region不会被分拆到多个Region服务器
B. 为了加快访问速度,.META.表的全部Region都会被保存在内存中
C. ⼀个-ROOT-表可以有多个Region
D. 为了加速寻址,客户端会缓存位置信息,同时,需要解决缓存失效问题
A. 数据存储层
B. 数据源层
C. 数据分析层
D. 数据应⽤层
A. DataNode:存储被拆分的数据块
B. JobTracker:协调数据计算任务
C. TaskTracker:负责执⾏由JobTracker指派的任务
D. SecondaryNameNode:帮助NameNode收集⽂件系统运⾏的状态信息
A. ⼀致性,是指任何⼀个读操作总是能够读到之前完成的写操作的结果量
B. ⼀个分布式系统可以同时满⾜⼀致性、可⽤性和分区容忍性这三个需求
C. 可⽤性,是指快速获取数据
D. 分区容忍性,是指当出现⽹络分区的情况时(即系统中的⼀部分节点⽆法和其他节点进⾏通信),分离的系统也能够正常运⾏
A. Client
B. JobTracker
C. TaskTracker以及Task
D. Job
A. Pig
B. Spark
C. Kafka
D. DN8
A. ⼀个RDD就是⼀个分布式对象集合,本质上是⼀个只读的分区记录集合
B. 每个RDD可分成多个分区,每个分区就是⼀个数据集⽚段
C. RDD是可以直接修改的
D. RDD提供了⼀种⾼度受限的共享内存模型
A. 在Pregel中,为了获得更好的性能,”标志位”和输⼊消息队列是分开保存的
B. 在超步S中,当⼀个Worker在进⾏顶点处理时,⽤于当前超步的消息会被处理
C. 需要两个消息队列⽤于存放作⽤于当前超步S的消息和作⽤于下⼀个超步S+1的消息
D. 每个Worker上都保存了⼀个或多个分区的状态信息,当⼀个Worker发⽣故障时,它所负责维护的分区的当前状态信息就会丢失