A、 Amazon是云数据库市场的先⾏者
B、 GoogleCloudSQL是⾕歌公司推出的基于MySQL的云数据库
C、 从数据模型的⾓度来说,云数据库并⾮⼀种全新的数据库技术
D、 云数据库并没有专属于⾃⼰的数据模型
答案:ABCD
A、 Amazon是云数据库市场的先⾏者
B、 GoogleCloudSQL是⾕歌公司推出的基于MySQL的云数据库
C、 从数据模型的⾓度来说,云数据库并⾮⼀种全新的数据库技术
D、 云数据库并没有专属于⾃⼰的数据模型
答案:ABCD
A. 兼容廉价的硬件设备
B. 流数据读写
C. ⼤数据集
D. 复杂的⽂件模型
A. 在Pregel中,为了获得更好的性能,”标志位”和输⼊消息队列是分开保存的
B. 在超步S中,当⼀个Worker在进⾏顶点处理时,⽤于当前超步的消息会被处理
C. 需要两个消息队列⽤于存放作⽤于当前超步S的消息和作⽤于下⼀个超步S+1的消息
D. 每个Worker上都保存了⼀个或多个分区的状态信息,当⼀个Worker发⽣故障时,它所负责维护的分区的当前状态信息就会丢失
A. 从分布式⽂件系统读⼊数据
B. 执⾏Map任务输出中间结果
C. 通过Shuffle阶段把中间结果分区排序整理后发送给Reduce任务
D. 执⾏Reduce任务得到最终结果并写⼊分布式⽂件系统
A. 智能物流
B. 智能安防
C. 环保监测
D. 数据采集
A. ⼑⽚服务器、⾼速⽹、SAN,价格贵,扩展性差上
B. 共享式(共享内存/共享存储),容错性好
C. what-how,难
D. 实时、细粒度计算、计算密集型
A. 常常表现出⽐较差的内存访问局部性
B. 针对单个顶点的处理⼯作过少
C. 计算过程中伴随着并⾏度的改变
D. 计算过程简易
A. 处理⼤规模数据的脚本语⾔
B. ⼯作流和协作服务引擎,协调Hadoop上运⾏的不同任务
C. ⽀持DAG作业的计算框架
D. 基于内存的分布式并⾏编程框架,具有较⾼的实时性,并且较好⽀持迭代计算
A. Hadoop可以很好地解决⼤规模数据的离线批量处理问题,但是,受限于HadoopMapReduce编程框架的⾼延迟数据处理机制,使得
B. HDFS⾯向批量访问模式,不是随机访问模式
C. 传统的通⽤关系型数据库⽆法应对在数据规模剧增时导致的系统扩展性和性能问题
D. 传统关系数据库在数据结构变化时⼀般需要停机维护;空列浪费存储空间
A. 实时获取来⾃不同数据源的海量数据,经过实时分析处理,获得有价值的信息
B. 流计算秉承⼀个基本理念,即数据的价值随着时间的流逝⽽降低
C. 对于⼀个流计算系统来说,它应该⽀持TB级甚⾄是PB级的数据规模
D. 流计算只需要保证较低的延迟时间,即只达到秒级别即可处理⼀切问题
A. Hadoop擅长批处理,不适合流计算
B. MapReduce是专门⾯向静态数据的批量处理的
C. Hadoop设计的初衷是⾯向⼤规模数据的批量处理
D. MapReduce不适合⽤于处理持续到达的动态数据