A、 Spark在借鉴HadoopMapReduce优点的同时,很好地解决了MapReduce所⾯临的问题
B、 Spark的计算模式也属于MapReduce,但不局限于Map和Reduce操作
C、 HadoopMapReduce编程模型⽐Spark更灵活
D、 HadoopMapReduce提供了内存计算,可将中间结果放到内存中,对于迭代运算效率更⾼
答案:AB
A、 Spark在借鉴HadoopMapReduce优点的同时,很好地解决了MapReduce所⾯临的问题
B、 Spark的计算模式也属于MapReduce,但不局限于Map和Reduce操作
C、 HadoopMapReduce编程模型⽐Spark更灵活
D、 HadoopMapReduce提供了内存计算,可将中间结果放到内存中,对于迭代运算效率更⾼
答案:AB
A. ⽀持⼤规模⽂件存储
B. 简化系统设计
C. 适合数据备份
D. ⽀持中等规模⽂件存储
A. 风险评估与管理
B. 客户行为分析
C. 交易系统优化
D. 传统柜台业务
A. worker:每个worker进程都属于⼀个特定的Topology
B. executor:executor是产⽣于worker进程内部的线程
C. task:实际的数据处理由task完成
D. 在Topology的⽣命周期中,每个组件的task数⽬是不会发⽣变化的,⽽executor的数⽬却不⼀定
A. AmazonRDS:云中的关系数据库
B. AmazonSimpleDB:云中的键值数据库
C. AmazonDynamoDB:云中的数据仓库
D. AmazonElastiCache:云中的分布式内存缓存
A. 针对⼤规模数据的批量处理
B. 针对⼤规模图结构数据的处理
C. ⼤规模数据的存储管理和查询分析
D. 针对流数据的实时计算
A. Hadoop可以很好地解决⼤规模数据的离线批量处理问题,但是,受限于HadoopMapReduce编程框架的⾼延迟数据处理机制,使得
B. HDFS⾯向批量访问模式,不是随机访问模式
C. 传统的通⽤关系型数据库⽆法应对在数据规模剧增时导致的系统扩展性和性能问题
D. 传统关系数据库在数据结构变化时⼀般需要停机维护;空列浪费存储空间
A. 运⾏速度快
B. 容易使⽤
C. 通⽤性
D. 运⾏模式单⼀
A. Amazon是云数据库市场的先⾏者
B. GoogleCloudSQL是⾕歌公司推出的基于MySQL的云数据库
C. 从数据模型的⾓度来说,云数据库并⾮⼀种全新的数据库技术
D. 云数据库并没有专属于⾃⼰的数据模型