A、 分布式⽂件系统
B、 分布式并⾏编程模型
C、 资源管理和调度器
D、 Hadoop上的数据仓库
答案:A
A、 分布式⽂件系统
B、 分布式并⾏编程模型
C、 资源管理和调度器
D、 Hadoop上的数据仓库
答案:A
A. 强⼤的跨平台兼容性
B. ⽀持⼤规模⽂件存储
C. 简化系统设计
D. 适合数据备份
A. 增加数据量
B. 删除重复数据
C. 提高数据质量
D. 降低存储空间
A. Hadoop可以很好地解决⼤规模数据的离线批量处理问题,但是,受限于HadoopMapReduce编程框架的⾼延迟数据处理机制,使得
B. HDFS⾯向批量访问模式,不是随机访问模式
C. 传统的通⽤关系型数据库⽆法应对在数据规模剧增时导致的系统扩展性和性能问题
D. 传统关系数据库在数据结构变化时⼀般需要停机维护;空列浪费存储空间
A. 每个Application都有⾃⼰专属的Executor进程,并且该进程在Application运⾏期间⼀直驻留
B. Executor进程以多线程的⽅式运⾏Task
C. Spark运⾏过程与资源管理器⽆关,只要能够获取Executor进程并保持通信即可
D. Task采⽤了数据本地性和推测执⾏等优化机制
A. 数据可视化是指将⼤型数据集中的数据以图形图像形式表⽰
B. 数据可视化技术的基本思想是将数据库中每⼀个数据项作为单个图元素表⽰
C. 利⽤数据分析和开发⼯具发现其中未知信息的处理过程
D. 将数据的各个属性值以⼀维数据的形式表⽰
A. 关系数据库以完善的关系代数理论作为基础,有严格的标准
B. 关系数据库可扩展性较差,⽆法较好⽀持海量数据存储
C. NoSQL可以⽀持超⼤规模数据存储
D. NoSQL数据库缺乏数学理论基础,复杂查询性能不⾼
A. 帮助NameNode收集⽂件系统运⾏的状态信息
B. 负责执⾏由JobTracker指派的任务
C. 协调数据计算任务
D. 负责协调集群中的数据存储
A. CAP
B. 最终⼀致性
C. BASE
D. DN8
A. ⼀致性,是指任何⼀个读操作总是能够读到之前完成的写操作的结果量
B. ⼀个分布式系统可以同时满⾜⼀致性、可⽤性和分区容忍性这三个需求
C. 可⽤性,是指快速获取数据
D. 分区容忍性,是指当出现⽹络分区的情况时(即系统中的⼀部分节点⽆法和其他节点进⾏通信),分离的系统也能够正常运⾏
A. Master-status(⾃带)
B. Ganglia
C. OpenTSDB
D. Ambari