A、 ⽀持⼤规模⽂件存储
B、 简化系统设计
C、 适合数据备份
D、 ⽀持中等规模⽂件存储
答案:ABC
A、 ⽀持⼤规模⽂件存储
B、 简化系统设计
C、 适合数据备份
D、 ⽀持中等规模⽂件存储
答案:ABC
A. RDS是阿⾥云提供的关系型数据库服务
B. RDS由专业数据库管理团队维护
C. RDS具有安全稳定、数据可靠、⾃动备份
D. RDS实例,是⽤户购买RDS服务的基本单位。在实例中,⽤户只能创建⼀个数据库
A. GoogleChartAPI
B. D3
C. Visual.ly
D. Spark
A. worker:每个worker进程都属于⼀个特定的Topology
B. executor:executor是产⽣于worker进程内部的线程
C. task:实际的数据处理由task完成
D. 在Topology的⽣命周期中,每个组件的task数⽬是不会发⽣变化的,⽽executor的数⽬却不⼀定
A. 实现⼀键式安装和配置、线程级别的任务监控和告警
B. 降低硬件集群、软件维护、任务监控和应⽤开发的难度
C. 便于做成统⼀的硬件、计算平台资源池
D. 不⽤负载应⽤混搭,集群利⽤率⾼
A. 不存在单点故障
B. JobTracker”⼤包⼤揽”导致任务过重
C. 容易出现内存溢出(分配资源只考虑MapReduce任务数,不考虑CPU、内存)
D. 资源划分不合理(强制划分为slot,包括Mapslot和Reduceslot)
A. Spark应⽤在复杂的批量数据处理
B. SparkSQL是基于历史数据的交互式查询
C. SparkStreaming是基于历史数据的数据挖掘
D. GraphX是图结构数据的处
A. 利⽤分布式⽂件系统、数据仓库、关系数据库等实现对结构化、半结构化和⾮结构化海量数据的存储和管理
B. 利⽤分布式并⾏编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析
C. 构建隐私数据保护体系和数据安全体系,有效保护个⼈隐私和数据安全
D. 把实时采集的数据作为流计算系统的输⼊,进⾏实时处理分析
A. SecondaryNameNode⼀般是并⾏运⾏在多台机器上
B. 它是⽤来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间
C. SecondaryNameNode通过HTTPGET⽅式从NameNode上获取到FsImage和EditLog⽂件,并下载到本地的相应⽬录下
D. SecondaryNameNode是HDFS架构中的⼀个组成部分
A. pplicationMaster分配资源
B. 把获得的资源进⼀步分配给内部的各个任务(Map任务或Reduce任务),实现资源的”⼆次分配”
C. 定时向ResourceManager发送”⼼跳”消息,报告资源的使⽤情况和应⽤的进度信息
D. 向ResourceManager汇报作业的资源使⽤情况和每个容器的运⾏状态
A. 每个Region服务器都有⼀个⾃⼰的HLog⽂件
B. 每次刷写都⽣成⼀个新的StoreFile,数量太多,影响查找速度
C. 合并操作⽐较耗费资源,只有数量达到⼀个阈值才启动合并
D. Store是Region服务器的核⼼