A、 读写分离
B、 分库分表
C、 数据安全
D、 资源合并
答案:D
A、 读写分离
B、 分库分表
C、 数据安全
D、 资源合并
答案:D
A. SecondaryNameNode⼀般是并⾏运⾏在多台机器上
B. 它是⽤来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间
C. SecondaryNameNode通过HTTPGET⽅式从NameNode上获取到FsImage和EditLog⽂件,并下载到本地的相应⽬录下
D. SecondaryNameNode是HDFS架构中的⼀个组成部分
A. 解析⽹页的任务就是分析⼀个页⾯的链接数,但是不赋初值
B. PageRank分配就是多次迭代计算页⾯的PageRank值
C. 收敛阶段的任务就是由⼀个⾮并⾏组件决定是否达到收敛
D. ⼀般判断是否收敛的条件是所有⽹页的PageRank值不再变化,或者运⾏30次以后我们就认为已经收敛了
A. Controller服务器向UMP集群提供各种管理服务
B. Controller服务器上运⾏了⼀组Mnesia分布式数据库服务
C. 当其它服务器组件需要获取⽤户数据时,不可以向Controller服务器发送请求获取数据
D. 为了避免单点故障,保证系统的⾼可⽤性,UMP系统中部署了多台Controller服务器
A. HadoopJob对应StormTopology
B. HadoopTaskTracker对应StormSupervisor
C. HadoopJobTracker对应StormSpout
D. HadoopReduce对应StormBolt
A. 从磁盘或从⽹络读取数据,即IO密集⼯作
B. 计算数据,即CPU密集⼯作
C. 针对不同的⼯作节点选择合适硬件类型
D. 负责协调集群中的数据存储
A. 在传统的数据处理流程中,存储的数据是旧的
B. 在传统的数据处理流程中,需要⽤户主动发出查询来获取结果
C. 传统的数据处理流程,需要先采集数据并存储在关系数据库等数据管理系统中
D. 流计算的处理流程⼀般包含三个阶段:数据实时采集、数据批量计算、实时查询服务
A. 实时性差(适合批处理,不⽀持实时交互式)
B. 资源浪费(Map和Reduce分两阶段执⾏)
C. 执⾏迭代操作效率低
D. 难以看到程序整体逻辑
A. 泊松相关系数
B. 余弦相似度
C. 调整余弦相似度
D. 调整正弦相似度
A. ⽤户可通过Client提供的⼀些接⼝查看作业运⾏状态
B. ⽤户编写的MapReduce程序通过Client提交到JobTracker端
C. JobTracker负责资源监控和作业调度
D. JobTracker会跟踪任务的执⾏进度、资源使⽤量等信息,并将这些信息告诉任务调度器(TaskScheduler)