A、 实时性差(适合批处理,不⽀持实时交互式)
B、 资源浪费(Map和Reduce分两阶段执⾏)
C、 执⾏迭代操作效率低
D、 难以看到程序整体逻辑
答案:ABCD
A、 实时性差(适合批处理,不⽀持实时交互式)
B、 资源浪费(Map和Reduce分两阶段执⾏)
C、 执⾏迭代操作效率低
D、 难以看到程序整体逻辑
答案:ABCD
A. ⾼效的容错性
B. 中间结果持久化到内存,数据在内存中的多个
C. 存放的数据可以是Java对象,避免了不必要的对象序列化和反序列化
D. 现有容错机制:数据复制或者记录⽇志
A. 库函数:链接到每个客户端
B. ⼀个Master主服务器
C. 许多个Region服务器
D. 部署在廉价的计算机集群中
A. 充分利⽤主从库实现⽤户读写操作的分离,实现负载均衡
B. UMP系统实现了对于⽤户透明的读写分离功能
C. UMP采⽤的两种资源隔离⽅式(⽤Cgroup限制MySQL进程资源和在Proxy服务器端限制QPS)
D. UMP系统只设计了⼀种机制来保证数据安全
A. ⽆论是亚马逊还是Netflix,其推荐系统的基础都是ItemCF算法
B. ItemCF算法是给⽬标⽤户推荐那些和他们之前喜欢的物品相似的物品
C. ItemCF算法主要通过分析⽤户的⾏为记录来计算物品之间的相似度
D. 实现UserCF算法的关键步骤是计算物品与物品之间的相似度
A. 每个Region服务器都有⼀个⾃⼰的HLog⽂件
B. 每次刷写都⽣成⼀个新的StoreFile,数量太多,影响查找速度
C. 合并操作⽐较耗费资源,只有数量达到⼀个阈值才启动合并
D. Store是Region服务器的核⼼
A. 源节点(SourceNode)
B. 主节点(MasterNode)
C. 名称结点(NameNode)
D. 节点(SlaveNode)
A. 为海量数据提供存储的HDFS和对数据进⾏计算的MapReduce
B. 提供整个HDFS⽂件系统的NameSpace(命名空间)管理、块管理等所有服务
C. Hadoop不仅可以运⾏在企业内部的集群中,也可以运⾏在云计算环境中
D. Hadoop被视为事实上的⼤数据处理标准
A. 负责资源监控和作业调度,监控所有TaskTracker与Job的健康状况
B. 使⽤”slot”等量划分本节点上的资源量(CPU、内存等)
C. 会周期性地通过”⼼跳”将本节点上资源的使⽤情况和任务的运⾏进度汇报给TaskTracker
D. 会跟踪任务的执⾏进度、资源使⽤量等信息,并将这些信息告诉任务(Task)