A、 每个Region服务器都有⼀个⾃⼰的HLog⽂件
B、 每次刷写都⽣成⼀个新的StoreFile,数量太多,影响查找速度
C、 合并操作⽐较耗费资源,只有数量达到⼀个阈值才启动合并
D、 Store是Region服务器的核⼼
答案:ABCD
A、 每个Region服务器都有⼀个⾃⼰的HLog⽂件
B、 每次刷写都⽣成⼀个新的StoreFile,数量太多,影响查找速度
C、 合并操作⽐较耗费资源,只有数量达到⼀个阈值才启动合并
D、 Store是Region服务器的核⼼
答案:ABCD
A. ⾮共享式,容错性好
B. 普通PC机,便宜,扩展性好
C. what,简单
D. 批处理、⾮实时、数据密集型
A. 相对于Spark来说,使⽤Hadoop进⾏迭代计算⾮常耗资源
B. Spark将数据载⼊内存后,之后的迭代计算都可以直接使⽤内存中的中间结果作运算,避免了从磁盘中频繁读取数据
C. Hadoop的设计遵循”⼀个软件栈满⾜不同应⽤场景”的理念
D. Spark可以部署在资源管理器YARN之上,提供⼀站式的⼤数据解决⽅案
A. 不存在单点故障
B. JobTracker”⼤包⼤揽”导致任务过重
C. 容易出现内存溢出(分配资源只考虑MapReduce任务数,不考虑CPU、内存)
D. 资源划分不合理(强制划分为slot,包括Mapslot和Reduceslot)
A. 负责数据的存储和读取
B. 根据客户端或者是名称节点的调度来进⾏数据的存储和检索
C. 向名称节点定期发送⾃⼰所存储的块的列表
D. ⽤来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间
A. 推荐系统可以创造全新的商业和经济模式,帮助实现长尾商品的销售
B. ”长尾”概念于2004年提出,⽤来描述以亚马逊为代表的电⼦商务⽹站的商业和经济模式
C. 可以通过发掘长尾商品并推荐给感兴趣的⽤户来提⾼销售额
D. 热门推荐的主要缺陷在于推荐的范围有限,所推荐的内容在⼀定时期内也相对固定。⽆法实现长尾商品的推荐
A. 存储设备容量不断增加
B. ⽹络带宽不断增加
C. CPU处理能⼒⼤幅提升
D. 数据量不断增⼤
A. Spark在借鉴HadoopMapReduce优点的同时,很好地解决了MapReduce所⾯临的问题
B. Spark的计算模式也属于MapReduce,但不局限于Map和Reduce操作
C. HadoopMapReduce编程模型⽐Spark更灵活
D. HadoopMapReduce提供了内存计算,可将中间结果放到内存中,对于迭代运算效率更⾼
A. Map将⼩数据集进⼀步解析成⼀批
B. Map每⼀个输⼊的
C. Reduce输⼊的中间结果
D. Reduce输⼊的中间结果
A. Zookeeper⽂件记录了⽤户数据表的Region位置信息
B. -ROOT-表记录了.META.表的Region位置信息
C. .META.表保存了HBase中所有⽤户数据表的Region位置信息
D. Zookeeper⽂件记录了-ROOT-表的位置信息