A、 Hadoop⾃⾝核⼼组件MapReduce的架构设计改进
B、 Hadoop⾃⾝核⼼组件HDFS的架构设计改进
C、 Hadoop⽣态系统其它组件的不断丰富
D、 Hadoop⽣态系统减少不必要的组件,整合系统
答案:ABC
A、 Hadoop⾃⾝核⼼组件MapReduce的架构设计改进
B、 Hadoop⾃⾝核⼼组件HDFS的架构设计改进
C、 Hadoop⽣态系统其它组件的不断丰富
D、 Hadoop⽣态系统减少不必要的组件,整合系统
答案:ABC
A. 爬⾍持续不断地抓取新页⾯,这些页⾯每隔⼀段时间地存储到BigTable⾥
B. BigTable是⼀个分布式存储系统
C. BigTable起初⽤于解决典型的互联⽹搜索问题
D. ⽹络搜索应⽤查询建⽴好的索引,从BigTable得到⽹页
A. 资源管理
B. 任务调度
C. 任务监控
D. 数据即服务
A. DougCutting
B. Lucene
C. Apache
D. MapReduce
A. Code⽤于存储⼆进制数据
B. Object⽤于内嵌⽂档
C. Null⽤于创建空值
D. String字符串,储数据常⽤的数据类型
A. 创建表的时候,可以通过HColumnDescriptor.setInMemory(true)将表放到Region服务器的缓存中,保证在读取的时候被cache命中
B. 创建表的时候,可以通过HColumnDescriptor.setMaxVersions(intmaxVersions)设置表中数据的最⼤版本,如果只需要保存最新版本的数据,那么可以设置setMaxVersions(1)
C. 创建表的时候,可以通过HColumnDescriptor.setTimeToLive(inttimeToLive)设置表中数据的存储⽣命期
D. 如果最近写⼊HBase表中的数据是最可能被访问的,可以考虑将时间戳作为⾏键的⼀部分
A. FieldsGrouping:⼴播发送,每⼀个Task都会收到所有的Tuple
B. GlobalGrouping:全局分组,所有的Tuple都发送到同⼀个Task中
C. NonGrouping:不分组,和ShuffleGrouping类似,当前Task的执⾏会和它的被订阅者在同⼀个线程中执⾏
D. DirectGrouping:直接分组,直接指定由某个Task来执⾏Tuple的处理
解析:答案解析
A. ⽬录
B. ⽂件
C. 块
D. 磁盘