A、 分布式环境必须要考虑系统出错。HBase采⽤HLog保证
B、 HBase系统为每个Region服务器配置了⼀个HLog⽂件
C、 Zookeeper会实时监测每个Region服务器的状态
D、 Master⾸先会处理该故障Region服务器上⾯遗留的HLog⽂件
答案:ABCD
A、 分布式环境必须要考虑系统出错。HBase采⽤HLog保证
B、 HBase系统为每个Region服务器配置了⼀个HLog⽂件
C、 Zookeeper会实时监测每个Region服务器的状态
D、 Master⾸先会处理该故障Region服务器上⾯遗留的HLog⽂件
答案:ABCD
A. 存储被拆分的数据块
B. 协调数据计算任务
C. 负责协调集群中的数据存储
D. 负责执⾏由JobTracker指派的任务
A. 结构化数据
B. 半结构化数据
C. 非结构化数据
D. 所有类型数据
A. UserCF算法推荐的是那些和⽬标⽤户有共同兴趣爱好的其他⽤户所喜欢的物品
B. ItemCF算法推荐的是那些和⽬标⽤户之前喜欢的物品类似的其他物品
C. ItemCF算法的推荐更偏向社会化,⽽UserCF算法的推荐更偏向于个性化
D. ItemCF算法倾向于推荐与⽤户已购买商品相似的商品,往往会出现多样性不⾜、推荐新颖度较低的问题
A. 64MB
B. 32MB
C. 128MB
D. 16MB
A. 静态数据
B. 实时数据流
C. 历史数据
D. 结构化数据
A. HBase采⽤表来组织数据,表由⾏和列组成,列划分为若⼲个列族
B. 每个HBase表都由若⼲⾏组成,每个⾏由⾏键(rowkey)来标识
C. 列族⾥的数据通过列限定符(或列)来定位
D. 每个单元格都保存着同⼀份数据的多个版本,这些版本采⽤时间戳进⾏索引
A. ⼀致性,是指任何⼀个读操作总是能够读到之前完成的写操作的结果量
B. ⼀个分布式系统可以同时满⾜⼀致性、可⽤性和分区容忍性这三个需求
C. 可⽤性,是指快速获取数据
D. 分区容忍性,是指当出现⽹络分区的情况时(即系统中的⼀部分节点⽆法和其他节点进⾏通信),分离的系统也能够正常运⾏
A. 查找速度慢,可扩展性差
B. 功能较少,⼤都不⽀持强事务⼀致性
C. 容易进⾏分布式扩展
D. 复杂性低
A. Hadoop可以很好地解决⼤规模数据的离线批量处理问题,但是,受限于HadoopMapReduce编程框架的⾼延迟数据处理机制,使得
B. HDFS⾯向批量访问模式,不是随机访问模式
C. 传统的通⽤关系型数据库⽆法应对在数据规模剧增时导致的系统扩展性和性能问题
D. 传统关系数据库在数据结构变化时⼀般需要停机维护;空列浪费存储空间