A、 基于物品的协同过滤算法(简称ItemCF算法)是⽬前业界应⽤最多的算法
B、 ItemCF算法是给⽬标⽤户推荐那些和他们之前喜欢的物品相似的物品
C、 ItemCF算法通过建⽴⽤户到物品倒排表(每个⽤户喜欢的物品的列表)来计算物品相似度
D、 UserCF算法推荐的是那些和⽬标⽤户有共同兴趣爱好的其他⽤户所喜欢的物品
答案:ABCD
A、 基于物品的协同过滤算法(简称ItemCF算法)是⽬前业界应⽤最多的算法
B、 ItemCF算法是给⽬标⽤户推荐那些和他们之前喜欢的物品相似的物品
C、 ItemCF算法通过建⽴⽤户到物品倒排表(每个⽤户喜欢的物品的列表)来计算物品相似度
D、 UserCF算法推荐的是那些和⽬标⽤户有共同兴趣爱好的其他⽤户所喜欢的物品
答案:ABCD
A. Hadoop可以很好地解决⼤规模数据的离线批量处理问题,但是,受限于HadoopMapReduce编程框架的⾼延迟数据处理机制,使得
B. HDFS⾯向批量访问模式,不是随机访问模式
C. 传统的通⽤关系型数据库⽆法应对在数据规模剧增时导致的系统扩展性和性能问题
D. 传统关系数据库在数据结构变化时⼀般需要停机维护;空列浪费存储空间
A. 数据类型
B. 数据操作
C. 存储模式
D. 数据维护
A. NativeJavaAPI
B. HBaseShell
C. ThriftGateway
D. RESTGateway
A. HBase采⽤表来组织数据,表由⾏和列组成,列划分为若⼲个列族
B. 每个HBase表都由若⼲⾏组成,每个⾏由⾏键(rowkey)来标识
C. 列族⾥的数据通过列限定符(或列)来定位
D. 每个单元格都保存着同⼀份数据的多个版本,这些版本采⽤时间戳进⾏索引
A. 库函数:链接到每个客户端
B. ⼀个Master主服务器
C. 许多个Region服务器
D. 部署在廉价的计算机集群中
A. Zookeeper⽂件
B. -ROOT-表
C. .META.表
D. 数据类型
A. Master-status(⾃带)
B. Ganglia
C. OpenTSDB
D. Ambari
A. 配置维护
B. 域名服务
C. 分布式同步
D. 组服务
A. 每个Region服务器都有⼀个⾃⼰的HLog⽂件
B. 每次刷写都⽣成⼀个新的StoreFile,数量太多,影响查找速度
C. 合并操作⽐较耗费资源,只有数量达到⼀个阈值才启动合并
D. Store是Region服务器的核⼼
A. 分布式环境必须要考虑系统出错。HBase采⽤HLog保证
B. HBase系统为每个Region服务器配置了⼀个HLog⽂件
C. Zookeeper会实时监测每个Region服务器的状态
D. Master⾸先会处理该故障Region服务器上⾯遗留的HLog⽂件