APP下载

大数据技术理论题库

搜索

大数据技术理论题库

题目内容

(

多选题

)

219、下列关于协同过滤算法的描述，哪些是正确的?

A、　基于物品的协同过滤算法(简称ItemCF算法)是⽬前业界应⽤最多的算法

B、　ItemCF算法是给⽬标⽤户推荐那些和他们之前喜欢的物品相似的物品

C、　ItemCF算法通过建⽴⽤户到物品倒排表(每个⽤户喜欢的物品的列表)来计算物品相似度

D、　UserCF算法推荐的是那些和⽬标⽤户有共同兴趣爱好的其他⽤户所喜欢的物品

答案：ABCD

Scan me!

大数据技术理论题库

230、关系数据库已经流⾏很多年，并且Hadoop已经有了HDFS和MapReduce，为什么需要HBase?

点击查看题目

231、HBase与传统的关系数据库的区别主要体现在以下哪⼏个⽅⾯?

点击查看题目

232、HBase访问接⼝类型包括哪些?

点击查看题目

233、下列关于数据模型的描述，哪些是正确的?

点击查看题目

234、HBase的实现包括哪三个主要的功能组件?

点击查看题目

235、HBase的三层结构中，三层指的是哪三层?

点击查看题目

236、HBase性能监视主要包括以下哪⼏⽅⾯?

点击查看题目

237、Zookeeper是⼀个很好的集群管理⼯具，被⼤量⽤于分布式计算，它主要提供什么服务?

点击查看题目

238、下列关于Region服务器⼯作原理的描述，哪些是正确的?

点击查看题目

239、下列关于HLog⼯作原理的描述，哪些是正确的?

点击查看题目

大数据技术理论题库

题目内容

(

多选题

)

手机预览

Scan me!

大数据技术理论题库

219、下列关于协同过滤算法的描述，哪些是正确的?

A、　基于物品的协同过滤算法(简称ItemCF算法)是⽬前业界应⽤最多的算法

B、　ItemCF算法是给⽬标⽤户推荐那些和他们之前喜欢的物品相似的物品

C、　ItemCF算法通过建⽴⽤户到物品倒排表(每个⽤户喜欢的物品的列表)来计算物品相似度

D、　UserCF算法推荐的是那些和⽬标⽤户有共同兴趣爱好的其他⽤户所喜欢的物品

答案：ABCD

相关题库:

大数据技术理论题库

分享

Scan me!

大数据技术理论题库

相关题目

230、关系数据库已经流⾏很多年，并且Hadoop已经有了HDFS和MapReduce，为什么需要HBase?

A. 　Hadoop可以很好地解决⼤规模数据的离线批量处理问题，但是，受限于HadoopMapReduce编程框架的⾼延迟数据处理机制，使得

B. 　HDFS⾯向批量访问模式，不是随机访问模式

C. 　传统的通⽤关系型数据库⽆法应对在数据规模剧增时导致的系统扩展性和性能问题

D. 　传统关系数据库在数据结构变化时⼀般需要停机维护;空列浪费存储空间

点击查看答案

231、HBase与传统的关系数据库的区别主要体现在以下哪⼏个⽅⾯?

A. 　数据类型

B. 　数据操作

C. 　存储模式

D. 　数据维护

点击查看答案

232、HBase访问接⼝类型包括哪些?

A. 　NativeJavaAPI

B. 　HBaseShell

C. 　ThriftGateway

D. 　RESTGateway

点击查看答案

233、下列关于数据模型的描述，哪些是正确的?

A. 　HBase采⽤表来组织数据，表由⾏和列组成，列划分为若⼲个列族

B. 　每个HBase表都由若⼲⾏组成，每个⾏由⾏键(rowkey)来标识

C. 　列族⾥的数据通过列限定符(或列)来定位

D. 　每个单元格都保存着同⼀份数据的多个版本，这些版本采⽤时间戳进⾏索引

点击查看答案

234、HBase的实现包括哪三个主要的功能组件?

A. 　库函数:链接到每个客户端

B. 　⼀个Master主服务器

C. 　许多个Region服务器

D. 　部署在廉价的计算机集群中

点击查看答案

235、HBase的三层结构中，三层指的是哪三层?

A. 　Zookeeper⽂件

B. 　-ROOT-表

C. 　.META.表

D. 　数据类型

点击查看答案

236、HBase性能监视主要包括以下哪⼏⽅⾯?

A. 　Master-status(⾃带)

B. 　Ganglia

C. 　OpenTSDB

D. 　Ambari

点击查看答案

237、Zookeeper是⼀个很好的集群管理⼯具，被⼤量⽤于分布式计算，它主要提供什么服务?

A. 　配置维护

B. 　域名服务

C. 　分布式同步

D. 　组服务

点击查看答案

238、下列关于Region服务器⼯作原理的描述，哪些是正确的?

A. 　每个Region服务器都有⼀个⾃⼰的HLog⽂件

B. 　每次刷写都⽣成⼀个新的StoreFile，数量太多，影响查找速度

C. 　合并操作⽐较耗费资源，只有数量达到⼀个阈值才启动合并

D. 　Store是Region服务器的核⼼

点击查看答案

239、下列关于HLog⼯作原理的描述，哪些是正确的?

A. 　分布式环境必须要考虑系统出错。HBase采⽤HLog保证

B. 　HBase系统为每个Region服务器配置了⼀个HLog⽂件

C. 　Zookeeper会实时监测每个Region服务器的状态

D. 　Master⾸先会处理该故障Region服务器上⾯遗留的HLog⽂件

点击查看答案

试题通app下载

类似热门题库

HCIP-openEuler-知识试题复习题库

应用型子网划分填空题

《数据网组建与维护》课程题库

计算机操作员四级

python单选题题目练习题

python选择填空题库练习

全国计算机一级选择题真题

管理信息理论复习题库

通信专业应知应会题库(最终版）

大数据技术理论题库

试题通小程序

试题通app下载

©2016-2024.南通佰易网络科技有限公司
苏ICP备16028519号-2 苏公网安备32061102000302