A、 UserCF算法的推荐更偏向社会化:适合应⽤于新闻推荐、微博话题推荐等应⽤场景,其推荐结果在新颖性⽅⾯有⼀定的优势
B、 ItemCF算法的推荐更偏向于个性化
C、 ItemCF随着⽤户数⽬的增⼤,⽤户相似度计算复杂度越来越⾼
D、 UserCF推荐结果相关性较弱,难以对推荐结果作出解释,容易受⼤众影响⽽推荐热门物品
答案:C
A、 UserCF算法的推荐更偏向社会化:适合应⽤于新闻推荐、微博话题推荐等应⽤场景,其推荐结果在新颖性⽅⾯有⼀定的优势
B、 ItemCF算法的推荐更偏向于个性化
C、 ItemCF随着⽤户数⽬的增⼤,⽤户相似度计算复杂度越来越⾼
D、 UserCF推荐结果相关性较弱,难以对推荐结果作出解释,容易受⼤众影响⽽推荐热门物品
答案:C
A. Storm将Streams的状态转换过程抽象为Spout
B. Storm认为每个Stream都有⼀个源头,并把这个源头抽象为Spout
C. Storm将Spouts和Bolts组成的⽹络抽象成Topology
D. Topology⾥⾯的每个处理组件(Spout或Bolt)都包含处理逻辑,⽽组件之间的连接则表⽰数据流动的⽅向
A. 数据可视化是指将⼤型数据集中的数据以图形图像形式表⽰
B. 数据可视化技术的基本思想是将数据库中每⼀个数据项作为单个图元素表⽰
C. 利⽤数据分析和开发⼯具发现其中未知信息的处理过程
D. 将数据的各个属性值以⼀维数据的形式表⽰
A. 数据起始位置
B. 数据长度
C. 数据所在节点
D. 数据⼤⼩
A. 按需服务
B. 随时服务
C. 通⽤性
D. 价格不菲
A. 第⼀阶段:解析⽹页
B. 第⼆阶段:PageRank分配
C. 第三阶段:收敛阶段
D. 第⼀阶段:收集⽹页
A. 创建表的时候,可以通过HColumnDescriptor.setInMemory(true)将表放到Region服务器的缓存中,保证在读取的时候被cache命中
B. 创建表的时候,可以通过HColumnDescriptor.setMaxVersions(intmaxVersions)设置表中数据的最⼤版本,如果只需要保存最新版本的数据,那么可以设置setMaxVersions(1)
C. 创建表的时候,可以通过HColumnDescriptor.setTimeToLive(inttimeToLive)设置表中数据的存储⽣命期
D. 如果最近写⼊HBase表中的数据是最可能被访问的,可以考虑将时间戳作为⾏键的⼀部分
A. 使⽤DAG执⾏引擎以⽀持循环数据流与内存计算
B. 可运⾏于独⽴的集群模式中,可运⾏于Hadoop中,也可运⾏于AmazonEC2等云环境中
C. ⽀持使⽤Scala、Java、Python和R语⾔进⾏编程,但是不可以通过SparkShell进⾏交互式编程
D. Spark提供了内存计算,可将中间结果放到内存中,对于迭代计算效率更⾼
A. Mnesia是⼀个分布式数据库管理系统
B. Mnesia的数据库模式(schema)只能在未运⾏前静态重配置
C. Mnesia的这些特性,使其在开发云数据库时被⽤来提供分布式数据库服务
D. Mnesia⽀持事务,⽀持透明的数据分⽚
A. 关系数据库以完善的关系代数理论作为基础,有严格的标准
B. 关系数据库可扩展性较差,⽆法较好⽀持海量数据存储
C. NoSQL可以⽀持超⼤规模数据存储
D. NoSQL数据库缺乏数学理论基础,复杂查询性能不⾼
A. ⽤户建模模块
B. 推荐对象建模模块
C. 推荐算法模块
D. 数据采集模块