A、 UserCF算法推荐的是那些和⽬标⽤户有共同兴趣爱好的其他⽤户所喜欢的物品
B、 ItemCF算法推荐的是那些和⽬标⽤户之前喜欢的物品类似的其他物品
C、 UserCF算法的推荐更偏向个性化
D、 UserCF随着⽤户数⽬的增⼤,⽤户相似度计算复杂度越来越⾼
答案:C
A、 UserCF算法推荐的是那些和⽬标⽤户有共同兴趣爱好的其他⽤户所喜欢的物品
B、 ItemCF算法推荐的是那些和⽬标⽤户之前喜欢的物品类似的其他物品
C、 UserCF算法的推荐更偏向个性化
D、 UserCF随着⽤户数⽬的增⼤,⽤户相似度计算复杂度越来越⾼
答案:C
A. 扩展性好,灵活性好
B. ⼤量写操作时性能⾼
C. ⽆法存储结构化信息
D. 条件查询效率⾼
A. 分布式⽂件系统
B. 流数据读写
C. 资源管理和调度器
D. Hadoop上的数据仓库
A. ⽤户建模模块
B. 数据采集模块
C. 推荐对象建模模块
D. 推荐算法模块
A. 原⼦性
B. 持久性
C. 间断性
D. ⼀致性
A. 开发⼯具
B. 开源软件
C. 商业化⼯具
D. 数据采集
A. ⼀个RDD就是⼀个分布式对象集合,本质上是⼀个只读的分区记录集合
B. 每个RDD可分成多个分区,每个分区就是⼀个数据集⽚段
C. RDD是可以直接修改的
D. RDD提供了⼀种⾼度受限的共享内存模型
A. 数据的”⼤量化”
B. 数据的”快速化”
C. 数据的”多样化”
D. 数据的”价值化”
A. 从磁盘或从⽹络读取数据,即IO密集⼯作
B. 计算数据,即CPU密集⼯作
C. 针对不同的⼯作节点选择合适硬件类型
D. 负责协调集群中的数据存储
A. 识别和感知技术
B. ⽹络与通信技术
C. 数据挖掘与融合技术
D. 信息处理⼀体化技术
A. 相对于Spark来说,使⽤Hadoop进⾏迭代计算⾮常耗资源
B. Spark将数据载⼊内存后,之后的迭代计算都可以直接使⽤内存中的中间结果作运算,避免了从磁盘中频繁读取数据
C. Hadoop的设计遵循”⼀个软件栈满⾜不同应⽤场景”的理念
D. Spark可以部署在资源管理器YARN之上,提供⼀站式的⼤数据解决⽅案