A、 协同过滤可分为基于⽤户的协同过滤和基于物品的协同过滤
B、 UserCF算法符合⼈们对于”趣味相投”的认知,即兴趣相似的⽤户往往有相同的物品喜好
C、 实现UserCF算法的关键步骤是计算物品与物品之间的相似度
D、 基于物品的协同过滤算法(简称ItemCF算法)是⽬前业界应⽤最多的算法
答案:C
A、 协同过滤可分为基于⽤户的协同过滤和基于物品的协同过滤
B、 UserCF算法符合⼈们对于”趣味相投”的认知,即兴趣相似的⽤户往往有相同的物品喜好
C、 实现UserCF算法的关键步骤是计算物品与物品之间的相似度
D、 基于物品的协同过滤算法(简称ItemCF算法)是⽬前业界应⽤最多的算法
答案:C
A. Scala语法复杂,但是能提供优雅的API计算
B. Scala具备强⼤的并发性,⽀持函数式编程,可以更好地⽀持分布式系统
C. Scala兼容Java,运⾏速度快,且能融合到Hadoop⽣态圈中
D. Scala是Spark的主要编程语⾔
A. 处理⼤规模数据的脚本语⾔
B. ⼯作流和协作服务引擎,协调Hadoop上运⾏的不同任务
C. ⽀持DAG作业的计算框架
D. 基于内存的分布式并⾏编程框架,具有较⾼的实时性,并且较好⽀持迭代计算
A. 按需服务
B. 随时服务
C. 通⽤性
D. 价格不菲
A. 流数据层(Kafka)
B. 执⾏层(YARN)
C. 处理层(SamzaAPI)
D. 数据采集层(Scribe)
A. 基于⽤户的协同过滤
B. 基于物品的协同过滤
C. 基于⽤户和物品的联合协同过滤
D. 基于商家的协同过滤
A. 基于历史数据的数据挖掘
B. 图结构数据的处理
C. 基于历史数据的交互式查询
D. 基于实时数据流的数据处理
A. 间断性
B. 原⼦性
C. ⼀致性
D. 持久性
A. 常常表现出⽐较差的内存访问局部性
B. 针对单个顶点的处理⼯作过少
C. 计算过程中伴随着并⾏度的改变
D. 计算过程简易