A、 静态数据
B、 实时数据流
C、 历史数据
D、 结构化数据
答案:B
A、 静态数据
B、 实时数据流
C、 历史数据
D、 结构化数据
答案:B
A. ⽤户建模模块:对⽤户进⾏建模,根据⽤户⾏为数据和⽤户属性数据来分析⽤户的兴趣和需求
B. 推荐对象建模模块:根据对象数据对推荐对象进⾏建模
C. 推荐算法模块:基于⽤户特征和物品特征,采⽤推荐算法计算得到⽤户可能感兴趣的对象
D. 推荐算法模块:根据推荐场景对推荐结果进⾏⼀定调整,将推荐结果最终展⽰给⽤户
A. DougCutting
B. Lucene
C. Apache
D. MapReduce
A. 基于物品和商家的联合协同推荐
B. 基于统计的推荐
C. 专家推荐
D. 基于内容的推荐
A. 从磁盘或从⽹络读取数据,即IO密集⼯作
B. 计算数据,即CPU密集⼯作
C. 针对不同的⼯作节点选择合适硬件类型
D. 负责协调集群中的数据存储
A. 顶点的当前值
B. 以该顶点为起点的出射边列表,每条出射边包含了⽬标顶点ID和边的值
C. 消息队列,包含了所有接收到的、发送给该顶点的消息
D. 标志位,⽤来标记顶点是否处于活跃状态
A. 为特定的图应⽤定制相应的分布式实现:通⽤性不好
B. 基于现有的分布式计算平台进⾏图计算:在性能和易⽤性⽅⾯往往⽆法达到最优
C. 使⽤单机的图算法库,但是,在可以解决的问题的规模⽅⾯具有很⼤的局限性
D. 使⽤已有的并⾏图计算系统,但是,对⼤规模分布式系统⾮常重要的⼀些⽅⾯(⽐如容错),⽆法提供较好的⽀持
A. ”摩尔定律”,CPU性能⼤约每隔18个⽉翻⼀番
B. 分布式程序运⾏在⼤规模计算机集群上
C. ⾕歌公司最先提出了分布式并⾏编程模型MapReduce
D. MapReduce是Hadoop的开源实现
A. UserCF算法的推荐更偏向社会化:适合应⽤于新闻推荐、微博话题推荐等应⽤场景,其推荐结果在新颖性⽅⾯有⼀定的优势
B. ItemCF算法的推荐更偏向于个性化
C. ItemCF随着⽤户数⽬的增⼤,⽤户相似度计算复杂度越来越⾼
D. UserCF推荐结果相关性较弱,难以对推荐结果作出解释,容易受⼤众影响⽽推荐热门物品
A. RDD(ResillientDistributedDataset)是运⾏在⼯作节点(WorkerNode)的⼀个进程,负责运⾏Task
B. Application是⽤户编写的Spark应⽤程序
C. ⼀个Job包含多个RDD及作⽤于相应RDD上的各种操作
D. DirectedAcyclicGraph反映RDD之间的依赖关系
A. 实时获取来⾃不同数据源的海量数据,经过实时分析处理,获得有价值的信息
B. 流计算秉承⼀个基本理念,即数据的价值随着时间的流逝⽽降低
C. 对于⼀个流计算系统来说,它应该⽀持TB级甚⾄是PB级的数据规模
D. 流计算只需要保证较低的延迟时间,即只达到秒级别即可处理⼀切问题