A、 ⽆论是亚马逊还是Netflix,其推荐系统的基础都是ItemCF算法
B、 ItemCF算法是给⽬标⽤户推荐那些和他们之前喜欢的物品相似的物品
C、 ItemCF算法主要通过分析⽤户的⾏为记录来计算物品之间的相似度
D、 实现UserCF算法的关键步骤是计算物品与物品之间的相似度
答案:D
A、 ⽆论是亚马逊还是Netflix,其推荐系统的基础都是ItemCF算法
B、 ItemCF算法是给⽬标⽤户推荐那些和他们之前喜欢的物品相似的物品
C、 ItemCF算法主要通过分析⽤户的⾏为记录来计算物品之间的相似度
D、 实现UserCF算法的关键步骤是计算物品与物品之间的相似度
答案:D
A. ⼤数据成为⼀种新的决策⽅式
B. ⼤数据应⽤促进信息技术与各⾏业的深度融合
C. ⼤数据开发推动新技术和新应⽤的不断涌现
D. ⼤数据使得数据科学家成为热门职业
A. Client
B. JobTracker
C. TaskTracker
D. Task
A. 数据存储
B. 数据加密
C. 数据理解与分析
D. 数据传输
A. 从分布式⽂件系统读⼊数据
B. 执⾏Map任务输出中间结果
C. 通过Shuffle阶段把中间结果分区排序整理后发送给Reduce任务
D. 执⾏Reduce任务得到最终结果并写⼊分布式⽂件系统
A. 电信⾏业:客户离⽹分析
B. 智能机器⼈
C. 零售⾏业:发现关联购买⾏为、进⾏客户群体细分
D. 推荐系统
A. 流处理系统处理的是实时的数据,⽽传统的数据处理系统处理的是预先存储好的静态数据
B. ⽤户通过流处理系统获取的是实时结果,⽽通过传统的数据处理系统,获取的是过去某⼀时刻的结果
C. 流处理系统⽆需⽤户主动发出查询,实时查询服务可以主动将结果推送给⽤户
D. 传统的数据处理系统系统⽆需⽤户主动发出查询,批量查询服务可以主动将结果推送给⽤户
A. 加快数据传输速度
B. 容易检查数据错误
C. 保证数据可靠性
D. 适合多平台上运⾏
A. 负责数据的存储和读取
B. 根据客户端或者是名称节点的调度来进⾏数据的存储和检索
C. 向名称节点定期发送⾃⼰所存储的块的列表
D. ⽤来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间
A. 数据的准确性
B. 数据处理的延迟
C. 数据存储的容量
D. 数据传输的速度
A. 局部计算:每个参与的处理器都有⾃⾝的计算任务
B. 通讯:处理器群相互交换数据
C. 栅栏同步:当⼀个处理器遇到”路障”(或栅栏),会等到其他所有处理器完成它们的计算步骤
D. 基于现有的分布式计算平台进⾏图计算