答案:关联分析
A. 基于⽤户的协同过滤算法(简称UserCF算法)在1992年被提出,是推荐系统中最古⽼的算法
B. UserCF算法符合⼈们对于”趣味相投”的认知
C. 实现UserCF算法的关键步骤是计算⽤户与⽤户之间的兴趣相似度
D. UserCF算法符合兴趣相似的⽤户往往有相同的物品喜好
A. 命名空间的限制
B. 性能的瓶颈
C. 隔离问题
D. 集群的可⽤性
A. 解析⽹页的任务就是分析⼀个页⾯的链接数,但是不赋初值
B. PageRank分配就是多次迭代计算页⾯的PageRank值
C. 收敛阶段的任务就是由⼀个⾮并⾏组件决定是否达到收敛
D. ⼀般判断是否收敛的条件是所有⽹页的PageRank值不再变化,或者运⾏30次以后我们就认为已经收敛了
A. 为⽤户提供了系统底层细节透明的分布式基础架构
B. 具有很好的跨平台特性
C. 可以部署在廉价的计算机集群中
D. 被公认为⾏业⼤数据标准开源软件
A. 利⽤分布式⽂件系统、数据仓库、关系数据库等实现对结构化、半结构化和⾮结构化海量数据的存储和管理
B. 利⽤分布式并⾏编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析
C. 构建隐私数据保护体系和数据安全体系,有效保护个⼈隐私和数据安全
D. 把实时采集的数据作为流计算系统的输⼊,进⾏实时处理分析
A. 结构化数据
B. 半结构化数据
C. 非结构化数据
D. 所有类型数据
A. 存储被拆分的数据块
B. 协调数据计算任务
C. 负责协调集群中的数据存储
D. 负责执⾏由JobTracker指派的任务