A、 基于⽤户的协同过滤算法(简称UserCF算法)在1992年被提出,是推荐系统中最古⽼的算法
B、 UserCF算法符合⼈们对于”趣味相投”的认知
C、 实现UserCF算法的关键步骤是计算⽤户与⽤户之间的兴趣相似度
D、 UserCF算法符合兴趣相似的⽤户往往有相同的物品喜好
答案:ABD
A、 基于⽤户的协同过滤算法(简称UserCF算法)在1992年被提出,是推荐系统中最古⽼的算法
B、 UserCF算法符合⼈们对于”趣味相投”的认知
C、 实现UserCF算法的关键步骤是计算⽤户与⽤户之间的兴趣相似度
D、 UserCF算法符合兴趣相似的⽤户往往有相同的物品喜好
答案:ABD
A. 利⽤分布式⽂件系统、数据仓库、关系数据库等实现对结构化、半结构化和⾮结构化海量数据的存储和管理
B. 利⽤分布式并⾏编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析
C. 构建隐私数据保护体系和数据安全体系,有效保护个⼈隐私和数据安全
D. 把实时采集的数据作为流计算系统的输⼊,进⾏实时处理分析
A. ⾕歌公司的制图服务接⼝GoogleChartAPI,可以⽤来为统计数据并⾃动⽣成图⽚
B. D3是最流⾏的可视化库之⼀,是⼀个⽤于⽹页作图、⽣成互动图形的JavaScrip函数库
C. Visual.ly可以⽤它来快速创建⾃定义的、样式美观且具有强烈视觉冲击⼒的信息图表
D. ⼤数据魔镜是⼀款优秀的国产数据分析软件,它丰富的数据公式和算法可以让⽤户真正理解探索分析数据
A. 原⼦性
B. 持久性
C. 间断性
D. ⼀致性
A. 负责数据的存储和读取
B. 根据客户端或者是名称节点的调度来进⾏数据的存储和检索
C. 向名称节点定期发送⾃⼰所存储的块的列表
D. ⽤来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间
A. 库函数:链接到每个客户端
B. ⼀个Master主服务器
C. 许多个Region服务器
D. 部署在廉价的计算机集群中
A. 互联⽹
B. 云计算
C. ⼤数据
D. 物联⽹
A. 单点故障问题
B. 不可以⽔平扩展
C. 单个名称节点难以提供不同程序之间的隔离性
D. 系统整体性能受限于单个名称节点的吞吐量
A. Pig
B. Spark
C. Kafka
D. DN8
A. 关键字
B. ⾏键
C. 列族
D. 时间戳
A. ⾼效的容错性
B. 中间结果持久化到内存,数据在内存中的多个
C. 存放的数据可以是Java对象,避免了不必要的对象序列化和反序列化
D. 现有容错机制:数据复制或者记录⽇志