A、 R是属于GNU系统的⼀个⾃由、免费、源代码开放的软件
B、 Weka主要⽤于社交图谱数据可视化分析,可以⽣成⾮常酷炫的可视化图形
C、 Gephi主要⽤于社交图谱数据可视化分析,可以⽣成⾮常酷炫的可视化图形
D、 R通常⽤于⼤数据集的统计与分析
答案:B
A、 R是属于GNU系统的⼀个⾃由、免费、源代码开放的软件
B、 Weka主要⽤于社交图谱数据可视化分析,可以⽣成⾮常酷炫的可视化图形
C、 Gephi主要⽤于社交图谱数据可视化分析,可以⽣成⾮常酷炫的可视化图形
D、 R通常⽤于⼤数据集的统计与分析
答案:B
A. 数据质量问题
B. 数据安全问题
C. 数据传输速度问题
D. 数据类型单一问题
A. ⽤户建模模块
B. 数据采集模块
C. 推荐对象建模模块
D. 推荐算法模块
A. Hadoop⽣态系统中各个组件和其他产品之间缺乏统⼀的、⾼效的数据交换中介
B. 不同的MapReduce任务之间存在重复操作,降低了效率
C. 延迟⾼,⽽且不适合执⾏迭代计算
D. 抽象层次低,需要⼿⼯编写⼤量代码
A. MapReduce默认1000MB缓存
B. 多个溢写⽂件归并成⼀个或多个⼤⽂件,⽂件中的键值对是排序的
C. 当数据很少时,不需要溢写到磁盘,直接在缓存中归并,然后输出给Reduce
D. 每个Map任务分配多个缓存,使得任务运⾏更有效率
A. 基于⽤户的协同过滤算法(简称UserCF算法)在1992年被提出,是推荐系统中最古⽼的算法
B. UserCF算法符合⼈们对于”趣味相投”的认知
C. 实现UserCF算法的关键步骤是计算⽤户与⽤户之间的兴趣相似度
D. UserCF算法符合兴趣相似的⽤户往往有相同的物品喜好
A. HadoopMapReduce是MapReduce的开源实现,后者⽐前者使⽤门槛低很多
B. MapReduce⾮共享式,容错性好
C. MapReduce批处理、实时、数据疏散型
D. MapReduce采⽤”分⽽治之”策略
A. 强⼤的跨平台兼容性
B. ⽀持⼤规模⽂件存储
C. 简化系统设计
D. 适合数据备份
A. ⽬录
B. ⽂件
C. 块
D. 磁盘
A. 从磁盘或从⽹络读取数据,即IO密集⼯作
B. 计算数据,即CPU密集⼯作
C. 针对不同的⼯作节点选择合适硬件类型
D. 负责协调集群中的数据存储