A、 从分布式⽂件系统读⼊数据
B、 执⾏Map任务输出中间结果
C、 通过Shuffle阶段把中间结果分区排序整理后发送给Reduce任务
D、 执⾏Reduce任务得到最终结果并写⼊分布式⽂件系统
答案:ABCD
A、 从分布式⽂件系统读⼊数据
B、 执⾏Map任务输出中间结果
C、 通过Shuffle阶段把中间结果分区排序整理后发送给Reduce任务
D、 执⾏Reduce任务得到最终结果并写⼊分布式⽂件系统
答案:ABCD
A. UserCF算法的推荐更偏向社会化:适合应⽤于新闻推荐、微博话题推荐等应⽤场景,其推荐结果在新颖性⽅⾯有⼀定的优势
B. ItemCF算法的推荐更偏向于个性化
C. ItemCF随着⽤户数⽬的增⼤,⽤户相似度计算复杂度越来越⾼
D. UserCF推荐结果相关性较弱,难以对推荐结果作出解释,容易受⼤众影响⽽推荐热门物品
A. 开发⼯具
B. 开源软件
C. 商业化⼯具
D. 数据采集
A. Hadoop⽣态系统中各个组件和其他产品之间缺乏统⼀的、⾼效的数据交换中介
B. 不同的MapReduce任务之间存在重复操作,降低了效率
C. 延迟⾼,⽽且不适合执⾏迭代计算
D. 抽象层次低,需要⼿⼯编写⼤量代码
A. 处理客户端请求
B. 监控NodeManager
C. 资源分配与调度
D. 处理来⾃ApplicationMaster的命令
A. 抽象层次⾼
B. 表达能⼒有限,抽象层次低,需⼈⼯编码
C. 价格昂贵
D. 可维护性低
A. 所有的数据交换都是通过MapReduce框架⾃⾝去实现的
B. 不同的Map任务之间会进⾏通信
C. 不同的Reduce任务之间可以发⽣信息交换
D. ⽤户可以显式地从⼀台机器向另⼀台机器发送消息
A. 推荐系统可以创造全新的商业和经济模式,帮助实现长尾商品的销售
B. ”长尾”概念于2004年提出,⽤来描述以亚马逊为代表的电⼦商务⽹站的商业和经济模式
C. 可以通过发掘长尾商品并推荐给感兴趣的⽤户来提⾼销售额
D. 热门推荐的主要缺陷在于推荐的范围有限,所推荐的内容在⼀定时期内也相对固定。⽆法实现长尾商品的推荐
A. ModestMaps是⼀个⼩型、可扩展、交互式的免费库
B. Leaflet是⼀个⼩型化的地图框架,通过⼩型化和轻量化来满⾜移动⽹页的需要
C. GoogleFusionTables让⼀般使⽤者也可以轻松制作出专业的统计地图
D. ⼤数据魔镜是⼀款优秀的国产数据分析软件,它丰富的数据公式和算法可以让⽤户真正理解探索分析数据
A. 智能物流
B. 智能安防
C. 环保监测
D. 数据采集