A、 专家推荐:⼈⼯推荐,由资深的专业⼈⼠来进⾏物品的筛选和推荐,需要较多的⼈⼒成本性
B、 基于统计的推荐:通过机器学习的⽅法去描述内容的特征,并基于内容的特征来发现与之相似的内容
C、 协同过滤推荐:应⽤最早和最为成功的推荐⽅法之⼀
D、 混合推荐:结合多种推荐算法来提升推荐效果
答案:B
A、 专家推荐:⼈⼯推荐,由资深的专业⼈⼠来进⾏物品的筛选和推荐,需要较多的⼈⼒成本性
B、 基于统计的推荐:通过机器学习的⽅法去描述内容的特征,并基于内容的特征来发现与之相似的内容
C、 协同过滤推荐:应⽤最早和最为成功的推荐⽅法之⼀
D、 混合推荐:结合多种推荐算法来提升推荐效果
答案:B
A. 观测、跟踪数据
B. 分析数据
C. 辅助理解数据
D. 增强数据吸引⼒
A. 数据挖掘
B. 云计算
C. 机器学习
D. 关系型数据库
A. UserCF算法推荐的是那些和⽬标⽤户有共同兴趣爱好的其他⽤户所喜欢的物品
B. ItemCF算法推荐的是那些和⽬标⽤户之前喜欢的物品类似的其他物品
C. ItemCF算法的推荐更偏向社会化,⽽UserCF算法的推荐更偏向于个性化
D. ItemCF算法倾向于推荐与⽤户已购买商品相似的商品,往往会出现多样性不⾜、推荐新颖度较低的问题
A. 该顶点的当前值
B. ⼀个接收到的消息的迭代器
C. ⼀个出射边的迭代器
D. ⼀个⼊射边的迭代器
A. 处理⼤规模数据的脚本语⾔
B. ⼯作流和协作服务引擎,协调Hadoop上运⾏的不同任务
C. ⽀持DAG作业的计算框架
D. 基于内存的分布式并⾏编程框架,具有较⾼的实时性,并且较好⽀持迭代计算
A. Zookeeper⽂件记录了⽤户数据表的Region位置信息
B. -ROOT-表记录了.META.表的Region位置信息
C. .META.表保存了HBase中所有⽤户数据表的Region位置信息
D. Zookeeper⽂件记录了-ROOT-表的位置信息
A. 相对于Spark来说,使⽤Hadoop进⾏迭代计算⾮常耗资源
B. Spark将数据载⼊内存后,之后的迭代计算都可以直接使⽤内存中的中间结果作运算,避免了从磁盘中频繁读取数据
C. Hadoop的设计遵循”⼀个软件栈满⾜不同应⽤场景”的理念
D. Spark可以部署在资源管理器YARN之上,提供⼀站式的⼤数据解决⽅案
A. 64MB
B. 32MB
C. 128MB
D. 16MB
A. HadoopJob对应StormTopology
B. HadoopTaskTracker对应StormSupervisor
C. HadoopJobTracker对应StormSpout
D. HadoopReduce对应StormBolt
A. 数据快速持续到达,潜在⼤⼩也许是⽆穷⽆尽的
B. 数据来源众多,格式复杂
C. 注重数据的整体价值,不过分关注个别数据
D. 系统可以控制将要处理的新到达的数据元素的顺序