A、 Spark最初由美国加州伯克利⼤学(UCBerkeley)的AMP实验室于2009年开发
B、 Spark在2014年打破了Hadoop保持的基准排序纪录.
C、 Spark⽤⼗分之⼀的计算资源,获得了⽐Hadoop快3倍的速度
D、 Spark运⾏模式单⼀
答案:D
A、 Spark最初由美国加州伯克利⼤学(UCBerkeley)的AMP实验室于2009年开发
B、 Spark在2014年打破了Hadoop保持的基准排序纪录.
C、 Spark⽤⼗分之⼀的计算资源,获得了⽐Hadoop快3倍的速度
D、 Spark运⾏模式单⼀
答案:D
A. ⽀持⼤规模⽂件存储
B. 简化系统设计
C. 适合数据备份
D. ⽀持中等规模⽂件存储
A. 基于⽤户的协同过滤算法(简称UserCF算法)在1992年被提出,是推荐系统中最古⽼的算法
B. UserCF算法符合⼈们对于”趣味相投”的认知
C. 实现UserCF算法的关键步骤是计算⽤户与⽤户之间的兴趣相似度
D. UserCF算法符合兴趣相似的⽤户往往有相同的物品喜好
A. 强⼤的跨平台兼容性
B. ⽀持⼤规模⽂件存储
C. 简化系统设计
D. 适合数据备份
A. 表达能⼒有限
B. 磁盘IO开销⼤
C. 延迟⾼
D. 在前⼀个任务执⾏完成之前,其他任务就⽆法开始,难以胜任复杂、多阶段的计算任务
A. 批量计算:充裕时间处理静态数据,如Hadoop
B. 静态数据不适合采⽤批量计算,因为它不适合⽤传统的关系模型建模
C. 流数据必须采⽤实时计算
D. 流数据的响应时间为秒级
A. 电信⾏业:客户离⽹分析
B. 智能机器⼈
C. 零售⾏业:发现关联购买⾏为、进⾏客户群体细分
D. 推荐系统
A. 复杂的批量数据处理:通常时间跨度在数⼗分钟到数⼩时之间
B. 基于历史数据的交互式查询:通常时间跨度在数⼗秒到数分钟之间
C. 基于实时数据流的数据处理:通常时间跨度在数⼗秒到数分钟之间
D. 基于实时数据流的数据处理:通常时间跨度在数百毫秒到数秒之间
解析:答案解析
A. 风险评估与管理
B. 客户行为分析
C. 交易系统优化
D. 传统柜台业务