A、 Scala的优势是提供了REPL(Read-Eval-PrintLoop,交互式解释器),提⾼程序开发效率
B、 Scala兼容Java,运⾏速度快,且能融合到Hadoop⽣态圈中
C、 Scala具备强⼤的并发性,⽀持函数式编程
D、 Scala可以更好地⽀持分布式系统
答案:ABCD
A、 Scala的优势是提供了REPL(Read-Eval-PrintLoop,交互式解释器),提⾼程序开发效率
B、 Scala兼容Java,运⾏速度快,且能融合到Hadoop⽣态圈中
C、 Scala具备强⼤的并发性,⽀持函数式编程
D、 Scala可以更好地⽀持分布式系统
答案:ABCD
A. 运⾏速度快
B. 容易使⽤
C. 通⽤性
D. 运⾏模式单⼀
A. 增加数据量
B. 删除重复数据
C. 提高数据质量
D. 降低存储空间
A. 具有较差的⽔平可扩展性
B. 设置个别属性的索引来实现更快的排序
C. 提供了⼀个⾯向⽂档存储,操作复杂
D. 可以实现替换完成的⽂档(数据)或者⼀些指定的数据字段
A. 电信⾏业:客户离⽹分析
B. 智能机器⼈
C. 零售⾏业:发现关联购买⾏为、进⾏客户群体细分
D. 推荐系统
A. 同⼀个Region不会被分拆到多个Region服务器
B. 为了加快访问速度,.META.表的全部Region都会被保存在内存中
C. ⼀个-ROOT-表可以有多个Region
D. 为了加速寻址,客户端会缓存位置信息,同时,需要解决缓存失效问题
A. Spark最初由美国加州伯克利⼤学(UCBerkeley)的AMP实验室于2009年开发
B. Spark在2014年打破了Hadoop保持的基准排序纪录.
C. Spark⽤⼗分之⼀的计算资源,获得了⽐Hadoop快3倍的速度
D. Spark运⾏模式单⼀
A. 资源管理
B. 任务调度
C. 任务监控
D. 数据即服务
A. 基于⽤户的协同过滤
B. 基于物品的协同过滤
C. 基于⽤户和物品的联合协同过滤
D. 基于商家的协同过滤
A. MapReduce采⽤”分⽽治之”策略
B. MapReduce设计的⼀个理念就是”计算向数据靠拢”
C. MapReduce框架采⽤了Master/Slave架构
D. MapReduce应⽤程序只⽤Java来写
A. 顶点值(Vertexvalue):顶点对应的PR值
B. 出射边(Outedge):只需要表⽰⼀条边,可以不取值
C. 消息(Message):传递的消息
D. ⼊射边(Iutedge):只需要表⽰⼀条边,可以不取值