A、 Scala的优势是提供了REPL(Read-Eval-PrintLoop,交互式解释器),提⾼程序开发效率
B、 Scala兼容Java,运⾏速度快,且能融合到Hadoop⽣态圈中
C、 Scala具备强⼤的并发性,⽀持函数式编程
D、 Scala可以更好地⽀持分布式系统
答案:ABCD
A、 Scala的优势是提供了REPL(Read-Eval-PrintLoop,交互式解释器),提⾼程序开发效率
B、 Scala兼容Java,运⾏速度快,且能融合到Hadoop⽣态圈中
C、 Scala具备强⼤的并发性,⽀持函数式编程
D、 Scala可以更好地⽀持分布式系统
答案:ABCD
A. 分布式并⾏编程模型
B. 流计算框架
C. Hadoop上的⼯作流管理系统
D. 提供分布式协调⼀致性服务
A. 使⽤DAG执⾏引擎以⽀持循环数据流与内存计算
B. 可运⾏于独⽴的集群模式中,可运⾏于Hadoop中,也可运⾏于AmazonEC2等云环境中
C. ⽀持使⽤Scala、Java、Python和R语⾔进⾏编程,但是不可以通过SparkShell进⾏交互式编程
D. Spark提供了内存计算,可将中间结果放到内存中,对于迭代计算效率更⾼
A. 流数据层(Kafka)
B. 执⾏层(YARN)
C. 处理层(SamzaAPI)
D. 数据采集层(Scribe)
A. 推荐系统:为⽤户推荐相关商品
B. 物流:基于⼤数据和物联⽹技术的智能物流
C. 智能交通:利⽤交通⼤数据,实现交通实时监控
D. 汽车:⽆⼈驾驶汽车,实时采集车辆各种⾏驶数据和周围环境
A. 顶点的当前值
B. 消息队列
C. 标志位
D. ⼀个接收到的消息的迭代器
A. 推荐系统是⼤数据在互联⽹领域的典型应⽤
B. 推荐系统是⾃动联系⽤户和物品的⼀种⼯具
C. 推荐系统可以创造全新的商业和经济模式,帮助实现长尾商品的销售
D. 推荐系统分为基于物品的协同过滤和基于商家的协同过滤
A. ⽀持⼤规模⽂件存储
B. 简化系统设计
C. 适合数据备份
D. ⽀持中等规模⽂件存储
A. HDFS采⽤具体的块概念,具有⽀持⼤规模⽂件存储、简化系统设计
B. HDFS采⽤了主从(Master/Slave)结构模型
C. HDFS采⽤了冗余数据存储,增强了数据可靠性
D. HDFS还采⽤了相应的数据存放、数据读取和数据复制策略,来提升系统整体读写响应性能
A. 帮助NameNode收集⽂件系统运⾏的状态信息
B. 负责执⾏由JobTracker指派的任务
C. 协调数据计算任务
D. 负责协调集群中的数据存储
A. ⼑⽚服务器、⾼速⽹、SAN,价格贵,扩展性差上
B. 共享式(共享内存/共享存储),容错性好
C. what-how,难
D. 实时、细粒度计算、计算密集型