A、 Scala语法复杂,但是能提供优雅的API计算
B、 Scala具备强⼤的并发性,⽀持函数式编程,可以更好地⽀持分布式系统
C、 Scala兼容Java,运⾏速度快,且能融合到Hadoop⽣态圈中
D、 Scala是Spark的主要编程语⾔
答案:A
A、 Scala语法复杂,但是能提供优雅的API计算
B、 Scala具备强⼤的并发性,⽀持函数式编程,可以更好地⽀持分布式系统
C、 Scala兼容Java,运⾏速度快,且能融合到Hadoop⽣态圈中
D、 Scala是Spark的主要编程语⾔
答案:A
A. 间断性
B. 原⼦性
C. ⼀致性
D. 持久性
A. 帮助NameNode收集⽂件系统运⾏的状态信息
B. 负责执⾏由JobTracker指派的任务
C. 协调数据计算任务
D. 负责协调集群中的数据存储
A. 不存在单点故障
B. JobTracker”⼤包⼤揽”导致任务过重
C. 容易出现内存溢出(分配资源只考虑MapReduce任务数,不考虑CPU、内存)
D. 资源划分不合理(强制划分为slot,包括Mapslot和Reduceslot)
A. RDS是阿⾥云提供的关系型数据库服务
B. RDS由专业数据库管理团队维护
C. RDS具有安全稳定、数据可靠、⾃动备份
D. RDS实例,是⽤户购买RDS服务的基本单位。在实例中,⽤户只能创建⼀个数据库
A. 资源管理
B. 任务调度
C. 任务监控
D. 数据即服务
A. 互联⽹
B. 云计算
C. ⼤数据
D. 物联⽹
A. 所有的数据交换都是通过MapReduce框架⾃⾝去实现的
B. 不同的Map任务之间会进⾏通信
C. 不同的Reduce任务之间可以发⽣信息交换
D. ⽤户可以显式地从⼀台机器向另⼀台机器发送消息
A. 实现⼀键式安装和配置、线程级别的任务监控和告警
B. 降低硬件集群、软件维护、任务监控和应⽤开发的难度
C. 便于做成统⼀的硬件、计算平台资源池
D. 不⽤负载应⽤混搭,集群利⽤率⾼
A. ⾼性能:处理⼤数据的基本要求,如每秒处理⼏⼗万条数据
B. 实时性:保证较低的延迟时间,达到秒级别,甚⾄是毫秒级别
C. 分布式:⽀持⼤数据的基本架构,必须能够平滑扩展
D. 可靠性:能可靠地处理流数据