A、 不同场景之间输⼊输出数据⽆法做到⽆缝共享,通常需要进⾏数据格式的转换
B、 不同的软件需要不同的开发和维护团队
C、 需要较⾼的使⽤成本
D、 ⽐较难以对同⼀个集群中的各个系统进⾏统⼀的资源协调和分配
答案:ABD
A、 不同场景之间输⼊输出数据⽆法做到⽆缝共享,通常需要进⾏数据格式的转换
B、 不同的软件需要不同的开发和维护团队
C、 需要较⾼的使⽤成本
D、 ⽐较难以对同⼀个集群中的各个系统进⾏统⼀的资源协调和分配
答案:ABD
A. MySQL
B. 阿⾥云RDS
C. OracleCloud
D. 百度云数据库
A. 第⼀阶段:解析⽹页
B. 第⼆阶段:PageRank分配
C. 第三阶段:收敛阶段
D. 第⼀阶段:收集⽹页
A. Storm将Streams的状态转换过程抽象为Spout
B. Storm认为每个Stream都有⼀个源头,并把这个源头抽象为Spout
C. Storm将Spouts和Bolts组成的⽹络抽象成Topology
D. Topology⾥⾯的每个处理组件(Spout或Bolt)都包含处理逻辑,⽽组件之间的连接则表⽰数据流动的⽅向
A. 推荐系统:为⽤户推荐相关商品
B. 物流:基于⼤数据和物联⽹技术的智能物流
C. 智能交通:利⽤交通⼤数据,实现交通实时监控
D. 汽车:⽆⼈驾驶汽车,实时采集车辆各种⾏驶数据和周围环境
A. 数据挖掘
B. 云计算
C. 机器学习
D. 关系型数据库
A. ⽤户编写的MapReduce程序通过Client提交到JobTracker端
B. JobTracker负责资源监控和作业调度
C. TaskTracker监控所有TaskTracker与Job的健康状况
D. TaskTracker使⽤”slot”等量划分本节点上的资源量(CPU、内存等)
A. 负责资源监控和作业调度,监控所有TaskTracker与Job的健康状况
B. 使⽤”slot”等量划分本节点上的资源量(CPU、内存等)
C. 会周期性地通过”⼼跳”将本节点上资源的使⽤情况和任务的运⾏进度汇报给TaskTracker
D. 会跟踪任务的执⾏进度、资源使⽤量等信息,并将这些信息告诉任务(Task)
A. 利⽤多线程来执⾏具体的任务,减少任务的启动开销
B. Executor中有⼀个BlockManager存储模块,有效减少IO开销
C. 提供了⼀种⾼度受限的共享内存模型
D. 不同场景之间输⼊输出数据能做到⽆缝共享
A. Scala语法复杂,但是能提供优雅的API计算
B. Scala具备强⼤的并发性,⽀持函数式编程,可以更好地⽀持分布式系统
C. Scala兼容Java,运⾏速度快,且能融合到Hadoop⽣态圈中
D. Scala是Spark的主要编程语⾔
A. 协同过滤可分为基于⽤户的协同过滤和基于物品的协同过滤
B. UserCF算法符合⼈们对于”趣味相投”的认知,即兴趣相似的⽤户往往有相同的物品喜好
C. 实现UserCF算法的关键步骤是计算物品与物品之间的相似度
D. 基于物品的协同过滤算法(简称ItemCF算法)是⽬前业界应⽤最多的算法