A、 ⼀个企业当中同时存在各种不同的业务应⽤场景,需要采⽤不同的计算框架
B、 为了避免不同类型应⽤之间互相⼲扰,企业就需要把内部的服务器拆分成多个集群,分别安装运⾏不同的计算框架,即”⼀个框架⼀个集群”
C、 这些产品通常来⾃不同的开发团队,具有各⾃的资源调度管理机制
D、 解决单点故障
答案:ABC
A、 ⼀个企业当中同时存在各种不同的业务应⽤场景,需要采⽤不同的计算框架
B、 为了避免不同类型应⽤之间互相⼲扰,企业就需要把内部的服务器拆分成多个集群,分别安装运⾏不同的计算框架,即”⼀个框架⼀个集群”
C、 这些产品通常来⾃不同的开发团队,具有各⾃的资源调度管理机制
D、 解决单点故障
答案:ABC
A. 表达能⼒有限
B. 磁盘IO开销⼤
C. 延迟⾼
D. 在前⼀个任务执⾏完成之前,其他任务就⽆法开始,难以胜任复杂、多阶段的计算任务
A. 关键字
B. ⾏键
C. 列族
D. 时间戳
A. 间断性
B. 原⼦性
C. ⼀致性
D. 持久性
A. 运⾏速度快
B. 容易使⽤
C. 通⽤性
D. 运⾏模式单⼀
A. 为⽤户提供了系统顶层分布式基础架构
B. 具有较差的跨平台特性
C. 可以部署在廉价的计算机集群中
D. 被公认为⾏业⼤数据标准开源软件
A. 全局计算
B. 局部计算
C. 通讯
D. 栅栏同步
A. 复杂性:部署、管理、配置很复杂
B. 数据库复制:MySQL主备之间采⽤复制⽅式,只能是异步复制
C. 扩容问题:如果系统压⼒过⼤需要增加新的机器,这个过程涉及数据重新划分
D. 动态数据迁移问题:如果某个数据库组压⼒过⼤,需要将其中部分数据迁移出去
A. Client
B. JobTracker
C. TaskTracker
D. Task
A. 基于物品的协同过滤算法(简称ItemCF算法)是⽬前业界应⽤最多的算法
B. ItemCF算法是给⽬标⽤户推荐那些和他们之前喜欢的物品相似的物品
C. ItemCF算法通过建⽴⽤户到物品倒排表(每个⽤户喜欢的物品的列表)来计算物品相似度
D. UserCF算法推荐的是那些和⽬标⽤户有共同兴趣爱好的其他⽤户所喜欢的物品
A. ⼀个RDD就是⼀个分布式对象集合,本质上是⼀个只读的分区记录集合
B. 每个RDD可分成多个分区,每个分区就是⼀个数据集⽚段
C. RDD是可以直接修改的
D. RDD提供了⼀种⾼度受限的共享内存模型