A、 ⾼可扩展性
B、 ⽀持多种编程语⾔
C、 成本低
D、 运⾏在Linux平台上
答案:ABCD
A、 ⾼可扩展性
B、 ⽀持多种编程语⾔
C、 成本低
D、 运⾏在Linux平台上
答案:ABCD
A. 为海量数据提供存储的HDFS和对数据进⾏计算的MapReduce
B. 提供整个HDFS⽂件系统的NameSpace(命名空间)管理、块管理等所有服务
C. Hadoop不仅可以运⾏在企业内部的集群中,也可以运⾏在云计算环境中
D. Hadoop被视为事实上的⼤数据处理标准
A. Scala的优势是提供了REPL(Read-Eval-PrintLoop,交互式解释器),提⾼程序开发效率
B. Scala兼容Java,运⾏速度快,且能融合到Hadoop⽣态圈中
C. Scala具备强⼤的并发性,⽀持函数式编程
D. Scala可以更好地⽀持分布式系统
A. 动态可扩展
B. ⾼可⽤性
C. 免维护
D. 安全
A. 通过单个⾏健访问
B. 通过时间戳访问
C. 通过⼀个⾏健的区间来访问
D. 全表扫描
A. MapReduce默认1000MB缓存
B. 多个溢写⽂件归并成⼀个或多个⼤⽂件,⽂件中的键值对是排序的
C. 当数据很少时,不需要溢写到磁盘,直接在缓存中归并,然后输出给Reduce
D. 每个Map任务分配多个缓存,使得任务运⾏更有效率
A. CA:也就是强调⼀致性(C)和可⽤性(A),放弃分区容忍性(P)
B. CP:也就是强调⼀致性(C)和分区容忍性(P),放弃可⽤性(A)
C. AP:也就是强调可⽤性(A)和分区容忍性(P),放弃⼀致性(C)
D. CAP:也就是同时兼顾可⽤性(A)、分区容忍性(P)和⼀致性(C),当时系统性能会下降很多
A. 充分利⽤主从库实现⽤户读写操作的分离,实现负载均衡
B. UMP系统实现了对于⽤户透明的读写分离功能
C. UMP采⽤的两种资源隔离⽅式(⽤Cgroup限制MySQL进程资源和在Proxy服务器端限制QPS)
D. UMP系统只设计了⼀种机制来保证数据安全
A. 只⽀持少数⼏种编程语⾔
B. 可扩展性⾼
C. 成本低
D. 能在linux上运⾏
A. 批量计算:充裕时间处理静态数据,如Hadoop
B. 静态数据不适合采⽤批量计算,因为它不适合⽤传统的关系模型建模
C. 流数据必须采⽤实时计算
D. 流数据的响应时间为秒级
A. 基于物品和商家的联合协同推荐
B. 基于统计的推荐
C. 专家推荐
D. 基于内容的推荐