A、 只⽀持少数⼏种编程语⾔
B、 可扩展性⾼
C、 成本低
D、 能在linux上运⾏
答案:A
A、 只⽀持少数⼏种编程语⾔
B、 可扩展性⾼
C、 成本低
D、 能在linux上运⾏
答案:A
A. Master-status(⾃带)
B. Ganglia
C. OpenTSDB
D. Ambari
A. 数据是规则的
B. 性能好(⾼并发)
C. 缺乏统⼀的查询语法
D. 复杂性低
A. ResourceManager
B. NodeManager
C. ApplicationMaster
D. DataManager
A. CA:也就是强调⼀致性(C)和可⽤性(A),放弃分区容忍性(P)
B. CP:也就是强调⼀致性(C)和分区容忍性(P),放弃可⽤性(A)
C. AP:也就是强调可⽤性(A)和分区容忍性(P),放弃⼀致性(C)
D. CAP:也就是同时兼顾可⽤性(A)、分区容忍性(P)和⼀致性(C),当时系统性能会下降很多
A. Hadoop擅长批处理,不适合流计算
B. MapReduce是专门⾯向静态数据的批量处理的
C. Hadoop设计的初衷是⾯向⼤规模数据的批量处理
D. MapReduce不适合⽤于处理持续到达的动态数据
A. 创建表的时候,可以通过HColumnDescriptor.setInMemory(true)将表放到Region服务器的缓存中,保证在读取的时候被cache命中
B. 创建表的时候,可以通过HColumnDescriptor.setMaxVersions(intmaxVersions)设置表中数据的最⼤版本,如果只需要保存最新版本的数据,那么可以设置setMaxVersions(1)
C. 创建表的时候,可以通过HColumnDescriptor.setTimeToLive(inttimeToLive)设置表中数据的存储⽣命期
D. 如果最近写⼊HBase表中的数据是最可能被访问的,可以考虑将时间戳作为⾏键的⼀部分
A. 基于⽤户的协同过滤
B. 基于物品的协同过滤
C. 基于⽤户和物品的联合协同过滤
D. 基于商家的协同过滤
A. 灵活的可扩展性
B. 灵活的数据模型
C. 与云计算紧密融合
D. ⼤型的数据库
A. 相对于Spark来说,使⽤Hadoop进⾏迭代计算⾮常耗资源
B. Spark将数据载⼊内存后,之后的迭代计算都可以直接使⽤内存中的中间结果作运算,避免了从磁盘中频繁读取数据
C. Hadoop的设计遵循”⼀个软件栈满⾜不同应⽤场景”的理念
D. Spark可以部署在资源管理器YARN之上,提供⼀站式的⼤数据解决⽅案