答案:非结构化数据
A. Web2.0⽹站系统通常不要求严格的数据库事务
B. Web2.0⽹站系统基本上不⽤数据库来存储
C. Web2.0并不要求严格的读写实时性
D. Web2.0通常不包含⼤量复杂的SQL查询
A. 读写分离
B. 分库分表
C. 数据安全
D. 资源合并
A. 复杂的批量数据处理:通常时间跨度在数⼗分钟到数⼩时之间
B. 基于历史数据的交互式查询:通常时间跨度在数⼗秒到数分钟之间
C. 基于实时数据流的数据处理:通常时间跨度在数⼗秒到数分钟之间
D. 基于实时数据流的数据处理:通常时间跨度在数百毫秒到数秒之间
A. 属于不同命名空间的块可以构成同⼀个”块池”
B. HDFSFederation中,所有名称节点会共享底层的数据节点存储资源,数据节点向所有名称节点汇报
C. 设计了多个相互独⽴的名称节点
D. HDFS的命名服务能够⽔平扩展
A. 不可以⽔平扩展
B. 多点故障问题
C. HDFSHA是热备份,提供⾼可⽤性,但是⽆法解决可扩展性、系统性能和隔离性
D. 系统整体性能受限于单个名称节点的吞吐量
A. 关系代数运算(选择、投影、并、交、差、连接)
B. 分组与聚合运算
C. 矩阵-向量乘法
D. 矩阵乘法
A. 不存在单点故障
B. JobTracker”⼤包⼤揽”导致任务过重
C. 容易出现内存溢出(分配资源只考虑MapReduce任务数,不考虑CPU、内存)
D. 资源划分不合理(强制划分为slot,包括Mapslot和Reduceslot)
A. CA:也就是强调⼀致性(C)和可⽤性(A),放弃分区容忍性(P)
B. CP:也就是强调⼀致性(C)和分区容忍性(P),放弃可⽤性(A)
C. AP:也就是强调可⽤性(A)和分区容忍性(P),放弃⼀致性(C)
D. CAP:也就是同时兼顾可⽤性(A)、分区容忍性(P)和⼀致性(C),当时系统性能会下降很多
A. 访问层
B. ⼤数据层
C. 数据源层
D. ⽹络层