A、 同⼀个Region不会被分拆到多个Region服务器
B、 为了加快访问速度,.META.表的全部Region都会被保存在内存中
C、 ⼀个-ROOT-表可以有多个Region
D、 为了加速寻址,客户端会缓存位置信息,同时,需要解决缓存失效问题
答案:C
A、 同⼀个Region不会被分拆到多个Region服务器
B、 为了加快访问速度,.META.表的全部Region都会被保存在内存中
C、 ⼀个-ROOT-表可以有多个Region
D、 为了加速寻址,客户端会缓存位置信息,同时,需要解决缓存失效问题
答案:C
A. 数据存储层
B. 数据源层
C. 数据分析层
D. 数据应⽤层
A. Hadoop⾃⾝核⼼组件MapReduce的架构设计改进
B. Hadoop⾃⾝核⼼组件HDFS的架构设计改进
C. Hadoop⽣态系统其它组件的不断丰富
D. Hadoop⽣态系统减少不必要的组件,整合系统
A. 分布式存储
B. 数据处理与分析
C. 分布式处理
D. 数据存储与管理
A. ⾼可扩展性
B. ⽀持多种编程语⾔
C. 成本低
D. 运⾏在Linux平台上
A. 实时获取来⾃不同数据源的海量数据,经过实时分析处理,获得有价值的信息
B. 流计算秉承⼀个基本理念,即数据的价值随着时间的流逝⽽降低
C. 对于⼀个流计算系统来说,它应该⽀持TB级甚⾄是PB级的数据规模
D. 流计算只需要保证较低的延迟时间,即只达到秒级别即可处理⼀切问题
A. 利⽤分布式⽂件系统、数据仓库、关系数据库等实现对结构化、半结构化和⾮结构化海量数据的存储和管理
B. 利⽤分布式并⾏编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析
C. 构建隐私数据保护体系和数据安全体系,有效保护个⼈隐私和数据安全
D. 把实时采集的数据作为流计算系统的输⼊,进⾏实时处理分析
A. 负责资源监控和作业调度,监控所有TaskTracker与Job的健康状况
B. 使⽤”slot”等量划分本节点上的资源量(CPU、内存等)
C. 会周期性地通过”⼼跳”将本节点上资源的使⽤情况和任务的运⾏进度汇报给TaskTracker
D. 会跟踪任务的执⾏进度、资源使⽤量等信息,并将这些信息告诉任务(Task)
A. 分布式环境必须要考虑系统出错。HBase采⽤HLog保证
B. HBase系统为每个Region服务器配置了⼀个HLog⽂件
C. Zookeeper会实时监测每个Region服务器的状态
D. Master⾸先会处理该故障Region服务器上⾯遗留的HLog⽂件
A. 关键字
B. ⾏键
C. 列族
D. 时间戳