A、 ⾼性能:处理⼤数据的基本要求,如每秒处理⼏⼗万条数据
B、 实时性:保证较低的延迟时间,达到秒级别,甚⾄是毫秒级别
C、 分布式:⽀持⼤数据的基本架构,必须能够平滑扩展
D、 可靠性:能可靠地处理流数据
答案:ABCD
A、 ⾼性能:处理⼤数据的基本要求,如每秒处理⼏⼗万条数据
B、 实时性:保证较低的延迟时间,达到秒级别,甚⾄是毫秒级别
C、 分布式:⽀持⼤数据的基本架构,必须能够平滑扩展
D、 可靠性:能可靠地处理流数据
答案:ABCD
A. 分布式并⾏编程模型
B. 流计算框架
C. Hadoop上的⼯作流管理系统
D. 提供分布式协调⼀致性服务
A. 动态可扩展
B. ⾼可⽤性
C. 免维护
D. 安全
A. 把⽂件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群
B. ⽤于在Hadoop与传统数据库之间进⾏数据传递
C. ⼀个⾼可⽤的,⾼可靠的,分布式的海量⽇志采集、聚合和传输的系统
D. ⼀种⾼吞吐量的分布式发布订阅消息系统,可以处理消费者规模的⽹站中的所有动作流数据
A. 数据存储层
B. 数据源层
C. 数据分析层
D. 数据应⽤层
A. 源节点(SourceNode)
B. 主节点(MasterNode)
C. 名称结点(NameNode)
D. 节点(SlaveNode)
A. MapReduce体系结构主要由四个部分组成,分别是:Client、JobTracker、TaskTracker以及Task
B. Task分为MapTask和ReduceTask两种,均由TaskTracker启动
C. 在MapReduce⼯作流程中,所有的数据交换都是通过MapReduce框架⾃⾝去实现的
D. 在MapReduce⼯作流程中,⽤户不能显式地从⼀台机器向另⼀台机器发送消息
A. ⽀持⼤规模⽂件存储
B. 简化系统设计
C. 适合数据备份
D. ⽀持中等规模⽂件存储
A. 数值数组
B. 字符串
C. 对象(本⾝包含其他数组或键/值对)
D. JSON和GeoJSON
A. 64MB
B. 32MB
C. 128MB
D. 16MB
A. Storm将Streams的状态转换过程抽象为Spout
B. Storm认为每个Stream都有⼀个源头,并把这个源头抽象为Spout
C. Storm将Spouts和Bolts组成的⽹络抽象成Topology
D. Topology⾥⾯的每个处理组件(Spout或Bolt)都包含处理逻辑,⽽组件之间的连接则表⽰数据流动的⽅向