A、 Storm将Streams的状态转换过程抽象为Spout
B、 Storm认为每个Stream都有⼀个源头,并把这个源头抽象为Spout
C、 Storm将Spouts和Bolts组成的⽹络抽象成Topology
D、 Topology⾥⾯的每个处理组件(Spout或Bolt)都包含处理逻辑,⽽组件之间的连接则表⽰数据流动的⽅向
答案:A
A、 Storm将Streams的状态转换过程抽象为Spout
B、 Storm认为每个Stream都有⼀个源头,并把这个源头抽象为Spout
C、 Storm将Spouts和Bolts组成的⽹络抽象成Topology
D、 Topology⾥⾯的每个处理组件(Spout或Bolt)都包含处理逻辑,⽽组件之间的连接则表⽰数据流动的⽅向
答案:A
A. Storm将流数据Stream描述成⼀个有限的Tuple序列
B. Storm保证每个消息都能完整处理
C. Storm认为每个Stream都有⼀个源头,并把这个源头抽象为Spout
D. Bolt可以执⾏过滤、函数操作、Join、操作数据库等任何操作
A. 负责资源监控和作业调度,监控所有TaskTracker与Job的健康状况
B. 使⽤”slot”等量划分本节点上的资源量(CPU、内存等)
C. 会周期性地通过”⼼跳”将本节点上资源的使⽤情况和任务的运⾏进度汇报给TaskTracker
D. 会跟踪任务的执⾏进度、资源使⽤量等信息,并将这些信息告诉任务(Task)
A. 为了让⽤户从海量信息中⾼效地获得⾃⼰所需的信息,推荐系统应运⽽⽣
B. 推荐系统是⼤数据在互联⽹领域的典型应⽤
C. 推荐系统是⾃动联系⽤户和物品的⼀种⼯具
D. 推荐系统是利⽤⼤数据为⽤户推荐消费内容、调整线下门店布局、控制店内⼈流量
A. Master-status(⾃带)
B. Ganglia
C. OpenTSDB
D. Ambari
A. 推荐系统:为⽤户推荐相关商品
B. 物流:基于⼤数据和物联⽹技术的智能物流
C. 智能交通:利⽤交通⼤数据,实现交通实时监控
D. 汽车:⽆⼈驾驶汽车,实时采集车辆各种⾏驶数据和周围环境
A. Hadoop⾃⾝核⼼组件MapReduce的架构设计改进
B. Hadoop⾃⾝核⼼组件HDFS的架构设计改进
C. Hadoop⽣态系统其它组件的不断丰富
D. Hadoop⽣态系统减少不必要的组件,整合系统
A. Hadoop擅长批处理,不适合流计算
B. MapReduce是专门⾯向静态数据的批量处理的
C. Hadoop设计的初衷是⾯向⼤规模数据的批量处理
D. MapReduce不适合⽤于处理持续到达的动态数据
A. 每个Region服务器都有⼀个⾃⼰的HLog⽂件
B. 每次刷写都⽣成⼀个新的StoreFile,数量太多,影响查找速度
C. 合并操作⽐较耗费资源,只有数量达到⼀个阈值才启动合并
D. Store是Region服务器的核⼼
A. 负责数据的存储和读取
B. 根据客户端或者是名称节点的调度来进⾏数据的存储和检索
C. 向名称节点定期发送⾃⼰所存储的块的列表
D. ⽤来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间
A. ⽤户建模模块
B. 推荐对象建模模块
C. 推荐算法模块
D. 数据采集模块