A、 worker:每个worker进程都属于⼀个特定的Topology
B、 executor:executor是产⽣于worker进程内部的线程
C、 task:实际的数据处理由task完成
D、 在Topology的⽣命周期中,每个组件的task数⽬是不会发⽣变化的,⽽executor的数⽬却不⼀定
答案:ABCD
A、 worker:每个worker进程都属于⼀个特定的Topology
B、 executor:executor是产⽣于worker进程内部的线程
C、 task:实际的数据处理由task完成
D、 在Topology的⽣命周期中,每个组件的task数⽬是不会发⽣变化的,⽽executor的数⽬却不⼀定
答案:ABCD
A. 在传统的数据处理流程中,存储的数据是旧的
B. 在传统的数据处理流程中,需要⽤户主动发出查询来获取结果
C. 传统的数据处理流程,需要先采集数据并存储在关系数据库等数据管理系统中
D. 流计算的处理流程⼀般包含三个阶段:数据实时采集、数据批量计算、实时查询服务
A. 基于物品的协同过滤算法(简称ItemCF算法)是⽬前业界应⽤最多的算法
B. ItemCF算法是给⽬标⽤户推荐那些和他们之前喜欢的物品相似的物品
C. ItemCF算法通过建⽴⽤户到物品倒排表(每个⽤户喜欢的物品的列表)来计算物品相似度
D. UserCF算法推荐的是那些和⽬标⽤户有共同兴趣爱好的其他⽤户所喜欢的物品
A. 提高数据分析效率
B. 降低数据存储成本
C. 增加数据体量
D. 改变数据类型
A. 同⼀个Region不会被分拆到多个Region服务器
B. 为了加快访问速度,.META.表的全部Region都会被保存在内存中
C. ⼀个-ROOT-表可以有多个Region
D. 为了加速寻址,客户端会缓存位置信息,同时,需要解决缓存失效问题
A. RDBMS有关系代数理论作为基础,NoSQL没有统⼀的理论基础
B. NoSQL很难实现横向扩展,RDBMS可以很容易通过添加更多设备来⽀持更⼤规模的数据
C. RDBMS需要定义数据库模式,严格遵守数据定义,NoSQL不存在数据库模式,可以⾃由灵活定义并存储各种不同类型的数据
D. RDBMS借助于索引机制可以实现快速查询,很多NoSQL数据库没有⾯向复杂查询的索引
A. 选择集群中的多台机器执⾏图计算任务,每台机器上运⾏⽤户程序的⼀个副本
B. Master把⼀个图分成多个分区,并把分区分配到多个Worker
C. ster会把⽤户输⼊划分成多个部分,通常是基于⽂件边界进⾏划分
D. ster向每个Worker发送指令,Worker收到指令后,开始运⾏⼀个超步
A. UserCF算法推荐的是那些和⽬标⽤户有共同兴趣爱好的其他⽤户所喜欢的物品
B. ItemCF算法推荐的是那些和⽬标⽤户之前喜欢的物品类似的其他物品
C. UserCF算法的推荐更偏向个性化
D. UserCF随着⽤户数⽬的增⼤,⽤户相似度计算复杂度越来越⾼
A. 为⽤户提供了系统底层细节透明的分布式基础架构
B. 具有很好的跨平台特性
C. 可以部署在廉价的计算机集群中
D. 被公认为⾏业⼤数据标准开源软件
A. 属于不同命名空间的块可以构成同⼀个”块池”
B. HDFSFederation中,所有名称节点会共享底层的数据节点存储资源,数据节点向所有名称节点汇报
C. 设计了多个相互独⽴的名称节点
D. HDFS的命名服务能够⽔平扩展
A. 强⼤的跨平台兼容性
B. ⽀持⼤规模⽂件存储
C. 简化系统设计
D. 适合数据备份