A、 为⽤户提供了系统底层细节透明的分布式基础架构
B、 具有很好的跨平台特性
C、 可以部署在廉价的计算机集群中
D、 被公认为⾏业⼤数据标准开源软件
答案:ABCD
A、 为⽤户提供了系统底层细节透明的分布式基础架构
B、 具有很好的跨平台特性
C、 可以部署在廉价的计算机集群中
D、 被公认为⾏业⼤数据标准开源软件
答案:ABCD
A. 顶点的当前值
B. 消息队列
C. 标志位
D. ⼀个接收到的消息的迭代器
A. 强⼤的跨平台兼容性
B. ⽀持⼤规模⽂件存储
C. 简化系统设计
D. 适合数据备份
A. 基于物品和商家的联合协同推荐
B. 基于统计的推荐
C. 专家推荐
D. 基于内容的推荐
A. ⼀个RDD就是⼀个分布式对象集合,本质上是⼀个只读的分区记录集合
B. 每个RDD可分成多个分区,每个分区就是⼀个数据集⽚段
C. RDD是可以直接修改的
D. RDD提供了⼀种⾼度受限的共享内存模型
A. 命名空间的限制
B. 性能的瓶颈
C. 隔离问题
D. 集群的可⽤性
A. Zookeeper⽂件
B. -ROOT-表
C. .META.表
D. 数据类型
A. 利⽤分布式⽂件系统、数据仓库、关系数据库等实现对结构化、半结构化和⾮结构化海量数据的存储和管理
B. 利⽤分布式并⾏编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析
C. 构建隐私数据保护体系和数据安全体系,有效保护个⼈隐私和数据安全
D. 把实时采集的数据作为流计算系统的输⼊,进⾏实时处理分析
A. 64MB
B. 32MB
C. 128MB
D. 16MB
A. 分布式⽂件系统
B. 流数据读写
C. 资源管理和调度器
D. Hadoop上的数据仓库
A. 在传统的数据处理流程中,存储的数据是旧的
B. 在传统的数据处理流程中,需要⽤户主动发出查询来获取结果
C. 传统的数据处理流程,需要先采集数据并存储在关系数据库等数据管理系统中
D. 流计算的处理流程⼀般包含三个阶段:数据实时采集、数据批量计算、实时查询服务