A、 ⼀个RDD就是⼀个分布式对象集合,本质上是⼀个只读的分区记录集合
B、 每个RDD可分成多个分区,每个分区就是⼀个数据集⽚段
C、 RDD是可以直接修改的
D、 RDD提供了⼀种⾼度受限的共享内存模型
答案:C
A、 ⼀个RDD就是⼀个分布式对象集合,本质上是⼀个只读的分区记录集合
B、 每个RDD可分成多个分区,每个分区就是⼀个数据集⽚段
C、 RDD是可以直接修改的
D、 RDD提供了⼀种⾼度受限的共享内存模型
答案:C
A. 在传统的数据处理流程中,存储的数据是旧的
B. 在传统的数据处理流程中,需要⽤户主动发出查询来获取结果
C. 传统的数据处理流程,需要先采集数据并存储在关系数据库等数据管理系统中
D. 流计算的处理流程⼀般包含三个阶段:数据实时采集、数据批量计算、实时查询服务
A. 推荐系统是⼤数据在互联⽹领域的典型应⽤
B. 推荐系统是⾃动联系⽤户和物品的⼀种⼯具
C. 推荐系统可以创造全新的商业和经济模式,帮助实现长尾商品的销售
D. 推荐系统分为基于物品的协同过滤和基于商家的协同过滤
A. 图结构数据的处理
B. 基于历史数据的交互式查询
C. 复杂的批量数据处理
D. 基于历史数据的数据挖掘
A. d3.select(“body”)查找DOM中的body
B. selectAll(“p”)选择DOM中的所有段落
C. enter()绑定数据和DOM元素
D. text(“Newparagraph!”)为新创建的p标签插⼊⼀个⽂本值
A. 通过单个⾏健访问
B. 通过时间戳访问
C. 通过⼀个⾏健的区间来访问
D. 全表扫描
A. ⽤户建模模块
B. 数据采集模块
C. 推荐对象建模模块
D. 推荐算法模块
A. ⽬录
B. ⽂件
C. 块
D. 磁盘
A. 顶点的出度
B. 顶点
C. 边
D. 消息
A. 存储元数据
B. 存储⽂件内容
C. ⽂件内存保存在磁盘中
D. 维护了blockid到datanode本地⽂件的映射关系
A. 保持单⼀的系统对外⼊⼝,并且为系统内部维护单⼀的资源池
B. 消除单点故障,保证服务的⾼可⽤性
C. 保证系统具有良好的可伸缩,能够动态地增加、删减计算与存储节点
D. 保证分配给⽤户的资源也是弹性可伸缩的