A、 RDD(ResillientDistributedDataset)是运⾏在⼯作节点(WorkerNode)的⼀个进程,负责运⾏Task
B、 Application是⽤户编写的Spark应⽤程序
C、 ⼀个Job包含多个RDD及作⽤于相应RDD上的各种操作
D、 DirectedAcyclicGraph反映RDD之间的依赖关系
答案:A
A、 RDD(ResillientDistributedDataset)是运⾏在⼯作节点(WorkerNode)的⼀个进程,负责运⾏Task
B、 Application是⽤户编写的Spark应⽤程序
C、 ⼀个Job包含多个RDD及作⽤于相应RDD上的各种操作
D、 DirectedAcyclicGraph反映RDD之间的依赖关系
答案:A
A. 矩形
B. 圆形
C. 线条
D. 图⽚
A. ⼀个RDD就是⼀个分布式对象集合,本质上是⼀个只读的分区记录集合
B. 每个RDD可分成多个分区,每个分区就是⼀个数据集⽚段
C. RDD是可以直接修改的
D. RDD提供了⼀种⾼度受限的共享内存模型
A. GFS与Zookeeper
B. GFS与HDFS
C. MapReduce与HadoopMapReduce
D. Chubby与Zookeeper
A. 性能好(⾼并发),灵活性⾼
B. 具备统⼀的查询语法
C. ⽂档数据库⽀持⽂档间的事务
D. 复杂性低,数据结构灵活
A. 处理⼤规模数据的脚本语⾔
B. ⼯作流和协作服务引擎,协调Hadoop上运⾏的不同任务
C. ⽀持DAG作业的计算框架
D. 基于内存的分布式并⾏编程框架,具有较⾼的实时性,并且较好⽀持迭代计算
A. 顶点的当前值
B. 消息队列
C. 标志位
D. ⼀个接收到的消息的迭代器
A. 从磁盘或从⽹络读取数据,即IO密集⼯作
B. 计算数据,即CPU密集⼯作
C. 针对不同的⼯作节点选择合适硬件类型
D. 负责协调集群中的数据存储
A. 推荐系统是⼤数据在互联⽹领域的典型应⽤
B. 推荐系统是⾃动联系⽤户和物品的⼀种⼯具
C. 推荐系统可以创造全新的商业和经济模式,帮助实现长尾商品的销售
D. 推荐系统分为基于物品的协同过滤和基于商家的协同过滤