A、 RDD(ResillientDistributedDataset)是运⾏在⼯作节点(WorkerNode)的⼀个进程,负责运⾏Task
B、 Application是⽤户编写的Spark应⽤程序
C、 ⼀个Job包含多个RDD及作⽤于相应RDD上的各种操作
D、 DirectedAcyclicGraph反映RDD之间的依赖关系
答案:A
A、 RDD(ResillientDistributedDataset)是运⾏在⼯作节点(WorkerNode)的⼀个进程,负责运⾏Task
B、 Application是⽤户编写的Spark应⽤程序
C、 ⼀个Job包含多个RDD及作⽤于相应RDD上的各种操作
D、 DirectedAcyclicGraph反映RDD之间的依赖关系
答案:A
A. Map将⼩数据集进⼀步解析成⼀批
B. Map每⼀个输⼊的
C. Reduce输⼊的中间结果
D. Reduce输⼊的中间结果
A. 关于出度分布的柱状图
B. 处于活跃状态的边数量
C. 在当前超步的时间信息和消息流量
D. 所有⽤户⾃定义Aggregator的值
A. 电信⾏业:客户离⽹分析
B. 智能机器⼈
C. 零售⾏业:发现关联购买⾏为、进⾏客户群体细分
D. 推荐系统
A. 数据分析
B. 数据实时查询
C. 数据挖掘
D. 数据接收
A. 存储设备容量不断增加
B. ⽹络带宽不断增加
C. CPU处理能⼒⼤幅提升
D. 数据量不断增⼤
A. 成本⾼
B. ⾼可靠性
C. ⾼容错性
D. 运⾏在Linux平台上
A. GFS与Zookeeper
B. GFS与HDFS
C. MapReduce与HadoopMapReduce
D. Chubby与Zookeeper
A. 数据的准确性
B. 数据处理的延迟
C. 数据存储的容量
D. 数据传输的速度
A. 按需服务
B. 随时服务
C. 通⽤性
D. 价格不菲
A. ⼑⽚服务器、⾼速⽹、SAN,价格贵,扩展性差上
B. 共享式(共享内存/共享存储),容错性好
C. what-how,难
D. 实时、细粒度计算、计算密集型