A、 加快数据传输速度
B、 容易检查数据错误
C、 保证数据可靠性
D、 适合多平台上运⾏
答案:ABC
A、 加快数据传输速度
B、 容易检查数据错误
C、 保证数据可靠性
D、 适合多平台上运⾏
答案:ABC
A. 所有的数据交换都是通过MapReduce框架⾃⾝去实现的
B. 不同的Map任务之间会进⾏通信
C. 不同的Reduce任务之间可以发⽣信息交换
D. ⽤户可以显式地从⼀台机器向另⼀台机器发送消息
A. 选择集群中的多台机器执⾏图计算任务,每台机器上运⾏⽤户程序的⼀个副本
B. Master把⼀个图分成多个分区,并把分区分配到多个Worker
C. ster会把⽤户输⼊划分成多个部分,通常是基于⽂件边界进⾏划分
D. ster向每个Worker发送指令,Worker收到指令后,开始运⾏⼀个超步
A. 流处理系统处理的是实时的数据,⽽传统的数据处理系统处理的是预先存储好的静态数据
B. ⽤户通过流处理系统获取的是实时结果,⽽通过传统的数据处理系统,获取的是过去某⼀时刻的结果
C. 流处理系统⽆需⽤户主动发出查询,实时查询服务可以主动将结果推送给⽤户
D. 传统的数据处理系统系统⽆需⽤户主动发出查询,批量查询服务可以主动将结果推送给⽤户
A. 实时性差(适合批处理,不⽀持实时交互式)
B. 资源浪费(Map和Reduce分两阶段执⾏)
C. 执⾏迭代操作效率低
D. 难以看到程序整体逻辑
A. 配置维护
B. 域名服务
C. 分布式同步
D. 组服务
A. 名称节点出错
B. 数据节点出错
C. 数据出错
D. 数据源太⼤
A. 数据存储
B. 数据加密
C. 数据理解与分析
D. 数据传输
A. 具有较差的⽔平可扩展性
B. 设置个别属性的索引来实现更快的排序
C. 提供了⼀个⾯向⽂档存储,操作复杂
D. 可以实现替换完成的⽂档(数据)或者⼀些指定的数据字段
A. RDD(ResillientDistributedDataset)是运⾏在⼯作节点(WorkerNode)的⼀个进程,负责运⾏Task
B. Application是⽤户编写的Spark应⽤程序
C. ⼀个Job包含多个RDD及作⽤于相应RDD上的各种操作
D. DirectedAcyclicGraph反映RDD之间的依赖关系