A、 FieldsGrouping:⼴播发送,每⼀个Task都会收到所有的Tuple
B、 GlobalGrouping:全局分组,所有的Tuple都发送到同⼀个Task中
C、 NonGrouping:不分组,和ShuffleGrouping类似,当前Task的执⾏会和它的被订阅者在同⼀个线程中执⾏
D、 DirectGrouping:直接分组,直接指定由某个Task来执⾏Tuple的处理
答案:A
A、 FieldsGrouping:⼴播发送,每⼀个Task都会收到所有的Tuple
B、 GlobalGrouping:全局分组,所有的Tuple都发送到同⼀个Task中
C、 NonGrouping:不分组,和ShuffleGrouping类似,当前Task的执⾏会和它的被订阅者在同⼀个线程中执⾏
D、 DirectGrouping:直接分组,直接指定由某个Task来执⾏Tuple的处理
答案:A
A. 数据可视化是指将⼤型数据集中的数据以图形图像形式表⽰
B. 数据可视化技术的基本思想是将数据库中每⼀个数据项作为单个图元素表⽰
C. 利⽤数据分析和开发⼯具发现其中未知信息的处理过程
D. 将数据的各个属性值以⼀维数据的形式表⽰
A. 存储被拆分的数据块
B. 协调数据计算任务
C. 负责协调集群中的数据存储
D. 负责执⾏由JobTracker指派的任务
A. 数据存储层
B. 数据源层
C. 数据分析层
D. 数据应⽤层
A. 数据起始位置
B. 数据长度
C. 数据所在节点
D. 数据⼤⼩
A. SecondaryNameNode⼀般是并⾏运⾏在多台机器上
B. 它是⽤来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间
C. SecondaryNameNode通过HTTPGET⽅式从NameNode上获取到FsImage和EditLog⽂件,并下载到本地的相应⽬录下
D. SecondaryNameNode是HDFS架构中的⼀个组成部分
A. 不同场景之间输⼊输出数据⽆法做到⽆缝共享,通常需要进⾏数据格式的转换
B. 不同的软件需要不同的开发和维护团队
C. 需要较⾼的使⽤成本
D. ⽐较难以对同⼀个集群中的各个系统进⾏统⼀的资源协调和分配
A. 在Pregel中,为了获得更好的性能,”标志位”和输⼊消息队列是分开保存的
B. 在超步S中,当⼀个Worker在进⾏顶点处理时,⽤于当前超步的消息会被处理
C. 需要两个消息队列⽤于存放作⽤于当前超步S的消息和作⽤于下⼀个超步S+1的消息
D. 每个Worker上都保存了⼀个或多个分区的状态信息,当⼀个Worker发⽣故障时,它所负责维护的分区的当前状态信息就会丢失
A. Standalone(类似于MapReduce1.0,slot为资源分配单位)
B. SparkonMesos(和Spark有⾎缘关系,更好⽀持Mesos)
C. SparkonYARN
D. SparkonHDFS
A. 操作系统和围绕特定应⽤的必需的服务
B. 将基础设施(计算资源和存储)作为服务出租
C. 从⼀个集中的系统部署软件,使之在⼀台本地计算机上(或从云中远程地)运⾏的⼀个模型
D. 提供硬件、软件、⽹络等基础设施以及提供咨询、规划和系统集成服务
A. 关系数据库以完善的关系代数理论作为基础,有严格的标准
B. 关系数据库可扩展性较差,⽆法较好⽀持海量数据存储
C. NoSQL可以⽀持超⼤规模数据存储
D. NoSQL数据库缺乏数学理论基础,复杂查询性能不⾼