APP下载

大数据技术理论题库

搜索

大数据技术理论题库

题目内容

(

单选题

)

170、下列哪个关于StreamGroupings的描述，有误的是?

A、　FieldsGrouping:⼴播发送，每⼀个Task都会收到所有的Tuple

B、　GlobalGrouping:全局分组，所有的Tuple都发送到同⼀个Task中

C、　NonGrouping:不分组，和ShuffleGrouping类似，当前Task的执⾏会和它的被订阅者在同⼀个线程中执⾏

D、　DirectGrouping:直接分组，直接指定由某个Task来执⾏Tuple的处理

答案：A

大数据技术理论题库

197、下列关于数据可视化的描述，正确的有?

点击查看题目

23、在⼀个基本的Hadoop集群中，DataNode主要负责什么?

点击查看题目

5、下列哪⼀个不属于⼤数据产业的产业链环节?

点击查看题目

115、对于MapReduce⽽⾔，其处理单位是split。split是⼀个逻辑概念，它包含哪些元数据信息?

点击查看题目

47、下⾯对SecondaryNameNode第⼆名称节点的描述，哪个是错误的?

点击查看题目

156、在实际应⽤中，⼤数据处理难免会带来哪些问题?

点击查看题目

259、下列说法正确的有?

点击查看题目

160、Spark⽀持三种不同类型的部署⽅式，包括?

点击查看题目

7、云计算平台层【PaaS】指的是什么?

点击查看题目

74、下⾯关于NoSQL与关系数据库的⽐较，哪些是正确的?

点击查看题目

大数据技术理论题库

题目内容

(

单选题

)

手机预览

大数据技术理论题库

170、下列哪个关于StreamGroupings的描述，有误的是?

A、　FieldsGrouping:⼴播发送，每⼀个Task都会收到所有的Tuple

B、　GlobalGrouping:全局分组，所有的Tuple都发送到同⼀个Task中

C、　NonGrouping:不分组，和ShuffleGrouping类似，当前Task的执⾏会和它的被订阅者在同⼀个线程中执⾏

D、　DirectGrouping:直接分组，直接指定由某个Task来执⾏Tuple的处理

答案：A

相关题库:

大数据技术理论题库

分享

大数据技术理论题库

相关题目

197、下列关于数据可视化的描述，正确的有?

A. 　数据可视化是指将⼤型数据集中的数据以图形图像形式表⽰

B. 　数据可视化技术的基本思想是将数据库中每⼀个数据项作为单个图元素表⽰

C. 　利⽤数据分析和开发⼯具发现其中未知信息的处理过程

D. 　将数据的各个属性值以⼀维数据的形式表⽰

点击查看答案

23、在⼀个基本的Hadoop集群中，DataNode主要负责什么?

A. 　存储被拆分的数据块

B. 　协调数据计算任务

C. 　负责协调集群中的数据存储

D. 　负责执⾏由JobTracker指派的任务

点击查看答案

5、下列哪⼀个不属于⼤数据产业的产业链环节?

A. 　数据存储层

B. 　数据源层

C. 　数据分析层

D. 　数据应⽤层

点击查看答案

115、对于MapReduce⽽⾔，其处理单位是split。split是⼀个逻辑概念，它包含哪些元数据信息?

A. 　数据起始位置

B. 　数据长度

C. 　数据所在节点

D. 　数据⼤⼩

点击查看答案

47、下⾯对SecondaryNameNode第⼆名称节点的描述，哪个是错误的?

A. 　SecondaryNameNode⼀般是并⾏运⾏在多台机器上

B. 　它是⽤来保存名称节点中对HDFS元数据信息的备份，并减少名称节点重启的时间

C. 　SecondaryNameNode通过HTTPGET⽅式从NameNode上获取到FsImage和EditLog⽂件，并下载到本地的相应⽬录下

D. 　SecondaryNameNode是HDFS架构中的⼀个组成部分

点击查看答案

156、在实际应⽤中，⼤数据处理难免会带来哪些问题?

A. 　不同场景之间输⼊输出数据⽆法做到⽆缝共享，通常需要进⾏数据格式的转换

B. 　不同的软件需要不同的开发和维护团队

C. 　需要较⾼的使⽤成本

D. 　⽐较难以对同⼀个集群中的各个系统进⾏统⼀的资源协调和分配

点击查看答案

259、下列说法正确的有?

A. 　在Pregel中，为了获得更好的性能，”标志位”和输⼊消息队列是分开保存的

B. 　在超步S中，当⼀个Worker在进⾏顶点处理时，⽤于当前超步的消息会被处理

C. 　需要两个消息队列⽤于存放作⽤于当前超步S的消息和作⽤于下⼀个超步S+1的消息

D. 　每个Worker上都保存了⼀个或多个分区的状态信息，当⼀个Worker发⽣故障时，它所负责维护的分区的当前状态信息就会丢失

点击查看答案

160、Spark⽀持三种不同类型的部署⽅式，包括?

A. 　Standalone(类似于MapReduce1.0，slot为资源分配单位)

B. 　SparkonMesos(和Spark有⾎缘关系，更好⽀持Mesos)

C. 　SparkonYARN

D. 　SparkonHDFS

点击查看答案

7、云计算平台层【PaaS】指的是什么?

A. 　操作系统和围绕特定应⽤的必需的服务

B. 　将基础设施(计算资源和存储)作为服务出租

C. 　从⼀个集中的系统部署软件，使之在⼀台本地计算机上(或从云中远程地)运⾏的⼀个模型

D. 　提供硬件、软件、⽹络等基础设施以及提供咨询、规划和系统集成服务

点击查看答案

74、下⾯关于NoSQL与关系数据库的⽐较，哪些是正确的?

A. 　关系数据库以完善的关系代数理论作为基础，有严格的标准

B. 　关系数据库可扩展性较差，⽆法较好⽀持海量数据存储

C. 　NoSQL可以⽀持超⼤规模数据存储

D. 　NoSQL数据库缺乏数学理论基础，复杂查询性能不⾼

点击查看答案

试题通app下载

类似热门题库

应用型子网划分填空题

《数据网组建与维护》课程题库

计算机操作员四级

python单选题题目练习题

python选择填空题库练习

全国计算机一级选择题真题

管理信息理论复习题库

通信专业应知应会题库(最终版）

大数据技术理论题库

2024参考题库理论知识

试题通小程序

试题通app下载

©2016-2024.南通佰易网络科技有限公司
苏ICP备16028519号-2 苏公网安备32061102000302