APP下载

大数据技术理论题库

搜索

大数据技术理论题库

题目内容

(

多选题

)

238、下列关于Region服务器⼯作原理的描述，哪些是正确的?

A、　每个Region服务器都有⼀个⾃⼰的HLog⽂件

B、　每次刷写都⽣成⼀个新的StoreFile，数量太多，影响查找速度

C、　合并操作⽐较耗费资源，只有数量达到⼀个阈值才启动合并

D、　Store是Region服务器的核⼼

答案：ABCD

Scan me!

大数据技术理论题库

239、下列关于HLog⼯作原理的描述，哪些是正确的?

点击查看题目

250、很多传统的图计算算法都存在以下哪些典型问题?

点击查看题目

251、针对⼤型图(⽐如社交⽹络和⽹络图)的计算问题，哪些说法是正确的?

点击查看题目

253、⼀次BSP【BulkSynchronousParallelComputingModel，⼜称”⼤同步”模型】计算过程包括⼀系列全局超步(所谓的超步就是计算中的⼀次迭代)，每个超步主要包括哪些组件?

点击查看题目

255、在Pregel计算框架中，图的保存格式多种多样，具体包括哪些?

点击查看题目

256、下列对于Pregel的执⾏过程，哪些是正确的?

点击查看题目

257、在⼀个Worker中，它所管辖的分区的状态信息是保存在内存中的，分区中的顶点的状态信息包括?

点击查看题目

258、在每个超步中，Worker会对⾃⼰所管辖的分区中的每个顶点进⾏遍历，并调⽤顶点上的Compute()函数，在调⽤时，会把以下哪些参数传递进去?

点击查看题目

259、下列说法正确的有?

点击查看题目

2.在大数据处理流程中,数据清洗的主要目的是什么?( )

点击查看题目

大数据技术理论题库

题目内容

(

多选题

)

手机预览

Scan me!

大数据技术理论题库

238、下列关于Region服务器⼯作原理的描述，哪些是正确的?

A、　每个Region服务器都有⼀个⾃⼰的HLog⽂件

B、　每次刷写都⽣成⼀个新的StoreFile，数量太多，影响查找速度

C、　合并操作⽐较耗费资源，只有数量达到⼀个阈值才启动合并

D、　Store是Region服务器的核⼼

答案：ABCD

相关题库:

大数据技术理论题库

分享

Scan me!

大数据技术理论题库

相关题目

239、下列关于HLog⼯作原理的描述，哪些是正确的?

A. 　分布式环境必须要考虑系统出错。HBase采⽤HLog保证

B. 　HBase系统为每个Region服务器配置了⼀个HLog⽂件

C. 　Zookeeper会实时监测每个Region服务器的状态

D. 　Master⾸先会处理该故障Region服务器上⾯遗留的HLog⽂件

点击查看答案

250、很多传统的图计算算法都存在以下哪些典型问题?

A. 　常常表现出⽐较差的内存访问局部性

B. 　针对单个顶点的处理⼯作过少

C. 　计算过程中伴随着并⾏度的改变

D. 　计算过程简易

点击查看答案

251、针对⼤型图(⽐如社交⽹络和⽹络图)的计算问题，哪些说法是正确的?

A. 　为特定的图应⽤定制相应的分布式实现:通⽤性不好

B. 　基于现有的分布式计算平台进⾏图计算:在性能和易⽤性⽅⾯往往⽆法达到最优

C. 　使⽤单机的图算法库，但是，在可以解决的问题的规模⽅⾯具有很⼤的局限性

D. 　使⽤已有的并⾏图计算系统，但是，对⼤规模分布式系统⾮常重要的⼀些⽅⾯(⽐如容错)，⽆法提供较好的⽀持

点击查看答案

253、⼀次BSP【BulkSynchronousParallelComputingModel，⼜称”⼤同步”模型】计算过程包括⼀系列全局超步(所谓的超步就是计算中的⼀次迭代)，每个超步主要包括哪些组件?

A. 　局部计算:每个参与的处理器都有⾃⾝的计算任务

B. 　通讯:处理器群相互交换数据

C. 　栅栏同步:当⼀个处理器遇到”路障”(或栅栏)，会等到其他所有处理器完成它们的计算步骤

D. 　基于现有的分布式计算平台进⾏图计算

点击查看答案

255、在Pregel计算框架中，图的保存格式多种多样，具体包括哪些?

A. 　⽂本⽂件

B. 　关系数据库

C. 　键值数据库

D. 　语⾳⽂件

点击查看答案

256、下列对于Pregel的执⾏过程，哪些是正确的?

A. 　选择集群中的多台机器执⾏图计算任务，每台机器上运⾏⽤户程序的⼀个副本

B. 　Master把⼀个图分成多个分区，并把分区分配到多个Worker

C. 　ster会把⽤户输⼊划分成多个部分，通常是基于⽂件边界进⾏划分

D. 　ster向每个Worker发送指令，Worker收到指令后，开始运⾏⼀个超步

点击查看答案

257、在⼀个Worker中，它所管辖的分区的状态信息是保存在内存中的，分区中的顶点的状态信息包括?

A. 　顶点的当前值

B. 　以该顶点为起点的出射边列表，每条出射边包含了⽬标顶点ID和边的值

C. 　消息队列，包含了所有接收到的、发送给该顶点的消息

D. 　标志位，⽤来标记顶点是否处于活跃状态

点击查看答案

258、在每个超步中，Worker会对⾃⼰所管辖的分区中的每个顶点进⾏遍历，并调⽤顶点上的Compute()函数，在调⽤时，会把以下哪些参数传递进去?

A. 　该顶点的当前值

B. 　⼀个接收到的消息的迭代器

C. 　⼀个出射边的迭代器

D. 　标志位，⽤来标记顶点是否处于活跃状态

点击查看答案

259、下列说法正确的有?

A. 　在Pregel中，为了获得更好的性能，”标志位”和输⼊消息队列是分开保存的

B. 　在超步S中，当⼀个Worker在进⾏顶点处理时，⽤于当前超步的消息会被处理

C. 　需要两个消息队列⽤于存放作⽤于当前超步S的消息和作⽤于下⼀个超步S+1的消息

D. 　每个Worker上都保存了⼀个或多个分区的状态信息，当⼀个Worker发⽣故障时，它所负责维护的分区的当前状态信息就会丢失

点击查看答案

2.在大数据处理流程中,数据清洗的主要目的是什么?( )

A. 增加数据量

B. 删除重复数据

C. 提高数据质量

D. 降低存储空间

点击查看答案

试题通app下载

类似热门题库

HCIP-openEuler-知识试题复习题库

应用型子网划分填空题

《数据网组建与维护》课程题库

计算机操作员四级

python单选题题目练习题

python选择填空题库练习

全国计算机一级选择题真题

管理信息理论复习题库

通信专业应知应会题库(最终版）

大数据技术理论题库

试题通小程序

试题通app下载

©2016-2024.南通佰易网络科技有限公司
苏ICP备16028519号-2 苏公网安备32061102000302