试题通
APP下载
首页
>
IT互联网
>
大数据技术理论题库
试题通
搜索
大数据技术理论题库
大数据技术理论题库
章节

单选题

题数量:132
去答题
章节

大数据技术理论题库(多选题)

题数量:127
去答题
章节

单选题

题数量:14
去答题
章节

简答题

题数量:21
去答题
试题通
大数据技术理论题库
238、下列关于Region服务器⼯作原理的描述,哪些是正确的?

A.  每个Region服务器都有⼀个⾃⼰的HLog⽂件

B.  每次刷写都⽣成⼀个新的StoreFile,数量太多,影响查找速度

C.  合并操作⽐较耗费资源,只有数量达到⼀个阈值才启动合并

D.  Store是Region服务器的核⼼

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a339-83eb-c022-e44c3222c300.html
查看题目
146、下列说法错误的是?

A.  RDD(ResillientDistributedDataset)是运⾏在⼯作节点(WorkerNode)的⼀个进程,负责运⾏Task

B.  Application是⽤户编写的Spark应⽤程序

C.  ⼀个Job包含多个RDD及作⽤于相应RDD上的各种操作

D.  DirectedAcyclicGraph反映RDD之间的依赖关系

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5bf-cb1f-c022-e44c3222c300.html
查看题目
175、下列关于流处理系统与传统的数据处理系统的描述,正确的有?

A.  流处理系统处理的是实时的数据,⽽传统的数据处理系统处理的是预先存储好的静态数据

B.  ⽤户通过流处理系统获取的是实时结果,⽽通过传统的数据处理系统,获取的是过去某⼀时刻的结果

C.  流处理系统⽆需⽤户主动发出查询,实时查询服务可以主动将结果推送给⽤户

D.  传统的数据处理系统系统⽆需⽤户主动发出查询,批量查询服务可以主动将结果推送给⽤户

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a325-a063-c022-e44c3222c300.html
查看题目
220、下列关于BigTable的描述,哪个是错误的?

A.  爬⾍持续不断地抓取新页⾯,这些页⾯每隔⼀段时间地存储到BigTable⾥

B.  BigTable是⼀个分布式存储系统

C.  BigTable起初⽤于解决典型的互联⽹搜索问题

D.  ⽹络搜索应⽤查询建⽴好的索引,从BigTable得到⽹页

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5d3-1c36-c022-e44c3222c300.html
查看题目
172、下列关于批量计算和实时计算的说法,正确的有?

A.  批量计算:充裕时间处理静态数据,如Hadoop

B.  静态数据不适合采⽤批量计算,因为它不适合⽤传统的关系模型建模

C.  流数据必须采⽤实时计算

D.  流数据的响应时间为秒级

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a323-dddd-c022-e44c3222c300.html
查看题目
158、Spark运⾏架构具有以下哪些特点?

A.  每个Application都有⾃⼰专属的Executor进程,并且该进程在Application运⾏期间⼀直驻留

B.  Executor进程以多线程的⽅式运⾏Task

C.  Spark运⾏过程与资源管理器⽆关,只要能够获取Executor进程并保持通信即可

D.  Task采⽤了数据本地性和推测执⾏等优化机制

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a321-70b0-c022-e44c3222c300.html
查看题目
18、物联⽹主要由下列哪些部分组成的?

A.  应⽤层

B.  处理层

C.  感知层

D.  ⽹络层

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a2f9-70c2-c022-e44c3222c300.html
查看题目
6.分布式计算通过将大数据划分为小块并在多个计算节点上并行处理,从而实现了______处理。
https://www.shititong.cn/cha-kan/shiti/00059ddd-4565-e085-c057-47291d003a00.html
查看题目
22、Hadoop框架中最核⼼的设计是什么?

A.  为海量数据提供存储的HDFS和对数据进⾏计算的MapReduce

B.  提供整个HDFS⽂件系统的NameSpace(命名空间)管理、块管理等所有服务

C.  Hadoop不仅可以运⾏在企业内部的集群中,也可以运⾏在云计算环境中

D.  Hadoop被视为事实上的⼤数据处理标准

https://www.shititong.cn/cha-kan/shiti/0004b09e-d59b-c0df-c022-e44c3222c300.html
查看题目
211、下列关于推荐系统集群的描述,哪些是正确的?

A.  为了让⽤户从海量信息中⾼效地获得⾃⼰所需的信息,推荐系统应运⽽⽣

B.  推荐系统是⼤数据在互联⽹领域的典型应⽤

C.  推荐系统是⾃动联系⽤户和物品的⼀种⼯具

D.  推荐系统是利⽤⼤数据为⽤户推荐消费内容、调整线下门店布局、控制店内⼈流量

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a32f-a590-c022-e44c3222c300.html
查看题目

大数据技术理论题库

首页
>
IT互联网
>
大数据技术理论题库

大数据技术理论题库

手机预览
试题通
大数据技术理论题库
章节

单选题

题数量:132
去答题
章节

大数据技术理论题库(多选题)

题数量:127
去答题
章节

单选题

题数量:14
去答题
章节

简答题

题数量:21
去答题
大数据技术理论题库

相关题目

238、下列关于Region服务器⼯作原理的描述,哪些是正确的?

A.  每个Region服务器都有⼀个⾃⼰的HLog⽂件

B.  每次刷写都⽣成⼀个新的StoreFile,数量太多,影响查找速度

C.  合并操作⽐较耗费资源,只有数量达到⼀个阈值才启动合并

D.  Store是Region服务器的核⼼

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a339-83eb-c022-e44c3222c300.html
查看题目
146、下列说法错误的是?

A.  RDD(ResillientDistributedDataset)是运⾏在⼯作节点(WorkerNode)的⼀个进程,负责运⾏Task

B.  Application是⽤户编写的Spark应⽤程序

C.  ⼀个Job包含多个RDD及作⽤于相应RDD上的各种操作

D.  DirectedAcyclicGraph反映RDD之间的依赖关系

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5bf-cb1f-c022-e44c3222c300.html
查看题目
175、下列关于流处理系统与传统的数据处理系统的描述,正确的有?

A.  流处理系统处理的是实时的数据,⽽传统的数据处理系统处理的是预先存储好的静态数据

B.  ⽤户通过流处理系统获取的是实时结果,⽽通过传统的数据处理系统,获取的是过去某⼀时刻的结果

C.  流处理系统⽆需⽤户主动发出查询,实时查询服务可以主动将结果推送给⽤户

D.  传统的数据处理系统系统⽆需⽤户主动发出查询,批量查询服务可以主动将结果推送给⽤户

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a325-a063-c022-e44c3222c300.html
查看题目
220、下列关于BigTable的描述,哪个是错误的?

A.  爬⾍持续不断地抓取新页⾯,这些页⾯每隔⼀段时间地存储到BigTable⾥

B.  BigTable是⼀个分布式存储系统

C.  BigTable起初⽤于解决典型的互联⽹搜索问题

D.  ⽹络搜索应⽤查询建⽴好的索引,从BigTable得到⽹页

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5d3-1c36-c022-e44c3222c300.html
查看题目
172、下列关于批量计算和实时计算的说法,正确的有?

A.  批量计算:充裕时间处理静态数据,如Hadoop

B.  静态数据不适合采⽤批量计算,因为它不适合⽤传统的关系模型建模

C.  流数据必须采⽤实时计算

D.  流数据的响应时间为秒级

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a323-dddd-c022-e44c3222c300.html
查看题目
158、Spark运⾏架构具有以下哪些特点?

A.  每个Application都有⾃⼰专属的Executor进程,并且该进程在Application运⾏期间⼀直驻留

B.  Executor进程以多线程的⽅式运⾏Task

C.  Spark运⾏过程与资源管理器⽆关,只要能够获取Executor进程并保持通信即可

D.  Task采⽤了数据本地性和推测执⾏等优化机制

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a321-70b0-c022-e44c3222c300.html
查看题目
18、物联⽹主要由下列哪些部分组成的?

A.  应⽤层

B.  处理层

C.  感知层

D.  ⽹络层

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a2f9-70c2-c022-e44c3222c300.html
查看题目
6.分布式计算通过将大数据划分为小块并在多个计算节点上并行处理,从而实现了______处理。
https://www.shititong.cn/cha-kan/shiti/00059ddd-4565-e085-c057-47291d003a00.html
查看题目
22、Hadoop框架中最核⼼的设计是什么?

A.  为海量数据提供存储的HDFS和对数据进⾏计算的MapReduce

B.  提供整个HDFS⽂件系统的NameSpace(命名空间)管理、块管理等所有服务

C.  Hadoop不仅可以运⾏在企业内部的集群中,也可以运⾏在云计算环境中

D.  Hadoop被视为事实上的⼤数据处理标准

https://www.shititong.cn/cha-kan/shiti/0004b09e-d59b-c0df-c022-e44c3222c300.html
查看题目
211、下列关于推荐系统集群的描述,哪些是正确的?

A.  为了让⽤户从海量信息中⾼效地获得⾃⼰所需的信息,推荐系统应运⽽⽣

B.  推荐系统是⼤数据在互联⽹领域的典型应⽤

C.  推荐系统是⾃动联系⽤户和物品的⼀种⼯具

D.  推荐系统是利⽤⼤数据为⽤户推荐消费内容、调整线下门店布局、控制店内⼈流量

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a32f-a590-c022-e44c3222c300.html
查看题目
试题通小程序
试题通app下载