APP下载
首页
>
IT互联网
>
大数据技术理论题库
搜索
大数据技术理论题库
题目内容
(
多选题
)
180、下列关于Samza的描述,哪些是正确的?

A、 ⼀个作业(Job)是对⼀组输⼊流进⾏处理转化成输出流的程序

B、 Samza的流数据单位既不是Storm中的元组,也不是SparkStreaming中的DStream,⽽是⼀条条消息

C、 ⼀个作业会被进⼀步分割成多个任务(Task)来执⾏

D、 分区之间没有定义顺序,从⽽允许每⼀个任务独⽴执⾏

答案:ABCD

大数据技术理论题库
163、下列哪项不属于流计算的处理流程的三个阶段?
https://www.shititong.cn/cha-kan/shiti/0004b09e-d5c3-8527-c022-e44c3222c300.html
点击查看题目
82、下列关于云数据库的描述,哪个是错误的?
https://www.shititong.cn/cha-kan/shiti/0004b09e-d5ac-9041-c022-e44c3222c300.html
点击查看题目
32、Hadoop在企业中的应⽤架构包括哪⼏层?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a2fb-98f2-c022-e44c3222c300.html
点击查看题目
235、HBase的三层结构中,三层指的是哪三层?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a337-d6bb-c022-e44c3222c300.html
点击查看题目
53、HDFS采⽤抽象的块概念可以带来以下哪⼏个明显的好处?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a301-f8a5-c022-e44c3222c300.html
点击查看题目
205、下列描述有误的是?
https://www.shititong.cn/cha-kan/shiti/0004b09e-d5d0-5ca1-c022-e44c3222c300.html
点击查看题目
149、Spark⽣态系统组件SparkStreaming的应⽤场景是?
https://www.shititong.cn/cha-kan/shiti/0004b09e-d5c1-64c7-c022-e44c3222c300.html
点击查看题目
141、下列关于Spark的描述,错误的是哪⼀项?
https://www.shititong.cn/cha-kan/shiti/0004b09e-d5bd-0374-c022-e44c3222c300.html
点击查看题目
253、⼀次BSP【BulkSynchronousParallelComputingModel,⼜称”⼤同步”模型】计算过程包括⼀系列全局超步(所谓的超步就是计算中的⼀次迭代),每个超步主要包括哪些组件?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a33b-fc21-c022-e44c3222c300.html
点击查看题目
86、下列关于阿⾥云RDS的说法,哪个是错误的?
https://www.shititong.cn/cha-kan/shiti/0004b09e-d5ae-ba2b-c022-e44c3222c300.html
点击查看题目
首页
>
IT互联网
>
大数据技术理论题库
题目内容
(
多选题
)
手机预览
大数据技术理论题库

180、下列关于Samza的描述,哪些是正确的?

A、 ⼀个作业(Job)是对⼀组输⼊流进⾏处理转化成输出流的程序

B、 Samza的流数据单位既不是Storm中的元组,也不是SparkStreaming中的DStream,⽽是⼀条条消息

C、 ⼀个作业会被进⼀步分割成多个任务(Task)来执⾏

D、 分区之间没有定义顺序,从⽽允许每⼀个任务独⽴执⾏

答案:ABCD

分享
大数据技术理论题库
相关题目
163、下列哪项不属于流计算的处理流程的三个阶段?

A.  数据实时采集

B.  数据批量采集

C.  数据实时计算

D.  实时查询服务

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5c3-8527-c022-e44c3222c300.html
点击查看答案
82、下列关于云数据库的描述,哪个是错误的?

A.  云数据库是部署和虚拟化在云计算环境中的数据库

B.  云数据库是在云计算的⼤背景下发展起来的⼀种新兴的共享基础架构的⽅法

C.  云数据库价格不菲,维护费⽤极其昂贵

D.  云数据库具有⾼可扩展性、⾼可⽤性、采⽤多租形式和⽀持资源有效分发等特点

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5ac-9041-c022-e44c3222c300.html
点击查看答案
32、Hadoop在企业中的应⽤架构包括哪⼏层?

A.  访问层

B.  ⼤数据层

C.  数据源层

D.  ⽹络层

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a2fb-98f2-c022-e44c3222c300.html
点击查看答案
235、HBase的三层结构中,三层指的是哪三层?

A.  Zookeeper⽂件

B.  -ROOT-表

C.  .META.表

D.  数据类型

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a337-d6bb-c022-e44c3222c300.html
点击查看答案
53、HDFS采⽤抽象的块概念可以带来以下哪⼏个明显的好处?

A.  ⽀持⼤规模⽂件存储

B.  简化系统设计

C.  适合数据备份

D.  ⽀持中等规模⽂件存储

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a301-f8a5-c022-e44c3222c300.html
点击查看答案
205、下列描述有误的是?

A.  专家推荐:⼈⼯推荐,由资深的专业⼈⼠来进⾏物品的筛选和推荐,需要较多的⼈⼒成本性

B.  基于统计的推荐:通过机器学习的⽅法去描述内容的特征,并基于内容的特征来发现与之相似的内容

C.  协同过滤推荐:应⽤最早和最为成功的推荐⽅法之⼀

D.  混合推荐:结合多种推荐算法来提升推荐效果

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5d0-5ca1-c022-e44c3222c300.html
点击查看答案
149、Spark⽣态系统组件SparkStreaming的应⽤场景是?

A.  基于历史数据的数据挖掘

B.  图结构数据的处理

C.  基于历史数据的交互式查询

D.  基于实时数据流的数据处理

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5c1-64c7-c022-e44c3222c300.html
点击查看答案
141、下列关于Spark的描述,错误的是哪⼀项?

A.  Spark最初由美国加州伯克利⼤学(UCBerkeley)的AMP实验室于2009年开发

B.  Spark在2014年打破了Hadoop保持的基准排序纪录.

C.  Spark⽤⼗分之⼀的计算资源,获得了⽐Hadoop快3倍的速度

D.  Spark运⾏模式单⼀

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5bd-0374-c022-e44c3222c300.html
点击查看答案
253、⼀次BSP【BulkSynchronousParallelComputingModel,⼜称”⼤同步”模型】计算过程包括⼀系列全局超步(所谓的超步就是计算中的⼀次迭代),每个超步主要包括哪些组件?

A.  局部计算:每个参与的处理器都有⾃⾝的计算任务

B.  通讯:处理器群相互交换数据

C.  栅栏同步:当⼀个处理器遇到”路障”(或栅栏),会等到其他所有处理器完成它们的计算步骤

D.  基于现有的分布式计算平台进⾏图计算

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a33b-fc21-c022-e44c3222c300.html
点击查看答案
86、下列关于阿⾥云RDS的说法,哪个是错误的?

A.  RDS是阿⾥云提供的关系型数据库服务

B.  RDS由专业数据库管理团队维护

C.  RDS具有安全稳定、数据可靠、⾃动备份

D.  RDS实例,是⽤户购买RDS服务的基本单位。在实例中,⽤户只能创建⼀个数据库

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5ae-ba2b-c022-e44c3222c300.html
点击查看答案
试题通小程序
试题通app下载