APP下载

大数据技术理论题库

搜索

大数据技术理论题库

题目内容

(

多选题

)

116、下列关于Map端的Shuffle的描述，哪些是正确的?

A、　MapReduce默认1000MB缓存

B、　多个溢写⽂件归并成⼀个或多个⼤⽂件，⽂件中的键值对是排序的

C、　当数据很少时，不需要溢写到磁盘，直接在缓存中归并，然后输出给Reduce

D、　每个Map任务分配多个缓存，使得任务运⾏更有效率

答案：BC

大数据技术理论题库

36、下列关于Hadoop的描述，哪些是正确的?

点击查看题目

159、Spark采⽤RDD以后能够实现⾼效计算的原因主要在于?

点击查看题目

207、下列关于协同过滤的说法，哪⼀项是错误的?

点击查看题目

1.大数据处理流程通常包括数据收集、_____、数据分析和数据可视化等环节。

点击查看题目

98、下列关于云数据库与其他数据库的关系，哪些是正确的?

点击查看题目

165、下列关于Storm设计思想，描述有误的是?

点击查看题目

52、HDFS特殊的设计，在实现上述优良特性的同时，也使得⾃⾝具有⼀些应⽤局限性，主要包括以下哪⼏个⽅⾯?

点击查看题目

206、下列哪⼀项不属于完整推荐系统的三个模块之⼀?

点击查看题目

63、下列哪⼀项不属于NoSQL的四⼤类型?

点击查看题目

92、下列关于云数据库的描述，哪些是正确的?

点击查看题目

大数据技术理论题库

题目内容

(

多选题

)

手机预览

大数据技术理论题库

116、下列关于Map端的Shuffle的描述，哪些是正确的?

A、　MapReduce默认1000MB缓存

B、　多个溢写⽂件归并成⼀个或多个⼤⽂件，⽂件中的键值对是排序的

C、　当数据很少时，不需要溢写到磁盘，直接在缓存中归并，然后输出给Reduce

D、　每个Map任务分配多个缓存，使得任务运⾏更有效率

答案：BC

相关题库:

大数据技术理论题库

分享

大数据技术理论题库

相关题目

36、下列关于Hadoop的描述，哪些是正确的?

A. 　为⽤户提供了系统底层细节透明的分布式基础架构

B. 　具有很好的跨平台特性

C. 　可以部署在廉价的计算机集群中

D. 　被公认为⾏业⼤数据标准开源软件

点击查看答案

159、Spark采⽤RDD以后能够实现⾼效计算的原因主要在于?

A. 　⾼效的容错性

B. 　中间结果持久化到内存，数据在内存中的多个

C. 　存放的数据可以是Java对象，避免了不必要的对象序列化和反序列化

D. 　现有容错机制:数据复制或者记录⽇志

点击查看答案

207、下列关于协同过滤的说法，哪⼀项是错误的?

A. 　协同过滤可分为基于⽤户的协同过滤和基于物品的协同过滤

B. 　UserCF算法符合⼈们对于”趣味相投”的认知，即兴趣相似的⽤户往往有相同的物品喜好

C. 　实现UserCF算法的关键步骤是计算物品与物品之间的相似度

D. 　基于物品的协同过滤算法(简称ItemCF算法)是⽬前业界应⽤最多的算法

点击查看答案

1.大数据处理流程通常包括数据收集、_____、数据分析和数据可视化等环节。

点击查看答案

98、下列关于云数据库与其他数据库的关系，哪些是正确的?

A. 　从数据模型的⾓度来说，云数据库并⾮⼀种全新的数据库技术

B. 　云数据库并没有专属于⾃⼰的数据模型，云数据库所采⽤的数据模型可以是关系数据库所使⽤的关系模型

C. 　同⼀个公司只能提供采⽤不同数据模型的单个云数据库服务

D. 　许多公司在开发云数据库时，后端数据库都是直接使⽤现有的各种关系数据库或NoSQL数据库产品

点击查看答案

165、下列关于Storm设计思想，描述有误的是?

A. 　Storm将Streams的状态转换过程抽象为Spout

B. 　Storm认为每个Stream都有⼀个源头，并把这个源头抽象为Spout

C. 　Storm将Spouts和Bolts组成的⽹络抽象成Topology

D. 　Topology⾥⾯的每个处理组件(Spout或Bolt)都包含处理逻辑，⽽组件之间的连接则表⽰数据流动的⽅向

点击查看答案

52、HDFS特殊的设计，在实现上述优良特性的同时，也使得⾃⾝具有⼀些应⽤局限性，主要包括以下哪⼏个⽅⾯?

A. 　不适合低延迟数据访问

B. 　⽆法⾼效存储⼤量⼩⽂件

C. 　不⽀持多⽤户写⼊及任意修改⽂件

D. 　较差的跨平台兼容性

点击查看答案

206、下列哪⼀项不属于完整推荐系统的三个模块之⼀?

A. 　⽤户建模模块

B. 　推荐对象建模模块

C. 　推荐算法模块

D. 　数据采集模块

点击查看答案

63、下列哪⼀项不属于NoSQL的四⼤类型?

A. 　⽂档数据库

B. 　图数据库

C. 　列族数据库

D. 　时间戳数据库

点击查看答案

92、下列关于云数据库的描述，哪些是正确的?

A. 　Amazon是云数据库市场的先⾏者

B. 　GoogleCloudSQL是⾕歌公司推出的基于MySQL的云数据库

C. 　从数据模型的⾓度来说，云数据库并⾮⼀种全新的数据库技术

D. 　云数据库并没有专属于⾃⼰的数据模型

点击查看答案

试题通app下载

类似热门题库

应用型子网划分填空题

《数据网组建与维护》课程题库

计算机操作员四级

python单选题题目练习题

python选择填空题库练习

全国计算机一级选择题真题

管理信息理论复习题库

通信专业应知应会题库(最终版）

大数据技术理论题库

2024参考题库理论知识

试题通小程序

试题通app下载

©2016-2024.南通佰易网络科技有限公司
苏ICP备16028519号-2 苏公网安备32061102000302