APP下载
首页
>
IT互联网
>
大数据技术理论题库
搜索
大数据技术理论题库
题目内容
(
多选题
)
116、下列关于Map端的Shuffle的描述,哪些是正确的?

A、 MapReduce默认1000MB缓存

B、 多个溢写⽂件归并成⼀个或多个⼤⽂件,⽂件中的键值对是排序的

C、 当数据很少时,不需要溢写到磁盘,直接在缓存中归并,然后输出给Reduce

D、 每个Map任务分配多个缓存,使得任务运⾏更有效率

答案:BC

大数据技术理论题库
36、下列关于Hadoop的描述,哪些是正确的?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a2fd-d1a8-c022-e44c3222c300.html
点击查看题目
159、Spark采⽤RDD以后能够实现⾼效计算的原因主要在于?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a321-fd89-c022-e44c3222c300.html
点击查看题目
207、下列关于协同过滤的说法,哪⼀项是错误的?
https://www.shititong.cn/cha-kan/shiti/0004b09e-d5d1-70ac-c022-e44c3222c300.html
点击查看题目
1.大数据处理流程通常包括数据收集、_____、数据分析和数据可视化等环节。
https://www.shititong.cn/cha-kan/shiti/00059ddd-4565-d629-c057-47291d003a00.html
点击查看题目
98、下列关于云数据库与其他数据库的关系,哪些是正确的?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a30f-d098-c022-e44c3222c300.html
点击查看题目
165、下列关于Storm设计思想,描述有误的是?
https://www.shititong.cn/cha-kan/shiti/0004b09e-d5c4-a1b5-c022-e44c3222c300.html
点击查看题目
52、HDFS特殊的设计,在实现上述优良特性的同时,也使得⾃⾝具有⼀些应⽤局限性,主要包括以下哪⼏个⽅⾯?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a301-64da-c022-e44c3222c300.html
点击查看题目
206、下列哪⼀项不属于完整推荐系统的三个模块之⼀?
https://www.shititong.cn/cha-kan/shiti/0004b09e-d5d0-df5e-c022-e44c3222c300.html
点击查看题目
63、下列哪⼀项不属于NoSQL的四⼤类型?
https://www.shititong.cn/cha-kan/shiti/0004b09e-d5a7-8740-c022-e44c3222c300.html
点击查看题目
92、下列关于云数据库的描述,哪些是正确的?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a30c-3f5e-c022-e44c3222c300.html
点击查看题目
首页
>
IT互联网
>
大数据技术理论题库
题目内容
(
多选题
)
手机预览
大数据技术理论题库

116、下列关于Map端的Shuffle的描述,哪些是正确的?

A、 MapReduce默认1000MB缓存

B、 多个溢写⽂件归并成⼀个或多个⼤⽂件,⽂件中的键值对是排序的

C、 当数据很少时,不需要溢写到磁盘,直接在缓存中归并,然后输出给Reduce

D、 每个Map任务分配多个缓存,使得任务运⾏更有效率

答案:BC

分享
大数据技术理论题库
相关题目
36、下列关于Hadoop的描述,哪些是正确的?

A.  为⽤户提供了系统底层细节透明的分布式基础架构

B.  具有很好的跨平台特性

C.  可以部署在廉价的计算机集群中

D.  被公认为⾏业⼤数据标准开源软件

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a2fd-d1a8-c022-e44c3222c300.html
点击查看答案
159、Spark采⽤RDD以后能够实现⾼效计算的原因主要在于?

A.  ⾼效的容错性

B.  中间结果持久化到内存,数据在内存中的多个

C.  存放的数据可以是Java对象,避免了不必要的对象序列化和反序列化

D.  现有容错机制:数据复制或者记录⽇志

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a321-fd89-c022-e44c3222c300.html
点击查看答案
207、下列关于协同过滤的说法,哪⼀项是错误的?

A.  协同过滤可分为基于⽤户的协同过滤和基于物品的协同过滤

B.  UserCF算法符合⼈们对于”趣味相投”的认知,即兴趣相似的⽤户往往有相同的物品喜好

C.  实现UserCF算法的关键步骤是计算物品与物品之间的相似度

D.  基于物品的协同过滤算法(简称ItemCF算法)是⽬前业界应⽤最多的算法

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5d1-70ac-c022-e44c3222c300.html
点击查看答案
1.大数据处理流程通常包括数据收集、_____、数据分析和数据可视化等环节。
https://www.shititong.cn/cha-kan/shiti/00059ddd-4565-d629-c057-47291d003a00.html
点击查看答案
98、下列关于云数据库与其他数据库的关系,哪些是正确的?

A.  从数据模型的⾓度来说,云数据库并⾮⼀种全新的数据库技术

B.  云数据库并没有专属于⾃⼰的数据模型,云数据库所采⽤的数据模型可以是关系数据库所使⽤的关系模型

C.  同⼀个公司只能提供采⽤不同数据模型的单个云数据库服务

D.  许多公司在开发云数据库时,后端数据库都是直接使⽤现有的各种关系数据库或NoSQL数据库产品

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a30f-d098-c022-e44c3222c300.html
点击查看答案
165、下列关于Storm设计思想,描述有误的是?

A.  Storm将Streams的状态转换过程抽象为Spout

B.  Storm认为每个Stream都有⼀个源头,并把这个源头抽象为Spout

C.  Storm将Spouts和Bolts组成的⽹络抽象成Topology

D.  Topology⾥⾯的每个处理组件(Spout或Bolt)都包含处理逻辑,⽽组件之间的连接则表⽰数据流动的⽅向

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5c4-a1b5-c022-e44c3222c300.html
点击查看答案
52、HDFS特殊的设计,在实现上述优良特性的同时,也使得⾃⾝具有⼀些应⽤局限性,主要包括以下哪⼏个⽅⾯?

A.  不适合低延迟数据访问

B.  ⽆法⾼效存储⼤量⼩⽂件

C.  不⽀持多⽤户写⼊及任意修改⽂件

D.  较差的跨平台兼容性

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a301-64da-c022-e44c3222c300.html
点击查看答案
206、下列哪⼀项不属于完整推荐系统的三个模块之⼀?

A.  ⽤户建模模块

B.  推荐对象建模模块

C.  推荐算法模块

D.  数据采集模块

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5d0-df5e-c022-e44c3222c300.html
点击查看答案
63、下列哪⼀项不属于NoSQL的四⼤类型?

A.  ⽂档数据库

B.  图数据库

C.  列族数据库

D.  时间戳数据库

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5a7-8740-c022-e44c3222c300.html
点击查看答案
92、下列关于云数据库的描述,哪些是正确的?

A.  Amazon是云数据库市场的先⾏者

B.  GoogleCloudSQL是⾕歌公司推出的基于MySQL的云数据库

C.  从数据模型的⾓度来说,云数据库并⾮⼀种全新的数据库技术

D.  云数据库并没有专属于⾃⼰的数据模型

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a30c-3f5e-c022-e44c3222c300.html
点击查看答案
试题通小程序
试题通app下载