APP下载

大数据技术理论题库

搜索

大数据技术理论题库

题目内容

(

多选题

)

159、Spark采⽤RDD以后能够实现⾼效计算的原因主要在于?

A、　⾼效的容错性

B、　中间结果持久化到内存，数据在内存中的多个

C、　存放的数据可以是Java对象，避免了不必要的对象序列化和反序列化

D、　现有容错机制:数据复制或者记录⽇志

答案：BC

大数据技术理论题库

190、在⼤数据时代，可视化技术可以⽀持实现哪些⽬标?

点击查看题目

227、HBase实际应⽤中的性能优化⽅法不包括下⾯哪⼀项?

点击查看题目

14、下⾯哪个属于⼤数据的应⽤领域?

点击查看题目

120、下列说法正确的是?

点击查看题目

246、下列哪项不属于在Vetex类中的值类型参数?

点击查看题目

64、下列关于键值数据库的描述，哪⼀项是错误的?

点击查看题目

3.关系型数据库与非关系型数据库的主要区别是什么?( )

点击查看题目

148、下列哪⼀项不属于Spark架构的优点?

点击查看题目

168、下列哪个说法是错误的?

点击查看题目

7.在大数据可视化中,常用的技术包括_____、热力图和散点图等。

点击查看题目

大数据技术理论题库

题目内容

(

多选题

)

手机预览

大数据技术理论题库

159、Spark采⽤RDD以后能够实现⾼效计算的原因主要在于?

A、　⾼效的容错性

B、　中间结果持久化到内存，数据在内存中的多个

C、　存放的数据可以是Java对象，避免了不必要的对象序列化和反序列化

D、　现有容错机制:数据复制或者记录⽇志

答案：BC

相关题库:

大数据技术理论题库

分享

大数据技术理论题库

相关题目

190、在⼤数据时代，可视化技术可以⽀持实现哪些⽬标?

A. 　观测、跟踪数据

B. 　分析数据

C. 　辅助理解数据

D. 　增强数据吸引⼒

点击查看答案

227、HBase实际应⽤中的性能优化⽅法不包括下⾯哪⼀项?

A. 　创建表的时候，可以通过HColumnDescriptor.setInMemory(true)将表放到Region服务器的缓存中，保证在读取的时候被cache命中

B. 　创建表的时候，可以通过HColumnDescriptor.setMaxVersions(intmaxVersions)设置表中数据的最⼤版本，如果只需要保存最新版本的数据，那么可以设置setMaxVersions(1)

C. 　创建表的时候，可以通过HColumnDescriptor.setTimeToLive(inttimeToLive)设置表中数据的存储⽣命期

D. 　如果最近写⼊HBase表中的数据是最可能被访问的，可以考虑将时间戳作为⾏键的⼀部分

点击查看答案

14、下⾯哪个属于⼤数据的应⽤领域?

A. 　智能医疗研发

B. 　监控⾝体情况

C. 　实时掌握交通状况

D. 　⾦融交易

点击查看答案

120、下列说法正确的是?

A. 　MapReduce体系结构主要由四个部分组成，分别是:Client、JobTracker、TaskTracker以及Task

B. 　Task分为MapTask和ReduceTask两种，均由TaskTracker启动

C. 　在MapReduce⼯作流程中，所有的数据交换都是通过MapReduce框架⾃⾝去实现的

D. 　在MapReduce⼯作流程中，⽤户不能显式地从⼀台机器向另⼀台机器发送消息

点击查看答案

246、下列哪项不属于在Vetex类中的值类型参数?

A. 　顶点的出度

B. 　顶点

C. 　边

D. 　消息

点击查看答案

64、下列关于键值数据库的描述，哪⼀项是错误的?

A. 　扩展性好，灵活性好

B. 　⼤量写操作时性能⾼

C. 　⽆法存储结构化信息

D. 　条件查询效率⾼

点击查看答案

3.关系型数据库与非关系型数据库的主要区别是什么?( )

A. 数据存储方式

B. 数据传输速度

C. 数据查询语言

D. 数据安全性

点击查看答案

148、下列哪⼀项不属于Spark架构的优点?

A. 　实现⼀键式安装和配置、线程级别的任务监控和告警

B. 　降低硬件集群、软件维护、任务监控和应⽤开发的难度

C. 　便于做成统⼀的硬件、计算平台资源池

D. 　不⽤负载应⽤混搭，集群利⽤率⾼

点击查看答案

168、下列哪个说法是错误的?

A. 　从编程的灵活性来讲，Storm是⽐较理想的选择，它使⽤ApacheThrift，可以⽤任何编程语⾔来编写拓扑结构(Topology)

B. 　当有⼤量的状态需要处理时，⽐如每个分区都有数⼗亿个元组，则可以选择Storm和SparkStreaming

C. 　SparkStreaming⽆法实现毫秒级的流计算

D. 　在Spark上可以统⼀部署SparkSQL，SparkStreaming、MLlib，GraphX等组件，提供便捷的⼀体化编程模型

点击查看答案

7.在大数据可视化中,常用的技术包括_____、热力图和散点图等。

点击查看答案

试题通app下载

类似热门题库

应用型子网划分填空题

《数据网组建与维护》课程题库

计算机操作员四级

python单选题题目练习题

python选择填空题库练习

全国计算机一级选择题真题

管理信息理论复习题库

通信专业应知应会题库(最终版）

大数据技术理论题库

2024参考题库理论知识

试题通小程序

试题通app下载

©2016-2024.南通佰易网络科技有限公司
苏ICP备16028519号-2 苏公网安备32061102000302