APP下载

大数据技术理论题库

搜索

大数据技术理论题库

题目内容

(

多选题

)

39、下列关于Hadoop的描述，哪些是错误的?

A、　为⽤户提供了系统顶层分布式基础架构

B、　具有较差的跨平台特性

C、　可以部署在廉价的计算机集群中

D、　被公认为⾏业⼤数据标准开源软件

答案：AB

大数据技术理论题库

211、下列关于推荐系统集群的描述，哪些是正确的?

点击查看题目

41、分布式⽂件系统指的是什么?

点击查看题目

10.数据挖掘在大数据分析中扮演着_____的角色,有助于发现数据中的潜在价值和模式。

点击查看题目

168、下列哪个说法是错误的?

点击查看题目

42、下⾯哪⼀项不属于计算机集群中的节点?

点击查看题目

85、下列关于UMP系统功能的说法，哪个是错误的?

点击查看题目

256、下列对于Pregel的执⾏过程，哪些是正确的?

点击查看题目

57、下列对于客服端的描述，哪些是正确的?

点击查看题目

120、下列说法正确的是?

点击查看题目

180、下列关于Samza的描述，哪些是正确的?

点击查看题目

大数据技术理论题库

题目内容

(

多选题

)

手机预览

大数据技术理论题库

39、下列关于Hadoop的描述，哪些是错误的?

A、　为⽤户提供了系统顶层分布式基础架构

B、　具有较差的跨平台特性

C、　可以部署在廉价的计算机集群中

D、　被公认为⾏业⼤数据标准开源软件

答案：AB

相关题库:

大数据技术理论题库

分享

大数据技术理论题库

相关题目

211、下列关于推荐系统集群的描述，哪些是正确的?

A. 　为了让⽤户从海量信息中⾼效地获得⾃⼰所需的信息，推荐系统应运⽽⽣

B. 　推荐系统是⼤数据在互联⽹领域的典型应⽤

C. 　推荐系统是⾃动联系⽤户和物品的⼀种⼯具

D. 　推荐系统是利⽤⼤数据为⽤户推荐消费内容、调整线下门店布局、控制店内⼈流量

点击查看答案

41、分布式⽂件系统指的是什么?

A. 　把⽂件分布存储到多个计算机节点上，成千上万的计算机节点构成计算机集群

B. 　⽤于在Hadoop与传统数据库之间进⾏数据传递

C. 　⼀个⾼可⽤的，⾼可靠的，分布式的海量⽇志采集、聚合和传输的系统

D. 　⼀种⾼吞吐量的分布式发布订阅消息系统，可以处理消费者规模的⽹站中的所有动作流数据

点击查看答案

10.数据挖掘在大数据分析中扮演着_____的角色,有助于发现数据中的潜在价值和模式。

点击查看答案

168、下列哪个说法是错误的?

A. 　从编程的灵活性来讲，Storm是⽐较理想的选择，它使⽤ApacheThrift，可以⽤任何编程语⾔来编写拓扑结构(Topology)

B. 　当有⼤量的状态需要处理时，⽐如每个分区都有数⼗亿个元组，则可以选择Storm和SparkStreaming

C. 　SparkStreaming⽆法实现毫秒级的流计算

D. 　在Spark上可以统⼀部署SparkSQL，SparkStreaming、MLlib，GraphX等组件，提供便捷的⼀体化编程模型

点击查看答案

42、下⾯哪⼀项不属于计算机集群中的节点?

A. 　源节点(SourceNode)

B. 　主节点(MasterNode)

C. 　名称结点(NameNode)

D. 　节点(SlaveNode)

点击查看答案

85、下列关于UMP系统功能的说法，哪个是错误的?

A. 　充分利⽤主从库实现⽤户读写操作的分离，实现负载均衡

B. 　UMP系统实现了对于⽤户透明的读写分离功能

C. 　UMP采⽤的两种资源隔离⽅式(⽤Cgroup限制MySQL进程资源和在Proxy服务器端限制QPS)

D. 　UMP系统只设计了⼀种机制来保证数据安全

点击查看答案

256、下列对于Pregel的执⾏过程，哪些是正确的?

A. 　选择集群中的多台机器执⾏图计算任务，每台机器上运⾏⽤户程序的⼀个副本

B. 　Master把⼀个图分成多个分区，并把分区分配到多个Worker

C. 　ster会把⽤户输⼊划分成多个部分，通常是基于⽂件边界进⾏划分

D. 　ster向每个Worker发送指令，Worker收到指令后，开始运⾏⼀个超步

点击查看答案

57、下列对于客服端的描述，哪些是正确的?

A. 　客户端是⽤户操作HDFS最常⽤的⽅式，HDFS在部署时都提供了客户端

B. 　HDFS客户端是⼀个库，暴露了HDFS⽂件系统接⼝

C. 　严格来说，客户端并不算是HDFS的⼀部分

D. 　客户端可以⽀持打开、读取、写⼊等常见的操作

点击查看答案

120、下列说法正确的是?

A. 　MapReduce体系结构主要由四个部分组成，分别是:Client、JobTracker、TaskTracker以及Task

B. 　Task分为MapTask和ReduceTask两种，均由TaskTracker启动

C. 　在MapReduce⼯作流程中，所有的数据交换都是通过MapReduce框架⾃⾝去实现的

D. 　在MapReduce⼯作流程中，⽤户不能显式地从⼀台机器向另⼀台机器发送消息

点击查看答案

180、下列关于Samza的描述，哪些是正确的?

A. 　⼀个作业(Job)是对⼀组输⼊流进⾏处理转化成输出流的程序

B. 　Samza的流数据单位既不是Storm中的元组，也不是SparkStreaming中的DStream，⽽是⼀条条消息

C. 　⼀个作业会被进⼀步分割成多个任务(Task)来执⾏

D. 　分区之间没有定义顺序，从⽽允许每⼀个任务独⽴执⾏

点击查看答案

试题通app下载

类似热门题库

应用型子网划分填空题

《数据网组建与维护》课程题库

计算机操作员四级

python单选题题目练习题

python选择填空题库练习

全国计算机一级选择题真题

管理信息理论复习题库

通信专业应知应会题库(最终版）

大数据技术理论题库

2024参考题库理论知识

试题通小程序

试题通app下载

©2016-2024.南通佰易网络科技有限公司
苏ICP备16028519号-2 苏公网安备32061102000302