APP下载
首页
>
IT互联网
>
大数据技术理论题库
搜索
大数据技术理论题库
题目内容
(
单选题
)
7.在大数据分析中,数据预处理的重要性体现在哪里?( )

A、 提高数据分析效率

B、 降低数据存储成本

C、 增加数据体量

D、 改变数据类型

答案:A

大数据技术理论题库
226、下⾯关于主服务器Master主要负责表和Region的管理⼯作的描述,哪个是错误的?
https://www.shititong.cn/cha-kan/shiti/0004b09e-d5d6-90e2-c022-e44c3222c300.html
点击查看题目
15、⼤数据的两个核⼼技术是什么?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a2f7-ce5c-c022-e44c3222c300.html
点击查看题目
140、YARN的⽬标就是实现”⼀个集群多个框架”,为什么?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a31c-9567-c022-e44c3222c300.html
点击查看题目
230、关系数据库已经流⾏很多年,并且Hadoop已经有了HDFS和MapReduce,为什么需要HBase?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a335-198a-c022-e44c3222c300.html
点击查看题目
38、Hadoop集群的整体性能主要受到什么因素影响?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a2fe-e40c-c022-e44c3222c300.html
点击查看题目
14、下⾯哪个属于⼤数据的应⽤领域?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a2f7-48ca-c022-e44c3222c300.html
点击查看题目
169、下列关于Storm的描述,有误的是?
https://www.shititong.cn/cha-kan/shiti/0004b09e-d5c6-f7d7-c022-e44c3222c300.html
点击查看题目
224、HBase中需要根据某些因素来确定⼀个单元格,这些因素可以视为⼀个”四维坐标”,下⾯哪个不属于”四维坐标”?
https://www.shititong.cn/cha-kan/shiti/0004b09e-d5d5-4891-c022-e44c3222c300.html
点击查看题目
120、下列说法正确的是?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a317-0541-c022-e44c3222c300.html
点击查看题目
123、下列哪项是Hadoop⽣态系统中Spark的功能?
https://www.shititong.cn/cha-kan/shiti/0004b09e-d5b8-6ec9-c022-e44c3222c300.html
点击查看题目
首页
>
IT互联网
>
大数据技术理论题库
题目内容
(
单选题
)
手机预览
大数据技术理论题库

7.在大数据分析中,数据预处理的重要性体现在哪里?( )

A、 提高数据分析效率

B、 降低数据存储成本

C、 增加数据体量

D、 改变数据类型

答案:A

分享
大数据技术理论题库
相关题目
226、下⾯关于主服务器Master主要负责表和Region的管理⼯作的描述,哪个是错误的?

A.  实现相同Region服务器之间的负载均衡⾏

B.  在Region分裂或合并后,负责重新调整Region的分布

C.  对发⽣故障失效的Region服务器上的Region进⾏迁移

D.  管理⽤户对表的增加、删除、修改、查询等操作

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5d6-90e2-c022-e44c3222c300.html
点击查看答案
15、⼤数据的两个核⼼技术是什么?

A.  分布式存储

B.  数据处理与分析

C.  分布式处理

D.  数据存储与管理

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a2f7-ce5c-c022-e44c3222c300.html
点击查看答案
140、YARN的⽬标就是实现”⼀个集群多个框架”,为什么?

A.  ⼀个企业当中同时存在各种不同的业务应⽤场景,需要采⽤不同的计算框架

B.  为了避免不同类型应⽤之间互相⼲扰,企业就需要把内部的服务器拆分成多个集群,分别安装运⾏不同的计算框架,即”⼀个框架⼀个集群”

C.  这些产品通常来⾃不同的开发团队,具有各⾃的资源调度管理机制

D.  解决单点故障

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a31c-9567-c022-e44c3222c300.html
点击查看答案
230、关系数据库已经流⾏很多年,并且Hadoop已经有了HDFS和MapReduce,为什么需要HBase?

A.  Hadoop可以很好地解决⼤规模数据的离线批量处理问题,但是,受限于HadoopMapReduce编程框架的⾼延迟数据处理机制,使得

B.  HDFS⾯向批量访问模式,不是随机访问模式

C.  传统的通⽤关系型数据库⽆法应对在数据规模剧增时导致的系统扩展性和性能问题

D.  传统关系数据库在数据结构变化时⼀般需要停机维护;空列浪费存储空间

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a335-198a-c022-e44c3222c300.html
点击查看答案
38、Hadoop集群的整体性能主要受到什么因素影响?

A.  CPU性能

B.  内存

C.  ⽹络

D.  存储容量

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a2fe-e40c-c022-e44c3222c300.html
点击查看答案
14、下⾯哪个属于⼤数据的应⽤领域?

A.  智能医疗研发

B.  监控⾝体情况

C.  实时掌握交通状况

D.  ⾦融交易

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a2f7-48ca-c022-e44c3222c300.html
点击查看答案
169、下列关于Storm的描述,有误的是?

A.  Storm将流数据Stream描述成⼀个有限的Tuple序列

B.  Storm保证每个消息都能完整处理

C.  Storm认为每个Stream都有⼀个源头,并把这个源头抽象为Spout

D.  Bolt可以执⾏过滤、函数操作、Join、操作数据库等任何操作

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5c6-f7d7-c022-e44c3222c300.html
点击查看答案
224、HBase中需要根据某些因素来确定⼀个单元格,这些因素可以视为⼀个”四维坐标”,下⾯哪个不属于”四维坐标”?

A.  关键字

B.  ⾏键

C.  列族

D.  时间戳

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5d5-4891-c022-e44c3222c300.html
点击查看答案
120、下列说法正确的是?

A.  MapReduce体系结构主要由四个部分组成,分别是:Client、JobTracker、TaskTracker以及Task

B.  Task分为MapTask和ReduceTask两种,均由TaskTracker启动

C.  在MapReduce⼯作流程中,所有的数据交换都是通过MapReduce框架⾃⾝去实现的

D.  在MapReduce⼯作流程中,⽤户不能显式地从⼀台机器向另⼀台机器发送消息

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a317-0541-c022-e44c3222c300.html
点击查看答案
123、下列哪项是Hadoop⽣态系统中Spark的功能?

A.  处理⼤规模数据的脚本语⾔

B.  ⼯作流和协作服务引擎,协调Hadoop上运⾏的不同任务

C.  ⽀持DAG作业的计算框架

D.  基于内存的分布式并⾏编程框架,具有较⾼的实时性,并且较好⽀持迭代计算

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5b8-6ec9-c022-e44c3222c300.html
点击查看答案
试题通小程序
试题通app下载