APP下载
首页
>
IT互联网
>
大数据技术理论题库
搜索
大数据技术理论题库
题目内容
(
单选题
)
7.在大数据分析中,数据预处理的重要性体现在哪里?( )

A、 提高数据分析效率

B、 降低数据存储成本

C、 增加数据体量

D、 改变数据类型

答案:A

大数据技术理论题库
232、HBase访问接⼝类型包括哪些?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a336-31f0-c022-e44c3222c300.html
点击查看题目
205、下列描述有误的是?
https://www.shititong.cn/cha-kan/shiti/0004b09e-d5d0-5ca1-c022-e44c3222c300.html
点击查看题目
227、HBase实际应⽤中的性能优化⽅法不包括下⾯哪⼀项?
https://www.shititong.cn/cha-kan/shiti/0004b09e-d5d7-341e-c022-e44c3222c300.html
点击查看题目
8.云计算通过提供弹性的计算和存储资源,为大数据处理提供了强大的_____支持。
https://www.shititong.cn/cha-kan/shiti/00059ddd-4565-e48b-c057-47291d003a00.html
点击查看题目
32、Hadoop在企业中的应⽤架构包括哪⼏层?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a2fb-98f2-c022-e44c3222c300.html
点击查看题目
157、与HadoopMapReduce计算框架相⽐,Spark所采⽤的Executor具有哪些优点?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a320-d740-c022-e44c3222c300.html
点击查看题目
56、HDFS的命名空间包含什么?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a303-1432-c022-e44c3222c300.html
点击查看题目
169、下列关于Storm的描述,有误的是?
https://www.shititong.cn/cha-kan/shiti/0004b09e-d5c6-f7d7-c022-e44c3222c300.html
点击查看题目
175、下列关于流处理系统与传统的数据处理系统的描述,正确的有?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a325-a063-c022-e44c3222c300.html
点击查看题目
97、为什么说云数据库是个性化数据存储需求的理想选择?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a30f-34a9-c022-e44c3222c300.html
点击查看题目
首页
>
IT互联网
>
大数据技术理论题库
题目内容
(
单选题
)
手机预览
大数据技术理论题库

7.在大数据分析中,数据预处理的重要性体现在哪里?( )

A、 提高数据分析效率

B、 降低数据存储成本

C、 增加数据体量

D、 改变数据类型

答案:A

分享
大数据技术理论题库
相关题目
232、HBase访问接⼝类型包括哪些?

A.  NativeJavaAPI

B.  HBaseShell

C.  ThriftGateway

D.  RESTGateway

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a336-31f0-c022-e44c3222c300.html
点击查看答案
205、下列描述有误的是?

A.  专家推荐:⼈⼯推荐,由资深的专业⼈⼠来进⾏物品的筛选和推荐,需要较多的⼈⼒成本性

B.  基于统计的推荐:通过机器学习的⽅法去描述内容的特征,并基于内容的特征来发现与之相似的内容

C.  协同过滤推荐:应⽤最早和最为成功的推荐⽅法之⼀

D.  混合推荐:结合多种推荐算法来提升推荐效果

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5d0-5ca1-c022-e44c3222c300.html
点击查看答案
227、HBase实际应⽤中的性能优化⽅法不包括下⾯哪⼀项?

A.  创建表的时候,可以通过HColumnDescriptor.setInMemory(true)将表放到Region服务器的缓存中,保证在读取的时候被cache命中

B.  创建表的时候,可以通过HColumnDescriptor.setMaxVersions(intmaxVersions)设置表中数据的最⼤版本,如果只需要保存最新版本的数据,那么可以设置setMaxVersions(1)

C.  创建表的时候,可以通过HColumnDescriptor.setTimeToLive(inttimeToLive)设置表中数据的存储⽣命期

D.  如果最近写⼊HBase表中的数据是最可能被访问的,可以考虑将时间戳作为⾏键的⼀部分

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5d7-341e-c022-e44c3222c300.html
点击查看答案
8.云计算通过提供弹性的计算和存储资源,为大数据处理提供了强大的_____支持。
https://www.shititong.cn/cha-kan/shiti/00059ddd-4565-e48b-c057-47291d003a00.html
点击查看答案
32、Hadoop在企业中的应⽤架构包括哪⼏层?

A.  访问层

B.  ⼤数据层

C.  数据源层

D.  ⽹络层

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a2fb-98f2-c022-e44c3222c300.html
点击查看答案
157、与HadoopMapReduce计算框架相⽐,Spark所采⽤的Executor具有哪些优点?

A.  利⽤多线程来执⾏具体的任务,减少任务的启动开销

B.  Executor中有⼀个BlockManager存储模块,有效减少IO开销

C.  提供了⼀种⾼度受限的共享内存模型

D.  不同场景之间输⼊输出数据能做到⽆缝共享

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a320-d740-c022-e44c3222c300.html
点击查看答案
56、HDFS的命名空间包含什么?

A.  ⽬录

B.  ⽂件

C.  块

D.  磁盘

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a303-1432-c022-e44c3222c300.html
点击查看答案
169、下列关于Storm的描述,有误的是?

A.  Storm将流数据Stream描述成⼀个有限的Tuple序列

B.  Storm保证每个消息都能完整处理

C.  Storm认为每个Stream都有⼀个源头,并把这个源头抽象为Spout

D.  Bolt可以执⾏过滤、函数操作、Join、操作数据库等任何操作

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5c6-f7d7-c022-e44c3222c300.html
点击查看答案
175、下列关于流处理系统与传统的数据处理系统的描述,正确的有?

A.  流处理系统处理的是实时的数据,⽽传统的数据处理系统处理的是预先存储好的静态数据

B.  ⽤户通过流处理系统获取的是实时结果,⽽通过传统的数据处理系统,获取的是过去某⼀时刻的结果

C.  流处理系统⽆需⽤户主动发出查询,实时查询服务可以主动将结果推送给⽤户

D.  传统的数据处理系统系统⽆需⽤户主动发出查询,批量查询服务可以主动将结果推送给⽤户

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a325-a063-c022-e44c3222c300.html
点击查看答案
97、为什么说云数据库是个性化数据存储需求的理想选择?

A.  云数据库可以满⾜⼤企业的海量数据存储需求

B.  云数据库可以满⾜中⼩企业的低成本数据存储需求

C.  云数据库可以满⾜企业动态变化的数据存储需求

D.  前期零投⼊、后期免维护的数据库服务,可以很好满⾜它们的需求

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a30f-34a9-c022-e44c3222c300.html
点击查看答案
试题通小程序
试题通app下载