APP下载
首页
>
IT互联网
>
大数据技术理论题库
搜索
大数据技术理论题库
题目内容
(
单选题
)
2.在大数据处理流程中,数据清洗的主要目的是什么?( )

A、 增加数据量

B、 删除重复数据

C、 提高数据质量

D、 降低存储空间

答案:C

大数据技术理论题库
204、下列哪⼀项不属于推荐算法?
https://www.shititong.cn/cha-kan/shiti/0004b09e-d5cf-cfc4-c022-e44c3222c300.html
点击查看题目
106、下列关于Map和Reduce函数的描述,哪个是错误的?
https://www.shititong.cn/cha-kan/shiti/0004b09e-d5b4-6fbf-c022-e44c3222c300.html
点击查看题目
207、下列关于协同过滤的说法,哪⼀项是错误的?
https://www.shititong.cn/cha-kan/shiti/0004b09e-d5d1-70ac-c022-e44c3222c300.html
点击查看题目
232、HBase访问接⼝类型包括哪些?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a336-31f0-c022-e44c3222c300.html
点击查看题目
4.论述大数据安全面临的挑战及其应对措施。
https://www.shititong.cn/cha-kan/shiti/00059ddd-4565-f142-c057-47291d003a00.html
点击查看题目
4.大数据安全的主要目标是保护数据的______、完整性和可用性。
https://www.shititong.cn/cha-kan/shiti/00059ddd-4565-dc72-c057-47291d003a00.html
点击查看题目
154、下列说法中,哪些选项描述正确?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a31f-1014-c022-e44c3222c300.html
点击查看题目
7.在大数据可视化中,常用的技术包括_____、热力图和散点图等。
https://www.shititong.cn/cha-kan/shiti/00059ddd-4565-e2ad-c057-47291d003a00.html
点击查看题目
104、下列关于MapReduce⼯作流程,哪个描述是正确的?
https://www.shititong.cn/cha-kan/shiti/0004b09e-d5b3-4640-c022-e44c3222c300.html
点击查看题目
69、下列关于NoSQL与关系数据库的⽐较,哪个说法是错误的?
https://www.shititong.cn/cha-kan/shiti/0004b09e-d5aa-e3ad-c022-e44c3222c300.html
点击查看题目
首页
>
IT互联网
>
大数据技术理论题库
题目内容
(
单选题
)
手机预览
大数据技术理论题库

2.在大数据处理流程中,数据清洗的主要目的是什么?( )

A、 增加数据量

B、 删除重复数据

C、 提高数据质量

D、 降低存储空间

答案:C

分享
大数据技术理论题库
相关题目
204、下列哪⼀项不属于推荐算法?

A.  基于物品和商家的联合协同推荐

B.  基于统计的推荐

C.  专家推荐

D.  基于内容的推荐

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5cf-cfc4-c022-e44c3222c300.html
点击查看答案
106、下列关于Map和Reduce函数的描述,哪个是错误的?

A.  Map将⼩数据集进⼀步解析成⼀批对,输⼊Map函数中进⾏处理

B.  Map每⼀个输⼊的会输出⼀批是计算的中间结果

C.  Reduce输⼊的中间结果中的List(v2)表⽰是⼀批属于不同⼀个k2的value

D.  Reduce输⼊的中间结果中的List(v2)表⽰是⼀批属于同⼀个k2的value

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5b4-6fbf-c022-e44c3222c300.html
点击查看答案
207、下列关于协同过滤的说法,哪⼀项是错误的?

A.  协同过滤可分为基于⽤户的协同过滤和基于物品的协同过滤

B.  UserCF算法符合⼈们对于”趣味相投”的认知,即兴趣相似的⽤户往往有相同的物品喜好

C.  实现UserCF算法的关键步骤是计算物品与物品之间的相似度

D.  基于物品的协同过滤算法(简称ItemCF算法)是⽬前业界应⽤最多的算法

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5d1-70ac-c022-e44c3222c300.html
点击查看答案
232、HBase访问接⼝类型包括哪些?

A.  NativeJavaAPI

B.  HBaseShell

C.  ThriftGateway

D.  RESTGateway

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a336-31f0-c022-e44c3222c300.html
点击查看答案
4.论述大数据安全面临的挑战及其应对措施。
https://www.shititong.cn/cha-kan/shiti/00059ddd-4565-f142-c057-47291d003a00.html
点击查看答案
4.大数据安全的主要目标是保护数据的______、完整性和可用性。
https://www.shititong.cn/cha-kan/shiti/00059ddd-4565-dc72-c057-47291d003a00.html
点击查看答案
154、下列说法中,哪些选项描述正确?

A.  Spark在借鉴HadoopMapReduce优点的同时,很好地解决了MapReduce所⾯临的问题

B.  Spark的计算模式也属于MapReduce,但不局限于Map和Reduce操作

C.  HadoopMapReduce编程模型⽐Spark更灵活

D.  HadoopMapReduce提供了内存计算,可将中间结果放到内存中,对于迭代运算效率更⾼

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a31f-1014-c022-e44c3222c300.html
点击查看答案
7.在大数据可视化中,常用的技术包括_____、热力图和散点图等。
https://www.shititong.cn/cha-kan/shiti/00059ddd-4565-e2ad-c057-47291d003a00.html
点击查看答案
104、下列关于MapReduce⼯作流程,哪个描述是正确的?

A.  所有的数据交换都是通过MapReduce框架⾃⾝去实现的

B.  不同的Map任务之间会进⾏通信

C.  不同的Reduce任务之间可以发⽣信息交换

D.  ⽤户可以显式地从⼀台机器向另⼀台机器发送消息

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5b3-4640-c022-e44c3222c300.html
点击查看答案
69、下列关于NoSQL与关系数据库的⽐较,哪个说法是错误的?

A.  在⼀致性⽅⾯,RDBMS强于NoSQL

B.  在数据完整性⽅⾯,RDBMS容易实现

C.  在扩展性⽅⾯,NoSQL⽐较好

D.  在可⽤性⽅⾯,NoSQL优于RDBMS

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5aa-e3ad-c022-e44c3222c300.html
点击查看答案
试题通小程序
试题通app下载