APP下载
首页
>
IT互联网
>
大数据技术理论题库
搜索
大数据技术理论题库
题目内容
(
简答题
)
1.大数据处理流程通常包括数据收集、_____、数据分析和数据可视化等环节。

答案:数据清洗

大数据技术理论题库
2.NoSQL数据库通常用于存储和查询_____数据。
https://www.shititong.cn/cha-kan/shiti/00059ddd-4565-d81d-c057-47291d003a00.html
点击查看题目
158、Spark运⾏架构具有以下哪些特点?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a321-70b0-c022-e44c3222c300.html
点击查看题目
10.数据挖掘在大数据分析中扮演着_____的角色,有助于发现数据中的潜在价值和模式。
https://www.shititong.cn/cha-kan/shiti/00059ddd-4565-e926-c057-47291d003a00.html
点击查看题目
214、⼀个完整的推荐系统通常包括以下哪三个模块?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a331-698c-c022-e44c3222c300.html
点击查看题目
244、下列关于PageRank算法在MapReduce中的实现的描述,错误的是?
https://www.shititong.cn/cha-kan/shiti/0004b09e-d5db-3349-c022-e44c3222c300.html
点击查看题目
258、在每个超步中,Worker会对⾃⼰所管辖的分区中的每个顶点进⾏遍历,并调⽤顶点上的Compute()函数,在调⽤时,会把以下哪些参数传递进去?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a33e-6fb3-c022-e44c3222c300.html
点击查看题目
191、信息图表是信息、数据、知识等的视觉化表达,下列哪个说法正确?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a329-c51e-c022-e44c3222c300.html
点击查看题目
36、下列关于Hadoop的描述,哪些是正确的?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a2fd-d1a8-c022-e44c3222c300.html
点击查看题目
197、下列关于数据可视化的描述,正确的有?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a32d-2af3-c022-e44c3222c300.html
点击查看题目
154、下列说法中,哪些选项描述正确?
https://www.shititong.cn/cha-kan/shiti/0004b0a1-a31f-1014-c022-e44c3222c300.html
点击查看题目
首页
>
IT互联网
>
大数据技术理论题库
题目内容
(
简答题
)
手机预览
大数据技术理论题库

1.大数据处理流程通常包括数据收集、_____、数据分析和数据可视化等环节。

答案:数据清洗

分享
大数据技术理论题库
相关题目
2.NoSQL数据库通常用于存储和查询_____数据。
https://www.shititong.cn/cha-kan/shiti/00059ddd-4565-d81d-c057-47291d003a00.html
点击查看答案
158、Spark运⾏架构具有以下哪些特点?

A.  每个Application都有⾃⼰专属的Executor进程,并且该进程在Application运⾏期间⼀直驻留

B.  Executor进程以多线程的⽅式运⾏Task

C.  Spark运⾏过程与资源管理器⽆关,只要能够获取Executor进程并保持通信即可

D.  Task采⽤了数据本地性和推测执⾏等优化机制

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a321-70b0-c022-e44c3222c300.html
点击查看答案
10.数据挖掘在大数据分析中扮演着_____的角色,有助于发现数据中的潜在价值和模式。
https://www.shititong.cn/cha-kan/shiti/00059ddd-4565-e926-c057-47291d003a00.html
点击查看答案
214、⼀个完整的推荐系统通常包括以下哪三个模块?

A.  ⽤户建模模块

B.  数据采集模块

C.  推荐对象建模模块

D.  推荐算法模块

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a331-698c-c022-e44c3222c300.html
点击查看答案
244、下列关于PageRank算法在MapReduce中的实现的描述,错误的是?

A.  解析⽹页的任务就是分析⼀个页⾯的链接数,但是不赋初值

B.  PageRank分配就是多次迭代计算页⾯的PageRank值

C.  收敛阶段的任务就是由⼀个⾮并⾏组件决定是否达到收敛

D.  ⼀般判断是否收敛的条件是所有⽹页的PageRank值不再变化,或者运⾏30次以后我们就认为已经收敛了

https://www.shititong.cn/cha-kan/shiti/0004b09e-d5db-3349-c022-e44c3222c300.html
点击查看答案
258、在每个超步中,Worker会对⾃⼰所管辖的分区中的每个顶点进⾏遍历,并调⽤顶点上的Compute()函数,在调⽤时,会把以下哪些参数传递进去?

A.  该顶点的当前值

B.  ⼀个接收到的消息的迭代器

C.  ⼀个出射边的迭代器

D.  标志位,⽤来标记顶点是否处于活跃状态

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a33e-6fb3-c022-e44c3222c300.html
点击查看答案
191、信息图表是信息、数据、知识等的视觉化表达,下列哪个说法正确?

A.  ⾕歌公司的制图服务接⼝GoogleChartAPI,可以⽤来为统计数据并⾃动⽣成图⽚

B.  D3是最流⾏的可视化库之⼀,是⼀个⽤于⽹页作图、⽣成互动图形的JavaScrip函数库

C.  Visual.ly可以⽤它来快速创建⾃定义的、样式美观且具有强烈视觉冲击⼒的信息图表

D.  ⼤数据魔镜是⼀款优秀的国产数据分析软件,它丰富的数据公式和算法可以让⽤户真正理解探索分析数据

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a329-c51e-c022-e44c3222c300.html
点击查看答案
36、下列关于Hadoop的描述,哪些是正确的?

A.  为⽤户提供了系统底层细节透明的分布式基础架构

B.  具有很好的跨平台特性

C.  可以部署在廉价的计算机集群中

D.  被公认为⾏业⼤数据标准开源软件

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a2fd-d1a8-c022-e44c3222c300.html
点击查看答案
197、下列关于数据可视化的描述,正确的有?

A.  数据可视化是指将⼤型数据集中的数据以图形图像形式表⽰

B.  数据可视化技术的基本思想是将数据库中每⼀个数据项作为单个图元素表⽰

C.  利⽤数据分析和开发⼯具发现其中未知信息的处理过程

D.  将数据的各个属性值以⼀维数据的形式表⽰

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a32d-2af3-c022-e44c3222c300.html
点击查看答案
154、下列说法中,哪些选项描述正确?

A.  Spark在借鉴HadoopMapReduce优点的同时,很好地解决了MapReduce所⾯临的问题

B.  Spark的计算模式也属于MapReduce,但不局限于Map和Reduce操作

C.  HadoopMapReduce编程模型⽐Spark更灵活

D.  HadoopMapReduce提供了内存计算,可将中间结果放到内存中,对于迭代运算效率更⾼

https://www.shititong.cn/cha-kan/shiti/0004b0a1-a31f-1014-c022-e44c3222c300.html
点击查看答案
试题通小程序
试题通app下载