A、 ⼤数据成为⼀种新的决策⽅式
B、 ⼤数据应⽤促进信息技术与各⾏业的深度融合
C、 ⼤数据开发推动新技术和新应⽤的不断涌现
D、 ⼤数据使得数据科学家成为热门职业
答案:ABC
A、 ⼤数据成为⼀种新的决策⽅式
B、 ⼤数据应⽤促进信息技术与各⾏业的深度融合
C、 ⼤数据开发推动新技术和新应⽤的不断涌现
D、 ⼤数据使得数据科学家成为热门职业
答案:ABC
A. 大数据可以脱离云计算独立存在
B. 云计算为大数据提供存储和计算资源
C. 大数据和云计算是两个毫不相关的领域
D. 云计算只能处理结构化大数据
A. 复杂的批量数据处理:通常时间跨度在数⼗分钟到数⼩时之间
B. 基于历史数据的交互式查询:通常时间跨度在数⼗秒到数分钟之间
C. 基于实时数据流的数据处理:通常时间跨度在数⼗秒到数分钟之间
D. 基于实时数据流的数据处理:通常时间跨度在数百毫秒到数秒之间
A. 把⽂件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群
B. ⽤于在Hadoop与传统数据库之间进⾏数据传递
C. ⼀个⾼可⽤的,⾼可靠的,分布式的海量⽇志采集、聚合和传输的系统
D. ⼀种⾼吞吐量的分布式发布订阅消息系统,可以处理消费者规模的⽹站中的所有动作流数据
A. 个⼈计算机
B. 物联⽹
C. 云计算和⼤数据
D. 互联⽹
A. 负责数据的存储和读取
B. 根据客户端或者是名称节点的调度来进⾏数据的存储和检索
C. 向名称节点定期发送⾃⼰所存储的块的列表
D. ⽤来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间
A. Spark应⽤在复杂的批量数据处理
B. SparkSQL是基于历史数据的交互式查询
C. SparkStreaming是基于历史数据的数据挖掘
D. GraphX是图结构数据的处
A. 分布式环境必须要考虑系统出错。HBase采⽤HLog保证
B. HBase系统为每个Region服务器配置了⼀个HLog⽂件
C. Zookeeper会实时监测每个Region服务器的状态
D. Master⾸先会处理该故障Region服务器上⾯遗留的HLog⽂件
A. Task分为MapTask和ReduceTask两种,分别由JobTracker和TaskTracker启动
B. slot分为Mapslot和Reduceslot两种,分别供MapTask和ReduceTask使⽤
C. TaskTracker使⽤”slot”等量划分本节点上的资源量(CPU、内存等)
D. TaskTracker会周期性接收JobTracker发送过来的命令并执⾏相应的操作(如启动新任务、杀死任务等)
A. DataNode:存储被拆分的数据块
B. JobTracker:协调数据计算任务
C. TaskTracker:负责执⾏由JobTracker指派的任务
D. SecondaryNameNode:帮助NameNode收集⽂件系统运⾏的状态信息