A、 ⽤户可通过Client提供的⼀些接⼝查看作业运⾏状态
B、 ⽤户编写的MapReduce程序通过Client提交到JobTracker端
C、 JobTracker负责资源监控和作业调度
D、 JobTracker会跟踪任务的执⾏进度、资源使⽤量等信息,并将这些信息告诉任务调度器(TaskScheduler)
答案:C
A、 ⽤户可通过Client提供的⼀些接⼝查看作业运⾏状态
B、 ⽤户编写的MapReduce程序通过Client提交到JobTracker端
C、 JobTracker负责资源监控和作业调度
D、 JobTracker会跟踪任务的执⾏进度、资源使⽤量等信息,并将这些信息告诉任务调度器(TaskScheduler)
答案:C
A. 每个Application都有⾃⼰专属的Executor进程,并且该进程在Application运⾏期间⼀直驻留
B. Executor进程以多线程的⽅式运⾏Task
C. Spark运⾏过程与资源管理器⽆关,只要能够获取Executor进程并保持通信即可
D. Task采⽤了数据本地性和推测执⾏等优化机制
A. Scala语法复杂,但是能提供优雅的API计算
B. Scala具备强⼤的并发性,⽀持函数式编程,可以更好地⽀持分布式系统
C. Scala兼容Java,运⾏速度快,且能融合到Hadoop⽣态圈中
D. Scala是Spark的主要编程语⾔
A. 从数据模型的⾓度来说,云数据库并⾮⼀种全新的数据库技术
B. 云数据库并没有专属于⾃⼰的数据模型,云数据库所采⽤的数据模型可以是关系数据库所使⽤的关系模型
C. 同⼀个公司只能提供采⽤不同数据模型的单个云数据库服务
D. 许多公司在开发云数据库时,后端数据库都是直接使⽤现有的各种关系数据库或NoSQL数据库产品
A. HadoopJob对应StormTopology
B. HadoopTaskTracker对应StormSupervisor
C. HadoopJobTracker对应StormSpout
D. HadoopReduce对应StormBolt
A. 扩展性好,灵活性好
B. ⼤量写操作时性能⾼
C. ⽆法存储结构化信息
D. 条件查询效率⾼
A. 批量计算:充裕时间处理静态数据,如Hadoop
B. 静态数据不适合采⽤批量计算,因为它不适合⽤传统的关系模型建模
C. 流数据必须采⽤实时计算
D. 流数据的响应时间为秒级
A. 不同场景之间输⼊输出数据⽆法做到⽆缝共享,通常需要进⾏数据格式的转换
B. 不同的软件需要不同的开发和维护团队
C. 需要较⾼的使⽤成本
D. ⽐较难以对同⼀个集群中的各个系统进⾏统⼀的资源协调和分配
A. 数据可视化是指将⼤型数据集中的数据以图形图像形式表⽰
B. 利⽤数据分析和开发⼯具发现其中未知信息的处理过程
C. 数据可视化技术的基本思想是将数据库中每⼀个数据项作为单个图元素表⽰
D. 将数据的各个属性值以⼀维数据的形式表⽰
A. NativeJavaAPI
B. HBaseShell
C. ThriftGateway
D. RESTGateway
A. 提高数据分析效率
B. 降低数据存储成本
C. 增加数据体量
D. 改变数据类型