A、 从磁盘或从⽹络读取数据,即IO密集⼯作
B、 计算数据,即CPU密集⼯作
C、 针对不同的⼯作节点选择合适硬件类型
D、 负责协调集群中的数据存储
答案:AB
A、 从磁盘或从⽹络读取数据,即IO密集⼯作
B、 计算数据,即CPU密集⼯作
C、 针对不同的⼯作节点选择合适硬件类型
D、 负责协调集群中的数据存储
答案:AB
A. 分布式并⾏编程模型
B. 流计算框架
C. Hadoop上的⼯作流管理系统
D. 提供分布式协调⼀致性服务
A. ⼀个企业当中同时存在各种不同的业务应⽤场景,需要采⽤不同的计算框架
B. 为了避免不同类型应⽤之间互相⼲扰,企业就需要把内部的服务器拆分成多个集群,分别安装运⾏不同的计算框架,即”⼀个框架⼀个集群”
C. 这些产品通常来⾃不同的开发团队,具有各⾃的资源调度管理机制
D. 解决单点故障
A. ⼀致性,是指任何⼀个读操作总是能够读到之前完成的写操作的结果量
B. ⼀个分布式系统可以同时满⾜⼀致性、可⽤性和分区容忍性这三个需求
C. 可⽤性,是指快速获取数据
D. 分区容忍性,是指当出现⽹络分区的情况时(即系统中的⼀部分节点⽆法和其他节点进⾏通信),分离的系统也能够正常运⾏
A. 帮助NameNode收集⽂件系统运⾏的状态信息
B. 负责执⾏由JobTracker指派的任务
C. 协调数据计算任务
D. 负责协调集群中的数据存储
A. 使⽤DAG执⾏引擎以⽀持循环数据流与内存计算
B. 可运⾏于独⽴的集群模式中,可运⾏于Hadoop中,也可运⾏于AmazonEC2等云环境中
C. ⽀持使⽤Scala、Java、Python和R语⾔进⾏编程,但是不可以通过SparkShell进⾏交互式编程
D. Spark提供了内存计算,可将中间结果放到内存中,对于迭代计算效率更⾼
A. ⽂本⽂件
B. 关系数据库
C. 键值数据库
D. 语⾳⽂件
A. ⽆法满⾜海量数据的管理需求
B. ⽆法满⾜数据⾼并发的需求
C. ⽆法满⾜⾼可扩展性和⾼可⽤性的需求
D. 使⽤难度⾼
A. HadoopMapReduce是MapReduce的开源实现,后者⽐前者使⽤门槛低很多
B. MapReduce⾮共享式,容错性好
C. MapReduce批处理、实时、数据疏散型
D. MapReduce采⽤”分⽽治之”策略
A. 数值数组
B. 字符串
C. 对象(本⾝包含其他数组或键/值对)
D. JSON和GeoJSON
A. HTML:超⽂本标记语⾔,⽤于设定⽹页的内容
B. CSS:⼀种直译式脚本语⾔,⽤于设定⽹页的⾏为
C. DOM:⽂档对象模型,⽤于修改⽂档的内容和结构
D. SVG:层叠样式表,⽤于设定⽹页的样式