A、 使⽤DAG执⾏引擎以⽀持循环数据流与内存计算
B、 可运⾏于独⽴的集群模式中,可运⾏于Hadoop中,也可运⾏于AmazonEC2等云环境中
C、 ⽀持使⽤Scala、Java、Python和R语⾔进⾏编程,但是不可以通过SparkShell进⾏交互式编程
D、 Spark提供了内存计算,可将中间结果放到内存中,对于迭代计算效率更⾼
答案:C
A、 使⽤DAG执⾏引擎以⽀持循环数据流与内存计算
B、 可运⾏于独⽴的集群模式中,可运⾏于Hadoop中,也可运⾏于AmazonEC2等云环境中
C、 ⽀持使⽤Scala、Java、Python和R语⾔进⾏编程,但是不可以通过SparkShell进⾏交互式编程
D、 Spark提供了内存计算,可将中间结果放到内存中,对于迭代计算效率更⾼
答案:C
A. 负责资源监控和作业调度,监控所有TaskTracker与Job的健康状况
B. 使⽤”slot”等量划分本节点上的资源量(CPU、内存等)
C. 会周期性地通过”⼼跳”将本节点上资源的使⽤情况和任务的运⾏进度汇报给TaskTracker
D. 会跟踪任务的执⾏进度、资源使⽤量等信息,并将这些信息告诉任务(Task)
A. ⾕歌公司的制图服务接⼝GoogleChartAPI,可以⽤来为统计数据并⾃动⽣成图⽚
B. D3是最流⾏的可视化库之⼀,是⼀个⽤于⽹页作图、⽣成互动图形的JavaScrip函数库
C. Visual.ly可以⽤它来快速创建⾃定义的、样式美观且具有强烈视觉冲击⼒的信息图表
D. ⼤数据魔镜是⼀款优秀的国产数据分析软件,它丰富的数据公式和算法可以让⽤户真正理解探索分析数据
A. 为特定的图应⽤定制相应的分布式实现:通⽤性不好
B. 基于现有的分布式计算平台进⾏图计算:在性能和易⽤性⽅⾯往往⽆法达到最优
C. 使⽤单机的图算法库,但是,在可以解决的问题的规模⽅⾯具有很⼤的局限性
D. 使⽤已有的并⾏图计算系统,但是,对⼤规模分布式系统⾮常重要的⼀些⽅⾯(⽐如容错),⽆法提供较好的⽀持
A. 为⽤户提供了系统顶层分布式基础架构
B. 具有较差的跨平台特性
C. 可以部署在廉价的计算机集群中
D. 被公认为⾏业⼤数据标准开源软件
A. 主从结构模型
B. 分层模式
C. 管道-过滤器模式
D. 点对点模式
A. 库函数:链接到每个客户端
B. ⼀个Master主服务器
C. 许多个Region服务器
D. 部署在廉价的计算机集群中
A. ⽂档数据库
B. 图数据库
C. 列族数据库
D. 时间戳数据库
A. 任务调度、监控与容错
B. 为应⽤程序申请资源
C. 将申请的资源分配给内部任务
D. 处理来⾃ResourceManger的命令
A. 操作系统和围绕特定应⽤的必需的服务
B. 将基础设施(计算资源和存储)作为服务出租
C. 从⼀个集中的系统部署软件,使之在⼀台本地计算机上(或从云中远程地)运⾏的⼀个模型
D. 提供硬件、软件、⽹络等基础设施以及提供咨询、规划和系统集成服务
A. 关系数据库以完善的关系代数理论作为基础,有严格的标准
B. 关系数据库可扩展性较差,⽆法较好⽀持海量数据存储
C. NoSQL可以⽀持超⼤规模数据存储
D. NoSQL数据库缺乏数学理论基础,复杂查询性能不⾼