A、 局部计算:每个参与的处理器都有⾃⾝的计算任务
B、 通讯:处理器群相互交换数据
C、 栅栏同步:当⼀个处理器遇到”路障”(或栅栏),会等到其他所有处理器完成它们的计算步骤
D、 基于现有的分布式计算平台进⾏图计算
答案:ABC
A、 局部计算:每个参与的处理器都有⾃⾝的计算任务
B、 通讯:处理器群相互交换数据
C、 栅栏同步:当⼀个处理器遇到”路障”(或栅栏),会等到其他所有处理器完成它们的计算步骤
D、 基于现有的分布式计算平台进⾏图计算
答案:ABC
A. 主从结构模型
B. 分层模式
C. 管道-过滤器模式
D. 点对点模式
A. 整合性:Storm可⽅便地与队列系统和数据库系统进⾏整合
B. 简易的API:Storm的API在使⽤上即简单⼜⽅便
C. 容错性:Storm可⾃动进⾏故障节点的重启、任务的重新分配
D. 可扩展性:Storm的并⾏特性使其可以运⾏在分布式集群中
A. 数据存储层
B. 数据源层
C. 数据分析层
D. 数据应⽤层
A. 从编程的灵活性来讲,Storm是⽐较理想的选择,它使⽤ApacheThrift,可以⽤任何编程语⾔来编写拓扑结构(Topology)
B. 当有⼤量的状态需要处理时,⽐如每个分区都有数⼗亿个元组,则可以选择Storm和SparkStreaming
C. SparkStreaming⽆法实现毫秒级的流计算
D. 在Spark上可以统⼀部署SparkSQL,SparkStreaming、MLlib,GraphX等组件,提供便捷的⼀体化编程模型
A. D3是⼀个被数据驱动的⽂档
B. D3是⼀个JavaScript的函数库,使⽤它主要是⽤来做数据可视化的
C. D3是⼀个JavaScript函数库,并不需要通常所说的”安装”
D. D3有多个⽂件,在HTML中引⽤即可
A. 为特定的图应⽤定制相应的分布式实现:通⽤性不好
B. 基于现有的分布式计算平台进⾏图计算:在性能和易⽤性⽅⾯往往⽆法达到最优
C. 使⽤单机的图算法库,但是,在可以解决的问题的规模⽅⾯具有很⼤的局限性
D. 使⽤已有的并⾏图计算系统,但是,对⼤规模分布式系统⾮常重要的⼀些⽅⾯(⽐如容错),⽆法提供较好的⽀持
A. 数据挖掘
B. 云计算
C. 机器学习
D. 关系型数据库
A. 结构化数据
B. 半结构化数据
C. 非结构化数据
D. 所有类型数据
A. 兼容廉价的硬件设备
B. 流数据读写
C. ⼤数据集
D. 复杂的⽂件模型