A、 分布式⽂件系统
B、 流数据读写
C、 资源管理和调度器
D、 Hadoop上的数据仓库
答案:A
A、 分布式⽂件系统
B、 流数据读写
C、 资源管理和调度器
D、 Hadoop上的数据仓库
答案:A
A. Map将⼩数据集进⼀步解析成⼀批
B. Map每⼀个输⼊的
C. Reduce输⼊的中间结果
D. Reduce输⼊的中间结果
A. ⽀持各种编程语⾔:Storm⽀持使⽤各种编程语⾔来定义任务
B. 容错性:Storm需要⼈⼯进⾏故障节点的重启、任务的重新分配
C. 可扩展性:Storm的并⾏特性使其可以运⾏在分布式集群中
D. 免费、开源:Storm是⼀款开源框架,可以免费使⽤
A. ⾮共享式,容错性好
B. 普通PC机,便宜,扩展性好
C. what,简单
D. 批处理、⾮实时、数据密集型
A. 数据快速持续到达,潜在⼤⼩也许是⽆穷⽆尽的
B. 数据来源众多,格式复杂
C. 注重数据的整体价值,不过分关注个别数据
D. 系统可以控制将要处理的新到达的数据元素的顺序
A. 处理⼤规模数据的脚本语⾔
B. ⼯作流和协作服务引擎,协调Hadoop上运⾏的不同任务
C. ⽀持DAG作业的计算框架
D. 基于内存的分布式并⾏编程框架,具有较⾼的实时性,并且较好⽀持迭代计算
A. 分布式⽂件系统
B. 流数据读写
C. 资源管理和调度器
D. Hadoop上的数据仓库
A. 在Pregel执⾏计算过程时,在每个超步中都会并⾏调⽤每个顶点上定义的Compute()函数
B. 顶点之间的通讯是借助于消息传递机制来实现的
C. 在默认情况下,Pregel计算框架并不会开启Combiner功能
D. 通常只对那些满⾜交换律和结合律的操作才可以去开启Combiner功能
A. ⽂档数据库
B. 图数据库
C. 列族数据库
D. 时间戳数据库
A. 分布式存储
B. 数据处理与分析
C. 分布式处理
D. 数据存储与管理
A. 解析⽹页的任务就是分析⼀个页⾯的链接数,但是不赋初值
B. PageRank分配就是多次迭代计算页⾯的PageRank值
C. 收敛阶段的任务就是由⼀个⾮并⾏组件决定是否达到收敛
D. ⼀般判断是否收敛的条件是所有⽹页的PageRank值不再变化,或者运⾏30次以后我们就认为已经收敛了