A、 ⽀持各种编程语⾔:Storm⽀持使⽤各种编程语⾔来定义任务
B、 容错性:Storm需要⼈⼯进⾏故障节点的重启、任务的重新分配
C、 可扩展性:Storm的并⾏特性使其可以运⾏在分布式集群中
D、 免费、开源:Storm是⼀款开源框架,可以免费使⽤
答案:B
A、 ⽀持各种编程语⾔:Storm⽀持使⽤各种编程语⾔来定义任务
B、 容错性:Storm需要⼈⼯进⾏故障节点的重启、任务的重新分配
C、 可扩展性:Storm的并⾏特性使其可以运⾏在分布式集群中
D、 免费、开源:Storm是⼀款开源框架,可以免费使⽤
答案:B
A. 电信⾏业:客户离⽹分析
B. 智能机器⼈
C. 零售⾏业:发现关联购买⾏为、进⾏客户群体细分
D. 推荐系统
A. HadoopJob对应StormTopology
B. HadoopTaskTracker对应StormSupervisor
C. HadoopJobTracker对应StormSpout
D. HadoopReduce对应StormBolt
A. Map将⼩数据集进⼀步解析成⼀批
B. Map每⼀个输⼊的
C. Reduce输⼊的中间结果
D. Reduce输⼊的中间结果
A. UserCF算法推荐的是那些和⽬标⽤户有共同兴趣爱好的其他⽤户所喜欢的物品
B. ItemCF算法推荐的是那些和⽬标⽤户之前喜欢的物品类似的其他物品
C. UserCF算法的推荐更偏向个性化
D. UserCF随着⽤户数⽬的增⼤,⽤户相似度计算复杂度越来越⾼
A. 为了让⽤户从海量信息中⾼效地获得⾃⼰所需的信息,推荐系统应运⽽⽣
B. 推荐系统是⼤数据在互联⽹领域的典型应⽤
C. 推荐系统是⾃动联系⽤户和物品的⼀种⼯具
D. 推荐系统是利⽤⼤数据为⽤户推荐消费内容、调整线下门店布局、控制店内⼈流量
A. 使⽤DAG执⾏引擎以⽀持循环数据流与内存计算
B. 可运⾏于独⽴的集群模式中,可运⾏于Hadoop中,也可运⾏于AmazonEC2等云环境中
C. ⽀持使⽤Scala、Java、Python和R语⾔进⾏编程,但是不可以通过SparkShell进⾏交互式编程
D. Spark提供了内存计算,可将中间结果放到内存中,对于迭代计算效率更⾼
A. 全局计算
B. 局部计算
C. 通讯
D. 栅栏同步
A. Pregel将PageRank处理对象看成是连通图,⽽MapReduce则将其看成是键值对
B. Pregel将计算细化到顶点,同时在顶点内控制循环迭代次数
C. apReduce将计算批量化处理,按任务进⾏循环迭代控制
D. 图算法如果⽤Pregel实现,需要⼀系列的Pregel的调⽤
A. Hadoop擅长批处理,不适合流计算
B. MapReduce是专门⾯向静态数据的批量处理的
C. Hadoop设计的初衷是⾯向⼤规模数据的批量处理
D. MapReduce不适合⽤于处理持续到达的动态数据
A. ⾼可扩展性
B. ⽀持多种编程语⾔
C. 成本低
D. 运⾏在Linux平台上