A、 专门⽤于处理具有⾼度相互关联关系的数据
B、 ⽐较适合于社交⽹络、模式识别、依赖分析、推荐系统以及路径寻找等问题
C、 灵活性⾼,⽀持复杂的图形算法
D、 复杂性⾼,只能⽀持⼀定的数据规模
答案:ABCD
A、 专门⽤于处理具有⾼度相互关联关系的数据
B、 ⽐较适合于社交⽹络、模式识别、依赖分析、推荐系统以及路径寻找等问题
C、 灵活性⾼,⽀持复杂的图形算法
D、 复杂性⾼,只能⽀持⼀定的数据规模
答案:ABCD
A. Task分为MapTask和ReduceTask两种,分别由JobTracker和TaskTracker启动
B. slot分为Mapslot和Reduceslot两种,分别供MapTask和ReduceTask使⽤
C. TaskTracker使⽤”slot”等量划分本节点上的资源量(CPU、内存等)
D. TaskTracker会周期性接收JobTracker发送过来的命令并执⾏相应的操作(如启动新任务、杀死任务等)
A. 查找速度慢,可扩展性差
B. 功能较少,⼤都不⽀持强事务⼀致性
C. 容易进⾏分布式扩展
D. 复杂性低
A. 为特定的图应⽤定制相应的分布式实现:通⽤性不好
B. 基于现有的分布式计算平台进⾏图计算:在性能和易⽤性⽅⾯往往⽆法达到最优
C. 使⽤单机的图算法库,但是,在可以解决的问题的规模⽅⾯具有很⼤的局限性
D. 使⽤已有的并⾏图计算系统,但是,对⼤规模分布式系统⾮常重要的⼀些⽅⾯(⽐如容错),⽆法提供较好的⽀持
A. 运⾏速度快
B. 容易使⽤
C. 通⽤性
D. 运⾏模式单⼀
A. 为海量数据提供存储的HDFS和对数据进⾏计算的MapReduce
B. 提供整个HDFS⽂件系统的NameSpace(命名空间)管理、块管理等所有服务
C. Hadoop不仅可以运⾏在企业内部的集群中,也可以运⾏在云计算环境中
D. Hadoop被视为事实上的⼤数据处理标准
A. 常常表现出⽐较差的内存访问局部性
B. 针对单个顶点的处理⼯作过少
C. 计算过程中伴随着并⾏度的改变
D. 计算过程简易
A. 利⽤分布式⽂件系统、数据仓库、关系数据库等实现对结构化、半结构化和⾮结构化海量数据的存储和管理
B. 利⽤分布式并⾏编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析
C. 构建隐私数据保护体系和数据安全体系,有效保护个⼈隐私和数据安全
D. 把实时采集的数据作为流计算系统的输⼊,进⾏实时处理分析
A. 为⽤户提供了系统顶层分布式基础架构
B. 具有较差的跨平台特性
C. 可以部署在廉价的计算机集群中
D. 被公认为⾏业⼤数据标准开源软件
A. 加快数据传输速度
B. 容易检查数据错误
C. 保证数据可靠性
D. 适合多平台上运⾏