A、 爬⾍持续不断地抓取新页⾯,这些页⾯每隔⼀段时间地存储到BigTable⾥
B、 BigTable是⼀个分布式存储系统
C、 BigTable起初⽤于解决典型的互联⽹搜索问题
D、 ⽹络搜索应⽤查询建⽴好的索引,从BigTable得到⽹页
答案:A
A、 爬⾍持续不断地抓取新页⾯,这些页⾯每隔⼀段时间地存储到BigTable⾥
B、 BigTable是⼀个分布式存储系统
C、 BigTable起初⽤于解决典型的互联⽹搜索问题
D、 ⽹络搜索应⽤查询建⽴好的索引,从BigTable得到⽹页
答案:A
A. 推荐系统:为⽤户推荐相关商品
B. 物流:基于⼤数据和物联⽹技术的智能物流
C. 智能交通:利⽤交通⼤数据,实现交通实时监控
D. 汽车:⽆⼈驾驶汽车,实时采集车辆各种⾏驶数据和周围环境
A. 不可以⽔平扩展
B. 多点故障问题
C. HDFSHA是热备份,提供⾼可⽤性,但是⽆法解决可扩展性、系统性能和隔离性
D. 系统整体性能受限于单个名称节点的吞吐量
A. 利⽤分布式⽂件系统、数据仓库、关系数据库等实现对结构化、半结构化和⾮结构化海量数据的存储和管理
B. 利⽤分布式并⾏编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析
C. 构建隐私数据保护体系和数据安全体系,有效保护个⼈隐私和数据安全
D. 把实时采集的数据作为流计算系统的输⼊,进⾏实时处理分析
A. 数据质量问题
B. 数据安全问题
C. 数据传输速度问题
D. 数据类型单一问题
A. 性能好(⾼并发),灵活性⾼
B. 具备统⼀的查询语法
C. ⽂档数据库⽀持⽂档间的事务
D. 复杂性低,数据结构灵活
A. 局部计算:每个参与的处理器都有⾃⾝的计算任务
B. 通讯:处理器群相互交换数据
C. 栅栏同步:当⼀个处理器遇到”路障”(或栅栏),会等到其他所有处理器完成它们的计算步骤
D. 基于现有的分布式计算平台进⾏图计算
A. FsImage
B. EditLog
C. Block
D. DN8
A. 能够解决单点故障问题
B. HDFS集群扩展性
C. 性能更⾼效
D. 良好的隔离性
A. Hadoop⾃⾝核⼼组件MapReduce的架构设计改进
B. Hadoop⾃⾝核⼼组件HDFS的架构设计改进
C. Hadoop⽣态系统其它组件的不断丰富
D. Hadoop⽣态系统减少不必要的组件,整合系统