A、 实时获取来⾃不同数据源的海量数据,经过实时分析处理,获得有价值的信息
B、 流计算秉承⼀个基本理念,即数据的价值随着时间的流逝⽽降低
C、 对于⼀个流计算系统来说,它应该⽀持TB级甚⾄是PB级的数据规模
D、 流计算只需要保证较低的延迟时间,即只达到秒级别即可处理⼀切问题
答案:D
A、 实时获取来⾃不同数据源的海量数据,经过实时分析处理,获得有价值的信息
B、 流计算秉承⼀个基本理念,即数据的价值随着时间的流逝⽽降低
C、 对于⼀个流计算系统来说,它应该⽀持TB级甚⾄是PB级的数据规模
D、 流计算只需要保证较低的延迟时间,即只达到秒级别即可处理⼀切问题
答案:D
A. 较低可扩展性
B. 只⽀持java语⾔
C. 成本低
D. 运⾏在Linux平台上
A. ⽬录
B. ⽂件
C. 块
D. 磁盘
A. 关系数据库以完善的关系代数理论作为基础,有严格的标准
B. 关系数据库可扩展性较差,⽆法较好⽀持海量数据存储
C. NoSQL可以⽀持超⼤规模数据存储
D. NoSQL数据库缺乏数学理论基础,复杂查询性能不⾼
A. 数据可视化是指将⼤型数据集中的数据以图形图像形式表⽰
B. 数据可视化技术的基本思想是将数据库中每⼀个数据项作为单个图元素表⽰
C. 利⽤数据分析和开发⼯具发现其中未知信息的处理过程
D. 将数据的各个属性值以⼀维数据的形式表⽰
A. 分布式⽂件系统
B. 分布式并⾏编程模型
C. 资源管理和调度器
D. Hadoop上的数据仓库
A. 单点故障问题
B. 不可以⽔平扩展
C. 单个名称节点难以提供不同程序之间的隔离性
D. 系统整体性能受限于单个名称节点的吞吐量
A. ⾼效的容错性
B. 中间结果持久化到内存,数据在内存中的多个
C. 存放的数据可以是Java对象,避免了不必要的对象序列化和反序列化
D. 现有容错机制:数据复制或者记录⽇志
A. 第⼀阶段:解析⽹页
B. 第⼆阶段:PageRank分配
C. 第三阶段:收敛阶段
D. 第⼀阶段:收集⽹页
A. ⾼性能:处理⼤数据的基本要求,如每秒处理⼏⼗万条数据
B. 实时性:保证较低的延迟时间,达到秒级别,甚⾄是毫秒级别
C. 分布式:⽀持⼤数据的基本架构,必须能够平滑扩展
D. 可靠性:能可靠地处理流数据