A、 许多⾮图结构的⼤数据,通常会被转换为关系模型后进⾏分析
B、 许多⼤数据都是以⼤规模图或⽹络的形式呈现
C、 图数据结构很好地表达了数据之间的关联性
D、 关联性计算是⼤数据计算的核⼼
答案:A
A、 许多⾮图结构的⼤数据,通常会被转换为关系模型后进⾏分析
B、 许多⼤数据都是以⼤规模图或⽹络的形式呈现
C、 图数据结构很好地表达了数据之间的关联性
D、 关联性计算是⼤数据计算的核⼼
答案:A
A. MySQL
B. 阿⾥云RDS
C. OracleCloud
D. 百度云数据库
A. 基于⽤户的协同过滤
B. 基于物品的协同过滤
C. 基于⽤户和物品的联合协同过滤
D. 基于商家的协同过滤
A. 数据存储层
B. 数据源层
C. 数据分析层
D. 数据应⽤层
A. 顶点的出度
B. 顶点
C. 边
D. 消息
A. 成本⾼
B. ⾼可靠性
C. ⾼容错性
D. 运⾏在Linux平台上
A. HadoopMapReduce是MapReduce的开源实现,后者⽐前者使⽤门槛低很多
B. MapReduce⾮共享式,容错性好
C. MapReduce批处理、实时、数据疏散型
D. MapReduce采⽤”分⽽治之”策略
A. ⼀个RDD就是⼀个分布式对象集合,本质上是⼀个只读的分区记录集合
B. 每个RDD可分成多个分区,每个分区就是⼀个数据集⽚段
C. RDD是可以直接修改的
D. RDD提供了⼀种⾼度受限的共享内存模型
A. 实时获取来⾃不同数据源的海量数据,经过实时分析处理,获得有价值的信息
B. 流计算秉承⼀个基本理念,即数据的价值随着时间的流逝⽽降低
C. 对于⼀个流计算系统来说,它应该⽀持TB级甚⾄是PB级的数据规模
D. 流计算只需要保证较低的延迟时间,即只达到秒级别即可处理⼀切问题
A. ⾼效的容错性
B. 中间结果持久化到内存,数据在内存中的多个
C. 存放的数据可以是Java对象,避免了不必要的对象序列化和反序列化
D. 现有容错机制:数据复制或者记录⽇志
A. 库函数:链接到每个客户端
B. ⼀个Master主服务器
C. 许多个Region服务器
D. 部署在廉价的计算机集群中