A、 关键字
B、 ⾏键
C、 列族
D、 时间戳
答案:A
A、 关键字
B、 ⾏键
C、 列族
D、 时间戳
答案:A
A. 许多⾮图结构的⼤数据,通常会被转换为关系模型后进⾏分析
B. 许多⼤数据都是以⼤规模图或⽹络的形式呈现
C. 图数据结构很好地表达了数据之间的关联性
D. 关联性计算是⼤数据计算的核⼼
A. 在Pregel执⾏计算过程时,在每个超步中都会并⾏调⽤每个顶点上定义的Compute()函数
B. 顶点之间的通讯是借助于消息传递机制来实现的
C. 在默认情况下,Pregel计算框架并不会开启Combiner功能
D. 通常只对那些满⾜交换律和结合律的操作才可以去开启Combiner功能
A. 爬⾍持续不断地抓取新页⾯,这些页⾯每隔⼀段时间地存储到BigTable⾥
B. BigTable是⼀个分布式存储系统
C. BigTable起初⽤于解决典型的互联⽹搜索问题
D. ⽹络搜索应⽤查询建⽴好的索引,从BigTable得到⽹页
A. 在传统的数据处理流程中,存储的数据是旧的
B. 在传统的数据处理流程中,需要⽤户主动发出查询来获取结果
C. 传统的数据处理流程,需要先采集数据并存储在关系数据库等数据管理系统中
D. 流计算的处理流程⼀般包含三个阶段:数据实时采集、数据批量计算、实时查询服务
A. Scala的优势是提供了REPL(Read-Eval-PrintLoop,交互式解释器),提⾼程序开发效率
B. Scala兼容Java,运⾏速度快,且能融合到Hadoop⽣态圈中
C. Scala具备强⼤的并发性,⽀持函数式编程
D. Scala可以更好地⽀持分布式系统
A. 数据挖掘
B. 离线分析
C. 实时查询
D. BI分析
E.
F.
G.
H.
I.
J.
解析:
A. 顶点的出度
B. 顶点
C. 边
D. 消息
A. 基于⽤户的协同过滤
B. 基于物品的协同过滤
C. 基于⽤户和物品的联合协同过滤
D. 基于商家的协同过滤
A. 帮助NameNode收集⽂件系统运⾏的状态信息
B. 负责执⾏由JobTracker指派的任务
C. 协调数据计算任务
D. 负责协调集群中的数据存储
A. 分布式并⾏编程模型
B. 流计算框架
C. Hadoop上的⼯作流管理系统
D. 提供分布式协调⼀致性服务