A、 许多⾮图结构的⼤数据,通常会被转换为关系模型后进⾏分析
B、 许多⼤数据都是以⼤规模图或⽹络的形式呈现
C、 图数据结构很好地表达了数据之间的关联性
D、 关联性计算是⼤数据计算的核⼼
答案:A
A、 许多⾮图结构的⼤数据,通常会被转换为关系模型后进⾏分析
B、 许多⼤数据都是以⼤规模图或⽹络的形式呈现
C、 图数据结构很好地表达了数据之间的关联性
D、 关联性计算是⼤数据计算的核⼼
答案:A
A. 把⽂件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群
B. ⽤于在Hadoop与传统数据库之间进⾏数据传递
C. ⼀个⾼可⽤的,⾼可靠的,分布式的海量⽇志采集、聚合和传输的系统
D. ⼀种⾼吞吐量的分布式发布订阅消息系统,可以处理消费者规模的⽹站中的所有动作流数据
A. 数据分析
B. 数据实时查询
C. 数据挖掘
D. 数据接收
A. 协同过滤可分为基于⽤户的协同过滤和基于物品的协同过滤
B. UserCF算法符合⼈们对于”趣味相投”的认知,即兴趣相似的⽤户往往有相同的物品喜好
C. 实现UserCF算法的关键步骤是计算物品与物品之间的相似度
D. 基于物品的协同过滤算法(简称ItemCF算法)是⽬前业界应⽤最多的算法
A. 批量计算:充裕时间处理静态数据,如Hadoop
B. 静态数据不适合采⽤批量计算,因为它不适合⽤传统的关系模型建模
C. 流数据必须采⽤实时计算
D. 流数据的响应时间为秒级
A. 实时性差(适合批处理,不⽀持实时交互式)
B. 资源浪费(Map和Reduce分两阶段执⾏)
C. 执⾏迭代操作效率低
D. 难以看到程序整体逻辑
A. Spark应⽤在复杂的批量数据处理
B. SparkSQL是基于历史数据的交互式查询
C. SparkStreaming是基于历史数据的数据挖掘
D. GraphX是图结构数据的处
A. 智能医疗研发
B. 监控⾝体情况
C. 实时掌握交通状况
D. ⾦融交易
A. ⽬录
B. ⽂件
C. 块
D. 磁盘
A. 在Pregel执⾏计算过程时,在每个超步中都会并⾏调⽤每个顶点上定义的Compute()函数
B. 顶点之间的通讯是借助于消息传递机制来实现的
C. 在默认情况下,Pregel计算框架并不会开启Combiner功能
D. 通常只对那些满⾜交换律和结合律的操作才可以去开启Combiner功能