A、 复杂的批量数据处理:通常时间跨度在数⼗分钟到数⼩时之间
B、 基于历史数据的交互式查询:通常时间跨度在数⼗秒到数分钟之间
C、 基于实时数据流的数据处理:通常时间跨度在数⼗秒到数分钟之间
D、 基于实时数据流的数据处理:通常时间跨度在数百毫秒到数秒之间
答案:ABD
A、 复杂的批量数据处理:通常时间跨度在数⼗分钟到数⼩时之间
B、 基于历史数据的交互式查询:通常时间跨度在数⼗秒到数分钟之间
C、 基于实时数据流的数据处理:通常时间跨度在数⼗秒到数分钟之间
D、 基于实时数据流的数据处理:通常时间跨度在数百毫秒到数秒之间
答案:ABD
A. ⾼效的容错性
B. 中间结果持久化到内存,数据在内存中的多个
C. 存放的数据可以是Java对象,避免了不必要的对象序列化和反序列化
D. 现有容错机制:数据复制或者记录⽇志
A. HBase采⽤表来组织数据,表由⾏和列组成,列划分为若⼲个列族
B. 每个HBase表都由若⼲⾏组成,每个⾏由⾏键(rowkey)来标识
C. 列族⾥的数据通过列限定符(或列)来定位
D. 每个单元格都保存着同⼀份数据的多个版本,这些版本采⽤时间戳进⾏索引
A. 基于遍历算法的、实时的图数据库,如Neo4j、OrientD
B. DEX和InfiniteGraph
C. 基于遍历算法的、实时的图数据库,如GoldenOrb、Giraph、Pregel和Hama
D. 以图顶点为中⼼的、基于消息传递批处理的并⾏引擎,如Neo4j、OrientDB、DEX和InfiniteGraph
A. 局部计算:每个参与的处理器都有⾃⾝的计算任务
B. 通讯:处理器群相互交换数据
C. 栅栏同步:当⼀个处理器遇到”路障”(或栅栏),会等到其他所有处理器完成它们的计算步骤
D. 基于现有的分布式计算平台进⾏图计算
A. 识别和感知技术
B. ⽹络与通信技术
C. 数据挖掘与融合技术
D. 信息处理⼀体化技术
A. UserCF算法推荐的是那些和⽬标⽤户有共同兴趣爱好的其他⽤户所喜欢的物品
B. ItemCF算法推荐的是那些和⽬标⽤户之前喜欢的物品类似的其他物品
C. ItemCF算法的推荐更偏向社会化,⽽UserCF算法的推荐更偏向于个性化
D. ItemCF算法倾向于推荐与⽤户已购买商品相似的商品,往往会出现多样性不⾜、推荐新颖度较低的问题
解析:答案解析
A. 复杂的批量数据处理:通常时间跨度在数⼗分钟到数⼩时之间
B. 基于历史数据的交互式查询:通常时间跨度在数⼗秒到数分钟之间
C. 基于实时数据流的数据处理:通常时间跨度在数⼗秒到数分钟之间
D. 基于实时数据流的数据处理:通常时间跨度在数百毫秒到数秒之间