A、 Map将⼩数据集进⼀步解析成⼀批
B、 Map每⼀个输⼊的
C、 Reduce输⼊的中间结果
D、 Reduce输⼊的中间结果
答案:C
A、 Map将⼩数据集进⼀步解析成⼀批
B、 Map每⼀个输⼊的
C、 Reduce输⼊的中间结果
D、 Reduce输⼊的中间结果
答案:C
A. 成本⾼
B. ⾼可靠性
C. ⾼容错性
D. 运⾏在Linux平台上
A. 描边(stroke)-颜⾊值
B. 描边宽度(stroke-width)-数字(通常以像素为单位)
C. SVG的默认样式是⿊⾊填充
D. 不透明度(opacity)–0.0(完全透明)和1.0(完全不透明)之间的数值
A. 创建表的时候,可以通过HColumnDescriptor.setInMemory(true)将表放到Region服务器的缓存中,保证在读取的时候被cache命中
B. 创建表的时候,可以通过HColumnDescriptor.setMaxVersions(intmaxVersions)设置表中数据的最⼤版本,如果只需要保存最新版本的数据,那么可以设置setMaxVersions(1)
C. 创建表的时候,可以通过HColumnDescriptor.setTimeToLive(inttimeToLive)设置表中数据的存储⽣命期
D. 如果最近写⼊HBase表中的数据是最可能被访问的,可以考虑将时间戳作为⾏键的⼀部分
A. 针对⼤规模数据的批量处理
B. 针对⼤规模图结构数据的处理
C. ⼤规模数据的存储管理和查询分析
D. 针对流数据的实时计算
A. 局部计算:每个参与的处理器都有⾃⾝的计算任务
B. 通讯:处理器群相互交换数据
C. 栅栏同步:当⼀个处理器遇到”路障”(或栅栏),会等到其他所有处理器完成它们的计算步骤
D. 基于现有的分布式计算平台进⾏图计算
A. 为⽤户提供了系统顶层分布式基础架构
B. 具有较差的跨平台特性
C. 可以部署在廉价的计算机集群中
D. 被公认为⾏业⼤数据标准开源软件
A. 推荐系统是⼤数据在互联⽹领域的典型应⽤
B. 推荐系统是⾃动联系⽤户和物品的⼀种⼯具
C. 推荐系统可以创造全新的商业和经济模式,帮助实现长尾商品的销售
D. 推荐系统分为基于物品的协同过滤和基于商家的协同过滤
解析:答案解析
A. 数据的”⼤量化”
B. 数据的”快速化”
C. 数据的”多样化”
D. 数据的”价值化”
A. ⼀个RDD就是⼀个分布式对象集合,本质上是⼀个只读的分区记录集合
B. 每个RDD可分成多个分区,每个分区就是⼀个数据集⽚段
C. RDD是可以直接修改的
D. RDD提供了⼀种⾼度受限的共享内存模型