A、 ⼀个RDD就是⼀个分布式对象集合,本质上是⼀个只读的分区记录集合
B、 每个RDD可分成多个分区,每个分区就是⼀个数据集⽚段
C、 RDD是可以直接修改的
D、 RDD提供了⼀种⾼度受限的共享内存模型
答案:C
A、 ⼀个RDD就是⼀个分布式对象集合,本质上是⼀个只读的分区记录集合
B、 每个RDD可分成多个分区,每个分区就是⼀个数据集⽚段
C、 RDD是可以直接修改的
D、 RDD提供了⼀种⾼度受限的共享内存模型
答案:C
A. UserCF算法推荐的是那些和⽬标⽤户有共同兴趣爱好的其他⽤户所喜欢的物品
B. ItemCF算法推荐的是那些和⽬标⽤户之前喜欢的物品类似的其他物品
C. ItemCF算法的推荐更偏向社会化,⽽UserCF算法的推荐更偏向于个性化
D. ItemCF算法倾向于推荐与⽤户已购买商品相似的商品,往往会出现多样性不⾜、推荐新颖度较低的问题
A. FsImage
B. EditLog
C. Block
D. DN8
A. Hadoop擅长批处理,不适合流计算
B. MapReduce是专门⾯向静态数据的批量处理的
C. Hadoop设计的初衷是⾯向⼤规模数据的批量处理
D. MapReduce不适合⽤于处理持续到达的动态数据
A. 顶点的当前值
B. 以该顶点为起点的出射边列表,每条出射边包含了⽬标顶点ID和边的值
C. 消息队列,包含了所有接收到的、发送给该顶点的消息
D. 标志位,⽤来标记顶点是否处于活跃状态
A. 灵活的可扩展性
B. 灵活的数据模型
C. 与云计算紧密融合
D. ⼤型的数据库
A. 数据是规则的
B. 性能好(⾼并发)
C. 缺乏统⼀的查询语法
D. 复杂性低
A. 能够解决单点故障问题
B. HDFS集群扩展性
C. 性能更⾼效
D. 良好的隔离性
A. Controller服务器
B. Proxy服务器
C. 愚公系统
D. 数据处理服务器
A. ⽀持⼤规模⽂件存储
B. 简化系统设计
C. 适合数据备份
D. ⽀持中等规模⽂件存储