A、 MapReduce默认1000MB缓存
B、 多个溢写⽂件归并成⼀个或多个⼤⽂件,⽂件中的键值对是排序的
C、 当数据很少时,不需要溢写到磁盘,直接在缓存中归并,然后输出给Reduce
D、 每个Map任务分配多个缓存,使得任务运⾏更有效率
答案:BC
A、 MapReduce默认1000MB缓存
B、 多个溢写⽂件归并成⼀个或多个⼤⽂件,⽂件中的键值对是排序的
C、 当数据很少时,不需要溢写到磁盘,直接在缓存中归并,然后输出给Reduce
D、 每个Map任务分配多个缓存,使得任务运⾏更有效率
答案:BC
A. 为⽤户提供了系统底层细节透明的分布式基础架构
B. 具有很好的跨平台特性
C. 可以部署在廉价的计算机集群中
D. 被公认为⾏业⼤数据标准开源软件
A. ⾼效的容错性
B. 中间结果持久化到内存,数据在内存中的多个
C. 存放的数据可以是Java对象,避免了不必要的对象序列化和反序列化
D. 现有容错机制:数据复制或者记录⽇志
A. 协同过滤可分为基于⽤户的协同过滤和基于物品的协同过滤
B. UserCF算法符合⼈们对于”趣味相投”的认知,即兴趣相似的⽤户往往有相同的物品喜好
C. 实现UserCF算法的关键步骤是计算物品与物品之间的相似度
D. 基于物品的协同过滤算法(简称ItemCF算法)是⽬前业界应⽤最多的算法
A. 从数据模型的⾓度来说,云数据库并⾮⼀种全新的数据库技术
B. 云数据库并没有专属于⾃⼰的数据模型,云数据库所采⽤的数据模型可以是关系数据库所使⽤的关系模型
C. 同⼀个公司只能提供采⽤不同数据模型的单个云数据库服务
D. 许多公司在开发云数据库时,后端数据库都是直接使⽤现有的各种关系数据库或NoSQL数据库产品
A. Storm将Streams的状态转换过程抽象为Spout
B. Storm认为每个Stream都有⼀个源头,并把这个源头抽象为Spout
C. Storm将Spouts和Bolts组成的⽹络抽象成Topology
D. Topology⾥⾯的每个处理组件(Spout或Bolt)都包含处理逻辑,⽽组件之间的连接则表⽰数据流动的⽅向
A. 不适合低延迟数据访问
B. ⽆法⾼效存储⼤量⼩⽂件
C. 不⽀持多⽤户写⼊及任意修改⽂件
D. 较差的跨平台兼容性
A. ⽤户建模模块
B. 推荐对象建模模块
C. 推荐算法模块
D. 数据采集模块
A. ⽂档数据库
B. 图数据库
C. 列族数据库
D. 时间戳数据库
A. Amazon是云数据库市场的先⾏者
B. GoogleCloudSQL是⾕歌公司推出的基于MySQL的云数据库
C. 从数据模型的⾓度来说,云数据库并⾮⼀种全新的数据库技术
D. 云数据库并没有专属于⾃⼰的数据模型