A、 ⽬录
B、 ⽂件
C、 块
D、 磁盘
答案:ABC
A、 ⽬录
B、 ⽂件
C、 块
D、 磁盘
答案:ABC
A. 选择集群中的多台机器执⾏图计算任务,每台机器上运⾏⽤户程序的⼀个副本
B. Master把⼀个图分成多个分区,并把分区分配到多个Worker
C. ster会把⽤户输⼊划分成多个部分,通常是基于⽂件边界进⾏划分
D. ster向每个Worker发送指令,Worker收到指令后,开始运⾏⼀个超步
A. HadoopJob对应StormTopology
B. HadoopTaskTracker对应StormSupervisor
C. HadoopJobTracker对应StormSpout
D. HadoopReduce对应StormBolt
A. 整合性:Storm可⽅便地与队列系统和数据库系统进⾏整合
B. 简易的API:Storm的API在使⽤上即简单⼜⽅便
C. 容错性:Storm可⾃动进⾏故障节点的重启、任务的重新分配
D. 可扩展性:Storm的并⾏特性使其可以运⾏在分布式集群中
A. AmazonRDS:云中的关系数据库
B. AmazonSimpleDB:云中的键值数据库
C. AmazonDynamoDB:云中的数据仓库
D. AmazonElastiCache:云中的分布式内存缓存
A. 从分布式⽂件系统读⼊数据
B. 执⾏Map任务输出中间结果
C. 通过Shuffle阶段把中间结果分区排序整理后发送给Reduce任务
D. 执⾏Reduce任务得到最终结果并写⼊分布式⽂件系统
A. 协同过滤可分为基于⽤户的协同过滤和基于物品的协同过滤
B. UserCF算法符合⼈们对于”趣味相投”的认知,即兴趣相似的⽤户往往有相同的物品喜好
C. 实现UserCF算法的关键步骤是计算物品与物品之间的相似度
D. 基于物品的协同过滤算法(简称ItemCF算法)是⽬前业界应⽤最多的算法
A. 在传统的数据处理流程中,存储的数据是旧的
B. 在传统的数据处理流程中,需要⽤户主动发出查询来获取结果
C. 传统的数据处理流程,需要先采集数据并存储在关系数据库等数据管理系统中
D. 流计算的处理流程⼀般包含三个阶段:数据实时采集、数据批量计算、实时查询服务
A. 圆。使⽤cx和cy,指定指定半径的中⼼的坐标,和ŗ表⽰半径
B. 线。使⽤x1和Y1到指定线的⼀端的坐标,x2和y2指定的另⼀端的坐标。
C. ⽂本。使⽤x和y指定⽂本的位置
D. 椭圆。使⽤x和y的指定左上⾓的坐标,width和height指定的尺⼨
A. 数据快速持续到达,潜在⼤⼩也许是⽆穷⽆尽的
B. 数据来源众多,格式复杂
C. 注重数据的整体价值,不过分关注个别数据
D. 系统可以控制将要处理的新到达的数据元素的顺序
A. ⽂档数据库
B. 图数据库
C. 列族数据库
D. 时间戳数据库