A、 数据起始位置
B、 数据长度
C、 数据所在节点
D、 数据⼤⼩
答案:ABCD
A、 数据起始位置
B、 数据长度
C、 数据所在节点
D、 数据⼤⼩
答案:ABCD
A. ⽤户建模模块
B. 推荐对象建模模块
C. 推荐算法模块
D. 数据采集模块
A. 协同过滤可分为基于⽤户的协同过滤和基于物品的协同过滤
B. UserCF算法符合⼈们对于”趣味相投”的认知,即兴趣相似的⽤户往往有相同的物品喜好
C. 实现UserCF算法的关键步骤是计算物品与物品之间的相似度
D. 基于物品的协同过滤算法(简称ItemCF算法)是⽬前业界应⽤最多的算法
A. AllGrouping:⼴播发送,每⼀个Task都会收到所有的Tuple
B. GlobalGrouping:全局分组,所有的Tuple都发送到同⼀个Task中
C. FieldsGrouping:按照字段分组,保证相同字段的Tuple分配到同⼀个Task中
D. DirectGrouping:随机分组,随机分发Stream中的Tuple,保证每个Bolt的Task接收Tuple数量⼤致⼀致
A. 分布式⽂件系统
B. 分布式并⾏编程模型
C. 资源管理和调度器
D. Hadoop上的数据仓库
A. RDBMS有关系代数理论作为基础,NoSQL没有统⼀的理论基础
B. NoSQL很难实现横向扩展,RDBMS可以很容易通过添加更多设备来⽀持更⼤规模的数据
C. RDBMS需要定义数据库模式,严格遵守数据定义,NoSQL不存在数据库模式,可以⾃由灵活定义并存储各种不同类型的数据
D. RDBMS借助于索引机制可以实现快速查询,很多NoSQL数据库没有⾯向复杂查询的索引
A. AmazonRDS:云中的关系数据库
B. AmazonSimpleDB:云中的键值数据库
C. AmazonDynamoDB:云中的数据仓库
D. AmazonElastiCache:云中的分布式内存缓存
A. pplicationMaster分配资源
B. 把获得的资源进⼀步分配给内部的各个任务(Map任务或Reduce任务),实现资源的”⼆次分配”
C. 定时向ResourceManager发送”⼼跳”消息,报告资源的使⽤情况和应⽤的进度信息
D. 向ResourceManager汇报作业的资源使⽤情况和每个容器的运⾏状态
A. DougCutting
B. Lucene
C. Apache
D. MapReduce
A. HTML:⽂档对象模型,⽤于修改⽂档的内容和结构
B. CSS:层叠样式表,⽤于设定⽹页的样式
C. SVG:可缩放⽮量图形,⽤于绘制可视化的图形
D. JavaScript:⼀种直译式脚本语⾔,⽤于设定⽹页的⾏为
A. 实时获取来⾃不同数据源的海量数据,经过实时分析处理,获得有价值的信息
B. 流计算秉承⼀个基本理念,即数据的价值随着时间的流逝⽽降低
C. 对于⼀个流计算系统来说,它应该⽀持TB级甚⾄是PB级的数据规模
D. 流计算只需要保证较低的延迟时间,即只达到秒级别即可处理⼀切问题