A、 较低可扩展性
B、 只⽀持java语⾔
C、 成本低
D、 运⾏在Linux平台上
答案:AB
A、 较低可扩展性
B、 只⽀持java语⾔
C、 成本低
D、 运⾏在Linux平台上
答案:AB
A. 分布式存储
B. 数据处理与分析
C. 分布式处理
D. 数据存储与管理
A. ⾕歌公司的制图服务接⼝GoogleChartAPI,可以⽤来为统计数据并⾃动⽣成图⽚
B. D3是最流⾏的可视化库之⼀,是⼀个⽤于⽹页作图、⽣成互动图形的JavaScrip函数库
C. Visual.ly可以⽤它来快速创建⾃定义的、样式美观且具有强烈视觉冲击⼒的信息图表
D. ⼤数据魔镜是⼀款优秀的国产数据分析软件,它丰富的数据公式和算法可以让⽤户真正理解探索分析数据
A. 存储被拆分的数据块
B. 协调数据计算任务
C. 负责协调集群中的数据存储
D. 负责执⾏由JobTracker指派的任务
A. 协同过滤可分为基于⽤户的协同过滤和基于物品的协同过滤
B. UserCF算法符合⼈们对于”趣味相投”的认知,即兴趣相似的⽤户往往有相同的物品喜好
C. 实现UserCF算法的关键步骤是计算物品与物品之间的相似度
D. 基于物品的协同过滤算法(简称ItemCF算法)是⽬前业界应⽤最多的算法
A. FsImage⽂件没有记录⽂件包含哪些块以及每个块存储在哪个数据节点
B. FsImage⽂件包含⽂件系统中所有⽬录和⽂件inode的序列化形式
C. FsImage⽤于维护⽂件系统树以及⽂件树中所有的⽂件和⽂件夹的元数据
D. FsImage⽂件记录了所有针对⽂件的创建、删除、重命名等操作
A. 基于物品的协同过滤算法(简称ItemCF算法)是⽬前业界应⽤最多的算法
B. ItemCF算法是给⽬标⽤户推荐那些和他们之前喜欢的物品相似的物品
C. ItemCF算法通过建⽴⽤户到物品倒排表(每个⽤户喜欢的物品的列表)来计算物品相似度
D. UserCF算法推荐的是那些和⽬标⽤户有共同兴趣爱好的其他⽤户所喜欢的物品
A. ⽀持各种编程语⾔:Storm⽀持使⽤各种编程语⾔来定义任务
B. 容错性:Storm需要⼈⼯进⾏故障节点的重启、任务的重新分配
C. 可扩展性:Storm的并⾏特性使其可以运⾏在分布式集群中
D. 免费、开源:Storm是⼀款开源框架,可以免费使⽤
A. worker:每个worker进程都属于⼀个特定的Topology
B. executor:executor是产⽣于worker进程内部的线程
C. task:实际的数据处理由task完成
D. 在Topology的⽣命周期中,每个组件的task数⽬是不会发⽣变化的,⽽executor的数⽬却不⼀定