A、 DataNode:存储被拆分的数据块
B、 JobTracker:协调数据计算任务
C、 TaskTracker:负责执⾏由JobTracker指派的任务
D、 SecondaryNameNode:帮助NameNode收集⽂件系统运⾏的状态信息
答案:ABCD
A、 DataNode:存储被拆分的数据块
B、 JobTracker:协调数据计算任务
C、 TaskTracker:负责执⾏由JobTracker指派的任务
D、 SecondaryNameNode:帮助NameNode收集⽂件系统运⾏的状态信息
答案:ABCD
A. 顶点的当前值
B. 消息队列
C. 标志位
D. ⼀个接收到的消息的迭代器
A. GFS与Zookeeper
B. GFS与HDFS
C. MapReduce与HadoopMapReduce
D. Chubby与Zookeeper
A. Scala的优势是提供了REPL(Read-Eval-PrintLoop,交互式解释器),提⾼程序开发效率
B. Scala兼容Java,运⾏速度快,且能融合到Hadoop⽣态圈中
C. Scala具备强⼤的并发性,⽀持函数式编程
D. Scala可以更好地⽀持分布式系统
A. 利⽤分布式⽂件系统、数据仓库、关系数据库等实现对结构化、半结构化和⾮结构化海量数据的存储和管理
B. 利⽤分布式并⾏编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析
C. 构建隐私数据保护体系和数据安全体系,有效保护个⼈隐私和数据安全
D. 把实时采集的数据作为流计算系统的输⼊,进⾏实时处理分析
A. 数据快速持续到达,潜在⼤⼩也许是⽆穷⽆尽的
B. 数据来源众多,格式复杂
C. 注重数据的整体价值,不过分关注个别数据
D. 系统可以控制将要处理的新到达的数据元素的顺序
A. 运⾏速度快
B. 容易使⽤
C. 通⽤性
D. 运⾏模式单⼀
A. worker:每个worker进程都属于⼀个特定的Topology
B. executor:executor是产⽣于worker进程内部的线程
C. task:实际的数据处理由task完成
D. 在Topology的⽣命周期中,每个组件的task数⽬是不会发⽣变化的,⽽executor的数⽬却不⼀定
A. ⽤户建模模块
B. 推荐对象建模模块
C. 推荐算法模块
D. 数据采集模块
A. 专门⽤于处理具有⾼度相互关联关系的数据
B. ⽐较适合于社交⽹络、模式识别、依赖分析、推荐系统以及路径寻找等问题
C. 灵活性⾼,⽀持复杂的图形算法
D. 复杂性⾼,只能⽀持⼀定的数据规模