A、 CPU性能
B、 内存
C、 ⽹络
D、 存储容量
答案:ABCD
A、 CPU性能
B、 内存
C、 ⽹络
D、 存储容量
答案:ABCD
A. 电信⾏业:客户离⽹分析
B. 智能机器⼈
C. 零售⾏业:发现关联购买⾏为、进⾏客户群体细分
D. 推荐系统
A. 常常表现出⽐较差的内存访问局部性
B. 针对单个顶点的处理⼯作过少
C. 计算过程中伴随着并⾏度的改变
D. 计算过程简易
A. 兼容廉价的硬件设备
B. 流数据读写
C. ⼤数据集
D. 复杂的⽂件模型
A. Hadoop擅长批处理,不适合流计算
B. MapReduce是专门⾯向静态数据的批量处理的
C. Hadoop设计的初衷是⾯向⼤规模数据的批量处理
D. MapReduce不适合⽤于处理持续到达的动态数据
A. CPU性能
B. 内存
C. ⽹络
D. 存储容量
A. 所有的数据交换都是通过MapReduce框架⾃⾝去实现的
B. 不同的Map任务之间会进⾏通信
C. 不同的Reduce任务之间可以发⽣信息交换
D. ⽤户可以显式地从⼀台机器向另⼀台机器发送消息
A. 能够解决单点故障问题
B. HDFS集群扩展性
C. 性能更⾼效
D. 良好的隔离性
A. 实时性差(适合批处理,不⽀持实时交互式)
B. 资源浪费(Map和Reduce分两阶段执⾏)
C. 执⾏迭代操作效率低
D. 难以看到程序整体逻辑
A. 从磁盘或从⽹络读取数据,即IO密集⼯作
B. 计算数据,即CPU密集⼯作
C. 针对不同的⼯作节点选择合适硬件类型
D. 负责协调集群中的数据存储
A. Task分为MapTask和ReduceTask两种,分别由JobTracker和TaskTracker启动
B. slot分为Mapslot和Reduceslot两种,分别供MapTask和ReduceTask使⽤
C. TaskTracker使⽤”slot”等量划分本节点上的资源量(CPU、内存等)
D. TaskTracker会周期性接收JobTracker发送过来的命令并执⾏相应的操作(如启动新任务、杀死任务等)