A、 Task分为MapTask和ReduceTask两种,分别由JobTracker和TaskTracker启动
B、 slot分为Mapslot和Reduceslot两种,分别供MapTask和ReduceTask使⽤
C、 TaskTracker使⽤”slot”等量划分本节点上的资源量(CPU、内存等)
D、 TaskTracker会周期性接收JobTracker发送过来的命令并执⾏相应的操作(如启动新任务、杀死任务等)
答案:A
A、 Task分为MapTask和ReduceTask两种,分别由JobTracker和TaskTracker启动
B、 slot分为Mapslot和Reduceslot两种,分别供MapTask和ReduceTask使⽤
C、 TaskTracker使⽤”slot”等量划分本节点上的资源量(CPU、内存等)
D、 TaskTracker会周期性接收JobTracker发送过来的命令并执⾏相应的操作(如启动新任务、杀死任务等)
答案:A
A. MapReduce默认1000MB缓存
B. 多个溢写⽂件归并成⼀个或多个⼤⽂件,⽂件中的键值对是排序的
C. 当数据很少时,不需要溢写到磁盘,直接在缓存中归并,然后输出给Reduce
D. 每个Map任务分配多个缓存,使得任务运⾏更有效率
A. Hadoop可以很好地解决⼤规模数据的离线批量处理问题,但是,受限于HadoopMapReduce编程框架的⾼延迟数据处理机制,使得
B. HDFS⾯向批量访问模式,不是随机访问模式
C. 传统的通⽤关系型数据库⽆法应对在数据规模剧增时导致的系统扩展性和性能问题
D. 传统关系数据库在数据结构变化时⼀般需要停机维护;空列浪费存储空间
A. HBase采⽤表来组织数据,表由⾏和列组成,列划分为若⼲个列族
B. 每个HBase表都由若⼲⾏组成,每个⾏由⾏键(rowkey)来标识
C. 列族⾥的数据通过列限定符(或列)来定位
D. 每个单元格都保存着同⼀份数据的多个版本,这些版本采⽤时间戳进⾏索引
A. DataNode:存储被拆分的数据块
B. JobTracker:协调数据计算任务
C. TaskTracker:负责执⾏由JobTracker指派的任务
D. SecondaryNameNode:帮助NameNode收集⽂件系统运⾏的状态信息
A. 分布式⽂件系统
B. 分布式并⾏编程模型
C. 资源管理和调度器
D. Hadoop上的数据仓库
A. 访问层
B. ⼤数据层
C. 数据源层
D. ⽹络层
A. 实现⼀键式安装和配置、线程级别的任务监控和告警
B. 降低硬件集群、软件维护、任务监控和应⽤开发的难度
C. 便于做成统⼀的硬件、计算平台资源池
D. 不⽤负载应⽤混搭,集群利⽤率⾼
A. ⾕歌公司的制图服务接⼝GoogleChartAPI,可以⽤来为统计数据并⾃动⽣成图⽚
B. D3是最流⾏的可视化库之⼀,是⼀个⽤于⽹页作图、⽣成互动图形的JavaScrip函数库
C. Visual.ly可以⽤它来快速创建⾃定义的、样式美观且具有强烈视觉冲击⼒的信息图表
D. ⼤数据魔镜是⼀款优秀的国产数据分析软件,它丰富的数据公式和算法可以让⽤户真正理解探索分析数据