A、 选择集群中的多台机器执⾏图计算任务,每台机器上运⾏⽤户程序的⼀个副本
B、 Master把⼀个图分成多个分区,并把分区分配到多个Worker
C、 ster会把⽤户输⼊划分成多个部分,通常是基于⽂件边界进⾏划分
D、 ster向每个Worker发送指令,Worker收到指令后,开始运⾏⼀个超步
答案:ABCD
A、 选择集群中的多台机器执⾏图计算任务,每台机器上运⾏⽤户程序的⼀个副本
B、 Master把⼀个图分成多个分区,并把分区分配到多个Worker
C、 ster会把⽤户输⼊划分成多个部分,通常是基于⽂件边界进⾏划分
D、 ster向每个Worker发送指令,Worker收到指令后,开始运⾏⼀个超步
答案:ABCD
A. FieldsGrouping:⼴播发送,每⼀个Task都会收到所有的Tuple
B. GlobalGrouping:全局分组,所有的Tuple都发送到同⼀个Task中
C. NonGrouping:不分组,和ShuffleGrouping类似,当前Task的执⾏会和它的被订阅者在同⼀个线程中执⾏
D. DirectGrouping:直接分组,直接指定由某个Task来执⾏Tuple的处理
A. ⽤户编写的MapReduce程序通过Client提交到JobTracker端
B. JobTracker负责资源监控和作业调度
C. TaskTracker监控所有TaskTracker与Job的健康状况
D. TaskTracker使⽤”slot”等量划分本节点上的资源量(CPU、内存等)
A. ⼑⽚服务器、⾼速⽹、SAN,价格贵,扩展性差上
B. 共享式(共享内存/共享存储),容错性好
C. what-how,难
D. 实时、细粒度计算、计算密集型
A. 分布式存储
B. 数据处理与分析
C. 分布式处理
D. 数据存储与管理
A. 数据挖掘
B. 云计算
C. 机器学习
D. 关系型数据库
A. ⼤数据魔镜是⼀款优秀的国产数据分析软件,可以让⽤户真正理解探索分析数据
B. Tableau是桌⾯系统中最简单的商业智能⼯具软件,是⼀个⽤于⽹页作图、⽣成互动图形的JavaScript函数库
C. GoogleFusionTables让⼀般使⽤者也可以轻松制作出专业的统计地图
D. ModestMaps是⼀个⼩型、可扩展、交互式的免费库,提供了⼀套查看卫星地图的API
A. HBase采⽤表来组织数据,表由⾏和列组成,列划分为若⼲个列族
B. 每个HBase表都由若⼲⾏组成,每个⾏由⾏键(rowkey)来标识
C. 列族⾥的数据通过列限定符(或列)来定位
D. 每个单元格都保存着同⼀份数据的多个版本,这些版本采⽤时间戳进⾏索引
A. MapReduce默认1000MB缓存
B. 多个溢写⽂件归并成⼀个或多个⼤⽂件,⽂件中的键值对是排序的
C. 当数据很少时,不需要溢写到磁盘,直接在缓存中归并,然后输出给Reduce
D. 每个Map任务分配多个缓存,使得任务运⾏更有效率
A. 分布式并⾏编程模型
B. 流计算框架
C. Hadoop上的⼯作流管理系统
D. 提供分布式协调⼀致性服务
A. 能够解决单点故障问题
B. HDFS集群扩展性
C. 性能更⾼效
D. 良好的隔离性