A、 关系代数运算(选择、投影、并、交、差、连接)
B、 分组与聚合运算
C、 矩阵-向量乘法
D、 矩阵乘法
答案:ABCD
A、 关系代数运算(选择、投影、并、交、差、连接)
B、 分组与聚合运算
C、 矩阵-向量乘法
D、 矩阵乘法
答案:ABCD
A. 从分布式⽂件系统读⼊数据
B. 执⾏Map任务输出中间结果
C. 通过Shuffle阶段把中间结果分区排序整理后发送给Reduce任务
D. 执⾏Reduce任务得到最终结果并写⼊分布式⽂件系统
A. 数据快速持续到达,潜在⼤⼩也许是⽆穷⽆尽的
B. 数据来源众多,格式复杂
C. 注重数据的整体价值,不过分关注个别数据
D. 系统可以控制将要处理的新到达的数据元素的顺序
A. 数据的准确性
B. 数据处理的延迟
C. 数据存储的容量
D. 数据传输的速度
A. 只⽀持少数⼏种编程语⾔
B. 可扩展性⾼
C. 成本低
D. 能在linux上运⾏
A. 性能好(⾼并发),灵活性⾼
B. 具备统⼀的查询语法
C. ⽂档数据库⽀持⽂档间的事务
D. 复杂性低,数据结构灵活
A. HBase采⽤表来组织数据,表由⾏和列组成,列划分为若⼲个列族
B. 每个HBase表都由若⼲⾏组成,每个⾏由⾏键(rowkey)来标识
C. 列族⾥的数据通过列限定符(或列)来定位
D. 每个单元格都保存着同⼀份数据的多个版本,这些版本采⽤时间戳进⾏索引
A. ⼀切与⽀撑⼤数据组织管理和价值发现相关的企业经济活动的集合
B. 提供智能交通、智慧医疗、智能物流、智能电⽹等⾏业应⽤的企业
C. 提供数据分享平台、数据分析平台、数据租售平台等服务的企业
D. 提供分布式计算、数据挖掘、统计分析等服务的各类企业
A. MapReduce体系结构主要由四个部分组成,分别是:Client、JobTracker、TaskTracker以及Task
B. Task分为MapTask和ReduceTask两种,均由TaskTracker启动
C. 在MapReduce⼯作流程中,所有的数据交换都是通过MapReduce框架⾃⾝去实现的
D. 在MapReduce⼯作流程中,⽤户不能显式地从⼀台机器向另⼀台机器发送消息
A. worker:每个worker进程都属于⼀个特定的Topology
B. executor:executor是产⽣于worker进程内部的线程
C. task:实际的数据处理由task完成
D. 在Topology的⽣命周期中,每个组件的task数⽬是不会发⽣变化的,⽽executor的数⽬却不⼀定