A、 分布式存储
B、 数据处理与分析
C、 分布式处理
D、 数据存储与管理
答案:AC
A、 分布式存储
B、 数据处理与分析
C、 分布式处理
D、 数据存储与管理
答案:AC
A. MapReduce具有⼴泛的应⽤,⽐如关系代数运算、分组与聚合运算等
B. MapReduce将复杂的、运⾏于⼤规模集群上的并⾏计算过程⾼度地抽象到了两个函数
C. 编程⼈员在不会分布式并⾏编程的情况下,也可以很容易将⾃⼰的程序运⾏在分布式系统上,完成海量数据集的计算
D. 不同的Map任务之间可以进⾏通信
A. 任务调度、监控与容错
B. 为应⽤程序申请资源
C. 将申请的资源分配给内部任务
D. 处理来⾃ResourceManger的命令
A. RDD(ResillientDistributedDataset)是运⾏在⼯作节点(WorkerNode)的⼀个进程,负责运⾏Task
B. Application是⽤户编写的Spark应⽤程序
C. ⼀个Job包含多个RDD及作⽤于相应RDD上的各种操作
D. DirectedAcyclicGraph反映RDD之间的依赖关系
A. 顶点的出度
B. 顶点
C. 边
D. 消息
A. 适合做数据统计
B. 适合HBase管理使⽤
C. 适合其他异构系统在线访问HBase表数据
D. 适合HadoopMapReduce作业并⾏批处理HBase表数据
A. 分布式环境必须要考虑系统出错。HBase采⽤HLog保证
B. HBase系统为每个Region服务器配置了⼀个HLog⽂件
C. Zookeeper会实时监测每个Region服务器的状态
D. Master⾸先会处理该故障Region服务器上⾯遗留的HLog⽂件
A. 基于⽤户的协同过滤
B. 基于物品的协同过滤
C. 基于⽤户和物品的联合协同过滤
D. 基于商家的协同过滤
A. 开发⼯具
B. 开源软件
C. 商业化⼯具
D. 数据采集
A. 流数据层(Kafka)
B. 执⾏层(YARN)
C. 处理层(SamzaAPI)
D. 数据采集层(Scribe)
A. 读写分离
B. 分库分表
C. 数据安全
D. 资源合并