A、 资源管理
B、 任务调度
C、 任务监控
D、 数据即服务
答案:ABC
A、 资源管理
B、 任务调度
C、 任务监控
D、 数据即服务
答案:ABC
A. 使⽤DAG执⾏引擎以⽀持循环数据流与内存计算
B. 可运⾏于独⽴的集群模式中,可运⾏于Hadoop中,也可运⾏于AmazonEC2等云环境中
C. ⽀持使⽤Scala、Java、Python和R语⾔进⾏编程,但是不可以通过SparkShell进⾏交互式编程
D. Spark提供了内存计算,可将中间结果放到内存中,对于迭代计算效率更⾼
A. AllGrouping:⼴播发送,每⼀个Task都会收到所有的Tuple
B. GlobalGrouping:全局分组,所有的Tuple都发送到同⼀个Task中
C. FieldsGrouping:按照字段分组,保证相同字段的Tuple分配到同⼀个Task中
D. DirectGrouping:随机分组,随机分发Stream中的Tuple,保证每个Bolt的Task接收Tuple数量⼤致⼀致
A. 开发⼯具
B. 开源软件
C. 商业化⼯具
D. 数据采集
A. 数据泄露
B. 数据篡改
C. 数据丢失
D. 数据类型多样化
A. ⽤户编写的MapReduce程序通过Client提交到JobTracker端
B. JobTracker负责资源监控和作业调度
C. TaskTracker监控所有TaskTracker与Job的健康状况
D. TaskTracker使⽤”slot”等量划分本节点上的资源量(CPU、内存等)
A. Storm将流数据Stream描述成⼀个有限的Tuple序列
B. Storm保证每个消息都能完整处理
C. Storm认为每个Stream都有⼀个源头,并把这个源头抽象为Spout
D. Bolt可以执⾏过滤、函数操作、Join、操作数据库等任何操作
A. HBase则采⽤了更加简单的数据模型,它把数据存储为未经解释的字符串
B. HBase操作不存在复杂的表与表之间的关系
C. HBase操作只有简单的插⼊、查询、删除、清空等
D. HBase在设计上就避免了复杂的表和表之间的关系
A. 实现相同Region服务器之间的负载均衡⾏
B. 在Region分裂或合并后,负责重新调整Region的分布
C. 对发⽣故障失效的Region服务器上的Region进⾏迁移
D. 管理⽤户对表的增加、删除、修改、查询等操作
A. 关系代数运算(选择、投影、并、交、差、连接)
B. 分组与聚合运算
C. 矩阵-向量乘法
D. 矩阵乘法