A、 智能医疗研发
B、 监控⾝体情况
C、 实时掌握交通状况
D、 ⾦融交易
答案:ABCD
A、 智能医疗研发
B、 监控⾝体情况
C、 实时掌握交通状况
D、 ⾦融交易
答案:ABCD
A. Master-status(⾃带)
B. Ganglia
C. OpenTSDB
D. Ambari
A. 设计了HDFSHA
B. 提供名称节点热备机制
C. 设计了HDFSFederation,管理多个命名空间
D. 设计了新的资源管理框架YARN
A. 命名空间的限制
B. 性能的瓶颈
C. 隔离问题
D. 集群的可⽤性
A. 观测、跟踪数据
B. 分析数据
C. 辅助理解数据
D. 增强数据吸引⼒
A. worker:每个worker进程都属于⼀个特定的Topology
B. executor:executor是产⽣于worker进程内部的线程
C. task:实际的数据处理由task完成
D. 在Topology的⽣命周期中,每个组件的task数⽬是不会发⽣变化的,⽽executor的数⽬却不⼀定
A. 基于⽤户的协同过滤算法(简称UserCF算法)在1992年被提出,是推荐系统中最古⽼的算法
B. UserCF算法符合⼈们对于”趣味相投”的认知
C. 实现UserCF算法的关键步骤是计算⽤户与⽤户之间的兴趣相似度
D. UserCF算法符合兴趣相似的⽤户往往有相同的物品喜好
A. 通过单个⾏健访问
B. 通过时间戳访问
C. 通过⼀个⾏健的区间来访问
D. 全表扫描
A. Task分为MapTask和ReduceTask两种,分别由JobTracker和TaskTracker启动
B. slot分为Mapslot和Reduceslot两种,分别供MapTask和ReduceTask使⽤
C. TaskTracker使⽤”slot”等量划分本节点上的资源量(CPU、内存等)
D. TaskTracker会周期性接收JobTracker发送过来的命令并执⾏相应的操作(如启动新任务、杀死任务等)
A. Scala语法复杂,但是能提供优雅的API计算
B. Scala具备强⼤的并发性,⽀持函数式编程,可以更好地⽀持分布式系统
C. Scala兼容Java,运⾏速度快,且能融合到Hadoop⽣态圈中
D. Scala是Spark的主要编程语⾔
A. 实时获取来⾃不同数据源的海量数据,经过实时分析处理,获得有价值的信息
B. 流计算秉承⼀个基本理念,即数据的价值随着时间的流逝⽽降低
C. 对于⼀个流计算系统来说,它应该⽀持TB级甚⾄是PB级的数据规模
D. 流计算只需要保证较低的延迟时间,即只达到秒级别即可处理⼀切问题