A、 数据分析
B、 数据实时查询
C、 数据挖掘
D、 数据接收
答案:ABC
A、 数据分析
B、 数据实时查询
C、 数据挖掘
D、 数据接收
答案:ABC
A. 不可以⽔平扩展
B. 多点故障问题
C. HDFSHA是热备份,提供⾼可⽤性,但是⽆法解决可扩展性、系统性能和隔离性
D. 系统整体性能受限于单个名称节点的吞吐量
A. ⽬录
B. ⽂件
C. 块
D. 磁盘
A. 每个Region服务器都有⼀个⾃⼰的HLog⽂件
B. 每次刷写都⽣成⼀个新的StoreFile,数量太多,影响查找速度
C. 合并操作⽐较耗费资源,只有数量达到⼀个阈值才启动合并
D. Store是Region服务器的核⼼
A. 复杂性:部署、管理、配置很复杂
B. 数据库复制:MySQL主备之间采⽤复制⽅式,只能是异步复制
C. 扩容问题:如果系统压⼒过⼤需要增加新的机器,这个过程涉及数据重新划分
D. 动态数据迁移问题:如果某个数据库组压⼒过⼤,需要将其中部分数据迁移出去
A. 每个Application都有⾃⼰专属的Executor进程,并且该进程在Application运⾏期间⼀直驻留
B. Executor进程以多线程的⽅式运⾏Task
C. Spark运⾏过程与资源管理器⽆关,只要能够获取Executor进程并保持通信即可
D. Task采⽤了数据本地性和推测执⾏等优化机制
A. Client
B. JobTracker
C. TaskTracker以及Task
D. Job
A. 针对⼤规模数据的批量处理
B. 针对⼤规模图结构数据的处理
C. ⼤规模数据的存储管理和查询分析
D. 针对流数据的实时计算
A. 分布式并⾏编程模型
B. 流计算框架
C. Hadoop上的⼯作流管理系统
D. 提供分布式协调⼀致性服务
A. 专家推荐:⼈⼯推荐,由资深的专业⼈⼠来进⾏物品的筛选和推荐,需要较多的⼈⼒成本性
B. 基于统计的推荐:通过机器学习的⽅法去描述内容的特征,并基于内容的特征来发现与之相似的内容
C. 协同过滤推荐:应⽤最早和最为成功的推荐⽅法之⼀
D. 混合推荐:结合多种推荐算法来提升推荐效果
A. 不适合低延迟数据访问
B. ⽆法⾼效存储⼤量⼩⽂件
C. 不⽀持多⽤户写⼊及任意修改⽂件
D. 较差的跨平台兼容性