A、 动态可扩展
B、 ⾼成本
C、 易⽤性
D、 ⼤规模并⾏处理
答案:B
A、 动态可扩展
B、 ⾼成本
C、 易⽤性
D、 ⼤规模并⾏处理
答案:B
A. 每个Region服务器都有⼀个⾃⼰的HLog⽂件
B. 每次刷写都⽣成⼀个新的StoreFile,数量太多,影响查找速度
C. 合并操作⽐较耗费资源,只有数量达到⼀个阈值才启动合并
D. Store是Region服务器的核⼼
A. 相对于Spark来说,使⽤Hadoop进⾏迭代计算⾮常耗资源
B. Spark将数据载⼊内存后,之后的迭代计算都可以直接使⽤内存中的中间结果作运算,避免了从磁盘中频繁读取数据
C. Hadoop的设计遵循”⼀个软件栈满⾜不同应⽤场景”的理念
D. Spark可以部署在资源管理器YARN之上,提供⼀站式的⼤数据解决⽅案
A. 复杂性:部署、管理、配置很复杂
B. 数据库复制:MySQL主备之间采⽤复制⽅式,只能是异步复制
C. 扩容问题:如果系统压⼒过⼤需要增加新的机器,这个过程涉及数据重新划分
D. 动态数据迁移问题:如果某个数据库组压⼒过⼤,需要将其中部分数据迁移出去
A. AllGrouping:⼴播发送,每⼀个Task都会收到所有的Tuple
B. GlobalGrouping:全局分组,所有的Tuple都发送到同⼀个Task中
C. FieldsGrouping:按照字段分组,保证相同字段的Tuple分配到同⼀个Task中
D. DirectGrouping:随机分组,随机分发Stream中的Tuple,保证每个Bolt的Task接收Tuple数量⼤致⼀致
A. 针对⼤规模数据的批量处理
B. 针对⼤规模图结构数据的处理
C. ⼤规模数据的存储管理和查询分析
D. 针对流数据的实时计算
A. 访问层
B. ⼤数据层
C. 数据源层
D. ⽹络层
A. ⽤户建模模块:对⽤户进⾏建模,根据⽤户⾏为数据和⽤户属性数据来分析⽤户的兴趣和需求
B. 推荐对象建模模块:根据对象数据对推荐对象进⾏建模
C. 推荐算法模块:基于⽤户特征和物品特征,采⽤推荐算法计算得到⽤户可能感兴趣的对象
D. 推荐算法模块:根据推荐场景对推荐结果进⾏⼀定调整,将推荐结果最终展⽰给⽤户
A. pplicationMaster分配资源
B. 把获得的资源进⼀步分配给内部的各个任务(Map任务或Reduce任务),实现资源的”⼆次分配”
C. 定时向ResourceManager发送”⼼跳”消息,报告资源的使⽤情况和应⽤的进度信息
D. 向ResourceManager汇报作业的资源使⽤情况和每个容器的运⾏状态
A. 智能医疗研发
B. 监控⾝体情况
C. 实时掌握交通状况
D. ⾦融交易
A. 把⽂件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群
B. ⽤于在Hadoop与传统数据库之间进⾏数据传递
C. ⼀个⾼可⽤的,⾼可靠的,分布式的海量⽇志采集、聚合和传输的系统
D. ⼀种⾼吞吐量的分布式发布订阅消息系统,可以处理消费者规模的⽹站中的所有动作流数据