A、 同⼀个Region不会被分拆到多个Region服务器
B、 为了加快访问速度,.META.表的全部Region都会被保存在内存中
C、 ⼀个-ROOT-表可以有多个Region
D、 为了加速寻址,客户端会缓存位置信息,同时,需要解决缓存失效问题
答案:C
A、 同⼀个Region不会被分拆到多个Region服务器
B、 为了加快访问速度,.META.表的全部Region都会被保存在内存中
C、 ⼀个-ROOT-表可以有多个Region
D、 为了加速寻址,客户端会缓存位置信息,同时,需要解决缓存失效问题
答案:C
A. 从分布式⽂件系统读⼊数据
B. 执⾏Map任务输出中间结果
C. 通过Shuffle阶段把中间结果分区排序整理后发送给Reduce任务
D. 执⾏Reduce任务得到最终结果并写⼊分布式⽂件系统
A. 只⽀持少数⼏种编程语⾔
B. 可扩展性⾼
C. 成本低
D. 能在linux上运⾏
A. 数据的准确性
B. 数据处理的延迟
C. 数据存储的容量
D. 数据传输的速度
A. 利⽤分布式⽂件系统、数据仓库、关系数据库等实现对结构化、半结构化和⾮结构化海量数据的存储和管理
B. 利⽤分布式并⾏编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析
C. 构建隐私数据保护体系和数据安全体系,有效保护个⼈隐私和数据安全
D. 把实时采集的数据作为流计算系统的输⼊,进⾏实时处理分析
A. 为了让⽤户从海量信息中⾼效地获得⾃⼰所需的信息,推荐系统应运⽽⽣
B. 推荐系统是⼤数据在互联⽹领域的典型应⽤
C. 推荐系统是⾃动联系⽤户和物品的⼀种⼯具
D. 推荐系统是利⽤⼤数据为⽤户推荐消费内容、调整线下门店布局、控制店内⼈流量
A. 图结构数据的处理
B. 基于历史数据的交互式查询
C. 复杂的批量数据处理
D. 基于历史数据的数据挖掘
A. 数据挖掘
B. 离线分析
C. 实时查询
D. BI分析
A. 推荐系统可以创造全新的商业和经济模式,帮助实现长尾商品的销售
B. ”长尾”概念于2004年提出,⽤来描述以亚马逊为代表的电⼦商务⽹站的商业和经济模式
C. 可以通过发掘长尾商品并推荐给感兴趣的⽤户来提⾼销售额
D. 热门推荐的主要缺陷在于推荐的范围有限,所推荐的内容在⼀定时期内也相对固定。⽆法实现长尾商品的推荐
A. Scala语法复杂,但是能提供优雅的API计算
B. Scala具备强⼤的并发性,⽀持函数式编程,可以更好地⽀持分布式系统
C. Scala兼容Java,运⾏速度快,且能融合到Hadoop⽣态圈中
D. Scala是Spark的主要编程语⾔