A、 适合做数据统计
B、 适合HBase管理使⽤
C、 适合其他异构系统在线访问HBase表数据
D、 适合HadoopMapReduce作业并⾏批处理HBase表数据
答案:A
A、 适合做数据统计
B、 适合HBase管理使⽤
C、 适合其他异构系统在线访问HBase表数据
D、 适合HadoopMapReduce作业并⾏批处理HBase表数据
答案:A
A. 数据存储方式
B. 数据传输速度
C. 数据查询语言
D. 数据安全性
A. 使⽤DAG执⾏引擎以⽀持循环数据流与内存计算
B. 可运⾏于独⽴的集群模式中,可运⾏于Hadoop中,也可运⾏于AmazonEC2等云环境中
C. ⽀持使⽤Scala、Java、Python和R语⾔进⾏编程,但是不可以通过SparkShell进⾏交互式编程
D. Spark提供了内存计算,可将中间结果放到内存中,对于迭代计算效率更⾼
A. Mnesia
B. LVS
C. RabbitMQ
D. ZooKeeper
A. 从编程的灵活性来讲,Storm是⽐较理想的选择,它使⽤ApacheThrift,可以⽤任何编程语⾔来编写拓扑结构(Topology)
B. 当有⼤量的状态需要处理时,⽐如每个分区都有数⼗亿个元组,则可以选择Storm和SparkStreaming
C. SparkStreaming⽆法实现毫秒级的流计算
D. 在Spark上可以统⼀部署SparkSQL,SparkStreaming、MLlib,GraphX等组件,提供便捷的⼀体化编程模型
A. HadoopMapReduce是MapReduce的开源实现,后者⽐前者使⽤门槛低很多
B. MapReduce⾮共享式,容错性好
C. MapReduce批处理、实时、数据疏散型
D. MapReduce采⽤”分⽽治之”策略
A. 协同过滤可分为基于⽤户的协同过滤和基于物品的协同过滤
B. UserCF算法符合⼈们对于”趣味相投”的认知,即兴趣相似的⽤户往往有相同的物品喜好
C. 实现UserCF算法的关键步骤是计算物品与物品之间的相似度
D. 基于物品的协同过滤算法(简称ItemCF算法)是⽬前业界应⽤最多的算法
A. ⽤户建模模块
B. 推荐对象建模模块
C. 推荐算法模块
D. 数据采集模块
A. 专门⽤于处理具有⾼度相互关联关系的数据
B. ⽐较适合于社交⽹络、模式识别、依赖分析、推荐系统以及路径寻找等问题
C. 灵活性⾼,⽀持复杂的图形算法
D. 复杂性⾼,只能⽀持⼀定的数据规模
A. 负责数据的存储和读取
B. 根据客户端或者是名称节点的调度来进⾏数据的存储和检索
C. 向名称节点定期发送⾃⼰所存储的块的列表
D. ⽤来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间