A、 为海量数据提供存储的HDFS和对数据进⾏计算的MapReduce
B、 提供整个HDFS⽂件系统的NameSpace(命名空间)管理、块管理等所有服务
C、 Hadoop不仅可以运⾏在企业内部的集群中,也可以运⾏在云计算环境中
D、 Hadoop被视为事实上的⼤数据处理标准
答案:A
A、 为海量数据提供存储的HDFS和对数据进⾏计算的MapReduce
B、 提供整个HDFS⽂件系统的NameSpace(命名空间)管理、块管理等所有服务
C、 Hadoop不仅可以运⾏在企业内部的集群中,也可以运⾏在云计算环境中
D、 Hadoop被视为事实上的⼤数据处理标准
答案:A
A. 专门⽤于处理具有⾼度相互关联关系的数据
B. ⽐较适合于社交⽹络、模式识别、依赖分析、推荐系统以及路径寻找等问题
C. 灵活性⾼,⽀持复杂的图形算法
D. 复杂性⾼,只能⽀持⼀定的数据规模
A. 许多⾮图结构的⼤数据,通常会被转换为关系模型后进⾏分析
B. 许多⼤数据都是以⼤规模图或⽹络的形式呈现
C. 图数据结构很好地表达了数据之间的关联性
D. 关联性计算是⼤数据计算的核⼼
A. RDD(ResillientDistributedDataset)是运⾏在⼯作节点(WorkerNode)的⼀个进程,负责运⾏Task
B. Application是⽤户编写的Spark应⽤程序
C. ⼀个Job包含多个RDD及作⽤于相应RDD上的各种操作
D. DirectedAcyclicGraph反映RDD之间的依赖关系
A. 读写分离
B. 分库分表
C. 数据安全
D. 资源合并
A. 协同过滤可分为基于⽤户的协同过滤和基于物品的协同过滤
B. UserCF算法符合⼈们对于”趣味相投”的认知,即兴趣相似的⽤户往往有相同的物品喜好
C. 实现UserCF算法的关键步骤是计算物品与物品之间的相似度
D. 基于物品的协同过滤算法(简称ItemCF算法)是⽬前业界应⽤最多的算法
A. 灵活的可扩展性
B. 灵活的数据模型
C. 与云计算紧密融合
D. ⼤型的数据库
A. 间断性
B. 原⼦性
C. ⼀致性
D. 持久性
A. 描边(stroke)-颜⾊值
B. 描边宽度(stroke-width)-数字(通常以像素为单位)
C. SVG的默认样式是⿊⾊填充
D. 不透明度(opacity)–0.0(完全透明)和1.0(完全不透明)之间的数值
A. 只⽀持少数⼏种编程语⾔
B. 可扩展性⾼
C. 成本低
D. 能在linux上运⾏
A. UserCF算法的推荐更偏向社会化:适合应⽤于新闻推荐、微博话题推荐等应⽤场景,其推荐结果在新颖性⽅⾯有⼀定的优势
B. ItemCF算法的推荐更偏向于个性化
C. ItemCF随着⽤户数⽬的增⼤,⽤户相似度计算复杂度越来越⾼
D. UserCF推荐结果相关性较弱,难以对推荐结果作出解释,容易受⼤众影响⽽推荐热门物品