A、 FsImage⽂件没有记录⽂件包含哪些块以及每个块存储在哪个数据节点
B、 FsImage⽂件包含⽂件系统中所有⽬录和⽂件inode的序列化形式
C、 FsImage⽤于维护⽂件系统树以及⽂件树中所有的⽂件和⽂件夹的元数据
D、 FsImage⽂件记录了所有针对⽂件的创建、删除、重命名等操作
答案:A
A、 FsImage⽂件没有记录⽂件包含哪些块以及每个块存储在哪个数据节点
B、 FsImage⽂件包含⽂件系统中所有⽬录和⽂件inode的序列化形式
C、 FsImage⽤于维护⽂件系统树以及⽂件树中所有的⽂件和⽂件夹的元数据
D、 FsImage⽂件记录了所有针对⽂件的创建、删除、重命名等操作
答案:A
A. 充分利⽤主从库实现⽤户读写操作的分离,实现负载均衡
B. UMP系统实现了对于⽤户透明的读写分离功能
C. UMP采⽤的两种资源隔离⽅式(⽤Cgroup限制MySQL进程资源和在Proxy服务器端限制QPS)
D. UMP系统只设计了⼀种机制来保证数据安全
A. 基于⽤户的协同过滤
B. 基于物品的协同过滤
C. 基于⽤户和物品的联合协同过滤
D. 基于商家的协同过滤
A. 间断性
B. 原⼦性
C. ⼀致性
D. 持久性
A. 复杂的批量数据处理:通常时间跨度在数⼗分钟到数⼩时之间
B. 基于历史数据的交互式查询:通常时间跨度在数⼗秒到数分钟之间
C. 基于实时数据流的数据处理:通常时间跨度在数⼗秒到数分钟之间
D. 基于实时数据流的数据处理:通常时间跨度在数百毫秒到数秒之间
A. UserCF算法的推荐更偏向社会化:适合应⽤于新闻推荐、微博话题推荐等应⽤场景,其推荐结果在新颖性⽅⾯有⼀定的优势
B. ItemCF算法的推荐更偏向于个性化
C. ItemCF随着⽤户数⽬的增⼤,⽤户相似度计算复杂度越来越⾼
D. UserCF推荐结果相关性较弱,难以对推荐结果作出解释,容易受⼤众影响⽽推荐热门物品
A. 相对于Spark来说,使⽤Hadoop进⾏迭代计算⾮常耗资源
B. Spark将数据载⼊内存后,之后的迭代计算都可以直接使⽤内存中的中间结果作运算,避免了从磁盘中频繁读取数据
C. Hadoop的设计遵循”⼀个软件栈满⾜不同应⽤场景”的理念
D. Spark可以部署在资源管理器YARN之上,提供⼀站式的⼤数据解决⽅案
A. 专门⽤于处理具有⾼度相互关联关系的数据
B. ⽐较适合于社交⽹络、模式识别、依赖分析、推荐系统以及路径寻找等问题
C. 灵活性⾼,⽀持复杂的图形算法
D. 复杂性⾼,只能⽀持⼀定的数据规模
A. 单⼀名称节点,存在单点失效问题
B. 单⼀命名空间,⽆法实现资源隔离
C. 资源管理效率低
D. 很难上⼿
A. 顶点值(Vertexvalue):顶点对应的PR值
B. 出射边(Outedge):只需要表⽰⼀条边,可以不取值
C. 消息(Message):传递的消息
D. ⼊射边(Iutedge):只需要表⽰⼀条边,可以不取值
A. 利⽤分布式⽂件系统、数据仓库、关系数据库等实现对结构化、半结构化和⾮结构化海量数据的存储和管理
B. 利⽤分布式并⾏编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析
C. 构建隐私数据保护体系和数据安全体系,有效保护个⼈隐私和数据安全
D. 把实时采集的数据作为流计算系统的输⼊,进⾏实时处理分析