答案:大数据安全面临的挑战包括数据泄露、数据篡改、数据丢失等。应对措施包括加强数据加密和访问控制,确保数据的保 密性;采用数据备份和恢复机制,防止数据丢失;同时,建 立完善的安全管理制度和流程,提高人员的安全意识
答案:大数据安全面临的挑战包括数据泄露、数据篡改、数据丢失等。应对措施包括加强数据加密和访问控制,确保数据的保 密性;采用数据备份和恢复机制,防止数据丢失;同时,建 立完善的安全管理制度和流程,提高人员的安全意识
A. 每个Application都有⾃⼰专属的Executor进程,并且该进程在Application运⾏期间⼀直驻留
B. Executor进程以多线程的⽅式运⾏Task
C. Spark运⾏过程与资源管理器⽆关,只要能够获取Executor进程并保持通信即可
D. Task采⽤了数据本地性和推测执⾏等优化机制
A. 不同场景之间输⼊输出数据⽆法做到⽆缝共享,通常需要进⾏数据格式的转换
B. 不同的软件需要不同的开发和维护团队
C. 需要较⾼的使⽤成本
D. ⽐较难以对同⼀个集群中的各个系统进⾏统⼀的资源协调和分配
A. Standalone(类似于MapReduce1.0,slot为资源分配单位)
B. SparkonMesos(和Spark有⾎缘关系,更好⽀持Mesos)
C. SparkonYARN
D. SparkonHDFS
A. 基于物品的协同过滤算法(简称ItemCF算法)是⽬前业界应⽤最多的算法
B. ItemCF算法是给⽬标⽤户推荐那些和他们之前喜欢的物品相似的物品
C. ItemCF算法通过建⽴⽤户到物品倒排表(每个⽤户喜欢的物品的列表)来计算物品相似度
D. UserCF算法推荐的是那些和⽬标⽤户有共同兴趣爱好的其他⽤户所喜欢的物品
A. CPU性能
B. 内存
C. ⽹络
D. 存储容量
A. 源节点(SourceNode)
B. 主节点(MasterNode)
C. 名称结点(NameNode)
D. 节点(SlaveNode)
A. Pig
B. Spark
C. Kafka
D. DN8
A. 基于⽤户的协同过滤算法(简称UserCF算法)在1992年被提出,是推荐系统中最古⽼的算法
B. UserCF算法符合⼈们对于”趣味相投”的认知
C. 实现UserCF算法的关键步骤是计算⽤户与⽤户之间的兴趣相似度
D. UserCF算法符合兴趣相似的⽤户往往有相同的物品喜好
A. 顶点的当前值
B. 以该顶点为起点的出射边列表,每条出射边包含了⽬标顶点ID和边的值
C. 消息队列,包含了所有接收到的、发送给该顶点的消息
D. 标志位,⽤来标记顶点是否处于活跃状态
A. Hadoop⾃⾝核⼼组件MapReduce的架构设计改进
B. Hadoop⾃⾝核⼼组件HDFS的架构设计改进
C. Hadoop⽣态系统其它组件的不断丰富
D. Hadoop⽣态系统减少不必要的组件,整合系统