A、 该顶点的当前值
B、 ⼀个接收到的消息的迭代器
C、 ⼀个出射边的迭代器
D、 ⼀个⼊射边的迭代器
答案:D
A、 该顶点的当前值
B、 ⼀个接收到的消息的迭代器
C、 ⼀个出射边的迭代器
D、 ⼀个⼊射边的迭代器
答案:D
A. 数据类型
B. 数据操作
C. 存储模式
D. 数据维护
A. 客户端是⽤户操作HDFS最常⽤的⽅式,HDFS在部署时都提供了客户端
B. HDFS客户端是⼀个库,暴露了HDFS⽂件系统接⼝
C. 严格来说,客户端并不算是HDFS的⼀部分
D. 客户端可以⽀持打开、读取、写⼊等常见的操作
A. 读写分离
B. 分库分表
C. 数据安全
D. 资源合并
A. 数据中⼼是云计算的重要载体,为各种平台和应⽤提供运⾏⽀撑环境
B. 提供智能交通、智慧医疗、智能物流、智能电⽹等
C. 提供分布式计算、数据挖掘、统计分析等服务
D. 提供硬件、软件、⽹络等基础设施
A. 泊松相关系数
B. 余弦相似度
C. 调整余弦相似度
D. 调整正弦相似度
A. RDS是阿⾥云提供的关系型数据库服务
B. RDS由专业数据库管理团队维护
C. RDS具有安全稳定、数据可靠、⾃动备份
D. RDS实例,是⽤户购买RDS服务的基本单位。在实例中,⽤户只能创建⼀个数据库
A. MapReduce具有⼴泛的应⽤,⽐如关系代数运算、分组与聚合运算等
B. MapReduce将复杂的、运⾏于⼤规模集群上的并⾏计算过程⾼度地抽象到了两个函数
C. 编程⼈员在不会分布式并⾏编程的情况下,也可以很容易将⾃⼰的程序运⾏在分布式系统上,完成海量数据集的计算
D. 不同的Map任务之间可以进⾏通信
A. ⾮共享式,容错性好
B. 普通PC机,便宜,扩展性好
C. what,简单
D. 批处理、⾮实时、数据密集型
A. worker:每个worker进程都属于⼀个特定的Topology
B. executor:executor是产⽣于worker进程内部的线程
C. task:实际的数据处理由task完成
D. 在Topology的⽣命周期中,每个组件的task数⽬是不会发⽣变化的,⽽executor的数⽬却不⼀定
A. 相对于Spark来说,使⽤Hadoop进⾏迭代计算⾮常耗资源
B. Spark将数据载⼊内存后,之后的迭代计算都可以直接使⽤内存中的中间结果作运算,避免了从磁盘中频繁读取数据
C. Hadoop的设计遵循”⼀个软件栈满⾜不同应⽤场景”的理念
D. Spark可以部署在资源管理器YARN之上,提供⼀站式的⼤数据解决⽅案