A、 增加数据量
B、 删除重复数据
C、 提高数据质量
D、 降低存储空间
答案:C
A、 增加数据量
B、 删除重复数据
C、 提高数据质量
D、 降低存储空间
答案:C
A. 表达能⼒有限
B. 磁盘IO开销⼤
C. 延迟⾼
D. 在前⼀个任务执⾏完成之前,其他任务就⽆法开始,难以胜任复杂、多阶段的计算任务
A. 矩形
B. 圆形
C. 线条
D. 图⽚
A. 使⽤DAG执⾏引擎以⽀持循环数据流与内存计算
B. 可运⾏于独⽴的集群模式中,可运⾏于Hadoop中,也可运⾏于AmazonEC2等云环境中
C. ⽀持使⽤Scala、Java、Python和R语⾔进⾏编程,但是不可以通过SparkShell进⾏交互式编程
D. Spark提供了内存计算,可将中间结果放到内存中,对于迭代计算效率更⾼
A. 操作系统和围绕特定应⽤的必需的服务
B. 将基础设施(计算资源和存储)作为服务出租
C. 从⼀个集中的系统部署软件,使之在⼀台本地计算机上(或从云中远程地)运⾏的⼀个模型
D. 提供硬件、软件、⽹络等基础设施以及提供咨询、规划和系统集成服务
A. ⽀持⼤规模⽂件存储
B. 简化系统设计
C. 适合数据备份
D. ⽀持中等规模⽂件存储
A. 不适合低延迟数据访问
B. ⽆法⾼效存储⼤量⼩⽂件
C. 不⽀持多⽤户写⼊及任意修改⽂件
D. 较差的跨平台兼容性
A. ⽆法满⾜海量数据的管理需求
B. ⽆法满⾜数据⾼并发的需求
C. ⽆法满⾜⾼可扩展性和⾼可⽤性的需求
D. 使⽤难度⾼
A. 在Pregel执⾏计算过程时,在每个超步中都会并⾏调⽤每个顶点上定义的Compute()函数
B. 顶点之间的通讯是借助于消息传递机制来实现的
C. 在默认情况下,Pregel计算框架并不会开启Combiner功能
D. 通常只对那些满⾜交换律和结合律的操作才可以去开启Combiner功能
A. 兼容廉价的硬件设备
B. 流数据读写
C. ⼤数据集
D. 复杂的⽂件模型