A、 操作系统和围绕特定应⽤的必需的服务
B、 将基础设施(计算资源和存储)作为服务出租
C、 从⼀个集中的系统部署软件,使之在⼀台本地计算机上(或从云中远程地)运⾏的⼀个模型
D、 提供硬件、软件、⽹络等基础设施以及提供咨询、规划和系统集成服务
答案:A
A、 操作系统和围绕特定应⽤的必需的服务
B、 将基础设施(计算资源和存储)作为服务出租
C、 从⼀个集中的系统部署软件,使之在⼀台本地计算机上(或从云中远程地)运⾏的⼀个模型
D、 提供硬件、软件、⽹络等基础设施以及提供咨询、规划和系统集成服务
答案:A
A. 从分布式⽂件系统读⼊数据
B. 执⾏Map任务输出中间结果
C. 通过Shuffle阶段把中间结果分区排序整理后发送给Reduce任务
D. 执⾏Reduce任务得到最终结果并写⼊分布式⽂件系统
A. 能够解决单点故障问题
B. HDFS集群扩展性
C. 性能更⾼效
D. 良好的隔离性
A. Spark在借鉴HadoopMapReduce优点的同时,很好地解决了MapReduce所⾯临的问题
B. Spark的计算模式也属于MapReduce,但不局限于Map和Reduce操作
C. HadoopMapReduce编程模型⽐Spark更灵活
D. HadoopMapReduce提供了内存计算,可将中间结果放到内存中,对于迭代运算效率更⾼
A. 实现⼀键式安装和配置、线程级别的任务监控和告警
B. 降低硬件集群、软件维护、任务监控和应⽤开发的难度
C. 便于做成统⼀的硬件、计算平台资源池
D. 不⽤负载应⽤混搭,集群利⽤率⾼
A. ⽀持各种编程语⾔:Storm⽀持使⽤各种编程语⾔来定义任务
B. 容错性:Storm需要⼈⼯进⾏故障节点的重启、任务的重新分配
C. 可扩展性:Storm的并⾏特性使其可以运⾏在分布式集群中
D. 免费、开源:Storm是⼀款开源框架,可以免费使⽤
A. 数据快速持续到达,潜在⼤⼩也许是⽆穷⽆尽的
B. 数据来源众多,格式复杂
C. 注重数据的整体价值,不过分关注个别数据
D. 系统可以控制将要处理的新到达的数据元素的顺序
A. ⾼性能:处理⼤数据的基本要求,如每秒处理⼏⼗万条数据
B. 实时性:保证较低的延迟时间,达到秒级别,甚⾄是毫秒级别
C. 分布式:⽀持⼤数据的基本架构,必须能够平滑扩展
D. 可靠性:能可靠地处理流数据
A. 矩形
B. 圆形
C. 线条
D. 图⽚
A. Web2.0⽹站系统通常不要求严格的数据库事务
B. Web2.0⽹站系统基本上不⽤数据库来存储
C. Web2.0并不要求严格的读写实时性
D. Web2.0通常不包含⼤量复杂的SQL查询