A、 数据快速持续到达,潜在⼤⼩也许是⽆穷⽆尽的
B、 数据来源众多,格式复杂
C、 注重数据的整体价值,不过分关注个别数据
D、 系统可以控制将要处理的新到达的数据元素的顺序
答案:AC
A、 数据快速持续到达,潜在⼤⼩也许是⽆穷⽆尽的
B、 数据来源众多,格式复杂
C、 注重数据的整体价值,不过分关注个别数据
D、 系统可以控制将要处理的新到达的数据元素的顺序
答案:AC
A. 为特定的图应⽤定制相应的分布式实现:通⽤性不好
B. 基于现有的分布式计算平台进⾏图计算:在性能和易⽤性⽅⾯往往⽆法达到最优
C. 使⽤单机的图算法库,但是,在可以解决的问题的规模⽅⾯具有很⼤的局限性
D. 使⽤已有的并⾏图计算系统,但是,对⼤规模分布式系统⾮常重要的⼀些⽅⾯(⽐如容错),⽆法提供较好的⽀持
A. 分布式并⾏编程模型
B. 流计算框架
C. Hadoop上的⼯作流管理系统
D. 提供分布式协调⼀致性服务
A. ⽤户建模模块
B. 推荐对象建模模块
C. 推荐算法模块
D. 数据采集模块
A. pplicationMaster分配资源
B. 把获得的资源进⼀步分配给内部的各个任务(Map任务或Reduce任务),实现资源的”⼆次分配”
C. 定时向ResourceManager发送”⼼跳”消息,报告资源的使⽤情况和应⽤的进度信息
D. 向ResourceManager汇报作业的资源使⽤情况和每个容器的运⾏状态
A. 从分布式⽂件系统读⼊数据
B. 执⾏Map任务输出中间结果
C. 通过Shuffle阶段把中间结果分区排序整理后发送给Reduce任务
D. 执⾏Reduce任务得到最终结果并写⼊分布式⽂件系统
A. 观测、跟踪数据
B. 分析数据
C. 辅助理解数据
D. 增强数据吸引⼒
A. 为⽤户提供了系统顶层分布式基础架构
B. 具有较差的跨平台特性
C. 可以部署在廉价的计算机集群中
D. 被公认为⾏业⼤数据标准开源软件
A. 存储元数据
B. 存储⽂件内容
C. ⽂件内存保存在磁盘中
D. 维护了blockid到datanode本地⽂件的映射关系
A. 动态可扩展
B. ⾼可⽤性
C. 免维护
D. 安全
A. 数据可视化是指将⼤型数据集中的数据以图形图像形式表⽰
B. 利⽤数据分析和开发⼯具发现其中未知信息的处理过程
C. 数据可视化技术的基本思想是将数据库中每⼀个数据项作为单个图元素表⽰
D. 将数据的各个属性值以⼀维数据的形式表⽰