A、 数据安全性高
B、 数据处理速度快
C、 数据存储成本低
D、 数据类型丰富
答案:B
A、 数据安全性高
B、 数据处理速度快
C、 数据存储成本低
D、 数据类型丰富
答案:B
A. 整合性:Storm可⽅便地与队列系统和数据库系统进⾏整合
B. 简易的API:Storm的API在使⽤上即简单⼜⽅便
C. 容错性:Storm可⾃动进⾏故障节点的重启、任务的重新分配
D. 可扩展性:Storm的并⾏特性使其可以运⾏在分布式集群中
A. ⽤户建模模块
B. 数据采集模块
C. 推荐对象建模模块
D. 推荐算法模块
A. ⽆法满⾜海量数据的管理需求
B. ⽆法满⾜数据⾼并发的需求
C. ⽆法满⾜⾼可扩展性和⾼可⽤性的需求
D. 使⽤难度⾼
A. Standalone(类似于MapReduce1.0,slot为资源分配单位)
B. SparkonMesos(和Spark有⾎缘关系,更好⽀持Mesos)
C. SparkonYARN
D. SparkonHDFS
A. ⽂本⽂件
B. 关系数据库
C. 键值数据库
D. 语⾳⽂件
A. 结构化数据
B. 半结构化数据
C. 非结构化数据
D. 所有类型数据
A. MapReduce默认1000MB缓存
B. 多个溢写⽂件归并成⼀个或多个⼤⽂件,⽂件中的键值对是排序的
C. 当数据很少时,不需要溢写到磁盘,直接在缓存中归并,然后输出给Reduce
D. 每个Map任务分配多个缓存,使得任务运⾏更有效率
A. ⾕歌公司的制图服务接⼝GoogleChartAPI,可以⽤来为统计数据并⾃动⽣成图⽚
B. D3是最流⾏的可视化库之⼀,是⼀个⽤于⽹页作图、⽣成互动图形的JavaScrip函数库
C. Visual.ly可以⽤它来快速创建⾃定义的、样式美观且具有强烈视觉冲击⼒的信息图表
D. ⼤数据魔镜是⼀款优秀的国产数据分析软件,它丰富的数据公式和算法可以让⽤户真正理解探索分析数据
A. 相对于Spark来说,使⽤Hadoop进⾏迭代计算⾮常耗资源
B. Spark将数据载⼊内存后,之后的迭代计算都可以直接使⽤内存中的中间结果作运算,避免了从磁盘中频繁读取数据
C. Hadoop的设计遵循”⼀个软件栈满⾜不同应⽤场景”的理念
D. Spark可以部署在资源管理器YARN之上,提供⼀站式的⼤数据解决⽅案
A. 在⼀致性⽅⾯,RDBMS强于NoSQL
B. 在数据完整性⽅⾯,RDBMS容易实现
C. 在扩展性⽅⾯,NoSQL⽐较好
D. 在可⽤性⽅⾯,NoSQL优于RDBMS