A、 R是属于GNU系统的⼀个⾃由、免费、源代码开放的软件
B、 Weka主要⽤于社交图谱数据可视化分析,可以⽣成⾮常酷炫的可视化图形
C、 Gephi主要⽤于社交图谱数据可视化分析,可以⽣成⾮常酷炫的可视化图形
D、 R通常⽤于⼤数据集的统计与分析
答案:B
A、 R是属于GNU系统的⼀个⾃由、免费、源代码开放的软件
B、 Weka主要⽤于社交图谱数据可视化分析,可以⽣成⾮常酷炫的可视化图形
C、 Gephi主要⽤于社交图谱数据可视化分析,可以⽣成⾮常酷炫的可视化图形
D、 R通常⽤于⼤数据集的统计与分析
答案:B
A. MapReduce默认1000MB缓存
B. 多个溢写⽂件归并成⼀个或多个⼤⽂件,⽂件中的键值对是排序的
C. 当数据很少时,不需要溢写到磁盘,直接在缓存中归并,然后输出给Reduce
D. 每个Map任务分配多个缓存,使得任务运⾏更有效率
A. 局部计算:每个参与的处理器都有⾃⾝的计算任务
B. 通讯:处理器群相互交换数据
C. 栅栏同步:当⼀个处理器遇到”路障”(或栅栏),会等到其他所有处理器完成它们的计算步骤
D. 基于现有的分布式计算平台进⾏图计算
A. 数据泄露
B. 数据篡改
C. 数据丢失
D. 数据类型多样化
A. 观测、跟踪数据
B. 分析数据
C. 辅助理解数据
D. 增强数据吸引⼒
A. 保持单⼀的系统对外⼊⼝,并且为系统内部维护单⼀的资源池
B. 消除单点故障,保证服务的⾼可⽤性
C. 保证系统具有良好的可伸缩,能够动态地增加、删减计算与存储节点
D. 保证分配给⽤户的资源也是弹性可伸缩的
A. 开发⼯具
B. 开源软件
C. 商业化⼯具
D. 数据采集
A. 数据挖掘
B. 离线分析
C. 实时查询
D. BI分析
E.
F.
G.
H.
I.
J.
解析:
A. 关系数据库以完善的关系代数理论作为基础,有严格的标准
B. 关系数据库可扩展性较差,⽆法较好⽀持海量数据存储
C. NoSQL可以⽀持超⼤规模数据存储
D. NoSQL数据库缺乏数学理论基础,复杂查询性能不⾼
A. MapReduce具有⼴泛的应⽤,⽐如关系代数运算、分组与聚合运算等
B. MapReduce将复杂的、运⾏于⼤规模集群上的并⾏计算过程⾼度地抽象到了两个函数
C. 编程⼈员在不会分布式并⾏编程的情况下,也可以很容易将⾃⼰的程序运⾏在分布式系统上,完成海量数据集的计算
D. 不同的Map任务之间可以进⾏通信