A、 分布式⽂件系统
B、 分布式并⾏编程模型
C、 资源管理和调度器
D、 Hadoop上的数据仓库
答案:A
A、 分布式⽂件系统
B、 分布式并⾏编程模型
C、 资源管理和调度器
D、 Hadoop上的数据仓库
答案:A
A. 局部计算:每个参与的处理器都有⾃⾝的计算任务
B. 通讯:处理器群相互交换数据
C. 栅栏同步:当⼀个处理器遇到”路障”(或栅栏),会等到其他所有处理器完成它们的计算步骤
D. 基于现有的分布式计算平台进⾏图计算
A. 创建表的时候,可以通过HColumnDescriptor.setInMemory(true)将表放到Region服务器的缓存中,保证在读取的时候被cache命中
B. 创建表的时候,可以通过HColumnDescriptor.setMaxVersions(intmaxVersions)设置表中数据的最⼤版本,如果只需要保存最新版本的数据,那么可以设置setMaxVersions(1)
C. 创建表的时候,可以通过HColumnDescriptor.setTimeToLive(inttimeToLive)设置表中数据的存储⽣命期
D. 如果最近写⼊HBase表中的数据是最可能被访问的,可以考虑将时间戳作为⾏键的⼀部分
A. 数据存储方式
B. 数据传输速度
C. 数据查询语言
D. 数据安全性
A. 成本⾼
B. ⾼可靠性
C. ⾼容错性
D. 运⾏在Linux平台上
A. DataNode:存储被拆分的数据块
B. JobTracker:协调数据计算任务
C. TaskTracker:负责执⾏由JobTracker指派的任务
D. SecondaryNameNode:帮助NameNode收集⽂件系统运⾏的状态信息
A. 表达能⼒有限
B. 磁盘IO开销⼤
C. 延迟⾼
D. 在前⼀个任务执⾏完成之前,其他任务就⽆法开始,难以胜任复杂、多阶段的计算任务
A. R是属于GNU系统的⼀个⾃由、免费、源代码开放的软件
B. Weka主要⽤于社交图谱数据可视化分析,可以⽣成⾮常酷炫的可视化图形
C. Gephi主要⽤于社交图谱数据可视化分析,可以⽣成⾮常酷炫的可视化图形
D. R通常⽤于⼤数据集的统计与分析
A. HTML:⽂档对象模型,⽤于修改⽂档的内容和结构
B. CSS:层叠样式表,⽤于设定⽹页的样式
C. SVG:可缩放⽮量图形,⽤于绘制可视化的图形
D. JavaScript:⼀种直译式脚本语⾔,⽤于设定⽹页的⾏为
A. 数值数组
B. 字符串
C. 对象(本⾝包含其他数组或键/值对)
D. JSON和GeoJSON