A、 从磁盘或从⽹络读取数据,即IO密集⼯作
B、 计算数据,即CPU密集⼯作
C、 针对不同的⼯作节点选择合适硬件类型
D、 负责协调集群中的数据存储
答案:AB
A、 从磁盘或从⽹络读取数据,即IO密集⼯作
B、 计算数据,即CPU密集⼯作
C、 针对不同的⼯作节点选择合适硬件类型
D、 负责协调集群中的数据存储
答案:AB
A. Zookeeper⽂件
B. -ROOT-表
C. .META.表
D. 数据类型
A. Hadoop可以很好地解决⼤规模数据的离线批量处理问题,但是,受限于HadoopMapReduce编程框架的⾼延迟数据处理机制,使得
B. HDFS⾯向批量访问模式,不是随机访问模式
C. 传统的通⽤关系型数据库⽆法应对在数据规模剧增时导致的系统扩展性和性能问题
D. 传统关系数据库在数据结构变化时⼀般需要停机维护;空列浪费存储空间
A. 常常表现出⽐较差的内存访问局部性
B. 针对单个顶点的处理⼯作过少
C. 计算过程中伴随着并⾏度的改变
D. 计算过程简易
A. 帮助NameNode收集⽂件系统运⾏的状态信息
B. 负责执⾏由JobTracker指派的任务
C. 协调数据计算任务
D. 负责协调集群中的数据存储
A. 顶点值(Vertexvalue):顶点对应的PR值
B. 出射边(Outedge):只需要表⽰⼀条边,可以不取值
C. 消息(Message):传递的消息
D. ⼊射边(Iutedge):只需要表⽰⼀条边,可以不取值
A. ⼤数据魔镜是⼀款优秀的国产数据分析软件,可以让⽤户真正理解探索分析数据
B. Tableau是桌⾯系统中最简单的商业智能⼯具软件,是⼀个⽤于⽹页作图、⽣成互动图形的JavaScript函数库
C. GoogleFusionTables让⼀般使⽤者也可以轻松制作出专业的统计地图
D. ModestMaps是⼀个⼩型、可扩展、交互式的免费库,提供了⼀套查看卫星地图的API
A. 数据间的因果关系
B. 数据间的相关关系
C. 数据间的包含关系
D. 数据间的传递关系
A. Web2.0⽹站系统通常不要求严格的数据库事务
B. Web2.0⽹站系统基本上不⽤数据库来存储
C. Web2.0并不要求严格的读写实时性
D. Web2.0通常不包含⼤量复杂的SQL查询
A. 专家推荐:⼈⼯推荐,由资深的专业⼈⼠来进⾏物品的筛选和推荐,需要较多的⼈⼒成本性
B. 基于统计的推荐:通过机器学习的⽅法去描述内容的特征,并基于内容的特征来发现与之相似的内容
C. 协同过滤推荐:应⽤最早和最为成功的推荐⽅法之⼀
D. 混合推荐:结合多种推荐算法来提升推荐效果