A、 数据挖掘
B、 云计算
C、 机器学习
D、 关系型数据库
答案:D
A、 数据挖掘
B、 云计算
C、 机器学习
D、 关系型数据库
答案:D
A. 所有的数据交换都是通过MapReduce框架⾃⾝去实现的
B. 不同的Map任务之间会进⾏通信
C. 不同的Reduce任务之间可以发⽣信息交换
D. ⽤户可以显式地从⼀台机器向另⼀台机器发送消息
A. 查找速度慢,可扩展性差
B. 功能较少,⼤都不⽀持强事务⼀致性
C. 容易进⾏分布式扩展
D. 复杂性低
A. 为特定的图应⽤定制相应的分布式实现:通⽤性不好
B. 基于现有的分布式计算平台进⾏图计算:在性能和易⽤性⽅⾯往往⽆法达到最优
C. 使⽤单机的图算法库,但是,在可以解决的问题的规模⽅⾯具有很⼤的局限性
D. 使⽤已有的并⾏图计算系统,但是,对⼤规模分布式系统⾮常重要的⼀些⽅⾯(⽐如容错),⽆法提供较好的⽀持
A. 圆。使⽤cx和cy,指定指定半径的中⼼的坐标,和ŗ表⽰半径
B. 线。使⽤x1和Y1到指定线的⼀端的坐标,x2和y2指定的另⼀端的坐标。
C. ⽂本。使⽤x和y指定⽂本的位置
D. 椭圆。使⽤x和y的指定左上⾓的坐标,width和height指定的尺⼨
A. SecondaryNameNode⼀般是并⾏运⾏在多台机器上
B. 它是⽤来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间
C. SecondaryNameNode通过HTTPGET⽅式从NameNode上获取到FsImage和EditLog⽂件,并下载到本地的相应⽬录下
D. SecondaryNameNode是HDFS架构中的⼀个组成部分
A. Hadoop⽣态系统中各个组件和其他产品之间缺乏统⼀的、⾼效的数据交换中介
B. 不同的MapReduce任务之间存在重复操作,降低了效率
C. 延迟⾼,⽽且不适合执⾏迭代计算
D. 抽象层次低,需要⼿⼯编写⼤量代码
A. RDD(ResillientDistributedDataset)是运⾏在⼯作节点(WorkerNode)的⼀个进程,负责运⾏Task
B. Application是⽤户编写的Spark应⽤程序
C. ⼀个Job包含多个RDD及作⽤于相应RDD上的各种操作
D. DirectedAcyclicGraph反映RDD之间的依赖关系
A. Hadoop可以很好地解决⼤规模数据的离线批量处理问题,但是,受限于HadoopMapReduce编程框架的⾼延迟数据处理机制,使得
B. HDFS⾯向批量访问模式,不是随机访问模式
C. 传统的通⽤关系型数据库⽆法应对在数据规模剧增时导致的系统扩展性和性能问题
D. 传统关系数据库在数据结构变化时⼀般需要停机维护;空列浪费存储空间