A、 数据可视化是指将⼤型数据集中的数据以图形图像形式表⽰
B、 利⽤数据分析和开发⼯具发现其中未知信息的处理过程
C、 数据可视化技术的基本思想是将数据库中每⼀个数据项作为单个图元素表⽰
D、 将数据的各个属性值以⼀维数据的形式表⽰
答案:D
A、 数据可视化是指将⼤型数据集中的数据以图形图像形式表⽰
B、 利⽤数据分析和开发⼯具发现其中未知信息的处理过程
C、 数据可视化技术的基本思想是将数据库中每⼀个数据项作为单个图元素表⽰
D、 将数据的各个属性值以⼀维数据的形式表⽰
答案:D
A. Task分为MapTask和ReduceTask两种,分别由JobTracker和TaskTracker启动
B. slot分为Mapslot和Reduceslot两种,分别供MapTask和ReduceTask使⽤
C. TaskTracker使⽤”slot”等量划分本节点上的资源量(CPU、内存等)
D. TaskTracker会周期性接收JobTracker发送过来的命令并执⾏相应的操作(如启动新任务、杀死任务等)
A. 数据存储层
B. 数据源层
C. 数据分析层
D. 数据应⽤层
A. 单⼀名称节点,存在单点失效问题
B. 单⼀命名空间,⽆法实现资源隔离
C. 资源管理效率低
D. 很难上⼿
A. HadoopJob对应StormTopology
B. HadoopTaskTracker对应StormSupervisor
C. HadoopJobTracker对应StormSpout
D. HadoopReduce对应StormBolt
A. 数据中⼼是云计算的重要载体,为各种平台和应⽤提供运⾏⽀撑环境
B. 提供智能交通、智慧医疗、智能物流、智能电⽹等
C. 提供分布式计算、数据挖掘、统计分析等服务
D. 提供硬件、软件、⽹络等基础设施
A. 创建表的时候,可以通过HColumnDescriptor.setInMemory(true)将表放到Region服务器的缓存中,保证在读取的时候被cache命中
B. 创建表的时候,可以通过HColumnDescriptor.setMaxVersions(intmaxVersions)设置表中数据的最⼤版本,如果只需要保存最新版本的数据,那么可以设置setMaxVersions(1)
C. 创建表的时候,可以通过HColumnDescriptor.setTimeToLive(inttimeToLive)设置表中数据的存储⽣命期
D. 如果最近写⼊HBase表中的数据是最可能被访问的,可以考虑将时间戳作为⾏键的⼀部分
A. RDD(ResillientDistributedDataset)是运⾏在⼯作节点(WorkerNode)的⼀个进程,负责运⾏Task
B. Application是⽤户编写的Spark应⽤程序
C. ⼀个Job包含多个RDD及作⽤于相应RDD上的各种操作
D. DirectedAcyclicGraph反映RDD之间的依赖关系
A. 关系代数运算(选择、投影、并、交、差、连接)
B. 分组与聚合运算
C. 矩阵-向量乘法
D. 矩阵乘法
A. 使⽤DAG执⾏引擎以⽀持循环数据流与内存计算
B. 可运⾏于独⽴的集群模式中,可运⾏于Hadoop中,也可运⾏于AmazonEC2等云环境中
C. ⽀持使⽤Scala、Java、Python和R语⾔进⾏编程,但是不可以通过SparkShell进⾏交互式编程
D. Spark提供了内存计算,可将中间结果放到内存中,对于迭代计算效率更⾼
A. ⽤户可通过Client提供的⼀些接⼝查看作业运⾏状态
B. ⽤户编写的MapReduce程序通过Client提交到JobTracker端
C. JobTracker负责资源监控和作业调度
D. JobTracker会跟踪任务的执⾏进度、资源使⽤量等信息,并将这些信息告诉任务调度器(TaskScheduler)