A、 复杂的批量数据处理:通常时间跨度在数⼗分钟到数⼩时之间
B、 基于历史数据的交互式查询:通常时间跨度在数⼗秒到数分钟之间
C、 基于实时数据流的数据处理:通常时间跨度在数⼗秒到数分钟之间
D、 基于实时数据流的数据处理:通常时间跨度在数百毫秒到数秒之间
答案:ABD
A、 复杂的批量数据处理:通常时间跨度在数⼗分钟到数⼩时之间
B、 基于历史数据的交互式查询:通常时间跨度在数⼗秒到数分钟之间
C、 基于实时数据流的数据处理:通常时间跨度在数⼗秒到数分钟之间
D、 基于实时数据流的数据处理:通常时间跨度在数百毫秒到数秒之间
答案:ABD
A. 选择集群中的多台机器执⾏图计算任务,每台机器上运⾏⽤户程序的⼀个副本
B. Master把⼀个图分成多个分区,并把分区分配到多个Worker
C. ster会把⽤户输⼊划分成多个部分,通常是基于⽂件边界进⾏划分
D. ster向每个Worker发送指令,Worker收到指令后,开始运⾏⼀个超步
A. 顶点值(Vertexvalue):顶点对应的PR值
B. 出射边(Outedge):只需要表⽰⼀条边,可以不取值
C. 消息(Message):传递的消息
D. ⼊射边(Iutedge):只需要表⽰⼀条边,可以不取值
A. 实时性差(适合批处理,不⽀持实时交互式)
B. 资源浪费(Map和Reduce分两阶段执⾏)
C. 执⾏迭代操作效率低
D. 难以看到程序整体逻辑
A. 同⼀个Region不会被分拆到多个Region服务器
B. 为了加快访问速度,.META.表的全部Region都会被保存在内存中
C. ⼀个-ROOT-表可以有多个Region
D. 为了加速寻址,客户端会缓存位置信息,同时,需要解决缓存失效问题
A. CA:也就是强调⼀致性(C)和可⽤性(A),放弃分区容忍性(P)
B. CP:也就是强调⼀致性(C)和分区容忍性(P),放弃可⽤性(A)
C. AP:也就是强调可⽤性(A)和分区容忍性(P),放弃⼀致性(C)
D. CAP:也就是同时兼顾可⽤性(A)、分区容忍性(P)和⼀致性(C),当时系统性能会下降很多
A. 顶点的出度
B. 顶点
C. 边
D. 消息
A. 实时获取来⾃不同数据源的海量数据,经过实时分析处理,获得有价值的信息
B. 流计算秉承⼀个基本理念,即数据的价值随着时间的流逝⽽降低
C. 对于⼀个流计算系统来说,它应该⽀持TB级甚⾄是PB级的数据规模
D. 流计算只需要保证较低的延迟时间,即只达到秒级别即可处理⼀切问题
A. 成本⾼
B. ⾼可靠性
C. ⾼容错性
D. 运⾏在Linux平台上
A. GoogleChartAPI
B. D3
C. Visual.ly
D. Spark