A、 ⽂本⽂件
B、 关系数据库
C、 键值数据库
D、 语⾳⽂件
答案:ABC
A、 ⽂本⽂件
B、 关系数据库
C、 键值数据库
D、 语⾳⽂件
答案:ABC
A. 数据的”⼤量化”
B. 数据的”快速化”
C. 数据的”多样化”
D. 数据的”价值化”
A. Storm将Streams的状态转换过程抽象为Spout
B. Storm认为每个Stream都有⼀个源头,并把这个源头抽象为Spout
C. Storm将Spouts和Bolts组成的⽹络抽象成Topology
D. Topology⾥⾯的每个处理组件(Spout或Bolt)都包含处理逻辑,⽽组件之间的连接则表⽰数据流动的⽅向
A. 所有的数据交换都是通过MapReduce框架⾃⾝去实现的
B. 不同的Map任务之间会进⾏通信
C. 不同的Reduce任务之间可以发⽣信息交换
D. ⽤户可以显式地从⼀台机器向另⼀台机器发送消息
A. 信息传输
B. 信息处理
C. 信息爆炸
D. 信息转换
A. 第⼀阶段:解析⽹页
B. 第⼆阶段:PageRank分配
C. 第三阶段:收敛阶段
D. 第⼀阶段:收集⽹页
A. 不同场景之间输⼊输出数据⽆法做到⽆缝共享,通常需要进⾏数据格式的转换
B. 不同的软件需要不同的开发和维护团队
C. 需要较⾼的使⽤成本
D. ⽐较难以对同⼀个集群中的各个系统进⾏统⼀的资源协调和分配
A. 实时获取来⾃不同数据源的海量数据,经过实时分析处理,获得有价值的信息
B. 流计算秉承⼀个基本理念,即数据的价值随着时间的流逝⽽降低
C. 对于⼀个流计算系统来说,它应该⽀持TB级甚⾄是PB级的数据规模
D. 流计算只需要保证较低的延迟时间,即只达到秒级别即可处理⼀切问题
A. 分布式并⾏编程模型
B. 流计算框架
C. Hadoop上的⼯作流管理系统
D. 提供分布式协调⼀致性服务
A. ⼀个作业(Job)是对⼀组输⼊流进⾏处理转化成输出流的程序
B. Samza的流数据单位既不是Storm中的元组,也不是SparkStreaming中的DStream,⽽是⼀条条消息
C. ⼀个作业会被进⼀步分割成多个任务(Task)来执⾏
D. 分区之间没有定义顺序,从⽽允许每⼀个任务独⽴执⾏