A、 ⾼效的容错性
B、 中间结果持久化到内存,数据在内存中的多个
C、 存放的数据可以是Java对象,避免了不必要的对象序列化和反序列化
D、 现有容错机制:数据复制或者记录⽇志
答案:BC
A、 ⾼效的容错性
B、 中间结果持久化到内存,数据在内存中的多个
C、 存放的数据可以是Java对象,避免了不必要的对象序列化和反序列化
D、 现有容错机制:数据复制或者记录⽇志
答案:BC
A. 观测、跟踪数据
B. 分析数据
C. 辅助理解数据
D. 增强数据吸引⼒
A. 创建表的时候,可以通过HColumnDescriptor.setInMemory(true)将表放到Region服务器的缓存中,保证在读取的时候被cache命中
B. 创建表的时候,可以通过HColumnDescriptor.setMaxVersions(intmaxVersions)设置表中数据的最⼤版本,如果只需要保存最新版本的数据,那么可以设置setMaxVersions(1)
C. 创建表的时候,可以通过HColumnDescriptor.setTimeToLive(inttimeToLive)设置表中数据的存储⽣命期
D. 如果最近写⼊HBase表中的数据是最可能被访问的,可以考虑将时间戳作为⾏键的⼀部分
A. 智能医疗研发
B. 监控⾝体情况
C. 实时掌握交通状况
D. ⾦融交易
A. MapReduce体系结构主要由四个部分组成,分别是:Client、JobTracker、TaskTracker以及Task
B. Task分为MapTask和ReduceTask两种,均由TaskTracker启动
C. 在MapReduce⼯作流程中,所有的数据交换都是通过MapReduce框架⾃⾝去实现的
D. 在MapReduce⼯作流程中,⽤户不能显式地从⼀台机器向另⼀台机器发送消息
A. 顶点的出度
B. 顶点
C. 边
D. 消息
A. 扩展性好,灵活性好
B. ⼤量写操作时性能⾼
C. ⽆法存储结构化信息
D. 条件查询效率⾼
A. 数据存储方式
B. 数据传输速度
C. 数据查询语言
D. 数据安全性
A. 实现⼀键式安装和配置、线程级别的任务监控和告警
B. 降低硬件集群、软件维护、任务监控和应⽤开发的难度
C. 便于做成统⼀的硬件、计算平台资源池
D. 不⽤负载应⽤混搭,集群利⽤率⾼
A. 从编程的灵活性来讲,Storm是⽐较理想的选择,它使⽤ApacheThrift,可以⽤任何编程语⾔来编写拓扑结构(Topology)
B. 当有⼤量的状态需要处理时,⽐如每个分区都有数⼗亿个元组,则可以选择Storm和SparkStreaming
C. SparkStreaming⽆法实现毫秒级的流计算
D. 在Spark上可以统⼀部署SparkSQL,SparkStreaming、MLlib,GraphX等组件,提供便捷的⼀体化编程模型