A、 创建表的时候,可以通过HColumnDescriptor.setInMemory(true)将表放到Region服务器的缓存中,保证在读取的时候被cache命中
B、 创建表的时候,可以通过HColumnDescriptor.setMaxVersions(intmaxVersions)设置表中数据的最⼤版本,如果只需要保存最新版本的数据,那么可以设置setMaxVersions(1)
C、 创建表的时候,可以通过HColumnDescriptor.setTimeToLive(inttimeToLive)设置表中数据的存储⽣命期
D、 如果最近写⼊HBase表中的数据是最可能被访问的,可以考虑将时间戳作为⾏键的⼀部分
答案:D
A、 创建表的时候,可以通过HColumnDescriptor.setInMemory(true)将表放到Region服务器的缓存中,保证在读取的时候被cache命中
B、 创建表的时候,可以通过HColumnDescriptor.setMaxVersions(intmaxVersions)设置表中数据的最⼤版本,如果只需要保存最新版本的数据,那么可以设置setMaxVersions(1)
C、 创建表的时候,可以通过HColumnDescriptor.setTimeToLive(inttimeToLive)设置表中数据的存储⽣命期
D、 如果最近写⼊HBase表中的数据是最可能被访问的,可以考虑将时间戳作为⾏键的⼀部分
答案:D
A. 扩展性好,灵活性好
B. ⼤量写操作时性能⾼
C. ⽆法存储结构化信息
D. 条件查询效率⾼
A. Hadoop⾃⾝核⼼组件MapReduce的架构设计改进
B. Hadoop⾃⾝核⼼组件HDFS的架构设计改进
C. Hadoop⽣态系统其它组件的不断丰富
D. Hadoop⽣态系统减少不必要的组件,整合系统
A. 智能物流
B. 智能安防
C. 环保监测
D. 数据采集
A. Spark在借鉴HadoopMapReduce优点的同时,很好地解决了MapReduce所⾯临的问题
B. Spark的计算模式也属于MapReduce,但不局限于Map和Reduce操作
C. HadoopMapReduce编程模型⽐Spark更灵活
D. HadoopMapReduce提供了内存计算,可将中间结果放到内存中,对于迭代运算效率更⾼
A. 在⼀致性⽅⾯,RDBMS强于NoSQL
B. 在数据完整性⽅⾯,RDBMS容易实现
C. 在扩展性⽅⾯,NoSQL⽐较好
D. 在可⽤性⽅⾯,NoSQL优于RDBMS
A. Map将⼩数据集进⼀步解析成⼀批
B. Map每⼀个输⼊的
C. Reduce输⼊的中间结果
D. Reduce输⼊的中间结果
A. 按需服务
B. 随时服务
C. 通⽤性
D. 价格不菲
A. 分布式⽂件系统
B. 流数据读写
C. 资源管理和调度器
D. Hadoop上的数据仓库
A. 数据挖掘
B. 云计算
C. 机器学习
D. 关系型数据库