A、 不存在单点故障
B、 JobTracker”⼤包⼤揽”导致任务过重
C、 容易出现内存溢出(分配资源只考虑MapReduce任务数,不考虑CPU、内存)
D、 资源划分不合理(强制划分为slot,包括Mapslot和Reduceslot)
答案:A
A、 不存在单点故障
B、 JobTracker”⼤包⼤揽”导致任务过重
C、 容易出现内存溢出(分配资源只考虑MapReduce任务数,不考虑CPU、内存)
D、 资源划分不合理(强制划分为slot,包括Mapslot和Reduceslot)
答案:A
A. 实时性差(适合批处理,不⽀持实时交互式)
B. 资源浪费(Map和Reduce分两阶段执⾏)
C. 执⾏迭代操作效率低
D. 难以看到程序整体逻辑
A. 动态可扩展
B. ⾼可⽤性
C. 免维护
D. 安全
A. CPU性能
B. 内存
C. ⽹络
D. 存储容量
A. Hadoop可以很好地解决⼤规模数据的离线批量处理问题,但是,受限于HadoopMapReduce编程框架的⾼延迟数据处理机制,使得
B. HDFS⾯向批量访问模式,不是随机访问模式
C. 传统的通⽤关系型数据库⽆法应对在数据规模剧增时导致的系统扩展性和性能问题
D. 传统关系数据库在数据结构变化时⼀般需要停机维护;空列浪费存储空间
A. 第⼀阶段:解析⽹页
B. 第⼆阶段:PageRank分配
C. 第三阶段:收敛阶段
D. 第⼀阶段:收集⽹页
A. 云数据库是部署和虚拟化在云计算环境中的数据库
B. 云数据库是在云计算的⼤背景下发展起来的⼀种新兴的共享基础架构的⽅法
C. 云数据库价格不菲,维护费⽤极其昂贵
D. 云数据库具有⾼可扩展性、⾼可⽤性、采⽤多租形式和⽀持资源有效分发等特点
A. 加快数据传输速度
B. 容易检查数据错误
C. 保证数据可靠性
D. 适合多平台上运⾏
A. 适合做数据统计
B. 适合HBase管理使⽤
C. 适合其他异构系统在线访问HBase表数据
D. 适合HadoopMapReduce作业并⾏批处理HBase表数据
A. 泊松相关系数
B. 余弦相似度
C. 调整余弦相似度
D. 调整正弦相似度