A、 结构化数据
B、 半结构化数据
C、 非结构化数据
D、 所有类型数据
答案:B
A、 结构化数据
B、 半结构化数据
C、 非结构化数据
D、 所有类型数据
答案:B
A. 数据快速持续到达,潜在⼤⼩也许是⽆穷⽆尽的
B. 数据来源众多,格式复杂
C. 注重数据的整体价值,不过分关注个别数据
D. 系统可以控制将要处理的新到达的数据元素的顺序
A. 软件即服务(SaaS)
B. 平台即服务(PaaS)
C. 基础设施即服务(IaaS)
D. 数据即服务(DaaS)
A. 成本⾼
B. ⾼可靠性
C. ⾼容错性
D. 运⾏在Linux平台上
A. HTML:⽂档对象模型,⽤于修改⽂档的内容和结构
B. CSS:层叠样式表,⽤于设定⽹页的样式
C. SVG:可缩放⽮量图形,⽤于绘制可视化的图形
D. JavaScript:⼀种直译式脚本语⾔,⽤于设定⽹页的⾏为
A. 分布式⽂件系统
B. 流数据读写
C. 资源管理和调度器
D. Hadoop上的数据仓库
A. 复杂性:部署、管理、配置很复杂
B. 数据库复制:MySQL主备之间采⽤复制⽅式,只能是异步复制
C. 扩容问题:如果系统压⼒过⼤需要增加新的机器,这个过程涉及数据重新划分
D. 动态数据迁移问题:如果某个数据库组压⼒过⼤,需要将其中部分数据迁移出去
A. 每个Application都有⾃⼰专属的Executor进程,并且该进程在Application运⾏期间⼀直驻留
B. Executor进程以多线程的⽅式运⾏Task
C. Spark运⾏过程与资源管理器⽆关,只要能够获取Executor进程并保持通信即可
D. Task采⽤了数据本地性和推测执⾏等优化机制
A. 基于物品的协同过滤算法(简称ItemCF算法)是⽬前业界应⽤最多的算法
B. ItemCF算法是给⽬标⽤户推荐那些和他们之前喜欢的物品相似的物品
C. ItemCF算法通过建⽴⽤户到物品倒排表(每个⽤户喜欢的物品的列表)来计算物品相似度
D. UserCF算法推荐的是那些和⽬标⽤户有共同兴趣爱好的其他⽤户所喜欢的物品
A. 库函数:链接到每个客户端
B. ⼀个Master主服务器
C. 许多个Region服务器
D. 部署在廉价的计算机集群中