A、 把⽂件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群
B、 ⽤于在Hadoop与传统数据库之间进⾏数据传递
C、 ⼀个⾼可⽤的,⾼可靠的,分布式的海量⽇志采集、聚合和传输的系统
D、 ⼀种⾼吞吐量的分布式发布订阅消息系统,可以处理消费者规模的⽹站中的所有动作流数据
答案:A
A、 把⽂件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群
B、 ⽤于在Hadoop与传统数据库之间进⾏数据传递
C、 ⼀个⾼可⽤的,⾼可靠的,分布式的海量⽇志采集、聚合和传输的系统
D、 ⼀种⾼吞吐量的分布式发布订阅消息系统,可以处理消费者规模的⽹站中的所有动作流数据
答案:A
A. GFS与Zookeeper
B. GFS与HDFS
C. MapReduce与HadoopMapReduce
D. Chubby与Zookeeper
A. 在传统的数据处理流程中,存储的数据是旧的
B. 在传统的数据处理流程中,需要⽤户主动发出查询来获取结果
C. 传统的数据处理流程,需要先采集数据并存储在关系数据库等数据管理系统中
D. 流计算的处理流程⼀般包含三个阶段:数据实时采集、数据批量计算、实时查询服务
A. 访问层
B. ⼤数据层
C. 数据源层
D. ⽹络层
A. 专家推荐:⼈⼯推荐,由资深的专业⼈⼠来进⾏物品的筛选和推荐,需要较多的⼈⼒成本
B. 基于统计的推荐:基于统计信息的推荐(如热门推荐),易于实现,但对⽤户个性化偏好的描述能⼒较弱
C. 基于内容的推荐:通过机器学习的⽅法去描述内容的特征,并基于内容的特征来发现与之相似的内容
D. 混合推荐:结合多种推荐算法来提升推荐效果
A. Timetoast是在线创作基于时间轴事件记载服务的⽹站
B. 提供个性化的时间线服务
C. Timetoast基于flash平台,可以在类似flash时间轴上任意加⼊事件
D. Timetoast是⼀个社区类型的时间轴⽹站
A. ⾕歌公司的制图服务接⼝GoogleChartAPI,可以⽤来为统计数据并⾃动⽣成图⽚
B. D3是最流⾏的可视化库之⼀,是⼀个⽤于⽹页作图、⽣成互动图形的JavaScrip函数库
C. Visual.ly可以⽤它来快速创建⾃定义的、样式美观且具有强烈视觉冲击⼒的信息图表
D. ⼤数据魔镜是⼀款优秀的国产数据分析软件,它丰富的数据公式和算法可以让⽤户真正理解探索分析数据
A. 针对⼤规模数据的批量处理
B. 针对⼤规模图结构数据的处理
C. ⼤规模数据的存储管理和查询分析
D. 针对流数据的实时计算
A. 命名空间的限制
B. 性能的瓶颈
C. 隔离问题
D. 集群的可⽤性
A. 数据挖掘
B. 云计算
C. 机器学习
D. 关系型数据库