A、 存储设备容量不断增加
B、 ⽹络带宽不断增加
C、 CPU处理能⼒⼤幅提升
D、 数据量不断增⼤
答案:AC
A、 存储设备容量不断增加
B、 ⽹络带宽不断增加
C、 CPU处理能⼒⼤幅提升
D、 数据量不断增⼤
答案:AC
A. Storm将流数据Stream描述成⼀个有限的Tuple序列
B. Storm保证每个消息都能完整处理
C. Storm认为每个Stream都有⼀个源头,并把这个源头抽象为Spout
D. Bolt可以执⾏过滤、函数操作、Join、操作数据库等任何操作
A. 数据可视化是指将⼤型数据集中的数据以图形图像形式表⽰
B. 数据可视化技术的基本思想是将数据库中每⼀个数据项作为单个图元素表⽰
C. 利⽤数据分析和开发⼯具发现其中未知信息的处理过程
D. 将数据的各个属性值以⼀维数据的形式表⽰
A. CA:也就是强调⼀致性(C)和可⽤性(A),放弃分区容忍性(P)
B. CP:也就是强调⼀致性(C)和分区容忍性(P),放弃可⽤性(A)
C. AP:也就是强调可⽤性(A)和分区容忍性(P),放弃⼀致性(C)
D. CAP:也就是同时兼顾可⽤性(A)、分区容忍性(P)和⼀致性(C),当时系统性能会下降很多
A. HadoopMapReduce是MapReduce的开源实现,后者⽐前者使⽤门槛低很多
B. MapReduce⾮共享式,容错性好
C. MapReduce批处理、实时、数据疏散型
D. MapReduce采⽤”分⽽治之”策略
A. 基于物品和商家的联合协同推荐
B. 基于统计的推荐
C. 专家推荐
D. 基于内容的推荐
A. 专家推荐:⼈⼯推荐,由资深的专业⼈⼠来进⾏物品的筛选和推荐,需要较多的⼈⼒成本
B. 基于统计的推荐:基于统计信息的推荐(如热门推荐),易于实现,但对⽤户个性化偏好的描述能⼒较弱
C. 基于内容的推荐:通过机器学习的⽅法去描述内容的特征,并基于内容的特征来发现与之相似的内容
D. 混合推荐:结合多种推荐算法来提升推荐效果
A. 识别和感知技术
B. ⽹络与通信技术
C. 数据挖掘与融合技术
D. 信息处理⼀体化技术
A. 常常表现出⽐较差的内存访问局部性
B. 针对单个顶点的处理⼯作过少
C. 计算过程中伴随着并⾏度的改变
D. 计算过程简易
A. 存储被拆分的数据块
B. 协调数据计算任务
C. 负责协调集群中的数据存储
D. 负责执⾏由JobTracker指派的任务
A. 使⽤DAG执⾏引擎以⽀持循环数据流与内存计算
B. 可运⾏于独⽴的集群模式中,可运⾏于Hadoop中,也可运⾏于AmazonEC2等云环境中
C. ⽀持使⽤Scala、Java、Python和R语⾔进⾏编程,但是不可以通过SparkShell进⾏交互式编程
D. Spark提供了内存计算,可将中间结果放到内存中,对于迭代计算效率更⾼