A、 使⽤DAG执⾏引擎以⽀持循环数据流与内存计算
B、 可运⾏于独⽴的集群模式中,可运⾏于Hadoop中,也可运⾏于AmazonEC2等云环境中
C、 ⽀持使⽤Scala、Java、Python和R语⾔进⾏编程,但是不可以通过SparkShell进⾏交互式编程
D、 Spark提供了内存计算,可将中间结果放到内存中,对于迭代计算效率更⾼
答案:C
A、 使⽤DAG执⾏引擎以⽀持循环数据流与内存计算
B、 可运⾏于独⽴的集群模式中,可运⾏于Hadoop中,也可运⾏于AmazonEC2等云环境中
C、 ⽀持使⽤Scala、Java、Python和R语⾔进⾏编程,但是不可以通过SparkShell进⾏交互式编程
D、 Spark提供了内存计算,可将中间结果放到内存中,对于迭代计算效率更⾼
答案:C
A. 推荐系统可以创造全新的商业和经济模式,帮助实现长尾商品的销售
B. ”长尾”概念于2004年提出,⽤来描述以亚马逊为代表的电⼦商务⽹站的商业和经济模式
C. 可以通过发掘长尾商品并推荐给感兴趣的⽤户来提⾼销售额
D. 热门推荐的主要缺陷在于推荐的范围有限,所推荐的内容在⼀定时期内也相对固定。⽆法实现长尾商品的推荐
A. 成熟期
B. 萌芽期
C. ⼤规模应⽤期
D. 迷茫期
A. MapReduce默认1000MB缓存
B. 多个溢写⽂件归并成⼀个或多个⼤⽂件,⽂件中的键值对是排序的
C. 当数据很少时,不需要溢写到磁盘,直接在缓存中归并,然后输出给Reduce
D. 每个Map任务分配多个缓存,使得任务运⾏更有效率
A. 为了让⽤户从海量信息中⾼效地获得⾃⼰所需的信息,推荐系统应运⽽⽣
B. 推荐系统是⼤数据在互联⽹领域的典型应⽤
C. 推荐系统是⾃动联系⽤户和物品的⼀种⼯具
D. 推荐系统是利⽤⼤数据为⽤户推荐消费内容、调整线下门店布局、控制店内⼈流量
A. 实现相同Region服务器之间的负载均衡⾏
B. 在Region分裂或合并后,负责重新调整Region的分布
C. 对发⽣故障失效的Region服务器上的Region进⾏迁移
D. 管理⽤户对表的增加、删除、修改、查询等操作
A. ⽂档数据库
B. 图数据库
C. 列族数据库
D. 时间戳数据库
A. DataNode:存储被拆分的数据块
B. JobTracker:协调数据计算任务
C. TaskTracker:负责执⾏由JobTracker指派的任务
D. SecondaryNameNode:帮助NameNode收集⽂件系统运⾏的状态信息
A. d3.select(“body”)查找DOM中的body
B. selectAll(“p”)选择DOM中的所有段落
C. enter()绑定数据和DOM元素
D. text(“Newparagraph!”)为新创建的p标签插⼊⼀个⽂本值
A. worker:每个worker进程都属于⼀个特定的Topology
B. executor:executor是产⽣于worker进程内部的线程
C. task:实际的数据处理由task完成
D. 在Topology的⽣命周期中,每个组件的task数⽬是不会发⽣变化的,⽽executor的数⽬却不⼀定
A. Controller服务器
B. Proxy服务器
C. 愚公系统
D. 数据处理服务器