A、逆强化学习
B、时序差分学习
C、蒙特卡罗强化学习
D、模仿学习
答案:BC
解析:在现实的强化学习任务中,环境的转移概率、奖赏函数往往很难得知,甚至很难知道环境中一共有多少状态,若学习算法不依赖于环境建模,则称为“免模型学习”,包括蒙特卡罗强化学习和时序差分学习
A、逆强化学习
B、时序差分学习
C、蒙特卡罗强化学习
D、模仿学习
答案:BC
解析:在现实的强化学习任务中,环境的转移概率、奖赏函数往往很难得知,甚至很难知道环境中一共有多少状态,若学习算法不依赖于环境建模,则称为“免模型学习”,包括蒙特卡罗强化学习和时序差分学习
解析:基础知识
A. 全梯度下降算法
B. 随机梯度下降算法
C. 快速梯度下降算法
D. 小批量梯度下降算法
解析:C选项应为“随机平均梯度下降算法”
A. 监督学习
B. 无监督学习
C. 半监督学习
D. 强化学习
解析:聚类分析(Cluster analysis)或聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集,这样让在同一个子集中的成员对象都有相似的一些属性,属于无监督学习。
A. C4.5
B. ID3
C. SGD
D. CART
解析:常见决策树分类算法包括C4.5,ID3,CART。SGD随机梯度下降算法属于降维算法。
A. 召回率
B. 混淆矩阵
C. 均方误差
D. 准确率
A. 建模
B. 测试
C. 聚类
D. 预聚类
解析:正确
解析:错误
A. 数据井喷
B. 计算能力突破
C. 产业效益提升
D. 算法技术与模型优化