答案:B
A. 逆强化学习
B. 时序差分学习
C. 蒙特卡罗强化学习
D. 模仿学习
解析:在现实的强化学习任务中,环境的转移概率、奖赏函数往往很难得知,甚至很难知道环境中一共有多少状态,若学习算法不依赖于环境建模,则称为“免模型学习”,包括蒙特卡罗强化学习和时序差分学习
解析:正确
解析:错误
A.
5秒
B. 6秒
C. 7秒
D. 8秒
解析:如果本次任务大于了GPU最多一次执行的任务数3,那么就得将这次任务交给下一次的任务处理,前三组任务都没有遗留,第四组任务剩余了4-3=1个任务没处理,第五组任务剩余了1+5-3=3个任务没处理,这3个任务需第6秒处理完成。
A. TensorFlow
B. PyTorch
C. Paddle
D. Anaconda
E. pycharm
解析:TensorFlow、PyTorch和Paddle是常用计算框架;Anaconda是大量包的软件工具;pycharm是一种python编译器
A. 花括号
B. 小括号
C. 引号
D. 缩进
解析:在代码前放置空格来缩进语句即可创建语句块,语句块中每行必须是同样的缩进量。
A. 8/sqrt(14)
B. 6/sqrt(14)
C. 2/sqrt(6)
D. 3/sqrt(6)
A. params文件
B. prototxt文件
C. data文件
D. json文件
解析:主要应用
A. 算力
B. 算法
C. 数据
D. 场景
A. DNN
B. CNN
C. RNN
D. Tanh
解析:卷积神经网络的英文缩写是CNN