APP下载
首页
>
IT互联网
>
计算机知识技术题库
搜索
计算机知识技术题库
题目内容
(
单选题
)
在强化学习中,哪个机制的引入使得强化学习具备了在利用与探索中寻求平衡的能力

A、贪心策略

B、蒙特卡洛采样

C、动态规划

D、Bellman方程

答案:A

计算机知识技术题库
并发是指多个任务同时执行,使用 Python 中多进程可以完成并发操作
https://www.shititong.cn/cha-kan/shiti/0005e5d0-af1d-fa68-c021-5dd340f22433.html
点击查看题目
一般来说,下列哪种方法常用来预测连续独立变量?
https://www.shititong.cn/cha-kan/shiti/0005e5d0-a625-ed58-c021-5dd340f22421.html
点击查看题目
不属于深度学习模型的选项是?
https://www.shititong.cn/cha-kan/shiti/0005e5d0-a7e8-cb38-c021-5dd340f22422.html
点击查看题目
模型训练的目的是确定预测变量与()之间的推理方式。
https://www.shititong.cn/cha-kan/shiti/0005e5d0-a626-00e0-c021-5dd340f22418.html
点击查看题目
深度学习的先驱吴恩达认为,人工智能类似于第二次工业革命中电力的发明,本身是一项突破性的技术,一旦被大幅采用,就能革新许多不同的产业。
https://www.shititong.cn/cha-kan/shiti/0005e5d0-b2ff-0140-c021-5dd340f22415.html
点击查看题目
已知 x = {'a':'b', 'c':'d'},那么表达式 'b' in x 的值为Ture。
https://www.shititong.cn/cha-kan/shiti/0005e5d0-af1d-fe50-c021-5dd340f2242e.html
点击查看题目
机器学习训练时,Mini-Batch的大小优选为2的幂,如256或512。它背后的原因是什么?()
https://www.shititong.cn/cha-kan/shiti/0005e5d0-a626-4348-c021-5dd340f2241e.html
点击查看题目
配置关键词时,我们可以按照以下哪个方法来进行操作?

https://www.shititong.cn/cha-kan/shiti/0005e5d0-af1d-d358-c021-5dd340f2240f.html
点击查看题目
LR的损失函数为hingeloss(或者说是逻辑损失都可以)、而SVM的损失函数为Log损失。
https://www.shititong.cn/cha-kan/shiti/0005e5d0-b2fe-da30-c021-5dd340f22419.html
点击查看题目
利用计算机来模拟人类的某些思维活动,如医疗诊断、定理证明,这些应用属于()
https://www.shititong.cn/cha-kan/shiti/0005e5d0-a625-f140-c021-5dd340f22423.html
点击查看题目
首页
>
IT互联网
>
计算机知识技术题库
题目内容
(
单选题
)
手机预览
计算机知识技术题库

在强化学习中,哪个机制的引入使得强化学习具备了在利用与探索中寻求平衡的能力

A、贪心策略

B、蒙特卡洛采样

C、动态规划

D、Bellman方程

答案:A

分享
计算机知识技术题库
相关题目
并发是指多个任务同时执行,使用 Python 中多进程可以完成并发操作

A. 对$;$

https://www.shititong.cn/cha-kan/shiti/0005e5d0-af1d-fa68-c021-5dd340f22433.html
点击查看答案
一般来说,下列哪种方法常用来预测连续独立变量?

A. 线性回归

B. 逻辑回归

C. 线性回归和逻辑回归都行 

D. 以上说法都不对

https://www.shititong.cn/cha-kan/shiti/0005e5d0-a625-ed58-c021-5dd340f22421.html
点击查看答案
不属于深度学习模型的选项是?

A. 朴素贝叶斯

B. 深度残差网络

C. 卷积神经网络 CNN

D. 循环神经网络 RNN

解析:朴素贝叶斯算法是基于贝叶斯定理与特征条件独立假设的分类算法不属于深度学习模型。

https://www.shititong.cn/cha-kan/shiti/0005e5d0-a7e8-cb38-c021-5dd340f22422.html
点击查看答案
模型训练的目的是确定预测变量与()之间的推理方式。

A. 目标值

B. 结果

C. 自变量

D. 因变量

https://www.shititong.cn/cha-kan/shiti/0005e5d0-a626-00e0-c021-5dd340f22418.html
点击查看答案
深度学习的先驱吴恩达认为,人工智能类似于第二次工业革命中电力的发明,本身是一项突破性的技术,一旦被大幅采用,就能革新许多不同的产业。
https://www.shititong.cn/cha-kan/shiti/0005e5d0-b2ff-0140-c021-5dd340f22415.html
点击查看答案
已知 x = {'a':'b', 'c':'d'},那么表达式 'b' in x 的值为Ture。
https://www.shititong.cn/cha-kan/shiti/0005e5d0-af1d-fe50-c021-5dd340f2242e.html
点击查看答案
机器学习训练时,Mini-Batch的大小优选为2的幂,如256或512。它背后的原因是什么?()

A. Mini-Batch 为偶数的时候,梯度下降算法训练的更快

B. Mini-Batch 设为2的幂,是为了符合 CPU、GPU 的内存要求,利于并行化处理

C. 不使用偶数时,损失函数是不稳定的

D. 以上说法都不对

https://www.shititong.cn/cha-kan/shiti/0005e5d0-a626-4348-c021-5dd340f2241e.html
点击查看答案
配置关键词时,我们可以按照以下哪个方法来进行操作?

A. 仅配置数字;

B. 仅配置字母;

C. 使用核心的词汇或词组来配置

D. 针对任一问题来提取关键词配置

解析:见算法解析

https://www.shititong.cn/cha-kan/shiti/0005e5d0-af1d-d358-c021-5dd340f2240f.html
点击查看答案
LR的损失函数为hingeloss(或者说是逻辑损失都可以)、而SVM的损失函数为Log损失。

解析:错误

https://www.shititong.cn/cha-kan/shiti/0005e5d0-b2fe-da30-c021-5dd340f22419.html
点击查看答案
利用计算机来模拟人类的某些思维活动,如医疗诊断、定理证明,这些应用属于()

A. 数值计算

B. 自动控制

C. 人工智能

D. 模拟仿真

https://www.shititong.cn/cha-kan/shiti/0005e5d0-a625-f140-c021-5dd340f22423.html
点击查看答案
试题通小程序
试题通app下载