APP下载
首页
>
财会金融
>
唐人街探案之秦风
搜索
唐人街探案之秦风
题目内容
(
单选题
)
Dropout是一种在深度学习环境中应用的正规化手段,他是这样运作的,在一次循环中我们先随机选择神经层中的一些单元并将其临时隐藏,然后再进行该次循环中
神经网络的训练和优化过程,在下一次循环中,我们又将隐藏另外一些神经元,如此直至训练结束。根据以上描述,Dropout技术在下列哪种神经层中不能发挥优势?

A、仿射层

B、卷积层

C、RNN层

D、以上都不对

答案:C

解析:因为RNN的权重存在累乘效应,如果使用dropout的话,会破坏RNN的学习过程。

唐人街探案之秦风
以下说法正确的是
https://www.shititong.cn/cha-kan/shiti/0005e9f1-2242-5d30-c07f-52a228da600a.html
点击查看题目
在机器学习中,如果单纯去提高训练数据的预测能力,所选模型的复杂度往往会很高,这种现象称为过拟合对于产生这种现象以下说法正确的是()
https://www.shititong.cn/cha-kan/shiti/0005e9f2-4769-3560-c07f-52a228da600f.html
点击查看题目
数据库系统的核心是()
https://www.shititong.cn/cha-kan/shiti/0005e9e7-291f-bfa8-c07f-52a228da6013.html
点击查看题目
深度学习是当前很热门的机器学习算法,在深度学习中,涉及到大量的矩阵相乘,现在需要计算三个稠密矩阵A,B,C的乘积ABC,假设三个矩阵的尺寸分别为m∗n,n∗p,p∗q,且m<n<p<q,以下计算顺序效率最高的是
https://www.shititong.cn/cha-kan/shiti/0005e9f2-4768-fac8-c07f-52a228da601e.html
点击查看题目
假设我们有一个5层的神经网络,这个神经网络在使用一个4GB显存显卡时需要花费3个小时来完成训练。而在测试过程中,单个数据需要花费2秒的时间。如果我们现在把架构变换一下,当评分是0.2和0.3时,分别在第2层和第4层添加Dropout,那么新架构的测试所用时间仍是2秒
https://www.shititong.cn/cha-kan/shiti/0005e9f2-4769-54a0-c07f-52a228da603c.html
点击查看题目
机器学习中处理缺失值的常用方法包括()?
https://www.shititong.cn/cha-kan/shiti/0005e9e7-291f-db00-c07f-52a228da6013.html
点击查看题目
关于谓词逻辑,下列描述正确的是() 
https://www.shititong.cn/cha-kan/shiti/0005e9f2-4769-3948-c07f-52a228da600d.html
点击查看题目
卷积操作中,卷积核在整张图片上滑动,不同区域共用同样的卷积核参数,与输入图片尺寸有关
https://www.shititong.cn/cha-kan/shiti/0005e9f2-4769-6058-c07f-52a228da6001.html
点击查看题目
边缘概率是只包含其中部分变量的概率分布
https://www.shititong.cn/cha-kan/shiti/0005e9f1-2242-5d30-c07f-52a228da6020.html
点击查看题目
设有机器人走迷宫问题,其入口坐标为(x0,y0),出口坐标为(xt,yt),当前机器人位置为(x,y),若定义,当从入口到出口存在通路时,用A算法求解该问题,定能找到从入口到出口的最佳路径。
https://www.shititong.cn/cha-kan/shiti/0005e9f2-4769-5c70-c07f-52a228da6001.html
点击查看题目
首页
>
财会金融
>
唐人街探案之秦风
题目内容
(
单选题
)
手机预览
唐人街探案之秦风

Dropout是一种在深度学习环境中应用的正规化手段,他是这样运作的,在一次循环中我们先随机选择神经层中的一些单元并将其临时隐藏,然后再进行该次循环中
神经网络的训练和优化过程,在下一次循环中,我们又将隐藏另外一些神经元,如此直至训练结束。根据以上描述,Dropout技术在下列哪种神经层中不能发挥优势?

A、仿射层

B、卷积层

C、RNN层

D、以上都不对

答案:C

解析:因为RNN的权重存在累乘效应,如果使用dropout的话,会破坏RNN的学习过程。

分享
唐人街探案之秦风
相关题目
以下说法正确的是

A. 负梯度方向是使函数值下降最快的方向

B. 当目标函数是凸函数时,梯度下降法的解是全局最优解

C. 梯度下降法比牛顿发收敛速度快

D. 梯度下降法需要确定合适的迭代步长

解析:牛顿法需要二阶求导,梯度下降法只需一阶,因此牛顿法比梯度下
降法更快收敛。

https://www.shititong.cn/cha-kan/shiti/0005e9f1-2242-5d30-c07f-52a228da600a.html
点击查看答案
在机器学习中,如果单纯去提高训练数据的预测能力,所选模型的复杂度往往会很高,这种现象称为过拟合对于产生这种现象以下说法正确的是()

A. 样本数量太少

B. 样本数量过多

C. 模型太复杂

D. 模型太简单

解析:见算法解析

https://www.shititong.cn/cha-kan/shiti/0005e9f2-4769-3560-c07f-52a228da600f.html
点击查看答案
数据库系统的核心是()

A. 数据库

B. 数据库管理系统

C. 数据模型

D. 软件工具

https://www.shititong.cn/cha-kan/shiti/0005e9e7-291f-bfa8-c07f-52a228da6013.html
点击查看答案
深度学习是当前很热门的机器学习算法,在深度学习中,涉及到大量的矩阵相乘,现在需要计算三个稠密矩阵A,B,C的乘积ABC,假设三个矩阵的尺寸分别为m∗n,n∗p,p∗q,且m<n<p<q,以下计算顺序效率最高的是

A. (AB)C

B. AC(B)

C. A(BC)

D. 所有效率都相同

https://www.shititong.cn/cha-kan/shiti/0005e9f2-4768-fac8-c07f-52a228da601e.html
点击查看答案
假设我们有一个5层的神经网络,这个神经网络在使用一个4GB显存显卡时需要花费3个小时来完成训练。而在测试过程中,单个数据需要花费2秒的时间。如果我们现在把架构变换一下,当评分是0.2和0.3时,分别在第2层和第4层添加Dropout,那么新架构的测试所用时间仍是2秒
https://www.shititong.cn/cha-kan/shiti/0005e9f2-4769-54a0-c07f-52a228da603c.html
点击查看答案
机器学习中处理缺失值的常用方法包括()?

A. 去掉该属性

B. 使用默认值

C. 使用属性平均值

D. 预测最可能的值

https://www.shititong.cn/cha-kan/shiti/0005e9e7-291f-db00-c07f-52a228da6013.html
点击查看答案
关于谓词逻辑,下列描述正确的是() 

A. 紧接于量词之后被量词作用的谓词公式称为该量词的辖域

B. 在一个量词的辖域中与该量词的指导变元相同的变元称为约束变元

C. 仅个体变元被量化的谓词成为一阶谓词

D. 个体变元、函数符号和谓词符号都被量化的谓词成为二阶谓词

解析:见算法解析

https://www.shititong.cn/cha-kan/shiti/0005e9f2-4769-3948-c07f-52a228da600d.html
点击查看答案
卷积操作中,卷积核在整张图片上滑动,不同区域共用同样的卷积核参数,与输入图片尺寸有关

解析:与尺寸无关

https://www.shititong.cn/cha-kan/shiti/0005e9f2-4769-6058-c07f-52a228da6001.html
点击查看答案
边缘概率是只包含其中部分变量的概率分布
https://www.shititong.cn/cha-kan/shiti/0005e9f1-2242-5d30-c07f-52a228da6020.html
点击查看答案
设有机器人走迷宫问题,其入口坐标为(x0,y0),出口坐标为(xt,yt),当前机器人位置为(x,y),若定义,当从入口到出口存在通路时,用A算法求解该问题,定能找到从入口到出口的最佳路径。
https://www.shititong.cn/cha-kan/shiti/0005e9f2-4769-5c70-c07f-52a228da6001.html
点击查看答案
试题通小程序
试题通app下载