APP下载
首页
>
IT互联网
>
随便搞的题库做做
搜索
随便搞的题库做做
题目内容
(
单选题
)
哪项技术在BERT中没有使用()

A、自注意力$;$Normalization$;$全连接$;$卷积

答案:D

随便搞的题库做做
下列哪一项属于特征学习算法()
https://www.shititong.cn/cha-kan/shiti/0005e939-dbd2-00b0-c07f-52a228da6000.html
点击查看题目
关于python类 说法错误的是()。
https://www.shititong.cn/cha-kan/shiti/0005e939-eea4-e568-c07f-52a228da6022.html
点击查看题目
那种机器学习算法不需要对数据进行标注
https://www.shititong.cn/cha-kan/shiti/0005e939-e59c-cee0-c07f-52a228da600e.html
点击查看题目
基于 sklearn 用机器学习模型进行数据分析与数据挖掘的关键步骤为 load_data()、create_model() 、 model.fit()、model.transform()
https://www.shititong.cn/cha-kan/shiti/0005e939-eea4-e950-c07f-52a228da6004.html
点击查看题目
Dropout是一种在深度学习环境中应用的正规化手段。它是这样运作的:在一次循环中我们先随机选择神经层中的一些单元并将其临时隐藏,然后再进行该次循环中神经网络的训练和优化过程。在下一次循环中,我们又将隐藏另外一些神经元,如此直至训练结束。  根据以上描述,Dropout技术在下列哪种神经层中将无法发挥显著优势?
https://www.shititong.cn/cha-kan/shiti/0005e939-e59c-caf8-c07f-52a228da6038.html
点击查看题目
下列哪项不是现有深度学习方法的必备技术?
https://www.shititong.cn/cha-kan/shiti/0005e939-e31f-ad68-c07f-52a228da6020.html
点击查看题目
哪项词向量模型支持一词多义?()
https://www.shititong.cn/cha-kan/shiti/0005e939-dbd1-ed28-c07f-52a228da603d.html
点击查看题目
关于梯度下降算法描述正确的是:
https://www.shititong.cn/cha-kan/shiti/0005e939-e59c-f208-c07f-52a228da6024.html
点击查看题目
对训练数据的预测效果很好,但对验证数据的预测效果不好的现象称为过拟合
https://www.shititong.cn/cha-kan/shiti/0005e939-e59c-d2c8-c07f-52a228da6026.html
点击查看题目
一个特征的权重越高,说明该特征比其他特征()。
https://www.shititong.cn/cha-kan/shiti/0005e939-e59c-f5f0-c07f-52a228da6025.html
点击查看题目
首页
>
IT互联网
>
随便搞的题库做做
题目内容
(
单选题
)
手机预览
随便搞的题库做做

哪项技术在BERT中没有使用()

A、自注意力$;$Normalization$;$全连接$;$卷积

答案:D

分享
随便搞的题库做做
相关题目
下列哪一项属于特征学习算法()

A. k近邻算法
$;$ 随机森林
$;$神经网络
$;$都不属于

https://www.shititong.cn/cha-kan/shiti/0005e939-dbd2-00b0-c07f-52a228da6000.html
点击查看答案
关于python类 说法错误的是()。

A. 类的实例方法必须创建对象后才可以调用$;$类的实例方法必须创建对象前才可以调用$;$类的类方法可以用对象和类名来调用$;$类的静态属性可以用类名和对象来调用

https://www.shititong.cn/cha-kan/shiti/0005e939-eea4-e568-c07f-52a228da6022.html
点击查看答案
那种机器学习算法不需要对数据进行标注

A. 有监督学习$;$无监督学习$;$强化学习$;$深度学习

https://www.shititong.cn/cha-kan/shiti/0005e939-e59c-cee0-c07f-52a228da600e.html
点击查看答案
基于 sklearn 用机器学习模型进行数据分析与数据挖掘的关键步骤为 load_data()、create_model() 、 model.fit()、model.transform()
https://www.shititong.cn/cha-kan/shiti/0005e939-eea4-e950-c07f-52a228da6004.html
点击查看答案
Dropout是一种在深度学习环境中应用的正规化手段。它是这样运作的:在一次循环中我们先随机选择神经层中的一些单元并将其临时隐藏,然后再进行该次循环中神经网络的训练和优化过程。在下一次循环中,我们又将隐藏另外一些神经元,如此直至训练结束。  根据以上描述,Dropout技术在下列哪种神经层中将无法发挥显著优势?

A. 仿射层$;$卷积层$;$RNN层$;$均不对

https://www.shititong.cn/cha-kan/shiti/0005e939-e59c-caf8-c07f-52a228da6038.html
点击查看答案
下列哪项不是现有深度学习方法的必备技术?

A. 卷积可视化解释$;$反向传播算法$;$非线性激活函数$;$深度神经网络

https://www.shititong.cn/cha-kan/shiti/0005e939-e31f-ad68-c07f-52a228da6020.html
点击查看答案
哪项词向量模型支持一词多义?()

A. word2vec$;$fasttext$;$glove$;$elmo

https://www.shititong.cn/cha-kan/shiti/0005e939-dbd1-ed28-c07f-52a228da603d.html
点击查看答案
关于梯度下降算法描述正确的是:

A. 梯度下降算法就是不断的更新w和b的值$;$梯度下降算法就是不断的更新w和b的导数值$;$梯度下降算法就是不断寻找损失函数的最大值$;$梯度下降算法就是不断更新学习率

https://www.shititong.cn/cha-kan/shiti/0005e939-e59c-f208-c07f-52a228da6024.html
点击查看答案
对训练数据的预测效果很好,但对验证数据的预测效果不好的现象称为过拟合
https://www.shititong.cn/cha-kan/shiti/0005e939-e59c-d2c8-c07f-52a228da6026.html
点击查看答案
一个特征的权重越高,说明该特征比其他特征()。

A. 更重要$;$不重要$;$有影响$;$无法判断

https://www.shititong.cn/cha-kan/shiti/0005e939-e59c-f5f0-c07f-52a228da6025.html
点击查看答案
试题通小程序
试题通app下载