APP下载
首页
>
IT互联网
>
随便搞的题库做做
搜索
随便搞的题库做做
题目内容
(
判断题
)
BatchNorm可以使学习快速进行(能够使用较大的学习率)

答案:A

随便搞的题库做做
距离函数dist(,)需要满足()特性。
https://www.shititong.cn/cha-kan/shiti/0005e939-e59d-0978-c07f-52a228da6027.html
点击查看题目
知识的框架表示法中,一个框架由若干个称为“槽”的结构组成,而每一个这样的结构又可拥有若干个侧面()
https://www.shititong.cn/cha-kan/shiti/0005e939-eb78-abb8-c07f-52a228da6008.html
点击查看题目
关于学习率初始值设定描述正确的是()?以下()数值适合作为学习率的初始值?
https://www.shititong.cn/cha-kan/shiti/0005e939-e59d-0590-c07f-52a228da6020.html
点击查看题目
下列关于深度学习神经网络结构的描述,正确的是()
https://www.shititong.cn/cha-kan/shiti/0005e939-e59c-cee0-c07f-52a228da6011.html
点击查看题目
KNN(K-Nearest Neighbor)算法由于需要同时存储大量的已知标签数据,故其一般不适合处理大规模的训练数据
https://www.shititong.cn/cha-kan/shiti/0005e939-e59c-d2c8-c07f-52a228da6019.html
点击查看题目
假设你需要改变参数来最小化代价函数(cost function),可以使用下列哪项技术?
https://www.shititong.cn/cha-kan/shiti/0005e939-e59c-da98-c07f-52a228da6035.html
点击查看题目
()适合连续特征,它假设每个特征对于每个类都符合正态分布。
https://www.shititong.cn/cha-kan/shiti/0005e939-e59c-f9d8-c07f-52a228da602c.html
点击查看题目
字典对象的_____方法返回字典的“值”列表。
https://www.shititong.cn/cha-kan/shiti/0005e939-eea4-fcd8-c07f-52a228da6022.html
点击查看题目
有许多种梯度下降算法,其中两种最出名的方法是l-BFGS和SGD。l-BFGS根据二阶梯度下降而SGD是根据一阶梯度下降的。
只有在数据很稀疏的场景中,会更加偏向于使用l-BFGS而不是SGD
https://www.shititong.cn/cha-kan/shiti/0005e939-e59c-e268-c07f-52a228da6026.html
点击查看题目
矩阵范数满足以下哪些特性()。
https://www.shititong.cn/cha-kan/shiti/0005e939-f894-6df0-c07f-52a228da602a.html
点击查看题目
首页
>
IT互联网
>
随便搞的题库做做
题目内容
(
判断题
)
手机预览
随便搞的题库做做

BatchNorm可以使学习快速进行(能够使用较大的学习率)

答案:A

分享
随便搞的题库做做
相关题目
距离函数dist(,)需要满足()特性。

A. A非负性:dist(Xi,Xj) >= 0;$;$B同一性:dist(Xi,Xj) =0当且仅当Xi = Xj$;$C对称性:dist(Xi,Xj) = dist(Xj,Xi)$;$D直递性:dist(Xi,Xj) <= dist(Xi,Xk) + dist(Xk,Xj)

https://www.shititong.cn/cha-kan/shiti/0005e939-e59d-0978-c07f-52a228da6027.html
点击查看答案
知识的框架表示法中,一个框架由若干个称为“槽”的结构组成,而每一个这样的结构又可拥有若干个侧面()
https://www.shititong.cn/cha-kan/shiti/0005e939-eb78-abb8-c07f-52a228da6008.html
点击查看答案
关于学习率初始值设定描述正确的是()?以下()数值适合作为学习率的初始值?

A. 学习率是网络自己学习得到的$;$学习率是根据不同场景,人为设定的$;$5e-08$;$0.005

https://www.shititong.cn/cha-kan/shiti/0005e939-e59d-0590-c07f-52a228da6020.html
点击查看答案
下列关于深度学习神经网络结构的描述,正确的是()

A. 不同的神经网络结构,层数与神经元数量正相关,层数越多,神经元数量越多$;$ 网络结构的层次越深,其学习特征越多,10层的结构要优于5层结构$;$深层网络结构中,学习到的特征一般与神经元的参数量有关,也与样本的特征多少有关$;$网络的层次越深,其训练时间越久,5层的网络比4层的训练时间长

https://www.shititong.cn/cha-kan/shiti/0005e939-e59c-cee0-c07f-52a228da6011.html
点击查看答案
KNN(K-Nearest Neighbor)算法由于需要同时存储大量的已知标签数据,故其一般不适合处理大规模的训练数据
https://www.shititong.cn/cha-kan/shiti/0005e939-e59c-d2c8-c07f-52a228da6019.html
点击查看答案
假设你需要改变参数来最小化代价函数(cost function),可以使用下列哪项技术?

A. 穷举搜索$;$随机搜索$;$Bayesian优化

https://www.shititong.cn/cha-kan/shiti/0005e939-e59c-da98-c07f-52a228da6035.html
点击查看答案
()适合连续特征,它假设每个特征对于每个类都符合正态分布。

A. GaussianNB $;$BernoulliNB $;$MultinomialNB $;$BaseDiscreteNB

https://www.shititong.cn/cha-kan/shiti/0005e939-e59c-f9d8-c07f-52a228da602c.html
点击查看答案
字典对象的_____方法返回字典的“值”列表。

A. value()$;$values()$;$keys()$;$list()

https://www.shititong.cn/cha-kan/shiti/0005e939-eea4-fcd8-c07f-52a228da6022.html
点击查看答案
有许多种梯度下降算法,其中两种最出名的方法是l-BFGS和SGD。l-BFGS根据二阶梯度下降而SGD是根据一阶梯度下降的。
只有在数据很稀疏的场景中,会更加偏向于使用l-BFGS而不是SGD
https://www.shititong.cn/cha-kan/shiti/0005e939-e59c-e268-c07f-52a228da6026.html
点击查看答案
矩阵范数满足以下哪些特性()。

A. 正定性$;$齐次性$;$三角不等式$;$相容性

https://www.shititong.cn/cha-kan/shiti/0005e939-f894-6df0-c07f-52a228da602a.html
点击查看答案
试题通小程序
试题通app下载