答案:A
答案:A
A. 计算预测值函数
B. 求偏导数函数
C. 均方误差损失函数
D. 更新参数函数
解析:均方误差损失函数属于常见损失函数。
A. 机器人视觉
B. 自动驾驶
C. 人机交互
A. 拉普拉斯分布
B. 高斯分布
C. 伽玛分布
D. 柏拉图分布
解析:L1正则化可通过假设权重w的先验分布为拉普拉斯分布,由最大后验概率估计导出。L2正则化可通过假设权重w的先验分布为高斯分布,由最大后验概率估计导出。
A. 基于实例学习
B. 概念学习
C. 决策树学习
D. 人工神经网络学习
A. 扩充数据集
B. 数据重采样
C. 设计对数据分布不敏感的损失函数
D. 使用复杂的网络
A. 在实际场景下,应尽量使用ADAM,避免使用SGD
B. 同样的初始学习率情况下,ADAM的收敛速度总是快于SGD方法
C. 相同超参数数量情况下,比起自适应的学习率调整方式,SGD加手动调节通常会取得更好效果
D. 同样的初始学习率情况下,ADAM比SGD容易过拟合
解析:相同超参数数量情况下,比起自适应的学习率调整方式,SGD加手动调节通常会取得更好效果
A. 复合技术
B. 专项技术
C. 群体技术
D. 集成技术