答案:A
答案:A
A. Adam
B. Adagrad
C. Momentum
D. Adadelta
A. 带有惯性的小球更容易滚过一些狭窄的局部极值。
B. 仍需要手动设置学习率和动量系数。
C. 动量梯度下降是小球在下降的过程中不断积累速度,这有助于小球快速中过平坦区域,加快收敛
D. 动量梯度下降可以解决振荡导致学习速度降低的问题
A. 自然语言处理
B. 控制系统
C. 计算机视觉
D. 语音识别
A. 梯度消失
B. 梯度爆炸
C. 训练数据丢失
D. 模型欠拟合
A. TRUE
B. FALSE
A. BN最大的优点为允许网络使用较大的学习速率进行训练加快网络的训练速度(减少epoch次数)
B. BN首先是把所有的samples的统计分布标准化
C. BN降低了batch内不同样本的差异性,但不允许batch内的各个samples有各自的统计分布
D. BN首次由Google人工智能团队提出
A. 均方误差更多用于分类问题
B. 交叉熵误差更多用于回归问题
C. 两者均可用于回归问题
D. 两者均可用于分类问题
A. 车路协同
B. 收费稽核
C. 车牌识别
D. 车辆监管