答案:A
A. 在实际场景下,应尽量使用ADAM,避免使用SGD$;$同样的初始学习率情况下,ADAM的收敛速度总是快于SGD方法$;$相同超参数数量情况下,比起自适应的学习率调整方式,SGD加手动调节通常会取得更好效果$;$同样的初始学习率情况下,ADAM比SGD容易过拟合
A. 22$;$21$;$13$;$20
A. axis=0,则沿着横轴进行操作$;$axis=0,则沿着纵轴进行操作$;$axis=1,则沿着纵轴进行操作$;$axis=1,则沿着横轴进行操作
A. 启发式搜索$;$模糊搜索$;$精确搜索$;$关键词搜索
A. 有监督的建模技术$;$无监督的建模技术$;$分类建模技术$;$聚合建模技术
A. 向量计算单元$;$标量计算单元$;$张量计算单元$;$矩阵计算单元
A. 车纹识别$;$图像分割$;$人脸识别$;$图像识别
A. 多分枝结构$;$残差连接$;$Batch Normalization$;$Sigmoid激活函数
A. 信息增益$;$损失函数$;$准确率$;$召回率