A、 普通梯度下降算法一定能收敛到全局极值点。
B、 普通梯度下降算法给每个参数设置不同的学习率。
C、 普通梯度下降算法需要手工设置学习率。
D、 普通梯度下降算法容易陷入局部极值点。
答案:CD
解析:解析(不同的参数使用不同的学习率如果数据是稀疏的且特征分布不均,似乎我们更应该给予较少出现的特征一个大的更新。这时可能需要对不同特征对应的参数设定不同的学习率。)
A、 普通梯度下降算法一定能收敛到全局极值点。
B、 普通梯度下降算法给每个参数设置不同的学习率。
C、 普通梯度下降算法需要手工设置学习率。
D、 普通梯度下降算法容易陷入局部极值点。
答案:CD
解析:解析(不同的参数使用不同的学习率如果数据是稀疏的且特征分布不均,似乎我们更应该给予较少出现的特征一个大的更新。这时可能需要对不同特征对应的参数设定不同的学习率。)
A. Inception
B. Bert
C. VGG
D. AlexNet
解析:解析:B不是卷积神经网络,主要用于自然语言处理任务
A. TRUE
B. FALSE
A. 大数据
B. 数据库
C. 云计算
D. 量子物理
A. Int16
B. FP32
C. FP16
D. Int8
A. 多层级的片上系统缓存或缓中区
B. 数字视觉预处理模块
C. 芯片系统控制CPU
D. AI计算擎
A. graph
B. Session
C. tensor
D. point
解析:解析:A:计算图定义计算任务,B:会话的上下文中,运行计算图(graph),C:使用张量(tensor)表示数据,通过变量(variable)维护状态。
A. 自研的MoXing深度学习框架,更高效更易用,大大提升训练速度。
B. 支持多种自动学习能力,通过“自动学习”训练模型,用户不需编写代码即可完成自动建模、一键部署。
C. 使用GES(图引擎服务)统一管理开发流程元数据,自动实现工作流和版本演进关系可视化,进而实现模型溯源。
D. 支持模型部署到多种生产环境,可部署为云端在线推理和批量推理,也可以直接部署到端和边。
A. mindspore.int32
B. (2,2)
C. 2
D. 4
A. service-endpoint
B. region
C. sk
D. ak