答案:B
A. 梯度下降法
B. 拟牛顿法
C. 启发式优化方法
D. EM算法
解析:EM算法
A. 损失函数
B. 无参数函数
C. 激活函数
D. 矩阵拼接函数
解析:衡量模型预测值和真实值差距的评价函数被称为损失函数
A. 1.2.3.4
B. 1.3.4.6
C. 1.2.3.4.5.6
D. 3.4.6
解析:DSSM经典模型的优点;1.解决了字典爆炸问题,降低了计算复杂度;2.中文方面使用字作为最细切分粒度,可以复用每个字表达的词义,减少分词的依赖,从而提高模型的泛化能力;3.字母的n-gram可以更好的处理新词,具有较强的鲁棒性;4.使用有监督的方法,优化语义embedding的映射问题;5.省去了人工特征工程;6.采用有监督训练,精度较高。
A. 循环神经网络
B. 卷积神经网络
C. 朴素贝叶斯
D. 深度残差网络
解析:LSTM是一个非常经典的面向序列的模型,可以对自然语言句子或是其他时序信号进行建模,是一种循环神经网络。
A. 关键结构
B. 信息字段
C. 标签
A. 多通路,不同
B. 单通路,不同
C. 多通路,相同
D. 单通路,相同
解析:Inception模块采用多通路,不同的设计形式,每个支路使用多通路,不同大小的卷积核。
A. 生成模型
B. 判别模型
C. 两者都不属于
D. 两者都属于