A、在无监督学习任务中,研究最多、应用最广的是聚类
B、聚类可作为一个单独过程,用于找寻数据内在的分布结构,但不能作为其他学习任务的前驱过程
C、聚类分析的目标是组内的对象之间是相似的,不同组中的对象是不同的
D、组内的相似性越大,组间差别越大,聚类就越好
答案:B
解析:聚类可作为一个单独过程,用于找寻数据内在的分布结构,可以作为其他学习任务的前驱过程
A、在无监督学习任务中,研究最多、应用最广的是聚类
B、聚类可作为一个单独过程,用于找寻数据内在的分布结构,但不能作为其他学习任务的前驱过程
C、聚类分析的目标是组内的对象之间是相似的,不同组中的对象是不同的
D、组内的相似性越大,组间差别越大,聚类就越好
答案:B
解析:聚类可作为一个单独过程,用于找寻数据内在的分布结构,可以作为其他学习任务的前驱过程
解析:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。
A. 割平面法
B. 随机梯度下降
C. 坐标下降法
D. 快速采样法
解析:见算法解析
A. A=0
B. A=E
C. r(A)=n
D. 0<r(A)<(n)
A. CRF 是生成式的,而 HMM 是判别式模型
B. CRF 是判别式模型,HMM 是生成式模型。
C. CRF 和 HMM 都是生成式模型
D. CRF 和 HMM 都是判别式模型。
A. 条件熵
B. 基尼指数Gini
C. 交叉熵
D. 联合熵
解析:CART树在分类过程中使用的基尼指数Gini
A. 核函数将低维空间中的数据映射到高维空间
B. 它是一个相似度函数
C. A、B都对
D. A、B都不对
解析:聚类问题是无监督学习问题