A、k 值并不是越大越好,k 值过大,会降低运算速度
B、选择更大的 k 值,会让偏差更小,因为 k 值越大,训练集越接近整个训练样本
C、选择合适的 k 值,能减小验方差
D、k 折交叉验证能够有效提高模型的学习能力
答案:ABCD
A、k 值并不是越大越好,k 值过大,会降低运算速度
B、选择更大的 k 值,会让偏差更小,因为 k 值越大,训练集越接近整个训练样本
C、选择合适的 k 值,能减小验方差
D、k 折交叉验证能够有效提高模型的学习能力
答案:ABCD
A. [3 5 7]
B. 7
C. [7 5 3]
D. [4 3]
解析:见函数库
A. EM
B. 吉布斯采样
C. 贝叶斯
D. 概率分布
A. 1930
B. 1931
C. 1932
D. 1933
A. 数据搜查
B. 数据检查
C. 数据探查
A. 训练集
B. 测试集
C. 验证集
D. 预测集
A. K均值一般会聚类所有对象,但DBSCAN会丢弃被它识别为噪声的对象
B. 当簇具有很不相同的密度时,K均值和DBSCAN的性能都很差
C. K均值可以用于高维的稀疏数据,DBSCAN则通常在此类数据上性能很差
D. K均值可以发现不是明显分离的簇,但DBSCAN会合并有重叠的簇
解析:见算法解析
A. Jupyter Notebook有两种模式:编辑模式、命令模式
B. Jupyter Notebook有两种形式的单元:Code单元、Markdown单元
C. Jupyter Notebook Markdown可以使用LaTeX语法
D. Jupyter Notebook可以支持Python等多种语言
解析:Jupyter Notebook有三种形式的单元:Code单元、Markdown单元、原始单元