答案:A
A. 聚类分析
$;$回归分析
$;$神经网络
$;$决策树算法
A. 离散化本质是将连续型数据分段 $;$数据中的离群值,会增强模型对于数据离群值的鲁棒性 $;$离散化后的特征,其取值均转化为有明确含义的区间号 $;$将连续型特征离散化后,特征的取值大大减少。
A. 探索;开发$;$开发;探索$;$探索;输出$;$开发;输出
A. 根据商家最近一年的经营及服务数据,用聚类算法判断出天猫商家在各自主营类目下所属的商家层级$;$根据商家近几年的成交数据,用聚类算法拟合出用户未来一个月可能的消费金额公式$;$用关联规则算法分析出购买了汽车坐垫的买家,是否适合推荐汽车脚垫$;$根据用户最近购买的商品信息,用决策树算法识别出淘宝买家可能是男还是女
A. ID3算法$;$K近邻方法$;$局部加权回归法$;$基于案例的推理
A. importmo$;$frommoimport*$;$importmoasm$;$importmfrommo
A. 使用print(crawl_content.decode(‘utf8-escape’))可以显示crawl_content中的中文字符$;$爬取同一个页面,使用不同的编码方式都可以显示中文字符$;$获得系统默认编码的方式是import sys; sys.getdefaultencoding();$;$Python写文件操作中,with open()的参数’a’表示更新,’w’表示覆盖
A. 逻辑关系$;$相关关系$;$假设-验证关系$;$函数关系
A. 表格型的数据结构,含有一组无序的列,每列可以是不同的值类型$;$既有行索引,也有列索引,可被看做有Series组成的字典$;$与其他类似的数据结构相比(如R语言的datframe),DataFrame中面向行和面向列的操作基本上是平衡的$;$数据一一个或多个二维块存放,而不是列表、字典或别的一维数据结构