分类默认分类下的文章 - 公众号：AI立智纪元

登录 / 注册

lizhi

累计撰写 81 篇文章
累计收到 329 条评论

搜索到 81 篇与的结果

2023-11-13
第6章使用scikit-learn 构建模型课程名称：Python数据分析与应用课程类别：必修适用专业：金融科技专业总学时：48学时（其中理论16学时，实验32学时）总学分：2.5学分本章学时：10学时一、材料清单（1）《Python数据分析与应用（第2版）（微课版）》教材。（2）配套PPT。（3）数据。（4）代码。（5）引导性提问。（6）探究性问题。（7）拓展性问题。二、教学目标与基本要求教学目标重点介绍聚类、分类和回归三类sklearn数据分析技术的基本任务对应的数据分析建模方法及实现过程。同时，每一类又有对应的多种评估方法，能够评价所构建模型的性能优劣。通过这一章的学习，基本能够掌握常用的模型构建与评估方法，可在以后的数据分析过程中采用适当的算法并按所介绍的步骤实现综合应用。基本要求（1）掌握sklearn转换器、评估器的使用。（2）掌握sklearn数据标准化与数据划分。（3）掌握sklearn中聚类、分类、回归模型的构建。（4）掌握sklearn中聚类、分类、回归模型的评价。三、问题引导性提问引导性提问需要教师根据教材内容和学生实际水平，提出问题，启发引导学生去解决问题，提问，从而达到理解、掌握知识，发展各种能力和提高思想觉悟的目的。（1）常见的模型算法使用场景有哪些？（2）不同的场景之间有什么区别？（3） scikit-learn名字的由来？探究性问题探究性问题需要教师深入钻研教材的基础上精心设计，提问的角度或者在引导性提问的基础上，从重点、难点问题切入，进行插入式提问。或者是对引导式提问中尚未涉及但在课文中又是重要的问题加以设问。（1） scikit-learn的标准化和第5章的有何不同？（2）聚类和分类的区别是什么？（3）回归和分类的区别又是什么？拓展性问题拓展性问题需要教师深刻理解教材的意义，学生的学习动态后，根据学生学习层次，提出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨，完成拓展性问题。（1）不同的算法，可解释性不同，能否挑选一种可解释性强的算法对算法结果进行解释？（2）除了PCA降维以外，可以使用RandomForest模型进行特征的筛选，该如何做？四、主要知识点、重点与难点主要知识点（1） sklearn转换器、评估器的使用。（2） sklearn数据标准化与数据划分。（3） sklearn中聚类、分类、回归模型的构建。（4） sklearn中聚类、分类、回归模型的评价。重点（1） sklearn转换器的使用方法。（2） sklearn估计器的使用方法。（3）聚类模型的构建与评价。（4）分类模型的构建与评价。（5）回归模型的构建与评价。难点（1） sklearn转换器的使用。（2） sklearn估计器的使用。（3）分类模型构建。（4）回归模型构建。五、教学过程设计理论教学过程（1）加载datasets模块中的数据集。（2）将数据集划分为训练集和测试集。（3）使用sklearn转换器进行数据预处理与降维。（4）使用sklearn估计器构建聚类模型。（5）评价聚类模型。（6）使用sklearn估计器构建分类模型。（7）评价分类模型。（8）使用sklearn估计器构建回归模型。（9）评价回归模型。实验教学过程（1）加载datasets模块自带数据集。（2）划分数据集。（3）使用sklearn转换器进行数据预处理与降维。（4）构建与评价聚类模型。（5）构建与评价分类模型。（6）构建与评价回归模型。六、教材与参考资料教材曾文权，张良均．Python数据分析与应用（第2版）（微课版）[M]．北京：人民邮电出版社．2022．参考资料[1] 黄红梅，张良均．Python数据分析与应用[M]．北京：人民邮电出版社．2018．[2] 张良均，谭立云．Python数据分析与挖掘实战（第2版）[M]．北京：机械工业出版社．2019．[3] 张健，张良均．Python编程基础[M]．北京：人民邮电出版社．2018．
- 2023年11月13日
- 304 阅读
- 0 评论
- 1 点赞
2023-11-08
第6章集合本章教学目标：理解集合元素无序、不重复（后面的数据分析要用到此特性）的特点；熟练掌握创建集合的不同形式；理解并熟练掌握集合常见运算；熟练掌握集合对象的常用方法；熟练掌握集合对运算符和内置函数的支持；够使用集合解决实际问题。6.1 基本概念教学内容：集合对象的概念与特点。习题：1、2、3、4、56.2 集合创建与删除教学内容：使用大括号创建集合，使用set()把其他可迭代对象转换为集合。data = {}这种方式创建的为空字典，非空集合。教学重点：集合中的元素不会重复。习题：6、76.3 集合常用方法教学内容：原地增加/删除集合元素，计算交集/并集/差集/对称差集返回新集合，集合测试。教学重点：集合运算。习题：8、9、10实验项目4：蒙蒂·霍尔悖论游戏
- 2023年11月08日
- 222 阅读
- 0 评论
- 1 点赞
2023-11-06
第4章实训3 离散化年龄特征利用分类算法预测患者是否中风时，算法模型要求数据是离散的。在实训2中巳对年龄特征异常值进行了处理，现需要将连续型数据变换为离散型数据，使用等宽法对年龄特征进行离散化。实现思路及步骤 (1)获取年龄特征。 (2)使用等宽法离散化对年龄特征进行离散化。上代码：import pandas as pd import numpy as np stroke_info = pd.read_excel('../data/healthcare-dataset-stroke.xlsx') age_abs = pd.read_excel('../data/healthcare-dataset-age_abs.xlsx') link_outer = pd.merge(stroke_info, age_abs, how='outer', left_on='编号', right_on='编号') link_outer.head() age = link_outer['年龄'] age_nomal = [] for i in age: if i > 0.0: age_nomal.append(i) # 使用等宽法离散化函数 age_cut = pd.cut(age_nomal, 5) print('离散化后5条记录年龄分布为：\n', age_cut.value_counts())
- 2023年11月06日
- 438 阅读
- 0 评论
- 1 点赞
2023-11-06
第4章实训2 删除年龄异常数据基于实训1合并后的数据，经观察发现在年龄特征中存在异常值（年龄数值为小数如1.8)，为了避免异常值数据对分析结果造成不良影响，需要对异常值进行处理。实现思路及步骤 (1) 获取年龄特征。(2) 利用for循环获取年龄特征中的数值，并用if-else语旬判断年龄数值是否为异常值。(3)若年龄数值为异常值，则删除异常值。上代码：import pandas as pd stroke_info = pd.read_excel('healthcare-dataset-stroke.xlsx') age_abs = pd.read_excel('healthcare-dataset-age_abs.xlsx') link_outer = pd.merge(stroke_info, age_abs, how='outer', left_on='编号', right_on='编号') age = link_outer['年龄'] age_nomal = [] for i in age: if i%1 == 0: age_nomal.append(True) else: age_nomal.append(False) link_outer2 = link_outer.loc[age_nomal,:] print(link_outer2)
- 2023年11月06日
- 7,908 阅读
- 46 评论
- 3 点赞
2023-11-06
第4章实训1 合并年龄、平均血糖和中风患者信息数据我国始终把保障人民健康放在优先发展的战略位詈。“上医治未病＂，建立疾病预防控制体系有利千从源头上预防和控制重大疾病。某医院为了早期监测预警患者的中风风险，对现有中风患者的基础值息和体检数据(healthcare-dataset-stroke.xlsx)进行分析，其部分数据如表4-15所示。经观察发现患者基础信息和休检数据中缺少中风患者的年龄和平均血糖的信息，然而在年龄和平均血糖数据(healthcare-dataset-age —abs.xlsx)中存放了分析所需的中风患者的年龄和平均血糖信息，其部分数据如表4-16所示。现需要对患者的年龄、平均血糖数据与患者基础信息和休检数据进行合并，以便下一步分析。实现思路和步骤： (1) 利用read —excel函数读取healthcare-dataset-stroke.xlsx表。(2) 利用read_excel函数读取healthcare-dataset-age_abs .xlsx表。(3) 查看两表的数据量。(4) 以编号作为主键进行外连接。(5) 查看数据是否合并成功。上代码：import pandas as pd stroke_info = pd.read_excel('Path') age_abs = pd.read_excel('Path') link_outer = pd.merge(stroke_info, age_abs, how='outer', left_on='编号', right_on='编号') print(link_outer.head())
- 2023年11月06日
- 531 阅读
- 0 评论
- 8 点赞