首页
关于
推荐
百度一下
腾讯视频
Search
1
你要的草莓熊来啦!——郑科院
5,318 阅读
2
第4章 实训2 删除年龄异常数据
5,044 阅读
3
郑州科技学院2023-2024学年第一学期期末统一考试 Python程序设计
4,083 阅读
4
郑州科技学院2022-2023年第二学期期末统一考试 管理学 课程试题
3,783 阅读
5
Python程序设计教学大纲(董付国老师版)
1,459 阅读
默认分类
登录
/
注册
Search
庞立智
累计撰写
79
篇文章
累计收到
384
条评论
首页
栏目
默认分类
页面
关于
推荐
百度一下
腾讯视频
搜索到
79
篇与
的结果
2023-10-09
任务3.2 掌握DataFrame的常用操作
# 代码3-9 from sqlalchemy import create_engine import pandas as pd # 创建数据库连接 engine = create_engine('mysql+pymysql://root:1234@127.0.0.1:3306/testdb?charset=utf8') musicdata = pd.read_sql_table('musicdata', con=engine) print('音乐行业收入信息表的索引为:', musicdata.index) print('音乐行业收入信息表的所有值为:\n', musicdata.values) print('音乐行业收入信息表的列名为:\n', musicdata.columns) print('音乐行业收入信息表的数据类型为:\n', musicdata.dtypes) # 代码3-10 # 查看DataFrame的元素个数、维度数、形状 print('音乐行业收入信息表的元素个数为:', musicdata.size) print('音乐行业收入信息表的维度数为:', musicdata.ndim) print('音乐行业收入信息表的形状为:', musicdata.shape) # 代码3-11 print('音乐行业收入信息表转置前形状为:', musicdata.shape) print('音乐行业收入信息表转置后形状为:', musicdata.T.shape) # 代码3-12 # 使用字典访问的方式取出musicdata中的某一列 format = musicdata['format'] print('音乐行业收入信息表中的format的形状为:', format.shape) # 代码3-13 # 使用访问属性的方式取出musicdata中的number_of_records number_of_records = musicdata.number_of_records print('音乐行业收入信息表中的number_of_records的形状为:', number_of_records.shape) # 代码3-14 metric5 = musicdata['metric'][:5] print('音乐行业收入信息表中的metric前5个元素为:\n', metric5) # 代码3-15 format_metric = musicdata[['format', 'metric']][:5] print('音乐行业收入信息表中的format和metric前5个元素为:\n', format_metric) # 代码3-16 musicdata5 = musicdata[:][1:6] print('音乐行业收入信息表的1~6行元素为:\n', musicdata5) # 代码3-17 print('音乐行业收入信息表中前5行数据为:\n', musicdata.head()) print('音乐行业收入信息表中后5行元素为:\n', musicdata.tail()) # 代码3-18 format1 = musicdata.loc[:, 'format'] print('使用loc()方法提取format列的size为:', format1.size) format2 = musicdata.iloc[:, 3] print('使用iloc()方法提取第3列的size为:', format2.size) # 代码3-19 format_metric1 = musicdata.loc[:, ['format', 'metric']] print('使用loc()方法提取format和metric列的size为:', format_metric1.size) format_metric2 = musicdata.iloc[:, [1, 3]] print('使用iloc()方法提取第1和第3列的size为:', format_metric2.size) # 代码3-20 print('列名为format和metric的行名为3的数据为:\n', musicdata.loc[3, ['format', 'metric']]) print('列名为format和metric行名为2,3,4,5,6的数据为:\n', musicdata.loc[2: 6, ['format', 'metric']]) print('列位置为1和3,行位置为3的数据为:\n', musicdata.iloc[3, [1, 3]]) print('列位置为1和3,行位置为2,3,4,5,6的数据为:\n', musicdata.iloc[2: 7, [1, 3]]) # 代码3-21 # 传入表达式 print('musicdata中metric为“Units”的format为:\n', musicdata.loc[musicdata['metric'] == 'Units', ['format', 'metric']]) print('musicdata中metric为“Units”的第1、4列数据为:\n', musicdata.iloc[musicdata['metric'] == 'Units', [1, 4]]) # 代码3-22 print('musicdata中metric为“Units”的第1、4列数据为:\n', musicdata.iloc[(musicdata['metric'] == 'Units').values, [1, 4]]) # 代码3-23 # 将format值为CD的变换为数值1 print('更改前musicdata中format为CD的数据为:\n', musicdata.loc[musicdata['format'] == 'CD', 'format']) musicdata.loc[musicdata['format'] == 'CD', 'format']=1 print('更改后musicdata中format为1的数据为:\n', musicdata.loc[musicdata['format'] == 1, 'format']) # 代码3-24 # 转换为时间序列数据 dates = pd.to_datetime(musicdata['date']) # 建立月份列 musicdata['month'] = dates.map(lambda x: x.month) # 查看前5行 print('musicdata新增列month的前5行为:\n', musicdata['month'].head()) # 代码3-25 musicdata['day'] = 15 print('musicdata新增列day的前5行为:\n', musicdata['day'].head()) # 代码3-26 print('删除day前musicdata的列索引为:\n', musicdata.columns) musicdata.drop(labels='day', axis=1, inplace=True) print('删除day后musicdata的列索引为:\n', musicdata.columns) # 代码3-27 print('删除1~3行前musicdata的长度为:', len(musicdata)) musicdata.drop(labels=range(1, 4), axis=0, inplace=True) print('删除1~3行后musicdata的长度为:', len(musicdata)) # 代码3-28 import numpy as np print('音乐行业收入信息表中number_of_records的平均值为:', np.mean(musicdata['number_of_records'])) # 代码3-29 print('音乐行业收入信息表中number_of_records的平均值为:', musicdata['number_of_records'].mean()) # 代码3-30 print('音乐行业收入信息表value_actual的描述性统计为:\n', musicdata['value_actual'].describe()) # 代码3-31 print('音乐行业收入信息 表format频数统计前6行结果为:\n', musicdata['format'].value_counts()[:6]) # 代码3-32 musicdata['metric'] = musicdata['metric'].astype('category') print('音乐行业收入信息表metric列转变数据类型后为:', musicdata['metric'].dtypes) # 代码3-33 print('音乐行业收入信息表metric的描述统计结果为:\n', musicdata['metric'].describe())
2023年10月09日
183 阅读
0 评论
2 点赞
2023-10-09
任务3.1 读写不同数据源的数据
# 代码3-1 import pandas as pd # 使用read_table函数读取音乐行业收入信息表 musicdata = pd.read_table('../data/musicdata.csv', sep=',', encoding='gbk') print('使用read_table函数读取音乐行业收入信息表的长度为:', len(musicdata)) # 使用read_csv函数读取音乐行业收入信息表 musicdata1 = pd.read_csv('../data/musicdata.csv', encoding='gbk') print('使用read_csv函数读取音乐行业收入信息表的长度为:', len(musicdata1)) # 代码3-2 # 使用read_table函数读取音乐行业收入表,sep=';' musicdata2 = pd.read_table('../data/musicdata.csv', sep = ';', encoding='gbk') print('当分隔符为;时,音乐行业收入信息表为:\n', musicdata2) # 使用read_csv函数读取音乐行业收入信息表,header=None musicdata3 = pd.read_csv('../data/musicdata.csv', sep=',', header=None, encoding='gbk') print('当header为None时,音乐行业收入数据信息表为:\n', musicdata3) # 使用UTF-16编码读取音乐行业收入信息表 musicdata4 = pd.read_csv('../data/musicdata.csv', sep=',', encoding='utf-16') print('encoding为"utf-16"时音乐行业收入数据信息表为:\n', musicdata4) # 代码3-3 import os print('音乐行业收入信息表写入文本文件前目录内文件列表为:\n', os.listdir('../tmp')) # 将musicdata以csv格式存储 musicdata.to_csv('../tmp/musicdataInfo.csv', sep=';', index=False) print('音乐行业收入信息表写入文本文件后目录内文件列表为:\n', os.listdir('../tmp')) # 代码3-4 # 读取musicdata.xlsx文件 musicdata = pd.read_excel('../data/musicdata.xlsx') print('音乐行业收入信息表长度为:', len(musicdata)) # 代码3-5 print('音乐行业收入信息表写入Excel文件前,目录内文件列表为:\n', os.listdir('../tmp')) musicdata.to_excel('../tmp/musicdata.xlsx') print('音乐行业收入信息表写入Excel文件后,目录内文件列表为:\n', os.listdir('../tmp')) # 代码3-6,没有办法直接运行,因为没有配置好环境。 from sqlalchemy import create_engine # 创建一个MySQL连接器,用户名为root,密码为1234 # 地址为127.0.0.1,数据库名称为testdb,编码为UTF-8 engine = create_engine('mysql+pymysql://root:1234@127.0.0.1:3306/testdb?charset=utf8') print(engine) # 代码3-7 # 使用read_sql_query函数查看testdb中的数据表数目 musicadatalist = pd.read_sql_query('show tables', con=engine) print('testdb数据库数据表清单为:\n', musicadatalist) # 使用read_sql_table函数读取音乐行业收入信息表 musicdata = pd.read_sql_table('musicdata', con=engine) print('使用read_sql_table函数读取音乐行业收入信息表的长度为:\n', len(musicdata)) # 使用read_sql函数读取音乐行业收入信息表 musicdata = pd.read_sql('musicdata', con=engine) print('使用read_sql函数读取音乐行业收入信息表的长度为:\n', len(musicdata)) # 代码3-8 # 使用to_sql()方法存储musicData musicdata.to_sql('test1', con=engine, index=False, if_exists='replace') # 使用read_sql函数读取test表 formlist1 = pd.read_sql_query('show tables', con=engine) print('新增一个表格后,testdb数据库数据表清单为:\n', formlist1)
2023年10月09日
287 阅读
0 评论
7 点赞
2023-10-09
第3章 程序控制结构
本章教学目标:理解表达式的值与True/False的等价关系;熟练掌握选择结构的语法和应用;熟练掌握循环结构的语法和应用;熟练掌握异常处理结构的语法和应用;熟练掌握选择结构、循环结构、异常处理结构嵌套使用的语法;养成对用户输入进行有效性检查的习惯3.1 条件表达式教学内容:表达式的值与True/False的等价关系。教学重点:等价和相等不是一个意思。习题:1、2、8、93.2 选择结构教学内容:单分支选择结构;双分支选择结构;嵌套的选择结构。教学重点:代码缩进。3.3 循环结构教学内容:for循环结构;while循环结构;break与continue语句。教学重点:带else的循环结构执行流程,break语句的作用。习题:3、4、5、10、113.4 异常处理结构教学内容:常见异常表现形式;异常处理结构语法与应用。教学重点:异常表现形式,带else的异常处理结构执行流程,异常处理代码也有可能会出错抛出异常。习题:6、7、12、13实验项目1:抓狐狸游戏1
2023年10月09日
148 阅读
0 评论
0 点赞
2023-10-08
第3章 Pandas统计分析基础
一、 材料清单(1) 《Python数据分析与应用(第2版)(微课版)》教材。(2) 配套PPT。(3) 数据。(4) 代码。(5) 引导性提问。(6) 探究性问题。(7) 拓展性问题。二、 教学目标与基本要求教学目标以音乐行业收入饮数据为例,介绍csv数据、Excel数据、数据库数据3种常用的数据读取与写入方式。阐述DataFrame的常用属性,方法与描述性统计相关内容。介绍时间数据的转换,信息提取与算术运算。剖析分组聚合方法groupby的原理、用法和三种聚合方法。展现透视表与交叉表的制作方法。通过本章的学习,能够对pandas库有一个整体了解并能够利用pandas库进行基础的统计。基本要求(1) 掌握常见的数据读取方式。(2) 掌握DataFrame常用属性与方法。(3) 掌握基础时间数据处理方法。(4) 掌握分组聚合的原理与方法。(5) 掌握透视表与交叉表的制作。三、 问题引导性提问引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。(1) 数据分析中常见的结构话数据读取方式有那些?(2) DataFrame和数组有什么相似之处?(3) Excel透视表如何制作?探究性问题探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课文中又是重要的问题加以设问。(1) 读取数据库数据为什么需要别的库?(2) 时间数据中存在哪些信息?(3) 以百万级的数据为例,Excel制作透视表和Python制作透视表哪个速度更快?拓展性问题拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问题。(1) 能否读取word数据,该如何做?(2) 为什么索引的时候有loc和iloc,设计者的意何在?四、 主要知识点、重点与难点主要知识点(1) 常见的数据读取方式。(2) DataFrame常用属性与方法。(3) 基础时间数据处理方法。(4) 分组聚合的原理与方法。(5) 透视表与交叉表的制作。重点(1) 读写数据。(2) DataFrame数据的常用属性与方法。(3) 基础时间数据处理方法。(4) 分组聚合的原理与方法。(5) 透视表与交叉表的制作。难点(1) 读写数据。(2) 分组聚合的原理与方法。(3) 透视表与交叉表的制作。五、 教学过程设计理论教学过程(1) 读写文本文件。(2) 读写Excel文件。(3) 读写数据库数据。(4) 查看DataFrame的常用属性。(5) 查改增删DataFrame数据。(6) 描述分析DataFrame数据。(7) 转换字符串时间为标准时间。(8) 提取时间序列数据信息。(9) 加减时间数据。(10) 使用groupby方法拆分数据。(11) 使用agg方法聚合数据。(12) 使用apply方法聚合数据。(13) 使用transform方法聚合数据。(14) 使用povit_table函数创建透视表。(15) 使用crosstab函数创建交叉表实验教学过程。实验教学过程(1) 读写文本文件。(2) 读写Excel文件。(3) 读写数据库数据。(4) 查看DataFrame的常用属性。(5) 查改增删DataFrame数据。(6) 描述分析DataFrame数据。(7) 转换字符串时间为标准时间。(8) 提取时间序列数据信息。(9) 加减时间数据。(10) 使用groupby方法拆分数据。(11) 使用agg、apply、transform方法聚合数据。(12) 制作透视表。(13) 制作交叉表。
2023年10月08日
161 阅读
0 评论
0 点赞
2023-09-16
金融科技(FinTech)专业前景分析
金融科技(FinTech)专业在过去几年里一直呈现出强劲的增长趋势,其前景仍然相当光明。以下是一些金融科技专业的前景方面的考虑:就业机会:金融科技行业提供了广泛的就业机会,包括软件开发、数据分析、网络安全、数字支付等领域。金融科技公司、银行、投资机构和初创企业都在积极招聘金融科技专业的毕业生。创业机会:如果你有创业精神,金融科技领域也提供了很多机会。许多成功的金融科技初创企业如PayPal、Stripe、Robinhood等都开始于创始人的愿景和技术专长。技能需求:金融科技专业通常需要具备技术、数据分析、人工智能和区块链等领域的知识和技能。(熟练使用一门计算机语言如Python)这些技能在当前和未来的就业市场中非常有价值。行业创新:金融科技在改变传统金融服务的方式,包括支付、借贷、投资和保险。这种创新将继续推动行业的发展,并创造新的职业机会。持续增长:金融科技行业的全球市场规模仍在不断扩大,尤其是在数字化支付、智能投资、区块链和金融安全等领域。 需要注意的是,金融科技行业也面临监管和竞争等挑战,因此,成功进入该领域需要不断学习和适应快速变化的环境。但总体来说,金融科技专业仍然具有广泛的就业和发展前景。
2023年09月16日
248 阅读
0 评论
4 点赞
1
...
12
13
14
...
16