《数据分析与实践》是专升本信息管理与信息系统专业核心课程,通过本课程的学习,使学生能够学会使用Python进行科学计算、可视化绘图、数据处理,分析与建模方法,提高学生熟练使用Python第三方库NumPy、Matplotlib、Pandas以及Scikit_learn的能力,为将来从事数据分析挖掘研究工作奠定基础。同时,支撑“能够根据设计方案,遵循数据分析流程和规范,实现数据分析目标要求,并采用科学合理方式呈现结果”、“能够使用平台对信息系统和数据分析方案进行验证和分析,并理解其局限性”、“能够利用集成开发环境、开源及第三方资源进行信息系统的开发、调试和测试,并利用管理科学知识和系统开发理论对实施过程进行有效管理,能够利用大数据算法进行数据的收集、清洗、分析,并理解其局限性”的毕业要求。 通过本课程的学习,使学生学会使用Python进行科学计算、可视化绘图、数据处理、数据分析与建模等数据分析的基本方法,培养学生理论联系实际、独立思考问题解决问题的能力和团队协作精神,同时为后续专业课程的学习提供必要的理论、方法和技能支撑,为日后从事数据分析、数据挖掘等研究工作奠定基础。 1.掌握Python数据分析的流程,了解Python数据分析的工具;掌握NumPy数组对象ndarray,掌握NumPy矩阵与通用函数的使用;能够利用NumPy库进行统计分析。 2.掌握Matplotlib绘图基础语法与常用参数的设置;能够利用Matplotlib库绘制散点图、折线图、直方图、饼图和箱线图。 3.能够利用Pandas库进行不同数据源数据的读取;掌握DataFrame的常用操作;了解转换与处理时间序列数据的方法;掌握利用Pandas进行分组、聚合、合并、清洗、标准化及转换数据的基本方法;了解数据透视表和数据交叉表的创建方法。 4.掌握使用scikit_learn转换器进行数据预处理与降维的方法;掌握使用scikit_learn估计器构建聚类模型、分类模型和线性回归模型的方法;掌握评价聚类模型、分类模型和线性回归模型的方法。