本课程总学时:48,理论32,实验16,总体学习目标如下: (1)理解数据采集与清洗在数据生命周期的应用 (2)理解数据采集方法 (3)理解爬虫的基本原理 (4)掌握Requests库的get和post方法 (5)掌握selenium库的元素查找、元素操纵、窗口切换方法 (6)掌握Xpath、BeautifulSoup、CSS选择器等解析方法 (7)掌握Scrapy框架的基本原理、运用BasicSpider和CrawlSpider编写爬虫 (8)掌握数据的文件,关系型数据库的存储方法 (9)掌握Pandas对采集数据进行数据清洗的方法