1.Urllib:python自带的一个Http请求库,主要是用来操作URL,以便于和网站进行请求响应交互。
2.Lxml:用来进行数据解析的库,主要支持对xml和html两种格式的返回数据进行解析,解析准确度和速度都非常高。
3.Pymysql:数据存储库,用来对关系型数据库MySQL客户端进行操作。
4.Scrapy:爬虫框架,爬虫的主要功能由它实现。对于简单的页面来说可以很轻松的抓取到所有的数据。
客服热线:0731-85127885
违法和不良信息举报
举报电话:0731-85127885 举报邮箱:tousu@csai.cn
优草派 版权所有 © 2024