项目简介
本项目基于Python语言,运用面向对象编程思想与爬虫技术,实现对pythonSpider网站的源码、图片进行爬取和下载。旨在提升开发者对Python爬虫技术的熟练度。
项目的主要特性和功能
- 采用面向对象编程,优化代码结构。
- 能够爬取网站的网页源码、JS源码。
- 可从网页中解析并下载图片资源。
- 通过命令行与用户交互,输入网站路径即可启动爬取。
安装使用步骤
环境准备
将pythonSpider部署到web服务中,可把文件夹放入phpStudy或者其他web服务的根目录下。
安装库
在命令行中执行以下命令:
pip install -r requirements.txt
启动程序
在命令行中执行:
cmd
python crawling_pythonSpider.py
输入网站路径
按照提示输入网站路径,例如:
http://127.0.0.1/python-spider/
程序运行完成后,目录中会存在网页源码、JS源码与图片。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】