快速部署 Scrapy项目scrapyd的详细流程_Python

快速部署 Scrapy项目 scrapyd

给服务端 install scrapyd

pip install scrapyd -i https://pypi.tuna.tsinghua.edu.cn/simple

运行

scrapyd

快速部署 Scrapy项目scrapyd的详细流程

修改配置项，以便远程访问

使用Ctrl +c 停止上一步的运行的scrapyd

在要运行scrapyd 命令的路径下，新建文件scrapyd.cnf 文件

输入以下内容

[scrapyd]
# 网页和Json服务监听的IP地址，默认为127.0.0.1（只有改成0.0.0.0 才能在别的电脑上能够访问scrapyd运行之后的服务器）
bind_address = 0.0.0.0
# 监听的端口，默认为6800
http_port = 6800
# 是否打开debug模式，默认为off
debug = off

快速部署 Scrapy项目scrapyd的详细流程

在客户端 install scrapyd-client

1. 安装 scrapy-client 命令如下

pip install scrapyd-client -i https://pypi.tuna.tsinghua.edu.cn/simple

配置Scrapy 项目

修改 scrapy.cfg 文件

快速部署 Scrapy项目scrapyd的详细流程

1 检查配置

scrapyd-deploay -l

发布scrapy项目到scrapyd所在的服务器（此时爬虫未运行）

# scrapyd-deploy <target> -p <project> --version <version>
# taget : 就是前面配置文件里的deploy后面的的target名字，例如 ubuntu1
# project: 可以随意定义， 建议与 scrapy 爬虫项目名相同
# version: 自定义版本号 不写的话默认为当前时间戳， 一般不写
scrapyd-deploy ubuntu-1 -p douban

注意

爬虫目录下不要放无关的py文件，放无关的py文件会导致发布失败，但是当爬虫发布成功后，会在当前目录生成一个setup.py文件，可以删除掉。

4.发送运行爬虫命令