采集1024论坛贴图区自动发布到wordpress的基础配置教程
本帖最后由 openos 于 2018-3-5 14:33 编辑shkong老大写了一个爬虫,
https://www.hs2v.com/thread-430613-1-1.html
但发现有些大爷不会配置环境, 现在把详细的基础流程写一下.
高手老大请略过.
本教程以CentOS 7为例, 环境配置不适合其他的系统.
1, 首先你需要配置好基本的服务器环境, 可以使用bt等面板.
安装方法
https://www.bt.cn/bbs/thread-1186-1-1.html
2, 再安装好WordPress和chevereto图床
https://cn.wordpress.org/wordpress-4.9.4-zh_CN.zip
https://github.com/Chevereto/Chevereto-Free/archive/1.0.9.zip
建议分开安装
如:www.free.com安装WordPress
i.free.comchevereto图床
安装好了后先去chevereto后台关闭防洪保护, 然后再去上传参数那边根据自己的要求设置.
3, 配置好Python3.6和pip3
安装EPEL和IUS软件源
[*]yum install epel-release
[*]yum install https://centos7.iuscommunity.org/ius-release.rpm复制代码
安装Python3.6
[*]yum install python36u复制代码
创建python3连接符
[*]ln -s /bin/python3.6 /bin/python3复制代码
安装pip3
[*]yum install python36u-pip复制代码
创建pip3链接符
[*]ln -s /bin/pip3.6 /bin/pip3复制代码
再安装requests和pymysql
[*]pip3 install requests
[*]pip3 install pymysql复制代码
再下载爬虫
[*]mkdir /home/1024
[*]cd /home/1024
[*]wget https://github.com/ishkong/1024_img_spider_wordpress/archive/master.zip
[*]unzip master.zip
[*]cd 1024_img_spider_wordpress复制代码
编辑spider.py文件
[*]vi spider.py复制代码
配置参数
在12行这里填写WordPress的MySQL数据库参数
conn = pymysql.connect(host='', port=3306, user='
MySQL用户名
', passwd='
密码
', db='
MySQL数据库名
', charset='utf8') #数据库填这里
一般情况MySQL用户名和MySQL数据库名都是一样的
在26行这里添加图床的API
APIKey = "" #API填这里
这个API可以在chevereto后台找到
https://s1.ax1x.com/2018/02/23/9ULLcT.png
在28行这里修改你的图床地址
url = "http://你的域名/api/1/upload/?key="+ APIKey + "&format=" + format #图床地址
如
url = "http://i.free.com/api/1/upload/?key="+ APIKey + "&format=" + format #图床地址
退出保存spider.py
再修改文件权限
[*]chmod +x spider.py复制代码
再开始运行
[*]python3 spider.py复制代码
开始采集了
https://s1.ax1x.com/2018/02/23/9ULNp6.png
然后可以去查看wordpress和chevereto的数据
https://s1.ax1x.com/2018/02/23/9ULD7d.png
1天的效果
https://s1.ax1x.com/2018/02/23/9ULB0H.png
4天后的效果
https://s1.ax1x.com/2018/02/25/9djwB8.png
下载完成,共1张图片
开始上传图片
开始上传图片:temp/0.jpg
主程序出错,请重新运行
左手写爱 发表于 2018-2-23 16:43
27.8G 看来真的需要上大盘鸡了
这是1天的多量..........
static/image/smiley/default/lol.gif
27.8G 看来真的需要上大盘鸡了 前排吃西瓜 mark下 好详细,有空搞 另外chevereto免费版不支持php 7.2
建议使用7.1 不错挺骚的操作。 你们这些采集真6,什么时候把1024全部采集完送个VIP。 这操作真666 另外问下chevereto 支持远程存储吗 比如 google的drive.
页:
[1]
2