强烈推荐网站镜像离线工具 httrack
macOS brew 快速安装:brew install httrack命令:[*]httrack "https://anime-86.com" -O ~/Downloads/anime-86-site -c8 \
[*]--user-agent "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/18.4 Safari/605.1.15"复制代码
目标网站:https://anime-86.com
缓存本地目录:~/Downloads/anime-86-site
下载线程数8:-c8
以前使用wget下载工具,部份动态网页会出问题。比如:
[*]https://anime-86.com/news/
[*]
[*]https://anime-86.com/story/复制代码
wget 本地文件:
[*]index.html
[*]story?id=01
[*]story?id=02
[*]story?id=03
[*]...复制代码
httrack 本地网页:
[*]index.html
[*]index0b48.html
[*]index1ffe.html
[*]index2e5f.html
[*]...复制代码
ChatGPT:
httrack 常用参数说明
基本参数
[*]-O - 指定存储目录[*]-c - 设置并发连接数(默认 3,建议 4-8)[*]--user-agent "" - 伪装浏览器标识(User-Agent)[*]--mirror - 仅下载网站,不解析本地文件[*]--get-files - 仅下载单个文件,而不是整个网站[*]--update - 增量更新已下载的网站[*]--continue - 继续中断的下载
网络相关
[*]--proxy - 使用代理服务器下载[*]--disable-security-limits - 解除速度限制[*]--sockets=N - 设置最大同时连接数[*]-D - 只下载与主域匹配的链接(避免外链)[*]-%v - 强制重新下载所有文件(忽略缓存)
过滤规则
[*]+*.jpg +*.png +*.gif - 仅下载指定格式的文件[*]-ad.doubleclick.net/* - 排除特定域名的资源[*]--depth=N - 限制下载深度[*]--max-size=N - 限制最大文件大小[*]--near - 尝试下载所有 HTML 引用的图片等资源
示例命令
[*]
[*]httrack "https://www.example.com" -O ~/Downloads/example-site -c8 --user-agent "Mozilla/5.0"
[*]复制代码
检索论坛信息,原来早在2018年就有人推荐过了
static/image/smiley/default/mad.gif
https://hostloc.com/thread-433819-1-1.html
页:
[1]