立即注册  找回密码
 立即注册
CeraNetworksBGVM服务器主机交流会员请立即修改密码Sharktech防护
查看: 51|回复: 7

关于火车头(高铁)关联分页的问题,来个彦祖解答下

[复制链接]

关于火车头(高铁)关联分页的问题,来个彦祖解答下

[复制链接]

27

主题

337

回帖

1371

积分

金牌会员

积分
1371
Twice

27

主题

337

回帖

1371

积分

金牌会员

积分
1371
2022-5-10 18:03:17 | 显示全部楼层 |阅读模式
本帖最后由 Twice 于 2022-5-10 18:12 编辑

问题很简单:
用火车头(高铁)采集小说这种类型的数据,
1.txt
2.txt
这类的,但是别人的网站存在分页。也就是1.txt这个章节分成1-3或者更多页面。

我用火车头采集这种页面,既要1-2-3-4-5-6.TXT这个章节,也需要把1.txt(1-3)在后台合成一个章节。

搞了一下午了,没有弄出头绪,来个大佬讲讲是软件本身的原因还是我思考有盲区。

回复

使用道具 举报

190

主题

2305

回帖

6388

积分

论坛元老

积分
6388
本人马保国

190

主题

2305

回帖

6388

积分

论坛元老

积分
6388
2022-5-10 18:05:33 | 显示全部楼层
采集内容时候本身就有分页功能的吧
回复

使用道具 举报

27

主题

337

回帖

1371

积分

金牌会员

积分
1371
Twice 楼主

27

主题

337

回帖

1371

积分

金牌会员

积分
1371
2022-5-10 18:08:39 | 显示全部楼层

本人马保国 发表于 2022-5-10 18:05

采集内容时候本身就有分页功能的吧

存在分页功能,但是内容是下一页下一页这种类型的,如果到达下一章这种程度就无法识别了。
我需要的是识别这个下一章做出判断。
回复

使用道具 举报

27

主题

337

回帖

1371

积分

金牌会员

积分
1371
Twice 楼主

27

主题

337

回帖

1371

积分

金牌会员

积分
1371
2022-5-10 18:05:00 | 显示全部楼层

本人马保国 发表于 2022-5-10 18:05

采集内容时候本身就有分页功能的吧

意思是多级内容分页,1下面有1-3,2下面有1-3,以此类推
回复

使用道具 举报

43

主题

1201

回帖

3391

积分

论坛元老

积分
3391
蝙蝠侠

43

主题

1201

回帖

3391

积分

论坛元老

积分
3391
2022-5-10 18:18:13 | 显示全部楼层
最近我也在研究火车头,等回去看看
回复

使用道具 举报

27

主题

337

回帖

1371

积分

金牌会员

积分
1371
Twice 楼主

27

主题

337

回帖

1371

积分

金牌会员

积分
1371
2022-5-10 18:05:00 | 显示全部楼层

蝙蝠侠 发表于 2022-5-10 18:20

最近我也在研究火车头,等回去看看



放弃了,不搞多级分页了。
回复

使用道具 举报

31

主题

175

回帖

887

积分

高级会员

积分
887
没钱图屌丶

31

主题

175

回帖

887

积分

高级会员

积分
887
2022-5-10 18:20:13 | 显示全部楼层
都采集小说了 为什么用关关或者94
回复

使用道具 举报

27

主题

337

回帖

1371

积分

金牌会员

积分
1371
Twice 楼主

27

主题

337

回帖

1371

积分

金牌会员

积分
1371
2022-5-10 19:19:42 | 显示全部楼层

没钱图屌丶 发表于 2022-5-10 19:41

都采集小说了 为什么用关关或者94

关关94适用性不好,只能支持杰奇。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|小黑屋|HS2V主机综合交流论坛

GMT+8, 2024-11-22 14:09 , Processed in 0.065371 second(s), 4 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表