找回密码
 立即注册
CeraNetworksBGVM服务器主机交流IP归属甄别会员请立即修改密码
查看: 44|回复: 7

关于火车头(高铁)关联分页的问题,来个彦祖解答下

[复制链接]

26

主题

337

回帖

1366

积分

金牌会员

积分
1366
发表于 2022-5-10 18:03:17 | 显示全部楼层 |阅读模式
本帖最后由 Twice 于 2022-5-10 18:12 编辑

问题很简单:
用火车头(高铁)采集小说这种类型的数据,
1.txt
2.txt
这类的,但是别人的网站存在分页。也就是1.txt这个章节分成1-3或者更多页面。

我用火车头采集这种页面,既要1-2-3-4-5-6.TXT这个章节,也需要把1.txt(1-3)在后台合成一个章节。

搞了一下午了,没有弄出头绪,来个大佬讲讲是软件本身的原因还是我思考有盲区。

回复

使用道具 举报

186

主题

2211

回帖

6096

积分

论坛元老

积分
6096
发表于 2022-5-10 18:05:33 | 显示全部楼层
采集内容时候本身就有分页功能的吧
回复

使用道具 举报

26

主题

337

回帖

1366

积分

金牌会员

积分
1366
 楼主| 发表于 2022-5-10 18:08:39 | 显示全部楼层

本人马保国 发表于 2022-5-10 18:05

采集内容时候本身就有分页功能的吧

存在分页功能,但是内容是下一页下一页这种类型的,如果到达下一章这种程度就无法识别了。
我需要的是识别这个下一章做出判断。
回复

使用道具 举报

26

主题

337

回帖

1366

积分

金牌会员

积分
1366
 楼主| 发表于 2022-5-10 18:05:00 | 显示全部楼层

本人马保国 发表于 2022-5-10 18:05

采集内容时候本身就有分页功能的吧

意思是多级内容分页,1下面有1-3,2下面有1-3,以此类推
回复

使用道具 举报

43

主题

1185

回帖

3329

积分

论坛元老

积分
3329
发表于 2022-5-10 18:18:13 | 显示全部楼层
最近我也在研究火车头,等回去看看
回复

使用道具 举报

26

主题

337

回帖

1366

积分

金牌会员

积分
1366
 楼主| 发表于 2022-5-10 18:05:00 | 显示全部楼层

蝙蝠侠 发表于 2022-5-10 18:20

最近我也在研究火车头,等回去看看



放弃了,不搞多级分页了。
回复

使用道具 举报

31

主题

175

回帖

887

积分

高级会员

积分
887
发表于 2022-5-10 18:20:13 | 显示全部楼层
都采集小说了 为什么用关关或者94
回复

使用道具 举报

26

主题

337

回帖

1366

积分

金牌会员

积分
1366
 楼主| 发表于 2022-5-10 19:19:42 | 显示全部楼层

没钱图屌丶 发表于 2022-5-10 19:41

都采集小说了 为什么用关关或者94

关关94适用性不好,只能支持杰奇。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|HS2V主机综合交流论坛

GMT+8, 2024-5-29 09:26 , Processed in 0.054254 second(s), 3 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表