立即注册  找回密码
 立即注册
CeraNetworksBGVM服务器主机交流会员请立即修改密码Sharktech防护
查看: 22|回复: 0

求一个爬虫的解决方案。技术佬请进。

[复制链接]

求一个爬虫的解决方案。技术佬请进。

[复制链接]

158

主题

297

回帖

2014

积分

金牌会员

积分
2014
akatom

158

主题

297

回帖

2014

积分

金牌会员

积分
2014
2025-3-15 23:10:06 | 显示全部楼层 |阅读模式
google的notebookml,没有api。这个notebookml主要作用就是读论文,返回一些文章的摘要。

试问各位大佬,我用python写个爬虫还是什么样子的自动化工具, 然后买一台服务器,我通过一些方式(服务器搭建一个Django或者springboot的接口)上传这个需要阅读的论文,然后获取到这个文件之后,python写一个自动化的脚本,例如使用selenium,或者drissionpage,进行提交到这个notebookml(是一个在线网址,需要国外的服务器),然后这个notebookml会生成一些内容,然后通过爬虫把这些内容获取到之后,再用Django写个api 暴露这些内容,传给一个自动化的平台(make or coze)这样是不是就可以发不到公众号上了? 请问大佬这些步骤是不是有哪些是可以优化的? 谢谢各位大佬。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|小黑屋|HS2V主机综合交流论坛

GMT+8, 2025-4-3 08:05 , Processed in 0.013040 second(s), 2 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表