立即注册  找回密码
 立即注册
CeraNetworksBGVM服务器主机交流会员请立即修改密码Sharktech防护
查看: 257|回复: 2

请教下 python BeautifulSoup4 取链接

[复制链接]

请教下 python BeautifulSoup4 取链接

[复制链接]

7

主题

24

回帖

137

积分

注册会员

积分
137
mingtian

7

主题

24

回帖

137

积分

注册会员

积分
137
2018-4-12 23:17:48 | 显示全部楼层 |阅读模式
本帖最后由 mingtian 于 2018-4-12 23:20 编辑



[url=]
[img][/img]
[/url]



[url=]
魔牌明月
[/url]

连载中

作者:
吕南明



---本书已经上架,求订阅,求贵宾,求盖章......谢谢!




最新章节:
[url=]第五百一十章 完本感言[/url]




需要从这里获取到a链接
[url=]
[img][/img]
[/url]

也就是获取/book/3033

才接触这个。没看懂。懂的朋友说下 有几种方法取出这个链接


这样取出来 for mulu1 in soup.select('.am-u-sm-2 a')[0]['href']

居然是竖着一行。。
/
b
o
o
k
/
3
0
3
3

就是这样 不知道为啥


回复

使用道具 举报

5

主题

29

回帖

145

积分

注册会员

积分
145
大风起

5

主题

29

回帖

145

积分

注册会员

积分
145
2018-4-13 19:40:31 | 显示全部楼层
[code]
import lxml.html as lh
html = '''
   
   
    [url=]
[img][/img]
[/url]
   
   
   
    [url=]
    魔牌明月
    [/url]
   
    连载中
   
    作者:
吕南明
   

   
    ---本书已经上架,求订阅,求贵宾,求盖章......谢谢!
   

   
   
    最新章节:
[url=]第五百一十章 完本感言[/url]
   
   
   
'''
doc = lh.fromstring(html)

print(doc.xpath('//article/div/a/@href')[0])
[code]

学着使用 xpath 吧,使用比soup方便,而且可移植性高
回复

使用道具 举报

7

主题

24

回帖

137

积分

注册会员

积分
137
mingtian 楼主

7

主题

24

回帖

137

积分

注册会员

积分
137
2018-4-13 22:45:55 | 显示全部楼层

大风起 发表于 2018-4-13 19:40

[code]
import lxml.html as lh
html = '''

嗯 多谢  

才接触的。。慢慢琢磨
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|小黑屋|HS2V主机综合交流论坛

GMT+8, 2024-11-22 23:01 , Processed in 0.048503 second(s), 4 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表