请教下 python BeautifulSoup4 取链接-Web技术-HS2V主机综合交流论坛

mingtian 发表于 2018-4-12 23:17:48

请教下 python BeautifulSoup4 取链接

本帖最后由 mingtian 于 2018-4-12 23:20 编辑

魔牌明月

连载中

作者:
吕南明

---本书已经上架，求订阅，求贵宾，求盖章......谢谢！

最新章节:
第五百一十章完本感言

需要从这里获取到a链接

也就是获取/book/3033

才接触这个。没看懂。懂的朋友说下有几种方法取出这个链接

这样取出来 for mulu1 in soup.select('.am-u-sm-2 a')['href']

居然是竖着一行。。
/
b
o
o
k
/
3
0
3
3

就是这样不知道为啥

大风起 发表于 2018-4-13 19:40:31

import lxml.html as lh
html = '''

魔牌明月

连载中

作者:
吕南明

---本书已经上架，求订阅，求贵宾，求盖章......谢谢！

最新章节:
第五百一十章完本感言

'''
doc = lh.fromstring(html)

print(doc.xpath('//article/div/a/@href'))

学着使用 xpath 吧，使用比soup方便，而且可移植性高

mingtian 发表于 2018-4-13 22:45:55

大风起发表于 2018-4-13 19:40

import lxml.html as lh
html = '''
嗯多谢

才接触的。。慢慢琢磨

页: [1]

HS2V主机综合交流论坛's Archiver

请教下 python BeautifulSoup4 取链接