mingtian 发表于 2018-4-12 23:17:48

请教下 python BeautifulSoup4 取链接

本帖最后由 mingtian 于 2018-4-12 23:20 编辑










魔牌明月


连载中

作者:
吕南明



---本书已经上架,求订阅,求贵宾,求盖章......谢谢!




最新章节:
第五百一十章 完本感言




需要从这里获取到a链接




也就是获取/book/3033

才接触这个。没看懂。懂的朋友说下 有几种方法取出这个链接


这样取出来 for mulu1 in soup.select('.am-u-sm-2 a')['href']

居然是竖着一行。。
/
b
o
o
k
/
3
0
3
3

就是这样 不知道为啥


大风起 发表于 2018-4-13 19:40:31


import lxml.html as lh
html = '''
   
   
   


   
   
   
   
    魔牌明月
   
   
    连载中
   
    作者:
吕南明
   

   
    ---本书已经上架,求订阅,求贵宾,求盖章......谢谢!
   

   
   
    最新章节:
第五百一十章 完本感言
   
   
   
'''
doc = lh.fromstring(html)

print(doc.xpath('//article/div/a/@href'))


学着使用 xpath 吧,使用比soup方便,而且可移植性高

mingtian 发表于 2018-4-13 22:45:55


大风起 发表于 2018-4-13 19:40


import lxml.html as lh
html = '''
嗯 多谢

才接触的。。慢慢琢磨
页: [1]
查看完整版本: 请教下 python BeautifulSoup4 取链接