python3 用BeautifulSoup 爬取指定ul下的a标签

2024-11-02 02:24:19
推荐回答(3个)
回答1:

用select('ul 的 css 路径').find_all(...)

css路径直接用浏览器开发视图,从ul复制就好,当然也可以把前面多余的部分删掉

回答2:

这种明细就用select来的方便啊
soup.select('a ul.class')

回答3:

# -*- coding:utf-8 -*-
#python 2.7
#XiaoDeng
#http://tieba.baidu.com/p/2460150866
#标签操作

from bs4 import BeautifulSoup
import urllib.request
import re

#如果是网址,可以用这个办法来读取网页
#html_doc = "http://tieba.baidu.com/p/2460150866"
#req = urllib.request.Request(html_doc)