sql >> Databáze >  >> RDS >> Mysql

Přístup ke konkrétní tabulce v html značce

Vypadá to, že problém s kódem alecxe je v tom, že vrací tabulku, která je přímým sourozencem h2, ale ta, kterou chcete, je ve skutečnosti v rámci div (což je sourozenec h2). Toto fungovalo pro mě:

import requests
from bs4 import BeautifulSoup

urls = [
    'https://www.hl7.org/fhir/valueset-account-status.html',
    'https://www.hl7.org/fhir/valueset-activity-reason.html',
    'https://www.hl7.org/fhir/valueset-age-units.html'
]


def extract_table(url):
    r = requests.get(url)
    soup = BeautifulSoup(r.content, 'lxml')

    h2 = soup.find(lambda elm: elm.name == 'h2' and 'Content Logical Definition' in elm.text)
    div = h2.find_next_sibling('div')
    return div.find('table')


for url in urls:
    print extract_table(url)



  1. Problém s dotazem Sequelize Many to Many

  2. Pomalý MySQL dotaz

  3. Vkládání dat pomocí vícerozměrného pole z více polí

  4. Odečtení dvou stejných hodnot není v mysql nula