Edição das 10h15min de 29 de janeiro de 2023

Índice

1 Request

Request

Install Requests

pip install requests
pip install beautifulsoup4
pip install selenium

Carrega uma pagina

from urllib.request import urlopen 
html = urlopen("http://www.pagina_exemplo.com")

BeaultifulSoap

Métodos de coleta

[[1]]

= Recupera todos os href da pagina

############################## Carrega arquivo para memória
html = open('dataset/result/site-01.html')
bs = BeautifulSoup(html, 'html.parser')
############################## Busca todos os A HREF
curriculos = []
for link in bs.find_all('a'):
   js = link.get('href')
   curriculos.append(js)

Mudanças entre as edições de "Python:Request"

Edição das 10h15min de 29 de janeiro de 2023

Índice

Request

Carrega uma pagina

BeaultifulSoap

= Recupera todos os href da pagina

Menu de navegação

Ferramentas pessoais

Espaços nominais

Variantes

Visualizações

Mais

Pesquisa

Navegação

Ferramentas