목록Beautifulsoup (1)
CODENAVY
Web Scraping (BeautifulSoup)
Workflow 1) 웹페이지에서 소스 코드를 다운로드 받는다. (requests 모듈 사용) 2) 소스 코드 중에서 특정 태그를 찾는다. (bs4의 BeautifulSoup 모듈 사용) 3) 태그가 저장하고 있는 정보를 추출한다. 태그는 시작 태그와 끝 태그로 구성되어 있으며, 일반적으로 text는 이 사이에 저장되어 있다. (태그 중에서 끝 태그가 없는 경우도 있음. ex: meta 태그) ex) 역사란 무엇인가 Chapter 1. 소스코드 다운받기 url = http://www.yes24.com/Product/goods/61385099 import requests r = requests.get(url) r.text # 소스코드가 저장되어 있음 print(r.text) Chapter 2. 원하는 정보..
Data Crawling
2021. 10. 28. 17:16