목록WebScraping (1)
CODENAVY
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/P81gU/btri44rt1BV/SCwnlGKoyeO03Q5KQmod71/img.png)
Workflow 1) 웹페이지에서 소스 코드를 다운로드 받는다. (requests 모듈 사용) 2) 소스 코드 중에서 특정 태그를 찾는다. (bs4의 BeautifulSoup 모듈 사용) 3) 태그가 저장하고 있는 정보를 추출한다. 태그는 시작 태그와 끝 태그로 구성되어 있으며, 일반적으로 text는 이 사이에 저장되어 있다. (태그 중에서 끝 태그가 없는 경우도 있음. ex: meta 태그) ex) 역사란 무엇인가 Chapter 1. 소스코드 다운받기 url = http://www.yes24.com/Product/goods/61385099 import requests r = requests.get(url) r.text # 소스코드가 저장되어 있음 print(r.text) Chapter 2. 원하는 정보..
Data Crawling
2021. 10. 28. 17:16