728x90
반응형
from bs4 import BeautifulSoup as BS
import requests as req
# iframe 안에 들어있는 표 값.
url = "https://finance.naver.com/marketindex/exchangeList.naver"
res = req.get(url)
soup = BS(res.text, "html.parser")
#print(soup.title)
#print(soup.title.string)
tds = soup.find_all("td")
#print(tds)
names = []
for td in tds:
#print(td.string)
if len(td.find_all("a")) == 0:
continue
#print(td.string) # 이러면 공백이 많다. 개선을 하려면..
#print(td.get_text(strip=True)) # 인자를 안넣으면 string 과 동일하게 동작. 반드시 옵션을 넣어라.
names.append(td.get_text(strip=True))
prices = []
for td in tds:
if "class" in td.attrs:
if "sale" in td.attrs["class"]:
prices.append(td.get_text(strip=True))
print(names)
print(prices)
728x90
반응형
'BIG DATA > 크롤링' 카테고리의 다른 글
css 셀렉터 테스트 방법 (0) | 2021.09.27 |
---|---|
CSS 셀렉터를 쓰는 방식 4가지 (0) | 2021.09.27 |
네이버 환율 데이터 가져오기 - css 셀렉터 방식 (0) | 2021.09.27 |
Top 11 FREE Web Scraping Frameworks (2019년글) (0) | 2021.09.10 |
12 Best Web Scraping Tools (0) | 2021.09.10 |
댓글