본문 바로가기

IT/IT 정보 정리

간단하게 파이썬을 이용해 네이버 블로그 크롤링 해보기

반응형

python의 BeautifulSoup 을 이용하여 크롤링해보기

 

iframurl 에는 네이버 블로그에서 개발자도구로 url확인 해서 넣어 주기

src 에 있는 url을 확인 하여 iframe에 넣기 !

from bs4 import BeautifulSoup
import requests
import urllib.request as req

iframeurl=""
url="https://blog.naver.com/"+iframeurl
res= req.urlopen(url)
soup= BeautifulSoup(res,'html.parser')

if soup.find("div", attrs={"class":"se-main-container"}):
    text = soup.find("div", attrs={"class":"se-main-container"}).get_text()
    text = text.replace("\n","") #공백 제거
    print(text)
반응형

'IT > IT 정보 정리' 카테고리의 다른 글

[ISTQB] 시험 후기 및 합격 후기 tip  (0) 2020.05.25
[ISTQB]테스트 활동과 작업  (0) 2020.05.03
[ISTQB] 테스트 레벨 비교  (0) 2020.05.03