About_Datascience/Project
-
[Crawliing Project _ 회고_ 어려웠던 부분(2) 이미지 복사 후 삽입]About_Datascience/Project 2023. 1. 24. 18:37
두 번째로 어려웠던 부분을 뽑자면 메일링 서비스를 진행할 때 메일을 쓰는 본문에 셀레니움을 통해 복사한 이미지를 붙여넣기 하는 작업이었다. 이 부분은 구글링을 해도 잘 나오지 않았고 , 결국 window에서만 가능한 클립보드를 이용하여 해결하였다. 따라서 이번 글에서는 이를 해결하기까지의 시행착오를 작성하고자 한다. 해결방법 import win32clipboard def send_to_clipboard(clip_type, data): win32clipboard.OpenClipboard() win32clipboard.EmptyClipboard() win32clipboard.SetClipboardData(clip_type, data) win32clipboard.CloseClipboard() for key,v..
-
[Crawliing Project _ 회고_ 어려웠던 부분(1) iframe안으로 이동]About_Datascience/Project 2023. 1. 24. 18:02
이번 프로젝트에 대한 회고는 어려웠던 부분과 느낀점으로 나누어 작성하려 한다. 1. iframe으로 이동하여 크롤링 # 메일 내용 입력 프레임으로 옮기기 chrome.switch_to.frame(chrome.find_element(By.XPATH, '//*[@id="content"]/div[3]/div/div[2]/div/div[3]/iframe')) # 다시 부모 프레임으로 옮기기 chrome.switch_to.default_content() 마무리 단계에서 네이버 메일 본문을 작성하는 위치를 평소와 같이 CSS_SELECTOR 를 이용하여 찾았다. class 이름도 대놓고 "workseditor-content" 라고 적혀있길래 '역시 네이버 ! 이렇게 편하고 직관적인 이름으로 명시를 해뒀구나 ! ' ..
-
[Crawling Project_급등된 주가에 대한 기사 분석 및 자료 메일링 서비스_최종코드]About_Datascience/Project 2023. 1. 24. 17:35
첫 토이 프로젝트인 크롤링 프로젝트를 진행하였다. 우리 조의 주제는 여러 아이디어가 나왔는데 그 중 '급등된 주가에 대한 기사 분석 및 자료 메일링 서비스' 로 정하였다. 처음에는 네이버 증권 창에서 거래량 상위 종목 중 등락율이 높은 종목들을 크롤링하고 추출된 종목들을 뉴스 검색창에 검색하여 뉴스 제목과 링크를 뽑아와 뼈대를 잡았다. 그 후 차트 이미지 삽입, 자동화,메일링 서비스 등 조건과 기능들을 하나씩 추가하면서 서비스를 디벨롭 시키고자 하였다. 이번 크롤링 프로젝트는 Selenium을 이용하여 진행하였다. 필요한 모듈 from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.s..