About_Datascience
-
[Crawling Project_급등된 주가에 대한 기사 분석 및 자료 메일링 서비스_최종코드]About_Datascience/Project 2023. 1. 24. 17:35
첫 토이 프로젝트인 크롤링 프로젝트를 진행하였다. 우리 조의 주제는 여러 아이디어가 나왔는데 그 중 '급등된 주가에 대한 기사 분석 및 자료 메일링 서비스' 로 정하였다. 처음에는 네이버 증권 창에서 거래량 상위 종목 중 등락율이 높은 종목들을 크롤링하고 추출된 종목들을 뉴스 검색창에 검색하여 뉴스 제목과 링크를 뽑아와 뼈대를 잡았다. 그 후 차트 이미지 삽입, 자동화,메일링 서비스 등 조건과 기능들을 하나씩 추가하면서 서비스를 디벨롭 시키고자 하였다. 이번 크롤링 프로젝트는 Selenium을 이용하여 진행하였다. 필요한 모듈 from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.s..
-
[ About_Selenium(2) ]About_Datascience/Crawling 2023. 1. 15. 18:44
오늘은 전에 배웠던 셀레니움을 이용하여 네이버 로그인 자동화 프로그램을 만들어 보고자 한다. 우선 전에 배웠던 기본적인 기능들을 토대로 네이버 로그인 프로그램을 구현해보았다. # 네이버 접속 browser = webdriver.Chrome('chromedriver') #browser.close() browser.get('https://www.naver.com') # 로그인 버튼 클릭 el = browser.find_element(By.CLASS_NAME,'link_login') el.click() # 아이디 입력 el = browser.find_element(By.ID,'id') # 아이디 입력 el.send_keys("my_id") # 비밀번호 입력 el = browser.find_element(By...
-
[ About_Selenium(1) ]About_Datascience/Crawling 2023. 1. 15. 18:33
셀레니움은 웹 어플리케이션 자동화 및 테스트를 위한 포터블 프레임워크이다. 오늘은 셀레니움을 이용하여 페이지를 제어하고, 자동화를 구현해보고자 한다. 1. chrome driver 다운로드 후 주피터 노트북과 같은 폴더에 넣어두기 우선 크롬드라이버를 자신의 크롬 버전과 pc(mac, window, bit ...)에 맞게 다운로드 받으면 된다. 필자는 맥북 m1 을 쓰고 있기 때문에 108버전 mac_arm64 을 다운로드 받았다.) 2. webdriver 선언 from selenium import webdriver 3. browser 선언 browser = webdriver.Chrome('chromedriver') browser.get('https://www.naver.com') browser을 선언 후..
-
[ About _ 파일 입출력 (txt , csv , excel) ]About_Datascience/Python 2023. 1. 6. 18:09
파일 입출력은 어떠한 파일을 열고 , 저장 , 변경, 추가 , 삭제 후 파일 닫기의 과정으로 이루어진다. 1. text file 입출력 * 파일 열기 (open) 기본적으로 파일을 열 때는 " open " 을 사용한다. 안에 들어가는 argument들을 살펴보면 " 파일 이름.txt" / "file mode" : write (w) , read(r) , append(a) 쓰기 , 읽기 , 추가 모드가 있지만 설정하지 않는 경우 기본 값인 read(r) 모드로 설정된다. / file encoding = " " : 인코딩 같은 경우 ecu-kr , utf-8 , ANSI 등등이 있지만 대개의 경우 utf-8을 사용한다. * 파일 쓰기 (write, "w" ) write 의 경우 f.write (" 원하는 내용..
-
[ About _ loc , iloc / drop , duplicated , drop_duplicates ]About_Datascience/DataFrame 2022. 12. 26. 10:34
1. loc 과 iloc 데이터 프레임에서 특정 행(row)나 열(column)을 골라낼 때 사용하는 방법으로 loc와 iloc이 있다. loc 은 location의 약자로 데이터 프레임의 행 또는 컬럼의 label이나 boolean array로 인덱싱하는 방법이다. 즉 사람이 읽을 수 있는 label 값으로 특정 값들을 골라오는 방법이라 할 수 있다. -기본적인 사용방법- df . loc [ 행 인덱싱 값, 열 인덱싱 값] loc[ ] 안에 원하는 row 이름과 column이름을 넣어주면 된다. 위의 경우에는 Jacket 부터 Shirt 까지 , 사이즈는 M 부터 XS 까지 가져와줘 ! 라는 의미로 슬라이싱을 한 결과이다. loc과 조건식을 이용하여 원하는 데이터를 뽑아올 수도 있다. 위의 경우 사이즈..
-
[ About _ Python 기초 (input , 형변환 , 특수연산 , if문, 문자열 연산, f-string) ]About_Datascience/Python 2022. 12. 22. 18:24
12.21 파이썬 기초 강의 입력 (Input) 형변환 특수 연산 ( ** , // , %) if 문 문자열 연산 format string 양식 중 f-string 이 6가지 주제로 수업이 진행되었다. 기존에 파이썬을 다뤄봤던 경험이 있기에 크게 어려운 수업은 아니었지만 완벽하지 않기에 당연하게도 부족한 부분이 나올 수 밖에 없었다. 따라서 6개 주제 중 부족하다 느끼거나 새로 알게된 부분이 있는 부분 위주로 채워가도록 하자. 1. Input ( ) 과 형변환 input( ) 은 사용자가 입력한 값을 변수에 저장하는 함수이다. 이는 a 라는 변수에 사용자가 입력한 값을 저장한다는 의미이다. input( ) 함수로 입력 받는 값은 무조건 string type 으로 저장이 된다. 따라서 추후 연산을 하기 위..