본문 바로가기
Programming/Python

[Crawling] 크롤링으로 Excel 업무 자동화 하기

by 코딩의성지 2020. 4. 16.

하이 ..!

 

회사에 있다보면 타부서에 이것저것 요청해야할 것 (서버 계정 신청이나 방화벽 신청 같은 것들??) 들이 굉장히 많다.

 

우리회사에서는 신청할 양이 꽤 되는 것들은 틀이 정해져 있는 액셀파일로 요청을 하는 경우가 많다.

 

그런데 ... 이 액셀 파일을 만드는 것 조차 귀찮게 느껴진다.

 

크롤링을 공부하다가 이런 액셀파일도 자동으로 만들어주면 어떨까 하는 생각이 들어서 .. 일단 크롤링을 통해 액셀 파일을 만들고, 읽는 예제를 한번 작성해보았다.

 

오늘 내가 크롤링해서 작업해볼 건 바로 !! 내 블로그이다. ㅎㅎㅎ

 

 일단 내 블로그 메인 페이지를 들어가보면 위의 화면과 같이 리스트로 정렬이 되어 있다. 나는 저기 저 글 제목들을 쭉 긁어서 액셀 파일로 만들어 볼거다.

 

액셀파일 만들기

 

 

위의 코드는 액셀 파일을 만드는 코드이다. 

이전에 공부했던 부분과 좀 다른게 ...! requests 라이브러리 대신 urllib 라이브러리를 사용했다는 것과 액셀 이용을 위해 openpyxl 라이브러리를 사용했따는 것이다.

 

requests 라이브러리를 사용하면 간혹 인코딩 문제가 생겨서 크롤링이 안될때가 있다. 그럴 때는 위의 방식처럼 urllib 라이브러리를 사용해주면된다.

 

openpyxl 라이브러리를 이용해 액셀파일을 만들고 , 시트에다가 데이터를 append 시키는 코드이다. 이건 File I/O이기때문에 마지막에 close를 꼭해주자 !!

 

만약 위의 코드 중 이해 안되는 부분있으면 언제든 댓글 남겨주라 ! ㅎㅎㅎ 

 

이제 저 코드를 실행시켜보면 ~!

 

이렇게 잘 만들어진 excel 을 볼 수 있다.

 

 

액셀파일 읽기

 

자. 만든 액셀파일을 읽어보자.

 

코드는 상대적으로 더 간단하다. 저장된 액셀파일을 로드해서 그냥 정말 읽어와주면된다. ㅎㅎㅎ 쉽지??

그리고 마찬가지로 작업이 끝나면 해당 액셀파일을 닫아주는 것 까지 잊지 않으면 끝이다!

 

그리고 코드를 실행해 보면 ..!

 

요렇게 잘 실행이 되는 거 볼 수 있다.

 

여러분들도 다양하게 응용해서 업무 효율 확확 늘리시길 바란다. 그럼 즐겁게 일하자 !! 안녕~~

 

 

반응형

댓글