Eraser's ProjectLog

  • 홈
  • 태그
  • 방명록
  • StudyLog
  • KnowLog
  • PSLog

twitter 1

[트위터 크롤링] GetOldTweets3

강의 중간 프로젝트로 트위터 데이터를 크롤링했다. 트위터 크롤링은 API(공식 Standard API를 활용하더라도 수집할 수 있는 기간에 제한이 있다), Request 에러 핸들링 등으로 인해 골치가 아프다. 위의 문제에 부딪히지 않기 위해 Selenium 및 네트워크 요청 분석을 통해 코드를 짜서 스크레이핑을 진행하려 했으나, 미니 프로젝트였기 때문에, 시간이 많지 않아 성공하지는 못했다. 하루 이틀 고생했는데, 결론적으로 내가 구현하고 싶은 방법을 잘 구현해 놓은 라이브러리를 발견했다. API 없이도 이전 트윗을 수집할 수 있었다. 데이터 분석이 목적이 아니라 단순히 여러 사이트에서 데이터를 수집하는 방법을 연습하는 프로젝트였기 때문에, 어떻게 라이브러리를 활용했는지를 위주로 크롤링 방법만 기록한다..

기타 2020.06.11
1
더보기
프로필사진

#즐겁게 #꾸준히 #시나브로

  • 분류 전체보기 (38)
    • AI (25)
      • 정책 댓글 반응 NLP (19)
      • 빅콘테스트 2020 챔피언리그 (2)
      • 제주 신용카드 빅데이터 경진대회 (4)
    • Backend (8)
      • AI App Server (5)
      • Image Server (3)
      • Route Server (0)
    • Infra (1)
    • 기타 (4)

Tag

크롤링, NLP, 스크레이핑, 파이썬, 자연어처리, Crawling, Selenium, LSTM, 감성분석, 분류, nginx-upload-module, 네이버 뉴스, NGINX, Scraping, fastcgi, 댓글, Python, fcgiwrap, 정적파일, CGi,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/06   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바