Eraser's ProjectLog

  • 홈
  • 태그
  • 방명록
  • StudyLog
  • KnowLog
  • PSLog

커뮤니티 1

[3] 커뮤니티 글 데이터셋 라벨링

감성분석을 모델링을 진행하기에 앞서 긍정, 부정이 라벨링된 Train Set을 만들기로 했다. 감성어 사전을 바탕으로 형태소 분석을 진행한 뒤, 문장 내 형태소가 긍정어 사전에 있으면 점수에 +1을, 부정어 사전에 있으면 -1을 했고, 각 문장별로 점수가 0보다 작으면 부정(-1), 0보다 크면 긍정(1), 0이면 중립/unknown(0)으로 라벨링했다. 이번 단계의 작업을 통해 얻고자 하는 결과물은, 커뮤니티 게시글, 댓글을 문장 단위로 나누어 긍/부정 라벨링을 진행한 데이터셋이다. # 사용한 라이브러리 KoNLPy Pandas, Numpy Matplotlib.pyplot, Seaborn 더보기 Jupyter Notebook 및 윈도우 환경에서는 KoNLPy를 사용하기에 제약이 많다. 따라서 Googl..

AI/정책 댓글 반응 NLP 2020.04.11
1
더보기
프로필사진

#즐겁게 #꾸준히 #시나브로

  • 분류 전체보기 (38)
    • AI (25)
      • 정책 댓글 반응 NLP (19)
      • 빅콘테스트 2020 챔피언리그 (2)
      • 제주 신용카드 빅데이터 경진대회 (4)
    • Backend (8)
      • AI App Server (5)
      • Image Server (3)
      • Route Server (0)
    • Infra (1)
    • 기타 (4)

Tag

Python, CGi, 파이썬, 크롤링, 스크레이핑, fastcgi, 네이버 뉴스, NGINX, NLP, 분류, LSTM, fcgiwrap, nginx-upload-module, Selenium, 감성분석, Crawling, Scraping, 정적파일, 자연어처리, 댓글,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바