Eraser's ProjectLog

  • 홈
  • 태그
  • 방명록
  • StudyLog
  • KnowLog
  • PSLog

Word2vec 1

[4] 포털 댓글 감성 분석_1. 순환신경망_3. Word2Vec 임베딩층

Keras Embedding 레이어가 아닌, 팀 데이터셋에 맞는 Word2Vec 임베딩 층을 사용해 임베딩 층으로 주입한다. 이전의 LSTM 모델에서 임베딩 층만 달라지기 때문에, 해당 부분만 기록한다. # Word2Vec Embedding 모든 데이터셋(커뮤니티, 포털 게시글 및 댓글)을 mecab 형태소 분석기를 사용해 형태소 단위로 분석하고, Word2Vec 임베딩을 진행했다. Gensim라이브러리의 Word2Vec 모델을 사용했고, skip-gram 방식을 적용했다. 최소 등장 빈도는 5, 윈도우 사이즈는 10으로 설정하였으며, 100차원으로 임베딩하였다. 임베딩 품질을 확인하기 위해 다음의 작업을 진행했다. 첫째, 몇 가지 키워드를 선정하여 코사인 유사도가 높은 단어들을 추출했다. 어느 정도 유..

AI/정책 댓글 반응 NLP 2020.04.21
1
더보기
프로필사진

#즐겁게 #꾸준히 #시나브로

  • 분류 전체보기 (38)
    • AI (25)
      • 정책 댓글 반응 NLP (19)
      • 빅콘테스트 2020 챔피언리그 (2)
      • 제주 신용카드 빅데이터 경진대회 (4)
    • Backend (8)
      • AI App Server (5)
      • Image Server (3)
      • Route Server (0)
    • Infra (1)
    • 기타 (4)

Tag

nginx-upload-module, NGINX, 네이버 뉴스, 분류, 감성분석, 스크레이핑, 자연어처리, 크롤링, fastcgi, LSTM, Scraping, Crawling, Python, fcgiwrap, 파이썬, Selenium, 정적파일, 댓글, NLP, CGi,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/06   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바