Skip to content

Pytorch 및 Hugging Face를 활용한 NLP 프로젝트 코스(2022.2 ~ 2022.3) | 자연어 처리 과정에 대한 이해 및 논문 구현

Notifications You must be signed in to change notification settings

woodywarhol9/wanted-pre-onboarding

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

26 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Pytorch를 활용한 NLP 모델링

Wanted 프리온보딩 AI/ML 코스에서 수행한 프로젝트 / 과제들을 정리합니다.



  • 기업 과제2 : 유튜브 데이터 분석인기도 지표 개발


  • 기업 과제4 : 스포츠 기사 요약문 생성평가 지표 개발

  • huggingface에서 pretrained tokenizer, bert 를 불러와 구조 확인
  • layer 마다 embedding 추출 및 cosine-similarity 측정

  • Bertbinary-classifier를 연결해 nsmc 데이터로 fine-tuning
  • fine-tuning : free, unfreeze 방법

  • Custom Dataset, Custom collate_fn 구현
  • 훈련(train), 검증(valid) Dataloader 구성

  • helper.py 모듈의 Class, function를 import
  • accuracy() 함수 구현하여 모델의 예측 정확도 확인


  • WordPiece Tokenizer 학습 및 결과 확인


  • Tensorboard 사용하기
    • Graph, Metrics, Text 시각화

About

Pytorch 및 Hugging Face를 활용한 NLP 프로젝트 코스(2022.2 ~ 2022.3) | 자연어 처리 과정에 대한 이해 및 논문 구현

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published