Baseline model of BoostCamp2021 P-Stage DST

Open-vocab based DST model인 TRADE의 한국어 구현체입니다. (5강, 6강 내용 참고)

기존의 GloVe, Char Embedding 대신 monologg/koelectra-base-v3-discriminator의 token_embeddings을pretrained Subword Embedding으로 사용합니다.
메모리를 아끼기 위해 Token Embedding (768) => Hidden Dimension (400)으로의 Projection layer가 들어 있습니다.
빠른 학습을 위해 Parallel Decoding이 구현되어 있습니다.

1. 필요한 라이브러리 설치

pip install -r requirements.txt

2. 모델 학습

SM_CHANNEL_TRAIN=data/train_dataset SM_MODEL_DIR=[model saving dir] python train.py
학습된 모델은 epoch 별로 SM_MODEL_DIR/model-{epoch}.bin 으로 저장됩니다.
추론에 필요한 부가 정보인 configuration들도 같은 경로에 저장됩니다.
Best Checkpoint Path가 학습 마지막에 표기됩니다.

3. 추론하기

SM_CHANNEL_EVAL=data/eval_dataset/public SM_CHANNEL_MODEL=[Model Checkpoint Path] SM_OUTPUT_DATA_DIR=[Output path] python inference.py

4. 제출하기

3번 스텝 inference.py에서 SM_OUTPUT_DATA_DIR에 저장된 predictions.json을 제출합니다.

wandb 적용하기

train.py파일을 수행하면 다음과 같은 화면에서 2번 선택

API key를 받을 수 있는 링크로 들어가 (그림 2번째 줄) 공유 계정으로 로그인

아래와 같이 key값을 terminal 창에 복사 붙여 넣기
- 다음과 같이 수행됨
wandb 홈페이지에서 다음과 같이 만들어진 project를 확인할 수 있음

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README_baseline.md

README_baseline.md

Baseline model of BoostCamp2021 P-Stage DST

1. 필요한 라이브러리 설치

2. 모델 학습

3. 추론하기

4. 제출하기

wandb 적용하기

Files

README_baseline.md

Latest commit

History

README_baseline.md

File metadata and controls

Baseline model of BoostCamp2021 P-Stage DST

1. 필요한 라이브러리 설치

2. 모델 학습

3. 추론하기

4. 제출하기

wandb 적용하기