한국어 문장 관계 분류 모델 : RoBERTa+KoELECTRA+Backtrans

2022. 3. 18. 01:05NLP

DACON 한국어 문장 관계 분류 경진대회

Premise 문장을 참고해 Hypothesis 문장이 참인지(Entailment), 거짓인지(Contradiction), 혹은 참/거짓 여부를 알 수 없는 문장인지(Neutral)를 판별하는 모델을 만드는 것이 목적입니다. 

 

 

RoBERTa와 KoELECTRA 모델을 사용했고 최종 5위를 할 수 있었습니다. 

한국어 문장에 대한 다양한 전처리를 시도했고, 앙상블을 통해서 성능을 높일 수 있었습니다.

 

자세한 모델링 과정은 다음 데이콘에서 작성한 코드공유에서 확인할 수 있습니다!

 

https://dacon.io/competitions/official/235875/codeshare/4596?page=3&dtype=recent 

 

[Private 6th/0.89555]RoBERTa+KoELECTRA+Backtrans

한국어 문장 관계 분류 경진대회

dacon.io