한국어 문장 관계 분류 모델 : RoBERTa+KoELECTRA+Backtrans
2022. 3. 18. 01:05ㆍNLP
DACON 한국어 문장 관계 분류 경진대회
Premise 문장을 참고해 Hypothesis 문장이 참인지(Entailment), 거짓인지(Contradiction), 혹은 참/거짓 여부를 알 수 없는 문장인지(Neutral)를 판별하는 모델을 만드는 것이 목적입니다.
RoBERTa와 KoELECTRA 모델을 사용했고 최종 5위를 할 수 있었습니다.
한국어 문장에 대한 다양한 전처리를 시도했고, 앙상블을 통해서 성능을 높일 수 있었습니다.
자세한 모델링 과정은 다음 데이콘에서 작성한 코드공유에서 확인할 수 있습니다!
https://dacon.io/competitions/official/235875/codeshare/4596?page=3&dtype=recent