한국어 문장 관계 분류 모델 : RoBERTa+KoELECTRA+Backtrans

한국어 문장 관계 분류 모델 : RoBERTa+KoELECTRA+Backtrans

2022. 3. 18. 01:05ㆍNLP

Premise 문장을 참고해 Hypothesis 문장이 참인지(Entailment), 거짓인지(Contradiction), 혹은 참/거짓 여부를 알 수 없는 문장인지(Neutral)를 판별하는 모델을 만드는 것이 목적입니다.

RoBERTa와 KoELECTRA 모델을 사용했고 최종 5위를 할 수 있었습니다.

한국어 문장에 대한 다양한 전처리를 시도했고, 앙상블을 통해서 성능을 높일 수 있었습니다.

자세한 모델링 과정은 다음 데이콘에서 작성한 코드공유에서 확인할 수 있습니다!

[Private 6th/0.89555]RoBERTa+KoELECTRA+Backtrans

한국어 문장 관계 분류 경진대회

dacon.io

BART 논문 리뷰 : Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translation, and Comprehension (0)	2022.08.26
RoBERTa 논문 리뷰 : A Robustly Optimized BERT Pretraining Approach (0)	2022.07.30
BERT 논문 리뷰 : Pre-training of Deep Bidirectional Transformers for Language Unders (0)	2022.02.11
Transformer 논문 리뷰 : Attention Is All You Need (0)	2022.02.02
Fasttext 논문 리뷰 : Enriching Word Vectors with Subword Information (0)	2022.01.22

Jihoo's data blog