자연어처리_transformer의 강력함

2021. 4. 30. 20:06카테고리 없음

Attentio is All You Need Tutorial을 하다보니 궁금증이 생겼다.

독일어2영어 예제인데 독일어는 다른 언어대비 변칙이 적고 규칙적이고, 영어는 데이터가 독일어에 비해 훨씬 많다.

그렇다면 둘 중 누가 자연어 처리에 유용할 것인가.

 

처음엔 강사님한테 좋은 데이터와 많은 데이터 중 무엇을 선택하겠냐했더니 고민없이 좋은 데이터라 했고,

독일어와 영어에 대해 이야기했더니 자연어처리에서는 무조건 많은 데이터라고 했다.

과거(언어별로 자연어처리를 시도하던 시절)에는 독일어가 나을 수 있었겠지만

이제는그런 언어별 유불리를 무시할 만큼 transformer가 강력한 기술이란 거다.