본문 바로가기

성지채널 바로가기

의역해결1

완벽해지려 하는 구글의 자연어 처리 (NLP) 대학교 4학년 때, 졸업프로젝트라는 걸 다들 해본 적 있을 것이다. 당시에 많은 팀들이 챗봇을 만들겠다면서 도전을 했다. 하지만 다들 1프로 부족했다. 그이유는 한글에 대한 자연어처리에 실패했기 때문이었다. 자연어 처리를 하는 많은 서비스가 있지만 한국어를 처리하는 건 대부분 부족했다. 보통 NLP 알고리즘은 단어의 순서, 구문 구조가 큰 영향을 미친다. 즉 단어의 순서가 하나만 바껴도 의미가 달라진다는 말이다. 한국어와 영어는 굉장히 다른 구조를 가지고 있기 때문에 이를 처리하는게 어려웠다. 이러한 문제를 드디어 !!! 구글이 해결했다고 하는 소식이다. 구글은 기존 알고리즘의 약점이 '의역'에 있다는 것을 파악하고 이를 극복할 수 있는 데이터 셋을 공개했다. 구글에서 새롭게 내놓은 기계학습 모델은 분류.. 2019. 12. 1.

이전 1 다음

티스토리툴바