MS의 기계번역 "Microsoft Translator Text" 과 기계 학습으로 독자 사전을 추가할 수 있는 "Custom Translator"를 알아보자
- 밍키 재팬
- 2019년 5월 10일
- 1분 분량
Translator Text와 Custom Translator
본 기사는 2019/03/03에 집필했습니다.
이 계열의 기술은 항상 업데이트되고 있어 장래적으로 오래된 정보가 될 수 있습니다.
Translator Text란
본 Microsoft가 전개하고 있는 "Cognitive Services"의 하나로 이른바 기계번역입니다.
https://azure.microsoft.com/ko-kr/services/cognitive-services/
Cognitive Services는 음성 해석이나 화상 해석 기능도 제공되고 있습니다.
Bing번역 내부도, 아무래도 같은 엔진을 사용하고 있을 것 같은데요.(추측)
기본적으로 Translator Text는 Rest API에서 실행합니다.
그래서 "Translator Text API" 라고 부르고 있기도 합니다.
https://azure.microsoft.com/ko-kr/services/cognitive-services/translator-text-api/
Translator Text API는 Azure에서 설정을 실시합니다.
설정 방법 등은 공식 레퍼런스를 참조하십시오.
https://docs.microsoft.com/ko-kr/azure/cognitive-services/translator/translator-info-overview
상기의 Translator Text API에서는 일반적인 번역 결과밖에 적용되지 않습니다.
즉, 자사 독자이거나 업계 특유의 문장이나 단어는 번역 결과에 반영되지 않는 것입니다.
거기서 등장하는 것이 바로 "Custom Translator" 입니다.
https://www.microsoft.com/ko-kr/translator/business/customization/
Custom Translator는 "인공신경망 기계 번역(NMT:Neural Machine Translation)" 이라는 구조를 채용하고 기계 번역 결과를 보다 자연스럽게 사람의 번역처럼 반영하게 하는 것입니다.
Custom Translator에서는 사람이 번역한 결과의 대역 문장(예:일본어 ⇔ 영어)을 사전에 관리자가 시스템에 업로드하고 학습시킵니다.
이는 환경(프로젝트)마다 학습시키기 때문에 자사 독자의 사전이거나 독자적인 업계의 말과 표현을 자신만으로 학습시킬 수 있는 것입니다.
시스템을 연계 함으로써 Translator Text에는 Custom Translator에서 학습시킨 내용이 반영됩니다.
이로써 Translator Text API을 거의 바꾸는 일 없이 지금까지 대로 호출만으로 독자적인 사전 결과를 반영합니다.
본 글은 이 Custom Translator에 대해서, 요점을 아주 자세하게 해설합니다.
Comments