top of page
교묘 테이블 정렬

한국어 일본어 언어쌍 
학습 코퍼스

기계학습 알고리즘을 이용한 문장 단위 학습 데이터
인공신경망 번역기 학습을 위한 단어 분리 가공 데이터

SentencePiece, Word2Vec, Glove, fastText, subword-nmt

학습 코퍼스: 가격 목록

​소프트

200만 문장

Annotation
sentence-aligned
tokenised
(mecab, mecab-ko)

뉴스

200만 문장

Annotation
sentence-aligned
tokenised
(mecab, mecab-ko)

여행

100만 문장

Annotation
sentence-aligned
tokenised
(mecab, mecab-ko)

나무에 꽃

한국어 영어 중국어 언어쌍 
학습 코퍼스

기계학습 알고리즘을 이용한 문장 단위 학습 데이터
인공신경망 번역기 학습을 위한 단어 분리 가공 데이터

SentencePiece, Word2Vec, Glove, fastText, subword-nmt

학습 코퍼스: 가격 목록

한영
Soft

110만 문장

Annotation
sentence-aligned
tokenised
(NLTK, mecab-ko)

한영
Travel

74만 문장

Annotation
sentence-aligned
tokenised
(NLTK, mecab-ko)

한중

Soft

78만 문장

Annotation
sentence-aligned
tokenised
(Jieba, mecab-ko)

한중
Travel

74만 문장

Annotation
sentence-aligned
tokenised
(Jieba, mecab-ko)

노트북 & 커피

영어 중국어 일본어 언어쌍 
학습 코퍼스

기계학습 알고리즘을 이용한 문장 단위 학습 데이터
인공신경망 번역기 학습을 위한 단어 분리 가공 데이터

SentencePiece, Word2Vec, Glove, fastText, subword-nmt

학습 코퍼스: 가격 목록

영일
Soft

270만 문장

Annotation
sentence-aligned
tokenised
(NLTK, mecab)

​영일

Travel

95만 문장

Annotation
sentence-aligned
tokenised
(NLTK, mecab)

중일
Soft

140만 문장

Annotation
sentence-aligned
tokenised
(Jieba, mecab)

중일
Travel

93만 문장

Annotation
sentence-aligned
tokenised
(Jieba, mecab)

bottom of page