글소리 (Speech2Text) 음성합성시스템

기본 음성 모델

기본 음성 모델 구조도

✓ 언어 특징(linguistic feature)을 각 화자들의 음성 임베딩과 합성하여 학습

DeepVoice2 와 Fast2speech2 모델 구조 적용

DeepVoice2 모델 구조도

fast2speech2 모델 구조도

✓ Tacotron계열과는 다른 non-Autoregressive TTS 모델 구조를 가진 fast2speech2 모델 적용

✓ fast2speech2 모델 적용으로 학습과 추론이 다른 모델에 비해 빠르며 높은 품질의 음성 제공

✓ 각 Parameter를 통해 음의 빠르기, 고음화, 저음화, 음의 강조 등을 조정 가능