글소리 (Speech2Text) 음성합성시스템
기본 음성 모델
기본 음성 모델 구조도
✓ 언어 특징(linguistic feature)을 각 화자들의 음성 임베딩과 합성하여 학습
DeepVoice2 와 Fast2speech2 모델 구조 적용
DeepVoice2 모델 구조도
fast2speech2 모델 구조도
✓ Tacotron계열과는 다른 non-Autoregressive TTS 모델 구조를 가진 fast2speech2 모델 적용
✓ fast2speech2 모델 적용으로 학습과 추론이 다른 모델에 비해 빠르며 높은 품질의 음성 제공
✓ 각 Parameter를 통해 음의 빠르기, 고음화, 저음화, 음의 강조 등을 조정 가능