НЕЙРОННІ МЕРЕЖІ ДЛЯ РОЗРОБКИ СИСТЕМИ КОНВЕРТАЦІЇ ГОЛОСУ

D. Yu. Yatsyna

D. Yu. Yatsyna

Ключові слова: вокодер з лінійним предикатом, пакетне вейвлет-перетворення, нейронна мережа радіально-базисних функцій та нейронна мережа загальної регресії, метод головних компонент

Анотація

Система конвертації голосу формулює функцію конвертації специфічних характеристик початкового голосу до відповідних характеристик цільового голосу. В цій статті використовуються такі характеристики голосу: форма вокального тракту, форма збуджувального сигналу (імпульс голосової щілини) та просодичні характеристики (енергія, висота тону). Проведено порівняння функцій конвертації реалізованих за допомогою нейронної мережі радіально-базисних функцій та нейронної мережі загальної регресії. Реалізовано новий метод виявлення аномальних значень в наборі даних.

Завантаження

Дані про завантаження поки що недоступні.

Посилання

1. A.N. Chadha, A comparative performance of various speech analysis-synthesis techniques / A.N. Chadha, J.H. Nirmal, P. Kachare // Int. J. Signal Process. Syst. 2 (1) (2014)
17–22.
2. J. Nirmal, Voice conversion using General Regression Neural Network, Applied Soft Computing / J. Nirmal, M. Zaveri, S. Patnaik, P. Kachare. 2014.
3. W. Kain Spectral voice conversion for text-to- speech synthesis / W. Kain, M. Macon // In: Proceeding of International Conference on Acoustics, Speech, and Signal Processing, vol. 1, IEEE, 1998, pp. 285–288.
4. K.S. Rao, Voice conversion by mapping the speakerspecific features using pitch synchronous approach / K.S. Rao // Comput. Speech Lang. 24 (3) (2010). 474–494.
5. S. Desai Spectral mapping using artificial neural networks for voice conversion/ S. Desai, A.W. Black, B. Yegnanarayana, K. Prahallad // IEEE Trans. Audio Speech Lang.Process. 18 (5) (2010) 954–964.
6. Sushant V. Rao Novel Pre-processing using Outlier Removal in Voice Conversion/ Sushant V. Rao, Nirmesh J. Shah, Hemant A. Patil, 2016.
7. S.H. Mohammadi, Voice Conversion Using Deep Neural Networks With Speaker-Independent Pre-training,/ S.H. Mohammadi, A. Kain, 2014.
8. S.H. Mohammadi Transmutative Voice Conversion / S.H. Mohammadi, A. Kain 2013.
9. Holmes, J.N. Speech synthesis and recognition/John Holmes and Wendy Holmes.—2 nd ed, 2001.
10. Набір голосових даних [Електронний ресурс]. – Режим доступу: festvox.org/cmu_arctic.
11. E. Helander. On the impact ofalignment on voice conversion performance / E. Helander, H Silén, M Gabbouj, 2008.
12. T.H. Park Introduction To Digital Signal Processing / T.H. Park, 2010.
13. S. Haykin Neural networks and learning machines / Simon Haykin. – 3rd ed.
14. M. Bishop Neural Networks for Pattern Recognition / M. Bishop. 1995.
15. A. Amrouche. Efficient System for Speech Recognition using General Regression Neural Network / A. Amrouche, J.M. Rouvaen, 2008.
16. Приклади конвертації [Електронний ресурс]. – Режим доступу: https://drive.google.com/open?id=0BwP19oqytjEZVh0Vl9jOEpnaGM.
17. S. Mondal. Clustering based voiced-unvoicedsilence detection in speech using temporal and spectral parameters/ S. Mondal, A. D. Barman, 2015.