Проект по курсу "Современные методы распознавания и синтеза речи" (http://www.machinelearning.ru/wiki/index.php?title=Современные_методы_распознавания_и_синтеза_речи_(курс_лекций)/2018).
Идея проекта: создать эмбеддинг для голоса человека, чтобы для разных голосов можно было выделить разные кластера.
Нейросеть: архитектура нейросети arxiv.org/abs/1503.03832. Вместо двумерных свёрток были использованы одномерные.