antony_w (antony_w) wrote,
antony_w
antony_w

Categories:

ИИ от IBM генерирует «человеческую» речь после пяти минут обучения



Обучение действительно качественных моделей преобразования текста в речь сейчас требует мощного железа. Специалисты IBM разработали экономичный метод синтеза речи. Алгоритм изучает различные аспекты голоса и адаптируется к речевым стилям на небольшом объеме данных.


Недавние успехи глубокого обучения существенно улучшили системы преобразования текста в речь (TTS) благодаря более эффективному изучению голоса и речевых стилей говорящих и генерированию более естественной исходящей речи, пишут исследователи в блоге. И все же, чтобы создавать такую качественную речь, большинству систем TTS требуются большие и сложные нейросети, которые непросто обучать и которые не могут синтезировать речь в реальном времени — даже при наличии мощных графических процессоров.

Решить эту проблему, команда из IBM разработала новый метод синтеза искусственной речи, основанный на модульной архитектуре, пишет VentureBeat.

Созданная ими система состоит из трех взаимосвязанных частей: предсказателя просодии, предсказателя акустических характеристик и нейронного вокодера. Первый элемент изучает длительность, высоту звуков и энергию образцов речи, чтобы лучше передать стиль речи говорящего. Второй элемент создает репрезентации голоса говорящего, а третий генерирует образцы речи исходя из акустических характеристик.

Все элементы работают сообща над тем, чтобы искусственный голос как можно точнее походил на голос образца, и при этом используют небольшой объем данных.

Во время теста, когда добровольцев попросили послушать и оценить качество двух образцов речи (оригинального и синтезированного), они отметили высокое качество и схожесть голосов, на создание которых потребовалось всего пять минут речи.

Эта модель легла в основу нового сервиса преобразования текста в речь IBM Watson. Пример можно послушать по ссылке (в выпадающем меню нужно выбрать V3).

Tags: искусственный интеллект
Subscribe

Posts from This Journal “искусственный интеллект” Tag

promo antony_w august 17, 2014 11:48 18
Buy for 10 tokens
Есть блог, в котором написано много постов про роботов: ссылка И там есть несколько статей о замене рабочих мест человека роботами: Уже к 2018 году роботы отберут у человека часть профессий Рабский труд без зарплаты Армия роботов: зачем она нужна обильной людьми Поднебесной и кому может…
  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 2 comments