Изкуственият интелект на DeepMind проговори с човешки глас и звучи човешки

10:30, 12 сеп 2016 г.
3,643
0
0
Вече сте гласувал/а!

DeepMind е самостоятелен отдел на Google, който работи в областта на ИИ. Именно тази компания създаде AlphaGo - системата, победила световния шампион по Го - корееца Ли Седол.

DeepMind не се занимава само с логически игри. В момента специалистите на компанията работят върху компютърна система за генериране на човешка реч. Използва се слаб ИИ, който според експертите може кардинално да подобри ситуацията с изкуствено синтезираната реч.

Компютрите и сега генерират човешка реч, като най-често се използват фрагменти от речта на реален човек, които образуват по-сложни отрязъци, или се използват най-разнообразни математически модели за генериране на звукови фрази. Но нито един от тези методи не е особено добър, понеже хората веднага забелязват изкуствените гласове и проблемите с интонацията и произношението.

WaveNet използва достойнствата и на двата метода. В новия модел също се използват фрагменти от реални човешки гласове, от които самообучаващи се невронни мрежи формират звуковите фрази. Но на тази система може да се подаде информация за лингвистичните и фонетични правила.

Резултатите са впечатляващи. Изкуственият глас звучи някак си човешки. При тестовете с доброволци, 50% от хората са сметнали, че гласът на машината всъщност е човешки.

Във WaveNet вече са записани над 44 часа човешка реч, а думите, звуците и фразите са на 109 различни хора. Оказа се, че WaveNet перфектно моделира гласа на всеки участник в експеримента и дори вмъква специфичното поемане на дъх и говорните дефекти на конкретния човек.

Източник: kaldata.com

От х:

Изкуственият интелект на DeepMind проговори с човешки глас и звучи човешки

Видеа по темата

Facebook коментари

Коментари в сайта

Докладване на коментар

Още новини от Технологии

Видеа по темата

Още новини

Препоръчано видео

Случаен виц

Последни обяви

Случайна рецепта

За Haskovo.NET

Главен редактор

Телефони

Последвай ни