От х:

Днес в x:

Изкуственият интелект на DeepMind проговори с човешки глас и звучи човешки

DeepMind е самостоятелен отдел на Google, който работи в областта на ИИ. Именно тази компания създаде AlphaGo - системата, победила световния шампион по Го - корееца Ли  Седол. 

DeepMind не се занимава само с логически игри. В момента специалистите на компанията работят върху компютърна система за генериране на човешка реч. Използва се слаб ИИ, който според експертите може кардинално да подобри ситуацията с изкуствено синтезираната реч.

Компютрите и сега генерират човешка реч, като най-често се използват фрагменти от речта на реален човек, които образуват по-сложни отрязъци, или се използват най-разнообразни математически модели за генериране на звукови фрази. Но нито един от тези методи не е особено добър, понеже хората веднага забелязват изкуствените гласове и проблемите с интонацията и произношението.

WaveNet използва достойнствата и на двата метода. В новия модел също се използват фрагменти от реални човешки гласове, от които самообучаващи се невронни мрежи формират звуковите фрази. Но на тази система може да се подаде информация за лингвистичните и фонетични правила.

Резултатите са впечатляващи. Изкуственият глас звучи някак си човешки. При тестовете с доброволци, 50% от хората са сметнали, че гласът на машината всъщност е човешки.

Във WaveNet вече са записани над 44 часа човешка реч, а думите, звуците и фразите са на 109 различни хора. Оказа се, че WaveNet перфектно моделира гласа на всеки участник в експеримента и дори вмъква специфичното поемане на дъх и говорните дефекти на конкретния човек.

Източник: kaldata.com

Facebook коментари

Коментари в сайта

Още новини

Последни новини