ByteDance представя Seeduplex гласов модел

ByteDance пусна своя най-нов модел за генериране на глас, Seeduplex, насочен към подобрения в синтеза на реч и взаимодействието в реално време.

Моделът се фокусира върху предоставянето на по-естествен разговорен изход, с подобрения в контрола на тона, емоционалното изразяване и многоезичните възможности. Той е предназначен за приложения като виртуални асистенти, създаване на съдържание и автоматизация на обслужването на клиенти.

Seeduplex поддържа реакция с ниска латентност и може да генерира реч в множество стилове, което го прави подходящ за интерактивни системи с изкуствен интелект. ByteDance има за цел да интегрира модела в своята по-широка AI екосистема, включително платформи за съдържание и корпоративни услуги.

0 (2).png

Изданието идва на фона на нарастващата конкуренция в гласовите технологии, генерирани от AI, където компаниите се фокусират върху реализма и скалируемостта. Играчите в индустрията също проучват интеграцията с мултимодални системи, комбинирайки глас, текст и видео генериране.

ByteDance не разкри конкретни планове за комерсиализация, но посочи, че моделът постепенно ще бъде разгърнат в своите платформи.

Източник: AIOrang

Source link

Like this:

Like Loading…

Нашия източник е Българо-Китайска Търговско-промишлена палaта

By admin