Question 1

Что такое Kling Lip Sync?

Accepted Answer

Kling Lip Sync (AI Avatar) — это AI-модель от Kuaishou, которая создаёт видео с говорящим аватаром. Вы загружаете портретное фото и аудиозапись, а AI генерирует реалистичное видео с синхронизированными движениями губ, мимикой и естественными жестами.

Question 2

Какие аудио форматы поддерживаются?

Accepted Answer

Поддерживаются форматы MP3, WAV, AAC и OGG. Максимальный размер файла — 10 МБ, максимальная длительность — 15 секунд. Для лучшего результата рекомендуем чёткую, разборчивую речь без фонового шума.

Question 3

Какая максимальная длительность видео?

Accepted Answer

Длительность видео определяется длительностью загруженного аудио, максимум 15 секунд. Минимальная длительность — около 3 секунд. Вы не выбираете длительность отдельно, она автоматически соответствует аудиодорожке.

Question 4

Какие требования к фотографии?

Accepted Answer

Минимальное разрешение — 300×300 пикселей. Лучше всего подходят портретные фото в анфас с чётко видимым лицом. Рекомендуется одно лицо на изображении. Поддерживаются форматы JPEG, PNG и WebP.

Question 5

Чем отличается Standard от Pro?

Accepted Answer

Standard версия генерирует видео в разрешении 720p и стоит 10 кредитов/секунду. Pro версия — 1080p и стоит 20 кредитов/секунду. Pro также обеспечивает более детализированную мимику и лучшее качество рендеринга.

Question 6

Как рассчитывается стоимость?

Accepted Answer

Стоимость зависит от длительности аудио и выбранной версии. Standard: 10 кредитов/сек (минимум 30). Pro: 20 кредитов/сек (минимум 60). Например, 10-секундное видео в Standard обойдётся в 100 кредитов, а в Pro — в 200 кредитов.

Kling Lip Sync AI-аватар

Kling Lip Sync AI-аватар