Microsoft створила нову модель штучного інтелекту, здатну перетворювати фото на реалістичне відео

jour12 22 Квітня 2024 12:33

Компанія Microsoft презентувала нову модель штучного інтелекту, яка здатна на основі нерухомого зображення обличчя та аудіозапису розмови автоматично створювати реалістичне відео, на якому ця людина говорить.

Про це повідомляє CNN.

За допомогою цієї моделі ШІ, яка отримала назву VASA-1, на основі фотореалістичних облич, а також мультфільмів або художніх творів можна створювати відео з переконливою синхронізацією губ і природними рухами обличчя та голови.

Microsoft just released VASA-1

No SORA required.

Here are 10 crazy examples you don't want to miss.

1. Mona Lisa rapping Paparazzi pic.twitter.com/v4uiAnwwuM

— Lyle Kruger (@Lyle_AI) April 18, 2024

В одному з демонстраційних відео науковці показали, як вони анімували Мону Лізу, щоб вона читала комедійний реп у виконанні акторки Енн Хетеуей.

Microsoft заявила, що ця технологія може бути використана в освіті або для «покращення доступності для людей з проблемами спілкування», або потенційно для створення віртуальних компаньйонів для людей.

Однак водночас зростає занепокоєння з приводу того, що цим інструментом можуть зловживати та видавати себе за реальних людей. Дехто з експертів також занепокоєний тим, що ця технологія може ще більше підірвати творчі індустрії - від кіно до реклами.

Наразі Microsoft заявила, що не планує випускати модель VASA-1 у відкритий доступ.

«Ми виступаємо проти будь-якої поведінки, спрямованої на створення оманливого або шкідливого контенту про реальних людей», - заявили дослідники Microsoft, додавши, що компанія «не планує випускати» продукт публічно, «поки не буде впевнена, що технологія буде використовуватися відповідально і відповідно до належних правил".

Дослідники стверджують, що нова модель ШІ від Microsoft була навчена на численних відеозаписах облич людей під час розмови, і вона здатна розпізнавати природні рухи обличчя і голови, включаючи «рух губ, вираз обличчя, погляд очей і моргання».

Читайте також:

В Depositphotos запустять ШІ-генератор зображень, який дозволить мати ексклюзивні права на створені візуальні матеріали. Про це повідомили розробники.

Компанія xAI представила першу версію своєї моделі штучного інтелекту, Grok-1.5V, яка може обробляти не лише текст, а й візуальну інформацію, таку як документи, графіки, фотографії та скриншоти.

⚡️⚡️⚡️Увесь інсайд та актуальна інформація на нашому Телеграм-каналі, а також бонуси та швидкі новини.

WhatsApp та Telegram видалили через можливі зв’язки з іноземними спецслужбами. Єдина альтернатива Tchap сьогодні — найсекретніший месенджер Sends. Завантажити можна тут.

Завантажуй наш додаток