OpenAI показала штучний інтелект Sora, який створює хвилинні майже реалістичні відео

Компанія з розробки штучного інтелекту OpenAI 15 лютого анонсувала Sora, нову модель, яка генерує відео високої чіткості тривалістю до однієї хвилини з текстових підказок.
Sora, що в перекладі з японської означає «небо», найближчим часом не стане доступною для широкого загалу. Натомість OpenAI робить її доступною для невеликої групи вчених і дослідників, які оцінять шкоду та потенціал його неправильного використання.
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024
«Sora здатна генерувати складні сцени з декількома персонажами, певними типами руху та точними деталями об’єкта та фону, — повідомляє компанія на своєму сайті. – Модель розуміє не тільки те, що запитав користувач, але й те, як ці речі існують у фізичному світі».
Prompt: “Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. the art style is 3d and realistic, with a focus on lighting and texture. the mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with… pic.twitter.com/aLMgJPI0y6
— OpenAI (@OpenAI) February 15, 2024
На одному з відео, згенерованих Sora, які оприлюднила OpenAI, зображено пару, яка гуляє засніженим містом Токіо, а пелюстки вишневого цвіту та сніжинки розвіваються навколо них. Інший показує реалістичних шерстистих мамонтів, які гуляють галявиною на фоні засніжених гірських хребтів.
Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024
OpenAI каже, що модель працює на основі глибокого розуміння мови, що дозволяє точно інтерпретувати текстові запити. Проте, як і всі генератори зображень і відео штучного інтелекту, Sora не є ідеальною та має артефакти. OpenAI також попереджає, що моделі може бути важко зрозуміти причинно-наслідкові зв’язки — наприклад, вона може створити відео людини, яка їсть печиво, але на печиві може не бути слідів укусів.
Нещодавно Федеральна комісія зі зв’язку (FCC) заявила, що буде контролювати роботизовані дзвінки з використанням голосів, згенерованих штучним інтелектом. Причиною став інцидент, що стався у січні, коли штучний голос президента США Джо Байдена телефоном закликав демократів Нью-Гемпширу пропустити праймеріз.
А компанія Google змінила назву чатбота зі штучним інтелектом – тепер Bard буде відомий під назвою Gemini.
⚡️⚡️⚡️ Увесь інсайд та актуальна інформація на нашому Телеграм-каналі, а також бонуси та швидкі новини.
