Викликала фурор. OpenAI показала ШІ, здатний перетворювати текстову підказку на мегареалістичне відео

OpenAI презентувала модель Sora, яка здатна генерувати відеоролики на основі текстових підказок. Ця модель ще потребує допрацювань, але вже викликає захват користувачів в соцмережах.

Sora, як заявляють в OpenAI, здатна створювати детальні відео з деталізованими сценами, складними рухами камери та кількома персонажами за допомогою лише простих текстових підказок. Також можна продовжувати відео, що вже існують, та генерувати анімовані сцени на основі нерухомого зображення. Наразі підтримується генерація роликів тривалістю до 60 секунд.

В OpenAI кажуть, що вивчають потенційні зловживання з Sora перед тим, як зробити її доступною широкому загалу. Поки вона доступна лише фахівцях з кібербезпеки.

«Ми вживемо кількох важливих заходів безпеки, перш ніж зробити Sora доступною в продуктах OpenAI. Ми працюємо з „червоними“ командами — експертами в галузі в таких сферах, як дезінформація, вміст, що пропагує ненависть і упередженість, — які тестують модель», — повідомляє OpenAI.

Модель спричинила фурор в X (Twitter), де на додаток до прикладів, опублікованих на сторінках OpenAI, гендиректор компанії Сем Альтман запостив сім роликів, згенерованих за текстовими підказками користувачів соцмережі. Зокрема, так було створено відео про качку-дракона, подорож дронів на Марсі й золотистих ретриверів, які записують подкаст на вершині гори.

Хоча результати, яких досягає Sora, вражають, OpenAI визнає, що модель ще далека від досконалості. Приміром, компанія каже, що їй важко точно моделювати фізику складної сцени. Вона може сплутати просторові деталі заданої підказки, змішуючи ліві та праві сторони, та причини й наслідки.

«Наприклад, людина може відкусити печиво, але після цього на печиві може не залишитися сліду від укусу», — кажуть в OpenAI.

Читайте також:

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *