Нет сомнений, что искусственный интеллект — одна из самых замечательных технологий нашего времени. Модели и приложения искусственного интеллекта, разработанные гигантскими технологическими компаниями, уже используются во многих различных областях. Более того, эта технология продолжает развиваться колоссальными темпами. Последним и наиболее ярким продуктом этой ослепительной разработки стала новая модель искусственного интеллекта, разработанная OpenAI: Sora. В отличие от предыдущих моделей и приложений ИИ, Sora преобразует письменный текст в видео. Реалистичность видеороликов, созданных с помощью новой модели искусственного интеллекта, находится на таком уровне, что может вызвать как волнение, так и удивление. Давайте рассмотрим ответы на такие вопросы, как, например, что представляет собой модель искусственного интеллекта Sora и как она используется.
Искусственный интеллект, который сегодня считается одной из важнейших технологий, уже используется во многих областях.
Однако сектор искусственного интеллекта продолжает развиваться невероятными темпами. Последним и самым удивительным примером развития в этой области является модель искусственного интеллекта под названием Sora.
Что такое Сора?
Sora — это модель искусственного интеллекта, разработанная компанией OpenAI, одним из лидеров в области искусственного интеллекта и создателем ChatGPT . Некоторые приложения искусственного интеллекта, появившиеся на сегодняшний день, способны преобразовывать письменные тексты в реалистичные фотографии, рисунки или проекты. Но Сора служит в гораздо более удивительной области!
Sora — это модель искусственного интеллекта, которая превращает написанный текст в видео.
Другими словами, Sora создает видеоролики на основе письменной информации и команд, предоставленных пользователями. Например, видео ниже было создано из письменного текста, который включал простое предложение и простые детали ландшафта, например, несколько гигантских мамонтов, идущих по заснеженной равнине:
Подсказка: «Несколько гигантских мохнатых мамонтов приближаются, шагая по заснеженному лугу, их длинная мохнатая шерсть слегка развевается на ветру, когда они идут, вдалеке видны покрытые снегом деревья и впечатляющие снежные вершины гор, полуденный свет с тонкими облаками и высоко вдалеке солнце… pic.twitter.com/Um5CWI18nS
Новая модель может создавать подробные и сложные сцены с несколькими персонажами, определенными типами движений и фонами.
Например, с помощью новой модели искусственного интеллекта можно создавать видеоролики с людьми, идущими и бегущими по живому городу, реалистичными сооружениями, растениями и животными, погодными явлениями и многими другими деталями. Видеоролики, созданные с помощью Sora, также могут включать различные движения камеры и ракурсы для усиления повествования, а также технические детали для усиления драматического эффекта. Это значит, что пользователи могут создавать видеоролики, которые выглядят как кино, с помощью всего лишь нескольких предложений команд.
Подсказка: «Стильная женщина идет по улице Токио, заполненной теплым неоновым светом и анимированными городскими вывесками. На ней черная кожаная куртка, длинное красное платье и черные ботинки, а в руках черная сумочка. На ней солнцезащитные очки и красная помада. Она идет уверенно и непринужденно.… pic.twitter.com/cjIdgYFaWq
OpenAI описывает принцип работы Sora так: « Мы учим ИИ понимать и моделировать физический мир в движении».
Таким образом, Sora не только понимает команды пользователей. Он также понимает, как вещи, описанные в письменном тексте, будут существовать, действовать и выглядеть в реальном, физическом мире. Сора может чрезвычайно успешно воспринимать команды и, таким образом, реалистично отражать эмоции персонажей.
Визуальное качество и уровень реалистичности видеороликов, созданных с помощью Sora, просто удивляют.
Настолько, что некоторые авторы, пишущие о технологиях, описывают свои первые впечатления от Sora как «пугающие».
На данный момент с помощью модели ИИ можно создавать только одноминутные видеоролики.
Однако с точки зрения реалистичности и точности выполнения команд пользователя он вполне успешен. В этой связи утверждается, что Сора мог бы стать пионером начала новой эры во многих областях, особенно в искусстве.
Тот факт, что Sora позволяет с такой легкостью создавать реалистичные видеоролики, также делает его опасным инструментом.
В связи с этим компания объявила, что приняла ряд мер против неправомерного использования новой модели искусственного интеллекта. Например, разрабатываются некоторые инструменты, которые могут определить, когда видео было создано Сорой. Также сообщается, что на первом этапе Сора будет тестироваться только определенными специалистами.
Как мы уже упоминали выше, все, что вам нужно сделать для создания реалистичных видеороликов с помощью Sora, — это изложить свои мысли в письменной форме. Однако пока эта модель доступна не всем. Новая модель искусственного интеллекта тестируется некоторыми специалистами в рамках мер безопасности. Согласно заявлению OpenAI, в дальнейшем он станет доступен в первую очередь людям, работающим в сфере изобразительного искусства, таким как кинематографисты и дизайнеры.
OpenAI также сообщает, что у Sora есть некоторые слабые стороны
Компания заявила, что модель, преобразующая текст в видео, может сбивать с толку некоторые запросы или испытывать трудности с имитацией физической реальности сложной сцены. Компания отмечает, что « человек может откусить печенье, но после этого на нем не останется никаких следов от укуса ». приводит пример. С другой стороны, утверждается, что модель может также искажать пространственные детали.