OpenAI выпустила генератор изображений ChatGPT Images 2.0 — The Verge
Компания OpenAI приступила к внедрению обновленной версии своего визуального инструмента ChatGPT Images 2, который обрёл революционную способность «мыслить».
Об этом пишет The Verge.
Теперь модель может использовать веб-поиск для более глубокого анализа запроса, что позволяет создавать серии изображений с высокой точностью и детализацией.
Главной особенностью обновления стала возможность генератора анализировать структуру будущего изображения перед началом работы.
Это позволяет модели лучше следовать сложным инструкциям, сохранять специфические детали и значительно качественнее воспроизводить текстовые надписи непосредственно на изображениях.
Функции интеллектуального анализа в настоящее время доступны для подписчиков уровней Plus, Pro, Business и Enterprise.
В этом режиме ChatGPT Images 2 может самостоятельно искать информацию в интернете для визуализации конкретных концепций или создавать пояснительные схемы на основе файлов, загруженных пользователем.
В режиме «мышления» система способна генерировать до восьми изображений одновременно, строго придерживаясь единой стилистики.
Это открывает новые возможности для авторов комиксов и дизайнеров, поскольку модель научилась сохранять идентичность персонажей и объектов в разных сценах.
В то же время базовые обновления стали доступны для более широкого круга пользователей сервиса.
Генератор существенно улучшил навыки передачи ключевых черт лиц на фотографиях, а также получил специализированные настройки для работы с пиксель-артом, мангой и сложными кинематографическими композициями.
Технические характеристики обновленной версии предусматривают поддержку разрешения до 2K.
Кроме того, разработчики расширили перечень доступных форматов — теперь пользователи могут создавать изображения от панорамных (3:1) до узких вертикальных (1:3).
Особое внимание OpenAI уделила мультиязычной поддержке текстовых надписей внутри генераций. Помимо традиционно качественного английского, модель теперь значительно лучше воспроизводит японский, корейский, китайский языки, а также хинди и бенгальский.
Эксперты рынка считают, что интеграция веб-поиска непосредственно в процесс создания визуального контента является значительным шагом вперед.
Это позволяет ИИ не просто фантазировать, а опираться на реальные факты и актуальные визуальные данные при выполнении запросов пользователя.
ИИ-стартап Безоса привлечет $10 млрд в рамках инвестиционного раунда
Напомним, Apple под давлением Трампа удалила приложения для отслеживания агентов ICE.
Компания Apple может на следующей неделе представить новую доступную версию MacBook. Инсайдеры сообщают о восьми технических ограничениях модели и прогнозируют ее вероятную стоимость для украинских покупателей.