OpenAI повышает ставки: новые модели ChatGPT теперь «видят» и анализируют изображения как профессионалы
OpenAI анонсировала две новые модели, o3 и o4-mini, которые значительно улучшают способности ChatGPT к интерпретации и анализу изображений, делая его конкурентом Google Gemini.

В мире, где каждый стартап ищет своё «серебряное ружьё» для привлечения инвестиций, OpenAI демонстрирует, что значит настоящий прорыв. Их новые модели, o3 и o4-mini, — это не просто апгрейд, это революция в области анализа изображений. Представьте себе искусственный интеллект, который не только понимает, что изображено на картинке, но и может манипулировать ею, обогащать детали и даже интегрировать визуальные данные в процесс мышления. Это как если бы ваш финансовый аналитик вдруг начал читать графики лучше, чем Уоррен Баффет.
Но, как и в любом хорошем стартапе, здесь есть подвох. Доступ к этим «умным» моделям ограничен платными подписчиками. Видимо, OpenAI решила, что лучше «недодать, чем перегреть» свои сервера. Хотя, если честно, кто может их винить? В конце концов, ROI на такие технологии должен быть соответствующим.
Среди практических применений — анализ рукописных заметок, диаграмм и даже реальных объектов. Это открывает двери для бесконечного количества use-case’ов, от образования до криминалистики. И да, теперь ChatGPT может составить конкуренцию Google Gemini в интерпретации реального мира. Вопрос только в том, кто окажется более «зрячим» в долгосрочной перспективе.