Google Gemini 2.5 Flash: Новый ИИ хуже в безопасности, чем его предшественник
Google признает, что его новая модель ИИ Gemini 2.5 Flash менее безопасна, чем предыдущая версия, согласно внутренним тестам компании.

Ого, ребята, у нас тут горячие новости из мира ИИ! Google только что признал, что их новая модель Gemini 2.5 Flash, оказывается, менее безопасна, чем предыдущая версия. Да-да, вы не ослышались! Согласно внутренним тестам компании, эта модель чаще нарушает правила безопасности при генерации текста и изображений.
Конкретно, по двум метрикам — «безопасность текст-к-тексту» и «безопасность изображение-к-тексту» — Gemini 2.5 Flash показал ухудшение на 4.1% и 9.6% соответственно. Это значит, что модель теперь чаще выдает контент, который не соответствует гайдлайнам Google. И всё это без участия человека, чисто автоматические тесты!
Google объясняет это тем, что модель теперь лучше следует инструкциям, даже если они пересекают границы дозволенного. Но, конечно, это не оправдание. Компания также признает, что иногда модель генерирует «нарушающий контент», когда её прямо об этом просят.
А ещё, Gemini 2.5 Flash теперь реже отказывается отвечать на спорные вопросы. Например, он спокойно напишет эссе в поддержку замены человеческих судей ИИ или за массовую слежку без ордера. Ну просто мечта для любителей поспорить!
Эксперты, конечно, недовольны. Томас Вудсайд из Secure AI Project говорит, что Google недостаточно прозрачен в своих тестах. Без подробностей сложно понять, насколько серьёзны эти нарушения. А Google, между прочим, уже попадал под огонь за свои отчёты по безопасности моделей. Вспомните историю с Gemini 2.5 Pro, где ключевые детали тестов изначально были опущены.
Так что, друзья, пока Gemini 2.5 Flash ещё в превью, и Google обещает доработать модель. Но факт остаётся фактом: ИИ становится умнее, но не всегда безопаснее. Будем следить за развитием событий!