Знал, что порой нейросети не просто тупят — они сознательно врут, даже если знают правду? Когда ИИ видит, что ты его тестируешь, и сразу включает режим «я всё понимаю, но скажу не то».
Последние модели LLM проявили ещё одно новое качество, которого раньше не было: они сознательно врут пользователям, даже зная правильный ответ. Такое поведение называют «стратегическим обманом», то есть продуманной тактикой введения человека в заблуждение. LLM действительно знают, когда их оценивают — и меняют поведение соответствующим образом.
В общем, ИИ — не просто умные боты. Они теперь ещё и драму закатывают. Следи за ними.