США - Информационное агентство Эхбари
«Доказательство запугиванием»: ИИ уверенно решает «невозможные» математические задачи. Но сможет ли он убедить ведущих математиков?
В сложном мире математики, где точность имеет первостепенное значение, быстрое развитие искусственного интеллекта (ИИ) представляет собой новую и тревожную проблему. Современные модели ИИ, такие как 'o4-mini' от OpenAI, теперь способны генерировать сложные математические доказательства, которые выглядят поразительно убедительно, даже впечатляя ведущих математиков. Однако это достижение ставит фундаментальный вопрос: можем ли мы действительно доверять этим доказательствам, сгенерированным машиной, особенно когда они кажутся «правильными», но могут содержать тонкие недостатки или быть слишком сложными для человеческой проверки?
На секретной встрече в 2025 году собрались ведущие мировые математики, чтобы тщательно протестировать новейшую большую языковую модель OpenAI 'o4-mini'. Присутствовавшие эксперты были поражены поразительным сходством результатов модели с рассуждениями человека-математика при представлении сложного доказательства. Кен Оно, выдающийся профессор теории чисел Вирджинского университета, прокомментировал работу модели: «Я никогда раньше не видел такого рода рассуждений в моделях. Это то, что делает ученый».
Читайте также
- Смертельное ДТП с Tesla на автопилоте в Техасе
- Распродажа Target Circle Deal Days стартует 23 июня: Как получить максимум выгоды
- Распродажа Prime Day: Скидки до 43% на кухонные гаджеты Ninja и Breville
- Apple Выпустила iOS 27 Beta 2: Новые Функции Siri и Поддержка RCS
- Meta Приостановила Программу Отслеживания Сотрудников После Утечки Данных
Однако это первоначальное восхищение быстро сменилось растущей тревогой. Не получал ли ИИ больше похвалы, чем заслуживал? И не рискуем ли мы принять доказательства, полученные от ИИ, не до конца понимая их последствия? Сам профессор Оно признал, что модель может предоставлять уверенные, но, возможно, неверные ответы. «Если вы говорите что-то с достаточным авторитетом, люди просто пугаются», — отметил Оно. «Я думаю, что o4-mini овладел искусством доказательства запугиванием; он говорит все с такой уверенностью».
Исторически сложилось так, что уверенность и видимость убедительного аргумента были надежными показателями, поскольку только самые искусные математики могли строить убедительные аргументы, и их рассуждения, как правило, были надежными. Эта парадигма изменилась. Известный математик Терри Тао, лауреат Филдсовской премии из Калифорнийского университета в Лос-Анджелесе, подчеркнул возросшую способность ИИ имитировать правильность. «К сожалению, ИИ гораздо лучше умеет создавать видимость того, что у него есть правильный ответ, чем действительно его получать… правильно или неправильно; он всегда будет выглядеть убедительно», — пояснил Тао в интервью Live Science. «Если бы вы были ужасным математиком, вы бы также были ужасным математическим писателем и делали бы акцент на неправильных вещах. Но ИИ сломал этот сигнал».
Следовательно, математики все больше обеспокоены тем, что ИИ может наводнить область правдоподобными на вид доказательствами, содержащими тонкие ошибки, которые трудно обнаружить человеку. Профессор Тао предостерег от некритического принятия аргументов, сгенерированных ИИ, из-за их кажущейся строгости. «К сожалению, ИИ гораздо лучше умеет создавать видимость того, что у него есть правильный ответ, чем действительно его получать… правильно или неправильно; он всегда будет выглядеть убедительно», — повторил он. Он призвал к осторожному подходу к ИИ-«доказательствам», заявив: «Одна из вещей, которые мы узнали, используя ИИ, заключается в том, что если вы ставите перед ними цель, они будут чертовски хитрить, чтобы достичь этой цели».
Хотя вопрос о том, можем ли мы действительно «доказать» высокотехничные математические гипотезы, не понимая доказательств, может показаться абстрактным, его последствия весьма значительны. Если доказательству нельзя доверять, рушится основа для дальнейшего математического развития. Рассмотрим проблему P против NP, одну из главных нерешенных задач в вычислительной математике. По сути, она спрашивает, являются ли проблемы, решения которых легко проверить, также и легкими для решения. Окончательное доказательство могло бы революционизировать планирование, логистику, проектирование микросхем и открытие лекарств. И наоборот, проверяемое доказательство могло бы подорвать безопасность большинства современных криптографических систем. Это не абстрактные вопросы; они несут значительную реальную опасность.
Неспециалистам может показаться удивительным узнать, что математические доказательства, полученные человеком, всегда имели социальный аспект — процесс убеждения коллег в обоснованности аргумента. Доказательство обычно принимается, когда другие математики анализируют его и признают правильным. Это означает, что широкое признание не гарантирует неопровержимой истины. Эндрю Гранвилл, математик из Университета Монреаля, подозревает, что даже некоторые хорошо известные и тщательно изученные человеческие доказательства могут содержать ошибки. «Были некоторые известные статьи, которые оказались неверными из-за мелких лингвистических проблем», — отметил Гранвилл.
Ярким примером является доказательство Великой теоремы Ферма, найденное Эндрю Уайлсом. Теорема гласит, что хотя существуют целые числа, где сумма двух квадратов равна другому квадрату (например, 3² + 4² = 5²), не существует таких целых чисел для кубов или более высоких степеней. Уайлс семь лет работал в почти полном уединении, прежде чем представить свое доказательство в 1993 году. Объявление было встречено всеобщим ликованием, но в процессе рецензирования был обнаружен существенный недостаток. Уайлс потратил еще год на исправление проблемы, но в течение короткого времени мир считал, что проблема решена, хотя на самом деле это было не так.
Чтобы смягчить подобные ошибки — когда доказательства принимаются, несмотря на их некорректность — растет движение в сторону использования языков формальной верификации. Эти компьютерные программы, в частности 'Lean', требуют от математиков перевода доказательств в строго формализованный формат. Затем программное обеспечение тщательно проверяет каждый шаг, используя строгую математическую логику. Любое отклонение сигнализирует об ошибке, предотвращая принятие ошибочных аргументов. Эта закодированная формализация призвана устранить лингвистические неоднозначности, которые, по мнению профессора Гранвилла, исторически омрачали математические доказательства.
Похожие новости
- Состав «Аль-Ахли» на матч с «ЭНППИ»: Бен Шарки возглавит атаку
- Решение тренера «Замалека» повлияло на двух игроков перед матчем со «Смухой»
- Хорошие новости для фанатов «Ливерпуля» о Мохамеде Салахе перед «Челси»
- Бьянка Андрееску Уверенно Проходит Дальше на Турнире в Риме
- Ралли Дакар Саудовская Аравия 2027: рекордные дистанции и новые песчаные испытания
Кевин Баззард, математик из Имперского колледжа Лондона и ведущий сторонник формальной верификации, заявил: «Я начал заниматься этим делом, потому что беспокоился, что человеческие доказательства были неполными и неверными, и что мы, люди, плохо документировали свои аргументы».
Помимо проверки существующих человеческих доказательств, ИИ в сочетании с такими инструментами, как Lean, может стать преобразующим фактором. «Если мы заставим ИИ производить результаты на формально верифицированном языке, то это, в принципе, решит большую часть проблемы» генерации ИИ убедительных, но ошибочных доказательств, — прокомментировал профессор Тао. Он добавил: «Существуют статьи по математике, где никто не понимает всю статью целиком. Знаете, есть статья с 20 авторами, и каждый автор понимает свою часть. Никто не понимает всего. И это нормально. Так все и работает». Баззард согласился: «Хотелось бы думать, что, возможно, мы сможем получить...»
Информационное агентство Эхбари