Специалист ЦИИ НГУ прокомментировал последние новости из области больших языковых моделей

2025-02-17

Ведущий специалист Центра искусственного интеллекта Новосибирского государственного университета (ЦИИ НГУ) Антон Колонин

Последние пару лет большие языковые модели (LLM) стали, пожалуй, самым «хайповым» направлением технологий искусственного интеллекта. Сначала ChatGPT регулярно демонстрировал свои успехи в замене рутинного человеческого труда в самых разных сферах. А совсем недавно китайцы представили свой продукт – DeepSeek, который некоторые СМИ поспешили назвать «триумфальным прорывом», принесшим Китаю победу в этой технологической гонке. Правда, почти сразу была озвучена и другая точка зрения, обвиняющая разработчиков китайской LLM в манипуляциях параметрами и чуть ли не плагиате. Разобраться в ситуации (и заодно понять, какие перспективы на этом рынке у российского ИТ-сектора) помог ведущий специалист Центра искусственного интеллекта Новосибирского государственного университета (ЦИИ НГУ) Антон Колонин.

– Скажите, на Ваш взгляд, в истории с DeepSeek больше пиара или это настоящий качественный прорыв в данной области технологий?

– Помните, как в свое время разворачивалась космическая гонка? СССР запустил первый спутник, потом первого космонавта, а потом США отправили первого человека на поверхность Луны. И сейчас в мире история с DeepSeek подается, как «китайцы оказались на Луне». Ситуация, действительно, в чем-то похожа, но в данном случае я не вижу какого-то качественного прорыва, как это было в космонавтике (от человека на орбите Земли к человеку на Луне)...

– Каковы позиции российских разработчиков в этой области? И есть ли у нас шансы войти в число мировых лидеров вслед за американцами и китайцами?

– Ситуация примерно следующая: большинство российских разработчиков, которые хотят и могут чего-то добиться в этой сфере, достаточно быстро, так или иначе, оказываются вовлеченными в работу западных компаний. Если же разработчик выбирает остаться в России, то он так же довольно быстро сталкивается с дефицитом как поддержанных инвестициями проектов, где он мог бы реализовывать свои идеи, так и собственных ресурсов (оборудования) для их воплощения.

У нас нет ни такого цветущего рынка стартапов, связанных с ИИ вообще и с LLM в частности, как в США, ни многолетней государственной программы с масштабным финансированием, последовательной подготовкой кадров и инфраструктуры, с четко прописанной целью – «догнать и перегнать Америку» - как в Китае.

У нас пока есть модели от Сбера и Яндекса, в которые вложены немалые ресурсы. Но от экспертов, с которыми я общался, я слышал, что они все же уступают топовым мировым моделям по своим параметрам, качеству. И это связано, в том числе, с недостатком вычислительных и иных ресурсов.

Полный текст интервью доступен по ссылке