
Последние пару лет большие языковые модели (LLM) стали, пожалуй, самым «хайповым» направлением технологий искусственного интеллекта. Сначала ChatGPT регулярно демонстрировал свои успехи в замене рутинного человеческого труда в самых разных сферах. А совсем недавно китайцы представили свой продукт – DeepSeek, который некоторые СМИ поспешили назвать «триумфальным прорывом», принесшим Китаю победу в этой технологической гонке. Правда, почти сразу была озвучена и другая точка зрения, обвиняющая разработчиков китайской LLM в манипуляциях параметрами и чуть ли не плагиате. Разобраться в ситуации (и заодно понять, какие перспективы на этом рынке у российского ИТ-сектора) помог ведущий специалист Центра искусственного интеллекта Новосибирского государственного университета (ЦИИ НГУ) Антон Колонин.
– Скажите, на Ваш взгляд, в истории с DeepSeek больше пиара или это настоящий качественный прорыв в данной области технологий?
– Помните, как в свое время разворачивалась космическая гонка? СССР запустил первый спутник, потом первого космонавта, а потом США отправили первого человека на поверхность Луны. И сейчас в мире история с DeepSeek подается, как «китайцы оказались на Луне». Ситуация, действительно, в чем-то похожа, но в данном случае я не вижу какого-то качественного прорыва, как это было в космонавтике (от человека на орбите Земли к человеку на Луне)...
– Каковы позиции российских разработчиков в этой области? И есть ли у нас шансы войти в число мировых лидеров вслед за американцами и китайцами?
– Ситуация примерно следующая: большинство российских разработчиков, которые хотят и могут чего-то добиться в этой сфере, достаточно быстро, так или иначе, оказываются вовлеченными в работу западных компаний. Если же разработчик выбирает остаться в России, то он так же довольно быстро сталкивается с дефицитом как поддержанных инвестициями проектов, где он мог бы реализовывать свои идеи, так и собственных ресурсов (оборудования) для их воплощения.
У нас нет ни такого цветущего рынка стартапов, связанных с ИИ вообще и с LLM в частности, как в США, ни многолетней государственной программы с масштабным финансированием, последовательной подготовкой кадров и инфраструктуры, с четко прописанной целью – «догнать и перегнать Америку» - как в Китае.
У нас пока есть модели от Сбера и Яндекса, в которые вложены немалые ресурсы. Но от экспертов, с которыми я общался, я слышал, что они все же уступают топовым мировым моделям по своим параметрам, качеству. И это связано, в том числе, с недостатком вычислительных и иных ресурсов.