Языковая модель KazLLM новые возможности для бизнеса и науки
В Казахстане завершена работа над обучением языковой модели KazLLM, созданной на базе 148 миллиардов токенов. Эта модель поддерживает казахский, русский, английский и турецкий языки. Разработка осуществлена специалистами Института умных систем и искусственного интеллекта (ISSAI) при Назарбаев Университете, при поддержке Министерства цифрового развития, инноваций и аэрокосмической промышленности Республики Казахстан (МЦРИАП РК) и Министерства науки и высшего образования (МНВО РК).
Модель станет доступной широкому кругу пользователей, включая научные организации, стартапы и крупные компании. Следуя инициативе Главы государства, KazLLM положит начало масштабному проекту TurkLLM, направленному на развитие технологий обработки естественного языка в тюркоязычных странах. Соглашение о сотрудничестве в рамках проекта было заключено на саммите Организации тюркских государств.
KazLLM стала важным шагом в создании национальной инфраструктуры искусственного интеллекта, укрепив позиции Казахстана как технологического лидера региона. Проект не только способствовал разработке высокотехнологичного продукта, но и дал импульс развитию кадрового потенциала в области искусственного интеллекта.
Реализация модели стала возможной благодаря сотрудничеству с такими организациями, как Тил Казына, АО «НИТ», Maqsut Narikbayev University и другими.
Министр Жаслан Мадиев подчеркнул, что запуск KazLLM с открытым исходным кодом является важным этапом в развитии ИИ-экосистемы Казахстана. Это решение способствует технологическому прогрессу и делает цифровые услуги более доступными для населения.
Модель была обучена на двух вариантах: с 8 миллиардами и 70 миллиардами параметров. Эти версии превосходят аналоги по точности и станут основой для создания новых ИИ-продуктов.
На первом этапе KazLLM будет предоставлена в открытом доступе, что позволит разработчикам и стартапам использовать модель для создания инновационных решений. Подготовлена подробная документация, облегчающая интеграцию модели в проекты.
Директор ISSAI Хусейн Атакан Варол отметил, что KazLLM построена на архитектуре Meta Llama и оптимизирована для работы как на мощных серверах, так и на обычных ноутбуках.
Ключевыми партнёрами стали Beeline Казахстан и его IT-компания QazCode. Они предоставили серверы DGX H100, которые значительно ускорили процесс обучения. Для сравнения: обработка большого массива данных, занимающая несколько дней на обычном компьютере, на этих серверах осуществляется за считанные секунды.
По словам CEO QazCode Алексея Шаравара, разработка KazLLM заняла 50 дней вычислений и включала адаптацию под особенности казахского языка. Результаты тестирования подтвердили эффективность модели в решении технических и культурных задач.
KazLLM открывает широкие возможности для бизнеса, науки и общества. Модель может использоваться для создания чат-ботов, систем клиентской поддержки, автоматизации документооборота и анализа данных. Она поможет банкам ускорить обработку запросов, ритейлу — улучшить клиентский опыт, а образовательным учреждениям — разработать приложения для изучения казахского языка. Медиа-индустрия сможет генерировать качественные тексты, улучшать переводы и автоматизировать контент.
Этот проект является важным шагом в развитии цифровых технологий Казахстана и способствует интеграции казахского языка в современное цифровое пространство.