OpenAI запускает программу сбора уникальных данных от сторонних организаций для обучения ИИ
OpenAI запустила программу Data Partnerships, которая направлена на сбор уникальных наборов данных от клиентов. Эти данные будут использоваться для обучения моделей искусственного интеллекта компании.
Инициатива OpenAI Data Partnerships нацелена на сбор частных и публичных данных, которые недоступны в интернете. Компания интересуют не только текстовые данные, но и изображения, аудио и видео.
OpenAI подчеркивает, что она ищет данные по любой тематике и на любом языке, при условии, что они отражают человеческие намерения. Ожидается, что эта информация, ориентированная на человека, поможет улучшить такие инструменты, как технология автоматического распознавания речи для точного расшифровывания произнесенных слов. Кроме того, она позволит усовершенствовать модель GPT-4 Turbo, чтобы она могла предоставлять пользователям более сложные и содержательные ответы.
OpenAI уже начала сотрудничать с заинтересованными организациями, включая правительство Исландии. Компания уже обучает модели лучше понимать запросы на исландском языке.
Для участия в программе необходимо заполнить форму на веб-сайте компании и предоставить информацию о типе и объеме данных. Это может быть архив с открытым исходным кодом, но материалы в нем станут общедоступными. Кроме того, OpenAI предлагает отправлять информацию через собственный канал, который будет нацелен на обучение "точно настроенных пользовательских моделей". Однако компания подчеркивает, что ей не требуются наборы данных, содержащие конфиденциальную или личную информацию.
Ранее OpenAI представила конструктор чат-ботов GPTs, который позволяет пользователям добавлять в ChatGPT специальные возможности, специфические знания и навыки.