Разворот OpenAI: обучение GPT-4 НЕ на данных клиентов API

изменение-политики-конфиденциальности-openai-6457d3fd3d25f-sej-760x400.png

В значительном отходе от прежних практик, OpenAI объявила, что больше не будет использовать данные клиентов, отправленные через ее API, для обучения своих масштабных языковых моделей, таких как GPT-4.

Изменение было подтверждено Сэмом Альтманом, генеральным директором OpenAI, в недавнем интервью с CNBC.

Новый подход OpenAI к данным пользователей

Политика OpenAI была введена 1 марта 2023 года, когда компания незаметно обновила свои условия обслуживания, чтобы отразить это новое обязательство к конфиденциальности пользователей.

Альтман уточнил: «Ясно, что клиенты не хотят, чтобы мы тренировались на их данных, поэтому мы изменили наши планы: мы не будем этого делать».

API, или интерфейсы прикладного программирования, являются технологическими фреймворками, которые позволяют клиентам подключаться непосредственно к программному обеспечению OpenAI.

Альтман заявил, что OpenAI уже "некоторое время" не использует данные API для обучения модели, что указывает на то, что этот официальный анонс формализует существующую практику.

Влияние на деловых клиентов

Ход OpenAI имеет далекоидущие последствия, особенно для его корпоративных клиентов, среди которых такие гиганты, как Microsoft, Salesforce и Snapchat.

Эти компании скорее всего будут использовать возможности API OpenAI для своей деятельности, поэтому сдвиг в области конфиденциальности и защиты данных особенно важен для них.

Однако новые меры по защите данных применяются исключительно к клиентам, использующим услуги компании API. В обновленных условиях использования OpenAI отмечается: "Мы можем использовать контент из служб, отличных от нашего API".

Таким образом, другие формы ввода данных, такие как текст, введенный в популярный чатбот ChatGPT, все еще могут использоваться OpenAI, если данные не передаются через API.

Более широкое воздействие на индустрию

Смена политики OpenAI происходит в то время, когда отрасли борются с потенциальными последствиями использования больших языковых моделей, таких как ChatGPT от OpenAI, которые заменяют материал, традиционно созданный людьми.

Например, Гильдия сценаристов Америки недавно начала забастовку после того, как переговоры между Гильдией и киностудиями потерпели неудачу. Гильдия выступала за ограничения на использование ChatGPT от OpenAI для создания или переписывания сценариев.

Решение OpenAI не использовать данные клиентов для обучения является переломным моментом в текущем обсуждении о конфиденциальности данных и искусственном интеллекте. Поскольку компании продолжают исследовать и расширять границы технологии ИИ, обеспечение конфиденциальности пользователей и поддержание доверия, вероятно, останутся центральными в этих дискуссиях.

Эволюция ChatGPT: от GPT-3 до GPT-4

Важно отметить, что обязательство OpenAI не использовать данные клиентов для обучения применяется к новейшей языковой модели GPT-4, выпущенной 14 марта 2023 года.

GPT-4 добавил несколько улучшений по сравнению со своим предшественником, GPT-3, включая значительное увеличение лимита на количество слов (25 000 по сравнению с 3 000 словами, предусмотренными для ChatGPT), более широкий окно контекста и улучшенные возможности рассуждения и понимания.

Еще одной значительной особенностью GPT-4 является его многомодальность, то есть способность понимать и делать выводы изображений, помимо текста. Эта последняя модель генерирует тексты, более похожие на человеческие, используя такие функции, как эмодзи, для более персонализированного ощущения.

Однако точные размеры и архитектура GPT-4 пока не разглашаются, что вызывает догадки о деталях модели.

Несмотря на эти слухи, генеральный директор OpenAI отрицает конкретные утверждения о размере модели.

Што касаецца продукцыйнасці, GPT-4 паказвае сiлы у генерацыі тэксту, але таксама мае некаторыя абмежаванні. Напрыклад, ён набраў 54-ое месцаю ў першым пяцідзесяцi на апісанай эстанцыі выхоўных даследаванняў (GRE) па пісьме і атрымаў адсоткі ў дыяпазоне 43-59 нацыляў на экзамене па дэрагавай дыферэнцыяльнай лічбе (AP Calculus BC).

Кроме того, он проявлял хорошие результаты на простых задачах для кодирования Leetcode, но его производительность снижалась с увеличением сложности задачи.

В то время как конкретные детали процесса обучения GPT-4 официально не задокументированы, известно, что модели GPT обычно включают в себя обширное машинное обучение с использованием разнообразного текста из интернета.

Взгляд вперед

В результате изменений политики использования данных OpenAI, данные, используемые для обучения его языковых моделей, не включают информацию, передаваемую через API, если пользователи не согласились явно предоставить ее для этой цели.

В то время как эта технология совершенствуется и играет все более значительную роль в нашей жизни, интересно, как компании изменяют свое направление и отвечают на вопросы о сохранении конфиденциальности данных и завоевании доверия людей.

OpenAI возвращает: обучение GPT-4 по данным клиентов API не производится

Новый подход OpenAI к данным пользователей

Влияние на деловых клиентов

Более широкое воздействие на индустрию

Эволюция ChatGPT: от GPT-3 до GPT-4

Взгляд вперед

Связанные статьи