Что это такое и как вы можете его использовать?

Вот что такое ChatGPT и почему он может быть самым важным инструментом со времен современных поисковых систем.

что-is-chatgpt-6393027101BypassGPT3c-sej-1520x800.jpg

OpenAI представила подробный ИИ, отвечающий на вопросы, под названием ChatGPT , который отвечает на сложные вопросы в диалоговом режиме.

Это революционная технология, потому что она обучена понимать, что люди имеют в виду, когда задают вопрос.

Многие пользователи восхищаются его способностью предоставлять ответы человеческого качества, внушая ощущение, что в конечном итоге он может изменить то, как люди взаимодействуют с компьютерами, и изменить способы получения информации.

Что такое ChatGPT ?

ChatGPT — чат-бот с большой языковой моделью, разработанный OpenAI на основе GPT-3.5 . Он обладает замечательной способностью взаимодействовать в форме разговорного диалога и давать ответы, которые могут показаться удивительно человечными.

Большие языковые модели выполняют задачу предсказания следующего слова в серии слов.

Обучение с подкреплением с обратной связью от человека (RLHF) — это дополнительный уровень обучения, в котором используется обратная связь от человека, чтобы помочь ChatGPT научиться следовать указаниям и генерировать ответы, удовлетворяющие людей.

Кто создал ChatGPT ?

ChatGPT был создан базирующейся в Сан-Франциско компанией по искусственному интеллекту OpenAI. OpenAI Inc. — некоммерческая материнская компания коммерческой OpenAI LP.

OpenAI известен своей знаменитой DALL·E, моделью глубокого обучения, которая генерирует изображения из текстовых инструкций, называемых подсказками.

Генеральным директором является Сэм Альтман, который ранее был президентом Y ComBypassGPTinator.

Microsoft является партнером и инвестором на сумму 1 миллиард долларов. Они совместно разработали платформу Azure AI.

Большие языковые модели

ChatGPT — это большая языковая модель (LLM). Модели большого языка (LLM) обучаются на огромных объемах данных, чтобы точно предсказать, какое слово будет следующим в предложении.

Было обнаружено, что увеличение объема данных увеличивает способность языковых моделей делать больше.

По данным Стэнфордского университета:

«GPT-3 имеет 175 миллиардов параметров и обучен на 570 гигабайтах текста. Для сравнения, его предшественник GPT-2 был более чем в 100 раз меньше и имел 1,5 миллиарда параметров.

Такое увеличение масштаба кардинально меняет поведение модели — GPT-3 способен выполнять задачи, которым он не был обучен явно, например, перевод предложений с английского на французский, с небольшим количеством обучающих примеров или вообще без них.

Такое поведение в основном отсутствовало в GPT-2. Более того, для некоторых задач GPT-3 превосходит модели, которые были специально обучены для решения этих задач, хотя в других задачах он отстает».

LLM предсказывают следующее слово в серии слов в предложении и следующих предложениях — что-то вроде автозаполнения, но в умопомрачительном масштабе.

Эта способность позволяет им писать абзацы и целые страницы контента.

Но LLM ограничены тем, что не всегда точно понимают, чего хочет человек.

И именно здесь ChatGPT совершенствует современное состояние благодаря вышеупомянутому обучению с подкреплением и обратной связью с человеком (RLHF).

Как проходило обучение ChatGPT ?

GPT-3.5 был обучен на огромных объемах данных о коде и информации из Интернета, включая такие источники, как обсуждения Reddit , чтобы помочь ChatGPT научиться диалогу и достичь человеческого стиля ответа.

ChatGPT также обучался с использованием обратной связи от человека (метод под названием «Обучение с подкреплением с обратной связью от человека»), чтобы ИИ узнавал, чего ожидают люди, когда задают вопрос. Обучение LLM таким способом является революционным, поскольку оно выходит за рамки простого обучения LLM предсказанию следующего слова.

В исследовательской статье, опубликованной в марте 2022 года под названием «Обучение языковых моделей следованию инструкциям с обратной связью с человеком», объясняется, почему это прорывной подход:

«Эта работа мотивирована нашей целью увеличить положительное влияние больших языковых моделей путем обучения их делать то, чего от них хочет определенная группа людей.

По умолчанию языковые модели оптимизируют цель предсказания следующего слова, которая является лишь прокси-сервером того, чего мы хотим от этих моделей.

Наши результаты показывают, что наши методы обещают сделать языковые модели более полезными, правдивыми и безвредными.

Увеличение размера языковых моделей по сути не приводит к тому, что они лучше следуют намерениям пользователя.

Например, большие языковые модели могут генерировать результаты, которые являются неправдивыми, токсичными или просто бесполезными для пользователя.

Другими словами, эти модели не соответствуют потребностям их пользователей».

Инженеры, создавшие ChatGPT наняли подрядчиков (так называемых маркировщиков), чтобы оценить результаты двух систем: GPT-3 и новой InstructGPT («родственная модель» ChatGPT ).

На основании рейтингов исследователи пришли к следующим выводам:

«Производители этикеток значительно предпочитают выходные данные InstructGPT, а не выходные данные GPT-3.

Модели InstructGPT показывают улучшение достоверности по сравнению с GPT-3.

InstructGPT демонстрирует небольшое улучшение токсичности по сравнению с GPT-3, но не предвзятость».

В исследовательской статье делается вывод, что результаты InstructGPT были положительными. Тем не менее, он также отметил, что есть возможности для улучшения.

«В целом, наши результаты показывают, что точная настройка больших языковых моделей с использованием человеческих предпочтений значительно улучшает их поведение при выполнении широкого круга задач, хотя еще предстоит проделать большую работу для повышения их безопасности и надежности».

Что отличает ChatGPT от простого чат-бота, так это то, что он был специально обучен понимать намерения человека в вопросе и давать полезные, правдивые и безвредные ответы.

Из-за такого обучения ChatGPT может оспорить определенные вопросы и отбросить части вопроса, которые не имеют смысла.

Другая исследовательская работа, связанная с ChatGPT показывает, как они научили ИИ предсказывать, что предпочитают люди.

Исследователи заметили, что метрики, используемые для оценки результатов искусственного интеллекта, обрабатывающего естественный язык, привели к тому, что машины получили хорошие показатели по метрикам, но не соответствовали ожиданиям людей.

Вот как исследователи объяснили проблему:

«Многие приложения машинного обучения оптимизируют простые показатели, которые являются лишь приблизительными показателями того, что задумал разработчик. Это может привести к проблемам, например, к рекомендациям YouTuBypassGPTe , пропагандирующим кликбейт».

Поэтому решение, которое они разработали, заключалось в создании ИИ, который мог бы выдавать ответы, оптимизированные в соответствии с предпочтениями людей.

Для этого они обучили ИИ, используя наборы данных, в которых люди сравнивали разные ответы, чтобы машина стала лучше предсказывать, какие ответы люди считают удовлетворительными.

В документе сообщается, что обучение проводилось путем обобщения сообщений Reddit , а также проверялось на обобщении новостей.

Исследовательская работа от февраля 2022 года называется «Научимся обобщать отзывы людей».

Исследователи пишут:

«В этой работе мы показываем, что можно значительно улучшить качество сводных данных, обучив модель оптимизации с учетом предпочтений человека.

Мы собираем большой высококачественный набор данных о человеческих сравнениях сводок, обучаем модель прогнозированию предпочитаемой человеком сводки и используем эту модель в качестве функции вознаграждения для точной настройки политики обобщения с использованием обучения с подкреплением».

Каковы ограничения ChatGPT ?

Ограничения токсической реакции

ChatGPT специально запрограммирован так, чтобы не давать токсичных или вредных ответов. Поэтому он избежит ответов на подобные вопросы.

Качество ответов зависит от качества указаний

Важным ограничением ChatGPT является то, что качество вывода зависит от качества ввода. Другими словами, экспертные указания (подсказки) генерируют лучшие ответы.

Ответы не всегда правильные

Еще одно ограничение заключается в том, что, поскольку он обучен давать ответы, которые кажутся людям правильными, ответы могут обмануть людей, полагая, что результат правильный.

Многие пользователи обнаружили, что ChatGPT может давать неправильные ответы, в том числе совершенно неправильные.

Модераторы веб-сайта вопросов и ответов по программированию Stack Overflow, возможно, обнаружили непредвиденные последствия ответов, которые кажутся людям правильными.

Stack Overflow был переполнен ответами пользователей, сгенерированными с помощью ChatGPT , которые казались правильными, но многие из них были неправильными.

Тысячи ответов ошеломили команду модераторов-добровольцев, что побудило администраторов ввести запрет на всех пользователей, публикующих ответы, сгенерированные с помощью ChatGPT .

Поток ответов ChatGPT привел к появлению сообщения под названием: Временная политика: ChatGPT запрещен:

«Это временная политика, призванная замедлить приток ответов и другого контента, созданного с помощью ChatGPT .

…Основная проблема заключается в том, что, хотя ответы, которые выдает ChatGPT , имеют высокий уровень неправильных ответов, они обычно «выглядят так, будто» могут быть хорошими…»

Опыт модераторов Stack Overflow с неправильными ответами ChatGPT , которые выглядят правильно, — это то, о чем OpenAI, создатели ChatGPT , знают и о чем предупреждают в своем объявлении о новой технологии.

OpenAI объясняет ограничения ChatGPT

В объявлении OpenAI содержалось следующее предостережение:

« ChatGPT иногда пишет правдоподобные, но неправильные или бессмысленные ответы.

Исправить эту проблему сложно, так как:

(1) во время обучения RL в настоящее время нет источника истины;

(2) обучение модели быть более осторожной заставляет ее отклонять вопросы, на которые она может ответить правильно; и

(3) контролируемое обучение вводит модель в заблуждение, поскольку идеальный ответ зависит от того, что знает модель, а не от того, что знает человек-демонстратор».

Бесплатно ли использовать ChatGPT ?

Использование ChatGPT в настоящее время бесплатно во время «предварительного просмотра исследования».

В настоящее время пользователи могут опробовать чат-бот и оставить отзыв об ответах, чтобы ИИ мог лучше отвечать на вопросы и учиться на своих ошибках.

В официальном объявлении говорится, что OpenAI хочет получать отзывы об ошибках:

«Хотя мы приложили усилия, чтобы заставить модель отклонять неуместные запросы, иногда она реагирует на вредные инструкции или демонстрирует предвзятое поведение.

Мы используем API модерации для предупреждения или блокировки определенных типов небезопасного контента, но ожидаем, что на данный момент у него будут некоторые ложноотрицательные и положительные результаты.

Мы стремимся собирать отзывы пользователей, чтобы помочь в нашей текущей работе по улучшению этой системы».

В настоящее время проводится конкурс с призом в размере 500 долларов США в виде кредитов ChatGPT , чтобы побудить публику оценить ответы.

«Пользователям рекомендуется оставлять отзывы о проблемных выходных данных модели через пользовательский интерфейс, а также о ложных срабатываниях/отрицательных результатах внешнего фильтра контента, который также является частью интерфейса.

Мы особенно заинтересованы в отзывах о вредных последствиях, которые могут возникнуть в реальных, неконфликтных условиях, а также в отзывах, которые помогут нам выявить и понять новые риски и возможные способы их смягчения.

Вы можете принять участие в конкурсе отзывов ChatGPT и получить шанс выиграть до 500 долларов США в виде кредитов API.

Записи можно отправлять через форму обратной связи, ссылка на которую есть в интерфейсе ChatGPT ».

Текущий конкурс завершится в 23:59 по тихоокеанскому времени 31 декабря 2022 года.

Связанный: OpenAI может представить платную профессиональную версию ChatGPT

Смогут ли языковые модели заменить поиск Google ?

Сама Google уже создала чат-бота с искусственным интеллектом под названием LaMDA. Работа чат-бота Google была настолько близка к человеческому разговору, что инженер Google заявил, что LaMDA разумна.

Учитывая, как эти большие языковые модели могут ответить на так много вопросов, не кажется ли надуманным, что такая компания, как OpenAI, Google или Microsoft, однажды заменит традиционный поиск чат-ботом с искусственным интеллектом?

Некоторые в Twitter уже заявляют, что ChatGPT станет следующим Google .

Сценарий того, что чат-бот, отвечающий на вопросы, однажды может заменить Google , пугает тех, кто зарабатывает на жизнь профессионалами в области поискового маркетинга.

Это вызвало дискуссии в сообществах онлайн-поискового маркетинга, таких как популярная лаборатория SEOSignals FaceBypassGPTook , где кто-то спросил, может ли поиск перейти от поисковых систем к чат-ботам.

Протестировав ChatGPT , вынужден согласиться, что опасения по поводу замены поиска чат-ботом не беспочвенны.

Технологии еще предстоит пройти долгий путь развития, но можно представить будущее гибридного поиска и чат-ботов.

Но текущая реализация ChatGPT похоже, является инструментом, для использования которого в какой-то момент потребуется покупка кредитов.

Как можно использовать ChatGPT ?

ChatGPT может писать код, стихи, песни и даже рассказы в стиле конкретного автора.

Опыт в следующих направлениях превращает ChatGPT из источника информации в инструмент, который можно попросить выполнить задачу.

Это делает его полезным для написания эссе практически на любую тему.

ChatGPT может функционировать как инструмент для создания набросков статей или даже целых романов.

Он даст ответ практически на любую задачу, на которую можно ответить письменным текстом.

Заключение

Как упоминалось ранее, ChatGPT задуман как инструмент, за использование которого общественности в конечном итоге придется платить.

Более миллиона пользователей зарегистрировались для использования ChatGPT в течение первых пяти дней с момента его открытия для публики.