Открытый искусственный интеллект GPT-4 прибудет в середине марта 2023 года

gpt-4-640b66db8c60d-sej-1520x800.jpg

Главный технический директор Microsoft Germany, Андреас Браун, подтвердил, что GPT-4 выйдет в течение недели с 9 марта 2023 года и будет мультимодальным. Мультимодальный искусственный интеллект означает, что он сможет работать с различными типами ввода, такими как видео, изображения и звук.

Обновлено: GPT-4 выпущен 14 марта 2023 года

OpenAI выпустила GPT-4 14 марта 2023 года. Это многомодельная модель, которая принимает изображения и текстовые подсказки.

Модальность - это фраза, используемая в машинном обучении для обозначения форм ввода, таких как текст, но также и таких сенсоров, как звук, вид, запах и т.д.

Объявление OpenAI описывает масштаб прогресса GPT-4:

«... в то время как во многих реальных сценариях он менее способен, чем люди, он проявляет профессиональные и академические показатели на уровне человека.

Например, он проходит симулированный барменский экзамен с результатом, находящимся примерно в верхней десятой части испытуемых; в отличие от этого, результат GPT-3.5 составлял примерно нижнюю десятую часть.

Мы потратили 6 месяцев на итеративное выравнивание GPT-4, используя уроки, извлеченные из нашей программы адверсарного тестирования, а также ChatGPT. Это привело к нашим лучшим результатам на данный момент (хотя далеко от идеала) в отношении достоверности, управляемости и соблюдения рамок правил».

Мультимодальные модели больших языковых моделей

Главное, что можно вынести из этого объявления, состоит в том, что GPT-4 является мультимодальным (SEJ предсказал GPT-4 является мультимодальным в январе 2023 года).

Модальность - это ссылка на тип ввода, с которым (в данном случае) работает большая языковая модель.

Мультимодальность может включать текст, речь, изображения и видео.

GPT-3 и GPT-3.5 работают только в одном режиме - текстовом.

Согласно немецкому новостному сообщению, GPT-4 возможно сможет работать как минимум в четырех режимах: изображения, звук (аудио), текст и видео.

Доктор Андреас Браун, технический директор Microsoft Германия, сказал:

«На следующей неделе мы запустим GPT-4, где у нас будут мультимодельные модели, которые будут предлагать совершенно другие возможности - например, видео...»

Сообщение не содержало конкретики относительно GPT-4, поэтому не ясно, относится ли то, что было рассказано о мультимодальности, непосредственно к GPT-4 или это относится в общем.

Microsoft Director Business Strategy Holger Kenn объяснил понятие мультимодальности, но неясно, ссылался ли он на мультимодальность GPT-4 или мультимодальность вообще.

Я считаю, что его упоминания о мультимодальности были конкретно относительно GPT-4.

Новость поделилась:

«Кенн объяснил, о чем речь в мультимодальном искусственном интеллекте, который может переводить текст не только в соответствующие изображения, но и в музыку и видео.»

Ещё один интересный факт заключается в том, что Microsoft работает над "метриками уверенности" с целью обосновать своего искусственного интеллекта фактами для того, чтобы сделать его более надёжным.

Майкрософт Космос-1

Что-то, что, кажется, мало рассказывали в Соединенных Штатах, заключалось в том, что в начале марта 2023 года Microsoft выпустила многофункциональную языковую модель под названием Космос-1.

Согласно сообщениям немецкого новостного сайта Heise.de:

«...команда подвергла предварительно обученную модель различным тестам, с хорошими результатами в классификации изображений, ответах на вопросы о контенте изображений, автоматической маркировке изображений, оптическом распознавании текста и задачах генерации речи.

...Визуальное мышление, то есть делать выводы о изображениях, не используя язык как промежуточный шаг, кажется здесь ключевым...

Kosmos-1 - это мультимодальный модальный режим, который интегрирует модальности текста и изображений.

GPT-4 идет дальше, чем Космос-1, потому что добавляет третий тип данных - видео, и также, по всей видимости, включает аудио.

Работает на нескольких языках

Похоже, что GPT-4 работает на всех языках. Он описывается как способный получать вопрос на немецком и отвечать на итальянском.

Это довольно странный пример, потому что, кто задаст вопрос на немецком языке и захочет получить ответ на итальянском языке?

Это то, что было подтверждено:

«...технология достигла такого уровня, что она практически работает на всех языках: Вы можете задать вопрос на немецком и получить ответ на итальянском.

С помощью мультимодальности Microsoft(-OpenAI) 'сделает модели всесторонними'».

Я верю, что сутью прорыва является то, что модель преодолевает языковые барьеры с помощью своей способности доставать знания из разных языков. Таким образом, если ответ находится на итальянском языке, она сможет его распознать и предоставить ответ на том же языке, на котором был задан вопрос.

Таким образом, это будет похоже на цель многомодального искусственного интеллекта Google, называющегося MUM. Говорят, что MUM способна предоставлять ответы на английском языке на вопросы, данные для которых доступны только на другом языке, например, на японском.

Применение GPT-4

На данный момент нет официального объявления о том, где появится GPT-4. Однако была сделана специальная упоминка о Azure-OpenAI.

Google пытается догнать Microsoft, интегрируя конкурирующую технологию в свой поисковый движок. Это развитие еще более усугубляет восприятие того, что Google отстает и лишен лидерства в области искусственного интеллекта для потребителей.

Google уже интегрирует искусственный интеллект во множество продуктов, таких как Google Lens, Google Maps и другие области, с которыми пользователи взаимодействуют с Google. Этот подход заключается в использовании искусственного интеллекта как технологии-помощника, чтобы помогать людям в маленьких задачах.

Способ, которым Microsoft его реализует, более заметен, и следовательно это привлекает всю внимание и усиливает картину Google, как компании, которая борется и старается догнать.

Читайте официальное объявление об выпуске OpenAI GPT-4 здесь.

Читайте оригинальные немецкие материалы здесь:

ГПТ-4 придет на следующей неделе - и он будет мультимодальным, говорит Microsoft Germany

Связанные статьи

Показать больше >>

Раскройте возможности искусственного интеллекта с помощью HIX.AI!