Нейросеть будущего GPT-4 от OpenAI

Обзор GPT-4

14 марта 2023 года компания OpenAi представила GPT4 – мультимодальная большая языковая модель нового поколения.

Что такое GPT-4?

GPT-4 – разработка лаборатории OpenAI, которая создала нейросеть Dalle-2, генерирующая изображения, и чат бот ChatGPT, который больше, чем поисковик.

GPT-4 – это инструмент, который может выполнять полезные языковые задачи. Он может принимать и генерировать до 25000 слов, что примерно в 8 раз больше, чем ChatGPT.

Он понимает, что изображено на картинке, и может делать логические умозаключения. Например, если перерезать веревки, шарики улетят прочь.

GPT-4

Система все еще не идеальна и допускает ошибки, но над ними можно работать. Обучение GPT-4 закончилось в августе 2022 года. Было сделано множество ограничений, чтобы нельзя было использовать модель во вред, создавать нежелательный контент и чтобы модель не нарушала правила конфиденциальности.

GPT-4 может преподавать широкий спектр предметов и даже стать репетитором для пятиклассника. Отличный инструмент, чтобы донести знания до человека.

OpenAI уже сколлаборировалась с Microsoft, чтобы делать множество полезных вещей не только для компаний, но и обычных людей. Искусственный интеллект станет следующим шагом развития после изобретения транзистора, компьютера, интернета, полупроводниковой промышленности и всех языков программирования.

Система довольно ограничена, но уже показывает потрясающий результат, часть из которого мы разберем в этой статье.

Интерфейс GPT-4

На своем стриме сотрудники компании продемонстрировали, как работает демо-версия чат бота. На протяжении последних 2 лет модель разрабатывалась, оптимизировалась и проверялась в реальных сценариях.

Давайте пробежимся по интерфейсу чат-бота. Он не сильно отличается от того, что был в GPT 3.5, потому что построен на том же API.

Интерфейс GPT-4

В левой части располагается окно системных сообщений, где вы объясняете модели, что она должна делать. Количество распознаваемых инструкций было значительно увеличено.

Во втором окне, основном, вы можете вставлять все, что захотите, как пользователь. Первая задача, которую теперь выполняет GPT-4, но не смогла выполнить модель предыдущего поколения, GPT 3.5, – пересказать смысл всего вставленного огромного текста с каким-либо условием. Например, чтобы ответ был в виде одного предложения, каждые буквы которого начинаются на G.

Функционал GPT-4

Версия 3.5 просто отказывалась работать с таким массивом скопированных данных, а четвертая без проблем выдала ответ.

Как в GPT 4 комбинировать идеи между различными статьями и добавлять креатив?

Показали, как можно комбинировать идеи между различными статьями. Добавив в окно два материала – статья и новость и задав вопрос “Найди общее между первым и вторым” – модель отрабатывает и такое.

Причем если вас не устроит ответ вы можете так и написать, а GPT-4 начнет исправлять ответ, предлагая другой вариант. Удивительно то, что GPT-4 умеет даже превращать статьи в рифмованные стихотворения, и не на пару строчек, а с внушительным объемом.

Работа с GPT-4

Как создать в GPT-4 чат-бот для Discord?

Далее разработчик предложил создать бот для мессенджера Discord. Первое, что нужно сделать, расписать в системном окне, что вы хотите: Например, создай помощника по программированию ИИ.

При этом нужно написать псевдокод, а затем и сам код, чтобы разбить решение на составляющие, которые можно будет потом править.

Постановка задачи

Это важный момент. Не надо просить модель решить сложную задачу за один подход. А то будет мало места для маневра.

Затем в окно сообщений уже вставляется подсказка. Пусть модель создаст чат-бот Дискорд для чтения изображения и текста.

чат-бот Дискорд для чтения изображения и текста

Пока еще актуальной проблемой остается то, что база модели ограничена данными 2021 года. Поэтому в окно чата были вкратце добавлены подробности о том, как работать с изображениями, используя свежие API GPT-4 .

Далее модель начинает актуализировать данные, подпитываясь новой информацией. Несколько мгновений, и код бота написан.

Копируем и вставляем его в Jupyter – интерактивный блокнот, который работает с языком программирования Python, и проверяем.

Готовый код

И ничего не работает. У Дискорда обновился API, а чат-бот использовал версию 2020 года. Появилась ошибка. Не беда. Копируем текст ошибки и вставляем в чат-бот без каких либо дополнительных пояснений, и модель все корректирует.

Правка кода

И вот так раз за разом, копируя ошибки и вставляя в чат-бот, вы будете получать новые итерации кода, пока он не заработает. И он в нашем примере заработал.

Работа с изображениями

Сейчас компания работает над функцией предварительного просмотра изображений. Она еще недоступна для всех. Разрабатывается совместно с компанией Be My Eyes.

Добавив в Дискорд изображение, в данном случае скриншот окна этого же мессенджера, и попросив бота GPT-4 описать его в мельчайших деталях – модель с этим отлично справляется.

Описание изображения

В нескольких абзацах описывается, что это окно приложения Дискорд. Модель рассказывает, какие иконки видит, описывает интерфейс, перечисляет уведомления пользователей, находящихся на канале. Неплохо.

Но иногда картинка не распознается. Опять же вина всему неактуальность баз данных. Поэтому из рабочей документации Дискорд просто актуализируется информация банальным копипастом страницы и вставкой ее в код написанного ранее чат-бота. Далее просим разобраться с проблемой.

Картинка не распознана

Вообще длина переписки с моделью чат-бота GPT-4 ограничена 32000 токенов. То есть бесконечно корректировать код не получится. Но если вы талантливый разработчик или крутая компания, то вы всегда можете написать в OpenAi, попросив больше ресурсов.

Вы можете комбинировать изображение и вопрос. Например, что же смешного в картинке. ИИ объяснит вам, что белки едят орехи, а не пользуются камерами или ведут себя как люди.

Работа с изображением

Вот еще крутой эксперимент. В блокноте нарисован от руки макет веб-сайта для шуток. Фотографируем и отправляем в Дискорд с написанным чат-ботом и просим превратить макет в вебсайт с несколькими шутками.

Макет сайта

GPT-4 генерирует HTML код с изображения, вставляем его в редактор и получаем реальный веб-сайт с двумя шутками. Таким образом можно даже писать простенькие приложения.

Создание сайта

Создаем налогового консультанта на базе GPT-4

Еще один забавный пример работы модели – превращение чат-бота в налогового консультанта.

Описываем системную задачу и вставляем в окно сообщений налоговый кодекс, 16 страниц. После этого просим рассчитать налоговый вычет семейной пары, которая имеет определенный доход на определенный год.

Причем модель рассчитывает налог, исходя из кодекса со всеми законодательными нюансами и дает точный ответ.

Рассчитать налоговый вычет

Разумеется разработчики рекомендуют проверять данные у налоговой. Можно даже попросить модель расписать, как рассчитывается налоговый вычет, чтобы понять логику ее работы. И дополнять задачу различными уточнениями, то есть продолжать решать, но уже с контекстом.

Решение математической задачи с пояснениями конечно впечатляет. Можно даже попросить преобразовать ответ в стихотворение. Получается налоговая поэма.

Стихотворение

Вся сила GPT-4 в том, что это гибкий инструмент, которому все равно: писать код, разбираться с языком или налогами.

Пользуетесь ли вы чат-ботом ChatGPT и для каких задач – пишите в комментариях.

Все про систему Андроид
Добавить комментарий