Сбербанк представил свой ответ Midjourney

Автор Seo engines На чтение 1 мин Просмотров 57 Опубликовано 06.04.2023

Технология уже доступна для тестирования.

Генеративная модель от Сбербанка создает высокодетализированные (до 4К) изображения по текстовому описанию. Основная ее фишка – распознавание «естественного языка». Помимо этого, технология умеет соединять несколько рисунков, сочетать текстовое описание и заданное изображение, дополнять недостающие фрагменты и формировать изображения в режиме бесконечного полотна.

Уже сейчас технология распознает команды на 101 языке, работает как минимум в 4 стилях (включая аниме) и понимает сложносоставные запросы. Технология основана на предшественнике, который прошел обучение на одной миллиарде пар «картинка-текст» и отдельно созданном датасете из 2 миллиона пар качественных изображений, сложных для понимания нейросети (в частности, лиц людей, текстов, рук).

Опробовать «Кандинского» можно через телеграм-бота.

Что вы думаете насчет отечественных разработок? Есть ли у них потенциал или Midjourney убежал слишком далеко? Пишите в комментариях!

Напоминаем, что за прошедшие это уже второй запуск технологии для генерации изображений по текстовому описанию от отечественных разработчиков – накануне бета-версию своего инструмента «Шедеврум» запустил Яндекс.

Источник: pr-cy.ru