Технология уже доступна для тестирования.
Генеративная модель от Сбербанка создает высокодетализированные (до 4К) изображения по текстовому описанию. Основная ее фишка – распознавание «естественного языка». Помимо этого, технология умеет соединять несколько рисунков, сочетать текстовое описание и заданное изображение, дополнять недостающие фрагменты и формировать изображения в режиме бесконечного полотна.
Уже сейчас технология распознает команды на 101 языке, работает как минимум в 4 стилях (включая аниме) и понимает сложносоставные запросы. Технология основана на предшественнике, который прошел обучение на одной миллиарде пар «картинка-текст» и отдельно созданном датасете из 2 миллиона пар качественных изображений, сложных для понимания нейросети (в частности, лиц людей, текстов, рук).
Опробовать «Кандинского» можно через телеграм-бота.
Что вы думаете насчет отечественных разработок? Есть ли у них потенциал или Midjourney убежал слишком далеко? Пишите в комментариях!
Напоминаем, что за прошедшие это уже второй запуск технологии для генерации изображений по текстовому описанию от отечественных разработчиков – накануне бета-версию своего инструмента «Шедеврум» запустил Яндекс.
Источник: pr-cy.ru