В комментариях на старожилы уже начали уставать от потока новостей про нейросети, однако зрительский интерес к ним все еще не падает. «Нейронные сети могут полноценно генерировать голос, полностью копировать его и заставлять озвучивать различные странные вещи. Временно исполняющая обязанности генерального директора Русского музея — о запуске нейросети.
10 картин. Как Малевич «нарисовал» Барановичи
The models ruDALL-E Malevich (XL), ruDALL-E Kandinsky (XXL), ruCLIP Small, ruCLIP Large, and Super Resolution (Real ESRGAN) will also soon be available on DataHub. Тут вы увидите результаты работы нейросети ruDALL-E Malevich (XL). Нейросеть также способна восстановить недостающие элементы в кадре (оторванные куски бумаги, пятная и так далее). Результат генерации в нейросети Kandinsky 2.1 со стилями «Малевич», «киберпанк», «советский мультфильм» и «картина маслом». Вышел трейлер первого фильма, созданного с помощью нейросетей. «Малевич»: россиянам продемонстрировали нейросеть будущего.
Русский музей запустил нейросеть во «ВКонтакте»
На основе полученной информации происходит генерация изображения по словам. На следующем этапе ИИ сравнивает полученные версии картинок и выбирает ту, что больше всего соответствует исходным параметрам. Как воспользоваться нейросетью Искусственный интеллект доступен на сайте разработчиков без предварительной регистрации. Чтобы протестировать функциональность нейросети, нужно: Ввести фразу из слов в специальное поле. Выбрать стиль и разрешение. Отправить запрос. Среднее время рендера занимает 1—2 минуты. Получившуюся фотографию можно скачать или попросить ИИ обработать запрос повторно.
Инициативную разработку студенты ВоГУ собираются предложить Департаменту здравоохранения Вологодской области. Современный уровень машинной диагностики позволит более эффективно решать задачи региональной программы Вологодской области «Борьба с онкологическими заболеваниями» на 2019—2024 годы, в том числе разгрузить специалистов первичного звена», — отметил Георгий Рапаков. Одна из проблем, на решение которой направлено исследование, это позднее выявление рака легких. Метод распознавания рака легких, который применяют студенты ВоГУ — это традиционная обработка изображений нейросетью.
Материалы помогут воссоздать детали и раскрасить снимки более точно, в соответствии с действительностью. Мы уверены, что это поможет многим людям по-другому взглянуть на дорогие им снимки и сохранить их не только в памяти», — прокомментировал Дмитрий Меркушов, руководитель группы машинного обучения Mail.
Таким образом культура креативного копирования существовала всегда, однако именно цифровые инструменты сделали это явление массовым. Из серии «После Брейгеля», 2023 Изображение, созданное нейросетью Midjourney v 5. Например, Питер Брейгель за свою жизнь создал порядка пятидесяти работ, но у него была большая семья. Братья и сыновья художника еще при его жизни и с его согласия, а потом после смерти художника создали множество копий его картин. То, что мы называем историей искусства — это один оригинал и десятки, может быть, сотни копий. Тогда почему приходя в музей, вы этого не замечаете? Потому что в каком-то смысле музей это скрывает. Музей транслирует вам модернистское представление об истории искусства, помещая на свои стены художников, которые отличаются друг от друга: вот Рубенс, вот Веронезе, там Суриков, а тут Малевич. Но вы не видите их бесконечные копии. Тогда новый вопрос: а что тогда действительно нового в этой форме копирования, которую предоставляет нам ИИ. Конечно, вы можете управлять им по-разному: давать ему видео, чтобы получить новое видео, задать ему картинку или звук. Но на данный момент популярнее всего то, что называется text to image, то есть вы создаёте текстовый запрос и получаете картинку или анимацию. Дело в том, что в современном обществе почти все люди умеют писать и читать. А вот рисовать или делать хорошие фотографии — далеко не все. Мы могли бы представить какой-нибудь авангардный вариант, где пользователь бы использовал в качестве запроса музыку, а в ответ получал архитектуру. Но пока все работают с текстовыми запросами. Как я уже говорил, пользователи могут видеть, как другие набирают свои запросы в каналах Discord и воспроизводить их целиком или частями. Так учатся новые пользователи, так же учился и я. Разные части этого текста могут описывать разные части изображения, как, например, в художественной литературе мы видим описание внешности Анны Карениной или Мадам Бовари. Эти описания менее структурны и более свободны, чем те, что создаём мы. Наши больше похожи на программирование. Скажем, отдельно мы описываем желаемое освещение, отдельно мы даём референсы на интересных нам по стилю художников, отдельно пишем very detailed или epic composition, и таким образом мы можем разобрать изображение на части, как «лего», и эти части скопировать. Это и есть, главное, на мой взгляд отличие от предыдущих культур копирования, среди которых есть и история западного искусства. Отношения изображения и текста в синтетических медиа. По мотивам Ролана Барта Десятилетиями в гуманитарных науках считалось, что возможности описать изображение словами ограничены. Это было очень важным допущением, которое принималось по умолчанию современной культурой. В частности, модернистское искусство старалось всеми способами избавиться от текстовых нарративов, чтобы вместо них исследовать собственный визуальный язык. У Малевича, Кандинского и многих других модернистов есть картины, которые оставлены «Без названия». Untitled — это, наверное, самое распространённое название произведений современного искусства. Отказ от названия подразумевает отказ от семантики, от попытки навязать зрителю то, что он должен увидеть в произведении. Например, всеми нами любимый теоретик культуры Ролан Барт в 60-е годы прошлого века замечает, что подписи к газетным фотографиями фиксируют значение фотографии, чтобы ограничить её потенциальную двусмысленность. Что же происходит, когда люди начинают использовать инструменты, которые им даёт искусственный интеллект, синтетические медиа? А происходит, я бы сказал, нечто обратное. Я пишу свой запрос и получаю четыре подходящих под него картинки. Если мне не нравится, я могу сгенерировать еще и еще. То есть одно и то же описание дает жизнь бесконечному числу изображений. Еще важный момент — Midjourney или Stable diffusion обогащают вашу короткую фразу, усиливают, интенсифицируют, развивают её, привнося детали, атмосферу, ассоциации и настроения, которые вы не закладывали, которые вы даже не могли себе представить. Всё это переворачивает наше предположение, что текст ограничивает значение изображений, поскольку один и тот же текстовый запрос можно использовать для создания бесконечного числа изображений — каждый раз будет возникать новый визуальный мир. ИИ — это инструмент или соавтор?
Популярное
- Малевича заменили нейросетью
- Напрасный труд
- Выставка воссозданных с помощью нейросети Kandinsky картин открылась в Волгограде
- Другие материалы рубрики
- Новости партнеров
- Раздел для тех, кто новичок в теме изображений, создаваемых искусственных интеллектом
Новости партнеров
- [quiz] Угадай, кто нарисовал картину — Казимир Малевич или нейросеть
- Выставка воссозданных с помощью нейросети Kandinsky картин открылась в Волгограде
- запустила нейросеть для восстановления старых и черно-белых фотографий
- Нейросеть раскрыла тайну квадрата Малевича
- Малевича заменили нейросетью
- Другие материалы рубрики
Новости партнеров
- ⚡ «Малевич»: россиянам продемонстрировали нейросеть будущего
- Айвазовский
- Новости партнеров
- Русский музей запустил нейросеть во «ВКонтакте» | Digital | Новости |
- Telegram: Contact @rusmuseum
NVIDIA представила ИИ, который генерирует видео с высоким разрешением по текстовому описанию
Модель запоминает детали разговора и может строить ответы, основываясь на информации, которую ей уже сообщил пользователь. Работает с русским языком, но с английским справляется намного лучше. GPT-4 лучше учитывает контекст, умеет распознавать изображения, хорошо работает с русским языком и сдает сложные экзамены на уровне отличников. Однако разрыв между версиями становится очевидным по достижении определенного порога сложности задачи. Я попыталась проверить несколько ботов, на какой версии GPT они работают: спрашивала об этом в самом чате. Не врет! Модель не распознает контекст и создает менее креативный текст. Есть ли боты именно с ChatGPT.
Липецк в советской мультяшной прорисовке отображает классику застройки СССР — оживленные улицы, где разнотипные многоэтажки в окружении зелени соседствуют с небольшими зданиями. Липецк руки Айвазовского получился мрачный, несмотря на утреннюю зарю. Город больше напоминает глубинку дореволюционной России с бездорожьем, заснеженными деревьями и храмом на фоне небольших строений.
Нейронная сеть — это одно из направлений в работе с искусственным интеллектом. Ее устройство похоже на нервную систему человека. Технологию используют в разных сферах, чтобы прогнозировать, распознавать образы, анализировать данные и даже создавать контент. С нейросетями активно работают музыканты, дизайнеры и копирайтеры. Это простой способ получить картинку, векторную иллюстрацию, голос или музыку.
Нейросеть ruDALL-E Malevich генерирует картинки, лично нам они напоминают смазанные сны или сюрреалистичные картины, что, видимо, и подразумевалось при их создании. Технология дает и довольно близкие к реальности изображения нам с этим везло реже. Нейросеть-художник видит таким наш город через много лет. Как вам застройка? Есть ощущение, что через много лет у мусорных контейнеров будут колеса.
Для обучения нейросети использовались фотографии и видео из общего пользования. Ее получилось обучить восстанавливать и раскрашивать кадры близко к оригиналу. Стоит отметить, что ограничений по количеству загрузок на реставрацию снимков нет. Мы уверены, что это поможет многим людям по-другому взглянуть на дорогие им снимки и сохранить их не только в памяти», — прокомментировал руководитель группы машинного обучения Mail. Ранее при помощи подобной технологии испанские художник смогли восстановить утраченную картину Диего Веласкеса «Изгнание морисков».
⚡ «Малевич»: россиянам продемонстрировали нейросеть будущего
На днях открыл для себя нейросеть ruDALL-E. Что она делает: вы пишете некий текст, а нейросеть генерирует изображение. Мы протестировали нейросеть ruDALL-E Malevich и развлечения ради сделали запросы про будущее Архангельска: какой будет природа через много лет, до чего дойдет наука. Опробовать возможности нейросети можно бесплатно на официальной странице сервиса. Фото сгенерированы нейросетью «Шедеврум» по запросу «Петербургского дневника». Эти инструменты — Midjourney, Stable Diffusion, RunwayML — используют одну и ту же систему нейронной сети, обученной на огромном количестве изображений. На днях открыл для себя нейросеть ruDALL-E. Что она делает: вы пишете некий текст, а нейросеть генерирует изображение.
Малевича заменили нейросетью
Объединение достижений этих двух областей привело к появлению квантового машинного обучения. Одна из ветвей подобных исследований — это создание квантовой нейросети , в которой искусственный нейрон заменен кубитом. Мы уже рассказывали, как такую нейросеть научили довольно точно предсказывать свойства молекулы водорода. Сегодня ведется активная работа по адаптации известных методов обучения нейросетей для квантовых компьютеров и симуляторов.
С помощью такой квантовой нейросети российские физики решили несколько задач классификации в рамках глубокого машинного обучения с учителем. Из восьми кубитов квантового процессора, созданного в МФТИ, авторы использовали четыре. Нейросеть, построенная на их базе, состояла из нескольких слоев.
Входные данные кодировались как углы однокубитных операций, составляющих первый слой.
Сегодня ведется активная работа по адаптации известных методов обучения нейросетей для квантовых компьютеров и симуляторов. С помощью такой квантовой нейросети российские физики решили несколько задач классификации в рамках глубокого машинного обучения с учителем.
Из восьми кубитов квантового процессора, созданного в МФТИ, авторы использовали четыре. Нейросеть, построенная на их базе, состояла из нескольких слоев. Входные данные кодировались как углы однокубитных операций, составляющих первый слой.
Последующие слои перемежались с набором двухкубитных вентилей, запутывающих кубиты. Для поиска оптимальных значений они использовали мини-пакетный градиентный спуск mini-batch gradient descent. Ученые применили свою квантовую нейросеть к трем задачам классификации и одной задаче распознавание изображений.
Существует лимит изображений. Особенно хорошо этой нейросети удается хуманизация, Самая популярная нейросеть с запросом на русском языке: ruDALL-E Запрос: на русском языке Регистрация и авторизация: не требуется. Нет лимитов на количество изображений. Однако, по сравнению с остальными сервисами, у ruDALL-E достаточно долгое ожидание, которое может составлять до 15-20 минут в зависимости от количества желающих.
Нарисовать картинку с помощью нейросети ruDALL-E можно в двух режимах: «Кандинский» — создание коллажа из 16 изображений, или «Малевич» — изображение одно, но в более высоком качестве. Стоит учитывать, что российская нейросеть менее точно выполняет запросы и требует более точных формулировок. Иногда, для получения результата требуется повторять запрос несколько раз. Использовать сервис можно через приложение «Салют».
Запрос: на английском языке Регистрация и авторизация: не требуется.
Как отреставрировать фото с помощью ИИ от Mail. Ограничений на количество обрабатываемых изображений нет. Данная модель была обучена на тысячах реальных фотографии и видео, чтобы с точностью восстановить все элементы и привести фотографию к более современному виду.
Нейросеть Малевич создала герб Брянской области за 2 минуты
Однако использование пикселей непосредственно в качестве признаков изображений потребует чрезмерного количества памяти, особенно для изображений с высоким разрешением. Чтобы не учить только краткосрочные зависимости между пикселями и текстами, а делать это более высокоуровнево, обучение модели проходит в 2 этапа: Предварительно сжатые изображения с разрешением 256х256 поступают на вход автоэнкодера мы обучили свой SBER VQ-GAN, улучшив метрики для генерации по некоторым доменам, и об этом как раз рассказывали тут , причем также поделились кодом , который учится сжимать изображение в матрицу токенов 32х32. Фактор сжатия 8 позволяет восстанавливать изображение с небольшой потерей качества: см. Для токенизации текстов использовался токенизатор YTTM. Публикация описывает её общими словами, но обходит вниманием некоторые важные нюансы реализации. Он включает такие детали, как позиционное кодирование блоков картинки, свёрточные и координатные маски Attention-слоёв, общее представление эмбеддингов текста и картинок, взвешенные лоссы для текстов и изображений, dropout-токенизатор. Из-за огромных вычислительных требований эффективно обучать модель можно только в режиме точности fp16. Это в 5-7 раз быстрее, чем обучение в классическом fp32. Кроме того, модель с таким подходом занимает меньше места. Но ограничение точности представления чисел повлекло за собой множество сложностей для такой глубокой архитектуры: a иногда встречающиеся очень большие значения внутри сети приводят к вырождению лосса в Nan и прекращению обучения; b при малых значениях learning rate, помогающих избежать проблемы а , сеть перестает улучшаться и расходится из-за большого числа нулей в градиентах.
Для решения этих проблем мы имплементировали несколько идей из работы китайского университета Цинхуа CogView , а также провели свои исследования стабильности, с помощью которых нашли ещё несколько архитектурных идей, помогающих стабилизировать обучение. Так как делать это приходилось прямо в процессе обучения модели, путь тренировки вышел долгим и тернистым. Сбор данных и их фильтрация: безусловно, когда мы говорим об архитектуре, нововведениях и других технических тонкостях, нельзя не упомянуть такой важный аспект как данные.
Она генерирует портреты в стиле Кустодиева, Врубеля и Малевича Для этой цели разработчики проанализировали более ста произведений искусства. Используя новые технологии, приложение создаст изображение в выбранном образе и соответствующей художественной манере — в стиле Карла Брюллова, Валентина Серова, Михаила Врубеля, Пабло Пикассо и других художников. Изображение предоставлено пресс-службой Русского музея Изображение предоставлено пресс-службой Русского музея Изображение предоставлено пресс-службой Русского музея Изображение предоставлено пресс-службой Русского музея Изображение предоставлено пресс-службой Русского музея Анна Цветкова Временно исполняющая обязанности генерального директора Русского музея — о запуске нейросети: Русский музей — крупнейшая в мире сокровищница национального искусства.
Наряду с ним в собрании музея экспонируется и уникальная коллекция «Музея Людвига» с произведениями Пабло Пикассо.
Интересный выбор, ничего не скажешь. Достойный конкурент другим предложенным вариантам. Возможно, брянские чиновники возьмут такой подход а что, модно и неожиданно на вооружение и также попробуют обратиться за помощью к нейросети. Наблюдая за тем, что предложили на сегодня, создаётся впечатление, что хуже уже не будет. Подписывайтесь, чтобы первыми узнавать о важном: Другие новости Общество.
Ограничений на количество обрабатываемых фотографий нет, пользователям станут доступны все функциональности нейросетевой модели. Для обучения нейросети были использованы опубликованные в широком доступе фотографии и видео. Материалы помогут воссоздать детали и раскрасить снимки более точно, в соответствии с действительностью.
NVIDIA представила ИИ, который генерирует видео с высоким разрешением по текстовому описанию
К 9 Мая нейросеть поможет отреставрировать фотографии | «Малевич»: россиянам продемонстрировали нейросеть будущего. |
«Сбер» представил новую версию нейросети Kandinsky — Kandinsky 2.1: как ей пользоваться | Полотна великих русских художников, которые были утрачены в ходе Сталинградской битвы, воссозданы нейросетью Сбера Kandinsky и представлены широкой аудитории. |
«Сбер» представил новую версию нейросети Kandinsky — Kandinsky 2.1: как ей пользоваться | «Малевич»: россиянам продемонстрировали нейросеть будущего. |
Арты нейросетей + Казимир Малевич
Сегодня схожие работы могут генерировать нейросети. Для обучения нейросети использовался обновленный датасет в размере 1,5 млрд пар «текст — изображение». открыла доступ к нейросети, которая может восстановить старые фотографии. Теперь нейросеть, подобно опытному фокуснику, формирует промежуточное представление картинки в виде латентного кода — своеобразной «шпаргалки», содержащей квинтэссенцию.