ИИ от Microsoft нарисовал птичку по текстовому описанию

21.01.2018 14:55

Ученые компании «попросили» компьютер нарисовать «желтую птичку с черными крыльями и коротким клювом», и он нарисовал. Что получилось, можно посмотреть в заголовке статьи. При этом, компьютер создал изображение с нуля, не выбирая подходящее из базы данных, пишет Engadget.

Разработчикам, таким образом, удалось показать эффективность нового алгоритма создания изображений на основе описания и отдельно — эффективность добавления в нейросеть «внимательной» составляющей. В Microsoft идут дальше и видят применение своего алгоритма в анимационных фильмах, созданных компьютером только по сценарию. Однако точно также она может использоваться для создания фейковых видео.

Текущая технология состоит из 2-х частей: одна, Generative Adversarial Network (GAN), генерирует изображения, а другая, дискриминатор, оценивает их качество.

Основой ее является ШИ-система CaptionBot, которая распознает фото и делает подписи к ним в автоматическом режиме. Данная система «стравливает» между собой две нейросети: ту, что непосредственно делает изображение («генератор»), и которая его анализирует («дискриминатор»), сравнивая получившуюся работу с картинками-эталонами.

Как отмечается, CaptionBot обучался на фотографиях и подписях, которые подсказывают, какие слова соотносятся с какими фотоснимками.

Нынешние ИИ-алгоритмы умеют определять объекты, изображённые на картинах и фотографиях с непревзойденной точностью, которая часто доходит до 80 процентов, однако именно ИИ от Microsoft стал первым алгоритмом, способным самостоятельно выполнять обратную задачу — воссоздавать изображения, основываясь на текстовом описании предмета. Мы же используем математику, чтобы сделать внимание «машинной», — говорит Сяодун Хе.

Источник

Канадская фристайлистка завоевала золото Олимпиады-2018 в хафпайпе

Ученые ДВФУ: что можно сделать с помощью капсул из новых нанопружин

Ученые раскрыли секрет горизонтальных полос на Плутоне

Сервис по уменьшению ссылок goo.gl закроется

Роборука теперь может хватать незнакомые предметы