Опубликован алгоритм аппроксимации изображений за счет геометрических фигур

image approximation

Исследователи из Осло опубликовали алгоритм, который создает представления изображений, используя  геометрические фигуры. Алгоритм создан с целью максимально точно аппроксимировать изображения и для разработки новых художественных стилей. Изображения аппроксимируются прозрачными, перекрывающимися и геометрическими формами разных типов — многоугольниками, кругами, линиями.

Алгоритм

Все изображения (геномы) реализованы в программе как объекты, состоящии из «генов». Каждый ген состоит из параметров, которые определяют размер холста, цвет фигуры, прозрачность, местоположение. Исходная структура гена состоит из следующих параметров:

  • Ширина и высота целевого изображения.
  • Массив цветов от 0 до 255.
  • Значение прозрачности от 0 до 1.

Дополнительные параметры: количество вершин, длина радиуса, толщина линии добавляются в конец гена при его создании. Ниже приведена таблица примера параметров и визуальное изображение.

геометрические фигуры

Мутации

Любой ген может иметь мутации, вероятность которых можно настроить в программе. Мутация гена происходит путём извлечения параметров гена и их изменения в соответствии с данными параметрами. Алгоритм имеет три вида мутаций:

  1. Мягкая — обновляет параметры в пределах лимита.
  2. Средняя — заменяет существующие параметры новыми значениями.
  3. Гибридная — объединяет две мягких и одну среднюю в соотношении 2:1.

Также существует два фактора мутации: мутация вероятности (probability mutation) и мутация фрагмента (chunk mutation).

Изображение

Для создания изображения создаётся чёрный холст, а затем каждый ген (геометрическая фигура) в генотипе выводится на холст один за другим. Для реализации использовалась библиотека OpenCV, способная отображать формы с правильными альфа-значениями, которая также предоставила простой метод работы с RGB цветами.

Эксперименты

Во всех тестах использовалось одно и то же изображение Мона Лизы:

Исходные параметры:

Получившиеся изображения после 10 000 генераций, с количеством вершин 3, 8 и 20 соответственно:

Получившиеся изображения после 10 000 генераций с сочетанием генов:

1) 10 окружностей и 10 многоугольников; 2) 5 окружностей и 15 многоугольников; 3) 5 окружностей, 5 многоугольников и 10 линий.
NS-CL

Нейросеть NS-CL интерпретирует сцену, требуя всего 5000 изображений для обучения

Гибридная модель NS-CL (Neuro-Symbolic Concept Learner) от MIT и Deepmind отвечает на вопросы по типу «Имеет ли красный объект слева такую же форму, как и фиолетовый справа». Модель имеет высокую точность, на обучение уходит в разы меньше времени и ресурсов, чем на другие современные…
hearing touch

Алгоритм крадет пароли, распознавая звуки давления на экран

Когда пользователь набирает пароль на своём смартфоне, нажатия генерируют звуковую волну, которая распространяется по экрану смартфона и по воздуху. Микрофоны смартфона улавливают этот звук и могут восстанавить пароль, так как для каждой части экрана характерен свой звук. Используя эту информацию, был создан алгоритм, который…

Почему проектами машинного обучения сложно управлять?

Многие компании пытаются внедрить машинное обучение — некоторые преуспевают, а другие терпят неудачу. Причина часто в том, что командам ML-инженеров трудно ставить конкретные цели. Почему так происходит? На этот и другие вопросы решил ответить Лукас Бивальд, основатель стартапа Weights&Biases, занимающегося разработкой софта для глубокого…
анализ неврологических заболеваний

В IBM разработали ногтевой датчик для анализа неврологических нарушений

Команда разработчиков IBM создала миниатюрный датчик, который может контролировать состояние здоровья пациента, отслеживая малейшие движения и деформации ногтя. Прибор состоит из тензодатчиков, прикрепленных к ногтю, и небольшого вычислительного устройства, которое измеряет значения деформации, собирает данные акселерометра и обменивается данными с умными часами. Часы анализируют…
эпоха итерации батчи

Эпоха, батч, итерация — в чем различия?

Вам должны быть знакомы моменты, когда вы смотрите на код и удивляетесь: “Почему я использую в коде эти три параметра, в чем отличие между ними?”. И это неспроста, так как параметры выглядят очень похожими. Epoch - Batch Size - Iteration Чтобы выяснить разницу между…
corti ai

Нейросеть помогает диспетчерам диагностировать остановку сердца за 48 секунд — и спасти жизнь

Датский стартап Corti разработал технологию, которая помогает аварийным диспетчерам распознавать сердечные приступы на 30 секунд быстрее. В случаях с сердечным приступом важна каждая секунда — указания, которые диспетчер дает на полминуты раньше, позволяют повысить выживаемость пациентов в три раза в последующий месяц. Как работает…

GAN взламывает любую текстовую CAPTCHA за 0,05 секунды

Ученые разработали алгоритм, который способен взломать CAPTCHA быстрее и точнее, чем предыдущие методы — за 0,05 секунды с помощью настольного ПК. Новый подход основан на использовании генеративно-состязательных нейросетей (GAN). Преимущество GAN при решении подобных задач состоит в том, что сеть может работать с гораздо…

Andrew Ng выпустил AI Transformation Playbook — руководство по внедрению ИИ в бизнес

Со-основатель Google Brain и ведущий ИИ специалист Baidu Andrew Ng выпустил AI Transformation Playbook — руководство для бизнеса, которое поможет начать использовать искусственный интеллект и машинное обучение в компании — создать команду ML-специалистов, начать разрабатывать собственные технологии или просто эффективно использовать существующие решения.  В…

Нейросеть Microsoft победила в конкурсе агрономов, вырастив 50кг огурцов на квадратном метре

Команда Microsoft победила команды Tencent и Intel в конкурсе по выращиванию огурцов в полностью автономных теплицах. Конкурс Autonomous Greenhouse Challenge проходил в Нидерландах с 27 августа по 7 декабря. Цель соревнования — посмотреть, какие технологии машинного обучения смогут лучше справиться с выращиванием растений и как их…
средства по уходу за кожей

Стартап кастомизирует косметику по уходу за кожей с помощью машинного обучения

Стартап Proven Skincare использует машинное обучение, чтобы определить, какие ингредиенты средств по уходу за кожей будут лучше работать на людях из разных стран, живущих в разном климате. Клиенты, которые хотят заказать косметику в Proven Skincare, предоставляют данные — возраст, этническую принадлежность, адрес, образ жизни и…
курс amazon по машинному обучению

Курсы Amazon по машинному обучению выложили в открытый доступ

Amazon открыла бесплатный доступ к «Machine Learning University» — внутренним курсам по машинному обучению для новых разработчиков компании. Обучающая программа представлена на английском языке. В неё входят 45 часов лекций, видео и лабораторных работ с примерами практических задач. Курсы доступны по 4 направлениям: для…
создание аватаров GAN

PaGAN — новый метод создания анимированного аватара из селфи

С ростом интереса к VR и персонализированному игровому опыту, набирают популярность приложения для создания 3D-аватаров. Команда приложения Pinscreen использует технологии машинного обучения, чтобы получать высококачественные анимированные аватары из одной фотографии. Синтез изображения с помощью paGAN Предыдущим методам для создания анимированного 3D-аватара требовалось несколько исходных…
дерево решений

Дерево решений: метод «белого ящика» в машинном обучении

Дерево решений — логическая схема, позволяющие получить окончательное решение о классификации объекта после ответов на иерархически организованную систему вопросов. Стоит сказать, большинство высоко результативных решений на Kaggle — комбинация XGboost-ов, одного из вариантов деревьев решений, и очень качественного фичер-инжиниринга. Один уровень Стоящая за деревьями…

Night Sight для Google Pixel: как работает новый режим ночного видения

В октябре компания Google представила новую технологию съемки фотографий в ночном режиме. Night Sight использует алгоритмы машинного обучения, чтобы получить яркие и четкие снимки даже в условиях недостаточного освещения. С 14 ноября технология доступна для всех поколений Pixel. Посмотрите сравнение, опубликованное разработчиками.  Один и…

В Китае создали технологию распознавания человека по походке

Команда китайского стартапа Watrix разработала технологию распознавания человека по походке. Китайское правительство уже внедряет разработку на улицах Пекина и Шанхая. Инструмент помогает полиции идентифицировать преступников. Технология SHUI DI SHEN JIAN способна распознать походку на расстоянии до 50 метров, независимо от того, повернут человек спиной или…

Искусственный интеллект и роботы ускорят создание новых молекул

Машинное обучение и робототехника позволят переосмыслить открытие новых химических веществ и материалов. Компания Kebotix создала автономную лабораторию — робот и компьютеры с искусственным интеллектом изучают и оценивают свойства молекул практически без участия людей. Возможно, с помощью ИИ удастся разработать новые материалы, которые будут поглощать…

Baidu создала технологию для синхронного перевода на основе ИИ

Интернет-гигант Baidu разработал инструмент, который переводит с двух языков в режиме реального времени. Технология STACL обрабатывает фразы естественного языка и предугадывает слова, что делает перевод близким к результату синхронного переводчика. Мгновенный перевод Искусственные переводчики работают с последовательным переводом, т.е. переводят предложение только после его…

Искусственный интеллект для малого бизнеса: 5 способов применения

В массовой культуре искусственный интеллект (AI) покрыт мифами и считается исключительной силой, подрывающей экономическую стабильность. На самом деле, он похож на любую другую технологию. По мере того, как больше и больше компаний используют AI, увеличивается конкуренция и снижаются издержки — искусственный интеллект становится доступным для…

Искусственный интеллект и спутники помогут фермерам анализировать урожайность

Стартап из Беларуси OneSoil запустил интерактивную карту полей Европы и США, которая позволяет изучать размеры полей, урожай и видеть как меняется поле с течением времени. Инструмент полезен для работы фермеров и учёных — помогает анализировать тенденции в растениеводстве и принимать решения о посевах. Интерактивная карта OneSoil Map…
линейная регрессия

Линейная регрессия в машинном обучении

Линейная регрессия (Linear regression) — модель зависимости переменной x от одной или нескольких других переменных (факторов, регрессоров, независимых переменных) с линейной функцией зависимости. Линейная регрессия относится к задаче определения «линии наилучшего соответствия» через набор точек данных и стала простым предшественником нелинейных методов, которые используют для обучения нейронных сетей. В этой статье покажем вам…