Нейросеть обучили диагностировать аневризму

Стэнфордская группа машинного обучения, возглавляемая Эндрю Ыном, разработала модель, которая диагностирует внутричерепные аневризмы на снимках компьютерной томографической ангиографии (КТА) головы. Датасет содержал 818 обследований от 662 уникальных пациентов с 328 обследованиями КТА (40,1%), содержащих по крайней мере 1 внутричерепную аневризму и 490 обследований (59,9%) без внутричерепных аневризм.

Члены команды HeadXNet, Эндрю Ын
Члены команды HeadXNet (слева направо: Эндрю Ын, Кристен Йом, Кристофер Шут, Пранав Раджпуркар и Эллисон Парк) смотрят на сканирование мозга

Проблема

Диагностика неразорвавшихся аневризм является критически важной клинической задачей: внутричерепные аневризмы встречаются у 1-3% населения и составляют более 80% нетравматических субарахноидальных кровоизлияний, угрожающих жизни. Компьютерная томографическая ангиография (КТА) — это первичная, малоинвазивная методика визуализации, используемая в настоящее время для диагностики, наблюдения и предоперационного планирования внутричерепных аневризм. Но интерпретация требует много времени даже для обученных по специальностям нейрорадиологов. Низкий уровень соглашения между различными экспертами создает дополнительную проблему для надежной диагностики.

Учитывая потенциальный катастрофический исход пропущенной аневризмы с риском разрыва, крайне желателен инструмент автоматического обнаружения, который надежно обнаруживает и повышает эффективность работы медицинских сотрудников. Разрыв аневризмы приводит к летальному исходу у 40% пациентов и приводит к необратимой неврологической инвалидности у двух третей выживших, поэтому точное и своевременное обнаружение имеет первостепенное значение.

Архитектура модели

В этом исследовании была разработана 3D-CNN под названием HeadXNet для сегментации внутричерепных аневризм с КТ. HeadXNet — это CNN со структурой энкодер-декодер, где энкодер служит для кодирования полного объема информации с изображения в более низкую размерность, а декодер расширяет это кодирование до объема сегментации с полным разрешением. Энкодер состоит из 50-слойной SE-ResNeXt сети, и декодер представляет собой последовательность из обратных сверток 3 × 3. Аналогично UNet, остаточные соединения используются в 3 слоях энкодера для передачи выходов непосредственно в декодер. Энкодер был предварительно обучен на датасете Kinetics-600, большой коллекции видео на YouTube, размеченной человеческими действиями; после предварительной подготовки энкодера, последние 3 сверточных блока и выходной слой softmax на 600 выходов были удалены. На их место были добавлены слой spatial pyramid pooling и декодер.

Результаты

Без аугментации, медицинские специалисты достигли чувствительности микросреднего уровня 0,831, специфичности 0,960 и точности 0,893. С аугментацией, специалисты достигли чувствительности микроусреднего уровня 0,890, специфичности 0,975 и точности 0,932. Базовая модель имела чувствительность 0,949, специфичность 0,661 и точность 0,809.

популяционный метод аугментации

Популяционный метод увеличивает скорость аугментации в 1000 раз

Новый Популяционный метод аугментации (Population based augmentation, PBA) сравним по качеству с текущим state-of-the-art методом AutoAugment от Google, однако работает в тысячу раз быстрее, что позволяет широко использовать его разработчикам. В эксперименте на датасете CIFAR-10, удалось увеличить показатели по сравнению с state-of-the-art методом. Реализация…

Google AI представила библиотеку TensorNetwork для эффективных вычислений в квантовых системах

С помощью новой библиотеки TensorNetworks от GoogleAI стало общедоступным использование тензорных сетей, которые играют большую роль в современной квантовой физике. Однако, помимо применения в квантовых системах, тензорные сети все чаще находят применение в машинном обучении. Библиотека была разработана в сотрудничестве с институтом теоретической физики…

Рекомендательная система в Alibaba научилась учитывать последовательные действия клиентов

Исследователи из Alibaba Group опубликовали описание модели Behavior Sequence Transformer (BST), которая применяется в рекомендательной системе сайта Taobao. Особенность модели заключается в том, что она анализирует последовательности действий, совершенных пользователями. Это позволило значительно увеличить показатель кликабельности (click-through rate, CTR) по сравнению с двумя базовыми…
GPT-2 medium

OpenAI выложили расширенную версию сети GPT-2, способную писать стихи

Этой весной лаборатория OpenAI, основанная Илоном Маском, представила результаты работы сети GPT-2, способной создавать фейковые новости, неотличимые от настоящих, а также стихи и другие тексты. Из-за угрозы злоупотребления обученной моделью, было принято решение не выпускать модель в открытый доступ, представив публике лишь весьма ограниченную…

С помощью ИИ от Microsoft были разработаны новые рецептуры виски

Шведский ликеро-водочный завод Mackmyra Whisky, технологическая компания Fourkind и Microsoft недавно объединились для производства первого в мире виски, созданного искусственным интеллектом. Виски Mackmyra, сгенерированный искусственным интеллектом, будет доступен с осени 2019 года. По словам ликероводочного завода, это первый раз, когда сложный рецепт потребительского продукта был создан с машинным…

Как работают рекомендательные системы

Рекомендательные системы, основанные на машинном обучении, получили широкое распространение для бизнеса в последние годы. В этой статье приведено описание принципов работы основных методов для реализации рекомендательных систем и метрик для оценки их работы. Перевод статьи Recommendation Systems — Models and Evaluation, автор — Neerja Doshi, ссылка…

Google протестировала свое AutoML решение на KaggleDays и показала одни из лучших результатов

Разработчики Google AI протестировали решение, на основе которого недавно был запущен сервис Google Cloud AutoML Tables (beta), на 8,5-часовом KaggleDays SF Hackathon. Несмотря на то, что в хакатоне принимали участие многие дата саентисты уровня Grandmaster на Kaggle, команда Google в первом соревновании лидировала большую…
Snapchat

Туториал по созданию системы фильтров Snapchat с использованием Deep Learning

Добро пожаловать всем программистам, которые, возможно, открыли эту статью, увидев слова «Snapchat» и «Deep Learning». Клянусь, эти 2 слова привлекают вас, ребята, как огонь мотылька. Чего уж там, я тоже стал их жертвой, поэтому я часами делал этот проект. Перевод статьи Creating the Snapchat…
Достопримечательности из датасета

Google AI расширила датасет для распознавания достопримечательностей

Google AI выпустила Google-Landmarks-v2, вторую версию крупнейшего датасета для распознавания достопримечательностей , расширив его до 5 миллионов изображений (в 2 раза). Особенностью датасета стало количество достопримечательностей — более 200 тысяч мест (увеличение в 7 раз по сравнению с первой версией). На основе этого датасета…
Российский Speech-to-text датасет

Российский Speech-to-text датасет (STT/ASR)

Группа российских разработчиков выпустила свободный датасет speech-to-text на русском языке, содержащий более 4000 тысяч часов записей с голосом для исследователей и разработчиков приложений с распознаванием речи. В ближайшее время создатели датасета планируют добавить еще 1500 часов речи, а в будущем увеличить его объем до…

Страховая компания увеличила прибыль благодаря фотографиям домов клиентов с Google Street View

Результат исследования Лукаша Кидзиньски из Стэнфордского университета в Калифорнии и Кинга Кита-Войцеховского из Варшавского университета может позволить страховым компаниям значительно повысить свою прибыль. Исследование показало, что фотографии домов клиентов с Google Street View — очень хороший признак для предсказания вероятности предъявления иска в страховую…
bagging-boosting-ansambli-e1557319537293

Ансамблевые методы: бэггинг, бустинг и стекинг

«Единство это сила». Эта старая поговорка довольно хорошо выражает основную идею, за которой стоят очень мощные «ансамблевые методы» в машинном обучении. Ансамблевые методы часто занимают топ рейтингов во многих соревнованиях по машинному обучению, в том числе на Kaggle. Если говорить грубо, они основаны на…

Google AI выпустила библиотеку с результатами исследования распутывания представлений

Google AI опубликовала библиотеку disentanglement_lib, которая содержит 10800 вариационных автоэнкодеров, обученных на семи датасетах. Эта библиотека призвана помочь исследователям по всему миру решить одну из главных проблем глубокого обучения — неспособность использовать многомерные данные для генерации полезных представлений методами без учителя. Один из подходов,…
walmart ai

Walmart представила магазин с автоматическим отслеживанием запасов

Компания Walmart запустила концептуальный магазин Walmart Intelligent Retail Lab в Нью-Йорке для испытания инновационных идей в торговле. Одна из первых идей, которую тестируют в магазине — отслеживание товаров на полках с помощью камер и системы машинного зрения. Первоначальная цель магазина заключается в том, чтобы…
синтез речи

Ученые синтезировали речь из сигналов мозга с помощью нейросети

Исследователи из Калифорнийского Университета Сан-Франциско разработали алгоритм, который расшифровывает сигналы мозга, связанные с произношением слов, и переводит их в понятную речь без необходимости двигать мышцами, даже находящимися во рту. Такая технология в скором будущем должна позволить немым людям свободно и внятно произносить слова. Прототип…
skype interview

Стартап собрал $1,7 миллиона на создание ИИ для отбора кандидатов по видеоинтервью

Стартап VCV.AI собрал 1,7 миллиона долларов на создание искусственного интеллекта для автоматического отбора кандидатов на работу с использованием распознавания лиц и голоса. VCV устраняет предвзятость человека при приеме на работу, помогая с предварительным отбором кандидатов, автоматически отбирая заявки и проводя робо-видео интервью с распознаванием…
добавление тегов на фотографии

Туториал: добавление тегов фотографиям с генератором Tagbox для удобства поиска на MacOS

Перевод статьи Building a private, local photo search app using machine learning, автор — Aaron Edell, ссылка на оригинал — в подвале статьи. Это оно. Это лучшая проклятая вещь, которую я когда-либо делал. Обычно я не люблю хвастаться, но я так горжусь собой за…
recommedation system keras

Туториал: cоздание рекомендательной системы c библиотекой FastAI

Метод коллаборативной фильтрации в рекомендательных системах предсказывает оценку или предпочтение, которое пользователь будет отдавать объекту на основе его прежних оценок или предпочтений. Системы рекомендаций используются практически каждой крупной компанией для повышения качества предложения своих услуг. Перевод статьи «Collaborative filtering with FastAI», автор — Gilbert…
нейросеть для шумоподавления

Deep Network Priors: unsupervised метод подавления аудиошума

Ученые из Тель-Авивского университета разработали метод Deep Network Priors для шумоподавления, идея которого схожа с методом Deep Image Prior, но в применении к звуку. Он объединяет обработку как во временной, так и в частотно-временной области. Результаты превосходят все unsupervised методы и приближаются к supervised…
python data visualization

Обзор пакетов для визуализации данных на Python

Есть много способов построения графиков на Python, но какой из них лучше? Когда вы делаете визуализацию, важно задать несколько вопросов о цели построения графика: пытаетесь ли вы создать первичное представление ваших данных для дальнейшего анализа, или пытаетесь произвести впечатление на презентации? В этой статье…