Ученые используют суперкомпьютеры и машинное обучение для автоматического определения опухолей головного мозга

Джордж Бирос, профессор машиностроения и руководитель группы параллельных алгоритмов для анализа данных и моделирования ICES в Техасском университете в Остине, почти десять лет работал над созданием точных и эффективных вычислительных алгоритмов, которые могут характеризовать глиомы, наиболее распространенные и наиболее распространенные. агрессивный тип первичной опухоли головного мозга.На 20-й Международной конференции по обработке изображений в медицине и вмешательству с помощью компьютера (MICCAI 2017) Бирос и его сотрудники из Университета Пенсильвании (под руководством профессора Христоса Давацикоса), Университета Хьюстона (под руководством профессора Андреаса Манга) и Университета Штутгарта (под руководством профессора Мириам Мель) представила результаты нового, полностью автоматического метода, сочетающего биофизические модели роста опухоли с алгоритмами машинного обучения для анализа данных магнитно-резонансной томографии (МРТ) пациентов с глиомой. Все компоненты нового метода были задействованы на суперкомпьютерах Техасского центра передовых вычислений (TACC).

Команда Бироса протестировала свой новый метод в рамках Multimodal Brain Tumor Segmentation Challenge 2017 (BRaTS’17), ежегодного конкурса, на котором исследовательские группы со всего мира представляют методы и результаты компьютерной идентификации и классификации опухолей головного мозга, а также различных типы раковых областей с использованием дооперационной МРТ.Их система попала в 25% лучших в испытании и была близка к вершине по всей сегментации опухоли.«Соревнование связано с характеристикой аномальной ткани у пациентов, страдающих опухолями глиомы, наиболее распространенной формой первичной опухоли головного мозга», — сказал Бирос. «Наша цель — сделать снимок и автоматически очертить его, а также определить различные типы аномальных тканей — отек, увеличивающуюся опухоль (области с очень агрессивными опухолями) и некротическую ткань. Это похоже на фотографирование своей семьи и распознавание лиц. чтобы идентифицировать каждого члена, но здесь вы делаете распознавание тканей, и все это должно происходить автоматически ».

Обучение и тестирование конвейера прогнозированияДля решения этой задачи Биросу и его команде из более чем дюжины студентов и исследователей заранее были предоставлены 300 наборов изображений мозга, на которых все команды откалибровали свои методы (то, что на языке машинного обучения называется «тренировкой»).В заключительной части испытания группам были предоставлены данные от 140 пациентов, и они должны были определить расположение опухолей и сегментировать их на различные типы тканей в течение всего двух дней.

«В этом 48-часовом окне нам потребовалась вся вычислительная мощность, которую мы могли получить», — пояснил Бирос.Конвейер обработки, анализа и прогнозирования изображений, который использовали Бирос и его команда, состоит из двух основных этапов: этап контролируемого машинного обучения, на котором компьютер создает карту вероятности для целевых классов («вся опухоль», «отек», «ядро опухоли»). ; и второй этап, на котором они объединяют эти вероятности с биофизической моделью, которая математически представляет, как опухоли растут, что накладывает ограничения на анализ и помогает находить корреляции.Вычислительные ресурсы TACC позволили команде Бироса использовать крупномасштабные классификаторы ближайшего соседа (метод машинного обучения). Для каждого вокселя или трехмерного пикселя в МР-изображении мозга система пытается найти все похожие воксели в мозге, которые она уже видела, чтобы определить, представляет ли область опухоль или не опухоль.

Имея 1,5 миллиона вокселей на мозг и 300 мозгов для оценки, это означает, что компьютер должен смотреть на полмиллиарда вокселей для каждого нового воксела из 140 неизвестных мозгов, которые он анализирует, решая для каждого из них, представляет ли воксель опухоль или здоровую ткань.«Мы использовали быстрые алгоритмы и приближения, чтобы сделать это возможным, но нам по-прежнему нужны суперкомпьютеры», — сказал Бирос.

На каждом из нескольких этапов конвейера анализа использовались отдельные вычислительные системы TACC. Компонент классификации машинного обучения ближайшего соседа одновременно использовал 60 узлов (каждый из 68 процессоров) на Stampede2, новейшем суперкомпьютере TACC и одной из самых мощных систем в мире. (Бирос был одним из первых исследователей, получивших доступ к суперкомпьютеру Stampede2 весной и смог там протестировать и настроить свой алгоритм для новых процессоров.) Они использовали Lonestar 5 для запуска биофизических моделей и Maverick для объединения сегментов.Большинству команд приходилось ограничивать количество используемых обучающих данных или применять более упрощенные алгоритмы классификатора ко всему обучающему набору, но приоритетный доступ к экосистеме суперкомпьютеров TACC означал, что команда Бироса могла изучить более сложные методы.«Джордж пришел к нам перед BRaTS Challenge и спросил, могут ли они получить приоритетный доступ к Stampede2, Lonestar5 и Maverick, чтобы их работа была выполнена вовремя для выполнения задачи», — сказал Билл Барт, директор TACC по высокопроизводительным вычислениям. «Мы решили, что простое повышение их приоритета, вероятно, не поможет, поэтому мы решили предоставить им резервирование для каждой системы, чтобы покрыть их потребности в течение 48 часов работы».

Как оказалось, Бирос и его команда смогли запустить свой конвейер анализа на 140 мозгах менее чем за 4 часа и правильно охарактеризовать данные тестирования с точностью почти 90 процентов, что сопоставимо с данными радиологов-людей.По словам Бироса, их метод полностью автоматический, и для оценки данных изображения и классификации опухолей требуется лишь небольшое количество исходных алгоритмических параметров.Интеграция разнообразных исследований

По словам Бироса, масштабируемая система анализа изображений, основанная на биофизике, стала кульминацией 10-летних исследований множества вычислительных проблем.«В нашей группе и группах наших сотрудников у нас есть несколько исследовательских потоков по анализу изображений, масштабируемому машинному обучению и численным алгоритмам», — пояснил он. «Но это был первый раз, когда мы собрали все вместе для приложения, чтобы заставить наш метод работать для действительно сложной задачи. Это непросто, но очень полезно».Таким образом, конкурс BRaTS представляет собой поворотный момент в его исследованиях, сказал Бирос.

«У нас есть все инструменты и основные идеи, теперь мы дорабатываем их и смотрим, как их можно улучшить».Классификатор сегментации изображений будет развернут в Пенсильванском университете к концу года в сотрудничестве с его коллегой Христосом Даватцикосом, директором Центра биомедицинских вычислений и аналитики изображений и профессором радиологии.

Он не заменит радиологов и хирургов, но улучшит воспроизводимость оценок и потенциально ускорит диагностику.Методы, разработанные командой, выходят за рамки идентификации опухоли головного мозга.

Они применимы ко многим проблемам медицины и физики, включая дизайн полупроводников и динамику плазмы.Саид Бирос: «Наличие доступа к суперкомпьютерам TACC делает нашу жизнь намного проще, делает нас более продуктивными и является настоящим преимуществом».


Портал обо всем