Глубокое обучение и безопасность полётов

Статистика несчастных случаев показывает, что около половины авиакатастроф происходят в конце полёта — во время захода на посадку и самой посадки. Одна из основных причин аварий — нерациональное использование энергии, часто приводящее к потере управления, удару хвостом о взлётно-посадочную полосу, жёсткой посадке и прочим нештатным ситуациям. В этой статье мы расскажем, как исследователи из НАСА анализируют авиационные инциденты для своевременного выявления рисков и увеличения безопасности полётов.

Анализ авиационных происшествий

Под энергией воздушного судна подразумевается вид удельной энергии, применяемой для анализа траектории полёта самолётов и ракет. Она зависит от веса, скорости полёта, высоты, тяги, подъёма и сопротивления. Всё это требует тщательного контроля со стороны экипажа, задача которого — не допустить возникновения опасных инцидентов.

Анализ происшествий, связанных с безопасностью полётов, важен во многих ситуациях. Например, работающий на коммерческую авиакомпанию аналитик заинтересован в поиске первопричин этих инцидентов. Результаты его работы помогут повысить надёжность полётов, информировать о необходимости профилактического обслуживания, отслеживать человеческие факторы для улучшения обучения пилотов и так далее.

Сейчас инциденты безопасности полётов анализируются вручную: группа экспертов исследует вызвавшие их причины, произошедшие в полёте. Но такой подход теряет свою эффективность с ростом объёма данных. В одном только Национальном воздушном пространстве США выполняется более 15 миллионов регулярных пассажирских рейсов в год. За 1000 рейсов на короткие и средние расстояния происходит около 900 инцидентов по регулированию безопасности*. И эти цифры постоянно растут!

*Статистика основана на данных, полученных НАСА от пожелавшей остаться неизвестной авиакомпании. Указанные здесь инциденты подпадают под степень опасности 2 и 3, в то время как 1 степень часто игнорируется, поскольку является самой низкой. Также обратите внимание, что не все инциденты одинаково влияют на безопасность полётов.

Поэтому специалисты из НАСА решили разработать систему, которая будет анализировать данные полёта в автоматическом режиме. Для определения ключевых событий в наборах данных они предложили использовать прекурсоры (предшественники). Прекурсор — это любое связанное с инцидентом и предшествующее ему событие. Прекурсоры помогают понять основные причины инцидента и предпринять необходимые меры. Их изучение даёт ответы на вопросы: «Когда появилось опасное состояние?» «Что такое опасное состояние?» «Существуют ли корректирующие операции для его устранения?» «Какова вероятность того, что произойдёт инцидент?»

Предложенный метод использовался для определения прекурсоров при непредвиденном превышении скорости самолёта (авиационный инцидент). Рассмотрим подробнее, как с помощью прекурсоров можно анализировать такие происшествия. На рисунке ниже показан этап посадки самолёта.

На расстоянии около 40 километров от взлётно-посадочной полосы большинство датчиков показывали нормальные значения — состояние было безопасным и вероятность инцидента близка к нулю. Приблизившись к высоте 750 метров на расстоянии 20 км самолёт стал поворачивать, чтобы выровняться относительно полосы, и тогда было установлено слишком высокое значение скорости. Прекурсором к этому событию является увеличение вероятности авиационного инцидента. К высоте 600 метров скорость была скорректирована (уменьшена). На это указывает падение вероятности неблагоприятного события. Однако начиная с 450 метров вероятность снова растёт, поскольку задерживается выпуск закрылок. Из-за этого скорость полёта снова становится высокой при приближении к отметке высоты 300 метров, на которой было отмечено происшествие. Таким образом можно обобщить данные полёта и дать объяснение ключевым событиям, случившимся до инцидента.

Поиск прекурсоров — задача обучения с незначительным привлечением учителя (weakly supervised learning). Обычно у нас есть доступ к метке, которая указывает на происшествие, связанное с безопасностью полёта. Эту метку можно извлечь из системы отчётности по безопасности полётов (aviation safety reporting system, ASRS), где члены лётного экипажа и авиадиспетчеры сообщают о происшествиях; или же из автоматически генерируемых отчётов о полётах. Хотя у нас есть метка инцидента, метки для прекурсоров обычно недоступны, что усложняет задачу. Чтобы решить эту проблему, исследователи из НАСА предложили использовать многовариантное обучение (Multiple-Instance Learning, MIL), которое с помощью меток инцидента выводит метки прекурсоров с временным шагом.

MIL обычно использует набор данных, сгруппированных в виде пакетов. Метки пакетов известны, но неизвестны метки отдельных объектов. Задача MIL — обучить модель для прогнозирования меток пакетов или меток объектов (или и тех и других). Обычно делается предположение, связывающее метки пакетов с отдельными экземплярами: если в пакете есть хотя бы один положительный объект, то пакет помечается как положительный (положительный = указывающий на авиационный инцидент). Если же все экземпляры отрицательные, то пакет считается отрицательным. В стандартной формулировке не учитывается временная связь между объектами, поэтому исследователи создали новую модель глубокого временного многовариантного обучения (deep temporal MIL, DT-MIL) для расширения структуры MIL и добавления временных рядов. Этот подход также можно применять для очень больших наборов данных с использованием параллелизма графических процессоров.

Основная идея

Единственное доступное наблюдение для решения задачи MIL — общие данные о полёте, в которых указывается, произошёл ли авиационный инцидент. Цель — используя эту высокоуровневую информацию (метки пакетов данных) идентифицировать связанные с инцидентом события низкого уровня (метки отдельных объектов), произошедшие во время полёта. Поскольку полёт продолжается в течение определённого конечного периода, все события коррелируют друг с другом во времени. Их динамика часто бывает неравномерной: например, раскрытие дросселя за миллисекунды меняет частоту вращения двигателя, в то время как на определение заметного увеличения скорости полёта требуется несколько секунд. Или если неожиданно меняется ветер, требуется гораздо больше времени, чтобы увидеть его влияние на поведение самолёта. Поэтому важно рассматривать отдельные объекты данных вместе с контекстом.

На рисунке показана предложенная исследователями НАСА идея, согласно которой каждый полёт — это временной ряд с меткой пакета, указывающей на наличие или отсутствие авиационного инцидента. Отдельные объекты определяются как события, произошедшие в определённый момент времени T с учётом всех предыдущих (прекурсоров).

Модель DT-MIL

Как сказано выше, DT-MIL используется для поиска прекурсоров. Чтобы эффективно моделировать отдельные объекты, применяется специальный тип рекуррентных нейронных сетей с управляемыми рекуррентными блоками (Gated Recurrent Units, GRU). GRU похожи на блоки долгой краткосрочной памяти (long short-term memory, LSTM), но имеют более простую структуру. Это позволяет уменьшить объём вычислений и упростить реализацию модели.

Архитектура DT-MIL схематично изображена на рисунке ниже. Данные временного ряда (X_i) обрабатываются блоками GRU, которые преобразуют их скрытые состояния и передают на полносвязные слои (fully connected layers, FCL). Рекуррентные слои (RNN) фиксируют временные зависимости между объектами, а полносвязные слои используются для расширения возможностей аппроксимации. Логистический слой извлекает вероятности объектов, которые затем объединяются в слое агрегации для получения метки пакета. Модель можно обобщить для нескольких меток, если использовать множество независимых логистических слоёв, за которыми будут следовать слои агрегации MIL для каждого класса.

Прототип DT-MIL построен с помощью TensorFlow. В качестве оптимизатора использовался ADAM со скоростью обучения 0.002. Ко всем параметрам модели применялась регуляризация L2 с коэффициентом 0.01.

Эксперименты

Набор данных

Для исследования применялись данные, полученные с помощью метода обеспечения качества полётов (Flight Operational Quality Assurance, FOQA) за период с апреля 2010 года по октябрь 2011 года. Информацию предоставила пожелавшая остаться неизвестной частная авиакомпания. Данные содержат показания большинства сенсорных измерений на борту: скорость полёта, высота, тяга, мощность двигателя, расход топлива, тангаж, крен, давление, температура и многие другие. Частота выборки составляет 1 Гц. Чтобы устранить изменчивость характеристик самолёта, рассматриваются только модели Airbus A319 и A320.

Авиационный инцидент

В работе исследователей НАСА в качестве авиационного инцидента и рассматривается значительное превышение скорости (high-speed exceedance, HSE). Он определяется как:

скорость полёта на высоте 300 м (в контексте) > целевая скорость (в контексте) + допуск

Временной контекст включает в себя одну морскую милю траектории полёта по обе стороны от контрольной точки в 300 метров. Это помогает идентифицировать полёты, в которых действительно наблюдалось устойчивое превышение скорости и игнорировать зашумлённые данные. Если указанное выражение выполняется, то полёт помечается положительной меткой с авиационным инцидентом HSE.

Обучение модели

Модель обучалась на описанных выше данных, которые случайным образом разделены на обучающую, проверочную и тестовую выборки в пропорциях 50%, 30% и 20% соответственно. Данные были нормализованы, чтобы иметь нулевое среднее и единичную дисперсию.

Результаты

Количественные результаты

Для сравнительной оценки используются следующие базовые модели:

MI-SVM: модель на основе метода опорных векторов, являющаяся наиболее близкой по своей реализации к DT-MIL. Она помечает пакеты как положительные и отрицательные так же, как описано в разделе «Основная идея».
MI-SVM (с привязкой ко времени): в отличие от обычной MI-SVM здесь учитывается временная связь между объектами.
DT-MIL (без привязки ко времени): не содержит в себе рекуррентные блоки GRU.
DT-MIL (неглубокая): не содержит полносвязных слоёв.
ADOPT: алгоритм автоматического обнаружения прекурсоров во временных рядах (automatic discovery of precursors in time series, ADOPT) из предыдущей работы НАСА. Работает на основе обучения с подкреплением.

Количественные результаты показаны в таблице. В качестве метрики используется область под ROC-кривой (area under the receiver operating characteristic, AUC).

Модели	AUC обучения	AUC тестирования
DT-MIL DT-MIL (без привязки ко времени) DT-MIL (неглубокая):	0.9904 0.9723 0.9892	0.9837 0.9447 0.9789
MI-SVM MI-SVM (с привязкой ко времени)	0.8052 0.8751	0.79825 0.8802
ADOPT	0.9373	0.8280

Видно, что предложенная DT-MIL модель достигает высокой точности в прогнозировании неблагоприятных событий. Её варианты без привязки ко времени и полносвязных слоёв также достигают неплохих результатов, превосходя MI-SVM и ADOPT.

Заключение

На этом работа исследователей не заканчивается. В дальнейшем они планируют провести более тонкую настройку модели и разработать с её помощью приложения, способные повысить безопасность полётов. Среди них: система принятия решений для лётного экипажа и авиадиспетчеров, а также конвейер обработки данных в реальном времени. Они помогут аналитикам, пилотам и диспетчерам оперативно реагировать на происшествия и избегать возможных проблем ещё на этапе обучения персонала и проектирования самолётов.

Если вы планируете разрабатывать своё решение с использованием глубокого обучения и хотите ускорить процесс вычислений — воспользуйтесь высокоскоростными GPU NVIDIA Tesla V100 на наших выделенных серверах с GPU.

С оригинальной статьёй можно ознакомиться на сайте arxiv.org.

СледующийКак ИИ меняет медицину »

Предыдущий « Серьёзный бизнес или развлечения? Для чего клиенты REG.RU создают сайты

6 лет назад

УПД в бухгалтерии: когда один документ может заменить несколько

Многие предприниматели жалуются на сложный и слишком изобильный документооборот: много документов приходится оформлять. Но при…

12 минут назад

Предпринимательство

Что такое роялти, как их рассчитать и кому они выгодны

Чтобы легально пользоваться результатами чужого труда в своем бизнесе, нужно за это заплатить. И неважно,…

24 часа назад

Предпринимательство

Франшиза: что это, как работает и стоит ли начинать такой бизнес

Франшизы предоставляют предпринимателям возможность использовать популярные бренды, эффективные бизнес-модели и поддержку со стороны материнской компании.…

3 дня назад