ISSN 0021-3454 (печатная версия)
ISSN 2500-0381 (онлайн версия)
Меню
Аннотации номера

СИСТЕМНЫЙ АНАЛИЗ, УПРАВЛЕНИЕ И ОБРАБОТКА ИНФОРМАЦИИ

305
Исследованы особенности классификации нарушений сердечного ритма по сигналу одного отведения электрокардиограммы. Предложено первичное множество из восьми информативных признаков: три для длительности RR-интервала и пять — для формы R-зубца. Найдена эффективная комбинация предложенных признаков для классификации трех состояний сердечного ритма (нормальный кардиоцикл, желудочковая экстрасистола, предсердная экстрасистола) с помощью алгоритмов логистической регрессии и случайного леса. Для проведения экспериментальных исследований использовались записи отведения II из баз данных многоканальных электрокардиограмм MIT-BIH Arrhythmia DB и Санкт-Петербургского Института кардиологической техники. Определено, что наиболее информативными признаками для рассматриваемых классов нарушений сердечного ритма являются коэффициент сцепления и коэффициент эксцесса i-го R-зубца γi. Достигнутая наибольшая точность классификации по средней сбалансированной F-мере для набора данных без балансировки классов составляет 92,58 % в случае логистической регрессии и 92,11 % — случайного леса; с балансировкой — 86,17 % для логистической регрессии и 84,55 % — для случайного леса. Результаты экспериментов показывают, что для классификации рассматриваемых нарушений сердечного ритма целесообразно использовать по одному критерию из признаков длительности и формы. Полученные в ходе экспериментальных исследований результаты могут быть применены при синтезе и анализе систем классификации нарушений сердечного ритма.
315
С развитием методов машинного обучения для распознавания образов открываются новые возможности в области медицинской диагностики. Уровень точности и надежности, достигнутый нейронными сетями, позволяет снизить риск ложных срабатываний и ошибок. Для задачи диагностирования пневмонии по рентгеновским изображениям проведено сравнение различных алгоритмов машинного обучения, таких как метод опорных векторов, k-ближайших соседей, сверточные нейронные сети. Обсуждаются преимущества использования данных методов в медицинской диагностике. Алгоритмы машинного обучения доведены до программной реализации, для каждого из них экспериментальным путем выбраны параметры обучения. Для сравнения методов использовалась стандартная метрика — точность (accuracy), также методы сравнивались по времени обучения. Эксперименты проведены на реальных рентгеновских снимках больных пневмонией пациентов. Результаты экспериментов показали, что глубокие нейронные сети демонстрируют лучшую точность, по сравнению с традиционными методами машинного обучения, что подтверждает эффективность их потенциального использования для диагностики и лечения данного заболевания.
321
Исследован набор медицинских данных, полученных из информационной системы сетевой лаборатории амбулаторного наблюдения, который содержит показатели анализов пациентов с диагнозом „анемия“. Набор содержит показатели общего анализа крови, ретикулоциты, дополнительные биохимические маркеры обмена железа и воспалительного процесса. Разработана программа, позволяющая автоматизировать процесс анализа исследуемого набора согласно предложенному алгоритму обработки с учетом особенностей медицинских данных. Выполнена предварительная подготовка и очистка данных, проведен статистический и факторный анализ. Анализ выделенных групп данных позволил найти некоторые общие показатели для пациентов с анемическим синдромом. С помощью факторного анализа сокращено число переменных, выделены четыре основных фактора (группы исходных признаков), которые необходимы для описания исследуемых данных. Полученные результаты могут быть использованы для предоставления статических отчетов медицинской организации. Также исследуемые данные были подготовлены для возможности использования методов машинного обучения и более глубокого анализа с целью выявления наиболее эффективной диагностики анемии на ранних стадиях.
330
Рассмотрены методы построения ускорителей глубокого обучения. Показано, что традиционные подходы к обеспечению отказоустойчивости ускорителей глубокого обучения основаны на избыточных вычислениях, что приводит к значительным накладным расходам, включая время обучения, энергопотребление и размеры интегральных схем. Рассмотрен метод, основанный на учете различий в уязвимости отдельных нейронов и битов каждого нейрона, частично решающий проблему избыточности вычислений. Метод позволяет избирательно защищать компоненты модели на уровне архитектуры и схемы, что снижает накладные расходы без ущерба для надежности модели. Показано, что квантование модели ускорителя глубокого обучения позволяет представлять данные меньшим числом битов, что снижает требования к аппаратным ресурсам.

ИНФОРМАТИКА И ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ

338
Представлен метод получения псевдослучайных чисел для их дальнейшего использования при разработке интерактивных приложений на движке Unity со сбором информации от датчиков давления и цвета, подключаемых к микроконтроллеру Arduino. Метод предполагает использование результатов периодических измерений давления, температуры, освещенности и цветов по каналам RGB в помещении, их побитовый сдвиг на случайное число разрядов, получение „зерна“ генератора псевдослучайных чисел путем взятия остатка от деления после сравнения числа с текущим UNIX-временем. Разработано приложение, реализующее предложенный метод генерации псевдослучайных чисел. Показаны результаты тестирования генератора псевдослучайных чисел. Проведена проверка равномерности распределения и оценка коэффициента корреляции на выборке случайных чисел.
345
Обсуждается проблема балансировки нагрузки в крупных информационных системах. В условиях высокой нагрузки информационных систем, через которые проходят большие объемы данных, и увеличения числа пользователей, становится критически важным эффективное распределение нагрузки между ресурсами системы. Рассматриваются алгоритмы балансировки нагрузки, функционирование которых зависит от подхода (централизованного или распределенного) к построению архитектуры информационной системы. Описаны разные типы архитектуры построения информационных систем с выделением особенностей механизмов балансировки нагрузки для них. Демонстрируются результаты натурного эксперимента на виртуальных серверах по оценке эффективности алгоритмов балансировки нагрузки. Вычислительные характеристики серверов задавались разными и ожидаемое время выполнения запроса разыгрывалось случайным образом, что делает условия эксперимента близкими к реальным.
352
Рассматриваются особенности разработки балансируемой структуры данных, ориентированной на ускоренный доступ к элементам, имеющим высокий приоритет. Подобные структуры могут использоваться в задачах моделирования дискретных источников информации. Предложено самобалансирующееся двоичное дерево поиска, оптимизированное для эффективного хранения и поиска данных на основе приоритетов, коррелирующих с вероятностью порождения символов. Решение позволяет преодолеть ограничения существующих структур данных с учетом требований к памяти и производительности в контексте специфических задач обработки информации.

МЕТОДЫ И ПРИБОРЫ ДЛЯ АНАЛИЗА И КОНТРОЛЯ МАТЕРИАЛОВ, ИЗДЕЛИЙ, ВЕЩЕСТВ И ПРИРОДНОЙ СРЕДЫ

359
Рассмотрены особенности изучения внутрисезонной изменчивости природно-террито¬риальных комплексов (ПТК) в Арктической зоне Российской Федерации (АЗРФ) средствами многоспектрального и радиолокационного космического мониторинга. Из-за особых условий освещенности и высокой облачности возможности космических аппаратов (КА) с оптическими приборами на борту ограничены для съемки территорий АЗРФ. Для обеспечения космического мониторинга природных территорий АЗРФ необходима разработка методик с использованием радиолокационных методов, не зависящих от условий съемки. На примере отдельно взятого региона АЗРФ — Тазовского полуострова — проанализирована внутрисезонная изменчивость наиболее характерных типов ПТК (кустарничко-лишайниковые тундры; сфагновые болота; ивняки травяные; песчаные отмели и антропогенные объекты). Методы исследования включают интерферометрическую обработку исходных радиолокационных данных SAR КА Sentinel-1В и обработку данных КА Sentinel-2А, 2В по алгоритмам классификации и расчета спектральных вегетационных индексов. На основе результатов классификации поверхностей полигона Тазовского полуострова, проведенной по многоспектральной космической информации, выбраны четыре опорных участка ПТК. Анализ стабильности и изменчивости поверхностей на выбранных участках полигона проведен на основе рассчитанных рядов интерферометрической когерентности для каждого типа ПТК в бесснежный период 2021 года. Для интерпретации полученных результатов использованы статистически обработанные ряды метеорологических наблюдений за температурой воздуха и осадками и данные вегетационных индексов. Результаты исследования могут быть наиболее востребованными в производственно-экологическом мониторинге нефтегазовой отрасли и охране окружающей среды с целью соблюдения техносферной безопасности и выявления степени антропогенной нарушенности территорий АЗРФ.
368
Рассмотрена задача проектирования системы мониторинга грозовой активности на основе датчиков, оценивающих параметры молниевых разрядов путем приема электромагнитного излучения, формируемого при движении электрического заряда по каналу молнии. Показано, что для обеспечения основных характеристик проектируемых систем мониторинга грозовой активности, таких как вероятность обнаружения, точность определения координат и тока молниевого разряда для выбранной рабочей зоны, может быть использовано математическое моделирование. Предложена модель, позволяющая спроектировать конфигурацию системы, способной обеспечить заданные характеристики посредством получения модельных оценок и их последующего анализа. Созданная модель системы мониторинга грозовой активности применена для оценивания вероятности обнаружения молниевого разряда экспериментальной сетью, развернутой в Санкт-Петербурге.

КРАТКИЕ СООБЩЕНИЯ

375
Представлен подход к анализу и управлению данными при проведении спутникового экологического мониторинга территорий и интерпретации полученных результатов. Подход основан на опыте прикладных исследований при проведении ежегодного спутникового мониторинга заданных территорий в Северо-Западном регионе РФ. Цифровые карты геопространственных слоев информации, построенные на основе космической информации различного пространственного разрешения и материалов полевых обследований заданных территорий, рассматриваются как геоданные для мониторинга параметров контролируемых из космоса объектов и определения экологически потенциально опасных зон. Разработан геопортал — программно-технический комплекс обработки данных и представления результатов распознавания характеристик земель. Результаты экологического мониторинга состояния природных и техногенных объектов являются выходными геоданными геопортала для пользователей, а также — сохраненные в архиве — источником данных для проведения дальнейшего мониторинга межвременной и пространственной изменчивости компонентов среды. В настоящее время результаты исследований наиболее востребованы при проведении производственно-экологического мониторинга в нефтегазовой, строительной и сельскохозяйственной отраслях.