<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.3 20210610//EN" "JATS-journalpublishing1-3.dtd">
<article article-type="research-article" dtd-version="1.3" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xml:lang="ru"><front><journal-meta><journal-id journal-id-type="publisher-id">pribor</journal-id><journal-title-group><journal-title xml:lang="ru">Известия высших учебных заведений. Приборостроение</journal-title><trans-title-group xml:lang="en"><trans-title>Journal of Instrument Engineering</trans-title></trans-title-group></journal-title-group><issn pub-type="ppub">0021-3454</issn><issn pub-type="epub">2500-0381</issn><publisher><publisher-name>Национальный исследовательский университет ИТМО</publisher-name></publisher></journal-meta><article-meta><article-id pub-id-type="doi">10.17586/0021-3454-2026-69-1-90-94</article-id><article-id custom-type="elpub" pub-id-type="custom">pribor-457</article-id><article-categories><subj-group subj-group-type="heading"><subject>Research Article</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="ru"><subject>КРАТКИЕ СООБЩЕНИЯ</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="en"><subject>BRIEF NOTES</subject></subj-group></article-categories><title-group><article-title>Метод классификации текстов без применения  обучения</article-title><trans-title-group xml:lang="en"><trans-title>Method of text classification without the use of training</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Татарникова</surname><given-names>Т. М.</given-names></name><name name-style="western" xml:lang="en"><surname>Tatarnikova</surname><given-names>T. M.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Татьяна Михайловна Татарникова — д-р техн. наук, профессор; Институт информационных технологий и программирования; директор</p><p>Санкт-Петербург</p></bio><bio xml:lang="en"><p>Tatyana M. Tatarnikova — Dr. Sci., Professor; Institute of Information Technologies and Programming; Director of the Institute</p><p>St. Petersburg</p></bio><email xlink:type="simple">tm-tatarn@yandex.ru</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Миляев</surname><given-names>Д. Р.</given-names></name><name name-style="western" xml:lang="en"><surname>Milyaev</surname><given-names>D. R.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Дмитрий Романович Миляев— аспирант; кафедра информационных систем</p><p>Санкт-Петербург</p></bio><bio xml:lang="en"><p>Dmitry R. Milyaev — Post-Graduate Student; Department of Information Systems</p><p>St. Petersburg</p></bio><email xlink:type="simple">milyaev.dmitry00@mail.ru</email><xref ref-type="aff" rid="aff-2"/></contrib></contrib-group><aff-alternatives id="aff-1"><aff xml:lang="ru"><institution>Cанкт-Петербургский государственный университет аэрокосмического приборостроения</institution></aff><aff xml:lang="en"><institution>St. Peterdburg State University of Aerospace Instrumentation</institution></aff></aff-alternatives><aff-alternatives id="aff-2"><aff xml:lang="ru"><institution>Cанкт-Петербургский государственный электротехнический университет „ЛЭТИ“ им. В. И. Ульянова (Ленина)</institution></aff><aff xml:lang="en"><institution>St. Petersburg Electrotechnical University „LETI“</institution></aff></aff-alternatives><pub-date pub-type="collection"><year>2026</year></pub-date><pub-date pub-type="epub"><day>14</day><month>02</month><year>2026</year></pub-date><volume>69</volume><issue>1</issue><fpage>90</fpage><lpage>94</lpage><permissions><copyright-statement>Copyright &amp;#x00A9; Национальный исследовательский университет ИТМО, 2026</copyright-statement><copyright-year>2026</copyright-year><copyright-holder xml:lang="ru">Национальный исследовательский университет ИТМО</copyright-holder><copyright-holder xml:lang="en">Национальный исследовательский университет ИТМО</copyright-holder><license xlink:href="https://pribor.ifmo.ru/jour/about/submissions#copyrightNotice" xlink:type="simple"><license-p>https://pribor.ifmo.ru/jour/about/submissions#copyrightNotice</license-p></license></permissions><self-uri xlink:href="https://pribor.ifmo.ru/jour/article/view/457">https://pribor.ifmo.ru/jour/article/view/457</self-uri><abstract><p>Предложен новый подход к классификации текстов без применения методов машинного обучения и необходимости иметь обучающую выборку.  Основу метода составляет расстояние Дамерау — Левенштейна, являющееся минимальным количеством операций редактирования, необходимых для преобразования одной строки в другую и учета семантической близости слов, взвешивания операций редактирования и порядка важности слов. Приведены основные метрики оценивания качества классификатора текстов и результаты апробации предложенного метода в соответствии с метриками.</p></abstract><trans-abstract xml:lang="en"><p>A new approach to text classification is proposed that does not employ machine learning methods or require a training set. The method is based on the Damerau-Levenshtein distance, which is the minimum number of editing operations required to transform one string into another and takes into account the semantic similarity of words, weighting of editing operations, and the order of importance of words. The main metrics for assessing the quality of a text classifier and the results of testing the proposed method against these metrics are presented.</p></trans-abstract><kwd-group xml:lang="ru"><kwd>классификатор текста</kwd><kwd>отсутствие обучающей выборки</kwd><kwd>эталонная выборка</kwd><kwd>метрика  редактирования</kwd><kwd>семантическая близость</kwd><kwd>метрика качества</kwd></kwd-group><kwd-group xml:lang="en"><kwd>text classifier</kwd><kwd>lack of training sample</kwd><kwd>reference sample</kwd><kwd>editing metric</kwd><kwd>semantic proximity</kwd><kwd>quality metric</kwd></kwd-group></article-meta></front><back><ref-list><title>References</title><ref id="cit1"><label>1</label><citation-alternatives><mixed-citation xml:lang="ru">Дудихин В. В., Кондрашов П. Е. Методология использования больших языковых моделей для решения задач государственного и муниципального управления по интеллектуальному реферированию и автоматическому формированию текстового контента // Государственное управление. Электронный вестник. 2024. № 105. С. 169–179. DOI: 10.55959/MSU2070-1381-105-2024-169-179.</mixed-citation><mixed-citation xml:lang="en">Dudikhin V.V., Kondrashov P.E. E-Journal Public Administration, 2024, no. 105, pp. 169–179, DOI: 10.55959/MSU2070-1381-105-2024-169-179. (in Russ.)</mixed-citation></citation-alternatives></ref><ref id="cit2"><label>2</label><citation-alternatives><mixed-citation xml:lang="ru">Houlsby N., Giurgiu A., Jastrzebski S., Morrone B. et al. Parameter-efficient transfer learning for NLP // Proc. 36th Intern. Conf. on Machine Learning. 2019. Vol. 97. P. 2790–2799.</mixed-citation><mixed-citation xml:lang="en">Houlsby N., Giurgiu A., Jastrzebski S., Morrone B. et al. Proc. 36th Int. Conf. on Machine Learning, 2019, vol. 97, pp. 2790–2799.</mixed-citation></citation-alternatives></ref><ref id="cit3"><label>3</label><citation-alternatives><mixed-citation xml:lang="ru">Кузнецов А. В. Цифровая история и искусственный интеллект: перспективы и риски применения больших языковых моделей // Новые информационные технологии в образовании и науке. 2022. № 5. С. 53–57. DOI: 10.17853/2587-6910-2022-05-53-57.</mixed-citation><mixed-citation xml:lang="en">Kuznetsov A.V. New Information Technologies in Education and Science, 2022, no. 5, pp. 53–57, DOI: 10.17853/2587-6910-2022-05-53-57. (in Russ.)</mixed-citation></citation-alternatives></ref><ref id="cit4"><label>4</label><citation-alternatives><mixed-citation xml:lang="ru">Sovetov B.Ya., Tatarnikova T.M., Yashin A.I. Use of technology textmining for identifying hidden threats in communications distributed by social networks // Изв. СПбГЭТУ ЛЭТИ. 2019. № 4. С. 26–32.</mixed-citation><mixed-citation xml:lang="en">Sovetov B.Ya., Tatarnikova T.M., Yashin A.I. Proceedings of Saint Petersburg Electrotechnical University, 2019, no. 4, pp. 26–32. (in Russ.)</mixed-citation></citation-alternatives></ref><ref id="cit5"><label>5</label><citation-alternatives><mixed-citation xml:lang="ru">Батура Т. В. Методы автоматической классификации текстов // Программные продукты и системы. 2017. Т. 30, № 1. C. 85–99. DOI: 10.15827/0236-235X.030.1.085-099.</mixed-citation><mixed-citation xml:lang="en">Batura T.V. Software &amp; Systems, 2017, no. 1(30), pp. 85–99, DOI: 10.15827/0236-235X.030.1.085-099. (in Russ.)</mixed-citation></citation-alternatives></ref><ref id="cit6"><label>6</label><citation-alternatives><mixed-citation xml:lang="ru">Белов С. Д., Зрелова Д. П., Зрелов П. В., Кореньков В. В. Обзор методов автоматической обработки текстов на естественном языке // Системный анализ в науке и образовании: сетевое научное издание. 2020. № 3. C. 8–22. [Электронный ресурс]: http://sanse.ru/download/401, 21.01.2026.</mixed-citation><mixed-citation xml:lang="en">Belov S., Zrelova D., Zrelov P., Korenkov V. System Analysis in Science and Education, 2020, no. 3, pp. 8–22, URL: http://sanse.ru/download/401. (in Russ.)</mixed-citation></citation-alternatives></ref><ref id="cit7"><label>7</label><citation-alternatives><mixed-citation xml:lang="ru">Татарникова Т. М., Мокрецов Н. С. Метод дистилляции знаний для языковых моделей на основе выборочного вмешательства в обучение // Программные продукты и системы. 2025. № 2. С. 361–365. DOI: 10.15827/0236-235X.150.361-365</mixed-citation><mixed-citation xml:lang="en">Tatarnikova T.M., Mokretsov N.S. Software &amp; Systems, 2025, no. 2, pp. 361–365, DOI: 10.15827/0236-235X.150.361 365. (in Russ.)</mixed-citation></citation-alternatives></ref><ref id="cit8"><label>8</label><citation-alternatives><mixed-citation xml:lang="ru">Максютин П. А., Шульженко С. Н. Обзор методов классификации текстов с помощью машинного обучения // Инженерный вестник Дона. 2022. № 12. [Электронный ресурс]: ivdon.ru/ru/magazine/archive/n12y2022/8043, 19.01.2026.</mixed-citation><mixed-citation xml:lang="en">Maksyutin P.A., Shuljenko S.N. Ingineering Journal of Don, 2022, no. 12, URL: ivdon.ru/ru/magazine/archive/n12y2022/8043. (in Russ.)</mixed-citation></citation-alternatives></ref><ref id="cit9"><label>9</label><citation-alternatives><mixed-citation xml:lang="ru">Khurana A., Subramonyam H., Chilana P. K. Why and when LLMbased assistants can go wrong: investigating the effectiveness of prompt-based interactions for software help-seeking // Proc. of the 29th Intern. Conf. on Intelligent User Interfaces. 2024. P. 288–303. DOI: 10.1145/3640543.3645200.</mixed-citation><mixed-citation xml:lang="en">Khurana A., Subramonyam H., Chilana P.K. Proc. of the 29th Intern. Conf. on Intelligent User Interfaces, 2024, рр. 288–303, https://doi.org/10.1145/3640543.3645200.</mixed-citation></citation-alternatives></ref><ref id="cit10"><label>10</label><citation-alternatives><mixed-citation xml:lang="ru">Тарасов Д. В.Романов Н. А. Процедура машинного обучения в задаче морфологической разметки текста и определения частей речи в флективных языках // Изв. вузов. Поволжский регион. 2017. № 1 (41). С. 56–72. DOI: 10.21685/2072-3059–2017-1-5.</mixed-citation><mixed-citation xml:lang="en">Tarasov D.V., Romanov N.A. University Proceedings. Volga Region. Technical Sciences, 2017, no. 1(41), pp. 56–72, DOI: 10.21685/2072-3059–2017-1-5.</mixed-citation></citation-alternatives></ref><ref id="cit11"><label>11</label><citation-alternatives><mixed-citation xml:lang="ru">Lane H., Hapke H., Howard C. Natural Language Processing in Action. Manning Publications Co, 2019. 544 p.</mixed-citation><mixed-citation xml:lang="en">Lane H., Hapke H., Howard C. Natural Language Processing in Action, Manning Publications Co., 2019, 544 p.</mixed-citation></citation-alternatives></ref></ref-list><fn-group><fn fn-type="conflict"><p>The authors declare that there are no conflicts of interest present.</p></fn></fn-group></back></article>
