<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.3 20210610//EN" "JATS-journalpublishing1-3.dtd">
<article article-type="research-article" dtd-version="1.3" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xml:lang="ru"><front><journal-meta><journal-id journal-id-type="publisher-id">pribor</journal-id><journal-title-group><journal-title xml:lang="ru">Известия высших учебных заведений. Приборостроение</journal-title><trans-title-group xml:lang="en"><trans-title>Journal of Instrument Engineering</trans-title></trans-title-group></journal-title-group><issn pub-type="ppub">0021-3454</issn><issn pub-type="epub">2500-0381</issn><publisher><publisher-name>Национальный исследовательский университет ИТМО</publisher-name></publisher></journal-meta><article-meta><article-id pub-id-type="doi">10.17586/0021-3454-2024-67-9-751-758</article-id><article-id custom-type="elpub" pub-id-type="custom">pribor-35</article-id><article-categories><subj-group subj-group-type="heading"><subject>Research Article</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="ru"><subject>СИСТЕМНЫЙ АНАЛИЗ, УПРАВЛЕНИЕ И ОБРАБОТКА ИНФОРМАЦИИ</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="en"><subject>SYSTEM ANALYSIS, MANAGEMENT AND INFORMATION PROCESSING</subject></subj-group></article-categories><title-group><article-title>Оптимальное объединение интервалов группированной выборки для применения критерия типа χ2</article-title><trans-title-group xml:lang="en"><trans-title>Optimal Aggregation of Clustered Sample Intervals for Applying the χ2 Test</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Винник</surname><given-names>П. М.</given-names></name><name name-style="western" xml:lang="en"><surname>Vinnik</surname><given-names>P. М.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Петр Михайлович Винник, д-р техн. наук, доцент, заведующий кафедрой</p><p>кафедра высшей математики</p><p>Санкт-Петербург</p></bio><bio xml:lang="en"><p>Petr M. Vinnik, Dr. Sci., Associate Professor, Head of the Department</p><p>Department of Higher Mathematics</p><p>St. Petersburg</p></bio><email xlink:type="simple">vinnik_pm@voenmeh.ru</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Винник</surname><given-names>Т. В.</given-names></name><name name-style="western" xml:lang="en"><surname>Vinnik</surname><given-names>Т. V.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Татьяна Викторовна Винник, канд. техн. наук,, доцент</p><p>кафедра математики</p><p>Санкт-Петербург</p></bio><bio xml:lang="en"><p>Tatyana V. Vinnik, PhD, Associate Professor</p><p>Department of Mathematics</p><p>St. Petersburg</p></bio><email xlink:type="simple">vinnik.tv92@gmail.com</email><xref ref-type="aff" rid="aff-2"/></contrib><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Еськова</surname><given-names>Е. А.</given-names></name><name name-style="western" xml:lang="en"><surname>Еskova</surname><given-names>Е. А.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Екатерина Александровна Еськова, ассистент</p><p>кафедра высшей математики</p><p>Санкт-Петербург</p></bio><bio xml:lang="en"><p>Ekaterina A. Eskova, Assistant</p><p>Department of Higher Mathematics</p><p>St. Petersburg</p></bio><email xlink:type="simple">eskova_ea@voenmeh.ru</email><xref ref-type="aff" rid="aff-1"/></contrib></contrib-group><aff-alternatives id="aff-1"><aff xml:lang="ru"><institution>Балтийский государственный технический университет „ВОЕНМЕХ“ им. Д. Ф. Устинова</institution></aff><aff xml:lang="en"><institution>D. F. Ustinov Baltic State Technical University VOENMEH</institution></aff></aff-alternatives><aff-alternatives id="aff-2"><aff xml:lang="ru"><institution>Санкт-Петербургский государственный технологический институт (технический университет)</institution></aff><aff xml:lang="en"><institution>St. Petersburg State Institute of Technology</institution></aff></aff-alternatives><pub-date pub-type="collection"><year>2024</year></pub-date><pub-date pub-type="epub"><day>25</day><month>11</month><year>2024</year></pub-date><volume>67</volume><issue>9</issue><fpage>751</fpage><lpage>758</lpage><permissions><copyright-statement>Copyright &amp;#x00A9; Национальный исследовательский университет ИТМО, 2024</copyright-statement><copyright-year>2024</copyright-year><copyright-holder xml:lang="ru">Национальный исследовательский университет ИТМО</copyright-holder><copyright-holder xml:lang="en">Национальный исследовательский университет ИТМО</copyright-holder><license xlink:href="https://pribor.ifmo.ru/jour/about/submissions#copyrightNotice" xlink:type="simple"><license-p>https://pribor.ifmo.ru/jour/about/submissions#copyrightNotice</license-p></license></permissions><self-uri xlink:href="https://pribor.ifmo.ru/jour/article/view/35">https://pribor.ifmo.ru/jour/article/view/35</self-uri><abstract><p>   Обсуждается применение интервалов равной длины или интервалов равной вероятности для использования критерия типа χ2. При этом интервалы равной вероятности предопределяются проверяемым законом распределения. При формировании исходной выборки по данным реального производства она часто сразу является группированной с заранее заданными и неизменяемыми на производстве границами группировки и может не удовлетворять рекомендациям по применению критериев типа χ2. Предложен способ построения набора оптимальных интервалов группировки путем объединения некоторых из имеющихся в исходной выборке интервалов. Под оптимальным набором таких интервалов понимается набор интервалов, имеющий наименьшее квадратическое отклонение взвешенных частот попадания от дискретного равномерного распределения, что позволяет не изменять набор интервалов при смене подбираемого закона распределения и автоматически решить проблему выбора оптимального числа интервалов. Перечислены некоторые свойства таких наборов, рассмотрены примеры возникающих при их построении ситуаций, приведен пример формирования оптимального набора.</p></abstract><trans-abstract xml:lang="en"><p>   The use of intervals of equal length or intervals of equal probability for using the χ2-type criterion is discussed. In this case, intervals of equal probability are predetermined by the distribution law being tested. When forming the initial sample based on real production data, it is often immediately grouped with predetermined and unchangeable grouping boundaries in production and may not satisfy the recommendations for applying χ2-type criteria. A method is proposed for constructing a set of optimal grouping intervals by combining some of the intervals available in the initial sample. An optimal set of such intervals is understood to be a set of intervals that has the least square deviation of weighted frequencies of hits from a discrete uniform distribution, which makes it possible not to change the set of intervals when changing the selected distribution law and to automatically solve the problem of choosing the optimal number of intervals. Some properties of such sets are listed, examples of situations arising during their construction are considered, and an example of forming such an optimal set is given.</p></trans-abstract><kwd-group xml:lang="ru"><kwd>закон распределения</kwd><kwd>эмпирические данные</kwd><kwd>критерий типа χ2</kwd><kwd>интервалы группировки</kwd><kwd>группированные выборки</kwd><kwd>оптимальность группировки</kwd></kwd-group><kwd-group xml:lang="en"><kwd>distribution law</kwd><kwd>empirical data</kwd><kwd>χ2 test</kwd><kwd>grouping intervals</kwd><kwd>grouped samples</kwd><kwd>grouping optimality</kwd></kwd-group></article-meta></front><back><ref-list><title>References</title><ref id="cit1"><label>1</label><citation-alternatives><mixed-citation xml:lang="ru">Миттаг Х.-Й., Ринне Х. Статистические методы обеспечения качества. М.: Машиностроение, 1995. 616 с.</mixed-citation><mixed-citation xml:lang="en">Mittag H.-J., Rinne H. Statistische Methoden der Qualitatssicherung, Munchen, Wien, 1993.</mixed-citation></citation-alternatives></ref><ref id="cit2"><label>2</label><citation-alternatives><mixed-citation xml:lang="ru">Кобзарь А. И. Прикладная математическая статистика. Для инженеров и научных работников. М.: ФИЗМАТЛИТ, 2006. 816 с.</mixed-citation><mixed-citation xml:lang="en">Kobzar' A.I. Prikladnaya matematicheskaya statistika. Dlya inzhenerov i nauchnykh rabotnikov (Applied Mathematical Statistics. For Engineers and Scientists), Moscow, 2006, 816 р. (in Russ.)</mixed-citation></citation-alternatives></ref><ref id="cit3"><label>3</label><citation-alternatives><mixed-citation xml:lang="ru">Лемешко Б. Ю., Постовалов С. Н. Статистический анализ одномерных наблюдений по частично группированным данным // Изв. вузов. Физика. 1995. № 9. С. 39–45.</mixed-citation><mixed-citation xml:lang="en">Lemeshko B.Yu., Postovalov S.N. Izvestiya vuzov. Fizika, 1995, no. 9, pp. 39–45. (in Russ.)</mixed-citation></citation-alternatives></ref><ref id="cit4"><label>4</label><citation-alternatives><mixed-citation xml:lang="ru">Новицкий П. В., Зограф И. А. Оценка погрешностей результатов измерений Л.: Энергоатомиздат, 1991. 304 c.</mixed-citation><mixed-citation xml:lang="en">Novitskiy P.V., Zograf I.A. Otsenka pogreshnostey rezul'tatov izmereniy (Evaluation of Errors in Measurement Results), Leningrad, 1991, 304 р. (in Russ.)</mixed-citation></citation-alternatives></ref><ref id="cit5"><label>5</label><citation-alternatives><mixed-citation xml:lang="ru">Хальд А. Математическая статистика с техническими приложениями. М.: Изд-во иностр. лит., 1956. 664 c.</mixed-citation><mixed-citation xml:lang="en">Hald A. Statistical Theory with Engineering Applications, NY, Wiley, 1952, 783 p.</mixed-citation></citation-alternatives></ref><ref id="cit6"><label>6</label><citation-alternatives><mixed-citation xml:lang="ru">Mann H. B., Wald A. On the choice of the number of class intervals in the application of the chi square test // Ann. Math. Stat. 1942. Vol. 13. P. 306–317.</mixed-citation><mixed-citation xml:lang="en">Mann H.B., Wald A. Ann. Math. Stat., 1942, vol. 13, рр. 306–317.</mixed-citation></citation-alternatives></ref><ref id="cit7"><label>7</label><citation-alternatives><mixed-citation xml:lang="ru">Williams C. A. Jr. On the Choice of the Number and Width of Classes for the Chi-Square Test of Goodness of Fit // Journal of the American Statistical Association. 1950. Vol. 45, N 249. P. 77–86.</mixed-citation><mixed-citation xml:lang="en">Williams C.A., jr., Journal of the American Statistical Association, 1950, no. 249(45), pp. 77–86.</mixed-citation></citation-alternatives></ref><ref id="cit8"><label>8</label><citation-alternatives><mixed-citation xml:lang="ru">Лемешко Б. Ю., Постовалов С. Н. О зависимости предельных распределений статистик хи-квадрат Пирсона и отношения правдоподобия от способа группирования данных // Заводская лаборатория. 1998. Т. 64, № 5. С. 56–63.</mixed-citation><mixed-citation xml:lang="en">Lemeshko B.Yu., Postovalov S.N. Industrial Laboratory. Diagnostics of Materials, 1998, no. 5(64), pp. 56–63. (in Russ.)</mixed-citation></citation-alternatives></ref><ref id="cit9"><label>9</label><citation-alternatives><mixed-citation xml:lang="ru">Лемешко Б. Ю., Чимитова Е. В. О выборе числа интервалов в критериях согласия типа χ&lt;sup&gt;2&lt;/sup&gt; // Заводская лаборатория. Диагностика материалов. 2003. Т. 69. С. 61–67.</mixed-citation><mixed-citation xml:lang="en">Lemeshko B.Yu., Chimitova E.V. Industrial Laboratory. Diagnostics of Materials, 2003, vol. 69, рр. 61–67. (in Russ.)</mixed-citation></citation-alternatives></ref><ref id="cit10"><label>10</label><citation-alternatives><mixed-citation xml:lang="ru">Куллдорф Г. Введение в теорию оценивания по группированным и частично группированным выборкам. М.: Наука, 1966. 176 c.</mixed-citation><mixed-citation xml:lang="en">Kulldorff G. Contributions to the theory of estimation from grouped and partially grouped samples, NY, John Wiley, 1963, 144 p.</mixed-citation></citation-alternatives></ref><ref id="cit11"><label>11</label><citation-alternatives><mixed-citation xml:lang="ru">Энциклопедия статистических терминов. Т. 1. Методологические основы статистики. М.: Федеральная служба государственной статистики, 2011 [Электронный ресурс]: https://03.rosstat.gov.ru/storage/mediabank/05_tom1(1).pdf, 18.03.2024.</mixed-citation><mixed-citation xml:lang="en">https://03.rosstat.gov.ru/storage/mediabank/05_tom1(1).pdf.</mixed-citation></citation-alternatives></ref><ref id="cit12"><label>12</label><citation-alternatives><mixed-citation xml:lang="ru">Винник П. М., Винник Т. В., Еськова Е. А. Математические задачи, возникающие при статистическом контроле технологических процессов машиностроительных производств // Вестник образования и развития науки Российской академии естественных наук. 2022. № 4. С. 24–30. DOI: 10.26163/RAEN.2022.32.23.003.</mixed-citation><mixed-citation xml:lang="en">Vinnik P.M., Vinnik T.V., Eskova E.A. Bulletin of Education and Development of Science of the Russian Academy of Natural Sciences, 2022, no. 4, pp. 24–30, DOI: 10.26163/RAEN.2022.32.23.003. (in Russ.)</mixed-citation></citation-alternatives></ref><ref id="cit13"><label>13</label><citation-alternatives><mixed-citation xml:lang="ru">Эндрюс Г. Теория разбиений. М.: Наука, 1982. 256 с.</mixed-citation><mixed-citation xml:lang="en">Andrews G.E. The theory of partitions, Addison-Wesley Pub. Co., 1976, 255 p.</mixed-citation></citation-alternatives></ref><ref id="cit14"><label>14</label><citation-alternatives><mixed-citation xml:lang="ru">Korf R. Multi-way number partitioning // IJCAI’09: Proc. of the 21&lt;sup&gt;st&lt;/sup&gt; Intern. Joint Conf. on Artificial Intelligence, Pasadena, California, USA, July 11–17, 2009. P. 538–543.</mixed-citation><mixed-citation xml:lang="en">Korf R. IJCAI'09, Proceedings of the 21&lt;sup&gt;st&lt;/sup&gt; International Joint Conference on Artificial Intelligence Pasadena, California, USA, July 11-17, 2009, pp. 538–543.</mixed-citation></citation-alternatives></ref><ref id="cit15"><label>15</label><citation-alternatives><mixed-citation xml:lang="ru">Бардасов С. А. Предпочтительность метода равных частот относительно метода равных интервалов при построении вариационных рядов // Вестн. Тюменск. гос. ун-та. 2003. № 5. С. 217–219.</mixed-citation><mixed-citation xml:lang="en">Bardasov S.A. Bulletin of Tyumen State University, 2003, no. 5, pp. 217–219. (in Russ.)</mixed-citation></citation-alternatives></ref></ref-list><fn-group><fn fn-type="conflict"><p>The authors declare that there are no conflicts of interest present.</p></fn></fn-group></back></article>
