DOI 10.17586/0021-3454-2024-67-9-751-758
УДК 658.562.012.7, 519.233.33, 519.6
ОПТИМАЛЬНОЕ ОБЪЕДИНЕНИЕ ИНТЕРВАЛОВ ГРУППИРОВАННОЙ ВЫБОРКИ ДЛЯ ПРИМЕНЕНИЯ КРИТЕРИЯ ТИПА χ2
;
Винник Т. В.
;
Еськова Е. А.
Балтийский государственный технический университет "ВОЕНМЕХ" им. Д. Ф. Устинова, кафедра высшей математики ; ассистент
Ссылка для цитирования : Винник П. М., Винник Т. В., Еськова Е. А. Оптимальное объединение интервалов группированной выборки для применения критерия типа χ2 // Изв. вузов. Приборостроение. 2024. Т. 67, № 9. С. 751–758. DOI: 10.17586/0021-3454-2024-67-9-751-758.
Аннотация. Обсужается применение интервалов равной длины или интервалов равной вероятности для использования критерия типа χ2. При этом интервалы равной вероятности предопределяются проверяемым законом распределения. При формировании исходной выборки по данным реального производства она часто сразу является группированной с заранее заданными и неизменяемыми на производстве границами группировки и может не удовлетворять рекомендациям по применению критериев типа χ2. Предложен способ построения набора оптимальных интервалов группировки путем объединения некоторых из имеющихся в исходной выборке интервалов. Под оптимальным набором таких интервалов понимается набор интервалов, имеющий наименьшее квадратическое отклонение взвешенных частот попадания от дискретного равномерного распределения, что позволяет не изменять набор интервалов при смене подбираемого закона распределения и автоматически решить проблему выбора оптимального числа интервалов. Перечислены некоторые свойства таких наборов, рассмотрены примеры возникающих при их построении ситуаций, приведен пример формирования оптимального набора.
Аннотация. Обсужается применение интервалов равной длины или интервалов равной вероятности для использования критерия типа χ2. При этом интервалы равной вероятности предопределяются проверяемым законом распределения. При формировании исходной выборки по данным реального производства она часто сразу является группированной с заранее заданными и неизменяемыми на производстве границами группировки и может не удовлетворять рекомендациям по применению критериев типа χ2. Предложен способ построения набора оптимальных интервалов группировки путем объединения некоторых из имеющихся в исходной выборке интервалов. Под оптимальным набором таких интервалов понимается набор интервалов, имеющий наименьшее квадратическое отклонение взвешенных частот попадания от дискретного равномерного распределения, что позволяет не изменять набор интервалов при смене подбираемого закона распределения и автоматически решить проблему выбора оптимального числа интервалов. Перечислены некоторые свойства таких наборов, рассмотрены примеры возникающих при их построении ситуаций, приведен пример формирования оптимального набора.
Ключевые слова: закон распределения, эмпирические данные, критерий типа χ2, интервалы группировки, группированные выборки, оптимальность группировки
Список литературы:
Список литературы:
- Миттаг Х.-Й., Ринне Х. Статистические методы обеспечения качества. М.: Машиностроение, 1995. 616 с.
- Кобзарь А. И. Прикладная математическая статистика. Для инженеров и научных работников. М.: ФИЗМАТЛИТ, 2006. 816 с.
- Лемешко Б. Ю., Постовалов С. Н. Статистический анализ одномерных наблюдений по частично группированным данным // Изв. вузов. Физика. 1995. № 9. С. 39–45.
- Новицкий П. В., Зограф И. А. Оценка погрешностей результатов измерений Л.: Энергоатомиздат, 1991. 304 c.
- Хальд А. Математическая статистика с техническими приложениями. М.: Изд-во иностр. лит., 1956. 664 c.
- Mann H. B., Wald A. On the choice of the number of class intervals in the application of the chi square test // Ann. Math. Stat. 1942. Vol. 13. P. 306–317.
- Williams C. A. Jr. On the Choice of the Number and Width of Classes for the Chi-Square Test of Goodness of Fit // Journal of the American Statistical Association. 1950. Vol. 45, N 249. P. 77–86.
- Лемешко Б. Ю., Постовалов С. Н. О зависимости предельных распределений статистик хи-квадрат Пирсона и отношения правдоподобия от способа группирования данных // Заводская лаборатория. 1998. Т. 64, № 5. С. 56–63.
- Лемешко Б. Ю., Чимитова Е. В. О выборе числа интервалов в критериях согласия типа χ2 // Заводская лаборатория. Диагностика материалов. 2003. Т. 69. С. 61–67.
- Куллдорф Г. Введение в теорию оценивания по группированным и частично группированным выборкам. М.: Наука, 1966. 176 c.
- Энциклопедия статистических терминов. Т. 1. Методологические основы статистики. М.: Федеральная служба государственной статистики, 2011 [Электронный ресурс]: https://03.rosstat.gov.ru/storage/mediabank/05_ tom1(1).pdf, 18.03.2024.
- Винник П. М., Винник Т. В., Еськова Е. А. Математические задачи, возникающие при статистическом контроле технологических процессов машиностроительных производств // Вестник образования и развития науки Российской академии естественных наук. 2022. № 4. С. 24–30. DOI: 10.26163/RAEN.2022.32.23.003.
- Эндрюс Г. Теория разбиений. М.: Наука, 1982. 256 с.
- Korf R. Multi-way number partitioning // IJCAI’09: Proc. of the 21st Intern. Joint Conf. on Artificial Intelligence, Pasadena, California, USA, July 11–17, 2009. P. 538–543.
- Бардасов С. А. Предпочтительность метода равных частот относительно метода равных интервалов при построении вариационных рядов // Вестн. Тюменск. гос. ун-та. 2003. № 5. С. 217–219.