Основы статистического анализа данных. Статистический анализ данных (курс лекций, К.В.Воронцов)

1. Определение термина "статистика" и история ее возникновения


Статистика - это точная наука, изучающая методы сбора, анализа и обработки данных, которые описывают массовые действия, явления и процессы. Данные, изучаемые в статистике, затрагивают не отдельные объекты, а их совокупности. Главным методом сбора данных для статистики является полное обследование объектов, имеющих отношение к изучаемой проблеме.

Статистика - отрасль знаний, в которой излагаются общие вопросы сбора, измерения и анализа массовых статистических (количественных или качественных) данных.

Слово «статистика» происходит от латинского status - состояние дел. В науку термин «статистика» ввел немецкий ученый Готфрид Ахенваль в 1746 году, предложив заменить название курса «Государствоведение», преподававшегося в университетах Германии, на «Статистику», положив тем самым начало развитию статистики как науки и учебной дисциплины. Несмотря на это, статистический учет вёлся намного раньше: проводились переписи населения в Древнем Китае, осуществлялось сравнение военного потенциала государств, велся учет имущества граждан в Древнем Риме и т. п.

Статистика разрабатывает специальную методологию исследования и обработки материалов: массовые статистические наблюдения, метод группировок, средних величин, индексов, балансовый метод, метод графических изображений и другие методы анализа статистических данных.

Начало статистической практики относится примерно ко времени возникновения государства. Первой опубликованной статистической информацией можно считать глиняные таблички Шумерского царства (III - II тысячелетия до н. э.).

Вначале под статистикой понимали описание экономического и политического состояния государства или его части. Например, к 1792 г. относится определение: «статистика описывает состояние государства в настоящее время или в некоторый известный момент в прошлом». И в настоящее время деятельность государственных статистических служб вполне укладывается в это определение.

Постепенно термин «статистика» стал использоваться более широко. В XX веке статистику часто рассматривают прежде всего как самостоятельную научную дисциплину. Статистика есть совокупность методов и принципов, согласно которым проводится сбор, анализ, сравнение, представление и интерпретация числовых данных. В 1954 г. академик АН УССР Б. В. Гнеденко дал следующее определение: «Статистика состоит из трёх разделов:

Сбор статистических сведений, то есть сведений, характеризующих отдельные единицы каких-либо массовых совокупностей;

Статистическое исследование полученных данных, заключающееся в выяснении тех закономерностей, которые могут быть установлены на основе данных массового наблюдения;

Разработка приёмов статистического наблюдения и анализа статистических данных. Последний раздел, собственно, и составляет содержание математической статистики».

Термин «статистика» употребляют ещё в двух смыслах. Во-первых, в обиходе под «статистикой» часто понимают набор количественных данных о каком-либо явлении или процессе. Во-вторых, статистикой называют функцию от результатов наблюдений, используемую для оценки характеристик и параметров распределений и проверки гипотез.

Типовые примеры раннего этапа применения статистических методов описаны в Библии, в Ветхом Завете. Там, в частности, приводится число воинов в различных племенах. С математической точки зрения дело сводилось к подсчёту числа попаданий значений наблюдаемых признаков в определённые градации.

Сразу после возникновения теории вероятностей (Паскаль, Ферма, XVII век) вероятностные модели стали использоваться при обработке статистических данных. Например, изучалась частота рождения мальчиков и девочек, было установлено отличие вероятности рождения мальчика от 0.5, анализировались причины того, что в парижских приютах эта вероятность не та, что в самом Париже, и т. д.

В 1794 г. (по другим данным - в 1795 г.) немецкий математик Карл Гаусс формализовал один из методов современной математической статистики - метод наименьших квадратов. В XIX веке заметный вклад в развитие практической статистики внёс бельгиец Кетле, на основе анализа большого числа реальных данных показавший устойчивость относительных статистических показателей, таких, как доля самоубийств среди всех смертей.

Первая треть ХХ века прошла под знаком параметрической статистики. Изучались методы, основанные на анализе данных из параметрических семейств распределений, описываемых кривыми семейства Пирсона. Наиболее популярным было нормальное распределение. Для проверки гипотез использовались критерии Пирсона, Стьюдента, Фишера. Были предложены метод максимального правдоподобия, дисперсионный анализ, сформулированы основные идеи планирования эксперимента.

Разработанную в первой трети ХХ века теорию анализа данных называют параметрической статистикой, поскольку её основной объект изучения - это выборки из распределений, описываемых одним или небольшим числом параметров. Наиболее общим является семейство кривых Пирсона, задаваемых четырьмя параметрами. Как правило, нельзя указать каких-либо веских причин, по которым распределение результатов конкретных наблюдений должно входить в то или иное параметрическое семейство. Исключения хорошо известны: если вероятностная модель предусматривает суммирование независимых случайных величин, то сумму естественно описывать нормальным распределением; если же в модели рассматривается произведение таких величин, то итог, видимо, приближается логарифмически нормальным распределением и так далее.

В настоящее время термин статистика употребляется в 4 значениях:

Наука, изучающая количественную сторону массовых явлений и процессов в неразрывной связи с их качественным содержанием - учебный предмет в высших и средних специальных учебных заведений;

Совокупность цифровых сведений, характеризующих состояние массовых явлений и процессов общественной жизни; статистические данные, представляемые в отчетности предприятий, организаций, отраслей экономики, а также публикуемых в сборниках, справочниках, периодической печати и в сети Интернет, которые являются результатом статистической работы;

Отрасль практической деятельности («статистический учет») по сбору, обработке, анализу и публикации массовых цифровых данных о самых различных явлениях и процессах общественной жизни;

Некий параметр ряда случайных величин, получаемый по определенному алгоритму из результатов наблюдений, например, статистические критерии (критические статистики), применяющиеся при проверке различных гипотез (предположительных утверждений) относительно природы или значений отдельных показателей исследуемых данных, особенностей их распределения и пр.


2. Описание научных подходов и методов статистики


Как и любая другая наука, статистика имеет свой предмет и метод исследования. Статистика изучает количественную сторону массовых общественных явлений в неразрывной связи с их качественной стороной или содержанием, а также исследует количественное выражение закономерностей общественного развития в конкретных условиях места и времени. Такое изучение основывается на системе категорий (понятий), отражающих наиболее общие и существенные свойства, признаки, связи и отношения предметов и явлений объективного мира.

Статистическая совокупность - множество социально-экономических объектов или явлений общественной жизни, объединенных качественной основой, но отличающихся друг от друга отдельными признаками, т.е. однородных в одном отношении, но разнородных в другом. Таковы, например, совокупность домохозяйств, семей, предприятий, фирм и т.п.

Единица совокупности - первичный элемент статистической совокупности, являющийся носителем признаков и основой ведущегося при обследовании счета.

Признак единицы совокупности - свойства единицы совокупности, которые различаются способами их измерения и другими особенностями

Статистический показатель - понятие, отображающее количественные характеристики (размеры) или соотношения признаков общественных явлений. Статистические показатели можно подразделить на первичные (объемные) - характеризуют либо общее число единиц совокупности (объем совокупности), либо сумму значений какого-либо признака (объем признака) и выражаются абсолютными величинами и вторичные (расчетные) - задаются на единицу первичного показателя и выражаются относительными и средними величинами. Статистические показатели могут быть плановыми, отчетными и прогнозными.

Система статистических показателей - совокупность статистических показателей, отражающая взаимосвязи, которые объективно существуют между явлениями. Она охватывает все стороны общественной жизни как на макро-, так и на микроуровне. С изменением условий жизни общества меняются и системы статистических показателей, совершенствуется методология их расчета.

Совокупность приемов, пользуясь которыми статистика исследует свой предмет, составляет метод статистики. Можно выделить 3 группы статистических методов (3 этапа статистического исследования):

Cтатистическое наблюдение - научно организованный сбор сведений, заключающийся в регистрации тех или иных фактов, признаков, относящихся к каждой единице изучаемой совокупности;

Сводка и группировка - обработка собранных первичных данных, включающая их группировку, обобщение и оформление в таблицах;

Статистический анализ - на основе итоговых данных сводки рассчитываются различные обобщающие показатели в виде средних и относительных величин, выявляются определенные закономерности в распределениях, динамике показателей и т.п.

Таким образом, любое законченное статистическое исследование проходит в 3 этапа, между которыми, разумеется, могут быть перерывы во времени.

Статистические методы - методы анализа статистических данных. Выделяют методы прикладной статистики, которые могут применяться во всех областях научных исследований и любых отраслях народного хозяйства, и другие статистические методы, применимость которых ограничена той или иной сферой. Имеются в виду такие методы, как статистический приемочный контроль, статистическое регулирование технологических процессов, надежность и испытания, планирование экспериментов.

Классификация статистических методов. Статистические методы анализа данных применяются практически во всех областях деятельности человека. Их используют всегда, когда необходимо получить и обосновать какие-либо суждения о группе (объектов или субъектов) с некоторой внутренней неоднородностью.

Целесообразно выделить три вида научной и прикладной деятельности в области статистических методов анализа данных (по степени специфичности методов, сопряженной с погруженностью в конкретные проблемы):

а) разработка и исследование методов общего назначения, без учета специфики области применения;

б) разработка и исследование статистических моделей реальных явлений и процессов в соответствии с потребностями той или иной области деятельности;

в) применение статистических методов и моделей для статистического анализа конкретных данных.

Прикладная статистика - это наука о том, как обрабатывать данные произвольной природы. Математической основой прикладной статистики и статистических методов анализа является теория вероятностей и математическая статистика.

Описание вида данных и механизма их порождения - начало любого статистического исследования. Для описания данных применяют как детерминированные, так и вероятностные методы. С помощью детерминированных методов можно проанализировать только те данные, которые имеются в распоряжении исследователя. Например, с их помощью получены таблицы, рассчитанные органами официальной государственной статистики на основе представленных предприятиями и организациями статистических отчетов. Перенести полученные результаты на более широкую совокупность, использовать их для предсказания и управления можно лишь на основе вероятностно-статистического моделирования. Поэтому в математическую статистику часто включают лишь методы, опирающиеся на теорию вероятностей.

Статистические методы - научные методы описания и изучения массовых явлений, допускающих количественное (численное) выражение. Слово статистика (от игал. stato - государство) имеет общий корень со словом государство. Первоначально оно относилось к науке управления и означало сбор данных о некоторых параметрах жизнедеятельности государства. Со временем статистика стала охватывать сбор, обработку и анализ данных о массовых явлениях вообще; ныне статистические методы охватывают собою практически все области знаний и жизнедеятельности общества.

Статистические методы включают в себя и экспериментальное, и теоретическое начала. Статистика исходит, прежде всего, из опыта; недаром ее зачастую определяют как науку об общих способах обработки результатов эксперимента. Обработка массовых опытных данных представляет самостоятельную задачу. Иногда простая регистрация некоторых рядов наблюдений приводит к тому или иному значимому выводу. Так, если в некоторой стране из года в год растет объем валового внутреннего продукта, то это говорит об ее устойчивом развитии. Однако в большинстве случаев для обработки опытного статистического материала используются математические модели исследуемого явления, основу которых составляют идеи и методы теории вероятностей.

Теория вероятностей есть наука о массовых случайных явлениях. Массовость означает, что исследуются огромные количества однородных явлений (объектов, процессов). Случайность же означает, что значение рассматриваемого параметра отдельного явления (объекта) в своей основе не зависит и не определяется значениями этого параметра у других явлений, входящих в ту же совокупность. Основной характеристикой массового случайного явления является распределение вероятностей. Теорию вероятностей можно определить как науку о вероятностных распределениях их свойствах, видах, законах взаимосвязей, распределении величин, характеризующих исследуемый объект, и законах изменения распределений во времени. Так, говорят о распределении молекул газа по скоростям, о распределениях доходов граждан в некотором обществе и т. д.

Эмпирически задаваемые распределения соотносятся с т. н. генеральной совокупностью, т. е. с наиболее полным теоретическим описанием распределений соответствующих массовых явлений. При этом во.многих случаях бывает нецелесообразно перебирать все элементы рассматриваемых совокупностей либо в силу чрезвычайно большого их числа, либо в силу того, что при наличии некоторого числа перебранных элементов учет новых не внесет существенных изменений в общие результаты. Для этих случаев разработан специальный выборочный метод исследования общих свойств статистических систем на основе изучения лишь части соответствующих элементов, взятых на выборку. Так, при оценке политических симпатий граждан некоторого региона или страны перед предстоящими выборами невозможно проводить сплошной опрос граждан. В этих случаях и прибегают к выборочному методу Чтобы выборочное распределение достаточно надежно характеризовало исследуемую систему, оно должно удовлетворять специальным условиям репрезентативности. Репрезентативность требует случайного выбора элементов и учета макроструктуры всего массового явления.

Распределения представляют наиболее общую характеристику массовых случайных явлений. Задание исходного распределения нередко предполагает построение математической модели соответствующих областей действительности. Построение и анализ таких моделей и составляет основную направленность статистических методов. Построенная математическая модель, в свою очередь, указывает, какие переменные следует измерять и какие из них имеют основное значение. Но главное в построении математической модели состоит в объяснении исследуемых явлений и процессов. Если модель достаточно полна, то она описывает зависимости между основными параметрами этих явлений.

Статистические методы в естествознании породили многие научные теории, привели к разработке важнейших фундаментальных направлений исследования - классической статистической физики, генетики, квантовой теории, теории цепных химических реакций и др. Следует, однако, отметить, что во многих случаях исходные вероятностные распределения задаются не путем непосредственной обработки массового материала. Вероятностная гипотеза чаще всего вводится гипотетически, косвенно, на основе теоретических предпосылок. Так, в учение о газах предположение о существовании вероятностных распределений было введено как гипотеза, на основе допущений о молекулярном беспорядке. Возможность подобного задания вероятностных распределений и проверки их справедливости обусловлена характером и природой самих распределений, математическое выражение которых обладает самостоятельными характеристиками, достаточно независимыми от конкретных значений элементов.

Особые сложности возникают при применении статистических методов в изучении социальных явлений. Анализ общих направлений социальных процессов и внутренних механизмов, вызывающих конкретные статистические результаты, необычайно трудоемок. Так, благосостояние людей характеризуется весьма многими параметрами и соответствующими распределениями - уровнем доходов, участием в общественно-полезном труде, уровнем образования и здравоохранения и др. показателями жизнедеятельности человека. Выявление взаимосвязи этих распределений и тенденций их изменения требует решения многих сложных задач. Состояние общества можно определить через такие параметры, как внутренний валовый продукт, потребление энергии на душу населения, расслоение общества по доходам и т. п. Вместе с тем общество представляет собой необычайно сложную систему, а познание сложных систем основывается на разработке многих моделей, выражающих различные аспекты их структуры и функционирования. Соответственно, для более полной характеристики состояния общества требуется оперировать весьма многими параметрами и их распределениями. Так, говорят об экономической, производственной, сельскохозяйственной, социальной и многих других статистиках. Для объединения данных этих статистик в единую целостную картину необходимо выявление субординации, иерархии параметров, характеризующих состояние общества.


3. Взаимосвязь статистики с другими науками


Статистика является мультидисциплиной, так как она использует методы и принципы, заимствованные из других дисциплин. Так, в качестве теоретической базы для формирования статистической науки служат знания в области социологии и экономической теории. В рамках этих дисциплин происходит изучение законов общественных явлений. Статистика помогает произвести оценку масштаба того или иного явления, а также разработать систему методов для анализа и изучения. Статистика, несомненно, связана с математикой, так как для выявления закономерностей, оценки и анализа объекта исследования требуется ряд математических операций, методов и законов, а систематизация результатов находит отражения в виде графиков и таблиц.


4. Виды статистических исследований


Наблюдение как начальный этап исследования связано со сбором исходных данных об изучаемом вопросе. Оно свойственно многим наукам. Однако каждая наука имеет свою специфику, отличаясь по своим наблюдениям. Поэтому не всякое наблюдение - статистическое.

Статистическое исследование - это научно организованный по единой программе сбор, сводка и анализ данных (фактов) о социально-экономических, демографических и других явлениях и процессах общественной жизни в государстве с регистрацией их наиболее существенных признаков в учетной документации.

Отличительными чертами (спецификой) статистического исследования являются: целенаправленность, организованность, массовость, системность (комплексность), сопоставимость, документированность, контролируемость, практичность.

В целом статистическое исследование должно:

Иметь общественно-полезную цель и всеобщую (государственную) значимость;

Относиться к предмету статистики в конкретных условиях его места и времени;

Выражать статистический вид учета (а не бухгалтерский и не оперативный);

Проводиться по заранее разработанной программе с ее научно обоснованным методологическим и другим обеспечением;

Осуществлять сбор массовых данных (фактов), в которых отражается вся совокупность причинно-следственных и других факторов, разносторонне характеризующих явление;

Регистрироваться в виде учетных документов установленного образца;

Гарантировать отсутствие ошибок наблюдения или же сводить их к возможному минимуму;

Предусматривать определенные критерии качества и способы контроля собранных данных, обеспечивая их достоверность, полноту и содержательность;

Ориентироваться на экономически эффективную технологию сбора и обработки данных;

Быть надежной информационной базой для всех последующих этапов статистического исследования и всех пользователей статистической информацией.

Исследования, не удовлетворяющие этим требованиям, статистическими не являются. Не являются статистическими исследования, например, наблюдения и исследования: матери за играющим ребенком (личный вопрос); зрителей за театральной постановкой (нет учетной документации по зрелищу); научного работника за физико-химическими опытами с их измерениями, расчетами и документальной регистрацией (не массово-общественные данные); врача за больными с ведением медицинских карточек (оперативный учет); бухгалтера за движением денежных средств на банковском счете предприятия (бухгалтерский учет); журналистов за общественной и личной жизнедеятельностью государственных лиц или иных знаменитостей (не предмет статистики).

Статистическая совокупность - множество единиц, обладающих массовостью, типичностью, качественной однородностью и наличием вариации.

Статистическая совокупность состоит из материально существующих объектов (Работники, предприятия, страны, регионы), является объектом статистического исследования.

Статистическое наблюдение является первой стадией статистического исследования, представляющий собой научно организованный сбор данных об изучаемых явлениях и процессах общественной жизни.


5. Предназначение выборочного метода


Множество всех единиц совокупности, обладающих определенным признаком и подлежащих изучению, носит в статистике название генеральной совокупности.

На практике по тем или иным причинам не всегда возможно или же нецелесообразно рассматривать всю генеральную совокупность. Тогда ограничиваются изучением лишь некоторой части ее, конечной целью которого является распространение полученных результатов на всю генеральную совокупность, т. е. применяют выборочный метод.

Для этого из генеральной совокупности особым образом отбирается часть элементов, так называемая выборка, и результаты обработки выборочных данных (например, средние арифметические значения) обобщаются на всю совокупность.

Теоретической основой выборочного метода является закон больших чисел. В силу этого закона при ограниченном рассеивании признака в генеральной совокупности и достаточно большой выборке с вероятностью, близкой к полной достоверности, выборочная средняя может быть сколь угодно близка к генеральной средней. Закон этот, включающий в себя группу теорем, доказан строго математически. Таким образом, средняя арифметическая, рассчитанная по выборке, может с достаточным основанием рассматриваться как показатель, характеризующий генеральную совокупность в целом.

Разумеется, не всякая выборка может быть основой для характеристики всей совокупности, к которой она принадлежит. Таким свойством обладают лишь репрезентативные (представительные) выборки, т. е. выборки, которые правильно отражают свойства генеральной совокупности. Существуют способы, позволяющие гарантировать достаточную репрезентативность выборки. Как доказано в ряде теорем математической статистики, таким способом при условии достаточно большой выборки является метод случайного отбора элементов генеральной совокупности, такого отбора, когда каждый элемент генеральной совокупности имеет равный с другими элементами шанс попасть в выборку. Выборки, полученные таким способом, называются случайными выборками. Случайность выборки является, таким образом, существенным условием применения выборочного метода.

Области применения выборочного метода в исторических исследованиях. Сфера приложения этого метода в изучении истории обширна. Во-первых, историки могут применять выборочный метод при проведении всякого рода обследований с целью изучения различных явлений и процессов современности. Правда, сейчас такими исследованиями больше занимаются социологи, чем историки, хотя именно историки могут проводить конкретно-социологические обследования, опираясь на исторические данные, и добиваться наибольшего эффекта таких исследований.

Во-вторых, историки нередко имеют дело с сохранившимися данными ранее проведенных собственно выборочных обследований. Такие обследования стали все более широко применяться с конца XIX в. Так, при проведении ряда сплошных обследований и переписей выборочно собирались и собираются сведения по более широкой программе. Многие данные собирались только выборочно. Наиболее интересными среди них для историков являются описания разного рода хозяйственных комплексов (крестьянских хозяйств, промышленных предприятий, колхозов, совхозов и т. д.), а также бюджетные и другого рода обследования различных слоев населения.

В-третьих, в распоряжении историков имеется значительное число разнообразных первичных сплошных массовых данных, полная обработка которых весьма затруднительна даже при применении современной вычислительной техники. При изучении их может быть применен выборочный метод. Такие материалы имеются по всем периодам истории, но особенно много их по истории XIX-XX вв.

Наконец, историкам очень часто приходится иметь дело с частичными данными, так называемыми естественными выборками. При обработке этих данных также может быть применен выборочный метод. Характер естественных выборок бывает различным. Прежде всего они могут представлять собой сохранившийся остаток некогда существовавшей более или менее полной совокупности данных. Так, многие актовые материалы, документы текущего делопроизводства и отчетности представляют остатки в прошлом обширных и систематических массивов данных. Далее, при систематическом сборе тех или иных сведений отдельные показатели могли учитываться лишь частично (именно частично, а не выборочно). Так, при составлении «Экономических примечаний» к Генеральному межеванию второй половины XVIII в., которое охватило большую часть территории страны, ряд показателей (количество населения, площадь земельных угодий и др.) учитывался повсеместно, а некоторые важные данные (о величине барских запашек, размерах оброка) были собраны в силу целого ряда причин лишь частично. Многие сведения вообще собирались только частично. Это, прежде всего, относится к тем из них, которые не являлись нормативными и сбором которых занимались различные местные органы, научные и общественные организации и отдельные лица.

Итак, области выборочного метода в исторических исследованиях весьма обширны, а задачи, которые следует при этом решать, различны.

Так, при организации выборочного обследования и формировании выборки из имеющихся сплошных данных исследователь располагает определенной свободой маневра для обеспечения репрезентативности выборок. При этом он может опираться на хорошо разработанную в математической статистике теорию, методику и технику получения таких выборок.

При оперировании же данными ранее проведенных выборочных обследований следует проверить, в какой мере они были выполнены в соответствии с требованиями, предъявляемыми к выборочному методу. Для этого надо знать, как было проведено это обследование. Чаще всего это вполне можно сделать.

И совсем иное дело - естественные выборки данных, с которыми очень часто имеет дело историк. Прежде всего необходимо доказать их репрезентативность. Без этого экстраполяция показателей выборок на всю изучаемую совокупность будет необоснованной. Поскольку пока еще нет достаточно надежных методов математической проверки репрезентативности естественных выборок, то решающую роль здесь играет выяснение истории их возникновения и содержательный анализ имеющихся данных.


6. Предназначение корреляционно-регрессионного анализа

сезонный регрессионный статистический выборочный

Экономические данные почти всегда представлены в виде таблиц. Числовые данные, содержащиеся в таблицах, обычно имеют между собой явные (известные) или неявные (скрытые) связи.

Явно связанные показатели получены методами прямого счета, т. е. вычислены по заранее известным формулам. Например, вычисляются проценты выполнения плана, темпы роста, индексы и т. д.

Связи же второго типа заранее неизвестны. Однако люди должны уметь объяснять и предсказывать (прогнозировать) сложные явления для того, чтобы управлять ими. Поэтому специалисты с помощью наблюдений стремятся выявить скрытые зависимости и выразить их в виде формул, т. е. математически смоделировать явления или процессы. Одну из таких возможностей предоставляет корреляционно-регрессионный анализ.

Обратим внимание на то, что специалисты строят и используют математические модели для трех обобщенных целей - объяснения, предсказания и управления.

Представление экономических и других данных в электронных таблицах в наши дни стало простым и естественным. Оснащение же электронных таблиц средствами корреляционно-регрессионного анализа способствует тому, что из группы сложных, глубоко научных и потому редко используемых, почти экзотических методов, корреляционно-регрессионный анализ превращается для специалиста в повседневный, эффективный и оперативный аналитический инструмент.

Пользуясь методами корреляционно-регрессионного анализа, аналитики измеряют тесноту связей показателей с помощью коэффициента корреляции. При этом обнаруживаются связи, различные по силе (сильные, слабые, умеренные и др.) и различные по направлению (прямые, обратные). Если связи окажутся существенными, то целесообразно будет найти их математическое выражение в виде регрессионной модели и оценить статистическую значимость модели. В экономике значимое уравнение регрессии используется, как правило, для прогнозирования изучаемого явления или показателя.

Поэтому регрессионный анализ называют основным методом современной математической статистики для выявления неявных и завуалированных связей между данными наблюдений. Электронные же таблицы делают такой анализ легко доступным.


7. Предназначение и методика проведения анализа сезонных колебаний


При анализе многих рядов динамики можно заметить определённую повторяемость (цикличность, закономерность в колебаниях), изменениях их уровней. Например, в большинстве отраслей экономики это проявляется в виде внутритрудовых чередований, подъёмов и спадов выпуска продукции, неодинаковым потреблением сырья и энергии, колебания уровней себестоимости, прибыли и других показателей. Ярко выраженный сезонный характер имеет сельское хозяйство, рыболовство, лесозаготовка, охота, туризм и так далее. Значительной колеблемости во внутренней динамике подвержены денежные обращения и товарооборот. Наибольшие денежные доходы образуются у населения в III и IV кварталах, особенно у селян. Максимальный объём товарооборота (различного) приходится на конец каждого года. Продажа молочных продуктов увеличивается обычно во II и III кварталах, а фруктов и овощей - во втором полугодии. Потребление пищи связано со временем суток, днями недели, временами года. Также закономерности в изменении уровней ряда динамики принято называть сезонными колебаниями.

Под сезонными колебаниями понимается более или менее устойчивые внутригодовые колебания уровней динамического рода, обусловленные спецификами развития данного явления.

Цель изучения сезонных колебаний состоит как в разработке мер его ликвидации или смягчению сезонных колебаний (нередко этим и ограничивается статистическое исследование), так и для оптимального исследования условий, благоприятствующих развитию массовых явлений и процессов.

При статистическом исследовании в рядах динамики сезонных колебаний решаются следующие две взаимосвязанные задачи: 1) выявление специфики развития изучаемого явления во внутренне годовой динамике; 2) измерение сезонных колебаний изучаемого явления с построением модели сезонной волны.

Особое внимание отражается на обеспечение сопоставимости уровней ряда. При наличии в исходном материале разновесных по продолжительности периодов времени объёмные величины пересчитываются в средние величины, характеризующие интенсивность развития изучаемого явления в единицу времени.

Для выявления сезонных колебаний обычно берутся данные за несколько последних лет, распределённые по определённым внутригодовым периодам.

Для измерения сезонных колебаний исчисляются специальные статистические показатели, которые называются индексами сезонности (Is) и совокупность которых отражает сезонную волну.

Для вычисления индексов сезонности применяются различные методы.

В общем виде индексы сезонности определяются отношением исходных (фактических) уровней первоначального ряда (y) к расчётным (теоретическим) уровням, выступающим в качестве базы сравнения.

Тем самым ликвидируется (устраняется) влияние основной тенденции (тренда). Затем усреднением индивидуальных индексов сезонных одноимённых внутригодовых периодов анализируемого ряда динамики устраняется влияние на сезонные колебания случайных отклонений. Поэтому для каждого периода сумма определяется обобщением показателей в виде средних индексов сезонности

В зависимости от характера тренда последняя формула может быть записана по разному:

Например, коэффициенты месячной непрерывности определяются в этом случае как отношения уровня каждого месяца к среднемесячному за год. Для большей надёжности индексы сезонности обычно рассчитываются по данным за 3-5 лет. При этом для каждого месяца рассчитывается средняя величина уровня за эти 3-5 дет, которая сопоставляется с общим ежемесячным уровнем за 3-5 лет. Можно, таким образом, сначала для каждого из этих 3-5 лет рассчитать ежемесячный индекс сезонности, из которых рассчитывается затем средний индекс сезонности для каждого месяца. Результаты будут совпадать.

Поэтому для всех фактических уровней анализируемого ряда динамики общий средний уровень является постоянной величиной, то этот подход называется способом постоянной средней. В этом случае сначала выполняется предварительное аналитическое выравнивание фактических уровней и после этого исчисляется сезонная величина, но не от постоянной средней (как в предыдущем случае), а от выровненных данных.

Измерение сезонных колебаний на базе переменных уровней тренда (расчётных уровней ряда) в статистике получило название способы переменной средней. Есть и другие, более сложные методы расчета индексов сезонности. Например, если все колебания членов первоначального ряда объясняются только (или в основном) сезонными причинами, то уравнение тренда выражает только сезонные колебания. Следовательно, изучение сезонного колебания сводится к проблеме выбора адекватной математической функции. Однако наилучшее с точки зрения отражения сезонных колебаний нагрузки уравнения выбирают по минимуму среднего квадратичного индексов сезонности 100 %.


Список литературы


1.Гусаров В.М. Теория статистики: М.: «Аудит», издательское объединение «ЮНИТИ», 2010.

2.Лапунина Л., Четверина Т. Напряженность на Российском рынке и механизмы ее преодоления: Вопросы экономики, N 2, 2008.

.Общая теория статистики: статистическая методология в изучении коммерческой деятельности, Учебник / под редакцией А.А. Спирина, О.Э. Башиной: М.: «Финансы и статистика», 2009.

.Сабирьянова К. Микроэкономический анализ динамических изменений на Российском рынке труда. Вопросы экономики, N 1, 2012.

.Социальная статистика: Учебник/ Под ред. чл.-кор. РАН И.И. Елисеевой.- 3-е изд., перераб. и доп.- М.: Финансы и статистика, 2011.- 480 с.


Репетиторство

Нужна помощь по изучению какой-либы темы?

Наши специалисты проконсультируют или окажут репетиторские услуги по интересующей вас тематике.
Отправь заявку с указанием темы прямо сейчас, чтобы узнать о возможности получения консультации.

Достаточно часто возникают явления, которые можно проанализировать исключительно при помощи статистических методов. В этой связи для каждого субъекта, стремящегося глубоко изучить проблему, проникнуть в суть темы, важно иметь представление о них. В статье разберемся, что такое статистический анализ данных, каковы его особенности, а также какие методы применяют при его проведении.

Особенности терминологии

Статистику рассматривают в качестве специфичной науки, системы госорганов, а также как набор цифр. Между тем далеко не все цифры можно считать статистикой. Разберемся в этом вопросе.

Для начала следует вспомнить, что слово "статистика" имеет латинские корни и происходит от понятия status. В буквальном переводе термин означает "определенное положение предметов, вещей". Следовательно, статистическими признаются только такие данные, с помощью которых фиксируются относительно устойчивые явления. Анализ, собственно, и выявляет эту устойчивость. Его используют, к примеру, при изучении социально-экономических, политических явлений.

Назначение

Применение статистического анализа позволяет отображать количественные показатели в неразрывной связи с качественными. В результате исследователь может увидеть взаимодействие фактов, установить закономерности, выявить типичные признаки ситуаций, сценарии развития, обосновать прогноз.

Статистический анализ - это один из ключевых инструментов СМИ. Чаще всего его используют в деловых изданиях, таких как, например, "Ведомости", "Коммерсант", "Эксперт-профи" и пр. В них всегда публикуются "аналитические рассуждения" о валютном курсе, котировке акций, учетных ставках, инвестициях, рынке, экономике в целом.

Разумеется, чтобы результаты анализа были достоверными, постоянно проводится сбор данных.

Источники информации

Сбор данных может осуществляться по-разному. Главное, чтобы способы не нарушали закон и не ущемляли интересы других лиц. Если говорить о СМИ, то для них ключевыми источниками информации выступают государственные статистические органы. Эти структуры должны:

  1. Собирать отчетные сведения в соответствии с утвержденными программами.
  2. Группировать информацию по тем или иным критериям, наиболее значимым для исследуемого явления, формировать сводки.
  3. Проводить собственный статистический анализ.

В задачи уполномоченных госорганов входит также предоставление полученных ими данных в отчетах, тематических подборках или пресс-релизах. В последнее время статистика публикуется на официальных сайтах госструктур.

Кроме указанных органов, информацию можно получить в Едином госреестре предприятий, учреждений, объединений и организаций. Цель его создания состоит в формировании единой информационной базы.

Для проведения анализа можно использовать информацию, полученную от межправительственных организаций. Существуют специальные базы данных экономической статистики стран.

Часто информация поступает от частных лиц, общественных организаций. Эти субъекты обычно ведут свою статистику. Так, к примеру, Союз охраны птиц в России регулярно устраивает так называемые соловьиные вечера. В конце мая через СМИ организация приглашает всех желающих поучаствовать в подсчете соловьев на территории Москвы. Полученные сведения обрабатываются группой экспертов. После этого сведения переносятся в специальную карту.

Многие журналисты обращаются за информацией к представителям других авторитетных СМИ, пользующихся у аудитории популярностью. Распространенным способом получения данных является опрос. При этом опрашиваемыми могут стать как рядовые граждане, так и эксперты в какой-либо области.

Специфика выбора методики

Перечень показателей, необходимых для проведения анализа, зависит от специфики исследуемого явления. К примеру, если изучается уровень благосостояния населения, приоритетными считаются данные о качестве жизни граждан, прожиточном минимуме на данной территории, размере МРОТ, пенсии, стипендии, потребительской корзины. При исследовании демографической ситуации важны показатели смертности и рождаемости, число мигрантов. Если изучается сфера промышленного производства, важные сведения для статистического анализа - это количество предприятий, их виды, объем продукции, уровень производительности труда и т. д.

Средние показатели

Как правило, при описании тех или иных явлений используются средние арифметические величины. Для их получения числа складывают друг с другом, а полученный результат делят на их количество.

Например, установлено, что в один госорган приходит 5 тысяч писем ежемесячно, а в другой - 1 000. Выходит, что первая структура получает в 5 раз больше обращений. При сравнении средних показателей может быть выражена в процентах. К примеру, средний заработок фармацевта составляет 70 % от ср. з/п инженера.

Итоговые сводки

Они представляют собой систематизацию признаков исследуемого события для выявления динамики его развития. К примеру, установлено, что в 1997 г. речной транспорт всех ведомств и управлений перевез 52,4 млн тонн груза, а в 2007 г. - 101,2 млн т. Чтобы понять изменения характера транспортировок за период с 1997 по 2007 г., можно сгруппировать итоговые показатели по видам объектов, а затем сравнить группы друг с другом. В итоге можно получить более полные сведения о развитии грузооборота.

Индексы

Их достаточно широко применяют при исследовании динамики событий. Индекс в статистическом анализе - это средний показатель, отражающий изменение явления под воздействием другого события, абсолютные показатели которого признаны неизменными.

К примеру, в демографии в качестве специфического индекса может выступать величина естественной убыли (прироста) населения. Ее определяют при сравнении уровня рождаемости и смертности.

Графики

Они используются для отображения динамики развития события. Для этого применяют фигуры, точки, линии, имеющие условные значения. Графики, с помощью которых выражаются количественные соотношения, именуются диаграммами или динамическими кривыми. Благодаря им можно наглядно увидеть динамику развития какого-то явления.

График, показывающий увеличение количества лиц, страдающих остеохондрозом, представляет собой кривую, уходящую вверх. Соответственно, по ней можно наглядно увидеть тенденцию заболеваемости. Люди, даже не прочитав текстовый материал, могут сформулировать выводы о сложившейся динамике и спрогнозировать развитие ситуации в дальнейшем.

Статистические таблицы

Они очень часто используются для отражения данных. С помощью статистических таблиц можно сопоставлять информацию по изменяющимся со временем показателям, различающимся в зависимости от страны и пр. Они представляют собой наглядную статистику, которой зачастую не нужны комментарии.

Методы

В основе статистического анализа лежат приемы и способы сбора, обработки и обобщения сведений. В зависимости от природы методы могут быть количественными и категориальными.

При помощи первых получают метрические данные, которые по своей структуре являются непрерывными. Их можно измерить при помощи интервальной шкалы. Она представляет собой систему чисел, равные промежутки между которыми отражают периодичность значений изучаемых показателей. Также используется шкала отношений. В ней, кроме расстояния, определяется также порядок значений.

Неметрические (категориальные) данные представляют собой качественные сведения, количество уникальных категорий и значений которых ограничено. Они могут быть представлены в виде номинальных или порядковых показателей. Первые используют для нумерации объектов. Для вторых предусматривается естественный порядок.

Одномерные методы

Они применяются в том случае, если для оценки всех элементов выборки используется единый измеритель или если последних несколько для каждого компонента, но переменные исследуются обособленно друг от друга.

Одномерные методы различаются в зависимости от типа данных: метрические или неметрические. Первые измеряют по относительной или интервальной шкале, вторые - по номинальной или порядковой. Кроме этого, деление методов осуществляется на классы в зависимости от количества исследуемых выборок. При этом необходимо учитывать, что это число определяют по тому, как осуществляется работа с информацией для конкретного анализа, а не по способу сбора данных.

Однофакторное дисперсионное исследование

Цель статистического анализа может состоять в изучении воздействия одного либо нескольких факторов на конкретный признак объекта. Однофакторный дисперсионный метод применяется тогда, когда у исследователя есть 3 и больше независимые выборки. При этом они должны быть получены из генеральной совокупности посредством изменения независимого фактора, для которого отсутствуют количественные измерения по каким-то причинам. Предполагается, что имеются различные и одинаковые выборочные дисперсии. В этой связи следует определить, оказал ли данный фактор значительное влияние на разброс или он стал следствием случайностей, возникших вследствие небольших объемов выборок.

Вариационный ряд

Он представляет собой упорядоченное распределение единиц генеральной совокупности, как правило, по возрастающим (в редких случаях по убывающим) показателям признака и подсчет их числа с тем или другим значением признака.

Вариация является различием в показателе какого-либо признака у различных единиц конкретной совокупности, возникающим в один и тот же момент либо период. К примеру, сотрудники компании отличаются друг от друга по возрасту, росту, доходам, весу и пр. Возникает вариация вследствие того, что индивидуальные показатели признака формируются под комплексным влиянием разных факторов. В каждом конкретном случае они сочетаются по-разному.

Вариационный ряд бывает:

  1. Ранжированным. Он представлен в виде перечня отдельных единиц генеральной совокупности, расположенных в порядке убывания либо возрастания исследуемого признака.
  2. Дискретным. Он представлен в форме таблицы, включающей в себя конкретные показатели изменяющегося признака х и количества единиц совокупности с заданной величиной f признака частот.
  3. Интервальным. В этом случае показатель непрерывного признака задается с помощью интервалов. Они характеризуются частотой t.

Многомерный статистический анализ

Он проводится, если для оценки элементов выборки применяется 2 и более измерителя, и переменные изучаются одновременно. Такая форма статистического анализа отличается от одномерного способа в первую очередь тем, что при ее использовании внимание сосредотачивается на уровне взаимосвязи между явлениями, а не на средних показателях и распределениях (дисперсиях).

Среди основных методов многомерного статистического исследования выделяют:

  1. Кросс-табуляцию. С ее использованием одновременно характеризуют значение двух и более переменных.
  2. Дисперсионный статистический анализ. Этот метод ориентирован на поиск зависимостей среди экспериментальных данных посредством изучения существенности различий в средних показателях.
  3. Ковариационный анализ. Он тесно связан с дисперсионным методом. При ковариационном исследовании зависимая переменная корректируется в соответствии с информацией, связанной с ней. Это обеспечивает возможность устранения изменчивости, вносимой извне, и, соответственно, повысить эффективность исследования.

Также существует дискриминантный анализ. Он применяется, если зависимая переменная является категориальной, а независимые (предикторы) - интервальными.

ТОЛЬЯТТИНСКИЙ ГОСУДАРСТВЕННЫЙ ИНСТИТУТ

АВТОМЕХАНИЧЕСКИЙ ИНСТИТУТ

Кафедра Технология машиностроения

СТАТИСТИЧЕСКИЕ МЕТОДЫ АНАЛИЗА КАЧЕСТВА

Методическое пособие для студентов машиностроительных специальностей

Тольятти 2003


В методическом пособии представлен обзор методов статистического обеспечения качества. Подробно рассмотрено применение 7 традиционных японских методов анализа качества. Включены материалы, рассматривающие идею статистического приемочного контроля. В отдельной главе изложен необходимый для понимания статистических методов математический аппарат.


СПИСОК ОБОЗНАЧЕНИЙ

ВВЕДЕНИЕ

2. МЕТОДЫ КОНТРОЛЯ КАЧЕСТВА

2.1 Контрольные листки

2.2 Диаграммы Парето

2.2.2 Анализ диаграмм Парето

2.3 Диаграммы Исикавы

2.4 Гистограммы

2.4.1 Построение гистограммы

2.4.2 Анализ гистограмм

2.5 Диаграммы рассеивания

2.6 Контрольные карты

2.6.3 Анализ контрольных карт

2.7 Расслоение

3.2 Pacчeт индексов воспроизводимости

4.2 Использование диаграмм Парето

5.2 Числовые характеристики случайных величин

5.3 Типовые теоретические распределения случайных величин


СПИСОК ОБОЗНАЧЕНИЙ

ВГД - верхняя граница поля допуска:

НГД - нижняя граница поля допуска;

ВКГ - верхняя контрольная граница на контрольной карте;

НКГ - нижняя контрольная граница на контрольной карте;

Ср, Срк - индексы воспроизводимости:

n-объем выборки;

Р(А) - вероятность случайного события А;

R - размах (длина интервала, в который попадают все значения наблюдаемого параметра);

s - стандартное отклонение;

 - среднее квадратичное отклонение;

х- выборочное среднее (среднее арифметическое всех значений наблюдаемого параметра);

х - медиана.


ВВЕДЕНИЕ

Статистические методы - важный инструмент повышения качества в любом современном производстве, тем более производстве серийном. Все ведущие автомобильные компании применяют статистические методы практически на всех стадиях жизненного цикла, как для анализа и контроля качества производственных процессов и произведенной продукции, так и для разработок новых технологий и принятия правильных управленческих решений.

В настоящее время в международном стандарте ИСО 9001 одним из элементов Системы качества является элемент «Статистические методы», а в комплекс международных стандартов QS-9000 входит руководство «Статистическое управление процессами».

Настоящее пособие содержит описание основных приемов и методов статистического управления качеством.

Глава 1 посвящена общим вопросам статистического управления процессами. В главах 2 и 3 рассматриваются статистические методы контроля качества процесса производства (так называемые «семь простых японских методов качества») и вытекающие из них возможные управляющие воздействия. В главе 4 применение методов анализа качества производственных процессов иллюстрируется на конкретных примерах, характерных для производственной деятельности АО «АВТОВАЗ». В главе 5 изложен необходимый минимум математического аппарата для понимания статистических методов.


1. СТАТИСТИЧЕСКОЕ УПРАВЛЕНИЕ ПРОЦЕССАМИ

Процесс - это совокупность взаимосвязанных ресурсов и деятельности, которая преобразует входящие элементы в выходящие . В результате процесса происходит преобразование исходных элементов (материалов, информации), которое увеличивает их ценность за счет применения квалифицированного труда и знаний.

В автомобилестроении под процессом понимается создание и эксплуатация автомобиля. Здесь элементами является сочетание поставщиков (входные материалы), производителей, оборудования, методов, окружающей среды, потребителей.

В заводских производственных условиях распространен термин технологический процесс как процесс изготовления некоторого продукта при наличии определенных ресурсов с наблюдаемым (контролируемым) результатом деятельности.

Способность некоторого объекта удовлетворять потребительским запросам покупателей связывается с понятием качество. Различают качество процессов и качество продукции. Качество продукции обусловлено эффективностью изучения спроса, проектирования, изготовления, сопровождения в эксплуатации.

Качество процесса определяется тем, насколько потребительские свойства продукта удовлетворяются на заводском уровне требованиями конструкторской и технологической документации.

Эффективность процесса оценивается как высокое качество выпускаемой продукции и обеспечивается с помощью системы управления.

Система управления процессом строится как замкнутая система с использованием принципа обратной связи. Само управление процессом основывается на активном анализе информации о продукции.

Информация о продукции - показатели качества изделий, а также параметры, описывающие условия протекания процесса (такие как, температура, цикличность и т.д.); собирается на основе анализа фактического качества изготовленной продукции. Если эта информация собрана и правильно интерпретирована, то она может показать, нуждается ли процесс я корректировке или нет.

Реализация управления процессом осуществляется с помощью различных мероприятий, распадающихся на две группы по признаку функциональной направленности.

Мероприятия, направленные на продукцию - мероприятия, нацеленные на поиск дефектов в уже изготовленной продукции. Если в процессе производства не выдерживаются технологические условия, то всегда будет существовать необходимость сортировать продукцию, исправлять несоответствия в изделиях. Это будет продолжаться до тех пор, пока не будут приняты необходимые меры по улучшению процесса. Мероприятия по выявлению и устранению брака ориентированы нa npошлоe.

Мероприятия, направленные на улучшение процесса - мероприятия, связанные со структурной перестройкой процесса, направлены на улучшение процесса (то есть позволяют избежать брака). Такими мероприятиями являются, например, обучение сотрудников, изменения в сырье, переналадка оборудования или даже изменение технологии. Важно, что эти мероприятия ориентированы в будущее.

Очевидно, что контроль качества в производстве, за которым следуют только мероприятия по продукции, является плохой заменой для мероприятий по действительному улучшению качества процесса.

При производстве любой продукции качество готового изделия зависит от множества самых различных факторов. Например, на размеры обрабатываемой детали оказывают влияние свойства и состояние:

a) станка (износ подшипника, износ элементов позиционирования),

b) инструмента (прочность, износ),

c) материала (твердость).

d) персонала (эффективность обучения),

e) рабочей среды (температура, бесперебойное электропитание) и т.п.

В результате, даже в условиях автоматизированного производства невозможно получить два абсолютно одинаковых изделия.

Отличия в конечных результатах процесса называют изменчивостью. Изменчивость в качестве готового продукта связывается с изменчивостью в процессе производства, которая обуславливает появление дефектных (несоответствующих) изделий даже при отлаженном производственном процессе. Выявление факторов, влияющих на качество, и уменьшение изменчивости процесса позволяет повысить качество выпускаемых изделий и уменьшить количество брака.

Следует распознавать два вида источников изменчивости:

Обычные причины изменчивости,

Особые причины изменчивости.

Обычные причины изменчивости представляют собой стабильную систему случайных факторов. В этом случае результаты процесса статистически предсказуемы.

Приведем примеры группы факторов случайного характера:

Случайные разбросы характеристик материалов, полуфабрикатов и комплектующих изделий;

Случайные разбросы параметров технологических процессов (окружающая среда и рабочее тело);

Случайные разбросы характеристик и параметров средств технологического оснащения, измерительных приборов, режущего и мерительного инструмента, стендового испытательного оборудования и т.д.;

Случайные неблагоприятные сочетания допусков в размерных технологических цепочках при изготовлении продукции и т.д.

Изменчивость, обусловленная факторами случайного характера, может быть уменьшена путем проведения соответствующих организационно-технических мероприятий на основе исследования результатов их статистического анализа и описания их проявления статистическими закономерностями.

Особые причины изменчивости представляют собой неслучайные факторы, нарушающие стабильный ход процесса.

Приведем примеры группы факторов неслучайного характера:

Применение материалов, полуфабрикатов и комплектующих изделий, не предусмотренных технологическими процессами, в том числе с просроченными сроками годности;

Несоблюдение установленных нормативно-технической документацией приемов, методов и режимов обработки изделий и их испытаний;

Использование не аттестованных во время средств контроля и средств технологического оснащения с просроченными сроками годности;

Неудовлетворительное состояние средств технологического оснащения, ремонтной базы, испытательного оборудования и т.д.:

Отсутствие закрепления конкретных видов работ (операций) за определенными исполнителями:

Неполное завершение предыдущих операций:

Несоблюдение последовательности выполнения работ (операций), заданных по технологическим маршрутным картам:


2. МЕТОДЫ КОНТРОЛЯ КАЧЕСТВА

Стремясь наиболее эффективно использовать статистические методы управления качеством, японские специалисты разработали такие процедуры, которые достаточно просты для применения, то есть не требуют специальных знаний, но в то же время дают результаты, позволяющие профессионалам оперативно анализировать и совершенствовать производственный процесс.

Совокупность используемых методов получила название «семь простых методов контроля качества» и содержит:

Контрольные листки,

Диаграммы Парето,

Диаграммы Исикавы.

Гистограммы,

Диаграммы рассеивания,

Контрольные карты,

Расслоение (стратификация).

Рассмотрим каждый из этих методов.

2.1 Контрольные листки

Анализ любого вида деятельности возможен только на основании имеющейся информации, поэтому применение каждого из методов контроля качества должно начинаться со сбора необходимых данных. Прежде всего, необходимо четко сформулировать цель сбора интересующих нас сведений (контроль и регулирование производственного процесса; анализ отклонений от установленных требований; контроль продукции). Затем продумывают, какие типы данных нужно собрать, их характер, частоту и способы измерения, надежность получаемых результатов и т.п. Так как для анализа данных используются различные статистические методы, то в процессе сбора информации следует позаботиться об упорядочении получаемых результатов, чтобы облегчить их последующую обработку. Результаты наблюдений удобнее всего заносить в контрольные листки.

Контрольный листок - это бумажный бланк для первичного сбора информации.

Контрольный листок предназначен для фиксации контролируемых параметров:

Облегчения процесса сбора данных;

Автоматического упорядочивания сбора данных для упрощения дальнейшей обработки.

Основные требования, предъявляемые к контрольному листку:

Простота фиксации результатов наблюдений;

Наглядность полученных результатов;

Полнота данных.

Для достижения этих требований необходимо заранее продумать форму контрольных листков и постоянно совершенствовать эту форму с учетом замечаний и пожеланий тех, кто заполняет контрольные листки. Следует стремиться к тому, чтобы при фиксации результатов требовалось производить минимум записей, например, просто делать отметки в нужных графах. Хорошо, когда в результате автоматически получается гистограмма (см. раздел 2.4) или диаграмма рассеивания (раздел 2.5). Но при этом контрольный листок должен содержать максимум исходной информации (не просто диаметр валика, а станок, на котором изготавливалась деталь, смена, время, обрабатываемая партия и т.п.)

Так как полученная информация необходима для последующего анализа причин дефектов, связанных как с несовершенством технологического процесса, так и с различными другими факторами, то следует требовать очень тщательного заполнения всех граф контрольного листка. Пренебрежение какими-либо данными, например, о номере партии или времени измерения исследуемого параметра, может потребовать последующего дополнительного сбора информации, что усложнит работу.

Примеры контрольных листков приведены на рисунках 2.1.1. - 2.1.4.

На рис. 2.1.1 показан контрольный листок для регистрации распределения измеряемого параметра в ходе производственного процесса. В данном случае фиксируются изменения в размерах некоторой детали, подвергающейся механической обработке, причем в чертеже был указан размер 8.300 0,008. При заполнении контрольного листка после каждого замера в соответствующей клеточке ставился крест. В результате к концу измерений на контрольном листке оказалась готовая гистограмма.

На рис. 2.1.2. показан контрольный листок для регистрации видов несоответствий, используемый при приемочном контроле некоторой детали. Здесь фиксируются определенные несоответствия, выявляемые контролером и в конце рабочего дня можно быстро подсчитать число и разновидности обнаруженных несоответствий. Такой контрольный листок удобен для последующего построения диаграммы Парето, но он не дает возмож¬ности расслоения данных, то есть разбивки их на группы, например, по времени или месту изготовления детали.

Если предполагается последующий дополнительный анализ информации, лучше использовать листок, приведенный на рисунке 2.1.3. На этом листке регистрируются несоответствия в деталях (вал КПП), изготовленных на станках 003.716.33 и 003.718.33 фирмы FISCHER с учетом станков, рабочих, дней изготовления и типов дефектов. Здесь сразу видно, что больше всего брака допускает рабочий В, а самым неудачным днем оказалась среда. Последующее исследование показало, что в среду смазывающе-охлаждающая жидкость была низкого качества.

Для выявления причин несоответствий бывает удобно не просто фиксировать количество и виды несоответствий, но и отслеживать место их локализации. Пример соответствующего контрольного листка приведен на рисунке 2.1.4. При контроле отливок фиксируются не только наличие, но и месторасположение раковин. В результате анализа такого контрольного листка проще выявлять возможные причины возникновения исследуемого дефекта.

2.2 Диаграммы Парето

При производстве продукции неминуемо приходится сталкиваться с потерями (некачественные изделия и затраты, связанные с их производством). В большинстве случаев подавляющее число несоответствий и связанных с ними потерь возникает из-за относительно небольшого числа причин. Этот постулат положен в основу анализа Парето, который предназначен для разделения проблем качества на немногочисленные существенно важные и многочисленные несущественные.

Для определения немногочисленных существенно важных факторов строят диаграммы Парето.

Диаграмма Парето - это графическое представление степени важности причин или факторов, влияющих на исследуемую проблему.

Диаграммы Парето бывают двух видов:

1) Диаграмма Парето по результатам деятельности помогает выявить главную проблему и отражает нежелательные результаты деятельности

В сфере качества: дефекты, поломки, ошибки, отказы, рекламации, ремонты, возвраты продукции;

В сфере себестоимости: объем потерь, затраты;

В сфере поставок: нехватка запасов, ошибки в составлении счетов, срывы сроков поставок:

В сфере безопасности: несчастные случаи, аварии.

2) Диаграмма Парето по причинам отражает причины проблем, возникающих в ходе производства, и помогает выявить главную

По кадрам: смена, бригада, возраст, опыт работы, квалификация, индивидуальные характеристики работника;

По оборудованию: станки, агрегаты, инструментальная оснастка, модели, штампы, технология;

По сырью: изготовитель, вид сырья, поставщик, партия:

По методам работы: условия производства, приемы работы, последовательность операций.

2.2.1 Метод построения диаграммы Парето

1) Определить проблему, которую надо исследовать.

2) Выделить факторы, которые могут повлиять на сформулированную проблему.

3) Перечислить данные, которые надо собрать.

4) Установить метод и период сбора данных. Примечание. На этом этапе полезно привлекать экспертов, в том числе наиболее опытных работников, сталкивающихся с данной проблемой

Этап 2: Разработать контрольные листки для регистрации данных с перечнем видов собираемой информации.

Примечание Результаты деятельности желательно пpедставлять в денежном выражении, так как затраты являются важным критерием измерении и управлении

Этап 3: Заполнить листы регистрации данных, собрать всю полученную информацию и подсчитать итоги.

Этап 4: Составить общую таблицу данных, в которой отразить все проверяемые признаки (факторы), итоги по каждому признаку отдельно, накопленную сумму, проценты к общему итогу для каждого признака и накопленные проценты.

Пример 2.2.1.

Типы Число Накопленная % числа дефект Накопленный

дефектов дефектов сумма тов к общей процент

Деформация

Царапины Раковины 104

Трещины Пятна 10

Разрыв Прочие 4

При этом исследуемые признаки (факторы) располагают в порядке получившейся значимости, есть по убыванию общего числа зарегистрированных данных, но группу "прочие" всегда записывают в последнюю строку.

Этап 5: Построить столбиковую диаграмму, ориентируясь на левую вертикальную ось (то есть над интервалом, соответствующим признаку А, изобразить прямоугольник (столбик), высота которого равна числу появления этого признака).

Этап 6: На вертикалях, соответствующих правым концам каждого интервала, нанести точки накопленных сумм процентов, ориентируясь на правую шкалу. Соединить эти точки отрезками прямых. Полученная ломаная называется кривой Парето (кумулятивной кривой).

Этап 7: Нанести на диаграмму все необходимые надписи (название, наименование контролируемого изделия, имя составителя диаграммы, период сбора информации, объект исследования и место его проведения, общее число объектов контроля, а также разметку числовых значений на осях и расшифровку кодовых обозначений).

Диаграмма Парето, соответствующая примеру 2.2.1, приведена на рисунке 2.2.1.

2.2.2 Анализ диаграмм Парето

Значимость фактора определяется частотой его регистрации, наибольшая частота указывает наиболее существенный фактор. Поэтому на диаграмме Парето высоты столбцов указывают степень влияния каждого фактора на всю проблему в целом, а кривая Парето позволяет оценить изменение результата при устранении нескольких наиболее существенных факторов.

После выявления проблемы путем составления диаграммы Парето по результатам полезно составить диаграмму Парето но причинам. Тогда появляется возможность определить причины возникновения проблемы и. следовательно, наметить пути устранения выявленной главной причины. Таким образом, выделяется наиболее эффективный путь решения проблемы.

Следует заметить, однако, что если какой-либо нежелательный фактор можно устранить сразу с помощью простого решения, это надо сделать немедленно (каким бы незначительным этот фактор ни был). При этом из рассмотрения исключается несущественный фактор, который просто перестает воздействовать.

Если группа "прочие" факторы составляет большой процент, то надо попытаться использовать какой-либо другой способ классификации (группировки) признаков. При этом может возникнуть необходимость в дополнительных исследованиях. Этого не следует бояться. Вообще для выявления сути проблемы имеет смысл строить много различных диаграмм Парето, исследуя самые разные факторы и способы их взаимодействия. Только в этом случае становится понятно, какие из факторов наиболее существенны и каковы возможные пути их преобразования.

2.3 Диаграммы Исикавы

Результат процесса зависит от многочисленных факторов, причем некоторые из них могут влиять на другие, то есть быть связанными отношениями "причина - результат". Знание структуры этих отношений, то есть выявление цепочки причин и результатов, позволяет успешно решать проблемы управления, в том числе и проблемы управления качеством. Для удобства анализа структуры причин и результатов используют диаграммы Исикавы - диаграммы причин и результатов.

В области контроля качества диаграмма Исикавы - это диаграмма, которая показывает отношение между показателем качества и воздействующими на него факторами.

Диаграмму причин и результатов иногда называют диаграммой "рыбий скелет" в силу ее специфического вида (см. рис. 2.3.1). Исследуя определенный показатель качества, стремятся сформулировать главные причины, влияющие на этот показатель. Затем выделяют вторичные факторы, влияющие на главные причины, а также более мелкие причины, воздействующие на вторичные факторы, и т. д. Таким образом, для составления диаграммы Исикавы надо проранжировать факторы по их значимости и установить структуру взаимовлияний.

Диаграмма причин и результатов графически отображает установленные связи следующим образом: посередине листа проводится горизонтальная прямая ("хребет"), оканчивающаяся прямоугольником, в котором указан рассматриваемый показатель качества. Главные причины, влияющие на данный показатель, записываются выше и ниже прямой и соединяются с хребтом стрелками. Вторичные причины записывают между прямой и соответствующей главной причиной и соединяют с этой причиной стрелками. Затем на диаграмме показывают факторы, влияющие на вторичные причины. Чтобы диаграмма была пригодна для дальнейшего использования, на ней необходимо указать всю сопутствующую информацию (название, наименование изделия, процесса или группы процессов, участников процесса и т. п.).

После того, как все факторы, влияющие на данный показатель качества, оказались отраженными на диаграмме, нетрудно установить степень их важности. Наиболее значимые, оказывающие самое сильное воздействие, следует отметить, с тем, чтобы именно им уделить наибольшее внимание при последующей работе.

Часто диаграммы Исикавы используют для систематизации списка причин. В этом случае при исследовании определенного показателя качества стараются найти максимальное число причин, влияющих на этот показатель, а уже затем располагают их в диаграмму причин - результатов, связывая все факторы в единую иерархическую структуру.

При построении диаграмм Исикавы важно как можно точнее сформулировать показатель, тогда диаграмма будет более конкретной. Чтобы силу связей причина - результат можно было оценить объективно, желательно формулировать показатель качества и влияющие на него факторы так, что бы их можно было измерить, то есть оценить численно. В некоторых случаях для этого приходится вводить числовые параметры, характеризующие исследуемый показатель. Например, качество окраски будет характеризоваться количеством непрокрашенных мест, либо толщиной красочного слоя, либо сорностью.

После выявления наиболее важных причин надо постараться найти те факторы, по которым можно принять меры. Если по обнаруженной причине нельзя предпринять никаких действий, проблема неразрешима, и поэтому следует попытаться разбить ее на подпричины. Использование диаграммы помогает обнаружить элементы, которые нужно проверить, устранить или модифицировать, а также те элементы, которые надо добавить. Если стремиться усовершенствовать диаграмму, то можно не только лучше разобраться в исследуемом процессе, но и найти пути улучшения технологии изготовления изделия.

2.4 Гистограммы

Большинство факторов, оказывающих влияние на производственный процесс, не остаются неизменными. Поэтому числовые данные, собранные в результате наблюдения, не могут быть одинаковыми, но обязательно подчиняются определенным закономерностям, называемым распределением (см. гл. 6).

Если измерять контролируемый параметр непрерывно, можно построить его график плотности распределения (см. раздел 6.3). Однако на практике проводят измерения только в определенные промежутки времени и не всех изделий, а только некоторых. Поэтому по результатам измерений строят обычно гистограмму - ступенчатую фигуру, контуры которой дают приблизительное представление о графике плотности, то есть о характере распределения изучаемого параметра.

Гистограмма - это столбиковая диаграмма, служащая для графического представления имеющейся количественной информации.

Обычно основой для построения гистограммы служит интервальная таблица частот, в которой весь диапазон измеренных значений случайной величины разбит на некоторое число интервалов, и для каждого интервала указано количество значений, попавших на данный интервал (частота).

2.4.1 Построение гистограммы

Отметить на оси абсцисс максимальное и минимальное значения случайной величины и границы интервалов - точки a1, ..., an, . Для удобства расчетов и последующего анализа можно немного расширить диапазон значений случайной величины, например, до границ поля допуска.

Длина каждого интервала h = (an+1 – an) / k .

Над каждым интервалом построить прямоугольник высотой n/h (его площадь н,). Получившаяся ступенчатая фигура называется гистограммой частот. При этом площадь гистограммы частот равна объему выборки n:

Отрезок назовем основанием гистограммы.

Аналогично строится и гистограмма относительных частот - ступенча¬тая фигура, состоящая из прямоугольников, площади которых равны n/h , то есть общая площадь гистограммы относительных частот равна 1.

2.4.2 Анализ гистограмм

При построении гистограмм могут встретиться следующие случаи (рис. 2.4.)-2.4.7):

1) Обычный тип (симметричный или колоколообразный). Наивысшая частота оказывается в середине основания гистограммы (и постепенно снижается к обоим концам). Форма симметрична (рис. 2.4.1). Такая гистограмма по внешнему виду приближается к нормальной (гауссовской) кривой, и можно предполагать, что ни один из факторов, влияющих на исследуемый процесс, не преобладает над другими.

Примечание. Эта форма встречается чаще всего. В этом случае среднее значение случайной величины (применительно к технологической операции - это показатель уровня настроенности) близко к середине основания гистограммы, а степень ее рассеяния относительно среднего значения (для технологических операций - это показатель точности) характеризуется крутизной снижения столбцов

2) Гребенка (мультимодальный тип). Классы через один имеют более низкие частоты (рис. 2.4.2).

Примечание. Такая форма встречается, кода число единичных наблюдении, попадающих в класс, колеблется от класса к классу или когда действует определенное пра¬вило округления данных Возможно требуется осуществить расслоение данных, то есть определить дополнительные признаки для группировки наблюдаемых значений

3) положительно скошенное распределение (отрицательно скошенное распределение). Среднее значение гистограммы локализуется справа (сле¬ва) от середины основания гистограммы. Частоты довольно резко спадают

при движении влево (вправо) и, наоборот, медленно вправо (влево). Форма асимметрична (рис. 2.4.3).

Примечание. Такая форма встречается, когда нижняя (верхняя) граница регулируется либо теоретически, либо по значению допуска или когда левое (правое) значение недостижимо. В этом случае также можно предполагать, что на процесс оказывает преобладающее влияние какой-либо фактор, в частности, подобная форма встречается, когда имеет место замедленный (ускоренный) износ режущего инструмента.

Подобная гистограмма характерна также для распределения Рэлея (раздел 6.3), которое характеризует форму либо несимметричность изделия.

4) Распределение с обрывом слева (распределение с обрывом справа). Среднее арифметическое гистограммы локализуется далеко слева (справа) от середины основания. Частоты резко спадают при движении влево (вправо) и, наоборот, медленно вправо (влево). Форма асимметрична (рис. 2.4.4).

Примечание. Это одна из тех форм, которые часто встречаются при 100 %-ном просеивании изделий из-за плохой воспроизводимости процесса, а также когда проявляется резко выраженная положительная (отрицательная) асимметрия.

5) Плато (равномерное и прямоугольное распределения). Частоты в разных классах образуют плато, поскольку все классы имеют более или менее одинаковые ожидаемые частоты (рис. 2.4.5).

Примечание. Такая форма встречается в смеси нескольких распределений, имеющих различные средние, но может также указывать на какой-либо преобладающий фактор, например, равномерный износ режущего инструмента.

6) Двухпиковый тип (бимодальный тип). В окрестностях середины основания частота низкая, зато есть по пику с каждой стороны (рис. 2.4.6).

Примечание. Такая форма встречается, когда смешиваются два распределения с далеко отстоящими средними значениями, то есть имеет смысл провести расслоение данных. Такую же форму гистограммы можно наблюдать и в случае, когда какой-либо преобладающий фактор меняет свои характеристики, например, если режущий инструмент имеет сначала ускоренный, а затем замедленный износ.

7) Распределение с изолированный пиком. Наряду с распределением обычного типа появляется маленький изолированный пик (рис. 2.4.7)

Примечание. Такая форма появляется при наличии малых включений данных из другого распределения или ошибки измерения. При получении подобной гистограммы следует прежде всего проверить достоверность данных, а в том случае, когда результаты измерений не вызывают сомнения, продумать обоснованность выбранного способа разбиения наблюдаемых значений на интервалы

2.4.3 Оценка процесса по гистограммам

При использовании гистограмм для оценки качества процесса на шкале значений наблюдаемого параметра отмечают нижнюю и верхнюю границы поля допуска (поля спецификации) и через эти точки проводят две прямые параллельные столбцам гистограммы.

Если вся гистограмма оказывается внутри границ поля допуска (рис. 2.4.8), процесс статистически устойчив и не требует никакого вмешательства.

Если левая и правая границы гистограммы совпадают с границами поля допуска (рис. 2.4.9), то желательно уменьшить разброс процесса, так как любое воздействие может привести к появлению изделий, не удовлетворяющих допуску.

Если часть столбцов гистограммы оказывается за границами поля допуска (рис. 2.4.10 - 2.4.12), то необходимо провести регулировку процесса так, чтобы сместить среднее ближе к центру поля допуска (рис. 2.4.10,2.4.12) или уменьшить вариации, чтобы добиться меньшего разброса (рис. 2.4.11, 2.4.12).

2.5 Диаграммы рассеивания

Часто приходится выяснять, существует ли зависимость между двумя различными параметрами процесса. Например, зависят ли изменения в диаметре отверстия от изменений скорости вращения сверла.

Обычно предполагается, что исследуемые параметры отражают характеристики качества и влияющие на них факторы. Чтобы понять, есть ли какая-либо связь между рассматриваемыми параметрами, используют диаграммы рассеивания.

Диаграмма рассеивания - это графическое представление пар исследуемых данных в виде множества точек на координатной плоскости.

Диаграмма рассеивания дает возможность выдвинуть гипотезу о наличии или отсутствии корреляционной связи (см. раздел 6.5) между двумя случайными величинами. При этом изучаются обычно величины, описывающие

Характеристику качества и влияющий на нее фактор;

Две различные характеристики качества;

Два фактора, влияющие на одну характеристику качества.

2.5.1 Построение диаграммы рассеивания (поля корреляции)

1) Собрать парные данные (х,у) об изучаемых случайных величинах. Для удобства эти данные записывают в виде таблицы. Желательно, чтобы число наблюдений было не меньше 30, так как в противном случае результаты корреляционного и регрессионного анализа (см. раздел 6.5) недостаточно достоверны.

2) Ввести на плоскости систему координат Оху, причем шкалы на горизонтальной и вертикальной осях подбираются таким образом, чтобы обе длины рабочих частей получились примерно одинаковыми. В этом случае диаграмма рассеивания более удобна для визуального анализа.

3) Каждую пару данных отметить на координатной плоскости точкой с координатами (х,у). Если какие-либо пары повторяются, то соответствующие им точки надо либо ставить рядом, либо использовать условные обозначения, например, концентрические кружки.

4) Сделать поясняющие надписи, то есть название диаграммы; интервал времени, который отражается на диаграмме; число пар данных; названия и единицы измерения для каждой оси; данные о составителе диаграммы.

2.5.2 Анализ диаграммы рассеивания

Если на диаграмме рассеивания есть далеко отстоящие точки (выбросы), необходимо исследовать причины их появления (ошибки измерения или записи данных, либо изменения в условиях работы). При этом можно получить неожиданную, но иногда весьма полезную информацию, однако из последующего корреляционного анализа эти точки обычно исключают.

Если точки расположены хаотично (рис. 2.5.3), то полагают, что между рассматриваемыми случайными величинами нет корреляции.

Если точки группируются таким образом, что явно выражена некоторая тенденция (рис. 2.5.1, 2.5.2), то говорят о положительной (рис. 2.5.1) или отрицательной (рис. 2.5.2) корреляции.

Если точки расположены так, что можно предположить нелинейную зависимость (рис. 2.5.4), то бывает полезно осуществить расслоение (стратификацию) данных, то есть разделение данных по какому-либо дополнительному признаку. (Например, при исследовании зависимости равномерности окраски от марки применяемого красителя можно отдельно учесть степень загрузки резервуара для краски)

Так как всегда может оказаться, что требуется провести расслоение или осуществить группировку собранных данных каким-либо иным способом, то необходимо очень тщательно подходить к исходной информации. Кроме того, становиться понятным требование полноты поясняющих надписей на диаграмме рассеивания. Любые выводы, сделанные на основании диаграммы рассеивания, должны сопровождаться подробным перечислением условий сбора данных и составления этой диаграммы.

Во всех случаях после визуального анализа диаграммы рассеивания необходимо вычислить коэффициент корреляции по формулам (6.6.1) -(6.6.4). Это позволит подтвердить или опровергнуть выдвинутую гипотезу о наличии либо отсутствии корреляционной связи и установить силу этой связи.

Если диаграмма рассеивания позволяет предположить линейную корреляцию между изучаемыми величинами, то строятся линии регрессии, уравнения которых получают по формулам (6.6.7) - (6.6.9).

Прямые регрессии наносят обычно на диаграмму рассеивания, что позволяет более наглядно представить себе тенденцию влияния одной случайной величины на другую. При проведении регрессионного анализа предварительное построение диаграммы рассеивания является необходимым этапом, так как анализ этой диаграммы позволяет выдвинуть гипотезу о линейной или нелинейной зависимости, о степени доверия к обрабатываемым результатам измерений и даже о надежности методики проведения экспериментов.

Например, при обработке четырех различных множеств исходных данных, приведенных на рисунке 2.5.5, формулы (6.6.7) - (6.6.9) дают одинаковые прямые регрессии. Однако по диаграммам рассеивания можно предположить, что в случае а) действительно имеет место линейная корреляция; в случае b) - нелинейная зависимость, в случае с) есть одна выпавшая точка, в случае d) наблюдается «странная» группировка точек. Отсюда следует, что в случае с) надо повторить измерения либо обосновать возможность пренебрежения этим результатом; в случае d) необходимо получить дополнительные данные.

2.6 Контрольные карты

2.6.1 Виды контрольных карт и область их применения

Поскольку всякий процесс испытывает большое число незначительных случайных воздействий, то результаты измерений, полученные в ходе нормального течения процесса, непостоянны, то есть всякий процесс имеет некоторую изменчивость (разброс).

Считается, что процесс находится в статистически управляемом состоянии, если в нем отсутствуют систематические сдвиги. В этом состоянии можно предсказывать ход процесса. Но как только на процесс станут воздействовать неслучайные (особые) причины, он станет статистически неуправляемым, а результат процесса окажется непредсказуем. Если процесс выведен из статистически управляемого состояния, то требуется определенное вмешательство, чтобы сделать его снова статистически управляемым.

Чтобы судить о состоянии процесса, осуществляют отбор единиц продукции и измеряют контролируемые параметры. Совокупность отобранных объектов (наблюдаемых значений) образуют выборку (см. раздел 6.1.).

Для сравнения информации о текущем состоянии процесса, полученной по выборке, с контрольными границами, являющимися пределами собственного разброса, применяют контрольные карты.

Контрольная карта - это графическое представление характеристики процесса, состоящее из центральной линии, контрольных границ и конкретных значений имеющихся статистических данных, позволяющее оценить степень статистической управляемости процесса.

Существует много разных типов контрольных карт в зависимости от природы данных, вида статистической обработки данных и методов принятия решений.

В зависимости от сферы применения выделяют три основных вида контрольных карт (рис. 2.6.1):

Контрольные карты Шухарта и аналогичные им, позволяющие оценить, находится ли процесс в статистически управляемом состоянии;

Приемочные контрольные карты, предназначенные для определения критерия приемки процесса;

Адаптивные контрольные карты, с помощью которых регулируют процесс посредством планирования его тренда (тенденции изменения процесса с течением времени) и проведения упреждающей корректировки на основании прогнозов.

Данные для контрольных карт разделяют на "количественные" и «качественные».

Количественные данные - это результаты наблюдений, проводимых с помощью измерения и записи числовых значений данного показателя (при этом используется непрерывная шкала значений).

Качественные (альтернативные) данные - это результаты наблюдений наличия (или отсутствия) определенного признака. Обычно подсчитывают, сколько элементов выборки имеют данный признак (например, сколько деталей из контролируемой партии имеют внешние дефекты). Иногда считают число таких признаков, имеющихся в выборке определенного объема (например, количество различных дефектов, отмеченных в одном изделии).

В зависимости от видов данных и методов их статистической обработки выделяют различные типы контрольных карт, основные из которых представлены на рис. 2.6.2.

При использовании количественных данных применяют контрольные карты двух видов:

Контрольные карты расположения, характеризующие меру расположения (центр) изучаемых данных, например, выборочное среднее х или медиану У;

Контрольные карты разброса, характеризующие меру разброса (рассеяния) отдельных выборочных данных в выборке или подгруппе, например, размах R или выборочное стандартное отклонение s.

Для анализа и управления процессами, показатели качества которых являются непрерывными величинами (длина, вес, концентрация, температура и т.п.), обычно используют парные контрольные карты, например, карту для выборочного среднего значения и карту размаха: х - карту и R -карту.

Контрольные карты по качественному признаку используют, когда качество процесса оценивают по количеству несоответствий.

Если учитывается количество несоответствующих единиц продукции в выборке, то применяют пр-карту (для выборок постоянного объема) или р-карту (для выборок меняющегося объема; в этом случае подсчитывают долю несоответствующих единиц); если учитывается количество несоответствий в исследуемом изделии либо процессе, то обычно применяют с-карту и и- карту.

Для выбора подходящей контрольной карты по альтернативному признаку удобно использовать таблицу 2.6.1.

Таблица 2.6.1.

Число на единицу выборки (объем выборки переменный*) Общее число в выборке (объем выборки постоянный)

Несоответствующие единицы Р "Р

Несоответствия и с

*0бъемы выборок отличаются не более чем в 1.6 раз

В контрольных картах для количественных данных предполагают, что имеет место нормальное распределение. Параметры этого распределения используют для установления контрольных границ, которые обычно фиксируются на уровне ±3s от центральной линии (здесь х - выборочное среднее изучаемых данных).

В контрольных картах для альтернативных данных используют либо биномиальное (пр-карты, р-карты), либо пуассоновское распределения (с-карты, м-карты).

2.6.2 Построение контрольных карт

Для первоначального построения X- и R - карт вычисляют средние значения и размах для каждой выборки R

X=(x1+x2+….Xn)/n (2.6.1)

R=Xmax-Xmin (2.6.2) Затем вычисляют среднее процесса и средний размах процесса

Xcp=(Xi+X2+...+Xk)/k (2.6.3)

Rcp=(R1+R2+...+Rk)/k (2.6.4)

где x, Ri, - среднее и размах i-ой (i=l,...,k) выборки. Эти величины определяют положение центральных линий на Х- карте и R - карте соответственно.

Положение верхних (ВКГ) и нижних (НКГ) контрольных границ для размахов и средних рассчитывается по формулам:

ВКГr=DrRср (2.6.5)

НКГr= D1,R,p ; (2.6.6) BKГ x =x+A2,Rcp ; (2.6.7)

НКГ x=x-A2Rср (2.6.8)

где –А2,D1,D4-константы, зависящие от объема выборки и приведенные в таблице 2.6.2.

n 2 3 4 5 6 7 8 9 10

D4 3.27 2.57 2.28 2.11 2.00 1.92 1.86 1.82 1.78

Di * *. * * * 0.08 0.14 0.18 0.22

A2 1.88 1.02 0.73 0.58 0.48 0.42 0.37 0.34 0.31

Для объемов выборки меньше 7 значение D„ а также и значение НКГ являются отрицательными. В таких случаях не строится.

После этого подготавливают бланки контрольных карт, на которых слева наносят вертикальную ось со шкалой возможных значений измеряемого параметра (x или R) сплошную горизонтальную линию, соответствующую значению вычисленному по формулам 2.6.3 или 2.6.4 и горизонтальные контрольные границы, рассчитанные по формулам (2.6.5 - 2.6.8). Если при расчете нижняя контрольная граница получается отрицательной, ее обычно не рассматривают, то есть не указывают на соответствующей карте. На подготовленных таким образом бланках точками отмечают значения изучаемой характеристики (показателя качества), получаемые в результате наблюдений. Примеры контрольных карт приведены на рис. 2.6.3. Для удобства последующего анализа обычно х- карту и R - карту строят одну под другой с одинаковым масштабом горизонтальных осей.

Если показатель качества представлен числом несоответствующих изделий или процентов (долей) несоответствий применяют пр - карты (для выборок постоянного объема) или р - карты (для выборок меняющегося объема). Эти карты основаны на биномиальном распределении (см. раздел 6.3), которое определяется всего одним параметром р, поэтому здесь нет необходимости строить пару карт. На бланке р - карты отмечают горизонтальную ось с номерами рассматриваемых подгрупп и вертикальную ось, где указаны возможные процентные значения несоответствий, встречающихся в подгруппах (или количество несоответствующих изделий - для пр - карты). Вычисляют среднее значение доли несоответствий р (или среднее число несоответствующих изделий п ~р) и отмечают его сплошной горизонтальной линией.

Если анализ и управление процессом ведутся по несоответствиям, но при этом величина р мала, то применяют с - карты (карты числа несоответствий) или u=с/п - карты (карты числа несоответствий, приходящихся на единицу продукции).

2.6.3 Анализ контрольных карт

Управляемое состояние процесса - состояние, когда процесс стабилен, а его среднее и разброс не меняются. Определить, вышел ли процесс из данного состояния, можно по контрольным картам на основании следующих критериев:

1) Выход за контрольные пределы. На карте есть точки, лежащие вне контрольных границ (рис 2.6.5).

2) Серия. Несколько (7 и более) точек подряд оказываются по одну сторону от центральной линии (число таких точек называется длиной серии); либо 10 из 11 последовательных точек находятся по одну сторону от центра(рис2.6.6).

3) Тренд. Точки образуют непрерывно повышающуюся или понижающуюся кривую (рис.2.6.7).

4) Приближение к контрольным пределам. Есть точки, которые приближаются к контрольным границам, причем 2 или более точек оказываются на расстоянии более 2о от центральной линии (рис.2.6.8).

5) Приближение к центральной линии. Большинство точек оказывается внутри центральной трети полосы между контрольными границами (рис.2.6.9).

6) Периодичность Кривая повторяет структуру «то подъем, то спад» с примерно одинаковыми интервалами времени (рис.2.6.10).

Порядок исследования контрольных x- карты и R - карты задается следующим алгоритмом:

Если встретилась одна из ситуаций, которая указывает на опасность выхода процесса из управляемого состояния (рис. 2.6.5 - 2.6.10), то необходимо

Проверить координаты «опасных точек»;

Проверить расчет границ;

Провести анализ измерительной системы;

Проверить достоверность данных измерений;

и, наконец,

Приступить к поиску особых причин (то есть каких-либо неслучайных воздействий на процесс) с целью их устранения.

В ситуациях 4-6 (рис. 2.6.8 - 2.6.10) бывает полезно построить гистограмму и провести расслоение процесса на подгруппы.

Пример 2.6.1. Для контроля процесса обработки внешнего вала коробки передач (модель 2108) на токарном одношпиндельном станке (фирмы FISCHER) замерялся контрольный параметр (линейный размер) обработанных деталей (см. рис. 4.1.1). По спецификации процесс должен иметь следующие характеристики:

Линейный размер 274.5 ± 0.1

Верхний предел допуска 274.6

Нижний предел допуска 274.4

По результатам измерений 80 изделий были построены х- карта и R-карта (рис. 2.6.11) со следующ

х = 274.464; ВКГх = 274.493; НКГх = 274.435;

R =0.016; ВКГR= 0.05; HKFR отрицательна, поэтому на рисунке не указана Х-карта

При анализе R- карты видно, что на участке 3-9 наблюдается понижающий тренд, на участке 11 -24 - повышающий тренд, много точек, вышедших за контрольные границы (9-15,17,27,30,36), а точки 9-10 находятся на границе поля допуска. Таким образом, во-первых, процесс не является статистически устойчивым. В силу того, что границы поля допуска в данном случае шире контрольных границ, может сложиться впечатление, что на участке 25 - 36 процесс является стабильным, однако выход за контрольные границы свидетельствует о наличии особых (неслучайных) воздействий. Необходимо провести технологический анализ условий протекания процесса обработки. Так, например, понижающий тренд может быть обусловлен образованием наклепа на инструменте, либо влиянием температурных деформаций в кинематике и гидравлике станка.

Приближение к центральной линии на R - карте может свидетельствовать о систематическом (неслучайном) торцевом биении базового центра, равном Rp=0.016.

В результате анализа контрольных карт можно сделать вывод о том, что в данном случае технологическая точность не обеспечивается, технологический процесс требует доработки.

2.6.4 Использование контрольных карт для оценки корреляции

Если требуется установить, имеется ли корреляционная зависимость между двумя исследуемыми параметрами Х и Y, вместо построения диаграммы рассеивания можно использовать контрольные карты.

Значения параметров Х и Y замеряют в одни и те же моменты времени и строят R- карту и X- карту. Центральная линия на этих картах соответствует значению медианы, т.е. Количество точек на обеих картах одинаково.

Затем на каждой из этих карт точки, находящиеся выше центральной линии, отмечают знаком «-», точки ниже центральной линии - знаком «-», точки, попавшие на центральную линию, - знаком «О». После этого составляют таблицу знаков, соответствующих каждой паре (X,Y). К этой таблице добавляют еще одну строку, в которой ставится «код» пары по следующим правилам:

Х + - 0 + - 0 +-

Y + - 0 - + +- 0

Код (X,Y) + + + - - 0 0

В последней строке таблицы подсчитывают число «+» - М(+); число «-» - N(-); число «О» - М(0), а также общее число кодов - К.

Если min > kmin то корреляционной зависимости нет, если min М - положительная (прямая) корреляция, при Р < М - отрицательная (обратная) корреляция.

Таблица 2.6.3.

11 37-39 12 40-41

2.7 Расслоение

При анализе состояния процесса с помощью контрольных карт или гистограмм может оказаться, что требуются какие-либо управляющие воздействия с целью устранения причин статистической неустойчивости процесса. Однако, если на процесс оказывают влияние несколько различных факторов, то бывает полезно рассмотреть действие каждого из этих факторов отдельно. Например, если сборка изделия производится на нескольких поточных линиях, то имеет смысл сгруппировать данные по соответствующим линиям и строить контрольные карты (или гистограммы) для каждой группы данных отдельно.

Расслоение - это разделение и группировка исследуемых данных в соответствии с различными факторами.

Обычно при исследовании производственной проблемы производят группировку данных по следующим признакам:

Раздельно по каждому станку;

По различным типам исходного сырья;

По дневной и ночной смене;

По различным бригадам и т.д.

При проведении расслоения по станкам обычно с каждого станка осуществляют выборку (объемом не менее 30 деталей), по полученным данным строят для каждого станка гистограмму, затем сравнивают эти гистограммы и выявляют станок, продукция которого имеет повышенную дефектность.

Пример 2.7.1. Обработка валиков происходит на двух шлифовальных станках. Технологический процесс должен быть настроен на диаметр 8.5 ±.0.25 (мм). По результатам контрольных замеров валиков после шли¬фовки была получена гистограмма, изображенная на рис. 2.7.1. Так как эта гистограмма имеет явно выраженный двухпиковый тип (см. раздел 2.4.2), было проведено расслоение, то есть рассмотрение данных по каждому станку отдельно. В результате получены гистограммы, представленные на рис. 2.7.2, 2.7.3. Таким образом было обнаружено, что на первом станке среднее значение и разброс меньше, чем на втором. Из рис. 2.7.2 и 2.7.3 видно, что на втором станке необходима переналадка, так как процесс вышел за правую границу поля допуска. Здесь нужно провести настройку на центр поля допуска и постараться уменьшить разброс. На втором станке результаты удовлетворительные, но при настройке желательно сместить среднее ближе к центру поля допуска.

Расслоение применяют и при оценке качества процесса производства с помощью контрольных карт. Так, в случае изготовления продукции на многошпиндельном станке производят расслоение по каждому шпинделю. Для каждого шпинделя строят х- карту или х- карту; по ним отслеживают изменение настройки во времени, выявляют правильность настройки каждого шпинделя, строят кривые распределения и делают заключение. См. также пример 4.1.2.


3. ОЦЕНКА ВОСПРОИЗВОДИМОСТИ ПРОЦЕССА

3.1 Понятие воспроизводимости процесса

Целью системы управления процессом является принятие экономически верных решений, связанных с выработкой оптимальных воздействий. Это требует введения критериев, позволяющих количественно оценить полезность мероприятий.

На рис. 3.1.а процесс находится в статистически неуправляемом состоянии (последовательным временным отсчетам соответствуют распределения случайной величины с различными параметрами). В результате организационных мероприятий (устранение особых причин) процесс приведен в статистически управляемое состояние (рис. 3.1.b). Однако продукция не соответствует запросам потребителя, так как часть изделий лежит вне поля допуска. Положение процесса, показанное на рис. 3.1.с должно удовлетворить и производителя, и потребителя: процесс статистически управляем и находится в поле допуска.

Количественно охарактеризовать качество производства в общем случае возможно путем расчета с помощью формул для вычисления вероятности процента несоответствий, оказавшихся вне поля допуска.

Достаточно часто в производстве наблюдаются процессы, статистические свойства которых соответствуют нормальному закону распределения случайных величин.

Однако на практике для оценки качества производства пользуются понятием воспроизводимость. Так как 99,7% значений нормальной случайной величины попадает в интервал 6σ, то доля несоответствующих изделий тесно связана с взаимным расположением этого интервала и поля допуска. Коэффициенты, характеризующие это расположение, называются индексами воспроизводимости.

Воспроизводимость процесса определяется как полный размах присущей стабильному процессу изменчивости, оцениваемой как интервал, длиной шесть стандартных отклонений (6s). Количественно привязка данного понятия к конкретным условиям настройки процесса (разброс и центрированность относительно поля допуска) оценивается индексами воспроизводимости Ср, Cpk.

При интерпретации воспроизводимости процесса с помощью указанных индексов примем следующие предположения:

Индивидуальные измерения соответствуют нормальному распределению;

Процесс статистически управляем;

Конструкторской целью является центр поля допуска (здесь рассматривается вариант двустороннего симметричного допуска).

3.2 Расчет индексов воспроизводимости

Определим структуру индексов и порядок их вычисления.

Индекс воспроизводимости Ср показывает, как соотносятся ширина поля допуска и изменчивость статистически устойчивого процесса, то есть, можно ли ожидать, что разброс контролируемого параметра окажется в границах поля допуска.

Индекс Ср равен отношению ширины поля допуска к полному размаху присущей стабильному процессу изменчивости.

Введем обозначения:

НГД - нижняя граница поля допуска,

ВГД - верхняя граница поля допуска,

Д - ширина поля допуска.

Вычисление индекса воспроизводимости Ср проводится по формуле:

Ср = Д/6σ. Здесь А = ВГД - НГД.

Иллюстрация введенных обозначений показана на рис. 3.3.

Случай 1 (базовый). Показан на рис. 3.3.а. В фиксированное поле допуска укладывается 6s процесса, т.е. Д = 6s (Ср = 1). При этом настроенный на центр поля допуска процесс содержит 0,27% несоответствий.

Случай 2 (рис. З.З.Ь). Пусть 6s, < Д. Тогда Ср > 1 и число несоответствий окажется весьма малым.

Случай 3 (рис. З.З.Ь). Пусть 6s, > Д, соответственно С < 1. Изменчивость процесса велика и число несоответствий превзойдет порог 0,27%.

а)С,=1; Ь)Ср<1,Ср>1

Итак, при зафиксированном поле допуска эффективность действий по управлению процессом, направленных на снижение изменчивости (уменьшение s), ясно и понятно характеризуется ростом индекса Ср. Считаются общепринятыми следующие оценки процесса с помощью Ср:1) Ср < 1 - неудовлетворительно,

2) 1,00 < Ср < 1,33 - удовлетворительно,

3) Ср > 1,33- хорошо.

Индекс воспроизводимости Срк характеризует настроенность процесса на центр поля допуска.

Индекс равен отношению разности между средним процесса и ближайшим пределом поля допуска к половине присущей стабильному процессу изменчивости.

Введем обозначения:

Dвгд=ВГД-(Хср)ср

Dнгд=(Хср)ср-НГД

Dmin=min(Dвгд,Dнгд)

Zвгд=Dвгд/s

Zнгд=Dнгд/s

Zmin=min(Zвгд,Zнгд)

Тогда индекс воспроизводимости Срк вычисляется по формуле:

Заметим, что для одностороннего поля допуска формулы определения индекса сходны, но при этом Zmin равно Zвгд или Zнгд в зависимости от случая расположения границы поля допуска.

Промежуточный расчет величин Z при вычислении Срk удобен тем, что позволяет при необходимости оперативно оценить по таблицам стандартного нормального распределения количество единиц продукции, которые могут оказаться вне поля допуска.

Простейший анализ формулы для вычисления Cpk, показывает, что при постоянном стандартном отклонении процесса качество процесса улучшается с ростом индекса. Между тем для управления процессом недостаточна оценка только одного этого индекса.

На рис. 3.4 показаны варианты расположения управляемого процесса в поле симметричного допуска.

Введем в рассмотрение параметр , связывающий отклонение центра настройки процесса от центра поля допуска и характеризующий этим эффективность управления настройкой. Согласно схеме на рис. 3.4

Управление процессом должно быть направлено на уменьшение 5. При этом число несоответствующих изделий уменьшится, качество процесса улучшится, достигая оптимального значения при =0.

Индексы Ср и Cpк удобно рассмотреть совместно, учитывая их связь с помощью отношения Cpк=Cp--D/3s. Из выражения видно:

Величина Срk не превосходит величины Ср

При d == О получим Cpk = Ср

Область возможных значений Срk лежит ниже прямой Срk = Ср. Отсюда следуют простые рассуждения. При оптимальной настроенности процесса на середину допуска число экземпляров несоответствующей продукции связывается с величиной Ср и не может быть уменьшено.

Таким образом, общий алгоритм управления процессом при заданном поле допуска реализуется в виде итерационного процесса, состоящего из последовательно реализуемых шагов, удовлетворяющих направлению:

s → 0, Cpk -> Ср.


4. ИСПОЛЬЗОВАНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ АНАЛИЗА ПРОИЗВОДСТВЕННЫХ ПРОЦЕССОВ

Рассмотрим применение вышеизложенных статистических методов контроля качества производственных процессов на нескольких примерах.

4.1 Контроль технологической точности

Пример 4.1.1. Производится контроль технологической точности станка после среднего ремонта.

Тип станка: токарный одношпиндельный станок (фирмы FICSHER).

Вид обработки детали: обработка внешнего диаметра вала коробки передач (модель 2108).

Эскиз, поясняющий схему обработки: см. рис. 4.1.1.

Диаметр 25.3;

Допуск на обработку 0.1;

Верхний предел допуска 25.35;

Нижний предел допуска 25.25.

Первичное представление результатов: таблица, содержащая массив данных, полученных в результате измерения 70 обработанных деталей.

Результаты замеров:

25.297 25.300 25.279 25.282 25.294 25.300 25.301 25.304 25.282 25.292 25.292 25.298 25.294 25.300 25.284 25.290 25.285 25.290 25.284 25.290 25.286 25.292 25.288 25.296 25.290 25.300 25.298 25.303 25.292 25.300 25.289 25.300 25.282 25.288 25.290 25.294 25.287 25.292 25.283 25.288 25.290 25.294 25.280 25.288 25.279 25.282 25.300 25.301 25.274 25.285 25.290 25.280 25.292 25.294 25.300 25.290 25.296 25.280 25.283 25.278 25.288 25.280 25.288 25.284 25.296 25.280 25.290 25.288 25.302 25.284

n=70; max= 25.304; min = 25.274; R=0.03.

Вторичное представление результатов: интервальная таблица частот (в верхней строке указаны левые границы интервалов, в нижней строке - количество деталей, диаметр которых попадает в данный интервал):

25.272 25.276 25.280 25.284 25.288 25.292 25.296 25.300 25.304 25.308
0 2 11 9 9 15 9 12 3 0

Расчет статистических характеристик процесса:

х = 25.2902; σ = 0.0073; поле рассеяния" 0.0469. Контрольная Х-карта: см. рис. 4.1.3: НКГ = 25.268; ВКГ = 25.312.

Расчет индексов воспроизводимости: Ср=2.13.

Поле рассеяния значений согласно СТП 37.101.9504 3-96 принимается равным w = k x s,

где х, - результат измерений. s - стандартное отклонение.

k - поправочный коэффициент зависящий от объема выборки причем его величина такова, что поле рассеяния оказывается в большинстве случаев несколько шире, чем 6s

Контрольная х-карта диаметра обработанных деталей, расположение гистограммы показывают, что процесс статистически управляем; это же подтверждает и значение индекса воспроизводимости Ср =2.13, свидетельствующее о практическом отсутствии несоответствий при обработке продукции;

Контрольная х-карта и расположение гистограммы относительно поля допуска показывают, что процесс смещен от центра поля допуска в направлении нижнего предела допуска, следовательно, есть возможность улучшения процесса с помощью смещения наладки на 0.0098 к середине поля допуска.

Выводы: вероятный брак равен 0%; технологическая точность обеспечивается; требуется смещение наладки, равное 0.0098.

Заключение: станок в работу утверждается с условием подналадки. Примечание. Так как контрольная карта не показывает критической ситуации, можно обойтись без подналадки. Содержательный анализ технологического процесса показывает, что в результате износа инструмента произойдет требуемая коррекция размера.

Пример 4.1.2. Производится контроль технологической точности станка с целью аудита.

Тип станка: специальный круглошлифовальный однокамневый станок (фирмы TOYOТA).

Вид обработки детали: обработка внешних диаметров шатунных шеек коленвала (модель 2108).

Эскиз, поясняющий схему обработки: см. рис.4.1.4.

Особенности протекания технологического процесса с точки зрения особых причин: стабильный участок работы.

Конкретные числовые характеристики технологического процесса (по спецификации):

Ход (шатунной шейки коленвала) 71 мм;

Допуск на обработку 0.15 мм;

Верхний предел допуска 71.05;

Нижний предел допуска 70.90.

Первичное представление результатов: таблица, содержащая общий массив данных, полученных в результате 80 замеров четырех шатунных шеек по параметру хода.

Результаты замеров:

70.900 70.900 70.880 70.880 70.900 70.900 70.870 70.880 70.900 70.880

70.880 70.900 70.890 70.870 70.900 70.910 70.890 70.880 70.880 70.900

70.940 70.930 70.900 70.930 70.900 70.890 70.900 70.940 70.950 70.930

70.900 70.930 70.940 70.900 70.930 70.940 70.920 70.900 70.910 70.930

70.950 70.960 70.930 70.940 70.940 70.930 70.940 70.930 70.980 70.960

70.930 70.950 70.970 70.940 70.960 70.940 70.930 70.940 70.930 70.970

70.960 70.920 70.890 70.910 70.910 70.920 70.910 70.900 70.870 70.890

70.870 70.910 70.900 70.890 70.920 70.930 70.900 70.900 70.890 70.940

n=80; max= 70.98; min = 70.87; R=0.11

Вторичное представление результатов: интервальная таблица частот (в верхней строке указаны левые границы интервалов, в нижней строке - количество измеренных значений, попадающих в данный интервал):

70.860 70.870 70.880 70.890 70.900 70.910 70.920
0 4 7 7 18 6 4
70.930 70.940 70.950 70.960 70.970 70.980 70.990
13 11 3 4 2 1 0

Расчет статистических характеристик процесса :

к = 70.916; поле рассеяния 0.117; смещение наладки 0.059. В данном случае не рассчитывается о, так как рассматриваются сразу 4 параметра хода четырех шатунных шеек.

Расчет индексов воспроизводимости: Ср=1.28; Ср,=0.27. Контрольная х-карта: см. рис. 4.1.6: НКГ = 70.857; ВКГ= 70.975.

Анализ экспериментального и расчетного материала:

Контрольная карта, а также расположение гистограммы показывают, что процесс не является статистически управляемым, так как имеется выход за верхнюю контрольную границу (49-я точка). Кроме того, имеет место выход процесса за границы поля допуска, что говорит о большой вероятности брака (22.5%). Двухпиковый тип гистограммы, а особенно вид контрольной карты указывают на необходимость расслоения данных, то есть рассмотрения хода каждой шейки по отдельности.

Большая разница в индексах воспроизводимости процесса (Ср« = 0.27 < Ср = 1.28) свидетельствует о том, что процесс смещен относительно центра поля допуска (по расчетам на 0.059 мм в направлении нижнего предела допуска) и, следовательно, может быть улучшен.

Расслоение данных дало следующие результаты.

1-я шейка:

Интервальная таблица

n=20; max= 70.95; min = 70.89; R=0.06. х = 70.921; σ = 0.018; поле рассеяния 0.118; смещение наладки 0.055;

3-я шейка:

Интервальная таблица

n=20; max= 70.96; min = 70.87; R=0.09.

х = 70.907; о = 0.022; поле рассеяния 0.139; смещение наладки 0.069 Ср=1.075.

1. Сравнение статистических характеристик для отдельных шеек показывает, что наихудшие параметры имеет 4-ая шейка (поле рассеяния 0.139; С-= 1.075). Это указывает на необходимость проведения профилактического ремонта левого зажимного патрона.

2. Так как центральная линия на контрольной карте смещена относительно заданного номинального значения хода 71 мм, то требуется наладка станка, так, чтобы центр настройки совпадал с номинальным (или серединой поля допуска).

3. Из гистограмм и контрольной карты видно, что в настоящее время наилучшая наладка по исследуемому параметру на 3-ей шейке, поэтому на ней требуется наименьшая подналадка.

4. Необходимо добиться, чтобы все статистические параметры для всех четырех шеек были близки по своим значениям, то есть находились на одной линии, а поля рассеяния отличались незначительно.

4.2. Использование диаграмм Парето

Для наиболее успешного устранения несоответствий в готовой продукции по результатам контроля строятся диаграммы Парето. Приведем пример такой диаграммы, показывающей распределение дефектов в цехе 46 за период с 01.01.95 no31.12.95.

Группа деталей - Генератор

Код дефекта Наименование дефекта Кол-во Сумма

1 Не работает регулятор 852 42

2 Нет цепи обм. воз 291 56

3 Шум, магнитный шум 249 68

5 Утоплена клемма 61. 155 75

12 Нет цепи центра эв. 107 79

8 Клинит ротор 88 84

6 Замыкание диодов 52 86

4 Пробиты диоды 41 88

13 Замыкает 11 89

7 Не закреплен шкив 8 90

11 Прочие дефекты 196 100

Устранение дефектов 1, 2, 3 даст возможность существенно повысить качество данного узла, следовательно, прежде всего надо сосредоточить усилия на выявлении причин этих несоответствий и внедрению мероприятий по их преодолению.


5. МАТЕМАТИЧЕСКИЕ ОСНОВЫ СТАТИСТИЧЕСКИХ МЕТОДОВ

5.1 Случайная величина. Общие определения

Случайная величина - это величина, измеряемая в исследуемых экспериментах, исходы которых заранее не известны и зависят от случайных причин.

Различают два вида случайных величин:

Дискретная - случайная величина, принимающая конечное или счетное множество значений х, ... , хn каждое с некоторой вероятностью pi,..., р,. Дискретная случайная величина задается законом распределения, устанавливающим однозначное соответствие между возможными значениями случайной величины и их вероятностями;

Непрерывная - случайная величина, которая может принимать все значения из некоторого конечного или бесконечного промежутка. Непрерывная случайная величина характеризуется плотностью вероятности -непрерывной функцией, такой что вероятность попадания случайной величины Х в интервал (а;Ь) равна

Пример 6.1. На контроль поступило несколько партий деталей. Контролируется размер отверстия. Диаметр отверстия - это непрерывная случайная величина, количество нестандартных деталей в каждой партии -дискретная случайная величина.

Генеральной совокупностью называется весь набор однородных объектов, изучаемых относительно некоторого качественного или количественного признака. Число всех изучаемых объектов N называется объемом генеральной совокупности.

Выборка - это та часть генеральной совокупности, элементы которой подвергаются статистическому обследованию. Число n вошедших выборку элементов называется объемом выборки.

Выборки бывают бесповторные, когда отобранный (и статистически обследованный) объект в генеральную совокупность не возвращается, и повторные, когда отобранный элемент после обследования возвращается в генеральную совокупность.

Чтобы результаты, полученные при изучении выборки, можно было достаточно уверенно распространить на всю генеральную совокупность, выборка должна быть репрезентативной (представительной). При статистическом контроле это достигается путем правильного выбора метода отбора исследуемых объектов. В зависимости от поставленных целей применяют следующие способы сбора данных:

Простой случайный отбор, когда выбор объектов осуществляется из всей генеральной совокупности случайным образом. Этот способ применяется, например, при выборочном контроле партии деталей на соответствие некоторому стандарту.

Типический отбор, когда объекты отбираются не из всей генеральной совокупности, а из каждой ее "типической" части. Например, если однотипные детали изготавливаются на нескольких станках, то отбор производится из продукции каждого станка в отдельности.

Механический отбор, когда генеральную совокупность делят на столько групп, сколько объектов должно войти в выборку, и из каждой группы выбирают один объект. При этом следует внимательно следить, чтобы не нарушалась репрезентативность выборки. Например, если отбирают каждый двадцатый обтачиваемый валик, причем сразу же после замера производят замену резца, то отобраны окажутся все валики, обточенные затупленными резцами. Если исследуемый параметр зависит от остроты резца, то следует устранить совпадение ритма отбора с ритмом замены резца, например, отбирать каждый десятый валик из двадцати обточенных.

Серийный отбор, когда объекты отбирают из генеральной совокупности не по одному, а "сериями", и обследуются все элементы каждой серии. Этот вид отбора применяют тогда, когда обследуемый признак колеблется в разных сериях незначительно, например, если изделия изготавливаются большой группой станков-автоматов, то сплошному обследованию подвергают продукцию только нескольких станков. Для получения более достоверных результатов при этом можно менять наборы "серий", то есть в разные дни обследовать разные группы станков.

При применении статистических методов управления качеством для построения контрольных карт обычно используют мгновенные выборки.

Мгновенная выборка - это выборка, взятая из технических соображений таким образом, что внутри нее вариации (то есть изменения) могут появляться только как следствие случайных (общих) причин. Возможные вариации между такими выборками, как правило, определяются неслучайными (специальными) причинами. В производстве мгновенная выборка должна быть сформирована из данных, собранных в короткий отрезок времени в однородных условиях (материал, инструмент, окружающая среда, один и тот же станок или оператор и т.п.).

При сборе данных применяют различные формы регистрации информации. Наиболее часто используют вариационные ряды, таблицы, а также контрольные листки.

Вариационный ряд - запись результатов измерений какой-либо случайной величины в виде последовательности чисел. Таким образом, получается одномерный массив чисел, обработка которого обычно начинается с его упорядочения и предполагает использование вычислительной техники. Эта форма регистрации информации наименее удобна для получения оперативных результатов и чаще всего применяется при использовании автоматических датчиков, напрямую соединенных с ЭВМ.

Таблица - представление данных в виде двумерного массива чисел, в котором элементы строки или столбца отражают состояние исследуемого признака при определенных условиях. Например, пусть некоторый параметр измеряется четыре раза в день на протяжении рабочей недели. Тогда результаты удобно занести в таблицу

День недели 9.00 11.00 14.00 16.00

понедельник

Контрольный листок - стандартный бланк, на котором заранее напечатаны контрольные параметры, чтобы можно было легко и точно записать Данные измерений. При правильно разработанном типе контрольного листа данные не только очень просто фиксируются, но и автоматически упорядочиваются для последующей обработки и необходимых выводов. Для обработки результатов статистических наблюдений их удобно оформлять в виде таблицы частот.

Статистическое распределение - таблица частот, в которой указаны значения случайной величины n, и соответствующие частоты, показывающие, сколько раз в выборке встретилось данное значение случайной величины.

Для получения интервальной таблицы частот (интервального вариационного ряда) весь диапазон измеренных значений случайной величины Х делят на k равных интервалов (а, tt,) и подсчитывают количество {и} значений случайной величины, попавших на соответствующий интервал. Кроме того, в таблице указывают также величину х, - середину i"-oro интервала.


Интервальная таблица частот

Номер интервала / Интервал (а,а,) Середина интервала

X, Частота п,

1 (а, а,) X1 N1

2 (а, а,) X2 N2

Здесь n1, + n2 ... + ni= n - объему выборки.

Первичная обработка результатов статистических наблюдений заключается в графическом представлении собранной информации. Обычно для этого строят гистограммы.

Для построения гистограммы на оси абсцисс отмечают границы интервалов - точки а, ..., ai-1 . Над каждым интервалом строится прямоугольник площадью п, (очевидно, если длина каждого интервала h, то высота этого прямоугольника n/h). Получившаяся ступенчатая фигура называется гистограммой частот. При этом площадь гистограммы частот равна объему выборки п. Отрезок [а, аn,] назовем основанием гистограммы.

Аналогично строится и гистограмма относительных частот - ступенчатая фигура, состоящая из прямоугольников, площади которых равны n/h, то есть общая площадь гистограммы относительных частот равна 1.

6.2 Числовые характеристики случайных величин

Поведение любой случайной величины определяется ее распределением, средним значением и разбросом относительно этого среднего значения.

Средними значениями случайной величины являются ее

Математическое ожидание - среднее арифметическое всех значений случайной величины;

Мода - значение случайной величины, которое встречается чаще всего, то есть имеет наибольшую частоту;

Медиана - такое значение случайной величины, которое оказывается точно в середине упорядоченного вариационного ряда, то есть, если все

зафиксированные значения случайной величины расположить в порядке возрастания, то слева и справа от медианы окажется одинаковое число точек. При этом, если число наблюдений нечетно (n=2k+l), то в качестве медианы берут среднюю точку хk-1, а если число наблюдений четно (n=2k), то медиана - это центр среднего интервала (хi.хk-1,), то есть;X=(xi+Xk+1)/2.

Разброс случайной величины относительно средних значений характеризуется дисперсией или средним квадратическим отклонением (с.к.о.) - мерой рассеяния распределения относительно математического ожидания. При этом с.к.о. - это корень квадратный из дисперсии. Наибольший разброс случайной величины определяется размахом выборки, то есть величиной интервала, в который попадают все возможные значения случайной величины.

В математической статистике говорят о статистических оценках параметров распределения. Статистические оценки бывают точечные (определяемые одним числом) и интервальные (определяемые двумя числами -концами интервала). Точечные оценки дают представление о величине соответствующего параметра, а интервальные характеризуют точность и достоверность оценки.

Предположим, что в результате наблюдений получены n значений случайной величины Х: x1; , ... , xn . Для вычисления точечных оценок параметров распределения пользуются формулами:

среднее квадратичное отклонение s = v/5 ; (6.2.8)

Пример 6.2. Пусть в результате наблюдений получены следующие значения случайной величины X: (5; 6; 3; 6; 4; 5; 3; 7; 6;7;5;6).


Упорядоченный вариационный ряд: 3, 3,4, 5, 5, 5, 6, 6, 6, 6, 7, 7.

Таблица частот статистическое распределение:

Вычислим все числовые характеристики случайной величины хmin = 3; xmax = 7; медиана 5- x=(X6+X7)/2 = (5 + 6)/2 = 5,5;

мода Х = 6 , так как это значение встречалось чаще всего (n = 4);

выборочное среднее х = (2 3+1 4+3 5+4 6+2 7)/12 = 5,25 ;

размах R = 7 - 3 = 4 ;

выборочная дисперсия.S= D =(1/11) (2(3 - 5,25)2+ 1(4-5,25)2+ + 3 (5 - 5.25)2 + 4 (6 - 5,25)2 +2 (7 - 5,25)2) = 15/11 = 1,84 ;

среднее квадратичное отклонением s = 1,36 .

Замечание. Современная вычислительная техника, используя специальные пакеты прикладных программ, позволяет получить значения выборочной средней и дисперсии сразу же после введения данных выборки (наблюдаемых значений исследуемой случайной величины)

6.3 Типовые теоретические распределения случайных величин

Характер поведения случайной величины определяется ее распределением. Зная тип распределения случайной величины и его числовые характеристики, можно прогнозировать, какие значения будет принимать случайная величина в результате наблюдений, то есть можно делать определенные выводы обо всей генеральной совокупности.

Наиболее часто встречается нормальное (гауссовское) распределение. Это связано с тем, что разброс характеристик качества обусловлен суммой большого числа независимых ошибок, вызванных различными факторами, а согласно центральной предельной теореме Ляпунова в этом случае случайная величина имеет распределение, близкое к нормальному.

Нормальное распределение описывает непрерывную случайную величину, поэтому его задают плотностью вероятности/С.^. Плотность вероятности нормального распределения имеет вид:

Параметр и определяет точку максимума, через которую проходит ось симметрии графика функции, и указывает среднее арифметическое значение случайной величины, s показывает разброс распределения относительно среднего значения, то есть определяет "ширину" колокола (расстояние от оси симметрии до точки перегиба графика

Для удобства подсчета вероятностей любое нормальное распределение с параметрами а и σ преобразуют к стандартному (нормированному) нормальному распределению, параметры которого а = 0, s = 1, то есть плотность

Значения функции f(х) можно найти в справочных таблицах или получить, используя готовые компьютерные программы.

Другим часто встречающимся в технике распределением непрерывной случайной величины является закон Рэлея. Он описывает распределение погрешностей формы и расположения поверхностей (биение, эксцентриситет, непараллельность, неперпендикулярность и т.п.), когда эти погрешности определяются радиусом кругового рассеяния н а плоскости.

Если на плоскости задана система координат Оху, то точка с координатами (х,у; отстоит от начала координат на расстояние координат х и у - нормально распределенная случайная величина, то г - случайная величина, имеющая распределение Рэлея. Плотность вероятности этого распределения:

Для дискретных случайных величин наиболее распространенным является биномиальное распределение. Биномиальный закон распределения описывает вероятность того, что в выборке объема п некоторый признак встретится ровно k раз. Точнее, пусть проводится п независимых испытаний ("опытов"), в каждом из которых признак может проявиться ("успех опыта") с вероятностью р. Рассмотрим случайную величину Х - число "успехов" в данной серии испытаний. Это дискретная случайная величина, принимающая значения О, 1,... , п, причем вероятность того, что Х примет значение, равное k, то есть что ровно в k испытаниях будет зафиксирован исследуемый признак, вычисляется по формуле

Формула (6.3.13) называется формулой Бернулли, а закон распределения случайной величины X, задаваемый этой формулой, называется биномиальным, Параметрами биномиального распределения являются число опытов n и вероятность "успеха" р. Но так как нас интересуют среднее значение и разброс случайной величины относительно своего среднего значения, то отметим, что для биномиального распределения математическое ожидание т → up . а дисперсия →прц.

Биномиальный закон описывает в самой общей форме осуществление признака в повторной выборке (в частности, появление несоответствий).

Например, пусть в партии из N деталей ровно М имеют внешний дефект (неравномерность окраски). При контроле из партии извлекается деталь, фиксируется наличие либо отсутствие дефекта, после чего деталь извращается обратно. Если эти действия проделаны n раз, то вероятность того, что при этом k раз будет зарегистрирован дефект, вычисляется по формуле:

Если же извлеченная деталь не возвращается обратно (или все п деталей вынимаются одновременно), то вероятность того, что среди вынутых п деталей окажется ровно k с дефектом равна

В этом случае случайная величина Х - количество несоответствующих деталей в выборке задается гипергеометрическим законом распределения. Этот закон описывает осуществление признака в бесповторной выборке.

Когда N очень велико по сравнению с п (то есть объем генеральной совокупности по крайней мере на два порядка больше объема выборки), то несущественно, какая проводится выборка - бесповторная или повторная, ТО есть в этом случае вместо формулы (6.3.16) можно использовать формулу (6.3.15).

При больших значениях п формула Бернулли (6.3.13) заменяется формулой

которая фактически совпадает с формулой (6.3.1), то есть с нормальным законом распределения, параметры которого а = пр. s = npq.

Для распределения Пуассона математическое ожидание равно l,Дисперсия также равна l.

На рисунке 6.4 представлены два биномиальных распределения P^(k). У одного п = 30; р = 0,3 - оно близко к нормальному распределению с математическим ожиданием т, = пр =-- 9. У другого п = 30;р = 0,05 - оно близко к распределению Пуассона с математическим ожиданием mk = пр = 1,5.


1. Статистические методы повышения качества (Пер. с англ./ Под ред. С. Кумэ).-М.: Финансы и статистика, 1990.-304с.

2. Статистическое управление процессами (SPC). Руководство. Пер. с англ. (с дополн.). - Н.Новгород: АО НИЦ КД, СМЦ «Приоритет», 1997г.

3. Статистический контроль качества продукции на основе принципа распределения приоритетов/В.А. Лапидус, М.И. Розно, А.В. Глазунов и др.-ВЙ.: Финансы и статистика, 1991 .-224с.

4. Миттаг Х.-И.. Ринне X. Статистические методы обеспечения качества М.: Машиностроение, 1995.-616с.

5. ГОСТ Р 50779.0-95 Статистические методы. Основные положения.

6. ГОСТ Р 50779.30-95 Статистические методы. Приемочный контроль качества. Общие требования.

7. ГОСТ Р 50779.50-95 Статистические методы. Приемочный контроль качества по количественному признаку. Общие требования.

8. ГОСТ Р 50779.51-95 Статистические методы. Непрерывный приемочный контроль качества по альтернативному признаку.

9. ГОСТ Р 50779.52-95 Статистические методы. Приемочный контроль качества по альтернативному признаку.

10. ИСО 9000-ИСО 9004. ИСО 8402. Управление качеством продукции (пер. с англ.).-М.: Изд-во стандартов, 1988.-96с.

11. ИСО 9000. Международные стандарты.

Деятельность людей во множестве случаев предполагает работу с данными, а она в свою очередь может подразумевать не только оперирование ими, но и их изучение, обработку и анализ. Например, когда нужно уплотнить информацию, найти какие-то взаимосвязи или определить структуры. И как раз для аналитики в этом случае очень удобно пользоваться не только , но и применять статистические методы.

Особенностью методов статистического анализа является их комплексность, обусловленная многообразием форм статистических закономерностей, а также сложностью процесса статистических исследований. Однако мы хотим поговорить именно о таких методах, которые может применять каждый, причем делать это эффективно и с удовольствием.

Статистическое исследование может проводиться посредством следующих методик:

  • Статистическое наблюдение;
  • Сводка и группировка материалов статистического наблюдения;
  • Абсолютные и относительные статистические величины;
  • Вариационные ряды;
  • Выборка;
  • Корреляционный и регрессионный анализ;
  • Ряды динамики.

Статистическое наблюдение

Статистическое наблюдение является планомерным, организованным и в большинстве случаев систематическим сбором информации, направленным, главным образом, на явления социальной жизни. Реализуется данный метод через регистрацию предварительно определенных наиболее ярких признаков, цель которой состоит в последующем получении характеристик изучаемых явлений.

Статистическое наблюдение должно выполняться с учетом некоторых важных требований:

  • Оно должно полностью охватывать изучаемые явления;
  • Получаемые данные должны быть точными и достоверными;
  • Получаемые данные должны быть однообразными и легкосопоставимыми.

Также статистическое наблюдение может иметь две формы:

  • Отчетность – это такая форма статистического наблюдения, где информация поступает в конкретные статистические подразделения организаций, учреждений или предприятий. В этом случае данные вносятся в специальные отчеты.
  • Специально организованное наблюдение – наблюдение, которое организуется с определенной целью, чтобы получить сведения, которых не имеется в отчетах, или же для уточнения и установления достоверности информации отчетов. К этой форме относятся опросы (например, опросы мнений людей), перепись населения и т.п.

Кроме того, статистическое наблюдение может быть категоризировано на основе двух признаков: либо на основе характера регистрации данных, либо на основе охвата единиц наблюдения. К первой категории относятся опросы, документирование и прямое наблюдение, а ко второй – наблюдение сплошное и несплошное, т.е. выборочное.

Для получения данных при помощи статистического наблюдения можно применять такие способы как анкетирование, корреспондентская деятельность, самоисчисление (когда наблюдаемые, например, сами заполняют соответствующие документы), экспедиции и составление отчетов.

Сводка и группировка материалов статистического наблюдения

Говоря о втором методе, в первую очередь следует сказать о сводке. Сводка представляет собой процесс обработки определенных единичных фактов, которые образуют общую совокупность данных, собранных при наблюдении. Если сводка проводится грамотно, огромное количество единичных данных об отдельных объектах наблюдения может превратиться в целый комплекс статистических таблиц и результатов. Также такое исследование способствует определению общих черт и закономерностей исследуемых явлений.

С учетом показателей точности и глубины изучения можно выделить простую и сложную сводку, но любая из них должна основываться на конкретных этапах:

  • Выбирается группировочный признак;
  • Определяется порядок формирования групп;
  • Разрабатывается система показателей, позволяющих охарактеризовать группу и объект или явление в целом;
  • Разрабатываются макеты таблиц, где будут представлены результаты сводки.

Важно заметить, что есть и разные формы сводки:

  • Централизованная сводка, требующая передачи полученного первичного материала в вышестоящий центр для последующей обработки;
  • Децентрализованная сводка, где изучение данных происходит на нескольких ступенях по восходящей.

Выполняться же сводка может при помощи специализированного оборудования, например, с использованием компьютерного ПО или вручную.

Что же касается группировки, то этот процесс отличается разделением исследуемых данных на группы по признакам. Особенности поставленных статистическим анализом задач влияют на то, какой именно будет группировка: типологической, структурной или аналитической. Именно поэтому для сводки и группировки либо прибегают к услугам узкопрофильных специалистов, либо применяют .

Абсолютные и относительные статистические величины

Абсолютные величина считаются самой первой формой представления статистических данных. С ее помощью удается придать явлениям размерные характеристики, например, по времени, по протяженности, по объему, по площади, по массе и т.д.

Если требуется узнать об индивидуальных абсолютных статистических величинах, можно прибегнуть к замерам, оценке, подсчету или взвешиванию. А если нужно получить итоговые объемные показатели, следует использовать сводку и группировку. Нужно иметь в виду, что абсолютные статистические величины отличаются наличием единиц измерения. К таким единицам относят стоимостные, трудовые и натуральные.

А относительные величины выражают количественные соотношения, касающиеся явлений социальной жизни. Чтобы их получить, одни величины всегда делятся на другие. Показатель, с которым сравнивают (это знаменатель), называют основанием сравнения, а показатель, которой сравнивают (это числитель), называют отчетной величиной.

Относительные величины могут быть разными, что зависит от их содержательной части. Например, существуют величины сравнения, величины уровня развития, величины интенсивности конкретного процесса, величины координации, структуры, динамики и т.д. и т.п.

Чтобы изучить какую-то совокупность по дифференцирующимся признакам, в статистическом анализе применяются средние величины – обобщающие качественные характеристики совокупности однородных явлений по какому-либо дифференцирующемуся признаку.

Крайне важным свойством средних величин является то, что они говорят о значениях конкретных признаков во всем их комплексе единым числом. Невзирая на то, что у отдельных единиц может наблюдаться количественная разница, средние величины выражают общие значения, свойственные всем единицам исследуемого комплекса. Получается, что при помощи характеристики чего-то одного можно получить характеристику целого.

Следует иметь в виду, что одним из самых важных условий применения средних величин, если проводится статистический анализ социальных явлений, считается однородность их комплекса, для которого и нужно узнать среднюю величину. А от такого, как именно будут представлены начальные данные для исчисления средней величины, будет зависеть и формула ее определения.

Вариационные ряды

В некоторых случаях данных о средних показателях тех или иных изучаемых величин может быть недостаточно, чтобы провести обработку, оценку и глубокий анализ какого-то явления или процесса. Тогда во внимание следует брать вариацию или разброс показателей отдельных единиц, который тоже представляет собой важную характеристику исследуемой совокупности.

На индивидуальные значения величин могут воздействовать многие факторы, а сами изучаемые явления или процессы могут быть очень многообразны, т.е. обладать вариацией (это многообразие и есть вариационные ряды), причины которой следует искать в сущности того, что изучается.

Вышеназванные абсолютные величины находятся в непосредственной зависимости от единиц измерения признаков, а значит, делают процесс изучения, оценки и сравнения двух и более вариационных рядов более сложным. А относительные показатели нужно вычислять в качестве соотношения абсолютных и средних показателей.

Выборка

Смысл выборочного метода (или проще – выборки) состоит в том, что по свойствам одной части определяются численные характеристики целого (это называется генеральной совокупностью). Основной выборочного метода является внутренняя связь, объединяющая части и целое, единичное и общее.

Метод выборки отличается рядом существенных преимуществ перед остальными, т.к. благодаря уменьшению количества наблюдений позволяет сократить объемы работы, затрачиваемые средства и усилия, а также успешно получать данные о таких процессах и явлениях, где либо нецелесообразно, либо просто невозможно исследовать их полностью.

Соответствие характеристик выборки характеристикам изучаемого явления или процесса будет зависеть от комплекса условий, и в первую очередь от того, как вообще будет реализовываться выборочный метод на практике. Это может быть как планомерный отбор, идущий по подготовленной схеме, так и непланомерный, когда выборка производится из генеральной совокупности.

Но во всех случаях выборочный метод должен быть типичным и соответствовать критериям объективности. Данные требования нужно выполнять всегда, т.к. именно от них будет зависеть соответствие характеристик метода и характеристик того, что подвергается статистическому анализу.

Таким образом, перед обработкой выборочного материала необходимо провести его тщательную проверку, избавившись тем самым от всего ненужного и второстепенного. Одновременно с этим, составляя выборку, в обязательном порядке нужно обходить стороной любую самодеятельность. Это означает, что ни в коем случае не следует делать выборку только из вариантов, кажущихся типичными, а все другие – отбрасывать.

Эффективная и качественная выборка должна составляться объективно, т.е. производить ее нужно так, чтобы были исключены любые субъективные влияния и предвзятые побуждения. И чтобы это условие было соблюдено должным образом, требуется прибегнуть к принципу рандомизации или, проще говоря, к принципу случайного отбора вариантов из всей их генеральной совокупности.

Представленный принцип служит основой теории выборочного метода, и следовать ему нужно всегда, когда требуется создать эффективную выборочную совокупность, причем случаи планомерного отбора исключением здесь не являются.

Корреляционный и регрессионный анализ

Корреляционный анализ и регрессионный анализ – это два высокоэффективных метода, позволяющие проводить анализ больших объемов данных для изучения возможной взаимосвязи двух или большего количества показателей.

В случае с корреляционным анализом задачами являются:

  • Измерить тесноту имеющейся связи дифференцирующихся признаков;
  • Определить неизвестные причинные связи;
  • Оценить факторы, в наибольшей степени воздействующие на окончательный признак.

А в случае с регрессионным анализом задачи следующие:

  • Определить форму связи;
  • Установить степень воздействия независимых показателей на зависимый;
  • Определить расчетные значения зависимого показателя.

Чтобы решить все вышеназванные задачи, практически всегда нужно применять и корреляционный и регрессионный анализ в комплексе.

Ряды динамики

Посредством этого метода статистического анализа очень удобно определять интенсивность или скорость, с которой развиваются явления, находить тенденцию их развития, выделять колебания, сравнивать динамику развития, находить взаимосвязь развивающихся во времени явлений.

Ряд динамики – это такой ряд, в котором во времени последовательно расположены статистические показатели, изменения которых характеризуют процесс развития исследуемого объекта или явления.

Ряд динамики включает в себя два компонента:

  • Период или момент времени, связанный с имеющимися данными;
  • Уровень или статистический показатель.

В совокупности эти компоненты представляют собой два члена ряда динамики, где первый член (временной период) обозначается буквой «t», а второй (уровень) – буквой «y».

Исходя из длительности временных промежутков, с которыми взаимосвязаны уровни, ряды динамики могут быть моментными и интервальными. Интервальные ряды позволяют складывать уровни для получения общей величины периодов, следующих один за другим, а в моментных такой возможности нет, но этого там и не требуется.

Ряды динамики также существуют с равными и разными интервалами. Суть же интервалов в моментных и интервальных рядах всегда разная. В первом случае интервалом является временной промежуток между датами, к которым привязаны данные для анализа (удобно использовать такой ряд, например, для определения количества действий за месяц, год и т.д.). А во втором случае – временной промежуток, к которому привязана совокупность обобщенных данных (такой ряд можно использовать для определения качества тех же самых действий за месяц, год и т.п.). Интервалы могут быть равными и разными, независимо от типа ряда.

Естественно, чтобы научиться грамотно применять каждый из методов статистического анализа, недостаточно просто знать о них, ведь, по сути, статистика – это целая наука, требующая еще и определенных навыков и умений. Но чтобы она давалась проще, можно и нужно тренировать свое мышление и .

В остальном же исследование, оценка, обработка и анализ информации – очень интересные процессы. И даже в тех случаях, когда это не приводит к какому-то конкретному результату, за время исследования можно узнать множество интересных вещей. Статистический анализ нашел свое применение в огромном количестве сфер деятельности человека, а вы можете использовать его в учебе, работе, бизнесе и других областях, включая развитие детей и самообразование.