Хотя анализ основной причины не является четко определенным процессом, некоторые его этапы могут быть выделены. Следующий список должен помочь оценить, были ли выполнены наиболее важные елементы этапа анализа вероятной причины перед тем, как двигаться дальше.
□ Используйте один или более наборов данных, относящихся к рассматриваемой проблеме и ее вероятным причинам, в качестве отправной точки для этапа вероятной причины.
□ Оцените имеющиеся данные и ожидаемые результаты, чтобы решить, какой инструмент будет использоваться. Определите вероятность получения многомерных зависимостей, ожидается ли наличие связей между двумя или более группами, оцените сложность данных и так далее.
□ Выберите один из следующих инструментов анализа: гистограмма, диаграмма Парето, диаграмма рассеивания, диаграмма зависимостей или аффинная диаграмма.
□ Проведите анализ согласно этапам, предусмотренным для выбранного инструмента или инструментов.
□ Если для анализа используется более чем один инструмент, то сравните результаты, полученные для каждого, чтобы удостовериться, что результаты совпадают.
□ Используйте результаты, полученные на этапе анализа вероятной причины, для последующей работы на этапе причинно-следственного анализа.
Рубрика Инструменты для анализа вероятной причины |
Гистограмма, также известная как столбчатая диаграмма, используется для демонстрации распределения и изменения значений в наборе данных. Данными могут быть значения длины, диаметра, продолжительности, стоимости, мнения и т.д.
Основная цель гистограммы - облегчить восприятие информации. Вы можете представить ту же самую информацию в виде таблицы, однако графическое представление данных обычно дает лучшее представление об имеющихся взаимозависимостях.
В процессе анализа основной причины гистограммы обычно используются для:
• Представления данных с целью определения какая из причин является доминирующей
Получения информации о характере распределения случаев проявления различных проблем, причин, последствий и т.д.
Рубрика Инструменты для анализа вероятной причины |
Небольшая городская газета нанимала детей и подростков для доставки газет подписчикам. Внезапно стали приходить жалобы от клиентов, проживавших по одному из маршрутов рассылки, на опоздания с доставкой. Когда рассыльный был проинформирован об этих нареканиях, он был удивлен и не мог дать разумных объяснений опозданиям, но обещал выдерживать график. После короткого периода, когда жалобы прекратились, поток претензий обрушился вновь. Тогда менеджер по рассылке попросил выборочную группу подписчиков отмечать время всякий раз, когда доставка опаздывала. После четырех недель наблюдений, менеджер по рассылке проанализировал собранные данные. (Итоговая гистограмма показана ниже). Увидев их, рассыльный признался, что в понедельник, вторник и субботу его сестра делала работу за него. Так как она хуже знала маршрут и ездила на велосипеде медленнее, это приводило к опозданию в среднем на 20 минут.
Рубрика Инструменты для анализа вероятной причины |
Существуют следующие виды распределения, о которых необходимо знать:
• Один пик показывает среднее значение для процесса. Если этот пик расположен не по центру, то для этого должна быть причина, которая может быть интересной для исследования.
• Два ярко выраженных пика могут быть вызваны двумя разными источниками данных, что обычно указывает на ошибку в процессе сбора информации. Это должно быть проверено.
• Обрезанное распределение, которое не имеет снижения по краям, указывает на то, что данные подвергались сортировке в процессе или после сбора информации.
• Гребенчатое распределение говорит о том, что данные разделены на слишком большое количество классов. Некоторые классы совсем не содержат данных, оказываясь бесполезными для формирования общей картины распределения.
Рубрика Инструменты для анализа вероятной причины |
Говоря о гистограммах, важно упомянуть об основной статистической концепции, а именно - о нормальном распределении.
Если бы вы хотели определить время, которое занимает дорога на работу каждое утро, то вероятно вы измеряли бы одну величину -продолжительность поездки. Если результаты замеров равномерно распределяются вокруг некой центральной точки (или ожидаемого значения), статистики используют нормальное распределение для описания этих результатов и расчета вероятности. Если нормально распределенные данные представить в виде гистограммы, то значения будут уменьшаться в обе стороны от этого центрального значения. Отклонение от такой картины распределения данных сигнализирует о наличии аномалии. Это можно использовать для решения проблемы, как показано дальше.
Нормальное распределение является по ряду причин довольно уникальным.
Оно симметрично, то есть вероятность того, что значение будет больше ожидаемого равна вероятности того, что полученное значение будет меньше ожидаемого.
Гистограмма, построенная для такого распределения, выглядит как колокол. Поэтому оно имеет второе название - распределение колоколообразной формы.
Распределение можно использовать для проведения серьезных рассчетов. Этот метод улучшения называется статистическим управление процессом.
Рубрика Инструменты для анализа вероятной причины |
Две величины, изменяющиеся синхронно, могут быть связаны между собой, что является важной информацией. Однако запомните, что если даже существует некая степень одновременной вариации величин, это не означает, что между ними обязательно есть причинно-следственная связь. На самом деле, этот эффект может появиться благодаря третьей величине.
Удивительный пример явной корреляции содержится в диаграмме рассеивания, которая показывает четкую взаимосвязь между индексом Доу-Джонса и уровнем воды в озере Верхнее в период с 1925 по 1965 гг.
Поэтому, если диаграмма указывает на признаки присутствия взаимосвязи, необходимо исследовать данный вопрос более глубоко и найти доказательства данному утверждению. Соответственно, диаграмма, не показывающая никакой корреляции, тоже не должна избавлять Вас от сомнений.
Рубрика Инструменты для анализа вероятной причины |
Крупный алюминиевый завод весь год работал в пять смен, состоявших из звеньев, каждое из которых обслуживало одну печь. Около года назад была введена новая система оплаты, в соответствии с которой работа звеньев оценивалась по выпуску, потреблению энергии, уровню брака и использованию металлолома. Оплата всего звена в свою очередь зависела от результатов по этим показателям.
Система оплаты понравилась рабочим, однако изредка звучали жалобы, что перед началом новой смены предыдущая наполняла печь металлоломом. В этой связи у первой смены были хорошие показатели по использованию металлолома, а звено, шедшее следом, имело низкий выпуск. Также звучали недовольства по поводу плохой уборки помещения цеха, невыполнения требуемого ремонта, неправильной и беспорядочной парковки транспортных средств.
Несмотря на то, что все эти вопросы неоднократно обсуждались, они не исчезали. Руководство было уверенно, что хотя система оплаты достаточно эффективна и увеличила производительность почти на 2 процента, она являлась причиной проблем. Поэтому система была отменена в начале весны. После нескольких недель работы по старой системе оказалось, что жалоб на беспорядок после окончания смены стало еще больше. Обескураженное руководство провело ряд тестов, пытаясь выяснить причину этого. Было составлено несколько диаграмм рассеивания, для выявления связи между количеством жалоб и различными причинами. Одна из последних диаграмм все-таки выявила «виновника»: как показывает график на следующей странице, была четкая взаимосвязь между количеством жалоб и погодой. Скорее всего, работники хотели закончить работу побыстрее и освободиться в хорошую погоду, поэтому не так тщательно убирали и чистили оборудование в конце смены.
Рубрика Инструменты для анализа вероятной причины |
1. Выберите для исследования две переменные (одну независимую и одну зависимую).
2. Для каждого значения независимой переменной измерьте соответствующее значение зависимой переменной.
3. Эти два значения представляют собой так называемую «пару данных», которая будет размещена на диаграмме. Как правило, должно быть хотя бы 30, а лучше более 100, подобных пар, чтобы получить содержательную диаграмму.
4. Постройте диаграмму, разместив в ней независимую переменную, то есть предполагаемую причину, по горизонтальной оси, а зависимую переменную, то есть предполагаемое последствие, по вертикальной.
5. Изобразите на диаграмме выбранные пары и проанализируйте их.
6. Если диаграмма не показывает взаимосвязи, постройте диаграмму в логарифмической системе координат (по одной или обеим осям), которая иногда может выявить связи, невидимые на обычной диаграмме.
Рубрика Инструменты для анализа вероятной причины |
Двумерная диаграмма рассеивания используется для одновременного анализа только двух причин, выраженных соответствующими переменными. Когда одна из переменных увеличивается, другая при этом может также увеличиваться, уменьшаться или изменяться случайным образом. Если обе переменные изменятся одновременно, это может означать, что они взаимосвязаны и оказывают влияние друг на друга.
Взаимосвязь между исследуемыми величинами может иметь разную степень: от сильно позитивной до сильно негативной. Между этими двумя крайними значениями находятся более слабые степени как позитивной, так и негативной корреляции, а также отсутствия таковой вообще. Примеры различных диаграмм с разной степенью взаимосвязи показаны далее.
Рубрика Инструменты для анализа вероятной причины |
Очень часто причины разных уровней оказывают влияние друг на друга. Диаграмма рассеивания помогает определить подобные взаимосвязи (обязательное условие для ее построения - каждая причина может быть представлена в виде числового значения).
Основная цель диаграммы рассеивания - показать взаимосвязь между двумя причинами или другими величинами.
При анализе основной причины такие диаграммы эффективны, чтобы:
• Исследовать цепь причин, определяя влияние, которое оказывает причина одного уровня на причины другого уровня.
• Исключить причины на разных уровнях, не связанные с основной причиной.
Рубрика Инструменты для анализа вероятной причины |