2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.



Начать новую тему Ответить на тему
 
 Контроль качества на производстве
Сообщение11.06.2015, 22:33 


17/04/06
256
Добрый день,

Что-то я совсем запутался в статистике, так что извиняйте за неграмотный вопрос. На практике можно часто столкнуться со следующей ситуацией. У нас есть производственная линия изготавливающая болванки. На контроле качества замеряют длину болванки. Допустим что у нас уже есть распределение длин болванок и допустим, что оно $N(\mu, \sigma)$. Если длина болванки в пределах $\mu +/- 2\sigma$, то пропускаюти, иначе - бракуют.

Так вот меня интересуют вопрос, что если у нас не нормальное распределение, а какое-нибудь бимодальное или еще хитрее. Можно задать вопрос и потруднее, если у нас замеряется сразу длина и ширина болванки и распределение опять какое-то хитрое. Как контролировать качество в этом случае?

Имеет ли смысл мой вопрос, или я черезмерно усложняю?

Поделитесь знаниями.
Спасибо!!

 Профиль  
                  
 
 Re: Контроль качества на производстве
Сообщение12.06.2015, 01:18 
Заслуженный участник
Аватара пользователя


09/09/14
6328
Bridgeport
Мне приходилось заниматься вопросами управления качеством, хотя и не с такими. Впрочем, Ваши примеры и вопросы не совсем понятны и, вероятно, могут быть интерпретированы по-разному. Попытаюсь прокомментировать в пределах своих остаточных знаний и понимания.

В первой ситуации, как я понимаю, на выходе имеется серия болванок с, пусть, бимодальным распределением длины. И по-прежнему требуются только $\mu \pm 2\sigma$, остальные бракуются. На практике это скорее всего означает, что у Вас в процессе производства имеются причины возникновения обнаруженной кластеризации (простейшая гипотеза: один станок или форма даёт чуть больше, другой -- чуть меньше). Теперь задача службы качества решить, что с этим делать:
либо определить эти причины и по возможности устранить их, приведя распределение к нормальному (если оно того стоит по деньгам -- что не факт),
либо просто продолжать контролировать ситуацию, отслеживая статистику.

Если Вы говорили не об этом, то лучше конкретизировать Ваш пример или идею.

По второму варианту я придумал вполне правдоподобный пример. Можно представить себе ситуацию, в которой мы класс шероховатости поверхности определяли бы не по отдельным характеристикам профиля, а по какой-то интегральной величине. И что средство измерения определяло бы сразу эту интегральную величину, а не отдельные характеристики. А годными считались бы те детали, у которых она находится в определённых пределах. Ну вот пример я вроде придумал адекватный, а в чём Ваш вопрос теперь не понятно. Ну, меряем одним измерением всё вкупе, ну пропускаем в годное какое-то своё интегральное $\mu \pm 2\sigma $ и что? Как и зачем можно усложнить эту ситуацию, не соображу.

 Профиль  
                  
 
 Re: Контроль качества на производстве
Сообщение12.06.2015, 04:54 


17/04/06
256
Спасибо, grizzly!

Да, я пожалуй излишне усложнил ситуацию. Скорее всего такое не встречается в жизни. Просто мне любопытен сам факт, что для нормального распределения мы можем говорить о том что какая-то единичная величина (длинна болванки) является более вероятной если она нaходится в интервале $\mu +/- 2\sigma$. Для некоторых распределиений это невозможно (ну или я просто с этим не знаком)

 Профиль  
                  
 
 Re: Контроль качества на производстве
Сообщение12.06.2015, 08:10 
Супермодератор
Аватара пользователя


20/11/12
5728
 i  Bridgeport
Bridgeport в сообщении #1026254 писал(а):
$\mu +/- 2\sigma$.
grizzly в сообщении #1026241 писал(а):
$\mu \pm 2\sigma $

пишите формулу нормально

 Профиль  
                  
 
 Re: Контроль качества на производстве
Сообщение12.06.2015, 12:04 
Заслуженный участник


16/02/13
4214
Владивосток
Скорее, по-моему, недодумали. Ситуации, описанные grizzly, вполне, имхо, возможны, так что вопрос вполне себе имеет отношение к жизни. Следующий вопрос: что с этим делать и надо ли что-то с этим делать? На эти вопросы можете ответить только вы, как непосредственный участник.

 Профиль  
                  
 
 Re: Контроль качества на производстве
Сообщение12.06.2015, 22:43 
Заслуженный участник
Аватара пользователя


28/09/06
11261
Bridgeport в сообщении #1026206 писал(а):
Имеет ли смысл мой вопрос, или я черезмерно усложняю?
Не знаю что тут сложного, но и смысла пока не увидел. Диапазон допустимых значений, за пределами которого продукт отбраковывается, вообще говоря не имеет никакого отношения к сигме. Допустимые отклонения определяются требованиями заказчика, а сигма -- условиями производства. Соотношение между одним и другим влияет на процент брака. Есть такие случаи, когда брак не должен превышать миллионные доли процента, а есть и такие, когда 99% продукции идёт в брак (и это считается допустимым).

 Профиль  
                  
 
 Re: Контроль качества на производстве
Сообщение13.06.2015, 00:23 


17/04/06
256
Да, товарищи математики, похоже, вы совсем чужие мысли читать не умеете. ;-)

Хорошо, я попробую переформулировать вопрос. Вот мы наблюдаем за болванками и если длинны болванок лежат в пределах $\mu \pm 2 \sigma$, мы считаем, что станок (производящий болванки работает нормально), если мы определяем, что длина болванки не лежит в вышеуказанных пределах, то надо перенастраивать станок. Как вы считаете, такая постановка контроля уместна?

Если она уместна, меня интересует немного теоретический (абстрактный вопрос). Удивительно, что для нормального распределения мы можем говорить о каких-то исходах (например в пределах $\mu \pm 2 \sigma$ ) как более вероятных, а о каких-то как менее вероятных.

А если допустить что длинны болванок логнормально распределены, как определить интервал длин болванок когда надо перенастраивать станок? Здесь можно поразмыслить и пересчитать логнормальное распределение в нормально, взять тот же интервал и перенести его обратно на случай логнормального распределения (просто предложил, не знаю имеет ли этот подход какой-то смысл) А что если взять распределение посложнее?

Понятно, что в случае более сложного распределения надо смотреть на данные и искать откуда произрастает это сложное распределение как и предложил grizzly. (Здесь под более сложным распределение понимается распределение отличное от нормального - кривовато сказано, но как-то так). Однако, интересно, можно ли для любого произведения говорить об интервалах более вероятных значений и об интервалах менее вероятных значений?

Спасибо!

 Профиль  
                  
 
 Re: Контроль качества на производстве
Сообщение13.06.2015, 01:51 
Заслуженный участник
Аватара пользователя


09/09/14
6328
Bridgeport
Здесь проблема в самих мыслях, а не в их чтении :)
Вы пытаетесь плясать от математики, совершенно не заботясь о том, чтобы используемые Вами понятия имели хоть какое-то отношение к реальной жизни. Вам уже разъяснил epros, что обычно никто не ставит себе целью отбраковывать ровно 5% изделий, а Вы опять за своё.

Bridgeport в сообщении #1026585 писал(а):
длинны болванок лежат в пределах $\mu \pm 2 \sigma$ ... если мы определяем, что длина болванки не лежит в вышеуказанных пределах, то надо перенастраивать станок. Как вы считаете, такая постановка контроля уместна?

Нет, не уместна. Исходить нужно от требований к болванкам. Если 100% выходящих с нашего станка болванок удовлетворяют необходимым требованиям, тогда ничего перенастраивать не нужно независимо от того, сколько болванок не попало в очерченные Вами пределы. Или обратная ситуация: 100% болванок не удовлетворяют требованиям, а с указанным Вами распределением всё идеально -- чистое $N(\mu, \sigma)$. В этом случае нужно срочно что-то перенастраивать.
Ту же логику нужно применять и в случае "плохого" распределения. Тип и параметры распределения могут помочь нам понять причины происходящего, но не являются критериями к отбраковке продукции или перенастройке процессов. Хотя стремление поддерживать на выходе определённое (скажем, нормальное) распределение может быть оправданно само по себе.

 Профиль  
                  
 
 Re: Контроль качества на производстве
Сообщение13.06.2015, 19:49 


17/04/06
256
Ну неужели это все плод моего больного воображения?

Хорошо, надеюсь это последняя попытка.

У нас имеется компьютерная система, которая распознает пользователя по голосу и открывает доступ к каким-либо ресурсам. Пользователь произносит секретное слово, и система его проверяет. Предварительно происходит обучение системы, т.е. пользователь многократно произносит секретное слово, и система его фиксирует. Процесс обучения продолжается и после этой предварительной стадии, но уже в рабочем режиме. Система идентификации продолжает аккумулировать знания и произнесении секретного слова. Очевидно, что секретное слово произнесенное пользователем не является какой-то константой, а представляет собой какое-то распределение. Здесь случай посложнее, чем с болванкой, так что, наверное, следует говорить и разложение в частотный ряд секретного слова, ну или какой-то иной квантификации звука, здесь я пока ничего конкретного сказать не могу.

Так вот задачи системы отличить настоящего пользователя по звуку. Я уже боюсь формулировать какое-либо статистическое утверждение. Здесь есть польза от изученного распределения? Имеет ли смысл говорить о каких-либо интервалах для параметров звука?

Спасибо.

 Профиль  
                  
 
 Re: Контроль качества на производстве
Сообщение13.06.2015, 22:09 


17/10/08

1313
С точки зрения дилетанта…еще раз про болванки, у которых контролируется длина. Всегда есть некоторые допуски на эту длину, т.е. существует допустимый диапазон длин, скажем от $a$ до $b$.

1. Если на производстве контролируется каждая болванка, то не попавшие в диапазон от $a$ до $b$ изделия бракуются.

2. Если каждую болванку проверить нет возможности, то проверка делается на выборке (части болванок). Задается приемлемый уровень брака в партии - если вероятностная оценка превышает этот порог - бракуется вся партия.
2.1 Если предполагается нормальное распределение (есть тесты проверки, то это распределение, или не то), то на выборке вычисляются среднее и дисперсия. Прикинуть, сколько «сигмов» нужно, чтобы обеспечить приемлемый уровень брака, можно посмотреть на картинке здесь. Если среднее не смещено, среднее то плюс-минус «2 сигма» должно попасть в диапазон $a$ и $b$ - в этом случае качество партии приемлемо.
2.2 Если имеет место смещение среднего, то нужно на график плотности распределения наложить $a$ и $b$ и посчитать площадь «хвостов» - это и будет оценка процента брака.
2.3 Если распределение не нормальное – накладываем на плотность $a$ и $b$ и считаем хвосты. Если они дают приемлемый уровень брака – то Ok.

3. Если погрешность задана на несколько параметров или "формулу" (скажем, на длину, ширину и площадь), то можно построить 3 вероятностных модели и оценить соответствие заданным требованиям (что будет не совсем корректно, но не суть).

4. Существует множество случаев, когда вероятностные модели просто не работают. Пример – распознавание ключевого слова по голосу. Эта задача относится к классу Data Mining и связана с обучением более сложным, чем наивная статистика. Во-первых собирается статистика – набор из пар «произнесенное слово» и «аудио-файл». В простейшем случае данные делятся на обучающие и тестовые. На обучающих данных подбирается функция/алгоритм распознавания, на тестовых делается проверка. Часто используется площадь ROC-кривой или индекс Джини.
Подбор алгоритма/функции в таких задачах обычно состоит из двух шагов:
* Подбор признаков
* Подбор вида функции (логистическая модель, случайные деревья и т.д.)
Статистические модели здесь обычно не работают, т.к. признаков может быть очень много, а функции весьма сложны и выявить их на глаз в многомерном пространстве невозможно.

 Профиль  
                  
 
 Re: Контроль качества на производстве
Сообщение13.06.2015, 22:19 


07/08/14
4231
Bridgeport в сообщении #1026783 писал(а):
Очевидно, что секретное слово произнесенное пользователем не является какой-то константой, а представляет собой какое-то распределение.

пусть одно слово - случайная величина (исход, реализация с.в., ...).
у разных людей разные распределения звучания слов?

 Профиль  
                  
 
 Re: Контроль качества на производстве
Сообщение13.06.2015, 22:26 
Заслуженный участник
Аватара пользователя


09/09/14
6328
Bridgeport
Я думаю, mserg дело говорит. Да, когда речь идёт о выборке из партий, мы по результатам измерений можем всяко-разно использовать статистику полученных результатов и принимать по этой статистике различные решения для всей партии (в зависимости от политики качества). Хороший пример.

По распознаванию голоса и другим относительно сложным примерам тоже соглашусь -- это всё творческие задачи, требующие индивидуального подхода к решению. Вряд ли их стоит обсуждать в канве общераспространённых задач стат.методов в управлении качеством. Впрочем, здесь уже я совсем дилетант.

 Профиль  
                  
 
 Re: Контроль качества на производстве
Сообщение13.06.2015, 22:40 


17/10/08

1313
Кстати, есть такой сайт kaggle, где есть подходящие "соревнования":
* Digit Recognizer (распознавание цифр)
* Facial Keypoints Detection (определение ключевых точек лица)
Чем они интересны. Они просты, также содержат начальное руководства с примерами на языке R. Разумеется, есть базы изображений и оценки (формулы оценки качества).

Еще там было такое смешное соревнование - распознавание, кто пользовался "девайсом" (Accelerometer Biometric Competition). У девайса есть измерители ускорений по трем координатам (когда девайс лежит на столе, то "ускорение" равно 9.8g и направлено вверх). Идея состояла в том, что каждый пользует девайс в своей манере - держит под углом, трясет, двигает - три датчика ускорения это фиксируют. Задача была в распознавании человека по манере пользования.

Еще одно забавное соревнование - предсказание судорог по энцефалограмме (American Epilepsy Society Seizure Prediction Challenge). На ихних форумах выкладывают решения, также делают публикации в журналах.

Так что материал для вхождения в тему есть.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 13 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: Bing [bot]


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group