2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.



Начать новую тему Ответить на тему
 
 О выборе модели экспертной системы
Сообщение12.05.2014, 01:25 


15/04/10
985
г.Москва
данный вопрос относясь к экспертным системам по-видимому имеет не только математическую составляющую. Тем не менее решил задать его здесь а не на форуме Computer Science.
Описание модели.
Имеется N классов $K_1,K_2,...Kn$ и совокупность m параметров $P_1,P_2,...P_m$
Тип значений параметров в общем случае –вещественный или целый.
Однако для характеристики принадлежности ситуации к какому-то классу, т.е в правиле приняты 3 качественных уровня значений параметров– низкое,среднее и высокое значение. Конкретно для каждого $i$параметра заданы 2 пороговых значения $P_{imin} , P_{imax} $
если $P_i<P_{imin}$ то значение параметра –низкое,
если $P_{imin}<P_i <P_{imax}$ то значение параметра –cреднее,
если $P_{imax}<P_i$ то значение параметра высокое.
Правило относит ситуацию, характеризуемую набором параметров к заданному классу, если каждый параметр набора имеет заданный качественный уровень значения: 0-низкий, 1-средний,2-высокий. Таким образом, правило-это конъюнкция простых условий$RUL=U_1 \bigwedge U_2...\bigwedge U_k $
и характеризуется номером класса $i$ к которому она относит ситуацию: ЕСЛИ $ RUL $ ТО $K_i$
А простое условие $U_i$ характеризуется:
$n_i$ - номером параметра в списке параметров и
$Z_k$ – качественным уровнем значения параметра (k=0-низкий, k=1-средний,k=2-высокий)
т.е. имеет вид $P_{n_i}\in Z_k$
Число условий к в каждом правиле может быть свое.
Алгоритм работы
1.Пользователь формирует набор параметров $v_1,v_2,...v_m$
и задает им численные значения .
2.Для каждого правила входящего в систему правил делается перебор по всех простым условиям входящими в данное. При этом
А)рассчитывается значение функции принадлежности простого условия на основании сопоставления значений параметров простого условия с значениями набора параметров пользователя. где
$p_j=1$ если j-параметр пользователя есть в списке параметров простого условия и он лежит в качественном диапазоне значений параметра этого условия
$p_j=0$ если j-параметра пользователя нет в списке параметров правила или их значения не совпадают
Б) Формируется степень принадлежности $\mu$ к данному правилу по формуле $\mu=\frac{\sum{p_j}}{k}$ (1)
-----------------------------------------------------------------------------------
Собственно вопросов у меня два.
1)о математических правилах оценки степени близости запроса пользователя и классификации ситуации в соответствии с введенными правилами в ЭС.
2)о выборе разновидности модели для построения экспертной системы

По 1 вопросу: в качестве $k$ –принято количество простых составляющих в очередном правиле ЭС.
В общем случае вектор запроса $\bar{v}$ и вектор качественных значений правила $\bar{Z}$ имеют разные размерности $Dim(V)=m, Dim(Z)=k$ И наборы их параметров могут пересекаться или входить один в другой.
Не лучше ли в формуле функции принадлежности (1) суммировать не по к , а по $\max(m,k)$?
Это имеет смысл: если пользователь «перебрал» параметров своей оценки ситуации по отношению к некому правилу, то за это он штрафуется умень-шением значения функции принадлежности за счет добавления лишних нулей.
Возможно есть другие статистические меры оценок степени близости ситуации правила и запроса пользователя.
2 вопрос о выборе разновидности модели по-видимому лежит вне математики а относится скорей к предметной области модели. Очевидным произволом этой модели была классификация всех параметров по 3 качественным уровням – (низкий,средний,высокий). Можно каждый параметр вообще говоря делить на разное число качественных уровней. Особенно на 2 – тогда ему соответствует не троичная а булева логика. Типа есть-нет. Но это –вопрос предметной области и особенностей ее параметров. Модель видно надо брать такую, чтобы ее можно было эффективно наполнить нужными параметрами и правилами данной предметной области.В моем случае предметная область – информационная безопасность, угрозы компьютерным сетям- вирусы, атаки и т.п.

 Профиль  
                  
 
 Re: О выборе модели экспертной системы
Сообщение12.05.2014, 08:30 


15/04/10
985
г.Москва
1)Забыл добавить, что результат работы алгоритма - класс с наибольшим значением функции принадлежности. Но если полученное мах значение функции принадлежности меньше допустимого, задаваемого опять-таки пользователем
$\mu_{\max}<\mu_{dop}$
то результата классификации запроса пользователя нет и ему выдается соответствующая диагностика
2)подход связанный с делением каждого параметра на разное число качественных уровней возможен, однако затрудняет хранение таких структур в базе данных. Возникает проблема хранения в базе данных такой таблицы параметров.(как известно, табл имеет постоянное число полей). И каждый уровень параметра придется хранить аналогично спискам в программировании в отдельной записи со ссылками на следующую

 Профиль  
                  
 
 Re: О выборе модели экспертной системы
Сообщение12.05.2014, 12:05 
Заслуженный участник


27/04/09
28128
eugrita в сообщении #862076 писал(а):
если $P_i<P_{imin}$ то значение параметра –низкое,
если $P_{imin}<P_i <P_{imax}$ то значение параметра –cреднее,
если $P_{imax}<P_i$ то значение параметра высокое.
Аккуратнее с формулировками-то надо! У вас возможны ситуации, когда значение параметра будет не низким, не средним и не высоким. Нужно два нестрогих неравенства.

eugrita в сообщении #862076 писал(а):
$Z_k$ – качественным уровнем значения параметра (k=0-низкий, k=1-средний,k=2-высокий)
т.е. имеет вид $P_{n_i}\in Z_k$
Должно быть $Z_{k_i}$. И вообще вы бы могли написать $Z_i$ и выкинуть отовсюду промежуточное никак не связанное ни с чем $k$.

(Дальше не разбирал.)

(О формулах.)

Кстати, в $\TeX$е для конъюнкции обычно используется не $\bigwedge$ как тут:
eugrita в сообщении #862076 писал(а):
$RUL=U_1 \bigwedge U_2...\bigwedge U_k $
а просто $\wedge$: $\mathrm{RUL} = U_1\wedge U_2\wedge\ldots\wedge U_k$. Большие знаки используются в таком контексте: $\mathrm{RUL} = \bigwedge_{i=1}^k U_i$.

eugrita в сообщении #862120 писал(а):
$\mu_{\max}<\mu_{dop}$
Так и пишите по-русски «доп», раз нужен: $\mu_\text{max} < \mu_\text{доп}$.

Менее значительные неприятности:
eugrita в сообщении #862076 писал(а):
$P_{imin} , P_{imax} $
Тут всё же лучше трёхуровневые индексы: $P_{i_\text{min}}, P_{i_\text{max}}$. Это не так страшно как кажется.

Также вы везде набираете многоточие как просто .... В отображении это не очень — есть же \ldots (в моих примерах оно используется, сравните вид). И ещё многоточие отделяется разделителями с обоих сторон (запятая или $\wedge$ в данном случае), а не только слева или справа.

 Профиль  
                  
 
 Re: О выборе модели экспертной системы
Сообщение13.05.2014, 07:55 


15/04/10
985
г.Москва
Да, записал не совсем точно, хотя вероятность что значение параметра пользователя точно попадет на границу класса=0 в случае вещественного типа и очень мала в случае целого типа.
но суть моих вопросов от этого не меняется. Я -конструктор и имею возможность управлять построением системы, построением правил, критериев близости. И хочу чтобы все было оптимально и безупречно. В отличие скажем от ситуации когда работают с какой-то готовой экспертной оболочкой и "запихивают" модель в нее.
Да, и еще.Проверяется возможность использования 2 вар. классификации по уровню значения параметра пользователя
а) когда заданы 2 фиксированные границы по каждому параметру
$g_1(i)$ разделяющая низкое и среднее значение $i$-параметра
$g_2(i)$ разделяющая среднее и высокое значение $i$-параметра

б)когда качественные уровни $i$-параметра заданы центрами (матожиданиями) и разбросами (ср.кв.откл)
$(XL_m(i),\sigma L(i))$ , $(XM_m(i),\sigma M(i))$ , $(XH_m(i),\sigma H(i))$
Тем самым конкретное значение параметра пользователя с разными вероятностями может относиться к одному или другому качественному уровню т.е. нечеткая логика

 Профиль  
                  
 
 Re: О выборе модели экспертной системы
Сообщение14.05.2014, 09:59 


15/04/10
985
г.Москва
Остановились на вар. когда 3 качественных уровня параметра - низкое, среднее и высокое характеризуются треугольными функциями принадлежности.
Тогда разделяющие границы
$g_1=\frac{Ms_L+Ls_m}{s_L+s_m}$ , $g_2=\frac{Hs_M+Ms_H}{s_M+s_H}$
Общее значение функции принадлежности по конкретному правилу (несколько параметров): $\mu=\frac{\sum{p_j\mu_j}}{k}$
где $p_j=1$ если параметр пользователя есть в списке параметров правила и значение параметра пользователя попадает в класс , назначенный для параметра правила иначе $p_j=0$
$\mu_j$-функция принадлежности $j$-параметра к классу (рассчитана по максимуму из 3 треугольных функций)
Правда опять, эта схема имеет недостаток. непонятно что делать с булевыми параметра типа наблюдается ли некоторый признак или нет.

 Профиль  
                  
 
 Re: О выборе модели экспертной системы
Сообщение18.05.2014, 21:37 


15/04/10
985
г.Москва
Еще раз формулирую правила вычисления значений функций принадлежности.
В основе модели лежит
а)определение границ области значений каждого параметра
б)принудительное разделение ее на 3 класса значений - низкое, $L$, среднее,$M$,высокое ,$H$
характеризуемых каждый своим интервалом (чуть изменю обозначения)
$L_m(i),\sigma_L(i)$ - обл низких значений,
$M_m(i),\sigma_M(i)$ - обл средних значений,
$H_m(i),\sigma_H(i)$ - обл высоких значений,
причем интервалы-пересекающиеся, т.е.
$L_m(i)+\sigma_L(i)>M_m(i)-\sigma_M(i)$ и то же для средних\высоких.
в)построение треугольных функций принадлежности
Изображение
после чего легко определяются разделяющие границы $g_1,g_2$
Далее процедура вычисления простой функции принадлежности $\mu_j$ $j$-параметра пользователя к классу "низкий","средний" или "высокий" и общей функции принадлежности $\mu$ правила понятна.
По-моему, наиболее шаткий момент в такой или аналогичной классификации в том, что некий эксперт-разработчик берет на себя смелость вообще провести такую классификацию на 3 класса каждого параметра, причем чтобы диапазоны были именно пересекающимися.
С этим можно поспорить - почему 3? Не проходит если только 2 уровня низкий-высокий, что эквивалентно булевому признаку есть/нет. Если можно выделить более 3 уровней, то лишние можно "склеить" чтобы остаться все же на 3 уровнях.
Но вроде именно такое выделение пересекающихся интервалов характерно для функций принадлежности нечеткой логики

 Профиль  
                  
 
 Re: О выборе модели экспертной системы
Сообщение18.05.2014, 22:30 
Заслуженный участник


27/04/09
28128
Да не, не характерно. Функция принадлежности низкости не знает ничего про функцию принадлежности высокости, это разные части описания. Да и именно три функции, мне думается, там не настолько распространены, чтобы затмить множество случаев использования другого числа, и даже одной.

Хотя в похожести на модели на основе нечёткой логики никакой веской причины нет, можно вообще не оглядываться на неё и не знать.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 7 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group