2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 О выборе модели экспертной системы
Сообщение12.05.2014, 01:25 
данный вопрос относясь к экспертным системам по-видимому имеет не только математическую составляющую. Тем не менее решил задать его здесь а не на форуме Computer Science.
Описание модели.
Имеется N классов $K_1,K_2,...Kn$ и совокупность m параметров $P_1,P_2,...P_m$
Тип значений параметров в общем случае –вещественный или целый.
Однако для характеристики принадлежности ситуации к какому-то классу, т.е в правиле приняты 3 качественных уровня значений параметров– низкое,среднее и высокое значение. Конкретно для каждого $i$параметра заданы 2 пороговых значения $P_{imin} , P_{imax} $
если $P_i<P_{imin}$ то значение параметра –низкое,
если $P_{imin}<P_i <P_{imax}$ то значение параметра –cреднее,
если $P_{imax}<P_i$ то значение параметра высокое.
Правило относит ситуацию, характеризуемую набором параметров к заданному классу, если каждый параметр набора имеет заданный качественный уровень значения: 0-низкий, 1-средний,2-высокий. Таким образом, правило-это конъюнкция простых условий$RUL=U_1 \bigwedge U_2...\bigwedge U_k $
и характеризуется номером класса $i$ к которому она относит ситуацию: ЕСЛИ $ RUL $ ТО $K_i$
А простое условие $U_i$ характеризуется:
$n_i$ - номером параметра в списке параметров и
$Z_k$ – качественным уровнем значения параметра (k=0-низкий, k=1-средний,k=2-высокий)
т.е. имеет вид $P_{n_i}\in Z_k$
Число условий к в каждом правиле может быть свое.
Алгоритм работы
1.Пользователь формирует набор параметров $v_1,v_2,...v_m$
и задает им численные значения .
2.Для каждого правила входящего в систему правил делается перебор по всех простым условиям входящими в данное. При этом
А)рассчитывается значение функции принадлежности простого условия на основании сопоставления значений параметров простого условия с значениями набора параметров пользователя. где
$p_j=1$ если j-параметр пользователя есть в списке параметров простого условия и он лежит в качественном диапазоне значений параметра этого условия
$p_j=0$ если j-параметра пользователя нет в списке параметров правила или их значения не совпадают
Б) Формируется степень принадлежности $\mu$ к данному правилу по формуле $\mu=\frac{\sum{p_j}}{k}$ (1)
-----------------------------------------------------------------------------------
Собственно вопросов у меня два.
1)о математических правилах оценки степени близости запроса пользователя и классификации ситуации в соответствии с введенными правилами в ЭС.
2)о выборе разновидности модели для построения экспертной системы

По 1 вопросу: в качестве $k$ –принято количество простых составляющих в очередном правиле ЭС.
В общем случае вектор запроса $\bar{v}$ и вектор качественных значений правила $\bar{Z}$ имеют разные размерности $Dim(V)=m, Dim(Z)=k$ И наборы их параметров могут пересекаться или входить один в другой.
Не лучше ли в формуле функции принадлежности (1) суммировать не по к , а по $\max(m,k)$?
Это имеет смысл: если пользователь «перебрал» параметров своей оценки ситуации по отношению к некому правилу, то за это он штрафуется умень-шением значения функции принадлежности за счет добавления лишних нулей.
Возможно есть другие статистические меры оценок степени близости ситуации правила и запроса пользователя.
2 вопрос о выборе разновидности модели по-видимому лежит вне математики а относится скорей к предметной области модели. Очевидным произволом этой модели была классификация всех параметров по 3 качественным уровням – (низкий,средний,высокий). Можно каждый параметр вообще говоря делить на разное число качественных уровней. Особенно на 2 – тогда ему соответствует не троичная а булева логика. Типа есть-нет. Но это –вопрос предметной области и особенностей ее параметров. Модель видно надо брать такую, чтобы ее можно было эффективно наполнить нужными параметрами и правилами данной предметной области.В моем случае предметная область – информационная безопасность, угрозы компьютерным сетям- вирусы, атаки и т.п.

 
 
 
 Re: О выборе модели экспертной системы
Сообщение12.05.2014, 08:30 
1)Забыл добавить, что результат работы алгоритма - класс с наибольшим значением функции принадлежности. Но если полученное мах значение функции принадлежности меньше допустимого, задаваемого опять-таки пользователем
$\mu_{\max}<\mu_{dop}$
то результата классификации запроса пользователя нет и ему выдается соответствующая диагностика
2)подход связанный с делением каждого параметра на разное число качественных уровней возможен, однако затрудняет хранение таких структур в базе данных. Возникает проблема хранения в базе данных такой таблицы параметров.(как известно, табл имеет постоянное число полей). И каждый уровень параметра придется хранить аналогично спискам в программировании в отдельной записи со ссылками на следующую

 
 
 
 Re: О выборе модели экспертной системы
Сообщение12.05.2014, 12:05 
eugrita в сообщении #862076 писал(а):
если $P_i<P_{imin}$ то значение параметра –низкое,
если $P_{imin}<P_i <P_{imax}$ то значение параметра –cреднее,
если $P_{imax}<P_i$ то значение параметра высокое.
Аккуратнее с формулировками-то надо! У вас возможны ситуации, когда значение параметра будет не низким, не средним и не высоким. Нужно два нестрогих неравенства.

eugrita в сообщении #862076 писал(а):
$Z_k$ – качественным уровнем значения параметра (k=0-низкий, k=1-средний,k=2-высокий)
т.е. имеет вид $P_{n_i}\in Z_k$
Должно быть $Z_{k_i}$. И вообще вы бы могли написать $Z_i$ и выкинуть отовсюду промежуточное никак не связанное ни с чем $k$.

(Дальше не разбирал.)

(О формулах.)

Кстати, в $\TeX$е для конъюнкции обычно используется не $\bigwedge$ как тут:
eugrita в сообщении #862076 писал(а):
$RUL=U_1 \bigwedge U_2...\bigwedge U_k $
а просто $\wedge$: $\mathrm{RUL} = U_1\wedge U_2\wedge\ldots\wedge U_k$. Большие знаки используются в таком контексте: $\mathrm{RUL} = \bigwedge_{i=1}^k U_i$.

eugrita в сообщении #862120 писал(а):
$\mu_{\max}<\mu_{dop}$
Так и пишите по-русски «доп», раз нужен: $\mu_\text{max} < \mu_\text{доп}$.

Менее значительные неприятности:
eugrita в сообщении #862076 писал(а):
$P_{imin} , P_{imax} $
Тут всё же лучше трёхуровневые индексы: $P_{i_\text{min}}, P_{i_\text{max}}$. Это не так страшно как кажется.

Также вы везде набираете многоточие как просто .... В отображении это не очень — есть же \ldots (в моих примерах оно используется, сравните вид). И ещё многоточие отделяется разделителями с обоих сторон (запятая или $\wedge$ в данном случае), а не только слева или справа.

 
 
 
 Re: О выборе модели экспертной системы
Сообщение13.05.2014, 07:55 
Да, записал не совсем точно, хотя вероятность что значение параметра пользователя точно попадет на границу класса=0 в случае вещественного типа и очень мала в случае целого типа.
но суть моих вопросов от этого не меняется. Я -конструктор и имею возможность управлять построением системы, построением правил, критериев близости. И хочу чтобы все было оптимально и безупречно. В отличие скажем от ситуации когда работают с какой-то готовой экспертной оболочкой и "запихивают" модель в нее.
Да, и еще.Проверяется возможность использования 2 вар. классификации по уровню значения параметра пользователя
а) когда заданы 2 фиксированные границы по каждому параметру
$g_1(i)$ разделяющая низкое и среднее значение $i$-параметра
$g_2(i)$ разделяющая среднее и высокое значение $i$-параметра

б)когда качественные уровни $i$-параметра заданы центрами (матожиданиями) и разбросами (ср.кв.откл)
$(XL_m(i),\sigma L(i))$ , $(XM_m(i),\sigma M(i))$ , $(XH_m(i),\sigma H(i))$
Тем самым конкретное значение параметра пользователя с разными вероятностями может относиться к одному или другому качественному уровню т.е. нечеткая логика

 
 
 
 Re: О выборе модели экспертной системы
Сообщение14.05.2014, 09:59 
Остановились на вар. когда 3 качественных уровня параметра - низкое, среднее и высокое характеризуются треугольными функциями принадлежности.
Тогда разделяющие границы
$g_1=\frac{Ms_L+Ls_m}{s_L+s_m}$ , $g_2=\frac{Hs_M+Ms_H}{s_M+s_H}$
Общее значение функции принадлежности по конкретному правилу (несколько параметров): $\mu=\frac{\sum{p_j\mu_j}}{k}$
где $p_j=1$ если параметр пользователя есть в списке параметров правила и значение параметра пользователя попадает в класс , назначенный для параметра правила иначе $p_j=0$
$\mu_j$-функция принадлежности $j$-параметра к классу (рассчитана по максимуму из 3 треугольных функций)
Правда опять, эта схема имеет недостаток. непонятно что делать с булевыми параметра типа наблюдается ли некоторый признак или нет.

 
 
 
 Re: О выборе модели экспертной системы
Сообщение18.05.2014, 21:37 
Еще раз формулирую правила вычисления значений функций принадлежности.
В основе модели лежит
а)определение границ области значений каждого параметра
б)принудительное разделение ее на 3 класса значений - низкое, $L$, среднее,$M$,высокое ,$H$
характеризуемых каждый своим интервалом (чуть изменю обозначения)
$L_m(i),\sigma_L(i)$ - обл низких значений,
$M_m(i),\sigma_M(i)$ - обл средних значений,
$H_m(i),\sigma_H(i)$ - обл высоких значений,
причем интервалы-пересекающиеся, т.е.
$L_m(i)+\sigma_L(i)>M_m(i)-\sigma_M(i)$ и то же для средних\высоких.
в)построение треугольных функций принадлежности
Изображение
после чего легко определяются разделяющие границы $g_1,g_2$
Далее процедура вычисления простой функции принадлежности $\mu_j$ $j$-параметра пользователя к классу "низкий","средний" или "высокий" и общей функции принадлежности $\mu$ правила понятна.
По-моему, наиболее шаткий момент в такой или аналогичной классификации в том, что некий эксперт-разработчик берет на себя смелость вообще провести такую классификацию на 3 класса каждого параметра, причем чтобы диапазоны были именно пересекающимися.
С этим можно поспорить - почему 3? Не проходит если только 2 уровня низкий-высокий, что эквивалентно булевому признаку есть/нет. Если можно выделить более 3 уровней, то лишние можно "склеить" чтобы остаться все же на 3 уровнях.
Но вроде именно такое выделение пересекающихся интервалов характерно для функций принадлежности нечеткой логики

 
 
 
 Re: О выборе модели экспертной системы
Сообщение18.05.2014, 22:30 
Да не, не характерно. Функция принадлежности низкости не знает ничего про функцию принадлежности высокости, это разные части описания. Да и именно три функции, мне думается, там не настолько распространены, чтобы затмить множество случаев использования другого числа, и даже одной.

Хотя в похожести на модели на основе нечёткой логики никакой веской причины нет, можно вообще не оглядываться на неё и не знать.

 
 
 [ Сообщений: 7 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group