Собственно на 2й свой вопрос нашел ответ. цена игры -
где
решения задачи линейного программирования при неотрицательных x, т.е получаем
оптимальные стратегии
т.е
неотрицательны и сумма=1 -т.е. это действительно вероятности
Я думаю, если писать учебную игровую программу матричной игры 2x2 для школьников или людей плохо знающих теорию, надо придерживаться следующих требований:
1)Ввод матрицы.
Если элементы допускают седловую точку то этот элемент =0, т.е.
Если не будет седловой точки, то цена игры найденная при смешанных стратегиях тоже должна быть=0, т.е. для 2x2 означает
c учетом требования выше разных знаков в каждом стоке столбце это
означают элементы главной диагонали одного знака а побочной - другого
(Правда непонятно, по теории цена игры больше 0 а я упорно хочу ее сделать равной 0)
2)Функция1 – интерактивная игра без знания хода. Пользователь играет вторым. Компьютер играет по оптимальной смешанной стратегии. Результат видит после сделанного хода.
3) Функция2 – интерактивная игра без знания хода. Пользователь играет вторым. Компьютер играет по адаптивной стратегии, т.е. на основе предыдущих ходов оценивает частоты выбора пользователем 1 и 2 столбца
где к -количество сделанных пар ходов.
Программа решает задачу поиска оптимальной стратегии, максимизирующей свой выигрыш считая полученные частоты - оценками вероятностей стратегии пользователя