Суть моей идеи заключается в следующем:
Цитата:
- централизованная (назовем ее “диспетчерской”) система сначала собирает статистику для реальной дорожной сети - наиболее часто имеющие место транспортные потоки, скорости движения отдельных транспортных средств (ТС) в разных условиях движения (заторы, свободное движение).
- на базе этого система настраивает параметры симулятора – виртуального экспериментального стенда, который имитирует проезд разных ТС по улично-дорожной сети (УДС) с учетом разных погодных условий (дождь, снег), времени суток, дня недели, времени года – примерно по типу того, как это реализовано в AnyLogic 8 – вероятностным образом, то есть просчитывает разные исходы движения транспорта. Допустим, автомобиль, стоящий в пробке перед светофором с определенной вероятностью успевает проехать на следующий зеленый сигнал светофора, а с определенной вероятностью не успевает. Симулятор выдает разветвляющееся дерево для каждого из исходов для всех машин на всех перекрестках, где каждый узел взвешен со своей вероятностью.
- потом система начинает самообучаться, прогоняя самые разные варианты развития дорожной обстановки на симуляторе - перебор возможных вариантов маршрутов ТС на УДС и их моделирование, моделирование ДТП и т.д., обучая оценочную нейронную сеть (недостатки: отличие данных, полученных с симулятора, от данных, полученных с реальной УДС), на входе которой – одна из возможных реальных ситуаций на УДС, на выходе – мат. ожидание средней удельной задержки времени проезда автомобилей.
- Потом обученная система начинает работать, управляя маршрутами ТС на УДС или возможными направлениями поворотов ТС на перекрестках путем сообщения предлагаемых действий водителям машин (или автопилотам) и режимами работы светофоров, но обучение системы и сбор статистики дорожных ситуаций продолжается. Реализуется дерево поиска по вероятности: осуществляется ветвление по разным переключениям светофоров (также возможна “зеленая волна”), разным поворотам машин на перекрестках, либо маршрутам машин по УДС (нужно выбрать, что именно, скорее всего первое) – вершины взвешены вероятностями этих исходов и вычисляются мат. ожидания среднего времени задержки проезда с помощью уже обученной нейронной сети. Ввиду большого ветвления дерева поиска можно применить метод Монте-Карло – тоже по аналогии с алгоритмом AlphaGo.
У этой идеи есть следующие особенности и недостатки:
Цитата:
- AlphaGo реализует игру с противником, система управления дорожным движением – игру с природой.
- Громоздкость реализации идеи для проверки (нужен коллектив программистов).
- Система станет наиболее актуальной при подавляющем количестве беспилотных автомобилей.
- Необходимо иметь разработанный адекватный симулятор движения автомобилей на УДС для точного предсказания математического ожидания удельных задержек движения машин.
- Видимо, систему можно реализовать только на небольшой УДС ввиду большого объема данных.