ИИ-разработка новосибирских студентов оценивает загруженность дорог и прогнозирует пробки в режиме реального времени/ Gрограмма анализирует видео с регистратора, распознаёт все объекты на дороге и выдаёт понятный текстовый отчёт о трафике. Проект создан на основе технологий компьютерного зрения и нейронных сетей и может быть полезен для дорожных служб, страховых компаний и аналитических центров.
Разработка студентов четвёртого курса НГТУ НЭТИ Максима Семёнова и Сергея Скорых работает так: нейросеть анализирует видеопоток и выделяет все важные объекты в кадре — дорожные знаки, разметку, светофоры, пешеходные переходы и транспортные средства. Затем алгоритм оценивает, как они расположены и движутся, и выдаёт связный текст на русском языке. Например: «в течение 30 секунд по дороге двигалось 12 легковых автомобилей и 2 грузовых, пешеходный переход не использовался, светофор работал в штатном режиме, загруженность трафика средняя».
Uлавное отличие их системы от обычных детекторов в том, что программа не просто перечисляет, что увидела, а формирует полноценный текст с итоговой оценкой ситуации. Это особенно удобно для обработки больших массивов данных: чтобы понять, что происходит на дороге, не нужно просматривать часы видео — достаточно прочитать готовый отчёт.
«В основе лежит свёрточная нейросетевая модель, которая обнаруживает объекты дорожной инфраструктуры в кадре: разметку, знаки, светофоры, пешеходные переходы, транспортные средства. Затем алгоритм анализирует их расположение и движение, после чего генерирует полное текстовое описание видеосцены. В конце программа делает итоговый вывод: "трафик низкий", "средняя загруженность" или "высокая интенсивность движения"», — объяснил Егор Антонянц.
Разработчики отмечают, что похожие решения существуют, но они либо требуют больших вычислительных мощностей, либо не адаптированы под российские дорожные реалии, либо просто выдают список объектов без анализа общей ситуации. Их программа, напротив, создана специально для наших дорог и выдаёт готовые тексты, которые легко искать, индексировать и обрабатывать автоматически.
«Наша разработка позволяет не просто увидеть, какие объекты попали в кадр, а получить полноценное текстовое описание видеосцены с итоговым вердиктом по трафику. Такой формат удобен для автоматического анализа больших объёмов данных. Текст легко индексировать, искать по ключевым словам и обрабатывать алгоритмами», — поделились студенты.
В перспективе система может пригодиться дорожным службам для мониторинга загруженности улиц в режиме реального времени, страховым компаниям для анализа аварийных ситуаций и аналитическим центрам для сбора статистики. Сейчас разработка проходит тестирование, а студенты уже думают над тем, как адаптировать систему для работы с существующими городскими камерами видеонаблюдения.
Фото: GigaChat