Ученые Новосибирского госуниверситета вместе с коллегами из других вузов научили нейросети давать более точные ответы без «галлюцинаций» - выдуманных или недостоверных данных. В основе разработки - модульный движок RAGU (Retrieval‑Augmented Generation & Understanding).
Технология строит графы знаний на основе текстовых документов: автоматически разбивает текст на фрагменты, выявляет ключевые сущности и связи между ними, группирует данные в кластеры. В результате система отвечает, опираясь на реальные знания о предметной области, а не на общие ассоциации.
Разработку создали под руководством доцента Ивана Бондаренко. Проект победил в конкурсе Yandex Open Source в треке «Искусственный интеллект» и получил грант на использование ресурсов Yandex Cloud — это позволит провести дополнительные эксперименты перед подачей статьи на крупную конференцию по обработке естественного языка.
Уже сейчас RAGU задействован в системе «Менон» — цифровом помощнике абитуриента НГУ. Виртуальный ассистент консультирует по вопросам поступления и учёбы, ведёт диалог и формулирует ответы самостоятельно, используя структурированную базу данных об университете.
По оценкам экспертов, разработка превосходим зарубежные аналоги.
Технологию можно адаптировать для разных сфер — от строительства до работы с нормативной документацией. В ближайших планах команды — научить систему лучше понимать живую речь: корректно трактовать аббревиатуры, учитывать контекст диалога и правильно интерпретировать местоимения.
В разработке участвуют студенты и выпускники НГУ, а также представители других вузов — например, Дальневосточного федерального университета и Балтийского университета имени Канта.
Фото: ИИ