В статье исследуется потенциал внедрения способностей к логическому рассуждению в роботов-копилотов с искусственным интеллектом, работающих на базе моделей Vision-Language-Action (VLA) в условиях эндоскопической хирургии. Авторы подчеркивают, что переход от реактивного исполнения команд к когнитивному сотрудничеству требует интеграции мультимодальных данных для интерпретации намерений хирурга и скрытой динамики тканей. Основная методология заключается в использовании моделей VLA, которые позволяют ИИ не просто реагировать на визуальные стимулы, но и выстраивать сложные логические цепочки в реальном времени. Это направлено на снижение когнитивной нагрузки на хирурга и минимизацию интраоперационной неопределенности. Внедрение таких систем способно значительно повысить точность, безопасность и устойчивость хирургических вмешательств. Исследование закладывает фундамент для создания автономных ассистентов, способных понимать контекст операции на глубоком уровне.