Исследование представляет автоматизированную платформу для систематического обзора биомедицинской литературы, направленную на решение проблемы галлюцинаций LLM при работе со сложными биологическими данными. В отличие от стандартных методов RAG, предлагаемый фреймворк заставляет модель анализировать каждую научную работу индивидуально на предмет соответствия конкретной гипотезе, что позволяет выявлять тонкие семантические противоречия. Методология фокусируется на поиске как подтверждающих, так и опровергающих доказательств, минимизируя риск чрезмерного обобщения данных. Эффективность системы была протестирована на задаче BioNLI, где она продемонстрировала высокую точность классификации поддержки или противоречия гипотезам. Использование ансамблевого подхода (ensemble approach) обеспечило более высокую стабильность и точность по сравнению с одиночными моделями. Результаты подтверждают практическую применимость метода для автоматизации доказательной базы в биомедицинских исследованиях и ускорения научного поиска.