В исследовании проводится сравнительный анализ эффективности трех систем ИИ-агентов (Codex с навыками Claude Scientific Skills, Biomni Lab и DeerFlow 2) при выполнении сложных биоинформатических задач. Основная задача заключалась в поиске и классификации белков, связанных с кальцификацией кокколитофорид, в базе данных UniProt по шести различным механистическим категориям. Результаты показали, что система Codex продемонстрировала наилучший баланс между чувствительностью и специфичностью: 92,4% найденных ею белков имели высокую релевантность, а средний коэффициент сходства Жаккара составил 0,982, что говорит о высокой стабильности. В то же время Biomni Lab выдала самый большой объем данных (8 752 белка), но 69,5% из них оказались малорелевантными из-за чрезмерного расширения поиска на общие семейства белков. DeerFlow 2 показала высокую полноту охвата, но с существенным снижением точности (43,8% низкорелевантных результатов). Исследование делает важный вывод: для биоинформатики качество ИИ-агента определяется не объемом выдачи, а точностью генерации запросов, способностью к декомпозиции промптов и стабильностью результатов при повторных запусках.