В статье представлен DivQuant — новый метод оптимизации для оценки показателей разнообразия дискретных распределений, что критически важно для биоинформатики и микробиологического анализа. Исследователи решают проблему оценки видового богатства (alpha-разнообразия) и энтропии Шеннона при работе с малыми выборками, где присутствие редких элементов искажает результаты. Методология DivQuant основана на формулировке задачи апсемплинга как выпуклой квадратичной программы с целевой функцией Неймана (chi-квадрат), что позволяет строить эмпирически калиброванные доверительные интервалы. В отличие от существующих методов, таких как RichnEst, iNext и PreSeq, которые ошибаются в оценке истинного богатства в 80% случаев, DivQuant обеспечивает точность на уровне номинальных 95% доверительных интервалов. Тестирование проводилось на шести семействах распределений, данных микробиома Tara Oceans и данных секвенирования единичных клеток (scRNA-seq) от 10X Genomics. Метод превосходит классические асимптотические оценки (Miller-Madow, CAE) и демонстрирует высокую скорость работы, завершая вычисления за считанные секунды.