Listen

Description

Этот текст представляет собой научную статью о системе OpenScholar, разработанной для автоматического синтеза исследовательской литературы с помощью поисково-дополненной генерации. Авторы описывают создание специализированного хранилища данных из 45 миллионов статей и внедрение цикла самоанализа для повышения точности цитирования. Для проверки системы был разработан новый междисциплинарный бенчмарк ScholarQABench, включающий тысячи экспертных вопросов. Исследование показывает, что открытая модель OpenScholar-8B превосходит GPT-4o по качеству ответов и достоверности ссылок, сводя к минимуму риск галлюцинаций. В ходе тестов эксперты часто отдавали предпочтение ответам системы перед текстами, написанными людьми, отмечая их глубину и полноту охвата. В конечном итоге проект предлагает открытые инструменты для ускорения научной работы и более эффективного ориентирования в растущем потоке публикаций.