언어 모델은 자연어 이해가 필요한 다양한 작업에서 놀라운 성과를 이루었습니다. 그러나 최신 모델들은 대학 수준의 수학, 과학, 공학 문제를 해결하는 데 필요한 양적 추론 작업에 대해 일반적으로 어려움을 겪고 있습니다. 이러한 차이를 좁히기 위해 우리는 Minerva를 소개합니다. Minerva는 일반 자연어 데이터로 사전 학습된 대형 언어 모델로, 기술적인 콘텐츠로 추가 학습되었습니다. 이 모델은 외부 도구를 사용하지 않고 기술적인 기준에 대해 최고 성능을 달성합니다. 또한 물리학, 생물학, 화학, 경제학 등 양적 추론이 필요한 200개 이상의 학부 수준 문제를 평가하였고, 모델이 거의 1/3의 문제를 정확히 해결할 수 있다는 결과를 얻었습니다.