AI 전문가 저스틴의 특별 강의: OpenAI o3 & o4-mini 전격 해부!

안녕하세요, AI에 푹 빠진 여러분! 저스틴입니다. 오늘 여러분과 함께 흥미진진한 OpenAI의 최신 모델, o3와 o4-mini에 대해 샅샅이 파헤쳐 볼 겁니다. 마치 새로운 스마트폰이 출시되자마자 스펙부터 사용 후기까지 꼼꼼하게 살펴보는 것처럼, 이 두 모델의 모든 것을 속속들이 알려드릴게요!

1. o-시리즈의 진화: 더 똑똑해진 AI, o3 & o4-mini

2025년 4월 16일, OpenAI는 o-시리즈의 최신 모델인 o3와 o4-mini를 공개했습니다. 이 모델들의 가장 큰 특징은 바로 **”더 오래 생각한다”**는 점입니다. 마치 숙련된 바둑 기사가 다음 수를 신중하게 고민하는 것처럼, o3와 o4-mini는 응답하기 전에 더욱 심층적인 사고 과정을 거칩니다.

이러한 심층적인 사고 능력은 ChatGPT의 전반적인 성능 향상으로 이어집니다. 이제 ChatGPT는 단순한 질문에 답하는 것을 넘어, 복잡한 문제를 해결하고 창의적인 아이디어를 제시하는 데 더욱 강력한 도구가 될 수 있습니다. AI에 대한 호기심을 가진 일반 사용자부터 고급 연구자까지, 모두에게 획기적인 변화를 가져다줄 모델이라고 할 수 있죠.

2. ChatGPT의 모든 도구를 활용하는 에이전트 AI

o3와 o4-mini의 또 다른 혁신적인 기능은 바로 **”에이전트(Agent)”**로서의 능력입니다. 이 모델들은 ChatGPT 내의 모든 도구를 자유자재로 사용하고 조합할 수 있습니다. 웹 검색, 파일 분석, Python을 이용한 데이터 분석, 이미지 해석, 심지어 이미지 생성까지, 다양한 도구를 능숙하게 활용하여 복잡한 문제를 해결합니다.

핵심은 이 모델들이 단순히 도구를 사용하는 것이 아니라, “언제, 어떻게” 도구를 사용해야 하는지 스스로 판단할 수 있다는 점입니다. 예를 들어, 사용자가 “캘리포니아의 여름 에너지 사용량이 작년과 어떻게 비교될까?”라고 질문하면, o3는 웹 검색을 통해 공공 유틸리티 데이터를 찾고, Python 코드를 작성하여 예측 모델을 만들고, 그래프나 이미지를 생성하여 결과를 시각적으로 보여줄 수 있습니다. 마치 숙련된 비서처럼, o3는 사용자를 대신하여 여러 단계를 거치는 복잡한 작업을 수행할 수 있습니다.

3. o3: 최고 수준의 추론 능력을 경험하다

OpenAI o3는 코딩, 수학, 과학, 시각적 인식 등 다양한 분야에서 최고 수준의 추론 능력을 자랑합니다. o3는 복잡한 쿼리에 대한 다각적인 분석이 필요한 경우, 즉 답이 명확하게 드러나지 않는 어려운 문제에 특히 강점을 보입니다. 이미지, 차트, 그래픽 분석과 같은 시각적인 작업에서도 뛰어난 성능을 발휘합니다.

외부 전문가들의 평가에 따르면, o3는 어려운 실제 작업에서 이전 모델인 o1보다 20% 적은 주요 오류를 발생시킵니다. 특히 프로그래밍, 비즈니스/컨설팅, 창의적인 아이디어 구상 분야에서 뛰어난 성능을 보이며, 분석적 엄격성과 새로운 가설을 생성하고 비판적으로 평가하는 능력은 생물학, 수학, 공학 분야에서 특히 빛을 발합니다. 마치 뛰어난 연구 파트너처럼, o3는 사용자의 생각을 자극하고 새로운 가능성을 제시합니다.

4. o4-mini: 빠르고 효율적인 추론의 새로운 기준

OpenAI o4-mini는 빠르고 비용 효율적인 추론에 최적화된 소형 모델입니다. 모델 크기와 비용을 고려했을 때 놀라운 성능을 보여주며, 특히 수학, 코딩 및 시각적인 작업에서 두각을 나타냅니다. o4-mini는 AIME 2024 및 2025에서 최고의 성능을 기록했으며, Python 인터프리터를 사용하여 AIME 2025에서 99.5%의 합격률을 달성했습니다.

전문가들은 o4-mini가 데이터 과학과 같은 비 STEM 분야에서도 이전 모델인 o3-mini를 능가한다고 평가합니다. o4-mini는 효율성 덕분에 o3보다 훨씬 높은 사용량 제한을 지원하며, 추론을 통해 해결할 수 있는 질문에 대해 높은 처리량을 제공합니다. 덕분에, o4-mini는 대용량 데이터 처리 및 빠른 응답 속도가 필요한 환경에 적합합니다.

5. 강화 학습을 통한 지속적인 성능 향상

OpenAI는 o3를 개발하는 과정에서 대규모 강화 학습이 GPT-시리즈의 사전 훈련에서 관찰된 “더 많은 컴퓨팅 = 더 나은 성능” 추세를 따른다는 것을 확인했습니다. OpenAI는 강화 학습에서도 컴퓨팅 규모를 획기적으로 늘려 모델의 성능을 지속적으로 향상시키고 있습니다.

OpenAI는 모델에게 도구를 사용하는 방법뿐만 아니라 “언제” 도구를 사용해야 하는지 추론하는 방법을 가르쳤습니다. 덕분에 o3와 o4-mini는 시각적 추론과 다단계 워크플로우를 포함하는 개방형 상황에서 더욱 뛰어난 능력을 발휘합니다.

6. 이미지를 통해 생각하는 AI

o3와 o4-mini는 텍스트뿐만 아니라 이미지도 직접 이해할 수 있습니다. 칠판 사진, 교과서 그림, 손으로 그린 스케치 등 다양한 이미지를 업로드하면, 모델이 이미지를 해석하고 이해합니다. 심지어 이미지가 흐릿하거나 뒤집히거나 품질이 낮은 경우에도 이미지를 이해할 수 있습니다.

또한, 이 모델들은 필요에 따라 이미지를 회전, 확대/축소, 변환하는 등 이미지를 자유롭게 조작할 수 있습니다. 덕분에 o3와 o4-mini는 이전에는 해결할 수 없었던 복잡한 시각적 추론 문제를 해결할 수 있습니다.

7. 코드 실행 환경(Codex CLI)

OpenAI는 o3 및 o4-mini와 같은 모델의 추론 능력을 극대화하도록 설계된 경량 코딩 에이전트인 Codex CLI를 공개했습니다. Codex CLI는 터미널에서 직접 실행되며, 스크린샷이나 저해상도 스케치를 모델에 전달하여 멀티모달 추론의 이점을 누릴 수 있습니다.

Codex CLI는 깃허브(github.com/openai/codex)에서 오픈 소스로 제공되며, OpenAI는 Codex CLI 및 OpenAI 모델을 사용하는 프로젝트를 지원하기 위해 100만 달러 규모의 이니셔티브를 시작했습니다.

8. OpenAI o3 & o4-mini: 누구에게나 열려 있는 AI

ChatGPT Plus, Pro, Team 사용자는 모델 선택기에서 o3, o4-mini, o4-mini-high를 사용할 수 있습니다. ChatGPT Enterprise 및 Edu 사용자는 1주일 후에 액세스 권한을 얻게 되며, 무료 사용자는 작곡기에서 ‘Think’를 선택하여 o4-mini를 사용해 볼 수 있습니다.

o3 및 o4-mini는 Chat Completions API 및 Responses API를 통해 개발자에게도 제공됩니다. Responses API는 추론 요약, 함수 호출 주변의 추론 토큰 유지 기능, 웹 검색, 파일 검색, 코드 인터프리터와 같은 내장 도구를 지원합니다.

9. 미래를 향한 발걸음

OpenAI의 o3 및 o4-mini는 전문적인 추론 능력과 자연스러운 대화 능력, 도구 사용 능력을 융합하여 미래 모델의 방향을 제시합니다. OpenAI는 이러한 강점을 통합하여 원활하고 자연스러운 대화, 사전 예방적인 도구 사용, 고급 문제 해결을 지원하는 모델을 개발할 계획입니다.