My AI Smarteasy와 글 읽기 – Is Grok 4 Overrated?
Is Grok 4 Overrated? | SVIC Podcast & Wes Roth – YouTube
자, 반갑습니다! 대한민국 최고의 일타 강사, 저스틴입니다. 오늘 제 강의 하나로 여러분의 머릿속에 AI의 새로운 지평을 그냥 꽂아 넣어 드리겠습니다.
오늘 우리가 파헤쳐 볼 주제는 바로 일론 머스크가 야심 차게 내놓은 Grok 4(그록 4) 입니다. 이 모델, 정말 논란의 중심에 서 있죠. 어떤 평가에서는 세계 1등이라고 극찬하는데, 또 다른 지표에서는 66위까지 떨어지기도 합니다. 과연 Grok 4는 최고의 AI 모델일까요, 아니면 과대평가된 거품일까요?
오늘 강의는 SVIC Podcast의 ‘Is Grok 4 the best or overhyped?’ 유튜브 영상 스크립트를 기반으로 진행됩니다. 이 팟캐스트 진행자들이 나누는 깊이 있는 대화를 제가 여러분이 이해하기 쉽게 낱낱이 분석해 드리겠습니다.
강의 본문: Grok 4, 신화의 시작인가 거품의 증거인가?
1. Grok 4 탄생의 비밀: 10배의 강화학습(RL) 파워
자, 먼저 이 팟캐스트 진행자들이 Grok 4의 핵심을 어떻게 짚어내는지 봅시다. 그들은 Grok 4가 이전 모델인 Grok 3라는 상대적으로 약한 모델에 강화학습(Reinforcement Learning, RL) 컴퓨팅 파워를 무려 10배나 쏟아부은 결과물이라고 분석합니다.
이게 무슨 말이냐? 기존의 지식을 때려 넣는 방식(사전학습)을 넘어, 모델이 특정 목표를 더 잘 달성하도록 ‘훈련’시키는 강화학습에 어마어마한 투자를 했다는 겁니다. 이 덕분에 한편으로는 놀라운 발전을 이뤄냈지만, 다른 한편으로는 여전히 부족한 점도 보인다는 게 이들의 첫인상입니다.
특히 ‘ARC 챌린지’를 주관하는 사람들의 반응이 아주 폭발적이었다고 하는데요, 이들은 전통적인 AI 성능 측정 방식(벤치마크)을 비판하며 진짜 인간처럼 생각하는 능력을 테스트하려는 집단입니다. 그들이 보기에 Grok 4의 등장은 이전에 없던 거대한 진보였다는 거죠.
2. AI 지능의 패러다임 전환: 결정적 지능 vs. 유동적 지능
자, 여기서 정말 중요한 개념이 나옵니다. 자, 이 부분은 별표 세 개! 바로 유동적 지능(Fluid Intelligence) 입니다.
팟캐스트 진행자는 AI의 지능을 두 가지로 나눠 설명합니다.
- 결정적 지능 (Crystallized Intelligence): 우리가 이미 가진 경험, 지식, 교육을 바탕으로 문제를 해결하는 능력입니다. 이건 마치 방대한 책을 읽고 그 내용을 바탕으로 답하는 것과 같아요. 현재 대부분의 AI 모델(LLM)이 여기에 해당합니다. 엄청난 양의 데이터를 학습해서 그걸 기반으로 답변을 생성하죠.
- 유동적 지능 (Fluid Intelligence): 특정 분야에 대한 지식이 거의 없는 상태에서도 새로운 상황을 빠르게 학습하고, 창의적인 해결책을 찾아내는 능력입니다. 어린아이가 새로운 것을 스펀지처럼 흡수하며 배우는 모습을 생각하면 쉽습니다. 기존 AI들은 익숙하지 않은 문제를 던져주면 ‘돌처럼 멍청해지는’ 한계를 보였죠.
그런데 이 팟캐스트의 발표자들은 ARC 챌린지의 창립자 중 한 명을 인용하며, “Grok 4가 아주 약간이나마 유동적 지능을 보여준 최초의 모델일 수 있다” 고 말합니다. 이것이 사실이라면, AI 역사에 한 획을 긋는 사건입니다.
그렇다면 이 ‘유동적 지능’은 어디서 왔을까요? 바로 앞서 말한 엄청난 양의 강화학습(RL) 훈련 덕분일 것이라는 게 이들의 추측입니다.
3. AI 훈련의 미래: 사전학습에서 강화학습으로의 대전환
이 흐름을 짚으면서, 팟캐스트에서는 미래 AI 훈련 방식의 변화를 예측합니다.
기존에는 전체 컴퓨팅 자원의 90%를 데이터 학습(사전학습)에 쓰고, 10% 정도를 강화학습(RL)에 썼다면, 앞으로는 이 비율이 뒤집혀서 90%를 강화학습에, 10%를 사전학습에 쓰는 시대가 올 수도 있다는 겁니다. 물론 전체 컴퓨팅 파이의 크기 자체가 거대해지면서 말이죠.
이것은 단순히 지식을 많이 아는 AI를 넘어, 스스로 생각하고 더 나은 답을 찾아가는 ‘현명한’ AI를 만드는 방향으로 기술이 발전하고 있음을 시사합니다.
4. 기술 발전의 법칙: S-커브 이론과 AI의 미래
팟캐스트 진행자들은 현재 AI 기술의 발전을 ‘S-커브(S-curve)’ 이론에 빗대어 설명합니다. 이것도 아주 흥미로운 비유이니 잘 들어보세요.
모든 기술은 처음에는 더디게 발전하다가 어느 순간 폭발적으로 성장하고(Mania 단계), 결국에는 성장세가 둔화되는(Depressive 단계) S자 형태의 곡선을 그린다는 이론입니다.
이들은 AI의 발전이 여러 개의 S-커브가 겹쳐진 형태라고 봅니다.
- 첫 번째 S-커브: 사전학습(Pre-training) 기술의 발전. 성능이 미친 듯이 올라가다가 한계에 부딪히며 모두가 패닉에 빠졌던 시기가 있었죠.
- 두 번째 S-커브: 그리고 지금, 강화학습(RL)이 새로운 S-커브를 그리며 다시 한번 가파른 성장세를 이끌고 있다는 겁니다.
또한, 기술 혁신 이론가인 칼로타 페레즈의 이론을 인용하는데요, S-커브의 초기에는 ‘기술 혁신’이 성장을 이끌지만, 후반부로 가면 기술의 힘이 약해지고 ‘금융 혁신’, 즉 그냥 돈을 쏟아붓는 방식(마케팅, 인수합병, 데이터센터 증설 등)이 성장을 주도하게 된다고 합니다.
5. XAI의 경이로운 성공: 돈인가, 사람인가?
이 지점에서 팟캐스트 진행자들은 Grok 4를 만든 XAI의 성공 요인을 분석합니다. 이렇게 단기간에 엄청난 규모로 성장한 것이 단순히 ‘돈’ 때문일까요?
그들은 “절대 아니다”라고 말합니다. XAI에는 단순히 돈만 있는 것이 아니라, 최첨단 연구를 밀어붙이는 혁신적인 인재들과, 그 수많은 GPU를 실제로 구축하고 운영할 수 있는 뛰어난 기술자들이 있었다는 겁니다.
구글이 20년에 걸쳐 만든 인프라를, XAI의 팀은 거의 맨땅에서 시작해 아주 짧은 시간 안에 해냈습니다. 진행자들은 “그들이 이 게임에 참여했다는 것 자체가 기적” 이라며 XAI 팀의 실행력을 극찬합니다. 다른 거대 테크 기업들이 비대한 인력 구조 속에서 허우적거릴 때, XAI의 소수 정예 팀은 밤새 사무실에서 자면서 하드웨어 스택부터 데이터센터까지 전부 구축해냈다는 거죠.
6. 하지만 현실은?: 비용, 실용성, 그리고 ‘소송 테스트’
자, 지금까지는 Grok 4에 대한 찬사였다면, 이제 팟캐스트 진행자들은 냉정한 현실 분석을 시작합니다.
- 비용 문제: 한 분석에 따르면 Grok 4의 추론 비용은 약 1,600달러로, 이전 모델의 357달러에 비해 엄청나게 비쌉니다. 성능이 좋아진 만큼 비용 부담이 어마어마하다는 거죠.
- 실용성의 의문: 한 진행자는 중요한 지적을 합니다. “Grok 4가 AI 에이전트의 새로운 활용 사례를 열어줄 만큼의 ‘단계적 성능 변화(step change)’를 보여주지는 못했다.” 즉, 기술적으로는 대단할지 몰라도, 일반 사용자들이 체감할 만한 혁신적인 변화는 아니라는 겁니다. 대부분의 사람들은 그냥 기본으로 설정된 빠르고 저렴한 모델을 쓴다는 거죠.
- ‘소송 테스트’ 실패: 이 진행자는 모델의 진짜 영향력을 측정하는 자신만의 독특한 기준을 제시합니다. 바로 ‘소송 테스트(Lawsuit test)’ 입니다. “이 모델이 너무 뛰어나서 내 일자리를 위협하니 저 회사를 고소해야 한다”는 말이 나올 정도가 되어야 진짜 ‘게임 체인저’라는 거죠. Grok 4는 아직 그 정도의 파급력은 보여주지 못했다는 평가입니다.
결국 초기의 열광이 가라앉은 후, 실제 사용자들은 “Grok 4가 인상적이긴 하지만, 결국 Claude 3나 GPT-4와 비슷한 수준의 결과를 얻고 있다”는 피드백을 내놓고 있다고 합니다.
강의 마무리: Grok 4, 미래를 향한 이정표
자, 오늘 강의 내용을 정리해 보겠습니다. SVIC 팟캐스트의 스크립트를 통해 분석해 본 Grok 4는 양면적인 평가를 받는 모델입니다.
결론적으로 이 팟캐스트 제작자들이 던지는 메시지는 명확합니다. XAI 팀이 이뤄낸 기술적 성과는 존중받아 마땅하지만, 이것이 지금 당장 AI 응용 프로그램의 판도를 바꾸는 절대적인 도약이라고 보기에는 아직 신중한 접근이 필요하다는 것입니다.
Grok 4는 끝이 아니라, ‘유동적 지능’을 향한 AI 발전의 중요한 이정표로 기억될 것입니다.