네, 일타 강사 저스틴입니다! 오늘 강의는 AI Copium님의 유튜브 영상, “OpenAI가 우리에게 미래를 살짝 보여줬나요?!”(https://www.youtube.com/live/1jn_RpbPU4U)를 바탕으로 진행됩니다. OpenAI의 새로운 ChatGPT Agent에 대해 낱낱이 파헤쳐 보겠습니다. 자, 그럼 시작해 볼까요?

ChatGPT Agent란 무엇인가?

AI Copium님은 OpenAI가 ChatGPT Agent를 출시한 것은 지금까지 우리가 봐왔던 자율 AI를 향한 가장 큰 발걸음일지도 모른다고 평가합니다 [i]. ChatGPT Agent는 웹 탐색, 심층 조사, 슬라이드 자료 생성, 온라인 쇼핑 등 다양한 기능을 하나의 통합 시스템에서 수행할 수 있는 AI 에이전트입니다 [i].

OpenAI의 Sam Altman은 ChatGPT Agent를 “미래를 엿볼 수 있는 창”이라고 표현했습니다 [i]. 더 이상 챗봇이 아니라, 사용자를 대신하여 복잡한 작업을 수행할 수 있는 진정한 AI 비서가 등장한 것입니다.

ChatGPT Agent의 기능

OpenAI의 연구원 Issa Fulford는 ChatGPT Agent가 다음과 같은 다양한 도구에 접근할 수 있다고 설명합니다 [i]:

가상 컴퓨터: ChatGPT Agent는 자체적인 가상 컴퓨터를 가지고 있으며, 이 컴퓨터에는 다양한 도구가 설치되어 있습니다 [i].
텍스트 브라우저: 딥 리서치 도구와 유사하며, 웹 페이지를 효율적이고 빠르게 읽고 검색할 수 있습니다 [i].
시각적 브라우저: 오퍼레이터 도구와 유사하며, 웹 페이지의 UI와 상호 작용할 수 있습니다 [i]. 커서를 사용하여 클릭하고, UI 구성 요소를 열고, 양식을 작성하고, 텍스트를 입력할 수 있습니다 [i].
터미널: 코드를 실행하고, 슬라이드 자료나 스프레드시트와 같은 파일을 생성하고 분석할 수 있습니다 [i]. 또한, 공용 API와 Google Drive, Google Calendar, GitHub, SharePoint와 같은 개인 데이터 소스에 접근하기 위한 API를 호출할 수 있습니다 [i].
이미지 생성: 슬라이드 자료 등에 사용할 멋진 비주얼을 만들 수 있습니다 [i].

자, 여기서 별표 세 개! ChatGPT Agent는 기존의 OpenAI 에이전트(오퍼레이터, 딥 리서치 등)를 통합한 모델이며, 스스로 어떤 도구를 사용할지 결정할 수 있다는 점입니다 [i]. ChatGPT Agent는 ChatGPT 자체에 접근할 수 있는 AI 에이전트와 같습니다.

협업적이면서도 자율적인 에이전트

ChatGPT Agent의 또 다른 특징은 사용자가 에이전트의 작업을 실시간으로 보고 필요한 경우 개입할 수 있다는 점입니다 [i]. 예를 들어, 결혼식 초대장을 첨부하고 에이전트에게 여행 계획을 세워달라고 요청할 수 있습니다 [i]. 에이전트가 호텔, 의상, 선물을 검색하는 과정을 마치 유튜브 동영상처럼 진행 상황 표시줄을 통해 확인할 수 있습니다 [i].

물론, 복잡한 작업은 시간이 오래 걸릴 수 있습니다 [i]. 하지만 사용자는 언제든지 에이전트의 작업에 개입하여 추가 지침을 제공하거나 방향을 수정할 수 있습니다 [i].

Issa Fulford는 에이전트가 매우 협력적이며, 이는 모델을 훈련하고 제품을 구축할 때 중요하게 고려한 사항이라고 설명합니다 [i]. 사용자가 다른 사람에게 오랜 시간이 걸리는 작업을 요청할 때와 마찬가지로, 에이전트도 작업 중간에 사용자에게 질문하거나 허가를 요청할 수 있습니다 [i].

스스로 벤치마크 슬라이드 자료를 만들다!

AI Copium님은 ChatGPT Agent의 가장 놀라운 기능 중 하나로, 스스로 Google Drive에서 데이터를 가져와 벤치마크 결과를 보여주는 슬라이드 자료를 만들 수 있다는 점을 꼽습니다 [i].

실제 벤치마크 성능

ChatGPT Agent는 Humanity’s Last Exam에서 약 42%의 점수를 얻었으며, 이는 매우 인상적인 결과입니다 [i]. Frontier Math에서는 약 27%의 점수를 얻었습니다 [i]. 또한, Web Arena 및 Browse Comp와 같은 에이전트 기반 벤치마크에서 최첨단 성능을 보였으며, 스프레드시트 벤치 또는 내부 뱅킹 벤치마크와 같은 실제 사용 벤치마크에서도 뛰어난 성능을 나타냈습니다 [i].

OpenAI의 안전 경고

ChatGPT Agent가 Plus, Pro, Team 사용자에게 배포되기 시작하면서, OpenAI는 사용자들에게 안전 경고를 발표했습니다 [i]. ChatGPT Agent는 인터넷 검색 기능을 통해 강력한 성능을 제공하지만, 인터넷에는 해커, 사기, 피싱 시도 등 위험 요소가 많습니다 [i].

특히, “프롬프트 주입(prompt injections)”이라는 새로운 유형의 공격에 취약할 수 있습니다 [i]. 예를 들어, 에이전트에게 책을 사달라고 요청하고 신용 카드 정보를 제공했을 때, 에이전트가 악성 웹사이트에 접속하여 신용 카드 정보를 입력하도록 요청받을 수 있습니다 [i]. 도움을 주도록 훈련된 에이전트는 이것이 좋은 생각이라고 판단할 수 있습니다 [i].

OpenAI는 이러한 문제가 발생하지 않도록 많은 노력을 기울였습니다 [i]. 의심스러운 웹사이트의 의심스러운 지침을 무시하도록 모델을 훈련하고, 에이전트의 행동을 감시하는 모니터링 시스템을 구축했습니다 [i]. 새로운 공격이 발견되면 실시간으로 업데이트할 수도 있습니다 [i].

자, 이 부분도 별표 세 개! OpenAI는 ChatGPT Agent가 최첨단 제품이며, 새로운 위험 요소가 존재한다는 점을 강조합니다 [i]. 따라서, 사용자는 정보를 공유할 때 주의를 기울여야 하며, 중요한 정보는 직접 입력하는 등의 방법을 사용하는 것이 좋습니다 [i].

마무리

AI Copium님은 ChatGPT Agent가 ChatGPT를 단순한 챗봇에서 사용자가 손 하나 까딱하지 않고도 전체 워크플로우를 처리할 수 있는 진정한 자율 AI 시스템으로 전환하려는 의도를 보여주는 것이라고 평가합니다 [i]. 아직 갈 길이 멀지만, 생각보다 빨리 AI가 우리 삶에 깊숙이 들어올 수 있을지도 모릅니다.

자, 오늘 강의는 여기까지입니다! ChatGPT Agent에 대한 궁금증, 확실하게 해소되셨기를 바랍니다. 다음 강의에서 또 만나요!