구글의 조용한 Gemini 2.5 발표

Gemini 2.5는 향상된 추론 능력, 네이티브 멀티모달리티, 긴 컨텍스트 창을 특징으로 합니다. 다양한 벤치마크에서 뛰어난 성능을 보여주며, 개발자들이 차세대 경험을 구축할 수 있도록 지원합니다. ​ 다양한 모델: 2.5 Pro (코딩 및 복잡한 프롬프트), 2.0 Flash (빠른 성능), 2.0 Flash Thinking (추론과 속도 균형), 2.0 Flash-Lite (비용 효율적인 성능) 등 다양한...

Introducing the Model Context Protocol

My AI Smarteasy 코파일럿 AI 에이전트 “글 읽기”와 함께 다음 글을 읽어보겠습니다. Introducing the Model Context Protocol    저스틴) 이 글에 대해 처음부터 끝까지 부분별로 자세히 설명해 주세요. 시작 부분에서 사족 같아 보이는 부분만 일부 제거 했습니다.   1. 제목 및 서론: Title: Introducing the Model Context Protocol (Model Context...

OpenAI Docs – Audio and speech API – Voice agents

고객 지원 및 언어 튜터링과 같은 애플리케이션을 위한 강력하고 상황 인식적인 음성 에이전트를 만드세요. 이 가이드는 음성 에이전트를 설계하고 구축하는 데 도움이 됩니다.   올바른 아키텍처 선택 OpenAI는 음성 에이전트를 구축하기 위한 두 가지 주요 아키텍처를 제공합니다. 음성-음성(멀티모달) 체인(음성-텍스트 → LLM → 텍스트-음성) 음성-음성(멀티모달) 아키텍처 멀티모달 음성-음성(S2S) 아키텍처는 오디오 입력...

OpenAI Docs

음성 관련 OpenAI Realtime API Audio and speech API Audio and speech API – Voice agents    관련 글 Smarteasy와 글 읽기 – New audio models from OpenAI, but how much can we rely on them?  

OpenAI Docs – Audio and speech API

OpenAI API는 오디오 애플리케이션 또는 음성 에이전트를 빌드하는 데 도움이 되는 여러 API 엔드포인트를 제공합니다. 오디오 사용 사례 둘러보기 음성 에이전트 음성 에이전트는 오디오를 이해하여 작업을 처리하고 자연어로 응답합니다. 음성 에이전트에 접근하는 방법에는 크게 두 가지가 있습니다. 음성-음성 모델과 Realtime API를 사용 음성-텍스트 모델, 요청을 처리하는 텍스트 언어 모델, 응답하는...

Smarteasy와 글 읽기 – LLM 서빙 프레임워크로 프라이빗 AI구축하기

LLM 서빙 프레임워크로 프라이빗 AI구축하기 feat. Ollama, vLLM, SGLang [세미남589@토크아이티, 윤성열 대표 / 드림플로우] – YouTube 이 영상은 토크아이티에서 진행된 세미나의 일부를 재구성한 것으로, 일반 기업에서 프라이빗 AI를 구축하고 LLM (Large Language Model)을 서빙하는 방법에 대해 설명합니다. 디플로의 윤성일 대표가 LLM 서빙을 도와주는 오픈소스 프레임워크 (Ollama, vLLM, SGLang 등)와 양자화...

AI 일타 스마티지와 함께 듀얼 브레인(원서 포함) 함께 읽기

듀얼 브레인 책 소개 일타 스마티지와 함께 책 읽기 첫 번째 Introduction

AI 일타 스마티지와 함께 듀얼 브레인 읽기

스마티지가 1강 Introduction 강의 초안을 공개합니다. 일타 – 스마티지 – 듀얼 브레인; Co-Intelligence Living and Working With AI – 1강Introduction 이것을 조금 다듬어 유튜브 강의로 갑니다.