스마티지의 AI 뉴스 – Ollama Qwen3 지원

https://ollama.com/library/qwen3

 

Qwen3란?
Qwen3는 Qwen 시리즈의 최신 대형 언어 모델(LLM) 세대로, 고밀도 모델(dense models)과 전문가 혼합 모델(Mixture-of-Experts, MoE)을 포괄적으로 제공합니다. 이 모델은 코딩, 수학, 일반 기능 등 다양한 벤치마크 평가에서 DeepSeek-R1, o1, o3-mini, Grok-3, Gemini-2.5-Pro와 같은 최고 수준의 모델들과 경쟁력 있는 결과를 보여줍니다.

주요 특징:

  1. 모델 크기 다양성: 0.6B(6억)부터 235B(2350억) 파라미터까지 다양한 크기의 모델을 제공하며, MoE 모델로는 30B(활성화 파라미터 3B)와 235B(활성화 파라미터 22B)가 포함됩니다.
  2. 사고 모드와 비사고 모드 지원: 단일 모델 내에서 복잡한 논리적 추론, 수학, 코딩을 위한 사고 모드(thinking mode)와 효율적인 일반 대화를 위한 비사고 모드(non-thinking mode) 간 원활한 전환을 지원합니다.
  3. 추론 능력 강화: 이전 모델(QwQ 및 Qwen2.5) 대비 수학, 코드 생성, 상식적 논리 추론에서 크게 향상된 성능을 보여줍니다.
  4. 인간 선호도 정합성: 창의적 글쓰기, 역할극, 다중 턴 대화, 지시 따르기에서 뛰어난 성능으로 자연스럽고 몰입감 있는 대화 경험을 제공합니다.
  5. 에이전트 기능 전문성: 사고 및 비사고 모드에서 외부 도구와의 정밀한 통합을 지원하며, 복잡한 에이전트 기반 작업에서 오픈소스 모델 중 선두를 달리고 있습니다.
  6. 다국어 지원: 100개 이상의 언어와 방언을 지원하며, 다국어 지시 따르기와 번역에 강력한 역량을 보유하고 있습니다.

사용 방법:
Qwen3 모델은 Ollama 플랫폼을 통해 실행 가능하며, Ollama 0.6.6 이상 버전이 필요합니다. 아래는 각 모델 실행 명령어 예시입니다:

  • 0.6B 모델: ollama run qwen3:0.6b
  • 8B 모델: ollama run qwen3:8b
  • 235B-A22B 모델: ollama run qwen3:235b-a22b

결론:
Qwen3는 다양한 크기와 특화된 기능을 통해 여러 시나리오에서 최적의 성능을 발휘하는 차세대 언어 모델입니다. 특히 사고와 비사고 모드의 전환, 강화된 추론 능력, 다국어 지원 등으로 개인 및 기업 사용자 모두에게 유용한 도구가 될 것입니다. 추가 정보는 Ollama 공식 사이트나 관련 GitHub, 블로그를 참고하세요.

About the Author
(주)뉴테크프라임 대표 김현남입니다. 저에 대해 좀 더 알기를 원하시는 분은 아래 링크를 참조하세요. http://www.umlcert.com/kimhn/

Leave a Reply

*