Arc 140V GPU 설치된 윈도우 11 노트북에서 Ollama 실행 하기

Intel Arc 140V GPU 장착된 노트북에서, 올라마에서 모델 실행하니 GPU가 사용되지 않고 CPU만 100% 사용되는 문제가 발생했습니다.  사용한 모델은 qwen3-coder:30b 입니다.

Intel Arc 140V GPU는 올라마  정식 지원이  아니기 때문에 다음과 같은 일을 추가로 해야 합니다.

실행되는 올라마를 종료하고 파워셀 관리자로 열어 다음을 실행합니다.

다른 파워셀을 열고 올라마 모델을 실행합니다. 저는 이미 wen3-coder:30b와 qwen2.5-coder:7b를 설치해 두었습니다.

qwen3-coder:30b는 GPU가 20G 이상이 되어야 GPU 사용 효과가 있다고  해서, qwen2.5-coder:7b도 설치해 두었습니다. 제 노트북 GPU는 18G 입니다.

qwen3-coder:30b를 먼저 실행해서 지시도 했습니다. GPU는 열심히 사용하는데 효과가 크지 않을 거라 생각하고 봐서 그런지 효과가 크지 않게 느껴 졌습니다.

다음과 같이 해 봤습니다. 효과가 있다고 생각해서 인지 GPU 안 쓸 때 보다 많이 빨라진 느낌입니다.


이것 관련 보고서를 작성해 봤습니다.

📊 Intel Arc 140V Ollama 최종 보고서: Windows 11 Vulkan GPU 최적화

🚨 문제 상황

환경: Windows 11 + Intel Arc 140V GPU (18GB 공유 VRAM) 노트북
문제: 초기 qwen3-coder:30b (20GB) 실행 시 CPU 100% 사용
원인: Intel Arc 140V는 Ollama 정식 지원 외 (Vulkan 실험 모드 + GPU 지정 필요)

🔧 해결 과정

1단계: 기존 프로세스 종료

2단계: Vulkan 활성화 (관리자 PowerShell)

3단계: 모델 준비

🧪 테스트 결과

Test 1: qwen3-coder:30b (20GB) ✅ GPU 100% 확인

관찰:

  • ✅ GPU 100% 사용 (Vulkan + ID 지정 성공)
  • ⚠️ 가장 최근 버전으로 사용 희망하나, 18GB VRAM 노트북 제약으로 효과 제한적 → 좋은 성능 나오면 지속 사용 계획
  • 체감: CPU 대비 “조금 빠름” (테스트 목적)

Test 2: qwen2.5-coder:7b (4.5GB)

관찰:

  • ✅ GPU 100% 완전 활용
  • 🚀 명확한 속도 향상
  • 체감: “많이 빨라짐” ⭐

📊 성능 비교

모델 크기 VRAM 요구 Arc 140V GPU 체감 속도 권장도
qwen3-coder:30b 20GB 20GB+ 100% 사용 ⚠️ 조금 빠름 (테스트용) 20G+ 노력 예정
qwen2.5-coder:7b 4.5GB 6GB 이내 100% 사용 ✅ 많이 빠름 실용 최고

✅ 권장 설정 (Arc 140V 최종)

1. 환경 변수 영구화 (PowerShell $PROFILE)

2. GPU ID 확인

🎯 결론 및 권고사항

주요 발견

  1. OLLAMA_VULKAN=1 + GGML_VK_VISIBLE_DEVICES="0"로 Arc 140V 모든 모델 GPU 100% 가능 ✅
  2. qwen3-coder:30b 최근 버전 선호하나 노트북 제약으로 7B 모델 실용 최적 → GPU 20G 이상 환경에서 qwen3-coder:30b 사용 노력 예정
  3. Vulkan 활성화 후 ollama ps로 GPU 상태 즉시 확인 권장 (모니터링 필수)

One-Click 최종 스크립트 (arc140v-ollama.ps1)

📈 성능 향상: GPU 100% 사용으로 성능 향상을  체감

About the Author
(주)뉴테크프라임 대표 김현남입니다. 저에 대해 좀 더 알기를 원하시는 분은 아래 링크를 참조하세요. http://www.umlcert.com/kimhn/

Leave a Reply

*