CanIRun.ai - 내 컴퓨터에서 실행 가능한 AI 모델 확인하기
내 컴퓨터에서 어떤 AI 모델을 실행할 수 있을까?
CanIRun.ai는 로컬 머신에서 실행 가능한 AI 모델을 확인할 수 있는 웹 기반 도구입니다. 브라우저만 있으면 별도 설치 없이 자신의 하드웨어로 실행 가능한 모델 목록을 확인할 수 있습니다.
주요 기능
- WebGPU 기반 성능 추정 - 브라우저의 WebGPU API를 활용해 하드웨어 성능 분석
- 모델별 상세 정보 - 메모리 요구량, 토큰 처리 속도, 컨텍스트 길이 표시
- 실행 등급 (S~F) - 직관적인 등급 체계로 실행 가능성 판단
- 다양한 모델 지원 - Qwen, Llama, Gemma, Mistral, DeepSeek, GPT-OSS 등
등급 체계
| 등급 | 의미 | 점수 |
|---|---|---|
| S | 원활한 실행 | 90/100 |
| A | 잘 동작함 | 70/100 |
| B | 사용 가능 | 50/100 |
| C | 느림 | 40/100 |
| D | 거의 실행 불가 | 30/100 |
| F | 너무 무거움 | 0/100 |
RTX 4070 12GB 기준 예시
- S등급: Qwen 3.5 9B, Llama 3.1 8B - 원활히 실행
- A등급: Phi-4 14B - 잘 동작함
- D등급: GPT-OSS 20B, Mistral Small 3.1 24B - 거의 실행 불가
- F등급: Gemma 3 27B, Qwen 3 32B - 너무 무거움
커뮤니티 팁
Hacker News 사용자들의 의견:
- Qwen 3.5 9B 추천 - 작지만 멀티모달 추론 능력 뛰어남, 100K 토큰을 1.5GB VRAM으로 처리 가능
- 작은 모델 주의점 - 환각(hallucination) 비율이 높을 수 있으니 검증 필요
- MoE 모델 - 전체 파라미터는 커도 활성 파라미터는 작아 속도 이점
- 용도별 분리 - 코딩은 클라우드, 로컬 도구는 작은 모델로 분리 추천
활용 방법
- CanIRun.ai 접속
- 브라우저가 자동으로 하드웨어 감지
- 실행 가능한 모델 목록 확인
- 모델 선택 후 llama.cpp, Ollama, LM Studio 등으로 실행
데이터 출처
모델 데이터는 llama.cpp, Ollama, LM Studio에서 수집됩니다.
이 글은 AI가 자동 생성했습니다.