モデル別おすすめオンプレPC(自作/WS)早見表
オンプレ前提。価格は税込・目安です(GPU相場により変動)。狭い画面では横スクロールできます。
モデル(サイズ) | おすすめ文章 | できそうな用途(例) | 推奨GPU/構成(VRAM目安) | GPU価格の目安 | 想定PC合計(概算) | 備考 |
---|---|---|---|---|---|---|
Qwen 3(7B/14B) | まずはこれ。FC安定&高コスパ | 日本語チャット/RAG、ツール呼び出しエージェント | GeForce RTX 4090(24GB)×1(24GBで余裕) | 約35〜73万円 | 約55〜103万円 | vLLMのFunction/Tool Callingで実装容易 |
Gemma 2(9B) | Google系の安定感。軽量FCで導入向き | 要約/QA、軽量エージェント | RTX 4090×1 | 約35〜73万円 | 約55〜103万円 | 公式のFunction Calling手順あり |
LLM-jp 13B(日本語) | 日本語の素直さ重視なら本命 | 日本語社内FAQ/RAG、現場ボット | RTX 4090×1(量子化で快適) | 約35〜73万円 | 約55〜103万円 | Instruct系あり。ツール呼び出しはvLLM側で |
ELYZA Japanese Llama-2 13B | 国産Llama派の定番。RAGの土台に | 日本語向けチャット/RAG | RTX 4090×1 | 約35〜73万円 | 約55〜103万円 | GGUF等で軽量運用もしやすい |
Mixtral 8×7B(MoE) | 24GBで長文強いMoE | 長文RAG、多言語、軽量エージェント | RTX 4090×1(4bit時 ≈22.5GB) | 約35〜73万円 | 約55〜103万円 | 速度は7B密より控えめ/長文・多並列に強み |
Llama 3.1 70B | 精度と多段ツール重視の決定版 | 多段ツール/高度推論、社内横断エージェント |
RTX 6000 Ada(48GB)×1 / L40S(48GB)×1 代替:RTX 4090×2(テンソル並列) |
RTX 6000 Ada:約109万円 L40S:約149万円 4090×2:70〜146万円 |
RTX 6000 Ada構成:約129〜144万円 L40S構成:約169〜184万円 4090×2構成:約96〜187万円 |
70B 4bit ≈35GB → 48GB級が楽。2GPUは帯域に注意 |
※ 本体その他の目安:CPU(Core i7/i9 または Ryzen 9)、RAM 64–128GB、NVMe 2TB、
電源 1000W級、筐体/冷却で約20〜30万円(2GPU構成は約25〜40万円想定)。
※ 価格は相場のレンジです。入手性・為替・モデルにより上下します。