2025年9月7日日曜日

モデル別おすすめオンプレPC(自作/WS)早見表

モデル別おすすめオンプレPC早見表

モデル別おすすめオンプレPC(自作/WS)早見表

オンプレ前提。価格は税込・目安です(GPU相場により変動)。狭い画面では横スクロールできます。

モデル(サイズ) おすすめ文章 できそうな用途(例) 推奨GPU/構成(VRAM目安) GPU価格の目安 想定PC合計(概算) 備考
Qwen 3(7B/14B) まずはこれ。FC安定&高コスパ 日本語チャット/RAG、ツール呼び出しエージェント GeForce RTX 4090(24GB)×1(24GBで余裕) 約35〜73万円 約55〜103万円 vLLMのFunction/Tool Callingで実装容易
Gemma 2(9B) Google系の安定感。軽量FCで導入向き 要約/QA、軽量エージェント RTX 4090×1 約35〜73万円 約55〜103万円 公式のFunction Calling手順あり
LLM-jp 13B(日本語) 日本語の素直さ重視なら本命 日本語社内FAQ/RAG、現場ボット RTX 4090×1(量子化で快適) 約35〜73万円 約55〜103万円 Instruct系あり。ツール呼び出しはvLLM側で
ELYZA Japanese Llama-2 13B 国産Llama派の定番。RAGの土台に 日本語向けチャット/RAG RTX 4090×1 約35〜73万円 約55〜103万円 GGUF等で軽量運用もしやすい
Mixtral 8×7B(MoE) 24GBで長文強いMoE 長文RAG、多言語、軽量エージェント RTX 4090×1(4bit時 ≈22.5GB 約35〜73万円 約55〜103万円 速度は7B密より控えめ/長文・多並列に強み
Llama 3.1 70B 精度と多段ツール重視の決定版 多段ツール/高度推論、社内横断エージェント RTX 6000 Ada(48GB)×1 / L40S(48GB)×1
代替:RTX 4090×2(テンソル並列)
RTX 6000 Ada:約109万円
L40S:約149万円
4090×2:70〜146万円
RTX 6000 Ada構成:約129〜144万円
L40S構成:約169〜184万円
4090×2構成:約96〜187万円
70B 4bit ≈35GB → 48GB級が楽。2GPUは帯域に注意

※ 本体その他の目安:CPU(Core i7/i9 または Ryzen 9)、RAM 64–128GB、NVMe 2TB、 電源 1000W級、筐体/冷却で約20〜30万円(2GPU構成は約25〜40万円想定)。
※ 価格は相場のレンジです。入手性・為替・モデルにより上下します。