# Ops: Ollama はshadowで稼働・arcanaからTailscale経由で利用
Ollamaはshadowサーバーにインストールされており、arcanaからはTailscale経由で `http://shadow:11434` に接続して利用する。shadow側は `OLLAMA_HOST=0.0.0.0:11434` でLAN公開済み。arcanaは収集/API/ダッシュボード担当、LLM推論はshadow集中という分離アーキテクチャを採用。pull済みモデルはgemma3:1b(fallback用)・nomic-embed-text(768次元embedding)。shadowのRAMが3.7GiBのためgemma3:4bはロード不可。フォールバックはgemma3:1b必須。新規スクリプトでembedding/LLM推論が必要な場合は必ず `http://shadow:11434` を使い、localhost:11434は使用不可。
## ポイント
- arcanaにはOllamaは未インストール。LLM推論はshadow集中アーキテクチャ
- 接続先: http://shadow:11434(localhost:11434は不可)
- shadowのRAMは3.7GiBのため gemma3:4b(4GiB必要)は起動不可、フォールバックはgemma3:1b必須
- llm_client.py にshadow Ollamaフォールバック実装済み(NVIDIA全モデル失敗時に自動切替)
- shadow接続不可時はTailscale経路障害を疑い `tailscale ping -c 1 shadow` で診断
## 関連ページ
[[Ollama はshadowで稼働・arcanaからTailscale経由で利用]] [[LLMモデル名を変更する前に全ボット共通のllm_client.pyを修正し他のタスクへの影響を確認する]] [[MCP vs CLI 選択基準]] [[PM2 dangling process detection]]
## 関連概念(未作成)
`Ollama モデル管理(pull/削除/RAM見積もり)` `arcana/shadow 役割分担アーキテクチャ` `Tailscale 経路障害診断手順`
Ops: Ollama はshadowで稼働・arcanaからTailscale経由で利用