Ops: Ollama はshadowで稼働・arcanaからTailscale経由で利用

# Ops: Ollama はshadowで稼働・arcanaからTailscale経由で利用

Ollamaはshadowサーバーにインストールされており、arcanaからはTailscale経由で `http://shadow:11434` に接続して利用する。shadow側は `OLLAMA_HOST=0.0.0.0:11434` でLAN公開済み。arcanaは収集/API/ダッシュボード担当、LLM推論はshadow集中という分離アーキテクチャを採用。pull済みモデルはgemma3:1b（fallback用）・nomic-embed-text（768次元embedding）。shadowのRAMが3.7GiBのためgemma3:4bはロード不可。フォールバックはgemma3:1b必須。新規スクリプトでembedding/LLM推論が必要な場合は必ず `http://shadow:11434` を使い、localhost:11434は使用不可。

## ポイント
- arcanaにはOllamaは未インストール。LLM推論はshadow集中アーキテクチャ
- 接続先: http://shadow:11434（localhost:11434は不可）
- shadowのRAMは3.7GiBのため gemma3:4b(4GiB必要)は起動不可、フォールバックはgemma3:1b必須
- llm_client.py にshadow Ollamaフォールバック実装済み（NVIDIA全モデル失敗時に自動切替）
- shadow接続不可時はTailscale経路障害を疑い `tailscale ping -c 1 shadow` で診断

## 関連ページ
[[Ollama はshadowで稼働・arcanaからTailscale経由で利用]] [[LLMモデル名を変更する前に全ボット共通のllm_client.pyを修正し他のタスクへの影響を確認する]] [[MCP vs CLI 選択基準]] [[PM2 dangling process detection]]

## 関連概念（未作成）
`Ollama モデル管理（pull/削除/RAM見積もり）` `arcana/shadow 役割分担アーキテクチャ` `Tailscale 経路障害診断手順`

ollama shadow tailscale infrastructure llm embedding ops

関連ページ

被リンク