From 7c36b9255a13007a10af4fadefc21aadfce482b0 Mon Sep 17 00:00:00 2001
From: Fahad <fahad@2doapp.com>
Date: Tue, 7 Oct 2025 12:59:09 +0400
Subject: [PATCH] refactor: moved registries into a separate module and code
 cleanup fix: refactored dial provider to follow the same pattern

---
 conf/dial_models.json                         | 169 ++++++++++++++++
 conf/openai_models.json                       |   4 +-
 config.py                                     |   3 +-
 docs/configuration.md                         |   2 +
 docs/custom_models.md                         |   3 +-
 providers/__init__.py                         |   2 +-
 providers/azure_openai.py                     |   4 +-
 providers/custom.py                           |   5 +-
 providers/dial.py                             | 187 +-----------------
 providers/gemini.py                           |   6 +-
 providers/{openai_provider.py => openai.py}   |   8 +-
 providers/openrouter.py                       |   2 +-
 providers/registries/__init__.py              |  19 ++
 .../azure.py}                                 |   4 +-
 .../base.py}                                  |   8 +-
 .../custom.py}                                |  11 +-
 providers/registries/dial.py                  |  19 ++
 .../gemini.py}                                |   6 +-
 .../openai.py}                                |   6 +-
 .../openrouter.py}                            |   6 +-
 .../{xai_registry.py => registries/xai.py}    |   8 +-
 providers/registry_provider_mixin.py          |   2 +-
 providers/xai.py                              |   6 +-
 pyproject.toml                                |   1 +
 server.py                                     |   4 +-
 tests/conftest.py                             |   2 +-
 tests/test_alias_target_restrictions.py       |   2 +-
 tests/test_auto_mode_comprehensive.py         |   2 +-
 tests/test_auto_mode_model_listing.py         |   2 +-
 tests/test_auto_mode_provider_selection.py    |  10 +-
 tests/test_buggy_behavior_prevention.py       |   2 +-
 tests/test_chat_cross_model_continuation.py   |   4 +-
 tests/test_chat_openai_integration.py         |   4 +-
 tests/test_consensus_integration.py           |   2 +-
 tests/test_custom_openai_temperature_fix.py   |  10 +-
 tests/test_intelligent_fallback.py            |  10 +-
 tests/test_issue_245_simple.py                |   4 +-
 tests/test_listmodels_restrictions.py         |   4 +-
 tests/test_model_restrictions.py              |   4 +-
 tests/test_o3_temperature_fix_simple.py       |   6 +-
 tests/test_openai_provider.py                 |   2 +-
 tests/test_openrouter_provider.py             |   6 +-
 tests/test_openrouter_registry.py             |   2 +-
 tests/test_per_tool_model_defaults.py         |   8 +-
 tests/test_provider_retry_logic.py            |   2 +-
 tests/test_provider_routing_bugs.py           |   2 +-
 tests/test_provider_utf8.py                   |   2 +-
 tests/test_providers.py                       |   2 +-
 tests/test_rate_limit_patterns.py             |   2 +-
 tests/test_supported_models_aliases.py        |   2 +-
 tests/test_uvx_resource_packaging.py          |   4 +-
 tests/transport_helpers.py                    |   2 +-
 tools/listmodels.py                           |   4 +-
 tools/shared/base_tool.py                     |   4 +-
 54 files changed, 325 insertions(+), 282 deletions(-)
 create mode 100644 conf/dial_models.json
 rename providers/{openai_provider.py => openai.py} (95%)
 create mode 100644 providers/registries/__init__.py
 rename providers/{azure_registry.py => registries/azure.py} (90%)
 rename providers/{model_registry_base.py => registries/base.py} (96%)
 rename providers/{custom_registry.py => registries/custom.py} (67%)
 create mode 100644 providers/registries/dial.py
 rename providers/{gemini_registry.py => registries/gemini.py} (75%)
 rename providers/{openai_registry.py => registries/openai.py} (75%)
 rename providers/{openrouter_registry.py => registries/openrouter.py} (87%)
 rename providers/{xai_registry.py => registries/xai.py} (65%)

diff --git a/conf/dial_models.json b/conf/dial_models.json
new file mode 100644
index 0000000..8c41987
--- /dev/null
+++ b/conf/dial_models.json
@@ -0,0 +1,169 @@
+{
+  "_README": {
+    "description": "Model metadata for the DIAL (Data & AI Layer) aggregation provider.",
+    "documentation": "https://github.com/BeehiveInnovations/zen-mcp-server/blob/main/docs/configuration.md",
+    "usage": "Models listed here are exposed through the DIAL provider. Aliases are case-insensitive.",
+    "field_notes": "Matches providers/shared/model_capabilities.py.",
+    "field_descriptions": {
+      "model_name": "The model identifier as exposed by DIAL (typically deployment name)",
+      "aliases": "Array of shorthand names users can type instead of the full model name",
+      "context_window": "Total number of tokens the model can process (input + output combined)",
+      "max_output_tokens": "Maximum number of tokens the model can generate in a single response",
+      "supports_extended_thinking": "Whether the model supports extended reasoning tokens",
+      "supports_json_mode": "Whether the model can guarantee valid JSON output",
+      "supports_function_calling": "Whether the model supports function/tool calling",
+      "supports_images": "Whether the model can process images/visual input",
+      "max_image_size_mb": "Maximum total size in MB for all images combined",
+      "supports_temperature": "Whether the model accepts the temperature parameter",
+      "temperature_constraint": "Temperature constraint hint: 'fixed', 'range', or 'discrete'",
+      "description": "Human-readable description of the model",
+      "intelligence_score": "1-20 human rating used as the primary signal for auto-mode ordering"
+    }
+  },
+  "models": [
+    {
+      "model_name": "o3-2025-04-16",
+      "friendly_name": "DIAL (O3)",
+      "aliases": ["o3"],
+      "intelligence_score": 14,
+      "description": "OpenAI O3 via DIAL - Strong reasoning model",
+      "context_window": 200000,
+      "max_output_tokens": 100000,
+      "supports_extended_thinking": false,
+      "supports_function_calling": false,
+      "supports_json_mode": true,
+      "supports_images": true,
+      "max_image_size_mb": 20.0,
+      "supports_temperature": false,
+      "temperature_constraint": "fixed"
+    },
+    {
+      "model_name": "o4-mini-2025-04-16",
+      "friendly_name": "DIAL (O4-mini)",
+      "aliases": ["o4-mini"],
+      "intelligence_score": 11,
+      "description": "OpenAI O4-mini via DIAL - Fast reasoning model",
+      "context_window": 200000,
+      "max_output_tokens": 100000,
+      "supports_extended_thinking": false,
+      "supports_function_calling": false,
+      "supports_json_mode": true,
+      "supports_images": true,
+      "max_image_size_mb": 20.0,
+      "supports_temperature": false,
+      "temperature_constraint": "fixed"
+    },
+    {
+      "model_name": "anthropic.claude-sonnet-4.1-20250805-v1:0",
+      "friendly_name": "DIAL (Sonnet 4.1)",
+      "aliases": ["sonnet-4.1", "sonnet-4"],
+      "intelligence_score": 10,
+      "description": "Claude Sonnet 4.1 via DIAL - Balanced performance",
+      "context_window": 200000,
+      "max_output_tokens": 64000,
+      "supports_extended_thinking": false,
+      "supports_function_calling": false,
+      "supports_json_mode": true,
+      "supports_images": true,
+      "max_image_size_mb": 5.0,
+      "supports_temperature": true,
+      "temperature_constraint": "range"
+    },
+    {
+      "model_name": "anthropic.claude-sonnet-4.1-20250805-v1:0-with-thinking",
+      "friendly_name": "DIAL (Sonnet 4.1 Thinking)",
+      "aliases": ["sonnet-4.1-thinking", "sonnet-4-thinking"],
+      "intelligence_score": 11,
+      "description": "Claude Sonnet 4.1 with thinking mode via DIAL",
+      "context_window": 200000,
+      "max_output_tokens": 64000,
+      "supports_extended_thinking": true,
+      "supports_function_calling": false,
+      "supports_json_mode": true,
+      "supports_images": true,
+      "max_image_size_mb": 5.0,
+      "supports_temperature": true,
+      "temperature_constraint": "range"
+    },
+    {
+      "model_name": "anthropic.claude-opus-4.1-20250805-v1:0",
+      "friendly_name": "DIAL (Opus 4.1)",
+      "aliases": ["opus-4.1", "opus-4"],
+      "intelligence_score": 14,
+      "description": "Claude Opus 4.1 via DIAL - Most capable Claude model",
+      "context_window": 200000,
+      "max_output_tokens": 64000,
+      "supports_extended_thinking": false,
+      "supports_function_calling": false,
+      "supports_json_mode": true,
+      "supports_images": true,
+      "max_image_size_mb": 5.0,
+      "supports_temperature": true,
+      "temperature_constraint": "range"
+    },
+    {
+      "model_name": "anthropic.claude-opus-4.1-20250805-v1:0-with-thinking",
+      "friendly_name": "DIAL (Opus 4.1 Thinking)",
+      "aliases": ["opus-4.1-thinking", "opus-4-thinking"],
+      "intelligence_score": 15,
+      "description": "Claude Opus 4.1 with thinking mode via DIAL",
+      "context_window": 200000,
+      "max_output_tokens": 64000,
+      "supports_extended_thinking": true,
+      "supports_function_calling": false,
+      "supports_json_mode": true,
+      "supports_images": true,
+      "max_image_size_mb": 5.0,
+      "supports_temperature": true,
+      "temperature_constraint": "range"
+    },
+    {
+      "model_name": "gemini-2.5-pro-preview-03-25-google-search",
+      "friendly_name": "DIAL (Gemini 2.5 Pro Search)",
+      "aliases": ["gemini-2.5-pro-search"],
+      "intelligence_score": 17,
+      "description": "Gemini 2.5 Pro with Google Search via DIAL",
+      "context_window": 1000000,
+      "max_output_tokens": 65536,
+      "supports_extended_thinking": false,
+      "supports_function_calling": false,
+      "supports_json_mode": true,
+      "supports_images": true,
+      "max_image_size_mb": 20.0,
+      "supports_temperature": true,
+      "temperature_constraint": "range"
+    },
+    {
+      "model_name": "gemini-2.5-pro-preview-05-06",
+      "friendly_name": "DIAL (Gemini 2.5 Pro)",
+      "aliases": ["gemini-2.5-pro"],
+      "intelligence_score": 18,
+      "description": "Gemini 2.5 Pro via DIAL - Deep reasoning",
+      "context_window": 1000000,
+      "max_output_tokens": 65536,
+      "supports_extended_thinking": false,
+      "supports_function_calling": false,
+      "supports_json_mode": true,
+      "supports_images": true,
+      "max_image_size_mb": 20.0,
+      "supports_temperature": true,
+      "temperature_constraint": "range"
+    },
+    {
+      "model_name": "gemini-2.5-flash-preview-05-20",
+      "friendly_name": "DIAL (Gemini Flash 2.5)",
+      "aliases": ["gemini-2.5-flash"],
+      "intelligence_score": 10,
+      "description": "Gemini 2.5 Flash via DIAL - Ultra-fast",
+      "context_window": 1000000,
+      "max_output_tokens": 65536,
+      "supports_extended_thinking": false,
+      "supports_function_calling": false,
+      "supports_json_mode": true,
+      "supports_images": true,
+      "max_image_size_mb": 20.0,
+      "supports_temperature": true,
+      "temperature_constraint": "range"
+    }
+  ]
+}
diff --git a/conf/openai_models.json b/conf/openai_models.json
index e5aea7f..a8e8c63 100644
--- a/conf/openai_models.json
+++ b/conf/openai_models.json
@@ -53,7 +53,7 @@
         "gpt5-pro"
       ],
       "intelligence_score": 18,
-      "description": "GPT-5 Pro (400K context, 272K output) - Advanced model with reasoning support",
+      "description": "GPT-5 Pro (400K context, 272K output) - Very advanced, reasoning model",
       "context_window": 400000,
       "max_output_tokens": 272000,
       "supports_extended_thinking": true,
@@ -156,7 +156,7 @@
         "o3pro"
       ],
       "intelligence_score": 15,
-      "description": "Professional-grade reasoning (200K context) - EXTREMELY EXPENSIVE: Only for the most complex problems requiring universe-scale complexity analysis OR when the user explicitly asks for this model. Use sparingly for critical architectural decisions or exceptionally complex debugging that other models cannot handle.",
+      "description": "Professional-grade reasoning (200K context)",
       "context_window": 200000,
       "max_output_tokens": 65536,
       "supports_extended_thinking": false,
diff --git a/config.py b/config.py
index 6d6e7e7..1378f13 100644
--- a/config.py
+++ b/config.py
@@ -30,7 +30,8 @@ DEFAULT_MODEL = get_env("DEFAULT_MODEL", "auto") or "auto"
 # Auto mode detection - when DEFAULT_MODEL is "auto", Claude picks the model
 IS_AUTO_MODE = DEFAULT_MODEL.lower() == "auto"
 
-# Each provider (gemini.py, openai_provider.py, xai.py) defines its own MODEL_CAPABILITIES
+# Each provider (gemini.py, openai.py, xai.py, dial.py, openrouter.py, custom.py, azure_openai.py)
+# defines its own MODEL_CAPABILITIES
 # with detailed descriptions. Tools use ModelProviderRegistry.get_available_model_names()
 # to get models only from enabled providers (those with valid API keys).
 #
diff --git a/docs/configuration.md b/docs/configuration.md
index 9b3885d..a27ce52 100644
--- a/docs/configuration.md
+++ b/docs/configuration.md
@@ -72,6 +72,7 @@ DEFAULT_MODEL=auto  # Claude picks best model for each task (recommended)
   - `conf/gemini_models.json` – Gemini catalogue (`GEMINI_MODELS_CONFIG_PATH`)
   - `conf/xai_models.json` – X.AI / GROK catalogue (`XAI_MODELS_CONFIG_PATH`)
   - `conf/openrouter_models.json` – OpenRouter catalogue (`OPENROUTER_MODELS_CONFIG_PATH`)
+  - `conf/dial_models.json` – DIAL aggregation catalogue (`DIAL_MODELS_CONFIG_PATH`)
   - `conf/custom_models.json` – Custom/OpenAI-compatible endpoints (`CUSTOM_MODELS_CONFIG_PATH`)
 
   Each JSON file documents the allowed fields via its `_README` block and controls model aliases, capability limits, and feature flags. Edit these files (or point the matching `*_MODELS_CONFIG_PATH` variable to your own copy) when you want to adjust context windows, enable JSON mode, or expose additional aliases without touching Python code.
@@ -154,6 +155,7 @@ OPENAI_MODELS_CONFIG_PATH=/path/to/openai_models.json
 GEMINI_MODELS_CONFIG_PATH=/path/to/gemini_models.json
 XAI_MODELS_CONFIG_PATH=/path/to/xai_models.json
 OPENROUTER_MODELS_CONFIG_PATH=/path/to/openrouter_models.json
+DIAL_MODELS_CONFIG_PATH=/path/to/dial_models.json
 CUSTOM_MODELS_CONFIG_PATH=/path/to/custom_models.json
 ```
 
diff --git a/docs/custom_models.md b/docs/custom_models.md
index c9df383..28c1a85 100644
--- a/docs/custom_models.md
+++ b/docs/custom_models.md
@@ -41,6 +41,7 @@ Zen ships multiple registries:
 - `conf/gemini_models.json` – native Google Gemini catalogue (`GEMINI_MODELS_CONFIG_PATH`)
 - `conf/xai_models.json` – native X.AI / GROK catalogue (`XAI_MODELS_CONFIG_PATH`)
 - `conf/openrouter_models.json` – OpenRouter catalogue (`OPENROUTER_MODELS_CONFIG_PATH`)
+- `conf/dial_models.json` – DIAL aggregation catalogue (`DIAL_MODELS_CONFIG_PATH`)
 - `conf/custom_models.json` – local/self-hosted OpenAI-compatible catalogue (`CUSTOM_MODELS_CONFIG_PATH`)
 
 Copy whichever file you need into your project (or point the corresponding `*_MODELS_CONFIG_PATH` env var at your own copy) and edit it to advertise the models you want.
@@ -71,7 +72,7 @@ Consult the JSON file for the full list, aliases, and capability flags. Add new
 
 View the baseline OpenRouter catalogue in [`conf/openrouter_models.json`](conf/openrouter_models.json) and populate [`conf/custom_models.json`](conf/custom_models.json) with your local models.
 
-Native catalogues (`conf/openai_models.json`, `conf/gemini_models.json`, `conf/xai_models.json`) follow the same schema. Updating those files lets you:
+Native catalogues (`conf/openai_models.json`, `conf/gemini_models.json`, `conf/xai_models.json`, `conf/dial_models.json`) follow the same schema. Updating those files lets you:
 
 - Expose new aliases (e.g., map `enterprise-pro` to `gpt-5-pro`)
 - Advertise support for JSON mode or vision if the upstream provider adds it
diff --git a/providers/__init__.py b/providers/__init__.py
index 9421edc..8a499d6 100644
--- a/providers/__init__.py
+++ b/providers/__init__.py
@@ -3,8 +3,8 @@
 from .azure_openai import AzureOpenAIProvider
 from .base import ModelProvider
 from .gemini import GeminiModelProvider
+from .openai import OpenAIModelProvider
 from .openai_compatible import OpenAICompatibleProvider
-from .openai_provider import OpenAIModelProvider
 from .openrouter import OpenRouterProvider
 from .registry import ModelProviderRegistry
 from .shared import ModelCapabilities, ModelResponse
diff --git a/providers/azure_openai.py b/providers/azure_openai.py
index 0371b6f..b0ec76f 100644
--- a/providers/azure_openai.py
+++ b/providers/azure_openai.py
@@ -12,9 +12,9 @@ except ImportError:  # pragma: no cover
 
 from utils.env import get_env, suppress_env_vars
 
-from .azure_registry import AzureModelRegistry
+from .openai import OpenAIModelProvider
 from .openai_compatible import OpenAICompatibleProvider
-from .openai_provider import OpenAIModelProvider
+from .registries.azure import AzureModelRegistry
 from .shared import ModelCapabilities, ModelResponse, ProviderType, TemperatureConstraint
 
 logger = logging.getLogger(__name__)
diff --git a/providers/custom.py b/providers/custom.py
index 835bfdd..cdd4f1d 100644
--- a/providers/custom.py
+++ b/providers/custom.py
@@ -4,11 +4,12 @@ import logging
 
 from utils.env import get_env
 
-from .custom_registry import CustomEndpointModelRegistry
 from .openai_compatible import OpenAICompatibleProvider
-from .openrouter_registry import OpenRouterModelRegistry
+from .registries.custom import CustomEndpointModelRegistry
+from .registries.openrouter import OpenRouterModelRegistry
 from .shared import ModelCapabilities, ProviderType
 
+
 class CustomProvider(OpenAICompatibleProvider):
     """Adapter for self-hosted or local OpenAI-compatible endpoints.
 
diff --git a/providers/dial.py b/providers/dial.py
index 921f599..bf96e31 100644
--- a/providers/dial.py
+++ b/providers/dial.py
@@ -2,17 +2,19 @@
 
 import logging
 import threading
-from typing import Optional
+from typing import ClassVar, Optional
 
 from utils.env import get_env
 
 from .openai_compatible import OpenAICompatibleProvider
-from .shared import ModelCapabilities, ModelResponse, ProviderType, TemperatureConstraint
+from .registries.dial import DialModelRegistry
+from .registry_provider_mixin import RegistryBackedProviderMixin
+from .shared import ModelCapabilities, ModelResponse, ProviderType
 
 logger = logging.getLogger(__name__)
 
 
-class DIALModelProvider(OpenAICompatibleProvider):
+class DIALModelProvider(RegistryBackedProviderMixin, OpenAICompatibleProvider):
     """Client for the DIAL (Data & AI Layer) aggregation service.
 
     DIAL exposes several third-party models behind a single OpenAI-compatible
@@ -23,185 +25,13 @@ class DIALModelProvider(OpenAICompatibleProvider):
 
     FRIENDLY_NAME = "DIAL"
 
+    REGISTRY_CLASS = DialModelRegistry
+    MODEL_CAPABILITIES: ClassVar[dict[str, ModelCapabilities]] = {}
+
     # Retry configuration for API calls
     MAX_RETRIES = 4
     RETRY_DELAYS = [1, 3, 5, 8]  # seconds
 
-    # Model configurations using ModelCapabilities objects
-    MODEL_CAPABILITIES = {
-        "o3-2025-04-16": ModelCapabilities(
-            provider=ProviderType.DIAL,
-            model_name="o3-2025-04-16",
-            friendly_name="DIAL (O3)",
-            intelligence_score=14,
-            context_window=200_000,
-            max_output_tokens=100_000,
-            supports_extended_thinking=False,
-            supports_system_prompts=True,
-            supports_streaming=True,
-            supports_function_calling=False,  # DIAL may not expose function calling
-            supports_json_mode=True,
-            supports_images=True,
-            max_image_size_mb=20.0,
-            supports_temperature=False,  # O3 models don't accept temperature
-            temperature_constraint=TemperatureConstraint.create("fixed"),
-            description="OpenAI O3 via DIAL - Strong reasoning model",
-            aliases=["o3"],
-        ),
-        "o4-mini-2025-04-16": ModelCapabilities(
-            provider=ProviderType.DIAL,
-            model_name="o4-mini-2025-04-16",
-            friendly_name="DIAL (O4-mini)",
-            intelligence_score=11,
-            context_window=200_000,
-            max_output_tokens=100_000,
-            supports_extended_thinking=False,
-            supports_system_prompts=True,
-            supports_streaming=True,
-            supports_function_calling=False,  # DIAL may not expose function calling
-            supports_json_mode=True,
-            supports_images=True,
-            max_image_size_mb=20.0,
-            supports_temperature=False,  # O4 models don't accept temperature
-            temperature_constraint=TemperatureConstraint.create("fixed"),
-            description="OpenAI O4-mini via DIAL - Fast reasoning model",
-            aliases=["o4-mini"],
-        ),
-        "anthropic.claude-sonnet-4.1-20250805-v1:0": ModelCapabilities(
-            provider=ProviderType.DIAL,
-            model_name="anthropic.claude-sonnet-4.1-20250805-v1:0",
-            friendly_name="DIAL (Sonnet 4.1)",
-            intelligence_score=10,
-            context_window=200_000,
-            max_output_tokens=64_000,
-            supports_extended_thinking=False,
-            supports_system_prompts=True,
-            supports_streaming=True,
-            supports_function_calling=False,
-            supports_json_mode=True,
-            supports_images=True,
-            max_image_size_mb=5.0,
-            supports_temperature=True,
-            temperature_constraint=TemperatureConstraint.create("range"),
-            description="Claude Sonnet 4.1 via DIAL - Balanced performance",
-            aliases=["sonnet-4.1", "sonnet-4"],
-        ),
-        "anthropic.claude-sonnet-4.1-20250805-v1:0-with-thinking": ModelCapabilities(
-            provider=ProviderType.DIAL,
-            model_name="anthropic.claude-sonnet-4.1-20250805-v1:0-with-thinking",
-            friendly_name="DIAL (Sonnet 4.1 Thinking)",
-            intelligence_score=11,
-            context_window=200_000,
-            max_output_tokens=64_000,
-            supports_extended_thinking=True,
-            supports_system_prompts=True,
-            supports_streaming=True,
-            supports_function_calling=False,
-            supports_json_mode=True,
-            supports_images=True,
-            max_image_size_mb=5.0,
-            supports_temperature=True,
-            temperature_constraint=TemperatureConstraint.create("range"),
-            description="Claude Sonnet 4.1 with thinking mode via DIAL",
-            aliases=["sonnet-4.1-thinking", "sonnet-4-thinking"],
-        ),
-        "anthropic.claude-opus-4.1-20250805-v1:0": ModelCapabilities(
-            provider=ProviderType.DIAL,
-            model_name="anthropic.claude-opus-4.1-20250805-v1:0",
-            friendly_name="DIAL (Opus 4.1)",
-            intelligence_score=14,
-            context_window=200_000,
-            max_output_tokens=64_000,
-            supports_extended_thinking=False,
-            supports_system_prompts=True,
-            supports_streaming=True,
-            supports_function_calling=False,
-            supports_json_mode=True,
-            supports_images=True,
-            max_image_size_mb=5.0,
-            supports_temperature=True,
-            temperature_constraint=TemperatureConstraint.create("range"),
-            description="Claude Opus 4.1 via DIAL - Most capable Claude model",
-            aliases=["opus-4.1", "opus-4"],
-        ),
-        "anthropic.claude-opus-4.1-20250805-v1:0-with-thinking": ModelCapabilities(
-            provider=ProviderType.DIAL,
-            model_name="anthropic.claude-opus-4.1-20250805-v1:0-with-thinking",
-            friendly_name="DIAL (Opus 4.1 Thinking)",
-            intelligence_score=15,
-            context_window=200_000,
-            max_output_tokens=64_000,
-            supports_extended_thinking=True,
-            supports_system_prompts=True,
-            supports_streaming=True,
-            supports_function_calling=False,
-            supports_json_mode=True,
-            supports_images=True,
-            max_image_size_mb=5.0,
-            supports_temperature=True,
-            temperature_constraint=TemperatureConstraint.create("range"),
-            description="Claude Opus 4.1 with thinking mode via DIAL",
-            aliases=["opus-4.1-thinking", "opus-4-thinking"],
-        ),
-        "gemini-2.5-pro-preview-03-25-google-search": ModelCapabilities(
-            provider=ProviderType.DIAL,
-            model_name="gemini-2.5-pro-preview-03-25-google-search",
-            friendly_name="DIAL (Gemini 2.5 Pro Search)",
-            intelligence_score=17,
-            context_window=1_000_000,
-            max_output_tokens=65_536,
-            supports_extended_thinking=False,
-            supports_system_prompts=True,
-            supports_streaming=True,
-            supports_function_calling=False,
-            supports_json_mode=True,
-            supports_images=True,
-            max_image_size_mb=20.0,
-            supports_temperature=True,
-            temperature_constraint=TemperatureConstraint.create("range"),
-            description="Gemini 2.5 Pro with Google Search via DIAL",
-            aliases=["gemini-2.5-pro-search"],
-        ),
-        "gemini-2.5-pro-preview-05-06": ModelCapabilities(
-            provider=ProviderType.DIAL,
-            model_name="gemini-2.5-pro-preview-05-06",
-            friendly_name="DIAL (Gemini 2.5 Pro)",
-            intelligence_score=18,
-            context_window=1_000_000,
-            max_output_tokens=65_536,
-            supports_extended_thinking=False,
-            supports_system_prompts=True,
-            supports_streaming=True,
-            supports_function_calling=False,
-            supports_json_mode=True,
-            supports_images=True,
-            max_image_size_mb=20.0,
-            supports_temperature=True,
-            temperature_constraint=TemperatureConstraint.create("range"),
-            description="Gemini 2.5 Pro via DIAL - Deep reasoning",
-            aliases=["gemini-2.5-pro"],
-        ),
-        "gemini-2.5-flash-preview-05-20": ModelCapabilities(
-            provider=ProviderType.DIAL,
-            model_name="gemini-2.5-flash-preview-05-20",
-            friendly_name="DIAL (Gemini Flash 2.5)",
-            intelligence_score=10,
-            context_window=1_000_000,
-            max_output_tokens=65_536,
-            supports_extended_thinking=False,
-            supports_system_prompts=True,
-            supports_streaming=True,
-            supports_function_calling=False,
-            supports_json_mode=True,
-            supports_images=True,
-            max_image_size_mb=20.0,
-            supports_temperature=True,
-            temperature_constraint=TemperatureConstraint.create("range"),
-            description="Gemini 2.5 Flash via DIAL - Ultra-fast",
-            aliases=["gemini-2.5-flash"],
-        ),
-    }
-
     def __init__(self, api_key: str, **kwargs):
         """Initialize DIAL provider with API key and host.
 
@@ -209,6 +39,7 @@ class DIALModelProvider(OpenAICompatibleProvider):
             api_key: DIAL API key for authentication
             **kwargs: Additional configuration options
         """
+        self._ensure_registry()
         # Get DIAL API host from environment or kwargs
         dial_host = kwargs.get("base_url") or get_env("DIAL_API_HOST") or "https://core.dialx.ai"
 
diff --git a/providers/gemini.py b/providers/gemini.py
index 162fee7..27fdac4 100644
--- a/providers/gemini.py
+++ b/providers/gemini.py
@@ -2,7 +2,7 @@
 
 import base64
 import logging
-from typing import TYPE_CHECKING, Optional
+from typing import TYPE_CHECKING, ClassVar, Optional
 
 if TYPE_CHECKING:
     from tools.models import ToolModelCategory
@@ -14,7 +14,7 @@ from utils.env import get_env
 from utils.image_utils import validate_image
 
 from .base import ModelProvider
-from .gemini_registry import GeminiModelRegistry
+from .registries.gemini import GeminiModelRegistry
 from .registry_provider_mixin import RegistryBackedProviderMixin
 from .shared import ModelCapabilities, ModelResponse, ProviderType
 
@@ -30,7 +30,7 @@ class GeminiModelProvider(RegistryBackedProviderMixin, ModelProvider):
     """
 
     REGISTRY_CLASS = GeminiModelRegistry
-    MODEL_CAPABILITIES: dict[str, ModelCapabilities] = {}
+    MODEL_CAPABILITIES: ClassVar[dict[str, ModelCapabilities]] = {}
 
     # Thinking mode configurations - percentages of model's max_thinking_tokens
     # These percentages work across all models that support thinking
diff --git a/providers/openai_provider.py b/providers/openai.py
similarity index 95%
rename from providers/openai_provider.py
rename to providers/openai.py
index d40263a..f7e61f4 100644
--- a/providers/openai_provider.py
+++ b/providers/openai.py
@@ -1,13 +1,13 @@
 """OpenAI model provider implementation."""
 
 import logging
-from typing import TYPE_CHECKING, Optional
+from typing import TYPE_CHECKING, ClassVar, Optional
 
 if TYPE_CHECKING:
     from tools.models import ToolModelCategory
 
 from .openai_compatible import OpenAICompatibleProvider
-from .openai_registry import OpenAIModelRegistry
+from .registries.openai import OpenAIModelRegistry
 from .registry_provider_mixin import RegistryBackedProviderMixin
 from .shared import ModelCapabilities, ProviderType
 
@@ -23,7 +23,7 @@ class OpenAIModelProvider(RegistryBackedProviderMixin, OpenAICompatibleProvider)
     """
 
     REGISTRY_CLASS = OpenAIModelRegistry
-    MODEL_CAPABILITIES: dict[str, ModelCapabilities] = {}
+    MODEL_CAPABILITIES: ClassVar[dict[str, ModelCapabilities]] = {}
 
     def __init__(self, api_key: str, **kwargs):
         """Initialize OpenAI provider with API key."""
@@ -50,7 +50,7 @@ class OpenAIModelProvider(RegistryBackedProviderMixin, OpenAICompatibleProvider)
             return builtin
 
         try:
-            from .openrouter_registry import OpenRouterModelRegistry
+            from .registries.openrouter import OpenRouterModelRegistry
 
             registry = OpenRouterModelRegistry()
             config = registry.get_model_config(canonical_name)
diff --git a/providers/openrouter.py b/providers/openrouter.py
index 6d7cb49..26a0ea7 100644
--- a/providers/openrouter.py
+++ b/providers/openrouter.py
@@ -5,7 +5,7 @@ import logging
 from utils.env import get_env
 
 from .openai_compatible import OpenAICompatibleProvider
-from .openrouter_registry import OpenRouterModelRegistry
+from .registries.openrouter import OpenRouterModelRegistry
 from .shared import (
     ModelCapabilities,
     ProviderType,
diff --git a/providers/registries/__init__.py b/providers/registries/__init__.py
new file mode 100644
index 0000000..5edbfdf
--- /dev/null
+++ b/providers/registries/__init__.py
@@ -0,0 +1,19 @@
+"""Registry implementations for provider capability manifests."""
+
+from .azure import AzureModelRegistry
+from .custom import CustomEndpointModelRegistry
+from .dial import DialModelRegistry
+from .gemini import GeminiModelRegistry
+from .openai import OpenAIModelRegistry
+from .openrouter import OpenRouterModelRegistry
+from .xai import XAIModelRegistry
+
+__all__ = [
+    "AzureModelRegistry",
+    "CustomEndpointModelRegistry",
+    "DialModelRegistry",
+    "GeminiModelRegistry",
+    "OpenAIModelRegistry",
+    "OpenRouterModelRegistry",
+    "XAIModelRegistry",
+]
diff --git a/providers/azure_registry.py b/providers/registries/azure.py
similarity index 90%
rename from providers/azure_registry.py
rename to providers/registries/azure.py
index 302ebf2..f0c48d4 100644
--- a/providers/azure_registry.py
+++ b/providers/registries/azure.py
@@ -4,8 +4,8 @@ from __future__ import annotations
 
 import logging
 
-from .model_registry_base import CAPABILITY_FIELD_NAMES, CustomModelRegistryBase
-from .shared import ModelCapabilities, ProviderType, TemperatureConstraint
+from ..shared import ModelCapabilities, ProviderType, TemperatureConstraint
+from .base import CAPABILITY_FIELD_NAMES, CustomModelRegistryBase
 
 logger = logging.getLogger(__name__)
 
diff --git a/providers/model_registry_base.py b/providers/registries/base.py
similarity index 96%
rename from providers/model_registry_base.py
rename to providers/registries/base.py
index c6dedec..513c817 100644
--- a/providers/model_registry_base.py
+++ b/providers/registries/base.py
@@ -12,7 +12,7 @@ from pathlib import Path
 from utils.env import get_env
 from utils.file_utils import read_json_file
 
-from .shared import ModelCapabilities, ProviderType, TemperatureConstraint
+from ..shared import ModelCapabilities, ProviderType, TemperatureConstraint
 
 logger = logging.getLogger(__name__)
 
@@ -34,7 +34,7 @@ class CustomModelRegistryBase:
         self._default_filename = default_filename
         self._use_resources = False
         self._resource_package = "conf"
-        self._default_path = Path(__file__).parent.parent / "conf" / default_filename
+        self._default_path = Path(__file__).resolve().parents[3] / "conf" / default_filename
 
         if config_path:
             self.config_path = Path(config_path)
@@ -51,7 +51,7 @@ class CustomModelRegistryBase:
                     else:
                         raise AttributeError("resource accessor not available")
                 except Exception:
-                    self.config_path = Path(__file__).parent.parent / "conf" / default_filename
+                    self.config_path = Path(__file__).resolve().parents[3] / "conf" / default_filename
 
         self.alias_map: dict[str, str] = {}
         self.model_map: dict[str, ModelCapabilities] = {}
@@ -213,7 +213,7 @@ class CustomModelRegistryBase:
 
 
 class CapabilityModelRegistry(CustomModelRegistryBase):
-    """Registry that returns `ModelCapabilities` objects with alias support."""
+    """Registry that returns :class:`ModelCapabilities` objects with alias support."""
 
     def __init__(
         self,
diff --git a/providers/custom_registry.py b/providers/registries/custom.py
similarity index 67%
rename from providers/custom_registry.py
rename to providers/registries/custom.py
index 990a3b0..e239da7 100644
--- a/providers/custom_registry.py
+++ b/providers/registries/custom.py
@@ -1,12 +1,14 @@
-"""Registry for models exposed via custom (local) OpenAI-compatible endpoints."""
+"""Registry loader for custom OpenAI-compatible endpoints."""
 
 from __future__ import annotations
 
-from .model_registry_base import CAPABILITY_FIELD_NAMES, CapabilityModelRegistry
-from .shared import ModelCapabilities, ProviderType
+from ..shared import ModelCapabilities, ProviderType
+from .base import CAPABILITY_FIELD_NAMES, CapabilityModelRegistry
 
 
 class CustomEndpointModelRegistry(CapabilityModelRegistry):
+    """Capability registry backed by ``conf/custom_models.json``."""
+
     def __init__(self, config_path: str | None = None) -> None:
         super().__init__(
             env_var_name="CUSTOM_MODELS_CONFIG_PATH",
@@ -15,11 +17,8 @@ class CustomEndpointModelRegistry(CapabilityModelRegistry):
             friendly_prefix="Custom ({model})",
             config_path=config_path,
         )
-        self.reload()
 
     def _finalise_entry(self, entry: dict) -> tuple[ModelCapabilities, dict]:
-        entry["provider"] = ProviderType.CUSTOM
-        entry.setdefault("friendly_name", f"Custom ({entry['model_name']})")
         filtered = {k: v for k, v in entry.items() if k in CAPABILITY_FIELD_NAMES}
         filtered.setdefault("provider", ProviderType.CUSTOM)
         capability = ModelCapabilities(**filtered)
diff --git a/providers/registries/dial.py b/providers/registries/dial.py
new file mode 100644
index 0000000..b2ed109
--- /dev/null
+++ b/providers/registries/dial.py
@@ -0,0 +1,19 @@
+"""Registry loader for DIAL provider capabilities."""
+
+from __future__ import annotations
+
+from ..shared import ProviderType
+from .base import CapabilityModelRegistry
+
+
+class DialModelRegistry(CapabilityModelRegistry):
+    """Capability registry backed by ``conf/dial_models.json``."""
+
+    def __init__(self, config_path: str | None = None) -> None:
+        super().__init__(
+            env_var_name="DIAL_MODELS_CONFIG_PATH",
+            default_filename="dial_models.json",
+            provider=ProviderType.DIAL,
+            friendly_prefix="DIAL ({model})",
+            config_path=config_path,
+        )
diff --git a/providers/gemini_registry.py b/providers/registries/gemini.py
similarity index 75%
rename from providers/gemini_registry.py
rename to providers/registries/gemini.py
index dd9e8fb..7ab8c35 100644
--- a/providers/gemini_registry.py
+++ b/providers/registries/gemini.py
@@ -2,12 +2,12 @@
 
 from __future__ import annotations
 
-from .model_registry_base import CapabilityModelRegistry
-from .shared import ProviderType
+from ..shared import ProviderType
+from .base import CapabilityModelRegistry
 
 
 class GeminiModelRegistry(CapabilityModelRegistry):
-    """Capability registry backed by `conf/gemini_models.json`."""
+    """Capability registry backed by ``conf/gemini_models.json``."""
 
     def __init__(self, config_path: str | None = None) -> None:
         super().__init__(
diff --git a/providers/openai_registry.py b/providers/registries/openai.py
similarity index 75%
rename from providers/openai_registry.py
rename to providers/registries/openai.py
index 859547f..ea5c0fb 100644
--- a/providers/openai_registry.py
+++ b/providers/registries/openai.py
@@ -2,12 +2,12 @@
 
 from __future__ import annotations
 
-from .model_registry_base import CapabilityModelRegistry
-from .shared import ProviderType
+from ..shared import ProviderType
+from .base import CapabilityModelRegistry
 
 
 class OpenAIModelRegistry(CapabilityModelRegistry):
-    """Capability registry backed by `conf/openai_models.json`."""
+    """Capability registry backed by ``conf/openai_models.json``."""
 
     def __init__(self, config_path: str | None = None) -> None:
         super().__init__(
diff --git a/providers/openrouter_registry.py b/providers/registries/openrouter.py
similarity index 87%
rename from providers/openrouter_registry.py
rename to providers/registries/openrouter.py
index 25f8dbf..28a59d9 100644
--- a/providers/openrouter_registry.py
+++ b/providers/registries/openrouter.py
@@ -2,12 +2,12 @@
 
 from __future__ import annotations
 
-from .model_registry_base import CAPABILITY_FIELD_NAMES, CapabilityModelRegistry
-from .shared import ModelCapabilities, ProviderType
+from ..shared import ModelCapabilities, ProviderType
+from .base import CAPABILITY_FIELD_NAMES, CapabilityModelRegistry
 
 
 class OpenRouterModelRegistry(CapabilityModelRegistry):
-    """Capability registry backed by `conf/openrouter_models.json`."""
+    """Capability registry backed by ``conf/openrouter_models.json``."""
 
     def __init__(self, config_path: str | None = None) -> None:
         super().__init__(
diff --git a/providers/xai_registry.py b/providers/registries/xai.py
similarity index 65%
rename from providers/xai_registry.py
rename to providers/registries/xai.py
index 80da85e..8708553 100644
--- a/providers/xai_registry.py
+++ b/providers/registries/xai.py
@@ -1,13 +1,13 @@
-"""Registry loader for X.AI (GROK) model capabilities."""
+"""Registry loader for X.AI model capabilities."""
 
 from __future__ import annotations
 
-from .model_registry_base import CapabilityModelRegistry
-from .shared import ProviderType
+from ..shared import ProviderType
+from .base import CapabilityModelRegistry
 
 
 class XAIModelRegistry(CapabilityModelRegistry):
-    """Capability registry backed by `conf/xai_models.json`."""
+    """Capability registry backed by ``conf/xai_models.json``."""
 
     def __init__(self, config_path: str | None = None) -> None:
         super().__init__(
diff --git a/providers/registry_provider_mixin.py b/providers/registry_provider_mixin.py
index afc85a9..316db68 100644
--- a/providers/registry_provider_mixin.py
+++ b/providers/registry_provider_mixin.py
@@ -22,7 +22,7 @@ from __future__ import annotations
 import logging
 from typing import ClassVar
 
-from .model_registry_base import CapabilityModelRegistry
+from .registries.base import CapabilityModelRegistry
 from .shared import ModelCapabilities
 
 
diff --git a/providers/xai.py b/providers/xai.py
index 0842f8e..a24d425 100644
--- a/providers/xai.py
+++ b/providers/xai.py
@@ -1,15 +1,15 @@
 """X.AI (GROK) model provider implementation."""
 
 import logging
-from typing import TYPE_CHECKING, Optional
+from typing import TYPE_CHECKING, ClassVar, Optional
 
 if TYPE_CHECKING:
     from tools.models import ToolModelCategory
 
 from .openai_compatible import OpenAICompatibleProvider
+from .registries.xai import XAIModelRegistry
 from .registry_provider_mixin import RegistryBackedProviderMixin
 from .shared import ModelCapabilities, ProviderType
-from .xai_registry import XAIModelRegistry
 
 logger = logging.getLogger(__name__)
 
@@ -24,7 +24,7 @@ class XAIModelProvider(RegistryBackedProviderMixin, OpenAICompatibleProvider):
     FRIENDLY_NAME = "X.AI"
 
     REGISTRY_CLASS = XAIModelRegistry
-    MODEL_CAPABILITIES: dict[str, ModelCapabilities] = {}
+    MODEL_CAPABILITIES: ClassVar[dict[str, ModelCapabilities]] = {}
 
     def __init__(self, api_key: str, **kwargs):
         """Initialize X.AI provider with API key."""
diff --git a/pyproject.toml b/pyproject.toml
index dd4bde9..f3404c7 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -28,6 +28,7 @@ py-modules = ["server", "config"]
     "conf/openai_models.json",
     "conf/gemini_models.json",
     "conf/xai_models.json",
+    "conf/dial_models.json",
 ]
 
 [project.scripts]
diff --git a/server.py b/server.py
index 813c13d..5e4e517 100644
--- a/server.py
+++ b/server.py
@@ -395,7 +395,7 @@ def configure_providers():
     from providers.custom import CustomProvider
     from providers.dial import DIALModelProvider
     from providers.gemini import GeminiModelProvider
-    from providers.openai_provider import OpenAIModelProvider
+    from providers.openai import OpenAIModelProvider
     from providers.openrouter import OpenRouterProvider
     from providers.shared import ProviderType
     from providers.xai import XAIModelProvider
@@ -432,7 +432,7 @@ def configure_providers():
     azure_models_available = False
     if azure_key and azure_key != "your_azure_openai_key_here" and azure_endpoint:
         try:
-            from providers.azure_registry import AzureModelRegistry
+            from providers.registries.azure import AzureModelRegistry
 
             azure_registry = AzureModelRegistry()
             if azure_registry.list_models():
diff --git a/tests/conftest.py b/tests/conftest.py
index eff88e3..723e06d 100644
--- a/tests/conftest.py
+++ b/tests/conftest.py
@@ -38,7 +38,7 @@ if sys.platform == "win32":
 
 # Register providers for all tests
 from providers.gemini import GeminiModelProvider  # noqa: E402
-from providers.openai_provider import OpenAIModelProvider  # noqa: E402
+from providers.openai import OpenAIModelProvider  # noqa: E402
 from providers.registry import ModelProviderRegistry  # noqa: E402
 from providers.shared import ProviderType  # noqa: E402
 from providers.xai import XAIModelProvider  # noqa: E402
diff --git a/tests/test_alias_target_restrictions.py b/tests/test_alias_target_restrictions.py
index 77f2799..c3a219a 100644
--- a/tests/test_alias_target_restrictions.py
+++ b/tests/test_alias_target_restrictions.py
@@ -9,7 +9,7 @@ import os
 from unittest.mock import patch
 
 from providers.gemini import GeminiModelProvider
-from providers.openai_provider import OpenAIModelProvider
+from providers.openai import OpenAIModelProvider
 from providers.shared import ProviderType
 from utils.model_restrictions import ModelRestrictionService
 
diff --git a/tests/test_auto_mode_comprehensive.py b/tests/test_auto_mode_comprehensive.py
index 56cc9e7..39895db 100644
--- a/tests/test_auto_mode_comprehensive.py
+++ b/tests/test_auto_mode_comprehensive.py
@@ -7,7 +7,7 @@ from unittest.mock import MagicMock, patch
 import pytest
 
 from providers.gemini import GeminiModelProvider
-from providers.openai_provider import OpenAIModelProvider
+from providers.openai import OpenAIModelProvider
 from providers.registry import ModelProviderRegistry
 from providers.shared import ProviderType
 from providers.xai import XAIModelProvider
diff --git a/tests/test_auto_mode_model_listing.py b/tests/test_auto_mode_model_listing.py
index dec487f..2b78249 100644
--- a/tests/test_auto_mode_model_listing.py
+++ b/tests/test_auto_mode_model_listing.py
@@ -9,7 +9,7 @@ import pytest
 import utils.env as env_config
 import utils.model_restrictions as model_restrictions
 from providers.gemini import GeminiModelProvider
-from providers.openai_provider import OpenAIModelProvider
+from providers.openai import OpenAIModelProvider
 from providers.openrouter import OpenRouterProvider
 from providers.registry import ModelProviderRegistry
 from providers.shared import ProviderType
diff --git a/tests/test_auto_mode_provider_selection.py b/tests/test_auto_mode_provider_selection.py
index f254cfb..7f79bd9 100644
--- a/tests/test_auto_mode_provider_selection.py
+++ b/tests/test_auto_mode_provider_selection.py
@@ -86,7 +86,7 @@ class TestAutoModeProviderSelection:
                 os.environ.pop(key, None)
 
             # Register only OpenAI provider
-            from providers.openai_provider import OpenAIModelProvider
+            from providers.openai import OpenAIModelProvider
 
             ModelProviderRegistry.register_provider(ProviderType.OPENAI, OpenAIModelProvider)
 
@@ -127,7 +127,7 @@ class TestAutoModeProviderSelection:
 
             # Register both providers
             from providers.gemini import GeminiModelProvider
-            from providers.openai_provider import OpenAIModelProvider
+            from providers.openai import OpenAIModelProvider
 
             ModelProviderRegistry.register_provider(ProviderType.GOOGLE, GeminiModelProvider)
             ModelProviderRegistry.register_provider(ProviderType.OPENAI, OpenAIModelProvider)
@@ -212,7 +212,7 @@ class TestAutoModeProviderSelection:
 
             # Register both providers
             from providers.gemini import GeminiModelProvider
-            from providers.openai_provider import OpenAIModelProvider
+            from providers.openai import OpenAIModelProvider
 
             ModelProviderRegistry.register_provider(ProviderType.GOOGLE, GeminiModelProvider)
             ModelProviderRegistry.register_provider(ProviderType.OPENAI, OpenAIModelProvider)
@@ -256,7 +256,7 @@ class TestAutoModeProviderSelection:
 
             # Register all providers
             from providers.gemini import GeminiModelProvider
-            from providers.openai_provider import OpenAIModelProvider
+            from providers.openai import OpenAIModelProvider
             from providers.xai import XAIModelProvider
 
             ModelProviderRegistry.register_provider(ProviderType.GOOGLE, GeminiModelProvider)
@@ -307,7 +307,7 @@ class TestAutoModeProviderSelection:
 
             # Register all providers
             from providers.gemini import GeminiModelProvider
-            from providers.openai_provider import OpenAIModelProvider
+            from providers.openai import OpenAIModelProvider
             from providers.xai import XAIModelProvider
 
             ModelProviderRegistry.register_provider(ProviderType.GOOGLE, GeminiModelProvider)
diff --git a/tests/test_buggy_behavior_prevention.py b/tests/test_buggy_behavior_prevention.py
index c8c3cdd..4bfe633 100644
--- a/tests/test_buggy_behavior_prevention.py
+++ b/tests/test_buggy_behavior_prevention.py
@@ -12,7 +12,7 @@ from unittest.mock import MagicMock, patch
 import pytest
 
 from providers.gemini import GeminiModelProvider
-from providers.openai_provider import OpenAIModelProvider
+from providers.openai import OpenAIModelProvider
 from providers.shared import ProviderType
 from utils.model_restrictions import ModelRestrictionService
 
diff --git a/tests/test_chat_cross_model_continuation.py b/tests/test_chat_cross_model_continuation.py
index 404dbff..7dc0ddd 100644
--- a/tests/test_chat_cross_model_continuation.py
+++ b/tests/test_chat_cross_model_continuation.py
@@ -105,7 +105,7 @@ async def test_chat_cross_model_continuation(monkeypatch):
 
         ModelProviderRegistry.reset_for_testing()
         from providers.gemini import GeminiModelProvider
-        from providers.openai_provider import OpenAIModelProvider
+        from providers.openai import OpenAIModelProvider
 
         ModelProviderRegistry.register_provider(ProviderType.OPENAI, OpenAIModelProvider)
         ModelProviderRegistry.register_provider(ProviderType.GOOGLE, GeminiModelProvider)
@@ -170,7 +170,7 @@ async def test_chat_cross_model_continuation(monkeypatch):
 
         ModelProviderRegistry.reset_for_testing()
         from providers.gemini import GeminiModelProvider
-        from providers.openai_provider import OpenAIModelProvider
+        from providers.openai import OpenAIModelProvider
 
         ModelProviderRegistry.register_provider(ProviderType.OPENAI, OpenAIModelProvider)
         ModelProviderRegistry.register_provider(ProviderType.GOOGLE, GeminiModelProvider)
diff --git a/tests/test_chat_openai_integration.py b/tests/test_chat_openai_integration.py
index 88c21aa..a493702 100644
--- a/tests/test_chat_openai_integration.py
+++ b/tests/test_chat_openai_integration.py
@@ -54,7 +54,7 @@ async def test_chat_auto_mode_with_openai(monkeypatch):
 
         # Reset registry and register only OpenAI provider
         ModelProviderRegistry.reset_for_testing()
-        from providers.openai_provider import OpenAIModelProvider
+        from providers.openai import OpenAIModelProvider
 
         ModelProviderRegistry.register_provider(ProviderType.OPENAI, OpenAIModelProvider)
 
@@ -115,7 +115,7 @@ async def test_chat_openai_continuation(monkeypatch):
             m.delenv(key, raising=False)
 
         ModelProviderRegistry.reset_for_testing()
-        from providers.openai_provider import OpenAIModelProvider
+        from providers.openai import OpenAIModelProvider
 
         ModelProviderRegistry.register_provider(ProviderType.OPENAI, OpenAIModelProvider)
 
diff --git a/tests/test_consensus_integration.py b/tests/test_consensus_integration.py
index 37025e6..7414c44 100644
--- a/tests/test_consensus_integration.py
+++ b/tests/test_consensus_integration.py
@@ -75,7 +75,7 @@ async def test_consensus_multi_model_consultations(monkeypatch):
         # Reset providers and register only OpenAI & Gemini for deterministic behavior
         ModelProviderRegistry.reset_for_testing()
         from providers.gemini import GeminiModelProvider
-        from providers.openai_provider import OpenAIModelProvider
+        from providers.openai import OpenAIModelProvider
 
         ModelProviderRegistry.register_provider(ProviderType.OPENAI, OpenAIModelProvider)
         ModelProviderRegistry.register_provider(ProviderType.GOOGLE, GeminiModelProvider)
diff --git a/tests/test_custom_openai_temperature_fix.py b/tests/test_custom_openai_temperature_fix.py
index 8f933d9..f483361 100644
--- a/tests/test_custom_openai_temperature_fix.py
+++ b/tests/test_custom_openai_temperature_fix.py
@@ -11,7 +11,7 @@ import tempfile
 from pathlib import Path
 from unittest.mock import Mock, patch
 
-from providers.openai_provider import OpenAIModelProvider
+from providers.openai import OpenAIModelProvider
 
 
 class TestCustomOpenAITemperatureParameterFix:
@@ -79,7 +79,7 @@ class TestCustomOpenAITemperatureParameterFix:
             mock_client.chat.completions.create.return_value = mock_response
 
             # Create provider with custom config
-            with patch("providers.openrouter_registry.OpenRouterModelRegistry") as mock_registry_class:
+            with patch("providers.registries.openrouter.OpenRouterModelRegistry") as mock_registry_class:
                 # Mock registry to load our test config
                 mock_registry = Mock()
                 mock_registry_class.return_value = mock_registry
@@ -163,7 +163,7 @@ class TestCustomOpenAITemperatureParameterFix:
         mock_client.chat.completions.create.return_value = mock_response
 
         # Create provider with custom config
-        with patch("providers.openrouter_registry.OpenRouterModelRegistry") as mock_registry_class:
+        with patch("providers.registries.openrouter.OpenRouterModelRegistry") as mock_registry_class:
             # Mock registry to load our test config
             mock_registry = Mock()
             mock_registry_class.return_value = mock_registry
@@ -221,7 +221,7 @@ class TestCustomOpenAITemperatureParameterFix:
         mock_service.is_allowed.return_value = True
         mock_restriction_service.return_value = mock_service
 
-        with patch("providers.openrouter_registry.OpenRouterModelRegistry") as mock_registry_class:
+        with patch("providers.registries.openrouter.OpenRouterModelRegistry") as mock_registry_class:
             # Mock registry to return a custom OpenAI model
             mock_registry = Mock()
             mock_registry_class.return_value = mock_registry
@@ -267,7 +267,7 @@ class TestCustomOpenAITemperatureParameterFix:
         mock_service.is_allowed.return_value = True
         mock_restriction_service.return_value = mock_service
 
-        with patch("providers.openrouter_registry.OpenRouterModelRegistry") as mock_registry_class:
+        with patch("providers.registries.openrouter.OpenRouterModelRegistry") as mock_registry_class:
             # Mock registry to raise an exception
             mock_registry_class.side_effect = Exception("Registry not available")
 
diff --git a/tests/test_intelligent_fallback.py b/tests/test_intelligent_fallback.py
index 20aed4b..1def89e 100644
--- a/tests/test_intelligent_fallback.py
+++ b/tests/test_intelligent_fallback.py
@@ -39,7 +39,7 @@ class TestIntelligentFallback:
     def test_prefers_openai_o3_mini_when_available(self):
         """Test that gpt-5 is preferred when OpenAI API key is available (based on new preference order)"""
         # Register only OpenAI provider for this test
-        from providers.openai_provider import OpenAIModelProvider
+        from providers.openai import OpenAIModelProvider
 
         ModelProviderRegistry.register_provider(ProviderType.OPENAI, OpenAIModelProvider)
 
@@ -62,7 +62,7 @@ class TestIntelligentFallback:
         """Test that OpenAI is preferred when both API keys are available"""
         # Register both OpenAI and Gemini providers
         from providers.gemini import GeminiModelProvider
-        from providers.openai_provider import OpenAIModelProvider
+        from providers.openai import OpenAIModelProvider
 
         ModelProviderRegistry.register_provider(ProviderType.OPENAI, OpenAIModelProvider)
         ModelProviderRegistry.register_provider(ProviderType.GOOGLE, GeminiModelProvider)
@@ -75,7 +75,7 @@ class TestIntelligentFallback:
         """Test fallback behavior when no API keys are available"""
         # Register providers but with no API keys available
         from providers.gemini import GeminiModelProvider
-        from providers.openai_provider import OpenAIModelProvider
+        from providers.openai import OpenAIModelProvider
 
         ModelProviderRegistry.register_provider(ProviderType.OPENAI, OpenAIModelProvider)
         ModelProviderRegistry.register_provider(ProviderType.GOOGLE, GeminiModelProvider)
@@ -86,7 +86,7 @@ class TestIntelligentFallback:
     def test_available_providers_with_keys(self):
         """Test the get_available_providers_with_keys method"""
         from providers.gemini import GeminiModelProvider
-        from providers.openai_provider import OpenAIModelProvider
+        from providers.openai import OpenAIModelProvider
 
         with patch.dict(os.environ, {"OPENAI_API_KEY": "sk-test-key", "GEMINI_API_KEY": ""}, clear=False):
             # Clear and register providers
@@ -119,7 +119,7 @@ class TestIntelligentFallback:
             patch.dict(os.environ, {"OPENAI_API_KEY": "sk-test-key", "GEMINI_API_KEY": ""}, clear=False),
         ):
             # Register only OpenAI provider for this test
-            from providers.openai_provider import OpenAIModelProvider
+            from providers.openai import OpenAIModelProvider
 
             ModelProviderRegistry.register_provider(ProviderType.OPENAI, OpenAIModelProvider)
 
diff --git a/tests/test_issue_245_simple.py b/tests/test_issue_245_simple.py
index 701fbda..486b3fd 100644
--- a/tests/test_issue_245_simple.py
+++ b/tests/test_issue_245_simple.py
@@ -6,7 +6,7 @@ Issue: Custom OpenAI models (gpt-5, o3) use temperature despite the config havin
 
 from unittest.mock import Mock, patch
 
-from providers.openai_provider import OpenAIModelProvider
+from providers.openai import OpenAIModelProvider
 
 
 def test_issue_245_custom_openai_temperature_ignored():
@@ -14,7 +14,7 @@ def test_issue_245_custom_openai_temperature_ignored():
 
     with patch("utils.model_restrictions.get_restriction_service") as mock_restriction:
         with patch("providers.openai_compatible.OpenAI") as mock_openai:
-            with patch("providers.openrouter_registry.OpenRouterModelRegistry") as mock_registry_class:
+            with patch("providers.registries.openrouter.OpenRouterModelRegistry") as mock_registry_class:
 
                 # Mock restriction service
                 mock_service = Mock()
diff --git a/tests/test_listmodels_restrictions.py b/tests/test_listmodels_restrictions.py
index 9cf3cf4..028f68e 100644
--- a/tests/test_listmodels_restrictions.py
+++ b/tests/test_listmodels_restrictions.py
@@ -97,7 +97,7 @@ class TestListModelsRestrictions(unittest.TestCase):
         },
     )
     @patch("utils.model_restrictions.get_restriction_service")
-    @patch("providers.openrouter_registry.OpenRouterModelRegistry")
+    @patch("providers.registries.openrouter.OpenRouterModelRegistry")
     @patch.object(ModelProviderRegistry, "get_available_models")
     @patch.object(ModelProviderRegistry, "get_provider")
     def test_listmodels_respects_openrouter_restrictions(
@@ -239,7 +239,7 @@ class TestListModelsRestrictions(unittest.TestCase):
         self.assertIn("OpenRouter models restricted by", result)
 
     @patch.dict(os.environ, {"OPENROUTER_API_KEY": "test-key", "GEMINI_API_KEY": "gemini-test-key"}, clear=True)
-    @patch("providers.openrouter_registry.OpenRouterModelRegistry")
+    @patch("providers.registries.openrouter.OpenRouterModelRegistry")
     @patch.object(ModelProviderRegistry, "get_provider")
     def test_listmodels_shows_all_models_without_restrictions(self, mock_get_provider, mock_registry_class):
         """Test that listmodels shows all models when no restrictions are set."""
diff --git a/tests/test_model_restrictions.py b/tests/test_model_restrictions.py
index a04c389..e651395 100644
--- a/tests/test_model_restrictions.py
+++ b/tests/test_model_restrictions.py
@@ -6,7 +6,7 @@ from unittest.mock import MagicMock, patch
 import pytest
 
 from providers.gemini import GeminiModelProvider
-from providers.openai_provider import OpenAIModelProvider
+from providers.openai import OpenAIModelProvider
 from providers.shared import ProviderType
 from utils.model_restrictions import ModelRestrictionService
 
@@ -767,7 +767,7 @@ class TestAutoModeWithRestrictions:
             # Clear registry and register only OpenAI and Gemini providers
             ModelProviderRegistry._instance = None
             from providers.gemini import GeminiModelProvider
-            from providers.openai_provider import OpenAIModelProvider
+            from providers.openai import OpenAIModelProvider
 
             ModelProviderRegistry.register_provider(ProviderType.OPENAI, OpenAIModelProvider)
             ModelProviderRegistry.register_provider(ProviderType.GOOGLE, GeminiModelProvider)
diff --git a/tests/test_o3_temperature_fix_simple.py b/tests/test_o3_temperature_fix_simple.py
index 6293822..81b9f79 100644
--- a/tests/test_o3_temperature_fix_simple.py
+++ b/tests/test_o3_temperature_fix_simple.py
@@ -7,7 +7,7 @@ for O3 models while maintaining them for regular models.
 
 from unittest.mock import Mock, patch
 
-from providers.openai_provider import OpenAIModelProvider
+from providers.openai import OpenAIModelProvider
 
 
 class TestO3TemperatureParameterFixSimple:
@@ -175,7 +175,7 @@ class TestO3TemperatureParameterFixSimple:
     @patch("utils.model_restrictions.get_restriction_service")
     def test_all_o3_models_have_correct_temperature_capability(self, mock_restriction_service):
         """Test that all O3/O4 models have supports_temperature=False in their capabilities."""
-        from providers.openai_provider import OpenAIModelProvider
+        from providers.openai import OpenAIModelProvider
 
         # Mock restriction service to allow all models
         mock_service = Mock()
@@ -211,7 +211,7 @@ class TestO3TemperatureParameterFixSimple:
     @patch("utils.model_restrictions.get_restriction_service")
     def test_openai_provider_temperature_constraints(self, mock_restriction_service):
         """Test that OpenAI provider has correct temperature constraints for O3 models."""
-        from providers.openai_provider import OpenAIModelProvider
+        from providers.openai import OpenAIModelProvider
 
         # Mock restriction service to allow all models
         mock_service = Mock()
diff --git a/tests/test_openai_provider.py b/tests/test_openai_provider.py
index e03e3b1..6ffb5d2 100644
--- a/tests/test_openai_provider.py
+++ b/tests/test_openai_provider.py
@@ -3,7 +3,7 @@
 import os
 from unittest.mock import MagicMock, patch
 
-from providers.openai_provider import OpenAIModelProvider
+from providers.openai import OpenAIModelProvider
 from providers.shared import ProviderType
 
 
diff --git a/tests/test_openrouter_provider.py b/tests/test_openrouter_provider.py
index 3b83be0..231d13e 100644
--- a/tests/test_openrouter_provider.py
+++ b/tests/test_openrouter_provider.py
@@ -282,7 +282,7 @@ class TestOpenRouterRegistry:
 
     def test_registry_loading(self):
         """Test registry loads models from config."""
-        from providers.openrouter_registry import OpenRouterModelRegistry
+        from providers.registries.openrouter import OpenRouterModelRegistry
 
         registry = OpenRouterModelRegistry()
 
@@ -301,7 +301,7 @@ class TestOpenRouterRegistry:
 
     def test_registry_capabilities(self):
         """Test registry provides correct capabilities."""
-        from providers.openrouter_registry import OpenRouterModelRegistry
+        from providers.registries.openrouter import OpenRouterModelRegistry
 
         registry = OpenRouterModelRegistry()
 
@@ -322,7 +322,7 @@ class TestOpenRouterRegistry:
 
     def test_multiple_aliases_same_model(self):
         """Test multiple aliases pointing to same model."""
-        from providers.openrouter_registry import OpenRouterModelRegistry
+        from providers.registries.openrouter import OpenRouterModelRegistry
 
         registry = OpenRouterModelRegistry()
 
diff --git a/tests/test_openrouter_registry.py b/tests/test_openrouter_registry.py
index bb41ce8..e1738e5 100644
--- a/tests/test_openrouter_registry.py
+++ b/tests/test_openrouter_registry.py
@@ -7,7 +7,7 @@ from unittest.mock import patch
 
 import pytest
 
-from providers.openrouter_registry import OpenRouterModelRegistry
+from providers.registries.openrouter import OpenRouterModelRegistry
 from providers.shared import ModelCapabilities, ProviderType
 
 
diff --git a/tests/test_per_tool_model_defaults.py b/tests/test_per_tool_model_defaults.py
index dd2af1d..6978200 100644
--- a/tests/test_per_tool_model_defaults.py
+++ b/tests/test_per_tool_model_defaults.py
@@ -90,7 +90,7 @@ class TestModelSelection:
             ModelProviderRegistry.unregister_provider(provider_type)
 
         with patch.dict(os.environ, {"OPENAI_API_KEY": "test-key"}, clear=False):
-            from providers.openai_provider import OpenAIModelProvider
+            from providers.openai import OpenAIModelProvider
 
             ModelProviderRegistry.register_provider(ProviderType.OPENAI, OpenAIModelProvider)
 
@@ -125,7 +125,7 @@ class TestModelSelection:
             ModelProviderRegistry.unregister_provider(provider_type)
 
         with patch.dict(os.environ, {"OPENAI_API_KEY": "test-key"}, clear=False):
-            from providers.openai_provider import OpenAIModelProvider
+            from providers.openai import OpenAIModelProvider
 
             ModelProviderRegistry.register_provider(ProviderType.OPENAI, OpenAIModelProvider)
 
@@ -159,7 +159,7 @@ class TestModelSelection:
             ModelProviderRegistry.unregister_provider(provider_type)
 
         with patch.dict(os.environ, {"OPENAI_API_KEY": "test-key"}, clear=False):
-            from providers.openai_provider import OpenAIModelProvider
+            from providers.openai import OpenAIModelProvider
 
             ModelProviderRegistry.register_provider(ProviderType.OPENAI, OpenAIModelProvider)
 
@@ -220,7 +220,7 @@ class TestFlexibleModelSelection:
             with patch.dict(os.environ, case["env"], clear=False):
                 # Register the appropriate provider
                 if case["provider_type"] == ProviderType.OPENAI:
-                    from providers.openai_provider import OpenAIModelProvider
+                    from providers.openai import OpenAIModelProvider
 
                     ModelProviderRegistry.register_provider(ProviderType.OPENAI, OpenAIModelProvider)
                 elif case["provider_type"] == ProviderType.GOOGLE:
diff --git a/tests/test_provider_retry_logic.py b/tests/test_provider_retry_logic.py
index 4ff92ed..5c49161 100644
--- a/tests/test_provider_retry_logic.py
+++ b/tests/test_provider_retry_logic.py
@@ -4,7 +4,7 @@ from types import SimpleNamespace
 
 import pytest
 
-from providers.openai_provider import OpenAIModelProvider
+from providers.openai import OpenAIModelProvider
 
 
 def _mock_chat_response(content: str = "retry success") -> SimpleNamespace:
diff --git a/tests/test_provider_routing_bugs.py b/tests/test_provider_routing_bugs.py
index d2b7133..4e0c2f1 100644
--- a/tests/test_provider_routing_bugs.py
+++ b/tests/test_provider_routing_bugs.py
@@ -189,7 +189,7 @@ class TestProviderRoutingBugs:
 
             # Register providers in priority order (like server.py)
             from providers.gemini import GeminiModelProvider
-            from providers.openai_provider import OpenAIModelProvider
+            from providers.openai import OpenAIModelProvider
             from providers.openrouter import OpenRouterProvider
 
             ModelProviderRegistry.register_provider(ProviderType.GOOGLE, GeminiModelProvider)
diff --git a/tests/test_provider_utf8.py b/tests/test_provider_utf8.py
index 9c15a4e..8786568 100644
--- a/tests/test_provider_utf8.py
+++ b/tests/test_provider_utf8.py
@@ -11,7 +11,7 @@ from unittest.mock import Mock, patch
 import pytest
 
 from providers.gemini import GeminiModelProvider
-from providers.openai_provider import OpenAIModelProvider
+from providers.openai import OpenAIModelProvider
 from providers.shared import ProviderType
 
 
diff --git a/tests/test_providers.py b/tests/test_providers.py
index c3bdf9e..1697a71 100644
--- a/tests/test_providers.py
+++ b/tests/test_providers.py
@@ -7,7 +7,7 @@ import pytest
 
 from providers import ModelProviderRegistry, ModelResponse
 from providers.gemini import GeminiModelProvider
-from providers.openai_provider import OpenAIModelProvider
+from providers.openai import OpenAIModelProvider
 from providers.shared import ProviderType
 
 
diff --git a/tests/test_rate_limit_patterns.py b/tests/test_rate_limit_patterns.py
index 6de2176..0ec446f 100644
--- a/tests/test_rate_limit_patterns.py
+++ b/tests/test_rate_limit_patterns.py
@@ -3,7 +3,7 @@ Test to verify structured error code-based retry logic.
 """
 
 from providers.gemini import GeminiModelProvider
-from providers.openai_provider import OpenAIModelProvider
+from providers.openai import OpenAIModelProvider
 
 
 def test_openai_structured_error_retry_logic():
diff --git a/tests/test_supported_models_aliases.py b/tests/test_supported_models_aliases.py
index e3b55d5..16be740 100644
--- a/tests/test_supported_models_aliases.py
+++ b/tests/test_supported_models_aliases.py
@@ -2,7 +2,7 @@
 
 from providers.dial import DIALModelProvider
 from providers.gemini import GeminiModelProvider
-from providers.openai_provider import OpenAIModelProvider
+from providers.openai import OpenAIModelProvider
 from providers.xai import XAIModelProvider
 
 
diff --git a/tests/test_uvx_resource_packaging.py b/tests/test_uvx_resource_packaging.py
index bbc0571..120d11a 100644
--- a/tests/test_uvx_resource_packaging.py
+++ b/tests/test_uvx_resource_packaging.py
@@ -5,7 +5,7 @@ import tempfile
 from pathlib import Path
 from unittest.mock import patch
 
-from providers.openrouter_registry import OpenRouterModelRegistry
+from providers.registries.openrouter import OpenRouterModelRegistry
 
 
 class TestUvxPathResolution:
@@ -55,7 +55,7 @@ class TestUvxPathResolution:
             assert registry.config_path == config_path
             assert len(registry.list_models()) > 0
 
-    @patch("providers.model_registry_base.importlib.resources.files")
+    @patch("providers.registries.base.importlib.resources.files")
     def test_multiple_path_fallback(self, mock_files):
         """Test that file-system fallback works when resource loading fails."""
         mock_files.side_effect = Exception("Resource loading failed")
diff --git a/tests/transport_helpers.py b/tests/transport_helpers.py
index 07fbfe9..477f885 100644
--- a/tests/transport_helpers.py
+++ b/tests/transport_helpers.py
@@ -22,7 +22,7 @@ def inject_transport(monkeypatch, cassette_path: str):
         transport = inject_transport(monkeypatch, "path/to/cassette.json")
     """
     # Ensure OpenAI provider is registered - always needed for transport injection
-    from providers.openai_provider import OpenAIModelProvider
+    from providers.openai import OpenAIModelProvider
     from providers.registry import ModelProviderRegistry
     from providers.shared import ProviderType
 
diff --git a/tools/listmodels.py b/tools/listmodels.py
index ebdcc8d..d60f651 100644
--- a/tools/listmodels.py
+++ b/tools/listmodels.py
@@ -11,8 +11,8 @@ from typing import Any, Optional
 
 from mcp.types import TextContent
 
-from providers.custom_registry import CustomEndpointModelRegistry
-from providers.openrouter_registry import OpenRouterModelRegistry
+from providers.registries.custom import CustomEndpointModelRegistry
+from providers.registries.openrouter import OpenRouterModelRegistry
 from tools.models import ToolModelCategory, ToolOutput
 from tools.shared.base_models import ToolRequest
 from tools.shared.base_tool import BaseTool
diff --git a/tools/shared/base_tool.py b/tools/shared/base_tool.py
index d041e7b..e5353b9 100644
--- a/tools/shared/base_tool.py
+++ b/tools/shared/base_tool.py
@@ -89,7 +89,7 @@ class BaseTool(ABC):
         """Get cached OpenRouter registry instance, creating if needed."""
         # Use BaseTool class directly to ensure cache is shared across all subclasses
         if BaseTool._openrouter_registry_cache is None:
-            from providers.openrouter_registry import OpenRouterModelRegistry
+            from providers.registries.openrouter import OpenRouterModelRegistry
 
             BaseTool._openrouter_registry_cache = OpenRouterModelRegistry()
             logger.debug("Created cached OpenRouter registry instance")
@@ -99,7 +99,7 @@ class BaseTool(ABC):
     def _get_custom_registry(cls):
         """Get cached custom-endpoint registry instance."""
         if BaseTool._custom_registry_cache is None:
-            from providers.custom_registry import CustomEndpointModelRegistry
+            from providers.registries.custom import CustomEndpointModelRegistry
 
             BaseTool._custom_registry_cache = CustomEndpointModelRegistry()
             logger.debug("Created cached Custom registry instance")