Use the new Gemini 2.5 Flash

Updated to support Thinking Tokens as a ratio of the max allowed Updated tests Updated README
2025-06-12 20:46:54 +04:00
parent b34c63d710
commit 3aedb16101
27 changed files with 135 additions and 98 deletions
--- a/tests/conftest.py
+++ b/tests/conftest.py
@@ -24,7 +24,7 @@ if "OPENAI_API_KEY" not in os.environ:

 # Set default model to a specific value for tests to avoid auto mode
 # This prevents all tests from failing due to missing model parameter
-os.environ["DEFAULT_MODEL"] = "gemini-2.0-flash"
+os.environ["DEFAULT_MODEL"] = "gemini-2.5-flash-preview-05-20"

 # Force reload of config module to pick up the env var
 import config  # noqa: E402
--- a/tests/mock_helpers.py
+++ b/tests/mock_helpers.py
@@ -5,7 +5,7 @@ from unittest.mock import Mock
 from providers.base import ModelCapabilities, ProviderType, RangeTemperatureConstraint


-def create_mock_provider(model_name="gemini-2.0-flash", max_tokens=1_048_576):
+def create_mock_provider(model_name="gemini-2.5-flash-preview-05-20", max_tokens=1_048_576):
    """Create a properly configured mock provider."""
    mock_provider = Mock()

--- a/tests/test_claude_continuation.py
+++ b/tests/test_claude_continuation.py
@@ -72,7 +72,7 @@ class TestClaudeContinuationOffers:
            mock_provider.generate_content.return_value = Mock(
                content="Analysis complete.",
                usage={"input_tokens": 10, "output_tokens": 20, "total_tokens": 30},
-                model_name="gemini-2.0-flash",
+                model_name="gemini-2.5-flash-preview-05-20",
                metadata={"finish_reason": "STOP"},
            )
            mock_get_provider.return_value = mock_provider
@@ -129,7 +129,7 @@ class TestClaudeContinuationOffers:
            mock_provider.generate_content.return_value = Mock(
                content="Continued analysis.",
                usage={"input_tokens": 10, "output_tokens": 20, "total_tokens": 30},
-                model_name="gemini-2.0-flash",
+                model_name="gemini-2.5-flash-preview-05-20",
                metadata={"finish_reason": "STOP"},
            )
            mock_get_provider.return_value = mock_provider
@@ -162,7 +162,7 @@ class TestClaudeContinuationOffers:
            mock_provider.generate_content.return_value = Mock(
                content="Analysis complete. The code looks good.",
                usage={"input_tokens": 10, "output_tokens": 20, "total_tokens": 30},
-                model_name="gemini-2.0-flash",
+                model_name="gemini-2.5-flash-preview-05-20",
                metadata={"finish_reason": "STOP"},
            )
            mock_get_provider.return_value = mock_provider
@@ -208,7 +208,7 @@ I'd be happy to examine the error handling patterns in more detail if that would
            mock_provider.generate_content.return_value = Mock(
                content=content_with_followup,
                usage={"input_tokens": 10, "output_tokens": 20, "total_tokens": 30},
-                model_name="gemini-2.0-flash",
+                model_name="gemini-2.5-flash-preview-05-20",
                metadata={"finish_reason": "STOP"},
            )
            mock_get_provider.return_value = mock_provider
@@ -253,7 +253,7 @@ I'd be happy to examine the error handling patterns in more detail if that would
            mock_provider.generate_content.return_value = Mock(
                content="Continued analysis complete.",
                usage={"input_tokens": 10, "output_tokens": 20, "total_tokens": 30},
-                model_name="gemini-2.0-flash",
+                model_name="gemini-2.5-flash-preview-05-20",
                metadata={"finish_reason": "STOP"},
            )
            mock_get_provider.return_value = mock_provider
@@ -309,7 +309,7 @@ I'd be happy to examine the error handling patterns in more detail if that would
            mock_provider.generate_content.return_value = Mock(
                content="Final response.",
                usage={"input_tokens": 10, "output_tokens": 20, "total_tokens": 30},
-                model_name="gemini-2.0-flash",
+                model_name="gemini-2.5-flash-preview-05-20",
                metadata={"finish_reason": "STOP"},
            )
            mock_get_provider.return_value = mock_provider
@@ -358,7 +358,7 @@ class TestContinuationIntegration:
            mock_provider.generate_content.return_value = Mock(
                content="Analysis result",
                usage={"input_tokens": 10, "output_tokens": 20, "total_tokens": 30},
-                model_name="gemini-2.0-flash",
+                model_name="gemini-2.5-flash-preview-05-20",
                metadata={"finish_reason": "STOP"},
            )
            mock_get_provider.return_value = mock_provider
@@ -411,7 +411,7 @@ class TestContinuationIntegration:
            mock_provider.generate_content.return_value = Mock(
                content="Structure analysis done.",
                usage={"input_tokens": 10, "output_tokens": 20, "total_tokens": 30},
-                model_name="gemini-2.0-flash",
+                model_name="gemini-2.5-flash-preview-05-20",
                metadata={"finish_reason": "STOP"},
            )
            mock_get_provider.return_value = mock_provider
@@ -448,7 +448,7 @@ class TestContinuationIntegration:
            mock_provider.generate_content.return_value = Mock(
                content="Performance analysis done.",
                usage={"input_tokens": 10, "output_tokens": 20, "total_tokens": 30},
-                model_name="gemini-2.0-flash",
+                model_name="gemini-2.5-flash-preview-05-20",
                metadata={"finish_reason": "STOP"},
            )

--- a/tests/test_collaboration.py
+++ b/tests/test_collaboration.py
@@ -41,7 +41,7 @@ class TestDynamicContextRequests:
        mock_provider.get_provider_type.return_value = Mock(value="google")
        mock_provider.supports_thinking_mode.return_value = False
        mock_provider.generate_content.return_value = Mock(
-            content=clarification_json, usage={}, model_name="gemini-2.0-flash", metadata={}
+            content=clarification_json, usage={}, model_name="gemini-2.5-flash-preview-05-20", metadata={}
        )
        mock_get_provider.return_value = mock_provider

@@ -82,7 +82,7 @@ class TestDynamicContextRequests:
        mock_provider.get_provider_type.return_value = Mock(value="google")
        mock_provider.supports_thinking_mode.return_value = False
        mock_provider.generate_content.return_value = Mock(
-            content=normal_response, usage={}, model_name="gemini-2.0-flash", metadata={}
+            content=normal_response, usage={}, model_name="gemini-2.5-flash-preview-05-20", metadata={}
        )
        mock_get_provider.return_value = mock_provider

@@ -106,7 +106,7 @@ class TestDynamicContextRequests:
        mock_provider.get_provider_type.return_value = Mock(value="google")
        mock_provider.supports_thinking_mode.return_value = False
        mock_provider.generate_content.return_value = Mock(
-            content=malformed_json, usage={}, model_name="gemini-2.0-flash", metadata={}
+            content=malformed_json, usage={}, model_name="gemini-2.5-flash-preview-05-20", metadata={}
        )
        mock_get_provider.return_value = mock_provider

@@ -146,7 +146,7 @@ class TestDynamicContextRequests:
        mock_provider.get_provider_type.return_value = Mock(value="google")
        mock_provider.supports_thinking_mode.return_value = False
        mock_provider.generate_content.return_value = Mock(
-            content=clarification_json, usage={}, model_name="gemini-2.0-flash", metadata={}
+            content=clarification_json, usage={}, model_name="gemini-2.5-flash-preview-05-20", metadata={}
        )
        mock_get_provider.return_value = mock_provider

@@ -233,7 +233,7 @@ class TestCollaborationWorkflow:
        mock_provider.get_provider_type.return_value = Mock(value="google")
        mock_provider.supports_thinking_mode.return_value = False
        mock_provider.generate_content.return_value = Mock(
-            content=clarification_json, usage={}, model_name="gemini-2.0-flash", metadata={}
+            content=clarification_json, usage={}, model_name="gemini-2.5-flash-preview-05-20", metadata={}
        )
        mock_get_provider.return_value = mock_provider

@@ -272,7 +272,7 @@ class TestCollaborationWorkflow:
        mock_provider.get_provider_type.return_value = Mock(value="google")
        mock_provider.supports_thinking_mode.return_value = False
        mock_provider.generate_content.return_value = Mock(
-            content=clarification_json, usage={}, model_name="gemini-2.0-flash", metadata={}
+            content=clarification_json, usage={}, model_name="gemini-2.5-flash-preview-05-20", metadata={}
        )
        mock_get_provider.return_value = mock_provider

@@ -299,7 +299,7 @@ class TestCollaborationWorkflow:
        """

        mock_provider.generate_content.return_value = Mock(
-            content=final_response, usage={}, model_name="gemini-2.0-flash", metadata={}
+            content=final_response, usage={}, model_name="gemini-2.5-flash-preview-05-20", metadata={}
        )

        result2 = await tool.execute(
--- a/tests/test_config.py
+++ b/tests/test_config.py
@@ -32,7 +32,7 @@ class TestConfig:
    def test_model_config(self):
        """Test model configuration"""
        # DEFAULT_MODEL is set in conftest.py for tests
-        assert DEFAULT_MODEL == "gemini-2.0-flash"
+        assert DEFAULT_MODEL == "gemini-2.5-flash-preview-05-20"
        assert MAX_CONTEXT_TOKENS == 1_000_000

    def test_temperature_defaults(self):
--- a/tests/test_conversation_field_mapping.py
+++ b/tests/test_conversation_field_mapping.py
@@ -75,7 +75,7 @@ async def test_conversation_history_field_mapping():
                        mock_provider = MagicMock()
                        mock_provider.get_capabilities.return_value = ModelCapabilities(
                            provider=ProviderType.GOOGLE,
-                            model_name="gemini-2.0-flash",
+                            model_name="gemini-2.5-flash-preview-05-20",
                            friendly_name="Gemini",
                            max_tokens=200000,
                            supports_extended_thinking=True,
--- a/tests/test_conversation_history_bug.py
+++ b/tests/test_conversation_history_bug.py
@@ -95,7 +95,7 @@ class TestConversationHistoryBugFix:
                return Mock(
                    content="Response with conversation context",
                    usage={"input_tokens": 10, "output_tokens": 20, "total_tokens": 30},
-                    model_name="gemini-2.0-flash",
+                    model_name="gemini-2.5-flash-preview-05-20",
                    metadata={"finish_reason": "STOP"},
                )

@@ -155,7 +155,7 @@ class TestConversationHistoryBugFix:
                return Mock(
                    content="Response without history",
                    usage={"input_tokens": 10, "output_tokens": 20, "total_tokens": 30},
-                    model_name="gemini-2.0-flash",
+                    model_name="gemini-2.5-flash-preview-05-20",
                    metadata={"finish_reason": "STOP"},
                )

@@ -193,7 +193,7 @@ class TestConversationHistoryBugFix:
                return Mock(
                    content="New conversation response",
                    usage={"input_tokens": 10, "output_tokens": 20, "total_tokens": 30},
-                    model_name="gemini-2.0-flash",
+                    model_name="gemini-2.5-flash-preview-05-20",
                    metadata={"finish_reason": "STOP"},
                )

@@ -277,7 +277,7 @@ class TestConversationHistoryBugFix:
                return Mock(
                    content="Analysis of new files complete",
                    usage={"input_tokens": 10, "output_tokens": 20, "total_tokens": 30},
-                    model_name="gemini-2.0-flash",
+                    model_name="gemini-2.5-flash-preview-05-20",
                    metadata={"finish_reason": "STOP"},
                )

--- a/tests/test_cross_tool_continuation.py
+++ b/tests/test_cross_tool_continuation.py
@@ -112,7 +112,7 @@ I'd be happy to review these security findings in detail if that would be helpfu
            mock_provider.generate_content.return_value = Mock(
                content=content,
                usage={"input_tokens": 10, "output_tokens": 20, "total_tokens": 30},
-                model_name="gemini-2.0-flash",
+                model_name="gemini-2.5-flash-preview-05-20",
                metadata={"finish_reason": "STOP"},
            )
            mock_get_provider.return_value = mock_provider
@@ -159,7 +159,7 @@ I'd be happy to review these security findings in detail if that would be helpfu
            mock_provider.generate_content.return_value = Mock(
                content="Critical security vulnerability confirmed. The authentication function always returns true, bypassing all security checks.",
                usage={"input_tokens": 10, "output_tokens": 20, "total_tokens": 30},
-                model_name="gemini-2.0-flash",
+                model_name="gemini-2.5-flash-preview-05-20",
                metadata={"finish_reason": "STOP"},
            )
            mock_get_provider.return_value = mock_provider
@@ -284,7 +284,7 @@ I'd be happy to review these security findings in detail if that would be helpfu
            mock_provider.generate_content.return_value = Mock(
                content="Security review of auth.py shows vulnerabilities",
                usage={"input_tokens": 10, "output_tokens": 20, "total_tokens": 30},
-                model_name="gemini-2.0-flash",
+                model_name="gemini-2.5-flash-preview-05-20",
                metadata={"finish_reason": "STOP"},
            )
            mock_get_provider.return_value = mock_provider
--- a/tests/test_intelligent_fallback.py
+++ b/tests/test_intelligent_fallback.py
@@ -33,10 +33,10 @@ class TestIntelligentFallback:

    @patch.dict(os.environ, {"OPENAI_API_KEY": "", "GEMINI_API_KEY": "test-gemini-key"}, clear=False)
    def test_prefers_gemini_flash_when_openai_unavailable(self):
-        """Test that gemini-2.0-flash is used when only Gemini API key is available"""
+        """Test that gemini-2.5-flash-preview-05-20 is used when only Gemini API key is available"""
        ModelProviderRegistry.clear_cache()
        fallback_model = ModelProviderRegistry.get_preferred_fallback_model()
-        assert fallback_model == "gemini-2.0-flash"
+        assert fallback_model == "gemini-2.5-flash-preview-05-20"

    @patch.dict(os.environ, {"OPENAI_API_KEY": "sk-test-key", "GEMINI_API_KEY": "test-gemini-key"}, clear=False)
    def test_prefers_openai_when_both_available(self):
@@ -50,7 +50,7 @@ class TestIntelligentFallback:
        """Test fallback behavior when no API keys are available"""
        ModelProviderRegistry.clear_cache()
        fallback_model = ModelProviderRegistry.get_preferred_fallback_model()
-        assert fallback_model == "gemini-2.0-flash"  # Default fallback
+        assert fallback_model == "gemini-2.5-flash-preview-05-20"  # Default fallback

    def test_available_providers_with_keys(self):
        """Test the get_available_providers_with_keys method"""
@@ -140,8 +140,8 @@ class TestIntelligentFallback:

                history, tokens = build_conversation_history(context, model_context=None)

-                # Should use gemini-2.0-flash when only Gemini is available
-                mock_context_class.assert_called_once_with("gemini-2.0-flash")
+                # Should use gemini-2.5-flash-preview-05-20 when only Gemini is available
+                mock_context_class.assert_called_once_with("gemini-2.5-flash-preview-05-20")

    def test_non_auto_mode_unchanged(self):
        """Test that non-auto mode behavior is unchanged"""
--- a/tests/test_large_prompt_handling.py
+++ b/tests/test_large_prompt_handling.py
@@ -75,7 +75,7 @@ class TestLargePromptHandling:
            mock_provider.generate_content.return_value = MagicMock(
                content="This is a test response",
                usage={"input_tokens": 10, "output_tokens": 20, "total_tokens": 30},
-                model_name="gemini-2.0-flash",
+                model_name="gemini-2.5-flash-preview-05-20",
                metadata={"finish_reason": "STOP"},
            )
            mock_get_provider.return_value = mock_provider
@@ -100,7 +100,7 @@ class TestLargePromptHandling:
            mock_provider.generate_content.return_value = MagicMock(
                content="Processed large prompt",
                usage={"input_tokens": 10, "output_tokens": 20, "total_tokens": 30},
-                model_name="gemini-2.0-flash",
+                model_name="gemini-2.5-flash-preview-05-20",
                metadata={"finish_reason": "STOP"},
            )
            mock_get_provider.return_value = mock_provider
@@ -212,7 +212,7 @@ class TestLargePromptHandling:
            mock_provider.generate_content.return_value = MagicMock(
                content="Success",
                usage={"input_tokens": 10, "output_tokens": 20, "total_tokens": 30},
-                model_name="gemini-2.0-flash",
+                model_name="gemini-2.5-flash-preview-05-20",
                metadata={"finish_reason": "STOP"},
            )
            mock_get_provider.return_value = mock_provider
@@ -245,7 +245,7 @@ class TestLargePromptHandling:
            mock_provider.generate_content.return_value = MagicMock(
                content="Success",
                usage={"input_tokens": 10, "output_tokens": 20, "total_tokens": 30},
-                model_name="gemini-2.0-flash",
+                model_name="gemini-2.5-flash-preview-05-20",
                metadata={"finish_reason": "STOP"},
            )
            mock_get_provider.return_value = mock_provider
@@ -276,7 +276,7 @@ class TestLargePromptHandling:
            mock_provider.generate_content.return_value = MagicMock(
                content="Success",
                usage={"input_tokens": 10, "output_tokens": 20, "total_tokens": 30},
-                model_name="gemini-2.0-flash",
+                model_name="gemini-2.5-flash-preview-05-20",
                metadata={"finish_reason": "STOP"},
            )
            mock_get_provider.return_value = mock_provider
@@ -298,7 +298,7 @@ class TestLargePromptHandling:
            mock_provider.generate_content.return_value = MagicMock(
                content="Success",
                usage={"input_tokens": 10, "output_tokens": 20, "total_tokens": 30},
-                model_name="gemini-2.0-flash",
+                model_name="gemini-2.5-flash-preview-05-20",
                metadata={"finish_reason": "STOP"},
            )
            mock_get_provider.return_value = mock_provider
--- a/tests/test_prompt_regression.py
+++ b/tests/test_prompt_regression.py
@@ -31,7 +31,7 @@ class TestPromptRegression:
            return Mock(
                content=text,
                usage={"input_tokens": 10, "output_tokens": 20, "total_tokens": 30},
-                model_name="gemini-2.0-flash",
+                model_name="gemini-2.5-flash-preview-05-20",
                metadata={"finish_reason": "STOP"},
            )

--- a/tests/test_providers.py
+++ b/tests/test_providers.py
@@ -49,7 +49,7 @@ class TestModelProviderRegistry:
        """Test getting provider for a specific model"""
        ModelProviderRegistry.register_provider(ProviderType.GOOGLE, GeminiModelProvider)

-        provider = ModelProviderRegistry.get_provider_for_model("gemini-2.0-flash")
+        provider = ModelProviderRegistry.get_provider_for_model("gemini-2.5-flash-preview-05-20")

        assert provider is not None
        assert isinstance(provider, GeminiModelProvider)
@@ -80,10 +80,10 @@ class TestGeminiProvider:
        """Test getting model capabilities"""
        provider = GeminiModelProvider(api_key="test-key")

-        capabilities = provider.get_capabilities("gemini-2.0-flash")
+        capabilities = provider.get_capabilities("gemini-2.5-flash-preview-05-20")

        assert capabilities.provider == ProviderType.GOOGLE
-        assert capabilities.model_name == "gemini-2.0-flash"
+        assert capabilities.model_name == "gemini-2.5-flash-preview-05-20"
        assert capabilities.max_tokens == 1_048_576
        assert not capabilities.supports_extended_thinking

@@ -103,13 +103,13 @@ class TestGeminiProvider:
        assert provider.validate_model_name("pro")

        capabilities = provider.get_capabilities("flash")
-        assert capabilities.model_name == "gemini-2.0-flash"
+        assert capabilities.model_name == "gemini-2.5-flash-preview-05-20"

    def test_supports_thinking_mode(self):
        """Test thinking mode support detection"""
        provider = GeminiModelProvider(api_key="test-key")

-        assert not provider.supports_thinking_mode("gemini-2.0-flash")
+        assert provider.supports_thinking_mode("gemini-2.5-flash-preview-05-20")
        assert provider.supports_thinking_mode("gemini-2.5-pro-preview-06-05")

    @patch("google.genai.Client")
@@ -133,11 +133,13 @@ class TestGeminiProvider:

        provider = GeminiModelProvider(api_key="test-key")

-        response = provider.generate_content(prompt="Test prompt", model_name="gemini-2.0-flash", temperature=0.7)
+        response = provider.generate_content(
+            prompt="Test prompt", model_name="gemini-2.5-flash-preview-05-20", temperature=0.7
+        )

        assert isinstance(response, ModelResponse)
        assert response.content == "Generated content"
-        assert response.model_name == "gemini-2.0-flash"
+        assert response.model_name == "gemini-2.5-flash-preview-05-20"
        assert response.provider == ProviderType.GOOGLE
        assert response.usage["input_tokens"] == 10
        assert response.usage["output_tokens"] == 20
--- a/tests/test_server.py
+++ b/tests/test_server.py
@@ -56,7 +56,7 @@ class TestServerTools:
        mock_provider.get_provider_type.return_value = Mock(value="google")
        mock_provider.supports_thinking_mode.return_value = False
        mock_provider.generate_content.return_value = Mock(
-            content="Chat response", usage={}, model_name="gemini-2.0-flash", metadata={}
+            content="Chat response", usage={}, model_name="gemini-2.5-flash-preview-05-20", metadata={}
        )
        mock_get_provider.return_value = mock_provider

--- a/tests/test_thinking_modes.py
+++ b/tests/test_thinking_modes.py
@@ -45,7 +45,7 @@ class TestThinkingModes:
        mock_provider.get_provider_type.return_value = Mock(value="google")
        mock_provider.supports_thinking_mode.return_value = True
        mock_provider.generate_content.return_value = Mock(
-            content="Minimal thinking response", usage={}, model_name="gemini-2.0-flash", metadata={}
+            content="Minimal thinking response", usage={}, model_name="gemini-2.5-flash-preview-05-20", metadata={}
        )
        mock_get_provider.return_value = mock_provider

@@ -82,7 +82,7 @@ class TestThinkingModes:
        mock_provider.get_provider_type.return_value = Mock(value="google")
        mock_provider.supports_thinking_mode.return_value = True
        mock_provider.generate_content.return_value = Mock(
-            content="Low thinking response", usage={}, model_name="gemini-2.0-flash", metadata={}
+            content="Low thinking response", usage={}, model_name="gemini-2.5-flash-preview-05-20", metadata={}
        )
        mock_get_provider.return_value = mock_provider

@@ -114,7 +114,7 @@ class TestThinkingModes:
        mock_provider.get_provider_type.return_value = Mock(value="google")
        mock_provider.supports_thinking_mode.return_value = True
        mock_provider.generate_content.return_value = Mock(
-            content="Medium thinking response", usage={}, model_name="gemini-2.0-flash", metadata={}
+            content="Medium thinking response", usage={}, model_name="gemini-2.5-flash-preview-05-20", metadata={}
        )
        mock_get_provider.return_value = mock_provider

@@ -145,7 +145,7 @@ class TestThinkingModes:
        mock_provider.get_provider_type.return_value = Mock(value="google")
        mock_provider.supports_thinking_mode.return_value = True
        mock_provider.generate_content.return_value = Mock(
-            content="High thinking response", usage={}, model_name="gemini-2.0-flash", metadata={}
+            content="High thinking response", usage={}, model_name="gemini-2.5-flash-preview-05-20", metadata={}
        )
        mock_get_provider.return_value = mock_provider

@@ -175,7 +175,7 @@ class TestThinkingModes:
        mock_provider.get_provider_type.return_value = Mock(value="google")
        mock_provider.supports_thinking_mode.return_value = True
        mock_provider.generate_content.return_value = Mock(
-            content="Max thinking response", usage={}, model_name="gemini-2.0-flash", metadata={}
+            content="Max thinking response", usage={}, model_name="gemini-2.5-flash-preview-05-20", metadata={}
        )
        mock_get_provider.return_value = mock_provider

@@ -222,18 +222,22 @@ class TestThinkingModes:
            async def prepare_prompt(self, request):
                return "test"

-        # Expected mappings
+        # Test dynamic budget calculation for Flash 2.5
+        from providers.gemini import GeminiModelProvider
+
+        provider = GeminiModelProvider(api_key="test-key")
+        flash_model = "gemini-2.5-flash-preview-05-20"
+        flash_max_tokens = 24576
+
        expected_budgets = {
-            "minimal": 128,
-            "low": 2048,
-            "medium": 8192,
-            "high": 16384,
-            "max": 32768,
+            "minimal": int(flash_max_tokens * 0.005),  # 123
+            "low": int(flash_max_tokens * 0.08),  # 1966
+            "medium": int(flash_max_tokens * 0.33),  # 8110
+            "high": int(flash_max_tokens * 0.67),  # 16465
+            "max": int(flash_max_tokens * 1.0),  # 24576
        }

-        # Check each mode in create_model
-        for _mode, _expected_budget in expected_budgets.items():
-            # The budget mapping is inside create_model
-            # We can't easily test it without calling the method
-            # But we've verified the values are correct in the code
-            pass
+        # Check each mode using the helper method
+        for mode, expected_budget in expected_budgets.items():
+            actual_budget = provider.get_thinking_budget(flash_model, mode)
+            assert actual_budget == expected_budget, f"Mode {mode}: expected {expected_budget}, got {actual_budget}"
--- a/tests/test_tools.py
+++ b/tests/test_tools.py
@@ -37,7 +37,7 @@ class TestThinkDeepTool:
        mock_provider.get_provider_type.return_value = Mock(value="google")
        mock_provider.supports_thinking_mode.return_value = True
        mock_provider.generate_content.return_value = Mock(
-            content="Extended analysis", usage={}, model_name="gemini-2.0-flash", metadata={}
+            content="Extended analysis", usage={}, model_name="gemini-2.5-flash-preview-05-20", metadata={}
        )
        mock_get_provider.return_value = mock_provider

@@ -88,7 +88,7 @@ class TestCodeReviewTool:
        mock_provider.get_provider_type.return_value = Mock(value="google")
        mock_provider.supports_thinking_mode.return_value = False
        mock_provider.generate_content.return_value = Mock(
-            content="Security issues found", usage={}, model_name="gemini-2.0-flash", metadata={}
+            content="Security issues found", usage={}, model_name="gemini-2.5-flash-preview-05-20", metadata={}
        )
        mock_get_provider.return_value = mock_provider

@@ -133,7 +133,7 @@ class TestDebugIssueTool:
        mock_provider.get_provider_type.return_value = Mock(value="google")
        mock_provider.supports_thinking_mode.return_value = False
        mock_provider.generate_content.return_value = Mock(
-            content="Root cause: race condition", usage={}, model_name="gemini-2.0-flash", metadata={}
+            content="Root cause: race condition", usage={}, model_name="gemini-2.5-flash-preview-05-20", metadata={}
        )
        mock_get_provider.return_value = mock_provider

@@ -181,7 +181,7 @@ class TestAnalyzeTool:
        mock_provider.get_provider_type.return_value = Mock(value="google")
        mock_provider.supports_thinking_mode.return_value = False
        mock_provider.generate_content.return_value = Mock(
-            content="Architecture analysis", usage={}, model_name="gemini-2.0-flash", metadata={}
+            content="Architecture analysis", usage={}, model_name="gemini-2.5-flash-preview-05-20", metadata={}
        )
        mock_get_provider.return_value = mock_provider

@@ -295,7 +295,7 @@ class TestAbsolutePathValidation:
        mock_provider.get_provider_type.return_value = Mock(value="google")
        mock_provider.supports_thinking_mode.return_value = False
        mock_provider.generate_content.return_value = Mock(
-            content="Analysis complete", usage={}, model_name="gemini-2.0-flash", metadata={}
+            content="Analysis complete", usage={}, model_name="gemini-2.5-flash-preview-05-20", metadata={}
        )
        mock_get_provider.return_value = mock_provider