WIP lots of new tests and validation scenarios

Simulation tests to confirm threading and history traversal Chain of communication and branching validation tests from live simulation Temperature enforcement per model
2025-06-12 09:35:05 +04:00
parent 2a067a7f4e
commit 9a55ca8898
17 changed files with 1507 additions and 176 deletions
--- a/tests/test_auto_mode.py
+++ b/tests/test_auto_mode.py
@@ -46,7 +46,7 @@ class TestAutoMode:
        from config import MODEL_CAPABILITIES_DESC
        
        # Check all expected models are present
-        expected_models = ["flash", "pro", "o3", "o3-mini", "gpt-4o"]
+        expected_models = ["flash", "pro", "o3", "o3-mini"]
        for model in expected_models:
            assert model in MODEL_CAPABILITIES_DESC
            assert isinstance(MODEL_CAPABILITIES_DESC[model], str)
--- a/tests/test_providers.py
+++ b/tests/test_providers.py
@@ -175,13 +175,14 @@ class TestOpenAIProvider:
        """Test model name validation"""
        provider = OpenAIModelProvider(api_key="test-key")
        
+        assert provider.validate_model_name("o3")
        assert provider.validate_model_name("o3-mini")
-        assert provider.validate_model_name("gpt-4o")
+        assert not provider.validate_model_name("gpt-4o")
        assert not provider.validate_model_name("invalid-model")
    
    def test_no_thinking_mode_support(self):
        """Test that no OpenAI models support thinking mode"""
        provider = OpenAIModelProvider(api_key="test-key")
        
-        assert not provider.supports_thinking_mode("o3-mini")
-        assert not provider.supports_thinking_mode("gpt-4o")
+        assert not provider.supports_thinking_mode("o3")
+        assert not provider.supports_thinking_mode("o3-mini")