Multi-LLM Provider Support Architecture

Status: Implemented
Version: 0.21.0
Last Updated: December 2024

Overview

TerminaI supports multiple LLM providers through a pluggable architecture that allows users to choose between Gemini (default), OpenAI-compatible APIs, and future providers like Anthropic.

Architecture Diagram

flowchart TB
    subgraph CLI["CLI Layer"]
        Settings["settings.toml<br/>llm.provider config"]
        Config["Config.getProviderConfig()"]
        UI["UI Components<br/>(ModelDialog, AboutBox)"]
    end

    subgraph Core["Core Layer"]
        Factory["createContentGenerator()"]
        Capabilities["getProviderCapabilities()"]

        subgraph Generators["Content Generators"]
            Gemini["GeminiContentGenerator<br/>(GoogleGenAI SDK)"]
            OpenAI["OpenAIContentGenerator<br/>(fetch-based)"]
            CodeAssist["CodeAssistContentGenerator<br/>(OAuth flow)"]
        end
    end

    subgraph External["External APIs"]
        GeminiAPI["LLM API"]
        OpenAIAPI["OpenAI-Compatible<br/>/chat/completions"]
    end

    Settings --> Config
    Config --> Factory
    Config --> Capabilities
    Capabilities --> UI
    Factory --> Gemini
    Factory --> OpenAI
    Factory --> CodeAssist
    Gemini --> GeminiAPI
    OpenAI --> OpenAIAPI
    CodeAssist --> GeminiAPI

Provider Configuration

Settings Schema (`settings.toml`)

[llm]
provider = "gemini"  # or "openai_compatible" or "anthropic"

[llm.openaiCompatible]
baseUrl = "https://api.openai.com/v1"
model = "gpt-4o"

[llm.openaiCompatible.auth]
type = "bearer"  # or "api-key" or "none"
envVarName = "OPENAI_API_KEY"

[llm.openaiCompatible.headers]
X-Custom-Header = "value"

Provider Types (`providerTypes.ts`)

enum LlmProviderId {
  GEMINI = 'gemini',
  OPENAI_COMPATIBLE = 'openai_compatible',
  ANTHROPIC = 'anthropic',
}

interface ProviderConfig {
  provider: LlmProviderId;
}

interface OpenAICompatibleConfig extends ProviderConfig {
  provider: LlmProviderId.OPENAI_COMPATIBLE;
  baseUrl: string;
  model: string;
  auth?: {
    type: 'bearer' | 'api-key' | 'none';
    apiKey?: string;
  };
  extraHeaders?: Record<string, string>;
}

interface ProviderCapabilities {
  supportsCitations: boolean;
  supportsImages: boolean;
  supportsTools: boolean;
  supportsStreaming: boolean;
}

Provider Selection Flow

sequenceDiagram
    participant User
    participant CLI
    participant Config
    participant Factory as createContentGenerator
    participant Generator

    User->>CLI: Start with --model or settings
    CLI->>Config: loadCliConfig()
    Config->>Config: resolve providerConfig
    CLI->>Factory: createContentGenerator(config, gcConfig)

    alt provider == OPENAI_COMPATIBLE
        Factory->>Generator: new OpenAIContentGenerator()
    else authType == LOGIN_WITH_GOOGLE
        Factory->>Generator: createCodeAssistContentGenerator()
    else authType == USE_GEMINI
        Factory->>Generator: new GoogleGenAI()
    end

    Generator-->>CLI: ContentGenerator instance

Key Components

1. OpenAIContentGenerator

Location: packages/core/src/core/openaiContentGenerator.ts

Handles OpenAI-compatible API interactions:

| Method | Description | | ------------------------- | ----------------------------------------------------- | | generateContent() | Non-streaming text/tool generation | | generateContentStream() | SSE streaming with tool call accumulation | | countTokens() | Local token estimation via estimateTokenCountSync() | | convertTools() | Gemini Tool → OpenAI function schema | | convertSchemaToOpenAI() | Type.OBJECT → "object" mapping |

Key Features:

Auth modes: bearer, api-key, none
Proxy support via ProxyAgent
Multi-chunk tool call accumulation
Debug-mode-only error logging

2. Provider Capability Gating

Location: packages/core/src/core/providerCapabilities.ts

function getProviderCapabilities(provider: LlmProviderId): ProviderCapabilities {
  switch (provider) {
    case LlmProviderId.GEMINI:
      return { supportsCitations: true, supportsImages: true, ... };
    case LlmProviderId.OPENAI_COMPATIBLE:
      return { supportsCitations: false, supportsImages: false, ... };
  }
}

Used in UI to conditionally render:

Citations display (only if supportsCitations)
Preview model marketing (only for Gemini)
Image upload controls (only if supportsImages)

3. Schema Conversion

Gemini uses Type enum values (OBJECT, STRING), while OpenAI requires lowercase JSON Schema types.

// Gemini Schema
{ type: Type.OBJECT, properties: { location: { type: Type.STRING } } }

// Converted to OpenAI
{ type: "object", properties: { location: { type: "string" } } }

Recursive conversion handles nested properties, items, required, enum, and nullable.

Request/Response Translation

Gemini → OpenAI Request

| Gemini | OpenAI | | -------------------------- | ------------------------------ | | contents[].role: "model" | messages[].role: "assistant" | | contents[].role: "user" | messages[].role: "user" | | config.systemInstruction | messages[0].role: "system" | | config.tools | tools[].function |

OpenAI → Gemini Response

| OpenAI | Gemini | | ------------------------------ | ------------------------------------------- | | choices[].message.content | candidates[].content.parts[].text | | choices[].message.tool_calls | candidates[].content.parts[].functionCall | | finish_reason: "stop" | finishReason: "STOP" |

Streaming Architecture

sequenceDiagram
    participant Client
    participant Generator as OpenAIContentGenerator
    participant API as OpenAI API

    Client->>Generator: generateContentStream()
    Generator->>API: POST /chat/completions (stream: true)

    loop SSE Events
        API-->>Generator: data: {"choices":[{"delta":{"content":"Hi"}}]}
        Generator->>Generator: Parse SSE, yield GenerateContentResponse
        Generator-->>Client: { candidates: [{ content: { parts: [{ text: "Hi" }] } }] }
    end

    API-->>Generator: data: [DONE]
    Generator->>Generator: releaseLock()

Tool Call Accumulation:

Tool calls arrive in chunks (name/args split across SSE events)
pendingToolCalls buffer accumulates until finish_reason
Final yield includes assembled functionCall parts

Environment Variables

| Variable | Purpose | | -------------------------- | ------------------------------------------- | | TERMINAI_GEMINI_BASE_URL | Override LLM API base URL (validated) | | OPENAI_API_KEY | Default key for OpenAI-compatible providers | | GEMINI_API_KEY | LLM API key |

Testing Strategy

Unit Tests

| Test File | Coverage | | -------------------------------- | ------------------------------------------------------ | | openaiContentGenerator.test.ts | 15 tests covering generation, streaming, tools, errors | | contentGenerator.test.ts | 21 tests including provider selection, OAuth bypass |

Key Test Cases

OAuth Regression: LOGIN_WITH_GOOGLE ignores TERMINAI_GEMINI_BASE_URL
Schema Conversion: Gemini Type → JSON Schema lowercase
Streaming Edge Cases: Malformed chunks, abort signal, finish-only
Capability Gating: Provider determines UI features

Future Extensibility

Adding a new provider (e.g., Anthropic):

Add to LlmProviderId enum
Create AnthropicContentGenerator implementing ContentGenerator
Add case to createContentGenerator() factory
Define capabilities in getProviderCapabilities()
Add settings schema for provider-specific config

Security Considerations

API keys resolved from environment at runtime (not stored in settings)
baseUrlHost shown in About box (no full URL or credentials)
Debug logging gated behind getDebugMode()
Unsupported modalities throw clear errors (no silent failures)

Cloud Relay

Safety & Trust