feat(llm-bridge): add vllm provider (#1005)

yomorun · Feb 8, 2025 · 3d9c03d · 3d9c03d
1 parent 825dd41
commit 3d9c03d
Show file tree

Hide file tree

Showing 4 changed files with 147 additions and 0 deletions.
diff --git a/cli/serve.go b/cli/serve.go
@@ -41,6 +41,7 @@ import (
 	"github.com/yomorun/yomo/pkg/bridge/ai/provider/ollama"
 	"github.com/yomorun/yomo/pkg/bridge/ai/provider/openai"
 	"github.com/yomorun/yomo/pkg/bridge/ai/provider/vertexai"
+	"github.com/yomorun/yomo/pkg/bridge/ai/provider/vllm"
 	"github.com/yomorun/yomo/pkg/bridge/ai/provider/xai"
 )
 
@@ -185,6 +186,8 @@ func registerAIProvider(aiConfig *ai.Config) error {
 			))
 		case "deepseek":
 			providerpkg.RegisterProvider(cerebras.NewProvider(provider["api_key"], provider["model"]))
+		case "vllm":
+			providerpkg.RegisterProvider(vllm.NewProvider(provider["api_endpoint"], provider["api_key"], provider["model"]))
 		default:
 			log.WarningStatusEvent(os.Stdout, "unknown provider: %s", name)
 		}

diff --git a/example/10-ai/zipper.yaml b/example/10-ai/zipper.yaml
@@ -54,3 +54,9 @@ bridge:
         location:
         model:
         credentials_file:
+
+      vllm:
+        api_endpoint: http://127.0.0.1:8000/v1
+        api_key: 
+        model: deepseek-ai/DeepSeek-R1-Distill-Qwen-14B
+
diff --git a/pkg/bridge/ai/provider/vllm/provider.go b/pkg/bridge/ai/provider/vllm/provider.go
@@ -0,0 +1,71 @@
+// Package vllm is the vllm llm provider
+package vllm
+
+import (
+	"context"
+
+	_ "github.com/joho/godotenv/autoload"
+	"github.com/sashabaranov/go-openai"
+	"github.com/yomorun/yomo/core/metadata"
+
+	provider "github.com/yomorun/yomo/pkg/bridge/ai/provider"
+)
+
+// check if implements ai.Provider
+var _ provider.LLMProvider = &Provider{}
+
+// Provider is the provider for vllm
+type Provider struct {
+	// vllm OpenAI compatibility api endpoint
+	APIEndpoint string
+	// APIKey is the API key for vllm
+	APIKey string
+	// Model is the model for vllm
+	// eg. "meta-llama/Llama-3.2-7B-Instruct"
+	Model  string
+	client *openai.Client
+}
+
+// NewProvider creates a new vllm ai provider
+func NewProvider(apiEndpoint string, apiKey string, model string) *Provider {
+	if apiEndpoint == "" {
+		apiEndpoint = "http://127.0.0.1:8000"
+	}
+	// vllm api endpoint is different from the default openai api endpoint, so we need to append "/v1" to the endpoint
+	if model == "" {
+		model = "meta-llama/Llama-3.2-7B-Instruct"
+	}
+
+	c := openai.DefaultConfig(apiKey)
+	c.BaseURL = apiEndpoint
+
+	return &Provider{
+		APIEndpoint: apiEndpoint,
+		APIKey:      apiKey,
+		Model:       model,
+		client:      openai.NewClientWithConfig(c),
+	}
+}
+
+// Name returns the name of the provider
+func (p *Provider) Name() string {
+	return "vllm"
+}
+
+// GetChatCompletions implements ai.LLMProvider.
+func (p *Provider) GetChatCompletions(ctx context.Context, req openai.ChatCompletionRequest, _ metadata.M) (openai.ChatCompletionResponse, error) {
+	if req.Model == "" {
+		req.Model = p.Model
+	}
+
+	return p.client.CreateChatCompletion(ctx, req)
+}
+
+// GetChatCompletionsStream implements ai.LLMProvider.
+func (p *Provider) GetChatCompletionsStream(ctx context.Context, req openai.ChatCompletionRequest, _ metadata.M) (provider.ResponseRecver, error) {
+	if req.Model == "" {
+		req.Model = p.Model
+	}
+
+	return p.client.CreateChatCompletionStream(ctx, req)
+}
diff --git a/pkg/bridge/ai/provider/vllm/provider_test.go b/pkg/bridge/ai/provider/vllm/provider_test.go
@@ -0,0 +1,67 @@
+package vllm
+
+import (
+	"context"
+	"testing"
+
+	"github.com/sashabaranov/go-openai"
+	"github.com/stretchr/testify/assert"
+)
+
+func TestVLlmProvider_Name(t *testing.T) {
+	provider := &Provider{}
+	name := provider.Name()
+
+	assert.Equal(t, "vllm", name)
+}
+
+func TestVLlmProvider_GetChatCompletions(t *testing.T) {
+	provider := NewProvider("", "", "")
+	msgs := []openai.ChatCompletionMessage{
+		{
+			Role:    "user",
+			Content: "hello",
+		},
+		{
+			Role:    "system",
+			Content: "I'm a bot",
+		},
+	}
+	req := openai.ChatCompletionRequest{
+		Messages: msgs,
+		Model:    "meta-llama/Llama-3.2-7B-Instruct",
+	}
+
+	_, err := provider.GetChatCompletions(context.TODO(), req, nil)
+	assert.Error(t, err)
+	t.Log(err)
+
+	_, err = provider.GetChatCompletionsStream(context.TODO(), req, nil)
+	assert.Error(t, err)
+	t.Log(err)
+}
+
+func TestVLlmProvider_GetChatCompletionsWithoutModel(t *testing.T) {
+	provider := NewProvider("", "", "")
+	msgs := []openai.ChatCompletionMessage{
+		{
+			Role:    "user",
+			Content: "hello",
+		},
+		{
+			Role:    "system",
+			Content: "I'm a bot",
+		},
+	}
+	req := openai.ChatCompletionRequest{
+		Messages: msgs,
+	}
+
+	_, err := provider.GetChatCompletions(context.TODO(), req, nil)
+	assert.Error(t, err)
+	t.Log(err)
+
+	_, err = provider.GetChatCompletionsStream(context.TODO(), req, nil)
+	assert.Error(t, err)
+	t.Log(err)
+}