feat: consume

labring · Jan 4, 2025 · cc30b33 · cc30b33
1 parent 40a2365
commit cc30b33
Show file tree

Hide file tree

Showing 8 changed files with 213 additions and 162 deletions.
diff --git a/service/aiproxy/common/consume/consume.go b/service/aiproxy/common/consume/consume.go
@@ -0,0 +1,162 @@
+package consume
+
+import (
+	"context"
+	"sync"
+
+	"github.com/labring/sealos/service/aiproxy/common/balance"
+	"github.com/labring/sealos/service/aiproxy/model"
+	"github.com/labring/sealos/service/aiproxy/relay/meta"
+	relaymodel "github.com/labring/sealos/service/aiproxy/relay/model"
+	"github.com/shopspring/decimal"
+	log "github.com/sirupsen/logrus"
+)
+
+var consumeWaitGroup sync.WaitGroup
+
+func Wait() {
+	consumeWaitGroup.Wait()
+}
+
+func AsyncConsume(
+	ctx context.Context,
+	postGroupConsumer balance.PostGroupConsumer,
+	code int,
+	usage *relaymodel.Usage,
+	meta *meta.Meta,
+	inputPrice,
+	outputPrice float64,
+	content string,
+	requestDetail *model.RequestDetail,
+) {
+	if meta.IsChannelTest {
+		return
+	}
+
+	consumeWaitGroup.Add(1)
+	defer func() {
+		consumeWaitGroup.Done()
+		if r := recover(); r != nil {
+			log.Errorf("panic in consume: %v", r)
+		}
+	}()
+
+	go Consume(ctx, postGroupConsumer, code, usage, meta, inputPrice, outputPrice, content, requestDetail)
+}
+
+func Consume(
+	ctx context.Context,
+	postGroupConsumer balance.PostGroupConsumer,
+	code int,
+	usage *relaymodel.Usage,
+	meta *meta.Meta,
+	inputPrice,
+	outputPrice float64,
+	content string,
+	requestDetail *model.RequestDetail,
+) {
+	if meta.IsChannelTest {
+		return
+	}
+
+	amount := calculateAmount(ctx, usage, inputPrice, outputPrice, postGroupConsumer, meta)
+
+	err := recordConsume(meta, code, usage, inputPrice, outputPrice, content, requestDetail, amount)
+	if err != nil {
+		log.Error("error batch record consume: " + err.Error())
+	}
+}
+
+func calculateAmount(
+	ctx context.Context,
+	usage *relaymodel.Usage,
+	inputPrice, outputPrice float64,
+	postGroupConsumer balance.PostGroupConsumer,
+	meta *meta.Meta,
+) float64 {
+	if usage == nil {
+		return 0
+	}
+
+	promptTokens := usage.PromptTokens
+	completionTokens := usage.CompletionTokens
+	totalTokens := promptTokens + completionTokens
+
+	if totalTokens == 0 {
+		return 0
+	}
+
+	promptAmount := decimal.NewFromInt(int64(promptTokens)).
+		Mul(decimal.NewFromFloat(inputPrice)).
+		Div(decimal.NewFromInt(model.PriceUnit))
+	completionAmount := decimal.NewFromInt(int64(completionTokens)).
+		Mul(decimal.NewFromFloat(outputPrice)).
+		Div(decimal.NewFromInt(model.PriceUnit))
+	amount := promptAmount.Add(completionAmount).InexactFloat64()
+
+	if amount > 0 {
+		return processGroupConsume(ctx, amount, postGroupConsumer, meta)
+	}
+
+	return 0
+}
+
+func processGroupConsume(
+	ctx context.Context,
+	amount float64,
+	postGroupConsumer balance.PostGroupConsumer,
+	meta *meta.Meta,
+) float64 {
+	consumedAmount, err := postGroupConsumer.PostGroupConsume(ctx, meta.Token.Name, amount)
+	if err != nil {
+		log.Error("error consuming token remain amount: " + err.Error())
+		if err := model.CreateConsumeError(
+			meta.RequestID,
+			meta.RequestAt,
+			meta.Group.ID,
+			meta.Token.Name,
+			meta.OriginModel,
+			err.Error(),
+			amount,
+			meta.Token.ID,
+		); err != nil {
+			log.Error("failed to create consume error: " + err.Error())
+		}
+		return amount
+	}
+	return consumedAmount
+}
+
+func recordConsume(meta *meta.Meta, code int, usage *relaymodel.Usage, inputPrice, outputPrice float64, content string, requestDetail *model.RequestDetail, amount float64) error {
+	promptTokens := 0
+	completionTokens := 0
+	if usage != nil {
+		promptTokens = usage.PromptTokens
+		completionTokens = usage.CompletionTokens
+	}
+
+	var channelID int
+	if meta.Channel != nil {
+		channelID = meta.Channel.ID
+	}
+
+	return model.BatchRecordConsume(
+		meta.RequestID,
+		meta.RequestAt,
+		meta.Group.ID,
+		code,
+		channelID,
+		promptTokens,
+		completionTokens,
+		meta.OriginModel,
+		meta.Token.ID,
+		meta.Token.Name,
+		amount,
+		inputPrice,
+		outputPrice,
+		meta.Endpoint,
+		content,
+		meta.Mode,
+		requestDetail,
+	)
+}
diff --git a/service/aiproxy/main.go b/service/aiproxy/main.go
@@ -18,10 +18,10 @@ import (
 	"github.com/labring/sealos/service/aiproxy/common"
 	"github.com/labring/sealos/service/aiproxy/common/balance"
 	"github.com/labring/sealos/service/aiproxy/common/config"
+	"github.com/labring/sealos/service/aiproxy/common/consume"
 	"github.com/labring/sealos/service/aiproxy/controller"
 	"github.com/labring/sealos/service/aiproxy/middleware"
 	"github.com/labring/sealos/service/aiproxy/model"
-	relaycontroller "github.com/labring/sealos/service/aiproxy/relay/controller"
 	"github.com/labring/sealos/service/aiproxy/router"
 	log "github.com/sirupsen/logrus"
 )
@@ -185,8 +185,8 @@ func main() {
 		log.Info("server shutdown successfully")
 	}
 
-	log.Info("shutting down relay consumer...")
-	relaycontroller.ConsumeWaitGroup.Wait()
+	log.Info("shutting down consumer...")
+	consume.Wait()
 
 	log.Info("shutting down sync services...")
 	wg.Wait()

diff --git a/service/aiproxy/middleware/distributor.go b/service/aiproxy/middleware/distributor.go
@@ -46,9 +46,9 @@ func getGroupRPMRatio(group *model.GroupCache) float64 {
 	return groupRPMRatio
 }
 
-func checkGroupModelRPMAndTPM(c *gin.Context, group *model.GroupCache, requestModel string, modelRPM int64, modelTPM int64) bool {
+func checkGroupModelRPMAndTPM(c *gin.Context, group *model.GroupCache, requestModel string, modelRPM int64, modelTPM int64) error {
 	if modelRPM <= 0 {
-		return true
+		return nil
 	}
 
 	groupConsumeLevelRpmRatio := calculateGroupConsumeLevelRpmRatio(group.UsedAmount)
@@ -65,28 +65,22 @@ func checkGroupModelRPMAndTPM(c *gin.Context, group *model.GroupCache, requestMo
 	)
 
 	if !ok {
-		abortWithMessage(c, http.StatusTooManyRequests,
-			group.ID+" is requesting too frequently",
-		)
-		return false
+		return fmt.Errorf("group (%s) is requesting too frequently", group.ID)
 	}
 
 	if modelTPM > 0 {
 		tpm, err := model.CacheGetGroupModelTPM(group.ID, requestModel)
 		if err != nil {
 			log.Errorf("get group model tpm (%s:%s) error: %s", group.ID, requestModel, err.Error())
 			// ignore error
-			return true
+			return nil
 		}
 
 		if tpm >= modelTPM {
-			abortWithMessage(c, http.StatusTooManyRequests,
-				group.ID+" tpm is too high",
-			)
-			return false
+			return fmt.Errorf("group (%s) tpm is too high", group.ID)
 		}
 	}
-	return true
+	return nil
 }
 
 func Distribute(c *gin.Context) {
@@ -111,6 +105,12 @@ func Distribute(c *gin.Context) {
 
 	SetLogModelFields(log.Data, requestModel)
 
+	mc, ok := GetModelCaches(c).ModelConfigMap[requestModel]
+	if !ok {
+		abortWithMessage(c, http.StatusServiceUnavailable, requestModel+" is not available")
+		return
+	}
+
 	token := GetToken(c)
 	if len(token.Models) == 0 || !slices.Contains(token.Models, requestModel) {
 		abortWithMessage(c,
@@ -122,13 +122,8 @@ func Distribute(c *gin.Context) {
 		return
 	}
 
-	mc, ok := GetModelCaches(c).ModelConfigMap[requestModel]
-	if !ok {
-		abortWithMessage(c, http.StatusServiceUnavailable, requestModel+" is not available")
-		return
-	}
-
-	if !checkGroupModelRPMAndTPM(c, group, requestModel, mc.RPM, mc.TPM) {
+	if err := checkGroupModelRPMAndTPM(c, group, requestModel, mc.RPM, mc.TPM); err != nil {
+		abortWithMessage(c, http.StatusTooManyRequests, err.Error())
 		return
 	}
 

diff --git a/service/aiproxy/model/modelconfig.go b/service/aiproxy/model/modelconfig.go
@@ -10,6 +10,11 @@ import (
 	"gorm.io/gorm"
 )
 
+const (
+	// /1K tokens
+	PriceUnit = 1000
+)
+
 //nolint:revive
 type ModelConfig struct {
 	CreatedAt         time.Time              `gorm:"index;autoCreateTime"          json:"created_at"`