Skip to content

Commit 0f873f5

Browse files
CH3CHO2456868764
authored andcommitted
feat: Support model prefix mapping in ai-proxy (alibaba#1097)
1 parent d340de4 commit 0f873f5

File tree

2 files changed

+37
-13
lines changed

2 files changed

+37
-13
lines changed

plugins/wasm-go/extensions/ai-proxy/README.md

+9-8
Original file line numberDiff line numberDiff line change
@@ -19,14 +19,14 @@ description: AI 代理插件配置参考
1919

2020
`provider`的配置字段说明如下:
2121

22-
| 名称 | 数据类型 | 填写要求 | 默认值 | 描述 |
23-
| -------------- | --------------- | -------- | ------ | ------------------------------------------------------------ |
24-
| `type` | string | 必填 | - | AI 服务提供商名称 |
25-
| `apiTokens` | array of string | 必填 | - | 用于在访问 AI 服务时进行认证的令牌。如果配置了多个 token,插件会在请求时随机进行选择。部分服务提供商只支持配置一个 token。 |
26-
| `timeout` | number | 非必填 | - | 访问 AI 服务的超时时间。单位为毫秒。默认值为 120000,即 2 分钟 |
27-
| `modelMapping` | map of string | 非必填 | - | AI 模型映射表,用于将请求中的模型名称映射为服务提供商支持模型名称。<br/>可以使用 "*" 为键来配置通用兜底映射关系 |
28-
| `protocol` | string | 非必填 | - | 插件对外提供的 API 接口契约。目前支持以下取值:openai(默认值,使用 OpenAI 的接口契约)、original(使用目标服务提供商的原始接口契约) |
29-
| `context` | object | 非必填 | - | 配置 AI 对话上下文信息 |
22+
| 名称 | 数据类型 | 填写要求 | 默认值 | 描述 |
23+
| -------------- | --------------- | -------- | ------ |-------------------------------------------------------------------------------------------------------------------------------------------------------------|
24+
| `type` | string | 必填 | - | AI 服务提供商名称 |
25+
| `apiTokens` | array of string | 必填 | - | 用于在访问 AI 服务时进行认证的令牌。如果配置了多个 token,插件会在请求时随机进行选择。部分服务提供商只支持配置一个 token。 |
26+
| `timeout` | number | 非必填 | - | 访问 AI 服务的超时时间。单位为毫秒。默认值为 120000,即 2 分钟 |
27+
| `modelMapping` | map of string | 非必填 | - | AI 模型映射表,用于将请求中的模型名称映射为服务提供商支持模型名称。<br/>1. 支持前缀匹配。例如用 "gpt-3-*" 匹配所有名称以“gpt-3-”开头的模型;<br/>2. 支持使用 "*" 为键来配置通用兜底映射关系;<br/>3. 如果映射的目标名称为空字符串 "",则表示保留原模型名称。 |
28+
| `protocol` | string | 非必填 | - | 插件对外提供的 API 接口契约。目前支持以下取值:openai(默认值,使用 OpenAI 的接口契约)、original(使用目标服务提供商的原始接口契约) |
29+
| `context` | object | 非必填 | - | 配置 AI 对话上下文信息 |
3030

3131
`context`的配置字段说明如下:
3232

@@ -255,6 +255,7 @@ provider:
255255
'gpt-3': "qwen-turbo"
256256
'gpt-35-turbo': "qwen-plus"
257257
'gpt-4-turbo': "qwen-max"
258+
'qwen-*': ""
258259
'*': "qwen-turbo"
259260
```
260261

plugins/wasm-go/extensions/ai-proxy/provider/provider.go

+28-5
Original file line numberDiff line numberDiff line change
@@ -3,6 +3,7 @@ package provider
33
import (
44
"errors"
55
"math/rand"
6+
"strings"
67

78
"github.com/alibaba/higress/plugins/wasm-go/pkg/wrapper"
89
"github.com/higress-group/proxy-wasm-go-sdk/proxywasm/types"
@@ -253,16 +254,38 @@ func CreateProvider(pc ProviderConfig) (Provider, error) {
253254
}
254255

255256
func getMappedModel(model string, modelMapping map[string]string, log wrapper.Log) string {
257+
mappedModel := doGetMappedModel(model, modelMapping, log)
258+
if len(mappedModel) != 0 {
259+
return mappedModel
260+
}
261+
return model
262+
}
263+
264+
func doGetMappedModel(model string, modelMapping map[string]string, log wrapper.Log) string {
256265
if modelMapping == nil || len(modelMapping) == 0 {
257-
return model
266+
return ""
258267
}
259-
if v, ok := modelMapping[model]; ok && len(v) != 0 {
260-
log.Debugf("model %s is mapped to %s explictly", model, v)
268+
269+
if v, ok := modelMapping[model]; ok {
270+
log.Debugf("model [%s] is mapped to [%s] explictly", model, v)
261271
return v
262272
}
273+
274+
for k, v := range modelMapping {
275+
if k == wildcard || !strings.HasSuffix(k, wildcard) {
276+
continue
277+
}
278+
k = strings.TrimSuffix(k, wildcard)
279+
if strings.HasPrefix(model, k) {
280+
log.Debugf("model [%s] is mapped to [%s] via prefix [%s]", model, v, k)
281+
return v
282+
}
283+
}
284+
263285
if v, ok := modelMapping[wildcard]; ok {
264-
log.Debugf("model %s is mapped to %s via wildcard", model, v)
286+
log.Debugf("model [%s] is mapped to [%s] via wildcard", model, v)
265287
return v
266288
}
267-
return model
289+
290+
return ""
268291
}

0 commit comments

Comments
 (0)