默认按照模型价格和能力进行了合理映射,且支持用户自定义调整配置。
可以通过 OpenAI 的统一协议对接多种大模型,屏蔽实现细节,降低接入新大模型的 API 适配成本。
Higress 可以提供 token 限流插件、内容审核插件,通过网关的工程化能力实现业务收益。
实操视频
Aliware
步骤介绍
Aliware
🔔 准备工作:需要登录阿里云申请通义千问 API Key[1]
# 创建一个工作目录mkdir higress; cd higress# 启动 higress,配置文件会写到工作目录下docker run -d --rm --name higress-ai -v ${PWD}:/data \-p 8001:8001 -p 8080:8080 \-e CONFIG_TEMPLATE=ai-proxy -e DEFAULT_AI_SERVICE=qwen \-e DASHSCOPE_API_KEY=这里填你自己的通义千问APIKey \higress-registry.cn-hangzhou.cr.aliyuncs.com/higress/all-in-one:1.4.1
from openai import OpenAIclient = OpenAI(api_key="your-api-key",base_url="http://127.0.0.1:8080/v1")# 不需要修改模型,higress 做了等价映射stream = client.chat.completions.create(model="gpt-4o",messages=[{"role": "user", "content": "你是谁"}],stream=True,)# 换行打印收到的每个流式响应for chunk in stream:if chunk.choices[0].delta.content:print(chunk.choices[0].delta.content)
测试生效:

Higress AI 代理能力介绍
Aliware
AI 代理插件目前支持的大模型 API 有:通义千问,OpenAI/Azure OpenAI,月之暗面,百川智能,零一万物,智谱 AI,阶跃星辰,文心一言,腾讯混元,DeepSeek,Anthropic Claude,Groq,MiniMax,Ollama。
下图以 OpenAI SDK 流式处理为例, Higress 的 AI 代理原理如下,可以纯流式处理多种不同厂商的模型协议:

探索更多 Higress AI 网关能力
Aliware

provider:type: qwenapiTokens:- "你自己的通义千问 API Key"modelMapping:# 映射配置省略...# 开启联网搜索能力qwenEnableSearch: true
然后使用 LobeChat 进行测试(这里查看:LobeChat 对接方式[2]):

curl --location --request POST 'https://dashscope.aliyuncs.com/compatible-mode/v1/files' \--header 'Authorization: Bearer 这里填APIKey' \--form 'file=@" ./doc.md"' \--form 'purpose="file-extract"'# 返回内容中包含文件id:{"id":"file-fe-xxxxxxx","object":"file","bytes":596687,"created_at":1716635947,"filename":"doc.md","purpose":"file-extract","status":"processed"}
AI 代理插件配置为:
provider:type: qwenapiTokens:- "你自己的通义千问 API Key"modelMapping:# 映射配置省略...# 在这里配置上面返回的文件idqwenFileIds:- "file-fe-xxxxxxx"
导入 Higress 官网文档的文件 id,测试效果:


加入 Higress 社区
22.5万奖金池|Higress AI 网关编程挑战赛启动 GLCC 开源夏令营的 Higress 三大课题[4]
了解更多社区动态,可以加入 Higress 微信/钉钉群(群号:30735012403 )。

相关链接:
https://www.gitlink.org.cn/glcc/2024/projects
文章转载自阿里巴巴中间件,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。





