33
33
7 . 全球唯一扩展了** openai** 库,实现Reranker模型(rerank, /v1/rerank)。(代码样例见gpt_server/tests/test_openai_rerank.py)
34
34
8 . 全球唯一支持了** openai** 库的文本审核模型接口(text-moderation, /v1/moderations)。(代码样例见gpt_server/tests/test_openai_moderation.py)
35
35
9 . 全球唯一支持了** openai** 库的TTS模型接口(tts, /v1/audio/speech),自带edge-tts(免费的TTS)(代码样例见gpt_server/tests/test_openai_tts.py)
36
- 10 . 支持多模态大模型
37
- 11 . 与FastChat相同的分布式架构
36
+ 10 . 全球唯一支持了** openai** 库的ASR模型接口(asr, /v1/audio/transcriptions),基于fanasr后端(代码样例见gpt_server/tests/test_openai_transcriptions.py)
37
+ 11 . 支持多模态大模型
38
+ 12 . 与FastChat相同的分布式架构
39
+ ## 配置文档
40
+ 通过这个样例文件,可以很快的掌握项目的配置方式。
41
+ <br >
42
+ ** 配置文件的详细说明信息位于:[ config_example.yaml] ( https://github.com/shell-nlp/gpt_server/blob/main/gpt_server/script/config_example.yaml " 配置文件 ") **
38
43
39
44
## 更新信息
40
45
41
46
``` plaintext
47
+ 2025-4-2 支持了 OpenAI的ASR接口 /v1/audio/transcriptions
48
+ 2025-4-1 支持了 internvl2.5模型
42
49
2025-2-9 支持了 QVQ
43
50
2024-12-22 支持了 tts, /v1/audio/speech TTS模型
44
51
2024-12-21 支持了 text-moderation, /v1/moderations 文本审核模型
@@ -209,19 +216,19 @@ Chat UI界面:
209
216
| Deepseek | deepseek | √ | √ | √ | √ |
210
217
| Llama-3 | llama | √ | √ | √ | √ |
211
218
| Baichuan-2 | baichuan | √ | √ | √ | √ |
212
- | QWQ-32B | qwen | √ | √ | √ | √ |
219
+ | QWQ-32B | qwen | √ | √ | √ | √ |
213
220
| Phi-4 | phi | √ | √ | × | × |
214
221
### ** VLM** (视觉大模型榜单 https://rank.opencompass.org.cn/leaderboard-multimodal)
215
222
216
223
| Models / BackEnd | model_type | HF | vllm | LMDeploy TurboMind | LMDeploy PyTorch |
217
224
| :--------------: | :--------: | :---: | :---: | :----------------: | :--------------: |
218
225
| glm-4v-9b | chatglm | × | × | × | √ |
219
- | InternVL2 | internvl | × | × | √ | √ |
220
- | InternVL2.5 | internvl | × | × | √ | √ |
226
+ | InternVL2 | internvl | × | × | √ | √ |
227
+ | InternVL2.5 | internvl | × | × | √ | √ |
221
228
| MiniCPM-V-2_6 | minicpmv | × | √ | √ | × |
222
229
| Qwen2-VL | qwen | × | √ | × | √ |
223
- | Qwen2.5-VL | qwen | × | × | × | √ |
224
- | QVQ | qwen | × | √ | × | × |
230
+ | Qwen2.5-VL | qwen | × | × | × | √ |
231
+ | QVQ | qwen | × | √ | × | × |
225
232
<br >
226
233
227
234
### Embedding/Rerank/Classify模型
@@ -232,24 +239,41 @@ Chat UI界面:
232
239
233
240
以下模型经过测试可放心使用:
234
241
235
- | Embedding/Rerank/Classify | HF | Infinity |
236
- | --------------------------------------------- | --- | -------- |
237
- | bge-reranker | √ | √ |
238
- | bce-reranker | √ | √ |
239
- | bge-embedding | √ | √ |
240
- | bce-embedding | √ | √ |
241
- | puff | √ | √ |
242
- | piccolo-base-zh-embedding | √ | √ |
243
- | acge_text_embedding | √ | √ |
244
- | Yinka | √ | √ |
245
- | zpoint_large_embedding_zh | √ | √ |
246
- | xiaobu-embedding | √ | √ |
247
- | Conan-embedding-v1 | √ | √ |
248
- | KoalaAI/Text-Moderation(文本审核/多分类,审核文本是否存在暴力、色情等) | × | √ |
242
+ | Embedding/Rerank/Classify | HF | Infinity |
243
+ | ----------------------------------------------------------------------------------- | --- | -------- |
244
+ | bge-reranker | √ | √ |
245
+ | bce-reranker | √ | √ |
246
+ | bge-embedding | √ | √ |
247
+ | bce-embedding | √ | √ |
248
+ | puff | √ | √ |
249
+ | piccolo-base-zh-embedding | √ | √ |
250
+ | acge_text_embedding | √ | √ |
251
+ | Yinka | √ | √ |
252
+ | zpoint_large_embedding_zh | √ | √ |
253
+ | xiaobu-embedding | √ | √ |
254
+ | Conan-embedding-v1 | √ | √ |
255
+ | KoalaAI/Text-Moderation(文本审核/多分类,审核文本是否存在暴力、色情等) | × | √ |
249
256
| protectai/deberta-v3-base-prompt-injection-v2(提示注入/2分类,审核文本为提示注入) | × | √ |
250
257
251
258
目前 TencentBAC的 ** Conan-embedding-v1** C-MTEB榜单排行第一(MTEB: https://huggingface.co/spaces/mteb/leaderboard )
252
259
260
+ <br >
261
+
262
+ ### ** ASR** (支持FunASR非实时模型 https://github.com/modelscope/FunASR/blob/main/README_zh.md)
263
+ 目前只测试了SenseVoiceSmall模型(性能最优的),其它模型的支持情况只是从官方文档中拷贝过来,不一定可以正常使用,欢迎测试/提issue。
264
+
265
+ | Models / BackEnd | model_type |
266
+ | :--------------------: | :--------: |
267
+ | SenseVoiceSmall | funasr |
268
+ | paraformer-zh | funasr |
269
+ | paraformer-en | funasr |
270
+ | conformer-en | funasr |
271
+ | Whisper-large-v3 | funasr |
272
+ | Whisper-large-v3-turbo | funasr |
273
+ | Qwen-Audio | funasr |
274
+ | Qwen-Audio-Chat | funasr |
275
+
276
+ <br >
253
277
254
278
## 架构
255
279
0 commit comments