openai_format_embedding
一个兼容 OpenAI Embeddings 接口格式的本地向量服务,基本支持所有 huggingface 能找到的嵌入模型。
功能说明
- 提供
POST /v1/embeddings接口 - 支持单条文本或文本数组输入
- 返回结构与 OpenAI Embeddings 响应格式一致
- 可通过环境变量配置模型路径、监听地址、端口和 worker 数
环境变量
可参考 .env.example。
EMBEDDING_PATH:模型目录路径,支持本地路径或 UNC 网络路径EMBEDDING_HOST:服务监听地址,默认0.0.0.0EMBEDDING_PORT:服务监听端口,默认8000EMBEDDING_WORKERS:Uvicorn worker 数,默认5
安装依赖
pip install -r requirements.txt
启动服务
# 编辑 .env 文件,配置 EMBEDDING_PATH 等参数
cp .env.example .env
# 启动服务
python main.py
调用示例
curl -X POST "http://127.0.0.1:8000/v1/embeddings" \
-H "Content-Type: application/json" \
-d '{
"model": "bge-m3",
"input": ["hello world", "你好,向量服务"]
}'
返回示例(结构示意):
{
"data": [
{
"object": "embedding",
"embedding": [0.0123, -0.0456],
"index": 0
}
],
"model": "bge-m3",
"object": "list",
"usage": {
"prompt_tokens": 2,
"total_tokens": 4
}
}
说明
prompt_tokens当前实现按空格分词统计total_tokens使用cl100k_base编码统计
Description
Languages
Python
100%