Alibaba-NLP
/

gte-multilingual-base

Sentence Similarity

sentence-transformers

Safetensors

text-embeddings-inference

custom_code

Eval Results

Model card Files Files and versions Community

thenlper

alvarobartt HF Staff commited on 17 days ago

Commit

9bbca17

verified ·

1 Parent(s): 9fdd4ee

Add Text Embeddings Inference (TEI) tag & snippet (#28)

Browse files

- Add Text Embeddings Inference (TEI) tag & snippet (f48be033386d222715f74de68ba1d31b51f19f3a)

Co-authored-by: Alvaro Bartolome <[email protected]>

Files changed (1) hide show

README.md +46 -0

README.md CHANGED Viewed

@@ -5,6 +5,7 @@ tags:
 - transformers
 - multilingual
 - sentence-similarity
 license: apache-2.0
 language:
 - af
@@ -4725,6 +4726,51 @@ michaelf34/infinity:0.0.69 \
 v2 --model-id Alibaba-NLP/gte-multilingual-base --revision "main" --dtype float16 --batch-size 32 --device cuda --engine torch --port 7997
 ```
 ### Use with custom code to get dense embeddings and sparse token weights
 ```python
 # You can find the script gte_embedding.py in https://huggingface.co/Alibaba-NLP/gte-multilingual-base/blob/main/scripts/gte_embedding.py

 - transformers
 - multilingual
 - sentence-similarity
+- text-embeddings-inference
 license: apache-2.0
 language:
 - af
 v2 --model-id Alibaba-NLP/gte-multilingual-base --revision "main" --dtype float16 --batch-size 32 --device cuda --engine torch --port 7997
 ```
+### Use with Text Embeddings Inference (TEI)
+Usage via Docker and [Text Embeddings Inference (TEI)](https://github.com/huggingface/text-embeddings-inference):
+- CPU:
+```bash
+docker run --platform linux/amd64 \
+  -p 8080:80 \
+  -v $PWD/data:/data \
+  --pull always \
+  ghcr.io/huggingface/text-embeddings-inference:cpu-1.7 \
+  --model-id Alibaba-NLP/gte-multilingual-base \
+  --dtype float16
+```
+- GPU:
+```
+docker run --gpus all \
+  -p 8080:80 \
+  -v $PWD/data:/data \
+  --pull always \
+  ghcr.io/huggingface/text-embeddings-inference:1.7 \
+  --model-id Alibaba-NLP/gte-multilingual-base \
+  --dtype float16
+```
+Then you can send requests to the deployed API via the OpenAI-compatible `v1/embeddings` route (more information about the [OpenAI Embeddings API](https://platform.openai.com/docs/api-reference/embeddings)):
+```bash
+curl https://0.0.0.0:8080/v1/embeddings \
+  -H "Content-Type: application/json" \
+  -d '{
+    "input": [
+      "what is the capital of China?",
+      "how to implement quick sort in python?",
+      "北京",
+      "快排算法介绍"
+    ],
+    "model": "Alibaba-NLP/gte-multilingual-base",
+    "encoding_format": "float"
+  }'
+```
 ### Use with custom code to get dense embeddings and sparse token weights
 ```python
 # You can find the script gte_embedding.py in https://huggingface.co/Alibaba-NLP/gte-multilingual-base/blob/main/scripts/gte_embedding.py