hotchpotch's picture
Update README.md
e62794c verified
---
license: mit
language:
- ja
base_model:
- tohoku-nlp/bert-base-japanese-v3
---
[japanese-splade-base-v1](https://huggingface.co/hotchpotch/japanese-splade-base-v1)を [huggingface/text-embeddings-inference](https://github.com/huggingface/text-embeddings-inference)で動かすための fork です。
なぜか safetensor では動かないので、pytorch_model.bin に変換したモデルの重みを入れています。
なお、[text-embeddings-inference で日本語トークナイザーモデルの推論をする](https://secon.dev/entry/2024/09/30/160000/)のように、token_ids に変換して API を叩く必要があります。
## docker-compose.yaml 例
```yaml
services:
splade-jp-v1:
# image の部分はアーキテクチャにあったものに変えること
image: ghcr.io/huggingface/text-embeddings-inference:86-1.5
ports:
- "8080:80"
volumes:
- /tmp/docker-tei-data:/data
command: [ "--model-id", "hotchpotch/japanese-splade-base-v1-dummy-fast-tokenizer-for-tei", "--dtype", "float16", "--pooling", "splade"]
deploy:
resources:
reservations:
devices:
- driver: nvidia
count: 1
capabilities: [ gpu ]
```