hotchpotch
/

japanese-splade-base-v1-dummy-fast-tokenizer-for-tei

Model card Files Files and versions Community

japanese-splade-base-v1-dummy-fast-tokenizer-for-tei / README.md

hotchpotch's picture

Update README.md

e62794c verified 7 months ago

|

history blame contribute delete

1.24 kB

	---
	license: mit
	language:
	- ja
	base_model:
	- tohoku-nlp/bert-base-japanese-v3
	---

	[japanese-splade-base-v1](https://huggingface.co/hotchpotch/japanese-splade-base-v1)を [huggingface/text-embeddings-inference](https://github.com/huggingface/text-embeddings-inference)で動かすための fork です。

	なぜか safetensor では動かないので、pytorch_model.bin に変換したモデルの重みを入れています。

	なお、[text-embeddings-inference で日本語トークナイザーモデルの推論をする](https://secon.dev/entry/2024/09/30/160000/)のように、token_ids に変換して API を叩く必要があります。


	## docker-compose.yaml 例

	```yaml
	services:
	splade-jp-v1:
	# image の部分はアーキテクチャにあったものに変えること
	image: ghcr.io/huggingface/text-embeddings-inference:86-1.5
	ports:
	- "8080:80"
	volumes:
	- /tmp/docker-tei-data:/data
	command: [ "--model-id", "hotchpotch/japanese-splade-base-v1-dummy-fast-tokenizer-for-tei", "--dtype", "float16", "--pooling", "splade"]
	deploy:
	resources:
	reservations:
	devices:
	- driver: nvidia
	count: 1
	capabilities: [ gpu ]
	```