Spaces:

AutoBench
/

AutoBench_1.0_Demo

Sleeping

PeterKruger commited on Mar 1

Commit

e42e726

verified ·

1 Parent(s): 22c6123

Update README.md

Files changed (1) hide show

README.md CHANGED Viewed

@@ -8,13 +8,13 @@ sdk_version: 1.42.2
 app_file: app.py
 pinned: false
 license: mit
-short_description: Many-Model-As-Judge LLM Benchmark
 ---
 # AutoBench 1.0 Demo
-This Space runs a Many-Model-As-Judge LLM benchmark to compare different language models using Hugging Face's Inference API. This is a simplified version of Autobench 1.0 which relies on multiple inference providers to manage request load and a wider range of models (Anthropic, Grok, Nebius, OpenAI, Together AI, Vertex AI). For more advanced use, please refer to the AutoBench 1.0 repository.
 ## Features

 app_file: app.py
 pinned: false
 license: mit
+short_description: Collective-Model-As-Judge LLM Benchmark
 ---
 # AutoBench 1.0 Demo
+This Space runs a Collective-Model-As-Judge LLM benchmark to compare different language models using Hugging Face's Inference API. This is a simplified version of Autobench 1.0 which relies on multiple inference providers to manage request load and a wider range of models (Anthropic, Grok, Nebius, OpenAI, Together AI, Vertex AI). For more advanced use, please refer to the AutoBench 1.0 repository.
 ## Features