martintgc's picture
Add new SentenceTransformer model
5c4f1d0 verified
---
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:50
- loss:MatryoshkaLoss
- loss:MultipleNegativesRankingLoss
base_model: Snowflake/snowflake-arctic-embed-l
widget:
- source_sentence: Was sind die wichtigsten Punkte, die man über Rottenburg und den
Ausbau zum Kleeblatt wissen muss, besonders nach der Fertigstellung des Bodenauftrags?
sentences:
- "A81 AS Rottenburg, Ausbau zum Kleeblatt einschließlich Parallelfahrbahnen und\
\ \ngrundhafte Erneuerung der B28 im Ausbaubereich \n____________________________________________________________________________________________________________\
\ \n \n11 \n \nDie Rampen und Parallelfahrbahnen werden in die Belastungsklasse\
\ Bk 10 eingestuft. \n \nDer Straßenaufbau der Verbreiterung der B 28 wird folgend\
\ festgelegt: \n \n \n \n 3,5 cm \nAsphaltdeckschicht SMA 8 S mit 25/55-55\
\ \n \n \n 9,0 cm \nAsphaltbinderschicht Typ SMA AC 22 B S mit \n \n\
\ \n \n \n \n10/40-55 gemäß Tab. 1 \n▼120 MPa \n 18,0 cm \nAsphalttragschicht\
\ AC 32 T S mit 50/70 \n▼45 MPa \n 39,5 cm \nFrostschutzschicht \n \n \n\
\ 70,0 cm Gesamtaufbau \n \nDer Straßenaufbau der neuen Rampen und Parallelfahrbahnen\
\ wird folgend festgelegt:"
- "A81 AS Rottenburg, Ausbau zum Kleeblatt einschließlich Parallelfahrbahnen und\
\ \ngrundhafte Erneuerung der B28 im Ausbaubereich \n____________________________________________________________________________________________________________\
\ \n \n19 \n \nNachsorge \n \n19. Nach Fertigstellung des Bodenauftrags sind die\
\ Flächen zur Vermeidung von Erosion \nund evtl. Stickstoffverlusten möglichst\
\ umgehend zu begrünen. \n \n20. Zur Förderung der Bodenstruktur sind für die\
\ Erst-/Zwischenbegrünung mehrjährige, \ntief- und intensivwurzelnde Gründüngungspflanzen\
\ (insbesondere Luzerne über 3 \nJahre) zu verwenden. Eine bodenschonende Folgebewirtschaftung\
\ (u.a. grundsätz-\nlich kein Maisanbau in den ersten 5 Jahren) ist einzuhalten."
- "A81 AS Rottenburg, Ausbau zum Kleeblatt einschließlich Parallelfahrbahnen und\
\ \ngrundhafte Erneuerung der B28 im Ausbaubereich \n____________________________________________________________________________________________________________\
\ \n \n3 \n \n1.4.5 \nKabelkanäle \n27 \n1.4.6 \nVer- und Entsorgungsleitungen\
\ \n27 \n1.4.7 \nFahrbahndecken \n27 \n1.4.8 \nSchutz- und Leiteinrichtungen \n\
27 \n1.4.9 \nLichtzeichenanlagen \n27 \n1.4.10 \nSonstige Ausstattung \n27 \n\
1.4.11 \nSonderbauwerke \n28 \n1.4.12 \nStraßenanschlüsse, Seitenwege \n28 \n\
1.4.13 \nLebendverbau, Böschungssicherung \n28 \n1.4.14 \nHydraulische Nassansaat\
\ \n28 \n1.5 \nMINDESTANFORDERUNGEN FÜR NEBENANGEBOTE \n28 \n1.5.1 \nVorgaben\
\ aus der Planfeststellung \n28 \n1.5.2 \nVorgaben aus Vereinbarungen mit Dritten\
\ \n28 \n1.5.3 \nAngaben zu Entwurfsvorgaben \n28 \n1.5.4"
- source_sentence: Was sind die Standardauflagen und Bedingungen des Landratsamtes
Böblingen?
sentences:
- "A81 AS Rottenburg, Ausbau zum Kleeblatt einschließlich Parallelfahrbahnen und\
\ \ngrundhafte Erneuerung der B28 im Ausbaubereich \n____________________________________________________________________________________________________________\
\ \n \n2 \n \nInhaltsverzeichnis \n1 \nALLGEMEINE BESCHREIBUNG DER LEISTUNG \n\
7 \n1.1 \nAUSZUFÜHRENDE LEISTUNGEN \n7 \n1.1.1 \nStraßenbau \n7 \n1.1.1.1 \nArt\
\ und Umfang \n7 \n1.1.1.2 \nUntergrund \n9 \n1.1.1.3 \nUnterbau \n9 \n1.1.1.4\
\ \nErdarbeiten \n9 \n1.1.1.5 \nFräsarbeiten \n9 \n1.1.1.6 \nEntwässerung \n9\
\ \n1.1.1.7 \nOberbau \n10 \n1.1.1.8 \nDurchlässe \n15 \n1.1.1.9 \nAusstattung\
\ \n15 \n1.1.2 \nBauwerke (Ingenieurbau) \n16 \n1.1.2.1 \nArt und Umfang \n16\
\ \n1.1.3 \nLandschaftsbau \n16 \n1.1.3.1 \nStandardauflagen und Bedingungen des\
\ Landratsamtes Böblingen \n16 \n1.1.3.2 \nArt und Umfang \n20 \n1.1.3.3"
- "A81 AS Rottenburg, Ausbau zum Kleeblatt einschließlich Parallelfahrbahnen und\
\ \ngrundhafte Erneuerung der B28 im Ausbaubereich \n____________________________________________________________________________________________________________\
\ \n \n25 \n \n1.2 \nAusgeführte Vorarbeiten \n1.2.1 Beweissicherung \nBisher\
\ wurden keine Beweissicherungsmaßnahmen durchgeführt. Weitere Maßnahmen \nsiehe\
\ Punkt 3.8 dieser Baubeschreibung. \n1.2.2 Vermessung \n1.2.2.1 Festpunkte, Vermessungsnetz\
\ und Absteckung \nAls geodätisches Grundlagennetz wird dem Auftragnehmer ein\
\ Lage- und Höhenfest-\npunktfeld übergeben. \n1.2.2.2 Lagefestpunkte \nSämtlichen\
\ Berechnungen des Lagefestpunktfeldes liegt das Gauss-Krüger-System im \nBereich\
\ 9° Meridians zugrunde."
- "gene Oberboden ist vollständig wieder im Baustellenbereich anzudecken. Die Wieder-\n\
verwendung von Oberboden aus Banketten und Mulden ist nur in diesen Bereichen\
\ ge-\nstattet. Der Oberboden darf nicht befahren werden. \nDer Oberboden im gesamten\
\ Baubereich der AS Rottenburg ist grundsätzlich auf Flä-\nchen des AN zwischenzulagern\
\ und für die Andeckung der Böschungen und Mulden zu \nverwenden. Vorrübergehend\
\ beanspruchte Flächen (VB-Flächen) sind in geringem Um-\nfang vorhanden und können\
\ für die Lagerung von Oberboden t. w. verwendet werden. \nDas Erdplanum ist grundsätzlich\
\ mit Weißfeinkalk zu verbessern. Die Dammaufstands-\nflächen bei der Verbreiterungen\
\ sind ebenso zu verbessern. Diese qualifizierte Boden-\nverbesserung ordnet der\
\ Auftraggeber an."
- source_sentence: Welche Rolle spielen Feldwege in den ergänzenden Baumaßnahmen eines
Bauprojekts?
sentences:
- "einschl. Sanierung des restlichen Bauwerks \n \nSanierung des Bauwerks Überführung\
\ der A81 \n \nAbbau von Schutzplanken in Bau- und Verbreiterungsbereichen durch\
\ den AN Stra-\nßenbau, der Bau neuer Schutzplanken erfolgt durch Dritte. \n\
\ \nStraßenausstattung Freigabemarkierung und ca. 6 Wochen später endgültige Markie-\n\
rung aufbringen \n \nBau von Feldwegen \n \nOberbodenandeckungsarbeiten und\
\ Ansaatarbeiten \n \nBankettarbeiten als Schotterrasen. \n \nErgänzende Baumaßnahmen\
\ durch Dritte: \n \n \nVerkehrsführung einrichten, vorhalten, betreiben und\
\ abbauen \n \nNeubau der Wegweisenden Beschilderung, StVO-Beschilderung auf\
\ der A81 \n \nNeubau der passiven Schutzeinrichtungen \n \nDiese Leistungen\
\ werden als Fachlose ausgeschrieben und vergeben. Die Umsetzung erfolgt vor"
- "Bauwerke (Ingenieurbau) \n16 \n1.1.2.1 \nArt und Umfang \n16 \n1.1.3 \nLandschaftsbau\
\ \n16 \n1.1.3.1 \nStandardauflagen und Bedingungen des Landratsamtes Böblingen\
\ \n16 \n1.1.3.2 \nArt und Umfang \n20 \n1.1.3.3 \nAllgemeines \n20 \n1.1.3.4\
\ \nOberbodenkonzept \n20 \n1.1.3.5 \nSchutzzäune \n22 \n1.1.3.6 \nWurzelstöcke\
\ und Gehölze roden \n22 \n1.1.3.7 \nAnsaatarbeiten \n22 \n1.1.3.8 \nRückbau nicht\
\ mehr benötigter Straßenflächen (Ausgleichsmaßnahmen) \n22 \n1.1.3.9 \nSonstiges\
\ \n22 \n1.1.4 \nAuftraggeber Aufgaben nach Baustellenverordnung \n22 \n1.1.4.1\
\ \nVorankündigung \n22 \n1.1.4.2 \nUnterlage nach § 3 Abs. 2 Nr. 3 Baustellenverordnung\
\ erstellen und anpassen \n23 \n1.1.4.3 \nSicherheits- und Gesundheitsschutzkoordinator\
\ während der Ausführung des Bauvorhabens stellen \n23 \n1.2 \nAUSGEFÜHRTE VORARBEITEN\
\ \n25 \n1.2.1 \nBeweissicherung \n25"
- "Oberbodenkonzept umfasst: \n- \nAbtrag und Lagerung des Oberbodens \n- \nWiederandeckung\
\ mit Oberboden \n- \nVerwertung und Entsorgung von Oberboden \nDie genannten\
\ Qualitätsstufen ergeben sich nach der VwV Boden 2007 \nDie genannten Deponieklassen\
\ richten sich nach der Deponieverordnung 2017 \n \na) Abtrag des Oberbodens:\
\ \nBeim Abtrag des Bodens werden verschiedene Bereich nach Ihren Schadstoffbelastung\
\ \nund der Oberbodenmächtigkeit unterschieden. Die Zwischenlagerung der aus diesen\
\ Be-\nreichen abgeschobenen Oberböden muss zwingend separat erfolgen. \n1. Bankette\
\ \nwerden in einer Breite von 2 m 5 cm tief abgeschoben. Das Material ist auf\
\ separaten \nMieten für die Haufwerksbeprobung zu lagern. Die Mieten dürfen jeweils\
\ 500 m³ nicht"
- source_sentence: Wie wird die B 28 in Bezug auf die Belastungsklasse eingestuft?
sentences:
- "A81 AS Rottenburg, Ausbau zum Kleeblatt einschließlich Parallelfahrbahnen und\
\ \ngrundhafte Erneuerung der B28 im Ausbaubereich \n____________________________________________________________________________________________________________\
\ \n \n14 \n \nSMA 22 B S \nSiebdurchgang \nM.-% \nSMA 16 B S \n6 bis \n10 \n\
6 bis \n13 \n27 bis \n30 \n39 bis \n43 \n49 bis \n53 \n66 bis \n69 \n95 bis \n\
100 \n100"
- "35 \n2.7.4 \nGüte des Oberbodens \n35 \n2.7.5 \nSchadstoffbelastung \n35 \n2.8\
\ \nSEITENENTNAHMEN UND ABLAGERUNGSSTELLE \n35 \n2.9 \nSCHUTZBEREICHE UND –OBJEKTE\
\ \n36 \n2.9.1 \nAllgemeines \n36 \n2.9.2 \nNatur-, Landschaftsschutzgebiete \n\
36 \n2.9.2.1 \nNaturschutzgebiete \n36 \n2.9.2.2 \nLandschaftsschutzgebiete \n\
36 \n2.9.3 \nBäume und Flurgehölze \n36 \n2.9.4 \nBiotope \n36 \n2.9.5 \nDenkmale\
\ \n37 \n2.9.6 \nImmisionsschutz-Bereiche und –Objekte \n37 \n2.9.7 \nGewässer,\
\ Wasserschutzgebiete \n37"
- "Da die bestehenden Sickerleitungen an die Kanäle angeschlossen sind, fließt in\
\ den be-\nstehenden Leitungen ständig Wasser. Das Umpumpen dieses Wassers von\
\ einem \nSchacht zum Nächsten ist als Wasserhaltung zu sehen und in der Kalkulation\
\ zu berück-\nsichtigen. \nIn Wasserschutzgebieten sind Grundwasserschutzmaßnahmen\
\ gemäß RiStWag erfor-\nderlich. Die Abdichtungen sind gemäß Regelquerschnitte\
\ auszuführen. \n \n1.1.1.7 Oberbau \n \nDie Durchgangsfahrbahn der A 81 wird\
\ in die Belastungsklasse Bk 100 eingestuft. \nDie neue Verbreiterung der B 28\
\ wird in die Belastungsklasse Bk 32 eingestuft. Der Auf-\nbau der bestehenden\
\ und zu sanierenden B 28 wird im Zuge der Baumaßnahme im \nBaustellenbereich\
\ auf die Belastungsklasse Bk 32 erhöht."
- source_sentence: Welche Maßnahmen sind im Zusammenhang mit der Sanierung des Bauwerks
Überführung der A81 vorgesehen?
sentences:
- "Marshall-Probekörper \n \n \n \n \nminimaler Hohlraumgehalt MPK \n \nVmin 3,0\
\ \nVmin 3,0 \nmaximaler Hohlraumgehalt MPK \n \nVmax 4,0 \nVmax 4,0 \nBindemittelvolumen\
\ \n \nVol.-% \nIst anzugeben2 \nIst anzugeben3 \nHohlraumausfüllungsgrad \n%\
\ \nIst anzugeben4 \nIst anzugeben4 \nProportionale Spurrinnentiefe \n \nPRDLuft5,0\
\ \nPRDLuft5,0 \n \n1 Bindemittelsorte in Ausnahmefällen. \n2 Erfahrungswerte\
\ liegen im Bereich zwischen 11 und 13 Vol.-% \n3 Erfahrungswerte liegen im\
\ Bereich zwischen 12 und 14 Vol.-% \n4 Erfahrungswerte liegen im Bereich zwischen\
\ 73 und 83 % \n \nNach den bisherigen Erfahrungen haben sich die in der Tabelle\
\ 2 dargestellten eingeengten Berei-\nche der Korngrößenverteilungen bei der Herstellung\
\ von Asphaltbinder SMA B S besonders be-\nwährt."
- "A81 AS Rottenburg, Ausbau zum Kleeblatt einschließlich Parallelfahrbahnen und\
\ \ngrundhafte Erneuerung der B28 im Ausbaubereich \n____________________________________________________________________________________________________________\
\ \n \n12 \n \n50 cm verbleibende Frostschutzschicht \n10 cm neues Frostschutzmaterial\
\ 0/45 aus Naturgestein \n18 cm Asphalttragschicht AC 32 TS (50/70) \n9,0 cm dicken\
\ Asphaltbinderschicht Typ SMA 22 B S mit 10/40-65 \n3,5 cm Deckschicht SMA 8\
\ S mit 25/55-55. \nDabei ist zu beachten, dass hierdurch die bestehenden Höhen\
\ des tieferen Fahrbahn-\nrandes auf der B 28 erhalten bleiben, ansonsten die\
\ Querneigung auf der B28 auf 2,5% \nerhöht wird. Dieser Ausgleich wird in der\
\ Frostschutzschicht vorgenommen. Im Bereich"
- "rung aufbringen. \n \nBau von Feldwegen und Rekultivierungsmaßnahmen \n \n\
Oberbodenandeckungsarbeiten und Ansaatarbeiten. \n \nBankettarbeiten als Schotterrasen\
\ \n \nVerbreiterung und FDE B28: \n \n \nVerkehrsführung einrichten, vorhalten,\
\ betreiben und abbauen wird durch Dritte aus-\ngeführt \n \nErdbau und Entwässerungsarbeiten\
\ auf der B28 \n \nVerbreiterung und FDE Maßnahme auf der B 28 mit Austausch\
\ der Asphalttrag-, As-\nphaltbinderschicht und der Deckschicht verbunden mit\
\ der Anhebung der Quernei-\ngung auf 2,5% \n \nVerbreiterung der Feldwegunterführung\
\ auf der B28 (BW 01, km 0+710) nach Süden \neinschl. Sanierung des restlichen\
\ Bauwerks \n \nSanierung des Bauwerks Überführung der A81 \n \nAbbau von Schutzplanken\
\ in Bau- und Verbreiterungsbereichen durch den AN Stra-"
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
- cosine_accuracy@1
- cosine_accuracy@3
- cosine_accuracy@5
- cosine_accuracy@10
- cosine_precision@1
- cosine_precision@3
- cosine_precision@5
- cosine_precision@10
- cosine_recall@1
- cosine_recall@3
- cosine_recall@5
- cosine_recall@10
- cosine_ndcg@10
- cosine_mrr@10
- cosine_map@100
model-index:
- name: SentenceTransformer based on Snowflake/snowflake-arctic-embed-l
results:
- task:
type: information-retrieval
name: Information Retrieval
dataset:
name: Unknown
type: unknown
metrics:
- type: cosine_accuracy@1
value: 0.16
name: Cosine Accuracy@1
- type: cosine_accuracy@3
value: 0.32
name: Cosine Accuracy@3
- type: cosine_accuracy@5
value: 0.46
name: Cosine Accuracy@5
- type: cosine_accuracy@10
value: 0.54
name: Cosine Accuracy@10
- type: cosine_precision@1
value: 0.16
name: Cosine Precision@1
- type: cosine_precision@3
value: 0.10666666666666666
name: Cosine Precision@3
- type: cosine_precision@5
value: 0.09200000000000001
name: Cosine Precision@5
- type: cosine_precision@10
value: 0.054000000000000006
name: Cosine Precision@10
- type: cosine_recall@1
value: 0.16
name: Cosine Recall@1
- type: cosine_recall@3
value: 0.32
name: Cosine Recall@3
- type: cosine_recall@5
value: 0.46
name: Cosine Recall@5
- type: cosine_recall@10
value: 0.54
name: Cosine Recall@10
- type: cosine_ndcg@10
value: 0.3317326362660334
name: Cosine Ndcg@10
- type: cosine_mrr@10
value: 0.2674444444444444
name: Cosine Mrr@10
- type: cosine_map@100
value: 0.2845659816762858
name: Cosine Map@100
---
# SentenceTransformer based on Snowflake/snowflake-arctic-embed-l
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [Snowflake/snowflake-arctic-embed-l](https://huggingface.co/Snowflake/snowflake-arctic-embed-l). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
## Model Details
### Model Description
- **Model Type:** Sentence Transformer
- **Base model:** [Snowflake/snowflake-arctic-embed-l](https://huggingface.co/Snowflake/snowflake-arctic-embed-l) <!-- at revision d8fb21ca8d905d2832ee8b96c894d3298964346b -->
- **Maximum Sequence Length:** 512 tokens
- **Output Dimensionality:** 1024 dimensions
- **Similarity Function:** Cosine Similarity
<!-- - **Training Dataset:** Unknown -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->
### Model Sources
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
### Full Model Architecture
```
SentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
```
## Usage
### Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
```bash
pip install -U sentence-transformers
```
Then you can load this model and run inference.
```python
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("martintgc/finetuned_arctic_kg_ft-constr-contr-v0")
# Run inference
sentences = [
'Welche Maßnahmen sind im Zusammenhang mit der Sanierung des Bauwerks Überführung der A81 vorgesehen?',
'rung aufbringen. \n\uf0b7 \nBau von Feldwegen und Rekultivierungsmaßnahmen \n\uf0b7 \nOberbodenandeckungsarbeiten und Ansaatarbeiten. \n\uf0b7 \nBankettarbeiten als Schotterrasen \n \nVerbreiterung und FDE B28: \n \n\uf0b7 \nVerkehrsführung einrichten, vorhalten, betreiben und abbauen wird durch Dritte aus-\ngeführt \n\uf0b7 \nErdbau und Entwässerungsarbeiten auf der B28 \n\uf0b7 \nVerbreiterung und FDE Maßnahme auf der B 28 mit Austausch der Asphalttrag-, As-\nphaltbinderschicht und der Deckschicht verbunden mit der Anhebung der Quernei-\ngung auf 2,5% \n\uf0b7 \nVerbreiterung der Feldwegunterführung auf der B28 (BW 01, km 0+710) nach Süden \neinschl. Sanierung des restlichen Bauwerks \n\uf0b7 \nSanierung des Bauwerks Überführung der A81 \n\uf0b7 \nAbbau von Schutzplanken in Bau- und Verbreiterungsbereichen durch den AN Stra-',
'A81 AS Rottenburg, Ausbau zum Kleeblatt einschließlich Parallelfahrbahnen und \ngrundhafte Erneuerung der B28 im Ausbaubereich \n____________________________________________________________________________________________________________ \n \n12 \n \n50 cm verbleibende Frostschutzschicht \n10 cm neues Frostschutzmaterial 0/45 aus Naturgestein \n18 cm Asphalttragschicht AC 32 TS (50/70) \n9,0 cm dicken Asphaltbinderschicht Typ SMA 22 B S mit 10/40-65 \n3,5 cm Deckschicht SMA 8 S mit 25/55-55. \nDabei ist zu beachten, dass hierdurch die bestehenden Höhen des tieferen Fahrbahn-\nrandes auf der B 28 erhalten bleiben, ansonsten die Querneigung auf der B28 auf 2,5% \nerhöht wird. Dieser Ausgleich wird in der Frostschutzschicht vorgenommen. Im Bereich',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
```
<!--
### Direct Usage (Transformers)
<details><summary>Click to see the direct usage in Transformers</summary>
</details>
-->
<!--
### Downstream Usage (Sentence Transformers)
You can finetune this model on your own dataset.
<details><summary>Click to expand</summary>
</details>
-->
<!--
### Out-of-Scope Use
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->
## Evaluation
### Metrics
#### Information Retrieval
* Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
| Metric | Value |
|:--------------------|:-----------|
| cosine_accuracy@1 | 0.16 |
| cosine_accuracy@3 | 0.32 |
| cosine_accuracy@5 | 0.46 |
| cosine_accuracy@10 | 0.54 |
| cosine_precision@1 | 0.16 |
| cosine_precision@3 | 0.1067 |
| cosine_precision@5 | 0.092 |
| cosine_precision@10 | 0.054 |
| cosine_recall@1 | 0.16 |
| cosine_recall@3 | 0.32 |
| cosine_recall@5 | 0.46 |
| cosine_recall@10 | 0.54 |
| **cosine_ndcg@10** | **0.3317** |
| cosine_mrr@10 | 0.2674 |
| cosine_map@100 | 0.2846 |
<!--
## Bias, Risks and Limitations
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->
<!--
### Recommendations
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->
## Training Details
### Training Dataset
#### Unnamed Dataset
* Size: 50 training samples
* Columns: <code>sentence_0</code> and <code>sentence_1</code>
* Approximate statistics based on the first 50 samples:
| | sentence_0 | sentence_1 |
|:--------|:----------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|
| type | string | string |
| details | <ul><li>min: 7 tokens</li><li>mean: 25.64 tokens</li><li>max: 52 tokens</li></ul> | <ul><li>min: 110 tokens</li><li>mean: 282.34 tokens</li><li>max: 391 tokens</li></ul> |
* Samples:
| sentence_0 | sentence_1 |
|:------------------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| <code>Was sind die Details zum Ausbau der B28 im Zusammenhang mit der A81 AS Rottenburg?</code> | <code>A81 AS Rottenburg, Ausbau zum Kleeblatt einschließlich Parallelfahrbahnen und <br>grundhafte Erneuerung der B28 im Ausbaubereich <br>________________________________________________________________________ <br> <br> <br> <br> <br>Die Autobahn GmbH des Bundes <br>Niederlassung Südwest, Außenstelle Stuttgart-Vaihingen <br> <br> <br> <br> <br> <br> <br> <br> <br> <br> <br>BAUBESCHREIBUNG <br> <br> <br>A81 AS Rottenburg, Ausbau zum Kleeblatt einschließlich <br>Parallelfahrbahnen und Rampen und grundhafte <br>Erneuerung der B28 im Ausbaubereich</code> |
| <code>Was sind die Standardauflagen und Bedingungen des Landratsamtes Böblingen?</code> | <code>A81 AS Rottenburg, Ausbau zum Kleeblatt einschließlich Parallelfahrbahnen und <br>grundhafte Erneuerung der B28 im Ausbaubereich <br>____________________________________________________________________________________________________________ <br> <br>2 <br> <br>Inhaltsverzeichnis <br>1 <br>ALLGEMEINE BESCHREIBUNG DER LEISTUNG <br>7 <br>1.1 <br>AUSZUFÜHRENDE LEISTUNGEN <br>7 <br>1.1.1 <br>Straßenbau <br>7 <br>1.1.1.1 <br>Art und Umfang <br>7 <br>1.1.1.2 <br>Untergrund <br>9 <br>1.1.1.3 <br>Unterbau <br>9 <br>1.1.1.4 <br>Erdarbeiten <br>9 <br>1.1.1.5 <br>Fräsarbeiten <br>9 <br>1.1.1.6 <br>Entwässerung <br>9 <br>1.1.1.7 <br>Oberbau <br>10 <br>1.1.1.8 <br>Durchlässe <br>15 <br>1.1.1.9 <br>Ausstattung <br>15 <br>1.1.2 <br>Bauwerke (Ingenieurbau) <br>16 <br>1.1.2.1 <br>Art und Umfang <br>16 <br>1.1.3 <br>Landschaftsbau <br>16 <br>1.1.3.1 <br>Standardauflagen und Bedingungen des Landratsamtes Böblingen <br>16 <br>1.1.3.2 <br>Art und Umfang <br>20 <br>1.1.3.3</code> |
| <code>Was ist Baustellenverordnung?</code> | <code>Bauwerke (Ingenieurbau) <br>16 <br>1.1.2.1 <br>Art und Umfang <br>16 <br>1.1.3 <br>Landschaftsbau <br>16 <br>1.1.3.1 <br>Standardauflagen und Bedingungen des Landratsamtes Böblingen <br>16 <br>1.1.3.2 <br>Art und Umfang <br>20 <br>1.1.3.3 <br>Allgemeines <br>20 <br>1.1.3.4 <br>Oberbodenkonzept <br>20 <br>1.1.3.5 <br>Schutzzäune <br>22 <br>1.1.3.6 <br>Wurzelstöcke und Gehölze roden <br>22 <br>1.1.3.7 <br>Ansaatarbeiten <br>22 <br>1.1.3.8 <br>Rückbau nicht mehr benötigter Straßenflächen (Ausgleichsmaßnahmen) <br>22 <br>1.1.3.9 <br>Sonstiges <br>22 <br>1.1.4 <br>Auftraggeber Aufgaben nach Baustellenverordnung <br>22 <br>1.1.4.1 <br>Vorankündigung <br>22 <br>1.1.4.2 <br>Unterlage nach § 3 Abs. 2 Nr. 3 Baustellenverordnung erstellen und anpassen <br>23 <br>1.1.4.3 <br>Sicherheits- und Gesundheitsschutzkoordinator während der Ausführung des Bauvorhabens stellen <br>23 <br>1.2 <br>AUSGEFÜHRTE VORARBEITEN <br>25 <br>1.2.1 <br>Beweissicherung <br>25</code> |
* Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
```json
{
"loss": "MultipleNegativesRankingLoss",
"matryoshka_dims": [
768,
512,
256,
128,
64
],
"matryoshka_weights": [
1,
1,
1,
1,
1
],
"n_dims_per_step": -1
}
```
### Training Hyperparameters
#### Non-Default Hyperparameters
- `eval_strategy`: steps
- `per_device_train_batch_size`: 10
- `per_device_eval_batch_size`: 10
- `num_train_epochs`: 10
- `multi_dataset_batch_sampler`: round_robin
#### All Hyperparameters
<details><summary>Click to expand</summary>
- `overwrite_output_dir`: False
- `do_predict`: False
- `eval_strategy`: steps
- `prediction_loss_only`: True
- `per_device_train_batch_size`: 10
- `per_device_eval_batch_size`: 10
- `per_gpu_train_batch_size`: None
- `per_gpu_eval_batch_size`: None
- `gradient_accumulation_steps`: 1
- `eval_accumulation_steps`: None
- `torch_empty_cache_steps`: None
- `learning_rate`: 5e-05
- `weight_decay`: 0.0
- `adam_beta1`: 0.9
- `adam_beta2`: 0.999
- `adam_epsilon`: 1e-08
- `max_grad_norm`: 1
- `num_train_epochs`: 10
- `max_steps`: -1
- `lr_scheduler_type`: linear
- `lr_scheduler_kwargs`: {}
- `warmup_ratio`: 0.0
- `warmup_steps`: 0
- `log_level`: passive
- `log_level_replica`: warning
- `log_on_each_node`: True
- `logging_nan_inf_filter`: True
- `save_safetensors`: True
- `save_on_each_node`: False
- `save_only_model`: False
- `restore_callback_states_from_checkpoint`: False
- `no_cuda`: False
- `use_cpu`: False
- `use_mps_device`: False
- `seed`: 42
- `data_seed`: None
- `jit_mode_eval`: False
- `use_ipex`: False
- `bf16`: False
- `fp16`: False
- `fp16_opt_level`: O1
- `half_precision_backend`: auto
- `bf16_full_eval`: False
- `fp16_full_eval`: False
- `tf32`: None
- `local_rank`: 0
- `ddp_backend`: None
- `tpu_num_cores`: None
- `tpu_metrics_debug`: False
- `debug`: []
- `dataloader_drop_last`: False
- `dataloader_num_workers`: 0
- `dataloader_prefetch_factor`: None
- `past_index`: -1
- `disable_tqdm`: False
- `remove_unused_columns`: True
- `label_names`: None
- `load_best_model_at_end`: False
- `ignore_data_skip`: False
- `fsdp`: []
- `fsdp_min_num_params`: 0
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
- `fsdp_transformer_layer_cls_to_wrap`: None
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
- `deepspeed`: None
- `label_smoothing_factor`: 0.0
- `optim`: adamw_torch
- `optim_args`: None
- `adafactor`: False
- `group_by_length`: False
- `length_column_name`: length
- `ddp_find_unused_parameters`: None
- `ddp_bucket_cap_mb`: None
- `ddp_broadcast_buffers`: False
- `dataloader_pin_memory`: True
- `dataloader_persistent_workers`: False
- `skip_memory_metrics`: True
- `use_legacy_prediction_loop`: False
- `push_to_hub`: False
- `resume_from_checkpoint`: None
- `hub_model_id`: None
- `hub_strategy`: every_save
- `hub_private_repo`: None
- `hub_always_push`: False
- `gradient_checkpointing`: False
- `gradient_checkpointing_kwargs`: None
- `include_inputs_for_metrics`: False
- `include_for_metrics`: []
- `eval_do_concat_batches`: True
- `fp16_backend`: auto
- `push_to_hub_model_id`: None
- `push_to_hub_organization`: None
- `mp_parameters`:
- `auto_find_batch_size`: False
- `full_determinism`: False
- `torchdynamo`: None
- `ray_scope`: last
- `ddp_timeout`: 1800
- `torch_compile`: False
- `torch_compile_backend`: None
- `torch_compile_mode`: None
- `dispatch_batches`: None
- `split_batches`: None
- `include_tokens_per_second`: False
- `include_num_input_tokens_seen`: False
- `neftune_noise_alpha`: None
- `optim_target_modules`: None
- `batch_eval_metrics`: False
- `eval_on_start`: False
- `use_liger_kernel`: False
- `eval_use_gather_object`: False
- `average_tokens_across_devices`: False
- `prompts`: None
- `batch_sampler`: batch_sampler
- `multi_dataset_batch_sampler`: round_robin
</details>
### Training Logs
| Epoch | Step | cosine_ndcg@10 |
|:-----:|:----:|:--------------:|
| 1.0 | 5 | 0.3048 |
| 2.0 | 10 | 0.3167 |
| 3.0 | 15 | 0.3633 |
| 4.0 | 20 | 0.3619 |
| 5.0 | 25 | 0.3436 |
| 6.0 | 30 | 0.3461 |
| 7.0 | 35 | 0.3475 |
| 8.0 | 40 | 0.3319 |
| 9.0 | 45 | 0.3320 |
| 10.0 | 50 | 0.3317 |
### Framework Versions
- Python: 3.9.21
- Sentence Transformers: 3.4.1
- Transformers: 4.49.0
- PyTorch: 2.6.0
- Accelerate: 1.4.0
- Datasets: 3.3.2
- Tokenizers: 0.21.0
## Citation
### BibTeX
#### Sentence Transformers
```bibtex
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
```
#### MatryoshkaLoss
```bibtex
@misc{kusupati2024matryoshka,
title={Matryoshka Representation Learning},
author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
year={2024},
eprint={2205.13147},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
```
#### MultipleNegativesRankingLoss
```bibtex
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
```
<!--
## Glossary
*Clearly define terms in order to be accessible across audiences.*
-->
<!--
## Model Card Authors
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->
<!--
## Model Card Contact
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
-->