desarrolloasesoreslocales
commited on
Commit
•
fec3341
1
Parent(s):
77857e6
Push model using huggingface_hub.
Browse files- README.md +246 -94
- config.json +6 -21
- config_sentence_transformers.json +2 -2
- model.safetensors +2 -2
- model_head.pkl +1 -1
- sentence_bert_config.json +1 -1
- special_tokens_map.json +8 -8
- tokenizer.json +0 -0
- tokenizer_config.json +12 -16
README.md
CHANGED
@@ -5,31 +5,24 @@ tags:
|
|
5 |
- sentence-transformers
|
6 |
- text-classification
|
7 |
- generated_from_setfit_trainer
|
8 |
-
base_model: desarrolloasesoreslocales/bert-leg-al-
|
9 |
metrics:
|
10 |
- accuracy
|
11 |
widget:
|
12 |
-
- text:
|
13 |
-
|
14 |
-
|
15 |
-
|
16 |
-
|
17 |
-
|
18 |
-
|
19 |
-
|
20 |
-
|
21 |
-
|
22 |
-
\ en el momento de formular la denuncia. \n"
|
23 |
-
- text: Que se proceda a la apertura del periodo de prueba para la denuncia número
|
24 |
-
GHI012, conforme al artículo 13 del Real Decreto 320/1992, y se solicite la ratificación
|
25 |
-
del agente denunciante y la aportación de pruebas documentales y fotográficas.
|
26 |
-
- text: Considero que la sanción impuesta es desproporcionada y no se justifica por
|
27 |
-
la gravedad de la infracción, por lo que solicito su revisión conforme al principio
|
28 |
-
de proporcionalidad.
|
29 |
pipeline_tag: text-classification
|
30 |
inference: true
|
31 |
model-index:
|
32 |
-
- name: SetFit with desarrolloasesoreslocales/bert-leg-al-
|
33 |
results:
|
34 |
- task:
|
35 |
type: text-classification
|
@@ -40,13 +33,13 @@ model-index:
|
|
40 |
split: test
|
41 |
metrics:
|
42 |
- type: accuracy
|
43 |
-
value: 0.
|
44 |
name: Accuracy
|
45 |
---
|
46 |
|
47 |
-
# SetFit with desarrolloasesoreslocales/bert-leg-al-
|
48 |
|
49 |
-
This is a [SetFit](https://github.com/huggingface/setfit) model that can be used for Text Classification. This SetFit model uses [desarrolloasesoreslocales/bert-leg-al-
|
50 |
|
51 |
The model has been trained using an efficient few-shot learning technique that involves:
|
52 |
|
@@ -57,9 +50,9 @@ The model has been trained using an efficient few-shot learning technique that i
|
|
57 |
|
58 |
### Model Description
|
59 |
- **Model Type:** SetFit
|
60 |
-
- **Sentence Transformer body:** [desarrolloasesoreslocales/bert-leg-al-
|
61 |
- **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
|
62 |
-
- **Maximum Sequence Length:**
|
63 |
- **Number of Classes:** 19 classes
|
64 |
<!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
|
65 |
<!-- - **Language:** Unknown -->
|
@@ -72,34 +65,34 @@ The model has been trained using an efficient few-shot learning technique that i
|
|
72 |
- **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
|
73 |
|
74 |
### Model Labels
|
75 |
-
| Label | Examples
|
76 |
-
|
77 |
-
|
|
78 |
-
|
|
79 |
-
|
|
80 |
-
|
|
81 |
-
|
|
82 |
-
|
|
83 |
-
|
|
84 |
-
|
|
85 |
-
|
|
86 |
-
|
|
87 |
-
|
|
88 |
-
|
|
89 |
-
|
|
90 |
-
|
|
91 |
-
|
|
92 |
-
|
|
93 |
-
|
|
94 |
-
| 78 | <ul><li>'
|
95 |
-
|
|
96 |
|
97 |
## Evaluation
|
98 |
|
99 |
### Metrics
|
100 |
| Label | Accuracy |
|
101 |
|:--------|:---------|
|
102 |
-
| **all** | 0.
|
103 |
|
104 |
## Uses
|
105 |
|
@@ -119,8 +112,7 @@ from setfit import SetFitModel
|
|
119 |
# Download from the 🤗 Hub
|
120 |
model = SetFitModel.from_pretrained("desarrolloasesoreslocales/bert-leg-al-setfit")
|
121 |
# Run inference
|
122 |
-
preds = model("
|
123 |
-
")
|
124 |
```
|
125 |
|
126 |
<!--
|
@@ -152,78 +144,238 @@ preds = model("Remisión de la prueba fotográfica que pudo y debió tomar el ag
|
|
152 |
### Training Set Metrics
|
153 |
| Training set | Min | Median | Max |
|
154 |
|:-------------|:----|:--------|:----|
|
155 |
-
| Word count |
|
156 |
|
157 |
| Label | Training Sample Count |
|
158 |
|:------|:----------------------|
|
159 |
-
| 49 |
|
160 |
-
| 78 |
|
161 |
-
| 304 |
|
162 |
-
| 353 |
|
163 |
-
| 357 |
|
164 |
| 994 | 11 |
|
165 |
-
| 1001 |
|
166 |
-
| 2001 |
|
167 |
-
| 2002 |
|
168 |
-
| 2010 |
|
169 |
-
| 2013 |
|
170 |
-
| 2014 |
|
171 |
| 2017 | 11 |
|
172 |
-
|
|
173 |
-
|
|
174 |
-
| 2037 |
|
175 |
-
| 2038 |
|
176 |
| 2039 | 11 |
|
177 |
-
| 2060 |
|
178 |
|
179 |
### Training Hyperparameters
|
180 |
-
- batch_size: (
|
181 |
- num_epochs: (1, 1)
|
182 |
-
- max_steps:
|
183 |
- sampling_strategy: oversampling
|
184 |
-
-
|
185 |
-
-
|
186 |
-
- head_learning_rate: 3e-05
|
187 |
- loss: CosineSimilarityLoss
|
188 |
- distance_metric: cosine_distance
|
189 |
- margin: 0.25
|
190 |
-
- end_to_end:
|
191 |
- use_amp: True
|
192 |
- warmup_proportion: 0.1
|
193 |
- seed: 42
|
194 |
-
- eval_max_steps:
|
195 |
- load_best_model_at_end: False
|
196 |
|
197 |
### Training Results
|
198 |
| Epoch | Step | Training Loss | Validation Loss |
|
199 |
|:------:|:----:|:-------------:|:---------------:|
|
200 |
-
| 0.
|
201 |
-
| 0.
|
202 |
-
| 0.
|
203 |
-
| 0.
|
204 |
-
| 0.
|
205 |
-
| 0.
|
206 |
-
| 0.
|
207 |
-
| 0.
|
208 |
-
| 0.
|
209 |
-
| 0.
|
210 |
-
| 0.
|
211 |
-
| 0.
|
212 |
-
| 0.
|
213 |
-
| 0.
|
214 |
-
| 0.
|
215 |
-
| 0.
|
216 |
-
| 0.
|
217 |
-
| 0.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
218 |
|
219 |
### Framework Versions
|
220 |
- Python: 3.10.12
|
221 |
- SetFit: 1.0.3
|
222 |
-
- Sentence Transformers: 3.0.
|
223 |
-
- Transformers: 4.
|
224 |
- PyTorch: 2.3.0+cu121
|
225 |
-
- Datasets: 2.
|
226 |
-
- Tokenizers: 0.
|
227 |
|
228 |
## Citation
|
229 |
|
|
|
5 |
- sentence-transformers
|
6 |
- text-classification
|
7 |
- generated_from_setfit_trainer
|
8 |
+
base_model: desarrolloasesoreslocales/bert-leg-al-corpus
|
9 |
metrics:
|
10 |
- accuracy
|
11 |
widget:
|
12 |
+
- text: Me dirijo a ustedes para solicitar la anulación de la multa recibida por aparcar
|
13 |
+
en un espacio reservado para personas con movilidad reducida, ya que la tarjeta
|
14 |
+
se encontraba en el lugar habitual en el vehículo y era perfectamente visible.
|
15 |
+
- text: Solicito informe del denunciante para que explique las razones por las que
|
16 |
+
se considera que la infracción no se cometió.
|
17 |
+
- text: ay que alegar que con el presente expediente se vulnera el PRINCIPIO DE PROPORCIONALIDAD
|
18 |
+
- text: La notificación posterior a la infracción es inválida, ya que no se cumplió
|
19 |
+
con el procedimiento establecido.
|
20 |
+
- text: La denuncia no fue notificada dentro del plazo establecido, por lo que se
|
21 |
+
considera prescrita la acción para sancionar la supuesta infracción
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
22 |
pipeline_tag: text-classification
|
23 |
inference: true
|
24 |
model-index:
|
25 |
+
- name: SetFit with desarrolloasesoreslocales/bert-leg-al-corpus
|
26 |
results:
|
27 |
- task:
|
28 |
type: text-classification
|
|
|
33 |
split: test
|
34 |
metrics:
|
35 |
- type: accuracy
|
36 |
+
value: 0.8421052631578947
|
37 |
name: Accuracy
|
38 |
---
|
39 |
|
40 |
+
# SetFit with desarrolloasesoreslocales/bert-leg-al-corpus
|
41 |
|
42 |
+
This is a [SetFit](https://github.com/huggingface/setfit) model that can be used for Text Classification. This SetFit model uses [desarrolloasesoreslocales/bert-leg-al-corpus](https://huggingface.co/desarrolloasesoreslocales/bert-leg-al-corpus) as the Sentence Transformer embedding model. A [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance is used for classification.
|
43 |
|
44 |
The model has been trained using an efficient few-shot learning technique that involves:
|
45 |
|
|
|
50 |
|
51 |
### Model Description
|
52 |
- **Model Type:** SetFit
|
53 |
+
- **Sentence Transformer body:** [desarrolloasesoreslocales/bert-leg-al-corpus](https://huggingface.co/desarrolloasesoreslocales/bert-leg-al-corpus)
|
54 |
- **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
|
55 |
+
- **Maximum Sequence Length:** 512 tokens
|
56 |
- **Number of Classes:** 19 classes
|
57 |
<!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
|
58 |
<!-- - **Language:** Unknown -->
|
|
|
65 |
- **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
|
66 |
|
67 |
### Model Labels
|
68 |
+
| Label | Examples |
|
69 |
+
|:------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
70 |
+
| 49 | <ul><li>'Esta parte no tiene constancia de que dicha infracción se haya cometido, negando los cargos que se me imputan, ya que siempre se estaciona respetando todas las normas establecidas. '</li><li>' Que, los hechos denunciados no son ciertos, ya que soy el titular y conductor habitual del vehículo que se refiere la presente denuncia, Audi ad, matrícula 0076-DRM. Manifestar que nunca he estado en Chipiona.'</li><li>'a sanción en materia de tráfico así como la retirada al depósito municipal no debió producirse'</li></ul> |
|
71 |
+
| 2017 | <ul><li>'No hay elementos que indiquen que el vehículo obstaculizara el tráfico, por lo que la denuncia es infundada.'</li><li>'El vehículo no representa un peligro para la circulación, se encuentra detenido en un lugar autorizado y no obstaculiza el tráfico.'</li><li>'QUE NO IMPOSIBILITA EL TRANSITO DE OTROS VEHICULOS, NO OBSTACULIZA LOS VEHICULOS AUTORIZADOS YA QUE NO HAY PARTIDO DE FUTBOL Y AUN ASÍ BAJO LA SUPERVISION EL RESPONSABLE DEL TALLER A ESPERA DE PODER MOVILIZAR EL VEHICULO PARA EL INTERIOR'</li></ul> |
|
72 |
+
| 994 | <ul><li>'Fotografía del vehículo denunciado en la zona de estacionamiento.'</li><li>'Prueba fotográfica del vehículo sancionado ante la negativa clara y rotunda del que suscribe.'</li><li>'fotografía del vehículo y del lugar donde se encontraba el mismo,'</li></ul> |
|
73 |
+
| 304 | <ul><li>'Vita dol expodionto sancionador.'</li><li>' Remisión del informe del denunciante donde se manifieste sobre las alegaciones efectuadas por este interesado.'</li><li>'Solicito a este Ayuntamiento que me remita a mi domicilio las pruebas acreditativas del extremo que se me pretende imputar, de conformidad con el articulo 76 L.S.V.: - Documental: para que se incorpore al expediente informe del Agente denunciante relativo a las circunstancias de la presunta infracción con expresión en concreto de su consideración acerca de la relación entre la conducta del presunto infractor y su determinación como infracción tipificada.'</li></ul> |
|
74 |
+
| 2026 | <ul><li>'Que con el fin de acreditar las afirmaciones anteriormente manifestadas en este escrito de descargos, y sin perjuicio de las demás actuaciones que de oficio sean practicadas por el órgano instructor competente, se propone la práctica de los siguientes medios de prueba:'</li><li>'se propone la práctica de los siguientes medios de prueba: fotografías del aparcamiento indebido en el que se refleje exactamente el lugar de estacionamiento y la ocupación del vehículo de la zona reservada a minusválidos'</li><li>'El día en que se formuló la denuncia no se notificó la misma en el momento por lo que solicito que me sea remitida copia del boletín completado por el denunciante.'</li></ul> |
|
75 |
+
| 2037 | <ul><li>'Reclamo la multa recibida por aparcar en un espacio PMR, ya que la tarjeta correspondiente se encontraba en el lugar correcto y visible en el momento de la infracción, y adjunto la documentación pertinente que acredita mi condición de persona con movilidad reducida.'</li><li>'Teniendo en cuenta que mi padre, titular de la tarjeta de persona con movilidad reducida, se encuentra en situación de dependencia absoluta y requiere mi atención constante, solicito la anulación de la multa ya que la tarjeta se encontraba en el lugar habitual en el vehículo.'</li><li>'Encontrándome en la calle Playa, Puerto de Santa María, aparqué en aparcamiento reservado PMR, siendo yo usuario de Tarjeta de aparcamiento PMR. Me pone en la multa que no está visible ni la fecha ni número de expediente. Me hacen una foto de la matricula de mi coche, pero no me demuestran que no se podía ver la fecha de expedición ni expediente. "Que me sea retirada dicha multa al tener en vigor la tarjeta de PMR, les mando foto de multa y de mi tarjeta PMR. '</li></ul> |
|
76 |
+
| 2060 | <ul><li>'Le trasmllo que por descuido no dejé la tarjeta de autorizado bien visible desde fuera, Por lo que una vez. ¡Que informo al acente de tal circunstancia, este me manifesta que solicite la corespondiente alegación '</li><li>'solicito informe contestación del Agente de Policía Local 2562 de Sanlucar de Barrameda,'</li><li>'QUE SE SOLICITA INFORME DE LOS AGENTES DENUNCIANTES, EN EL QUE SE PODRÁ APRECIAR LOS HECHOS ARRIBA RESEÑADOS, PARA LA ESTIMACIÓN DE LAS ALEGACIONES PRESENTADAS EN TIEMPO Y FORMAS. '</li></ul> |
|
77 |
+
| 2014 | <ul><li>'En relación con la cuantía económica impuesta, considero que es desproporcionada y no se ajusta a los criterios establecidos en la normativa vigente.'</li><li>'En cuanto ala sanción propuesta para la Infracción cometida, considero que la misma, es contraria al principlo de proporcionalidad '</li><li>'La falta de graduación de la sanción en función de la gravedad del hecho denunciado vulnera el principio de proporcionalidad.'</li></ul> |
|
78 |
+
| 2001 | <ul><li>'APERTURA DEL PERÍODO PROBATORIO.\r\nQue para el conocimiento correcto del hecho y de conformidad con el Reglamento de Procedimiento sancionador en materia de tráfico, se proceda por el instructor a la apertura del periodo de prueba, comunicando a este exponente la fecha de inicio y las pruebas admitidas. Y solicita como MEDIOS PROBATORIOS'</li><li>'CONDUCE MOTOCICLETA ARRANCADA Y APEADO DE ELLA SIN CASCO, ES DECIR, QUE NO SE ENCUENTRA ENCIMA DE LA MOTO, CON LO CUAL, NO EXISTE LA OBLIGACIÓN DE LLEVAR CASCO, ENTONCES ESTA SANCIÓN NO DEBERÍA TENER NINGÚN SENTIDO. '</li><li>'Que tenga por presentado este escrito en tiempo y forma, se sirva admitirlo y, atendiendo a los razonamientos expuestos, tenga a bien dictar la anulación del procedimiento sancionador a que hubiera de dar lugar el citado boletín de denuncia EP8707582, de fecha 02/04/2023, por las circunstancias descritas en el parrafo anterior.'</li></ul> |
|
79 |
+
| 2013 | <ul><li>'En aplicación del principio de proporcionalidad, solicito se ajuste la sanción a la gravedad de la falta cometida.'</li><li>'Encuanto ala sanción propuesta para la infracción cometida, considero que la misma, es contraria al principio de proporcionalidad y de presunción de inocencia, dado que no ha quedado acreditada la comisión del hecho que se me imputa, debido a la omisión de todo tipo de elementos probatorios objetivos y directos que lleven a la Administración actuante a apreciar que el hecho denunciado sea constitutivo de infracción y su debida calificación.'</li><li>'La cuantía económica impuesta es contraria al principio de proporcionalidad, por lo que solicito se reduzca.'</li></ul> |
|
80 |
+
| 2039 | <ul><li>'No se recibió la aticación de la denuncia, con el requerimiento para que identiicase al dto de! hecho on que consista la supuesta infracción orinara, dentro dl plazo establecido enla Ley de Seguridad Vial, ya que entre la fecha dela denuncia, 2604-2023 y la fecha de recepción de la misma 13-11-2003 Iranscunieron mes de seis meses, por lo que desconociendo cualquier actuación del Ayuntamiento dentro de este perodo, considero PRESCRITA, mientras no se demuestro documentalmente lo contraria, la acción para sancionar la supuesta infracción'</li><li>'Que de acuerdo a lo expuesto en los párrafos anteriores el hecho denunciado se encuentra prescrito y en consecuencia extinguida toda responsabilidad.'</li><li>'Se ha producido la prescripción de la acción para sancionar infracciones en materia de tráfico. '</li></ul> |
|
81 |
+
| 353 | <ul><li>'Lo presente sanción objeto de este recurso no es procedente, al haberse producido una concurrencia de sanciones, ya que el recurente fue denunciado y sancionado por idénticas hechos y fundamentos en el expediente 0033/2029/8725164,'</li><li>' Hemos de aclarar que las tres denuncias han sido impuestas por el mismo hecho, siendo el mismo vehículo el objeto de éstas, mismo lugar y sin que el vehículo haya circulado en el escaso tiempo que transcurre entre las fechas que van desde la primera denuncia y la última. Es por ello que, una vez formulada la primera de las denuncias reseñadas, a cuyo pago ya se ha procedido a realizar, con la segunda y la tercera de las denuncias ahora notificadas, se infringe el principio general del Derecho non bís in idem, ya que no podrán sancionarse en más de una ocasión una misma conducta.'</li><li>'Que el vehículo ha sido sancionado con 30 min. de diferencia en la misma dirección c/ Candray 2 y por el mismo motivo por dos agentes distintos. Anulen la denuncia nº EPE806711 ya que la otra con num. EP 8806690 ha sigo abonada. Basándome en el principio legal llamado "Non bis in Idem, es decir, que no se puede castigar dos veces a la misma persona por la misma infracción. '</li></ul> |
|
82 |
+
| 1001 | <ul><li>'También existe un serio defecto de forma en la redacción del boletín de denuncia al no poder identificar al conductor in situ, se debería solicitar en dicho boletín la identificación del conductor del vehículo en el momento de la infracción, cosa que se ha omitido y no suponer que el conductor coincide con el propietario del vehículo.'</li><li>'haya defectos de forma en la denuncia, ya que al no ser identificado el conductor en el momento de la denuncia, pueda existir un error por parte del agente a la hora de la anotación de la matrícula. Así como por la infracción cometida, no llevar el cinturón de seguridad abrochado, que para poder detectar de forma clara y precisa la comisión Fecha y Hora 07/12/2020 10:22:50 DIPUTACIÓN PROVINCIAL DE CADIZ Ade LE https://sede.dipucadiz.es/verifirma/code/IV7G262DHFOKRBG4BRHTKABHMA - 2 / 8 de la infracción requiere detener la marcha del vehículo y poder ver de desde una distancia muy cercana que el conductor no hace uso del cinturón de seguridad'</li><li>'Que habiendo recibido una denuncia con 0 SF2684366 sobre el venculo marca AUDI AS SPORTBACK con matricula 507312), les tenemos ue decir que nunca hemos estado en Cádiz y que aunque la matricula s que pertenece a nuesto venieulo la foto NO comesponde, '</li></ul> |
|
83 |
+
| 2002 | <ul><li>'Solicito que se me remita la copia del boletín completado por el denunciante, ya que no se notificó la denuncia en el momento de la infracción, lo que vulnera el artículo 10 del RD. 320/94.'</li><li>'La sanción no fue notificada en el acto'</li><li>'Considero que la ausencia de notificación de la denuncia en el acto al conductor del vehículo vicia de nulidad dicha denuncia, y por extensión, vicia el resto del procedimiento cuya validez depende de que se notifique en el acto la denuncia, o en su caso se expresen las razones que impidan llevar a cabo esta notificación. Resulta evidente que el instructor me da traslado del precepto literal supuestamente infringido, si bien el artículo 87.2 del Real Decreto Legislativo 6/2015, de 30 de octubre, por el que se aprueba el texto refundido de la Ley sobre Tráfico, Circulación de Vehículos a Motor y Seguridad, en materia sancionadora; señala que “En las denuncias por hechos de circulación deberá constar, en todo caso.\r\n\r\na) La identificación del vehiculo con el que se haya cometido la presunta infracción.\r\n\r\nb) La identidad del denunciado, si se conoce.\r\n\r\ne) Una descripción sucinta del hecho, con expresión del lugar o tramo, fecha y hora.\r\n\r\nd) El nombre, apellidos y domicilio del denunciante o, si es un agente de la autoridad, su número de identificación profesional. ” Por lo tanto, la denuncia no se notifica en el acto, a esta parte no se le notifica por qué no se produce tal circunstancia, y además los hechos denunciados se limitan a transcribir el precepto supuestamente infringido.'</li></ul> |
|
84 |
+
| 2022 | <ul><li>'la falta de concreción en la denuncia impide determinar la existencia de una infracción, y por tanto, no se puede imponer una sanción'</li><li>'la falta de concreción en la denuncia hace que no se pueda determinar la existencia de una infracción, y por tanto, no se puede imponer una sanción'</li><li>'la denuncia no contiene una descripción clara y concreta de los hechos, lo que impide determinar la responsabilidad del denunciado'</li></ul> |
|
85 |
+
| 2038 | <ul><li>'La infracción imputada no se ajusta a los elementos y requisitos necesarios para ser considerada como tal, vulnerando el principio de tipicidad.'</li><li>'En el presente procedimiento sancionador se vulnera el Principio de Tipicidad, y es que el artículo 25.1 de la Constitución Española, establece la obligatoriedad de la tipificación legal de las infracciones al disponer que nadie pueda ser sancionado por acciones u omisiones que en el momento de producirse no constituyan infracción administrativa según la legislación vigente en aquel momento.'</li><li>'La vulneración del principio de tipicidad se produce al no estar la infracción administrativa prevista en la ley correspondiente.'</li></ul> |
|
86 |
+
| 2010 | <ul><li>'La denuncia presentada carece de fundamento y no se ajusta a la realidad, por lo que solicito su anulación y la práctica de pruebas para esclarecer los hechos.'</li><li>'La declaración del agente no es suficiente para considerarla como prueba plena, por lo que se requiere la práctica de otras pruebas para esclarecer los hechos.'</li><li>'La declaración del agente no es suficiente para considerarla como prueba plena, por lo que se requiere la práctica de otras pruebas para esclarecer los hechos y determinar la responsabilidad.'</li></ul> |
|
87 |
+
| 78 | <ul><li>'La denuncia carece de fundamentos probatorios, lo que vulnera el derecho a la presunción de inocencia.'</li><li>'La falta de pruebas objetivas y directas vulnera el principio de presunción de inocencia, ya que no se ha acreditado la comisión de la infracción.'</li><li>'A fin de no vulnerar el Derecho a la presunción de inocencia que establece el artículo 24.2 de nuestra Carta Magna en relación con el artículo 53 de la Ley 39/2015, de 1 de octubre, del Procedimiento Administrativo Común, debe ser la Administración la que ha de probar la realidad de los hechos objeto de la denuncia. En el marco del procedimiento administrativo sancionador está garantizado «el derecho a no sufrir una sanción que no tenga fundamento en una previa actividad probatoria sobre la cual el órgano competente pueda fundamentar un juicio razonable de culpabilidad» STC 212/1990'</li></ul> |
|
88 |
+
| 357 | <ul><li>'La descripción del hecho denunciado es vaga y no se proporciona información suficiente para entender la conducta real del denunciado.'</li><li>'La motivación de la sanción no se ajusta a la realidad de los hechos, lo que me causa una grave indefensión.'</li><li>'La denuncia no contiene una descripción sucinta del hecho, lo que me deja sin los elementos de juicio necesarios.'</li></ul> |
|
89 |
|
90 |
## Evaluation
|
91 |
|
92 |
### Metrics
|
93 |
| Label | Accuracy |
|
94 |
|:--------|:---------|
|
95 |
+
| **all** | 0.8421 |
|
96 |
|
97 |
## Uses
|
98 |
|
|
|
112 |
# Download from the 🤗 Hub
|
113 |
model = SetFitModel.from_pretrained("desarrolloasesoreslocales/bert-leg-al-setfit")
|
114 |
# Run inference
|
115 |
+
preds = model("ay que alegar que con el presente expediente se vulnera el PRINCIPIO DE PROPORCIONALIDAD")
|
|
|
116 |
```
|
117 |
|
118 |
<!--
|
|
|
144 |
### Training Set Metrics
|
145 |
| Training set | Min | Median | Max |
|
146 |
|:-------------|:----|:--------|:----|
|
147 |
+
| Word count | 4 | 36.8856 | 231 |
|
148 |
|
149 |
| Label | Training Sample Count |
|
150 |
|:------|:----------------------|
|
151 |
+
| 49 | 36 |
|
152 |
+
| 78 | 10 |
|
153 |
+
| 304 | 22 |
|
154 |
+
| 353 | 10 |
|
155 |
+
| 357 | 10 |
|
156 |
| 994 | 11 |
|
157 |
+
| 1001 | 10 |
|
158 |
+
| 2001 | 10 |
|
159 |
+
| 2002 | 10 |
|
160 |
+
| 2010 | 10 |
|
161 |
+
| 2013 | 10 |
|
162 |
+
| 2014 | 10 |
|
163 |
| 2017 | 11 |
|
164 |
+
| 2022 | 10 |
|
165 |
+
| 2026 | 21 |
|
166 |
+
| 2037 | 10 |
|
167 |
+
| 2038 | 10 |
|
168 |
| 2039 | 11 |
|
169 |
+
| 2060 | 39 |
|
170 |
|
171 |
### Training Hyperparameters
|
172 |
+
- batch_size: (48, 48)
|
173 |
- num_epochs: (1, 1)
|
174 |
+
- max_steps: 5000
|
175 |
- sampling_strategy: oversampling
|
176 |
+
- body_learning_rate: (3e-06, 3e-06)
|
177 |
+
- head_learning_rate: 2e-05
|
|
|
178 |
- loss: CosineSimilarityLoss
|
179 |
- distance_metric: cosine_distance
|
180 |
- margin: 0.25
|
181 |
+
- end_to_end: True
|
182 |
- use_amp: True
|
183 |
- warmup_proportion: 0.1
|
184 |
- seed: 42
|
185 |
+
- eval_max_steps: 100
|
186 |
- load_best_model_at_end: False
|
187 |
|
188 |
### Training Results
|
189 |
| Epoch | Step | Training Loss | Validation Loss |
|
190 |
|:------:|:----:|:-------------:|:---------------:|
|
191 |
+
| 0.0001 | 1 | 0.371 | - |
|
192 |
+
| 0.0074 | 50 | 0.3118 | 0.3225 |
|
193 |
+
| 0.0148 | 100 | 0.2343 | 0.1789 |
|
194 |
+
| 0.0221 | 150 | 0.1885 | 0.1228 |
|
195 |
+
| 0.0295 | 200 | 0.1359 | 0.1067 |
|
196 |
+
| 0.0369 | 250 | 0.1251 | 0.0885 |
|
197 |
+
| 0.0443 | 300 | 0.0923 | 0.0795 |
|
198 |
+
| 0.0517 | 350 | 0.0274 | 0.0752 |
|
199 |
+
| 0.0590 | 400 | 0.1386 | 0.0648 |
|
200 |
+
| 0.0664 | 450 | 0.1388 | 0.058 |
|
201 |
+
| 0.0738 | 500 | 0.0181 | 0.0602 |
|
202 |
+
| 0.0812 | 550 | 0.0151 | 0.0657 |
|
203 |
+
| 0.0886 | 600 | 0.0054 | 0.0585 |
|
204 |
+
| 0.0959 | 650 | 0.005 | 0.0558 |
|
205 |
+
| 0.1033 | 700 | 0.0077 | 0.0605 |
|
206 |
+
| 0.1107 | 750 | 0.0038 | 0.0486 |
|
207 |
+
| 0.1181 | 800 | 0.1056 | 0.0571 |
|
208 |
+
| 0.1255 | 850 | 0.1113 | 0.0548 |
|
209 |
+
| 0.1328 | 900 | 0.001 | 0.0513 |
|
210 |
+
| 0.1402 | 950 | 0.0005 | 0.0581 |
|
211 |
+
| 0.1476 | 1000 | 0.0234 | 0.0607 |
|
212 |
+
| 0.1550 | 1050 | 0.0391 | 0.052 |
|
213 |
+
| 0.1624 | 1100 | 0.0025 | 0.0519 |
|
214 |
+
| 0.1697 | 1150 | 0.0467 | 0.0536 |
|
215 |
+
| 0.1771 | 1200 | 0.0657 | 0.0516 |
|
216 |
+
| 0.1845 | 1250 | 0.1097 | 0.0492 |
|
217 |
+
| 0.1919 | 1300 | 0.0007 | 0.054 |
|
218 |
+
| 0.1993 | 1350 | 0.0268 | 0.056 |
|
219 |
+
| 0.2066 | 1400 | 0.0008 | 0.0571 |
|
220 |
+
| 0.2140 | 1450 | 0.0013 | 0.0581 |
|
221 |
+
| 0.2214 | 1500 | 0.0008 | 0.0577 |
|
222 |
+
| 0.2288 | 1550 | 0.0003 | 0.0584 |
|
223 |
+
| 0.2362 | 1600 | 0.0022 | 0.0593 |
|
224 |
+
| 0.2435 | 1650 | 0.0058 | 0.0555 |
|
225 |
+
| 0.2509 | 1700 | 0.0026 | 0.0582 |
|
226 |
+
| 0.2583 | 1750 | 0.0009 | 0.0584 |
|
227 |
+
| 0.2657 | 1800 | 0.0003 | 0.0563 |
|
228 |
+
| 0.2731 | 1850 | 0.0004 | 0.0596 |
|
229 |
+
| 0.2804 | 1900 | 0.0004 | 0.0552 |
|
230 |
+
| 0.2878 | 1950 | 0.0001 | 0.0543 |
|
231 |
+
| 0.2952 | 2000 | 0.0046 | 0.0535 |
|
232 |
+
| 0.3026 | 2050 | 0.0004 | - |
|
233 |
+
| 0.0005 | 1 | 0.0017 | - |
|
234 |
+
| 0.0235 | 50 | 0.0209 | 0.0551 |
|
235 |
+
| 0.0469 | 100 | 0.0197 | 0.0525 |
|
236 |
+
| 0.0704 | 150 | 0.0099 | 0.0555 |
|
237 |
+
| 0.0939 | 200 | 0.0284 | 0.055 |
|
238 |
+
| 0.1174 | 250 | 0.0066 | 0.0482 |
|
239 |
+
| 0.1408 | 300 | 0.0065 | 0.0485 |
|
240 |
+
| 0.1643 | 350 | 0.0003 | 0.0453 |
|
241 |
+
| 0.1878 | 400 | 0.0164 | 0.048 |
|
242 |
+
| 0.2113 | 450 | 0.0044 | 0.0488 |
|
243 |
+
| 0.2347 | 500 | 0.0013 | 0.0447 |
|
244 |
+
| 0.2582 | 550 | 0.0107 | 0.0476 |
|
245 |
+
| 0.2817 | 600 | 0.0302 | 0.047 |
|
246 |
+
| 0.3052 | 650 | 0.0028 | 0.048 |
|
247 |
+
| 0.3286 | 700 | 0.0001 | 0.0462 |
|
248 |
+
| 0.3521 | 750 | 0.0009 | 0.0477 |
|
249 |
+
| 0.3756 | 800 | 0.0004 | 0.0488 |
|
250 |
+
| 0.3991 | 850 | 0.0035 | 0.0497 |
|
251 |
+
| 0.4225 | 900 | 0.0026 | 0.0479 |
|
252 |
+
| 0.4460 | 950 | 0.0033 | 0.0497 |
|
253 |
+
| 0.4695 | 1000 | 0.0001 | 0.0493 |
|
254 |
+
| 0.0005 | 1 | 0.0001 | - |
|
255 |
+
| 0.0235 | 50 | 0.0224 | 0.0499 |
|
256 |
+
| 0.0469 | 100 | 0.0168 | 0.0486 |
|
257 |
+
| 0.0704 | 150 | 0.0067 | 0.0542 |
|
258 |
+
| 0.0939 | 200 | 0.0048 | 0.0517 |
|
259 |
+
| 0.1174 | 250 | 0.0057 | 0.0485 |
|
260 |
+
| 0.1408 | 300 | 0.0052 | 0.0557 |
|
261 |
+
| 0.1643 | 350 | 0.0006 | 0.0468 |
|
262 |
+
| 0.1878 | 400 | 0.0147 | 0.0498 |
|
263 |
+
| 0.2113 | 450 | 0.0031 | 0.0539 |
|
264 |
+
| 0.2347 | 500 | 0.0008 | 0.0487 |
|
265 |
+
| 0.2582 | 550 | 0.0104 | 0.0504 |
|
266 |
+
| 0.2817 | 600 | 0.0298 | 0.05 |
|
267 |
+
| 0.3052 | 650 | 0.0016 | 0.0525 |
|
268 |
+
| 0.3286 | 700 | 0.0001 | 0.0478 |
|
269 |
+
| 0.3521 | 750 | 0.0012 | 0.0532 |
|
270 |
+
| 0.3756 | 800 | 0.0003 | 0.052 |
|
271 |
+
| 0.3991 | 850 | 0.004 | 0.0512 |
|
272 |
+
| 0.4225 | 900 | 0.0031 | 0.0491 |
|
273 |
+
| 0.4460 | 950 | 0.0029 | 0.0496 |
|
274 |
+
| 0.4695 | 1000 | 0.0001 | 0.0495 |
|
275 |
+
| 0.4930 | 1050 | 0.0003 | 0.0483 |
|
276 |
+
| 0.5164 | 1100 | 0.0001 | 0.0558 |
|
277 |
+
| 0.5399 | 1150 | 0.0023 | 0.0533 |
|
278 |
+
| 0.5634 | 1200 | 0.013 | 0.0526 |
|
279 |
+
| 0.5869 | 1250 | 0.0052 | 0.0498 |
|
280 |
+
| 0.6103 | 1300 | 0.0002 | 0.0532 |
|
281 |
+
| 0.6338 | 1350 | 0.0038 | 0.0531 |
|
282 |
+
| 0.6573 | 1400 | 0.0015 | 0.0515 |
|
283 |
+
| 0.6808 | 1450 | 0.0056 | 0.0591 |
|
284 |
+
| 0.7042 | 1500 | 0.001 | 0.0597 |
|
285 |
+
| 0.7277 | 1550 | 0.0068 | 0.0555 |
|
286 |
+
| 0.7512 | 1600 | 0.0006 | 0.0529 |
|
287 |
+
| 0.7746 | 1650 | 0.0011 | 0.0527 |
|
288 |
+
| 0.7981 | 1700 | 0.0011 | 0.0542 |
|
289 |
+
| 0.8216 | 1750 | 0.0001 | 0.0502 |
|
290 |
+
| 0.8451 | 1800 | 0.0029 | 0.0531 |
|
291 |
+
| 0.8685 | 1850 | 0.0003 | 0.0571 |
|
292 |
+
| 0.8920 | 1900 | 0.0003 | 0.0529 |
|
293 |
+
| 0.9155 | 1950 | 0.0012 | 0.051 |
|
294 |
+
| 0.9390 | 2000 | 0.002 | 0.0511 |
|
295 |
+
| 0.9624 | 2050 | 0.0038 | 0.0539 |
|
296 |
+
| 0.9859 | 2100 | 0.0014 | 0.0495 |
|
297 |
+
| 0.0007 | 1 | 0.0018 | - |
|
298 |
+
| 0.0352 | 50 | 0.0126 | 0.051 |
|
299 |
+
| 0.0704 | 100 | 0.0063 | 0.0511 |
|
300 |
+
| 0.1056 | 150 | 0.0026 | 0.0512 |
|
301 |
+
| 0.1408 | 200 | 0.0035 | 0.0519 |
|
302 |
+
| 0.1761 | 250 | 0.0033 | 0.0508 |
|
303 |
+
| 0.2113 | 300 | 0.0028 | 0.0505 |
|
304 |
+
| 0.2465 | 350 | 0.0002 | 0.0505 |
|
305 |
+
| 0.2817 | 400 | 0.0183 | 0.0501 |
|
306 |
+
| 0.3169 | 450 | 0.0021 | 0.0505 |
|
307 |
+
| 0.3521 | 500 | 0.0018 | 0.0507 |
|
308 |
+
| 0.3873 | 550 | 0.0175 | 0.0511 |
|
309 |
+
| 0.4225 | 600 | 0.0016 | 0.0513 |
|
310 |
+
| 0.4577 | 650 | 0.0006 | 0.0508 |
|
311 |
+
| 0.4930 | 700 | 0.0031 | 0.0504 |
|
312 |
+
| 0.5282 | 750 | 0.004 | 0.0509 |
|
313 |
+
| 0.5634 | 800 | 0.0044 | 0.0511 |
|
314 |
+
| 0.5986 | 850 | 0.0013 | 0.0512 |
|
315 |
+
| 0.6338 | 900 | 0.0014 | 0.0517 |
|
316 |
+
| 0.6690 | 950 | 0.0139 | 0.0515 |
|
317 |
+
| 0.7042 | 1000 | 0.0009 | 0.0522 |
|
318 |
+
| 0.7394 | 1050 | 0.0008 | 0.0518 |
|
319 |
+
| 0.7746 | 1100 | 0.0015 | 0.0518 |
|
320 |
+
| 0.8099 | 1150 | 0.0031 | 0.0521 |
|
321 |
+
| 0.8451 | 1200 | 0.0027 | 0.0516 |
|
322 |
+
| 0.8803 | 1250 | 0.0013 | 0.0517 |
|
323 |
+
| 0.9155 | 1300 | 0.0015 | 0.0518 |
|
324 |
+
| 0.9507 | 1350 | 0.0001 | 0.052 |
|
325 |
+
| 0.9859 | 1400 | 0.001 | 0.0518 |
|
326 |
+
| 0.0007 | 1 | 0.0007 | - |
|
327 |
+
| 0.0352 | 50 | 0.0153 | 0.055 |
|
328 |
+
| 0.0704 | 100 | 0.0095 | 0.056 |
|
329 |
+
| 0.1056 | 150 | 0.0038 | 0.0692 |
|
330 |
+
| 0.1408 | 200 | 0.0072 | 0.0738 |
|
331 |
+
| 0.1761 | 250 | 0.0031 | 0.069 |
|
332 |
+
| 0.2113 | 300 | 0.0035 | 0.0618 |
|
333 |
+
| 0.2465 | 350 | 0.0004 | 0.0617 |
|
334 |
+
| 0.2817 | 400 | 0.02 | 0.0638 |
|
335 |
+
| 0.3169 | 450 | 0.003 | 0.0649 |
|
336 |
+
| 0.0007 | 1 | 0.0038 | - |
|
337 |
+
| 0.0352 | 50 | 0.0164 | 0.0607 |
|
338 |
+
| 0.0704 | 100 | 0.0084 | 0.0711 |
|
339 |
+
| 0.1056 | 150 | 0.0031 | 0.0653 |
|
340 |
+
| 0.1408 | 200 | 0.0034 | 0.0703 |
|
341 |
+
| 0.0007 | 1 | 0.0125 | - |
|
342 |
+
| 0.0352 | 50 | 0.0108 | 0.0602 |
|
343 |
+
| 0.0704 | 100 | 0.0056 | 0.0589 |
|
344 |
+
| 0.1056 | 150 | 0.0019 | 0.0598 |
|
345 |
+
| 0.1408 | 200 | 0.0025 | 0.0626 |
|
346 |
+
| 0.1761 | 250 | 0.0032 | 0.0576 |
|
347 |
+
| 0.2113 | 300 | 0.0033 | 0.0565 |
|
348 |
+
| 0.2465 | 350 | 0.0002 | 0.0574 |
|
349 |
+
| 0.2817 | 400 | 0.018 | 0.0575 |
|
350 |
+
| 0.3169 | 450 | 0.0022 | 0.0573 |
|
351 |
+
| 0.3521 | 500 | 0.0016 | 0.0553 |
|
352 |
+
| 0.3873 | 550 | 0.0165 | 0.0565 |
|
353 |
+
| 0.4225 | 600 | 0.0016 | 0.0565 |
|
354 |
+
| 0.4577 | 650 | 0.0002 | 0.0557 |
|
355 |
+
| 0.4930 | 700 | 0.0033 | 0.0553 |
|
356 |
+
| 0.5282 | 750 | 0.0039 | 0.0573 |
|
357 |
+
| 0.5634 | 800 | 0.0034 | 0.0574 |
|
358 |
+
| 0.5986 | 850 | 0.001 | 0.0578 |
|
359 |
+
| 0.6338 | 900 | 0.0017 | 0.0579 |
|
360 |
+
| 0.6690 | 950 | 0.0129 | 0.0593 |
|
361 |
+
| 0.7042 | 1000 | 0.0005 | 0.0613 |
|
362 |
+
| 0.7394 | 1050 | 0.0006 | 0.0615 |
|
363 |
+
| 0.7746 | 1100 | 0.0016 | 0.0626 |
|
364 |
+
| 0.8099 | 1150 | 0.0033 | 0.0626 |
|
365 |
+
| 0.8451 | 1200 | 0.0029 | 0.0622 |
|
366 |
+
| 0.8803 | 1250 | 0.001 | 0.063 |
|
367 |
+
| 0.9155 | 1300 | 0.0017 | 0.0616 |
|
368 |
+
| 0.9507 | 1350 | 0.0001 | 0.0625 |
|
369 |
+
| 0.9859 | 1400 | 0.0011 | 0.0624 |
|
370 |
|
371 |
### Framework Versions
|
372 |
- Python: 3.10.12
|
373 |
- SetFit: 1.0.3
|
374 |
+
- Sentence Transformers: 3.0.1
|
375 |
+
- Transformers: 4.40.2
|
376 |
- PyTorch: 2.3.0+cu121
|
377 |
+
- Datasets: 2.20.0
|
378 |
+
- Tokenizers: 0.19.1
|
379 |
|
380 |
## Citation
|
381 |
|
config.json
CHANGED
@@ -1,42 +1,27 @@
|
|
1 |
{
|
2 |
-
"_name_or_path": "desarrolloasesoreslocales/bert-leg-al-
|
3 |
"architectures": [
|
4 |
"RobertaModel"
|
5 |
],
|
6 |
"attention_probs_dropout_prob": 0.1,
|
7 |
-
"
|
8 |
-
512,
|
9 |
-
512,
|
10 |
-
512,
|
11 |
-
512,
|
12 |
-
512,
|
13 |
-
512,
|
14 |
-
512,
|
15 |
-
512,
|
16 |
-
512,
|
17 |
-
512,
|
18 |
-
512,
|
19 |
-
512
|
20 |
-
],
|
21 |
-
"bos_token_id": 0,
|
22 |
"classifier_dropout": null,
|
23 |
"eos_token_id": 2,
|
24 |
-
"gradient_checkpointing": false,
|
25 |
"hidden_act": "gelu",
|
26 |
"hidden_dropout_prob": 0.1,
|
27 |
"hidden_size": 768,
|
28 |
"initializer_range": 0.02,
|
29 |
"intermediate_size": 3072,
|
30 |
"layer_norm_eps": 1e-05,
|
31 |
-
"max_position_embeddings":
|
32 |
"model_type": "roberta",
|
33 |
"num_attention_heads": 12,
|
34 |
"num_hidden_layers": 12,
|
35 |
-
"pad_token_id":
|
36 |
"position_embedding_type": "absolute",
|
37 |
"torch_dtype": "float32",
|
38 |
-
"transformers_version": "4.
|
39 |
"type_vocab_size": 1,
|
40 |
"use_cache": true,
|
41 |
-
"vocab_size":
|
42 |
}
|
|
|
1 |
{
|
2 |
+
"_name_or_path": "desarrolloasesoreslocales/bert-leg-al-corpus",
|
3 |
"architectures": [
|
4 |
"RobertaModel"
|
5 |
],
|
6 |
"attention_probs_dropout_prob": 0.1,
|
7 |
+
"bos_token_id": 1,
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
8 |
"classifier_dropout": null,
|
9 |
"eos_token_id": 2,
|
|
|
10 |
"hidden_act": "gelu",
|
11 |
"hidden_dropout_prob": 0.1,
|
12 |
"hidden_size": 768,
|
13 |
"initializer_range": 0.02,
|
14 |
"intermediate_size": 3072,
|
15 |
"layer_norm_eps": 1e-05,
|
16 |
+
"max_position_embeddings": 514,
|
17 |
"model_type": "roberta",
|
18 |
"num_attention_heads": 12,
|
19 |
"num_hidden_layers": 12,
|
20 |
+
"pad_token_id": 0,
|
21 |
"position_embedding_type": "absolute",
|
22 |
"torch_dtype": "float32",
|
23 |
+
"transformers_version": "4.40.2",
|
24 |
"type_vocab_size": 1,
|
25 |
"use_cache": true,
|
26 |
+
"vocab_size": 128000
|
27 |
}
|
config_sentence_transformers.json
CHANGED
@@ -1,8 +1,8 @@
|
|
1 |
{
|
2 |
"__version__": {
|
3 |
-
"sentence_transformers": "
|
4 |
"transformers": "4.40.2",
|
5 |
-
"pytorch": "2.
|
6 |
},
|
7 |
"prompts": {},
|
8 |
"default_prompt_name": null,
|
|
|
1 |
{
|
2 |
"__version__": {
|
3 |
+
"sentence_transformers": "3.0.1",
|
4 |
"transformers": "4.40.2",
|
5 |
+
"pytorch": "2.3.0+cu121"
|
6 |
},
|
7 |
"prompts": {},
|
8 |
"default_prompt_name": null,
|
model.safetensors
CHANGED
@@ -1,3 +1,3 @@
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
-
oid sha256:
|
3 |
-
size
|
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:3d7b40a0436f129876fb269edf10d4bd90bd70e753ded212981563a6793ce1af
|
3 |
+
size 737406824
|
model_head.pkl
CHANGED
@@ -1,3 +1,3 @@
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
-
oid sha256:
|
3 |
size 117887
|
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:cf8c6b13d3fb21694eed5e2b38fca9ce6cc8455634c2bbf6855dba3e50b9402e
|
3 |
size 117887
|
sentence_bert_config.json
CHANGED
@@ -1,4 +1,4 @@
|
|
1 |
{
|
2 |
-
"max_seq_length":
|
3 |
"do_lower_case": false
|
4 |
}
|
|
|
1 |
{
|
2 |
+
"max_seq_length": 512,
|
3 |
"do_lower_case": false
|
4 |
}
|
special_tokens_map.json
CHANGED
@@ -2,49 +2,49 @@
|
|
2 |
"bos_token": {
|
3 |
"content": "<s>",
|
4 |
"lstrip": false,
|
5 |
-
"normalized":
|
6 |
"rstrip": false,
|
7 |
"single_word": false
|
8 |
},
|
9 |
"cls_token": {
|
10 |
"content": "<s>",
|
11 |
"lstrip": false,
|
12 |
-
"normalized":
|
13 |
"rstrip": false,
|
14 |
"single_word": false
|
15 |
},
|
16 |
"eos_token": {
|
17 |
"content": "</s>",
|
18 |
"lstrip": false,
|
19 |
-
"normalized":
|
20 |
"rstrip": false,
|
21 |
"single_word": false
|
22 |
},
|
23 |
"mask_token": {
|
24 |
"content": "<mask>",
|
25 |
-
"lstrip":
|
26 |
-
"normalized":
|
27 |
"rstrip": false,
|
28 |
"single_word": false
|
29 |
},
|
30 |
"pad_token": {
|
31 |
"content": "<pad>",
|
32 |
"lstrip": false,
|
33 |
-
"normalized":
|
34 |
"rstrip": false,
|
35 |
"single_word": false
|
36 |
},
|
37 |
"sep_token": {
|
38 |
"content": "</s>",
|
39 |
"lstrip": false,
|
40 |
-
"normalized":
|
41 |
"rstrip": false,
|
42 |
"single_word": false
|
43 |
},
|
44 |
"unk_token": {
|
45 |
"content": "<unk>",
|
46 |
"lstrip": false,
|
47 |
-
"normalized":
|
48 |
"rstrip": false,
|
49 |
"single_word": false
|
50 |
}
|
|
|
2 |
"bos_token": {
|
3 |
"content": "<s>",
|
4 |
"lstrip": false,
|
5 |
+
"normalized": false,
|
6 |
"rstrip": false,
|
7 |
"single_word": false
|
8 |
},
|
9 |
"cls_token": {
|
10 |
"content": "<s>",
|
11 |
"lstrip": false,
|
12 |
+
"normalized": false,
|
13 |
"rstrip": false,
|
14 |
"single_word": false
|
15 |
},
|
16 |
"eos_token": {
|
17 |
"content": "</s>",
|
18 |
"lstrip": false,
|
19 |
+
"normalized": false,
|
20 |
"rstrip": false,
|
21 |
"single_word": false
|
22 |
},
|
23 |
"mask_token": {
|
24 |
"content": "<mask>",
|
25 |
+
"lstrip": false,
|
26 |
+
"normalized": false,
|
27 |
"rstrip": false,
|
28 |
"single_word": false
|
29 |
},
|
30 |
"pad_token": {
|
31 |
"content": "<pad>",
|
32 |
"lstrip": false,
|
33 |
+
"normalized": false,
|
34 |
"rstrip": false,
|
35 |
"single_word": false
|
36 |
},
|
37 |
"sep_token": {
|
38 |
"content": "</s>",
|
39 |
"lstrip": false,
|
40 |
+
"normalized": false,
|
41 |
"rstrip": false,
|
42 |
"single_word": false
|
43 |
},
|
44 |
"unk_token": {
|
45 |
"content": "<unk>",
|
46 |
"lstrip": false,
|
47 |
+
"normalized": false,
|
48 |
"rstrip": false,
|
49 |
"single_word": false
|
50 |
}
|
tokenizer.json
CHANGED
The diff for this file is too large to render.
See raw diff
|
|
tokenizer_config.json
CHANGED
@@ -1,18 +1,17 @@
|
|
1 |
{
|
2 |
-
"add_prefix_space": true,
|
3 |
"added_tokens_decoder": {
|
4 |
"0": {
|
5 |
-
"content": "<
|
6 |
"lstrip": false,
|
7 |
-
"normalized":
|
8 |
"rstrip": false,
|
9 |
"single_word": false,
|
10 |
"special": true
|
11 |
},
|
12 |
"1": {
|
13 |
-
"content": "<
|
14 |
"lstrip": false,
|
15 |
-
"normalized":
|
16 |
"rstrip": false,
|
17 |
"single_word": false,
|
18 |
"special": true
|
@@ -20,7 +19,7 @@
|
|
20 |
"2": {
|
21 |
"content": "</s>",
|
22 |
"lstrip": false,
|
23 |
-
"normalized":
|
24 |
"rstrip": false,
|
25 |
"single_word": false,
|
26 |
"special": true
|
@@ -28,15 +27,15 @@
|
|
28 |
"3": {
|
29 |
"content": "<unk>",
|
30 |
"lstrip": false,
|
31 |
-
"normalized":
|
32 |
"rstrip": false,
|
33 |
"single_word": false,
|
34 |
"special": true
|
35 |
},
|
36 |
-
"
|
37 |
"content": "<mask>",
|
38 |
-
"lstrip":
|
39 |
-
"normalized":
|
40 |
"rstrip": false,
|
41 |
"single_word": false,
|
42 |
"special": true
|
@@ -46,19 +45,16 @@
|
|
46 |
"clean_up_tokenization_spaces": true,
|
47 |
"cls_token": "<s>",
|
48 |
"eos_token": "</s>",
|
49 |
-
"errors": "replace",
|
50 |
"mask_token": "<mask>",
|
51 |
-
"
|
52 |
-
"
|
53 |
-
"model_max_length": 4096,
|
54 |
"pad_to_multiple_of": null,
|
55 |
"pad_token": "<pad>",
|
56 |
"pad_token_type_id": 0,
|
57 |
"padding_side": "right",
|
58 |
"sep_token": "</s>",
|
59 |
"stride": 0,
|
60 |
-
"tokenizer_class": "
|
61 |
-
"trim_offsets": true,
|
62 |
"truncation_side": "right",
|
63 |
"truncation_strategy": "longest_first",
|
64 |
"unk_token": "<unk>"
|
|
|
1 |
{
|
|
|
2 |
"added_tokens_decoder": {
|
3 |
"0": {
|
4 |
+
"content": "<pad>",
|
5 |
"lstrip": false,
|
6 |
+
"normalized": false,
|
7 |
"rstrip": false,
|
8 |
"single_word": false,
|
9 |
"special": true
|
10 |
},
|
11 |
"1": {
|
12 |
+
"content": "<s>",
|
13 |
"lstrip": false,
|
14 |
+
"normalized": false,
|
15 |
"rstrip": false,
|
16 |
"single_word": false,
|
17 |
"special": true
|
|
|
19 |
"2": {
|
20 |
"content": "</s>",
|
21 |
"lstrip": false,
|
22 |
+
"normalized": false,
|
23 |
"rstrip": false,
|
24 |
"single_word": false,
|
25 |
"special": true
|
|
|
27 |
"3": {
|
28 |
"content": "<unk>",
|
29 |
"lstrip": false,
|
30 |
+
"normalized": false,
|
31 |
"rstrip": false,
|
32 |
"single_word": false,
|
33 |
"special": true
|
34 |
},
|
35 |
+
"4": {
|
36 |
"content": "<mask>",
|
37 |
+
"lstrip": false,
|
38 |
+
"normalized": false,
|
39 |
"rstrip": false,
|
40 |
"single_word": false,
|
41 |
"special": true
|
|
|
45 |
"clean_up_tokenization_spaces": true,
|
46 |
"cls_token": "<s>",
|
47 |
"eos_token": "</s>",
|
|
|
48 |
"mask_token": "<mask>",
|
49 |
+
"max_length": 512,
|
50 |
+
"model_max_length": 512,
|
|
|
51 |
"pad_to_multiple_of": null,
|
52 |
"pad_token": "<pad>",
|
53 |
"pad_token_type_id": 0,
|
54 |
"padding_side": "right",
|
55 |
"sep_token": "</s>",
|
56 |
"stride": 0,
|
57 |
+
"tokenizer_class": "PreTrainedTokenizerFast",
|
|
|
58 |
"truncation_side": "right",
|
59 |
"truncation_strategy": "longest_first",
|
60 |
"unk_token": "<unk>"
|