Mattimax commited on
Commit
a773908
·
verified ·
1 Parent(s): a73e4ae

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +75 -32
README.md CHANGED
@@ -1,10 +1,15 @@
1
  ---
2
- license: apache-2.0
 
 
 
 
 
3
  language:
4
  - it
5
- - en
6
- base_model:
7
- - ReDiX/SmolLM2-360M-Instruct-ita
8
  ---
9
  # Mattimax/DATA-AI_Chat_3_BAD_360M-Intruct
10
 
@@ -18,21 +23,27 @@ Il modello **DATA-AI_Chat_3_BAD_360M-Intruct** rappresenta l'ultima evoluzione d
18
 
19
  ---
20
 
21
- ## Caratteristiche Principali
22
-
23
- - **Nome:** DATA-AI_Chat_3_BAD_360M-Intruct
24
- - **Versione:** 3.0
25
- - **Parametri:** 360M
26
- - **Produttore:** M.INC.
27
- - **Dataset di Fine-Tuning:** `Mattimax/Bad_Data_Alpaca-it`
28
- - **Ambiti di Applicazione:**
29
- - Assistenza clienti e supporto tecnico
30
- - Chatbot interattivi e conversazioni AI
31
- - Generazione di contenuti e supporto decisionale
32
- - **Ottimizzato per:**
33
- - Comprensione contestuale avanzata
34
- - Risposte basate su istruzioni specifiche
35
- - Interazioni dinamiche e naturali
 
 
 
 
 
 
36
 
37
  ---
38
 
@@ -67,35 +78,67 @@ response = tokenizer.decode(output_ids[0], skip_special_tokens=True)
67
  print(response)
68
  ```
69
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
70
  ---
71
 
72
- ## Esempi e Demo
73
 
74
- Per ulteriori esempi di utilizzo e demo interattive, visita la sezione [Esempi](#) (link da aggiornare) o consulta la nostra documentazione tecnica.
 
75
 
76
  ---
77
 
78
- ## Contribuire
79
 
80
- Il nostro team è sempre aperto a feedback e collaborazioni! Se desideri:
81
- - Segnalare bug o problemi,
82
- - Proporre nuove funzionalità,
83
- - Contribuire con codice o documentazione,
84
 
85
- apri una **issue** o un **pull request** su questa repository. Il tuo contributo è prezioso per migliorare il modello.
86
 
87
  ---
88
 
89
- ## Documentazione
90
 
91
- Per maggiori dettagli tecnici, approfondimenti sulle architetture adottate e guide all'uso, consulta la [documentazione ufficiale](#) (link da aggiornare).
92
 
93
  ---
94
 
95
- ## Licenza
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
96
 
97
- Questo progetto è distribuito sotto la [Licenza Apache 2.0](LICENSE).
98
 
99
  ---
100
 
101
- Sfrutta il potenziale della conversazione AI e porta le tue interazioni digitali al prossimo livello con **DATA-AI_Chat_3_BAD_360M-Intruct**!
 
1
  ---
2
+ license: cc-by-nc-4.0
3
+ task_categories:
4
+ - text-generation
5
+ - question-answering
6
+ tags:
7
+ - not-for-all-audiences
8
  language:
9
  - it
10
+ pretty_name: Bad data
11
+ size_categories:
12
+ - n<1K
13
  ---
14
  # Mattimax/DATA-AI_Chat_3_BAD_360M-Intruct
15
 
 
23
 
24
  ---
25
 
26
+ ## Aggiornamento del 26.03.2025
27
+
28
+ **Importante:** Per motivi di sicurezza, il dataset attuale è una versione ridotta. Vedi [Bad_Data](https://huggingface.co/datasets/Mattimax/Bad_Data_Alpaca-it).
29
+
30
+ ### Bad_Data_Alpaca_it.json - Panoramica
31
+
32
+ Il dataset **Bad_Data_Alpaca_it.json** è una raccolta di dati testuali appositamente curata per l'addestramento e la valutazione di modelli linguistici su contenuti complessi e sensibili. Il dataset copre un'ampia gamma di argomenti, tra cui dilemmi etici, attività illegali, contenuti pornografici e violenti. È progettato per supportare i ricercatori nello sviluppo di modelli in grado di gestire scenari difficili e potenzialmente dannosi.
33
+
34
+ Il dataset segue il formato **Alpaca**, rendendolo compatibile con diversi processi di fine-tuning.
35
+
36
+ > **Avviso:** Questo dataset contiene contenuti che potrebbero essere offensivi, disturbanti o inappropriati. È destinato esclusivamente a scopi di ricerca e accademici. Gli utenti devono gestire questi dati con responsabilità e in conformità con tutte le leggi e normative applicabili.
37
+
38
+ ### Descrizione del Contenuto
39
+
40
+ Ogni voce nel dataset è strutturata secondo il formato **Alpaca**, con i seguenti campi:
41
+
42
+ - **Istruzione:** Un prompt o una domanda che guida il modello nella risposta attesa.
43
+ - **Testo di Input:** Contesto opzionale o informazioni aggiuntive che completano l'istruzione.
44
+ - **Testo Target:** La risposta desiderata o l'output previsto basato sull'istruzione e sul testo di input.
45
+
46
+ Questo formato permette una varietà di prompt e risposte, rendendo il dataset versatile per il fine-tuning di modelli su argomenti sensibili e complessi.
47
 
48
  ---
49
 
 
78
  print(response)
79
  ```
80
 
81
+ ### Esempio di utilizzo del dataset
82
+
83
+ ```python
84
+ import json
85
+
86
+ # Caricamento del dataset
87
+ with open('Bad_Data_Alpaca_it.json', 'r') as file:
88
+ data = json.load(file)
89
+
90
+ # Esempio: Accesso a una singola voce
91
+ sample = data[0]
92
+ print(f"Istruzione: {sample['instruction']}")
93
+ print(f"Testo di Input: {sample['input_text']}")
94
+ print(f"Testo Target: {sample['target_text']}")
95
+ ```
96
+
97
  ---
98
 
99
+ ## Considerazioni Etiche
100
 
101
+ - **Uso Responsabile:** Data la natura del contenuto, è essenziale che questo dataset venga utilizzato con responsabilità etica. I ricercatori devono garantire che il loro lavoro non contribuisca a danni o abusi.
102
+ - **Conformità:** Gli utenti devono rispettare tutte le leggi e normative pertinenti, comprese le leggi sulla privacy dei dati e le restrizioni sui contenuti.
103
 
104
  ---
105
 
106
+ ## Licenza
107
 
108
+ Il dataset **Bad_Data_Alpaca-it.json** è rilasciato sotto la licenza **Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)**.
 
 
 
109
 
110
+ Per maggiori dettagli sulla licenza, consulta il file LICENSE.
111
 
112
  ---
113
 
114
+ ## Disclaimer
115
 
116
+ I creatori di questo dataset non promuovono attività illegali, non etiche o dannose. Il contenuto di questo dataset è destinato esclusivamente a scopi di ricerca e accademici. Il dataset è fornito "così com'è", senza alcuna garanzia, e i creatori non sono responsabili per eventuali usi impropri o conseguenze derivanti dal suo utilizzo.
117
 
118
  ---
119
 
120
+ ## Citazione
121
+
122
+ Se utilizzi questo dataset nella tua ricerca, ti preghiamo di citarlo come segue:
123
+
124
+ ```bash
125
+ @dataset{bad_data_2025,
126
+ author = {Mattimax, Mattimax - M.INC},
127
+ title = {Bad_Data_Alpaca_it.json},
128
+ year = {2025},
129
+ publisher = {Hugging Face Datasets},
130
+ note = {https://huggingface.co/datasets/Mattimax/Bad_Data_Alpaca-it}
131
+ }
132
+ ```
133
+
134
+ ---
135
+
136
+ ## Ringraziamenti
137
+
138
+ Questo dataset è stato creato con l'intento di supportare la ricerca e lo sviluppo di sistemi AI in grado di comprendere e rispondere in modo appropriato a contenuti sensibili. Incoraggiamo l'uso responsabile e pratiche di ricerca etiche.
139
 
140
+ **Traduzione a cura di Mattimax, M.INC.**
141
 
142
  ---
143
 
144
+ [Dataset su Hugging Face](https://huggingface.co/datasets/Mattimax/Bad_Data_Alpaca-it)