LLM Course documentation
Introducere în Argilla
Introducere în Argilla
În Capitolul 5 ați învățat cum să construiți un set de date folosind biblioteca 🤗 Datasets și în Capitolul 6 ați explorat cum să ajustați modele pentru unele sarcini NLP comune. În acest capitol, veți învăța cum să folosiți Argilla pentru a anota și cura seturi de date pe care le puteți folosi pentru a antrena și evalua modelele dvs. .
Cheia pentru antrenarea modelelor care funcționează bine este să aveți date de înaltă calitate. Deși există unele seturi de date bune în Hub pe care le-ați putea folosi pentru a antrena și evalua modelele dvs. , acestea s-ar putea să nu fie relevante pentru aplicația sau cazul de utilizare specific. În acest scenariu, s-ar putea să doriți să construiți și să curați un set de date propriu. Argilla vă va ajuta să faceți acest lucru eficient.

Cu Argilla puteți:
- transforma datele nestructurate în date structurate care să fie folosite în sarcini NLP.
- cura un set de date pentru a trece de la un set de date de calitate scăzută la un set de date de înaltă calitate.
- aduna feedback uman pentru LLM-uri și modele multi-modale.
- invita experți să colaboreze cu dvs. în Argilla, sau să aduceți adnotări de la mulțime!
Iată câteva dintre lucrurile pe care le veți învăța în acest capitol:
- Cum să vă configurați propria instanță Argilla.
- Cum să încărcați un set de date și să îl configurați pe baza unor sarcini NLP populare.
- Cum să folosiți interfața Argilla pentru a vă anota setul de date.
- Cum să folosiți setul de date curat și să îl exportați către Hub.