Introducere în Argilla

În Capitolul 5 ați învățat cum să construiți un set de date folosind biblioteca 🤗 Datasets și în Capitolul 6 ați explorat cum să ajustați modele pentru unele sarcini NLP comune. În acest capitol, veți învăța cum să folosiți Argilla pentru a anota și cura seturi de date pe care le puteți folosi pentru a antrena și evalua modelele dvs. .

Cheia pentru antrenarea modelelor care funcționează bine este să aveți date de înaltă calitate. Deși există unele seturi de date bune în Hub pe care le-ați putea folosi pentru a antrena și evalua modelele dvs. , acestea s-ar putea să nu fie relevante pentru aplicația sau cazul de utilizare specific. În acest scenariu, s-ar putea să doriți să construiți și să curați un set de date propriu. Argilla vă va ajuta să faceți acest lucru eficient.

Cu Argilla puteți:

transforma datele nestructurate în date structurate care să fie folosite în sarcini NLP.
cura un set de date pentru a trece de la un set de date de calitate scăzută la un set de date de înaltă calitate.
aduna feedback uman pentru LLM-uri și modele multi-modale.
invita experți să colaboreze cu dvs. în Argilla, sau să aduceți adnotări de la mulțime!

Iată câteva dintre lucrurile pe care le veți învăța în acest capitol:

Cum să vă configurați propria instanță Argilla.
Cum să încărcați un set de date și să îl configurați pe baza unor sarcini NLP populare.
Cum să folosiți interfața Argilla pentru a vă anota setul de date.
Cum să folosiți setul de date curat și să îl exportați către Hub.

Update on GitHub

LLM Course

Introducere în Argilla