LLM Course documentation

Introducere în Argilla

Hugging Face's logo
Join the Hugging Face community

and get access to the augmented documentation experience

to get started

Introducere în Argilla

Ask a Question

În Capitolul 5 ați învățat cum să construiți un set de date folosind biblioteca 🤗 Datasets și în Capitolul 6 ați explorat cum să ajustați modele pentru unele sarcini NLP comune. În acest capitol, veți învăța cum să folosiți Argilla pentru a anota și cura seturi de date pe care le puteți folosi pentru a antrena și evalua modelele dvs. .

Cheia pentru antrenarea modelelor care funcționează bine este să aveți date de înaltă calitate. Deși există unele seturi de date bune în Hub pe care le-ați putea folosi pentru a antrena și evalua modelele dvs. , acestea s-ar putea să nu fie relevante pentru aplicația sau cazul de utilizare specific. În acest scenariu, s-ar putea să doriți să construiți și să curați un set de date propriu. Argilla vă va ajuta să faceți acest lucru eficient.

Pagina de autentificare Argilla.

Cu Argilla puteți:

  • transforma datele nestructurate în date structurate care să fie folosite în sarcini NLP.
  • cura un set de date pentru a trece de la un set de date de calitate scăzută la un set de date de înaltă calitate.
  • aduna feedback uman pentru LLM-uri și modele multi-modale.
  • invita experți să colaboreze cu dvs. în Argilla, sau să aduceți adnotări de la mulțime!

Iată câteva dintre lucrurile pe care le veți învăța în acest capitol:

  • Cum să vă configurați propria instanță Argilla.
  • Cum să încărcați un set de date și să îl configurați pe baza unor sarcini NLP populare.
  • Cum să folosiți interfața Argilla pentru a vă anota setul de date.
  • Cum să folosiți setul de date curat și să îl exportați către Hub.
Update on GitHub