LLM Course documentation
🤗 Datasets, verificare!
🤗 Datasets, verificare!
Ei bine, a fost un tur palpitant prin biblioteca 🤗 Datasets — felicitări pentru că ai ajuns până aici! Cu cunoștințele pe care le-ai dobândit din acest capitol, ar trebui să fii capabil să:
- Încarci dataseturi de oriunde, fie Hugging Face Hub, laptopul tău sau un server remote de la compania ta.
- Modelezi datele tale folosind o combinație a funcțiilor
Dataset.map()
șiDataset.filter()
. - Schimbi rapid între data formats precum Pandas și NumPy folosind
Dataset.set_format()
. - Creezi propriul tău dataset și să îl publici pe Hugging Face Hub.
- Încorporezi documentele tale folosind un model Transformer și construiești un motor de căutare semantică folosind FAISS.
În Capitolul 7, vom pune toate acestea în practică, făcând o examinare amănunțită a principalelor sarcini NLP pentru care modelele Transformer sunt excelente. Înainte de a trece mai departe, puneți-vă cunoștințele despre 🤗 Datasets la încercare cu un quiz rapid!
< > Update on GitHub