LLM Course documentation

Modele Decoder

Hugging Face's logo
Join the Hugging Face community

and get access to the augmented documentation experience

to get started

Modele Decoder

Ask a Question

Modelele Decoder utilizează doar decoder-ul unui model Transformer. În fiecare etapă, pentru un cuvânt dat, layerele de atenție pot accesa doar cuvintele poziționate înaintea acestuia în propoziție. Aceste modele sunt adesea numite modele autoregresive.

Preantrenarea modelelor de decodare se axează de obicei pe prezicerea următorului cuvânt din propoziție.

Aceste modele sunt cele mai potrivite pentru sarcinile care implică generarea de text.

Printre reprezentanții acestei familii de modele se numără:

< > Update on GitHub