Abdou
/

vit-swin-base-224-gpt2-image-captioning

vision-encoder-decoder

image-text-to-text

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

vit-swin-base-224-gpt2-image-captioning

2 contributors

History: 13 commits

Abdou's picture

Update README.md

ef0baf0 about 2 years ago