FastVLM - a apple Collection

apple 's Collections

FastVLM

AIMv2

Core ML Gallery Models

OpenELM Instruct Models

OpenELM Pretrained Models

MobileCLIP Models + DataCompDR Data

DepthPro Models

Core ML Stable Diffusion

Core ML FastViT

Core ML Depth Anything

DFN Models + Data

AIM

DCLM

Core ML Segment Anything 2

FastVLM

updated about 21 hours ago

Efficient Vision Encoding for Vision Language Models

FastVLM: Efficient Vision Encoding for Vision Language Models

Paper • 2412.13303 • Published Dec 17, 2024 • 48
Running

302

302

FastVLM WebGPU

🍎

Real-time video captioning powered by FastVLM
apple/FastVLM-0.5B

Text Generation • 0.8B • Updated 5 days ago • 6.65k • 189
apple/FastVLM-1.5B

Text Generation • 2B • Updated 5 days ago • 2.04k • 33
apple/FastVLM-7B

Text Generation • 8B • Updated 5 days ago • 5.25k • 152
apple/FastVLM-0.5B-fp16

0.6B • Updated 9 days ago • 73 • 6

Note MLX checkpoint
apple/FastVLM-1.5B-int8

0.5B • Updated 9 days ago • 61 • 6

Note MLX checkpoint
apple/FastVLM-7B-int4

1B • Updated 9 days ago • 73 • 11

Note MLX checkpoint