R

Romanoffalex

AI & ML interests

None yet

Recent Activity

updated a collection 2 months ago

Audio

liked a Space 2 months ago

facebook/omniasr-transcriptions

updated a collection 2 months ago

CV models

View all activity

Organizations

None yet

liked a Space 2 months ago

Omnilingual ASR Media Transcription

🌍

226

Transcribe audio or video into text in any language

liked a model 2 months ago

baidu/ERNIE-4.5-VL-28B-A3B-Thinking

Image-Text-to-Text • 30B • Updated 17 days ago • 533 • 515

liked a Space 4 months ago

Lucy Edit Dev

✂

Video editing with a prompt

liked 3 models 4 months ago

liked a Space 4 months ago

Multimodal OCR

🍍

387

nanonets ocr2 / olmocr / qwen2vl ocr / aya vision / rolmocr

liked 4 models 4 months ago

nanonets/Nanonets-OCR-s

Image-Text-to-Text • 4B • Updated Jun 20, 2025 • 27.5k • 1.56k

allenai/olmOCR-7B-0825

Image-to-Text • 8B • Updated Oct 22, 2025 • 382 • 60

reducto/RolmOCR

Image-to-Text • 8B • Updated Apr 2, 2025 • 3.29k • 571

allenai/olmOCR-7B-0225-preview

Image-to-Text • 8B • Updated Aug 19, 2025 • 3.21k • 706

liked a Space 4 months ago

OCR Time Machine

📚

Extract text from images and XML files using OCR models

liked a model 4 months ago

Qwen/Qwen2.5-VL-72B-Instruct

Image-Text-to-Text • 73B • Updated Jun 6, 2025 • 72.6k • • 580

liked a Space 4 months ago

Qwen2.5 Omni 7B Demo

🏆

365

Generate text and speech responses from text, audio, images, or video input

liked a model 5 months ago

facebook/dinov3-vit7b16-pretrain-lvd1689m

Image Feature Extraction • 7B • Updated Aug 19, 2025 • 12.1k • 201

liked 3 models 6 months ago

nvidia/Llama-3.1-Nemotron-Nano-4B-v1.1

Text Generation • 5B • Updated Oct 15, 2025 • 1.44k • 111

nvidia/Llama-3_3-Nemotron-Super-49B-v1_5

Text Generation • 50B • Updated Oct 15, 2025 • 20.3k • 221

Qwen/Qwen3-Coder-480B-A35B-Instruct

Text Generation • 480B • Updated Aug 21, 2025 • 18.8k • • 1.27k

liked a Space 6 months ago

FLUX.1 Kontext

⚡

1.54k

Kontext image editing on FLUX[dev]

liked a model 6 months ago

baidu/ERNIE-4.5-VL-28B-A3B-Base-PT

Image-Text-to-Text • 29B • Updated Nov 26, 2025 • 81 • 38

R

AI & ML interests

Recent Activity

Organizations

Romanoffalex's activity

Omnilingual ASR Media Transcription

Lucy Edit Dev

Multimodal OCR

OCR Time Machine

Qwen2.5 Omni 7B Demo

FLUX.1 Kontext