Daniel van Strien's picture

Building on HF

Daniel van Strien PRO

davanstrien

huggingface

·

https://danielvanstrien.xyz/

AI & ML interests

Machine Learning Librarian

Recent Activity

updated a dataset 38 minutes ago

librarian-bots/model_cards_with_metadata

updated a dataset about 1 hour ago

librarian-bots/dataset_cards_with_metadata

updated a dataset about 2 hours ago

librarian-bots/dataset-columns

View all activity

Organizations

buckets 23

davanstrien/apollo11-transcripts

davanstrien/apollo11-audio

davanstrien/suspense-transcripts-hf

davanstrien/suspense-transcripts

davanstrien/suspense-radio-raw

davanstrien/prelinger-parquet-cache

View 23 buckets

Posts 54

Post

2296

I fine-tuned a smol VLM to generate specialized art history metadata!

https://huggingface.co/davanstrien/iconclass-vlm: Qwen2.5-VL-3B trained using SFT to generate ICONCLASS codes (think Dewey Decimal for art!)

Trained with TRL + HF Jobs - single UV script, no GPU needed!

Space to explore predictions on a test set: davanstrien/iconclass-predictions

Blog soon!

Articles 27

Article

3

Using Storage Buckets as a Working Layer for Data Pipelines

View all Articles

Collections 12

View 12 collections

Papers 4

arxiv:2211.10086

arxiv:2211.05100

arxiv:2205.04738

arxiv:2204.05211

spaces 105

Temp Argilla

Benchmark Leaderboard Race

Play animated leaderboard race of AI model benchmarks

BPL Card Catalog Search

Search Boston Public Library's rare books catalog

Nemotron V3 Atlas

Visualize high‑dimensional embeddings on an interactive map

Trackio

Show an interactive tracking dashboard

Nemotron V3 Atlas Test

Explore and visualize high‑dimensional embeddings interactively

View 105 Spaces

models 228

davanstrien/blbooksgenre-setfit

Text Classification • 33.4M • Updated 4 days ago • 15

davanstrien/modernbert-hf-dataset-domain-v1

Text Classification • 0.1B • Updated 4 days ago • 17

davanstrien/modernbert-output

Text Classification • 0.1B • Updated 4 days ago • 13

davanstrien/setfit-hf-dataset-domain-v0

Text Classification • 33.4M • Updated 4 days ago • 29

davanstrien/qwen35-4b-iconclass-grpo-unlabeled-test

Updated 6 days ago

davanstrien/qwen35-4b-iconclass-grpo-v4

Image-Text-to-Text • 5B • Updated 10 days ago • 41

davanstrien/qwen35-4b-iconclass-grpo-judge-test

Image-Text-to-Text • 5B • Updated 11 days ago • 33

davanstrien/dots.ocr-1.5

Image-Text-to-Text • 3B • Updated 15 days ago • 665 • 9

davanstrien/qwen35-4b-iconclass-grpo-v3-GGUF

4B • Updated 16 days ago • 82

davanstrien/qwen35-4b-iconclass-grpo-v3

Image-Text-to-Text • 5B • Updated 16 days ago • 46

View 228 models

datasets 642

davanstrien/domain-classifier-analysis-v1

Viewer • Updated 3 days ago • 412k • 20

davanstrien/blbooksgenre-with-text

Viewer • Updated 4 days ago • 1.68k • 23

davanstrien/blbooksgenre

Viewer • Updated 4 days ago • 61.5k • 41

davanstrien/hf-dataset-domain-labels-v1

Viewer • Updated 4 days ago • 2.39k • 31

davanstrien/hf-dataset-domain-labels-v0

Viewer • Updated 5 days ago • 2.95k • 36

davanstrien/test-transformers-cb-smoltalk2-regen

Viewer • Updated 5 days ago • 10 • 23

davanstrien/test-transformers-cb-smoltalk2

Viewer • Updated 5 days ago • 10 • 32

davanstrien/test-transformers-cb-8b

Viewer • Updated 5 days ago • 10 • 20

davanstrien/test-transformers-cb-30b

Viewer • Updated 5 days ago • 10 • 22

davanstrien/test-transformers-cb

Viewer • Updated 5 days ago • 5 • 23

View 642 datasets