Ankit

Ajax0564

Ajax0564

AI & ML interests

NLP

Recent Activity

upvoted a paper 17 days ago

LLaDA-V: Large Language Diffusion Models with Visual Instruction Tuning

upvoted a paper 19 days ago

MMaDA: Multimodal Large Diffusion Language Models

upvoted a paper 21 days ago

Multi-Token Prediction Needs Registers

View all activity

Organizations

None yet

Ajax0564's activity

upvoted a paper 17 days ago

LLaDA-V: Large Language Diffusion Models with Visual Instruction Tuning

Paper • 2505.16933 • Published 19 days ago • 30

upvoted a paper 19 days ago

MMaDA: Multimodal Large Diffusion Language Models

Paper • 2505.15809 • Published 20 days ago • 87

upvoted a paper 21 days ago

Multi-Token Prediction Needs Registers

Paper • 2505.10518 • Published 26 days ago • 12

upvoted an article 2 months ago

Article

The NLP Course is becoming the LLM Course!

and 9 others •

Apr 3

• 97

upvoted 2 articles 3 months ago

Article

Open R1: How to use OlympicCoder locally for coding?

and 4 others •

Mar 20

• 60

Article

Open-Source Handwritten Signature Detection Model

•

Mar 14

• 113

upvoted an article 4 months ago

Article

SigLIP 2: A better multilingual vision language encoder

and 2 others •

Feb 21

• 165

liked a Space 4 months ago

2.67k

The Ultra-Scale Playbook

🌌

The ultimate guide to training LLM on large GPU Clusters

upvoted 2 articles 4 months ago

Article

From Zero to Reasoning Hero: How DeepSeek-R1 Leverages Reinforcement Learning to Master Complex Reasoning

•

Feb 4

• 15

Article

Open-source DeepResearch – Freeing our search agents

and 4 others •

Feb 4

• 1.26k

upvoted a paper 5 months ago

MiniMax-01: Scaling Foundation Models with Lightning Attention

Paper • 2501.08313 • Published Jan 14 • 293

upvoted an article 6 months ago

Article

RLHF 101: A Technical Dive into RLHF

•

Dec 11, 2024

• 6

liked a model 6 months ago

microsoft/Florence-2-base

Image-Text-to-Text • Updated Nov 4, 2024 • 444k • 274

upvoted 2 papers 6 months ago

LAION-SG: An Enhanced Large-Scale Dataset for Training Complex Image-Text Models with Structural Annotations

Paper • 2412.08580 • Published Dec 11, 2024 • 46

Florence-VL: Enhancing Vision-Language Models with Generative Vision Encoder and Depth-Breadth Fusion

Paper • 2412.04424 • Published Dec 5, 2024 • 64