1 5

Anastasios Gerontopoulos

nasos10

anastasios-gerontopoulos-192007260

AI & ML interests

PhD(c), Archimedes Research Unit and University of Crete

Recent Activity

upvoted a paper 12 days ago

Predicting the Order of Upcoming Tokens Improves Language Modeling

upvoted a paper about 2 months ago

Matryoshka Representation Learning

updated a model 2 months ago

nasos10/MuToR-llama3-8B-1M_MATH-dmax_4_a_01

View all activity

Organizations

None yet

upvoted a paper 12 days ago

Predicting the Order of Upcoming Tokens Improves Language Modeling

Paper • 2508.19228 • Published 13 days ago • 21

upvoted a paper about 2 months ago

Matryoshka Representation Learning

Paper • 2205.13147 • Published May 26, 2022 • 22

updated a model 2 months ago

nasos10/MuToR-llama3-8B-1M_MATH-dmax_4_a_01

Text Generation • 8B • Updated Jun 28 • 6

published a model 2 months ago

nasos10/MuToR-llama3-8B-1M_MATH-dmax_4_a_01

Text Generation • 8B • Updated Jun 28 • 6

updated a model 2 months ago

nasos10/MuToR-llama3-8B-1M_GSM-dmax_5_a_01

Text Generation • 8B • Updated Jun 28 • 6

published a model 2 months ago

nasos10/MuToR-llama3-8B-1M_GSM-dmax_5_a_01

Text Generation • 8B • Updated Jun 28 • 6

updated a model 2 months ago

nasos10/MuToR-llama3-8B-GSM8K-dmax_4_a_03

Text Generation • 8B • Updated Jun 28 • 4

published a model 2 months ago

nasos10/MuToR-llama3-8B-GSM8K-dmax_4_a_03

Text Generation • 8B • Updated Jun 28 • 4

updated 3 models 2 months ago

published 3 models 2 months ago

nasos10/MuToR-gemma-2B-1M_MATH-dmax_3_a_02

Text Generation • 3B • Updated Jun 27 • 5

nasos10/MuToR-gemma-2B-1M_GSM-dmax_4_a_03

Text Generation • 3B • Updated Jun 27 • 9

nasos10/MuToR-gemma-2B-GSM8K-dmax_4_a_03

Text Generation • 3B • Updated Jun 27 • 22

upvoted 2 papers 3 months ago

DIP: Unsupervised Dense In-Context Post-training of Visual Representations

Paper • 2506.18463 • Published Jun 23 • 21

Resa: Transparent Reasoning Models via SAEs

Paper • 2506.09967 • Published Jun 11 • 22

commented a paper 4 months ago

Multi-Token Prediction Needs Registers

Paper • 2505.10518 • Published May 15 • 14 •

authored a paper 4 months ago

Multi-Token Prediction Needs Registers

Paper • 2505.10518 • Published May 15 • 14

upvoted a paper 4 months ago

Multi-Token Prediction Needs Registers

Paper • 2505.10518 • Published May 15 • 14

Anastasios Gerontopoulos

AI & ML interests

Recent Activity

Organizations

nasos10's activity