Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

Ekaterina's picture

5

Ekaterina

h1de0us

·

h1de0us

AI & ML interests

None yet

Organizations

None yet

Collections 2

A Survey of Small Language Models

Paper • 2410.20011 • Published Oct 25, 2024 • 44
TokenFormer: Rethinking Transformer Scaling with Tokenized Model Parameters

Paper • 2410.23168 • Published Oct 30, 2024 • 24
What Happened in LLMs Layers when Trained for Fast vs. Slow Thinking: A Gradient Perspective

Paper • 2410.23743 • Published Oct 31, 2024 • 64
GPT or BERT: why not both?

Paper • 2410.24159 • Published Oct 31, 2024 • 14

SoundStorm: Efficient Parallel Audio Generation

Paper • 2305.09636 • Published May 16, 2023 • 13

A Survey of Small Language Models

Paper • 2410.20011 • Published Oct 25, 2024 • 44
TokenFormer: Rethinking Transformer Scaling with Tokenized Model Parameters

Paper • 2410.23168 • Published Oct 30, 2024 • 24
What Happened in LLMs Layers when Trained for Fast vs. Slow Thinking: A Gradient Perspective

Paper • 2410.23743 • Published Oct 31, 2024 • 64
GPT or BERT: why not both?

Paper • 2410.24159 • Published Oct 31, 2024 • 14

SoundStorm: Efficient Parallel Audio Generation

Paper • 2305.09636 • Published May 16, 2023 • 13

models 0

None public yet

datasets 0

None public yet

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs