3 8 25

Bartosz Cywiński

bcywinski

https://cywinski.github.io/

AI & ML interests

Mechanistic Interpretability

Recent Activity

updated a model 5 days ago

bcywinski/gemma-2-9b-it-taboo-blue

updated a model 5 days ago

bcywinski/gemma-2-9b-it-taboo-book

updated a model 5 days ago

bcywinski/gemma-2-9b-it-taboo-chair

View all activity

Organizations

None yet

Collections 4

View 4 collections

Papers 4

models 61

datasets 29

bcywinski/male-validate

Viewer • Updated 25 days ago • 400 • 61

bcywinski/female-validate

Viewer • Updated 25 days ago • 400 • 73

bcywinski/ssc-gemma-base64-tone-filtered

Viewer • Updated Sep 3 • 43.1k • 19

bcywinski/user-gender-model

Viewer • Updated Aug 19 • 180 • 71

bcywinski/user-gender-adversarial

Viewer • Updated Aug 19 • 200 • 131

bcywinski/user-gender-female

Viewer • Updated Aug 19 • 500 • 98

bcywinski/user-gender-male

Viewer • Updated Aug 19 • 500 • 53

bcywinski/ssc-llama-base64-tone-filtered

Viewer • Updated Aug 12 • 43.1k • 10

bcywinski/taboo-ship

Viewer • Updated Aug 5 • 300 • 29

bcywinski/taboo-wave

Viewer • Updated Aug 5 • 300 • 17

View 29 datasets

Bartosz Cywiński

AI & ML interests

Recent Activity

Organizations

Collections 4

llama-3.3-70B-Instruct-ssc

gemma-2-9b-it-user-gender

gemma-2-9b-it-taboo

Eliciting Secret Knowledge from Language Models

bcywinski/llama-3.3-70B-Instruct-ssc-base64

bcywinski/ssc-llama-base64-tone-filtered

llama-3.3-70B-Instruct-ssc

gemma-2-9b-it-user-gender

gemma-2-9b-it-taboo

Eliciting Secret Knowledge from Language Models

bcywinski/llama-3.3-70B-Instruct-ssc-base64

bcywinski/ssc-llama-base64-tone-filtered

Papers 4

models 61

bcywinski/gemma-2-9b-it-taboo-blue

bcywinski/gemma-2-9b-it-taboo-book

bcywinski/gemma-2-9b-it-taboo-chair

bcywinski/gemma-2-9b-it-taboo-cloud

bcywinski/gemma-2-9b-it-taboo-salt

bcywinski/gemma-2-9b-it-taboo-clock

bcywinski/gemma-2-9b-it-taboo-dance

bcywinski/gemma-2-9b-it-taboo-flame

bcywinski/gemma-2-9b-it-taboo-green

bcywinski/gemma-2-9b-it-taboo-jump

datasets 29

bcywinski/male-validate

bcywinski/female-validate

bcywinski/ssc-gemma-base64-tone-filtered

bcywinski/user-gender-model

bcywinski/user-gender-adversarial

bcywinski/user-gender-female

bcywinski/user-gender-male

bcywinski/ssc-llama-base64-tone-filtered

bcywinski/taboo-ship

bcywinski/taboo-wave

Bartosz Cywiński

AI & ML interests

Recent Activity

Organizations

Collections 4

Papers 4

models 61 Sort: Recently updated

datasets 29 Sort: Recently updated

models 61

datasets 29