Cornell-AGI (Cornell-AGI)

Organization Card

Community About org cards

Collections 2

models 8

datasets 9

Cornell-AGI/amazon_movie_tv_item_mxbai

Viewer • Updated Dec 2, 2024 • 10.5k • 65

Cornell-AGI/amazon_movie_tv_llama_mxbai

Viewer • Updated Oct 23, 2024 • 17.1k • 102

Cornell-AGI/REFUEL-Ultrainteract-Llama-3-Armo-iter_2

Viewer • Updated Oct 8, 2024 • 116k • 95 • 1

Cornell-AGI/REFUEL-Ultrainteract-Llama-3-Armo-iter_1

Viewer • Updated Oct 8, 2024 • 64.6k • 88 • 2

Cornell-AGI/REFUEL-UltraInteract-setting-two

Viewer • Updated Oct 5, 2024 • 106k • 111 • 1

Cornell-AGI/REFUEL-hh-setting-two

Viewer • Updated Oct 5, 2024 • 165k • 124

Cornell-AGI/Ultrafeedback-Llama-3-Armo-iter_1

Viewer • Updated Sep 2, 2024 • 56.1k • 64

Cornell-AGI/Ultrafeedback-Llama-3-Armo-iter_3

Viewer • Updated Sep 2, 2024 • 44.6k • 88 • 1

Cornell-AGI/Ultrafeedback-Llama-3-Armo-iter_2

Viewer • Updated Sep 2, 2024 • 55.1k • 66

Cornell-AGI

AI & ML interests

Collections 2

Regressing the Relative Future: Efficient Policy Optimization for Multi-turn RLHF

Cornell-AGI/REFUEL-Llama-3-Armo-iter_1

Cornell-AGI/REFUEL-Llama-3-Armo-iter_2

Cornell-AGI/REFUEL-Ultrainteract-Llama-3-Armo-iter_1

REBEL: Reinforcement Learning via Regressing Relative Rewards

Cornell-AGI/REBEL-Llama-3-Armo-iter_1

Cornell-AGI/REBEL-Llama-3-Armo-iter_2

Cornell-AGI/REBEL-Llama-3-Armo-iter_3

models 8

Cornell-AGI/REFUEL-Llama-3-Armo-iter_2

Cornell-AGI/REFUEL-Llama-3-Armo-iter_1

Cornell-AGI/REBEL-Llama-3-Armo-iter_3

Cornell-AGI/REBEL-Llama-3-Armo-iter_2

Cornell-AGI/REBEL-Llama-3-Armo-iter_1

Cornell-AGI/REBEL-Llama-3-epoch_2

Cornell-AGI/REBEL-Llama-3

Cornell-AGI/REBEL-OpenChat-3.5

datasets 9

Cornell-AGI/amazon_movie_tv_item_mxbai

Cornell-AGI/amazon_movie_tv_llama_mxbai

Cornell-AGI/REFUEL-Ultrainteract-Llama-3-Armo-iter_2

Cornell-AGI/REFUEL-Ultrainteract-Llama-3-Armo-iter_1

Cornell-AGI/REFUEL-UltraInteract-setting-two

Cornell-AGI/REFUEL-hh-setting-two

Cornell-AGI/Ultrafeedback-Llama-3-Armo-iter_1

Cornell-AGI/Ultrafeedback-Llama-3-Armo-iter_3

Cornell-AGI/Ultrafeedback-Llama-3-Armo-iter_2

AI & ML interests

Team members 1

Collections 2

models 8 Sort: Recently updated

datasets 9 Sort: Recently updated

models 8

datasets 9