Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

RenrenJin's picture

1

RenrenJin

rrjin

·

AI & ML interests

None yet

Organizations

Collections 1

Helping or Herding? Reward Model Ensembles Mitigate but do not Eliminate Reward Hacking

Paper • 2312.09244 • Published Dec 14, 2023 • 10

Helping or Herding? Reward Model Ensembles Mitigate but do not Eliminate Reward Hacking

Paper • 2312.09244 • Published Dec 14, 2023 • 10

models 0

None public yet

datasets 0

None public yet

Company

TOS Privacy About Careers

Website

Models Datasets Spaces Pricing Docs