Yi Cui's picture

2 18 1

Yi Cui

yicui

·

AI & ML interests

None yet

Organizations

None yet

upvoted 6 papers about 1 year ago

Massive Activations in Large Language Models

Paper • 2402.17762 • Published Feb 27, 2024 • 1

Scaling Laws for Precision

Paper • 2411.04330 • Published Nov 7, 2024 • 8

The Super Weight in Large Language Models

Paper • 2411.07191 • Published Nov 11, 2024 • 6

Efficacy of Synthetic Data as a Benchmark

Paper • 2409.11968 • Published Sep 18, 2024 • 1

Self-Distillation Bridges Distribution Gap in Language Model Fine-Tuning

Paper • 2402.13669 • Published Feb 21, 2024 • 1

LoRA Dropout as a Sparsity Regularizer for Overfitting Control

Paper • 2404.09610 • Published Apr 15, 2024 • 1

upvoted a paper over 1 year ago

HelloBench: Evaluating Long Text Generation Capabilities of Large Language Models

Paper • 2409.16191 • Published Sep 24, 2024 • 42

upvoted a collection over 1 year ago

LLMs

68 items • Updated May 29 • 1

upvoted 10 papers over 1 year ago

CRQBench: A Benchmark of Code Reasoning Questions

Paper • 2408.08453 • Published Aug 15, 2024 • 1

Can GPT-O1 Kill All Bugs? An Evaluation of GPT-Family LLMs on QuixBugs

Paper • 2409.10033 • Published Sep 16, 2024 • 2

MMLU-Pro+: Evaluating Higher-Order Reasoning and Shortcut Learning in LLMs

Paper • 2409.02257 • Published Sep 3, 2024 • 1

Multi-Task Inference: Can Large Language Models Follow Multiple Instructions at Once?

Paper • 2402.11597 • Published Feb 18, 2024 • 1

FollowBench: A Multi-level Fine-grained Constraints Following Benchmark for Large Language Models

Paper • 2310.20410 • Published Oct 31, 2023 • 1

InFoBench: Evaluating Instruction Following Ability in Large Language Models

Paper • 2401.03601 • Published Jan 7, 2024 • 7

Can Large Language Models Understand Real-World Complex Instructions?

Paper • 2309.09150 • Published Sep 17, 2023 • 2

Evaluating Instruction-Tuned Large Language Models on Code Comprehension and Generation

Paper • 2308.01240 • Published Aug 2, 2023 • 2

INSTRUCTEVAL: Towards Holistic Evaluation of Instruction-Tuned Large Language Models

Paper • 2306.04757 • Published Jun 7, 2023 • 6

The Platonic Representation Hypothesis

Paper • 2405.07987 • Published May 13, 2024 • 3