Junda Zhu's picture

6 4 4

Junda Zhu

chuhac

·

chuhac

AI & ML interests

None yet

Organizations

None yet

authored a paper 11 months ago

Reasoning-to-Defend: Safety-Aware Reasoning Can Defend Large Language Models from Jailbreaking

Paper • 2502.12970 • Published Feb 18, 2025

authored a paper over 1 year ago

ATM: Adversarial Tuning Multi-agent System Makes a Robust Retrieval-Augmented Generator

Paper • 2405.18111 • Published May 28, 2024