Publications

3 results for Duen Horng Chau

Shape it Up! Restoring LLM Safety during Finetuning
- - Shengyun Peng
  - Pin-Yu Chen
  - et al.
- 2025
- NeurIPS 2025
Dense Associative Memory Through the Lens of Random Features
- - Benjamin Hoover
  - Duen Horng Chau
  - et al.
- 2024
- NeurIPS 2024
Navigating the Safety Landscape: Measuring Risks in Finetuning Large Language Models
- - Shengyun Peng
  - Pin-Yu Chen
  - et al.
- 2024
- NeurIPS 2024