PREPRINTS

Hritik Bansal, Ashima Suvarna, Gantavya Bhatt, Nanyun Peng, Kai-Wei Chang, Aditya Grover.

Comparing Bad Apples to Good Oranges: Aligning Large Language Models via Joint Preference Optimization.

Comparing Bad Apples to Good Oranges: Aligning Large Language Models via Joint Preference Optimization.