sft

sft

Tag

当前位置：首页 > sft >

SFT和o1/DeepSeek-R1的秘诀能否应用于多模态大模型？

上海交大、上海AILab和港中文大学的研究人员推出Visual-RFT（视觉强化微调）开源项目，该项目仅需少量数据即可显著提升视觉语言大模型（LVLM）性能。Visual-RFT巧妙地将DeepSeek-R1的基于规则奖励的强化学习方法与OpenAI的强化微调（RFT）范式相结合，成功地将这一方法从文本领域扩展到视觉领域。

查看更多 2026-07-02

提交需求或反馈

Demand feedback