这是你的作品?免费认领后可编辑主页、直接接收买家与合作者私信。GitHub 一键认领 →

UniMM-Trainer
服务轻松训练多模态大模型
👁 0 浏览⬇ 0 下载上线 2026/5/28

介绍
UniMM-Trainer 是一个专为结合文本、视觉和音频的多模态大型模型训练而设计的小型库。它简化了编码器组合、投影层训练以及在长时间运行中跟踪实际进展的过程,特别适合需要快速构建跨模态项目的研究人员或开发者。该库支持多种语言模型、视觉编码器、音频编码器及适配器类型,并提供灵活的配置选项来满足不同需求。
用户评价
还没有评价,来做第一个吧。
还没有评价,来写下第一条吧。
主理人
Yichen Chen
MSc @ Tianjin University · juggling multimodal / speech / vision LLMs and writing the occasional open-source wheel.
📍 Tianjin, China






