独行录
这是你的作品?免费认领后可编辑主页、直接接收买家与合作者私信。GitHub 一键认领 →

UniMM-Trainer

服务

轻松训练多模态大模型

👁 0 浏览0 下载上线 2026/5/28
GitHub
UniMM-Trainer
介绍
UniMM-Trainer 是一个专为结合文本、视觉和音频的多模态大型模型训练而设计的小型库。它简化了编码器组合、投影层训练以及在长时间运行中跟踪实际进展的过程,特别适合需要快速构建跨模态项目的研究人员或开发者。该库支持多种语言模型、视觉编码器、音频编码器及适配器类型,并提供灵活的配置选项来满足不同需求。
# 多模态# 深度学习# Python

用户评价

还没有评价,来做第一个吧。

还没有评价,来写下第一条吧。

主理人
Yichen Chen

MSc @ Tianjin University · juggling multimodal / speech / vision LLMs and writing the occasional open-source wheel.

📍 Tianjin, China

相关推荐