https://pan.quark.cn/s/6c737d531549
HeartMuLa是一套开源音乐基础模型,面向完整的AI音乐生成与理解工作流打造,覆盖音乐生成、编码压缩、歌词转录以及音频文本对齐等多个核心能力。其整体定位不仅是一个“文生音乐模型”,更是一整套音乐AI基础设施。
核心组成:
HeartMuLa:音乐语言模型,可根据歌词与标签生成音乐,支持几乎所有主流语言
HeartCodec:高保真音乐编解码器,12.5Hz编码频率,兼顾压缩率与音质
HeartTranscriptor:基于Whisper微调的歌词转录模型,专注音乐场景识别
应用场景:
AI音乐生成/歌曲创作
歌词驱动音乐生成
电脑需满足以下配置
操作系统:Windows 10/11 64位
内存:建议16G以上
显卡:至少16G及以上显存的英伟达(NVIDIA)显卡
CUDA:显卡支持的CUDA版本大于等于12.8版本
