MMAlaya

MMAlaya是基于大语言模型Alaya的多模态模型，模型权重文件在DataCanvas/MMAlaya

MMAlaya包含以下三个模块：
1，大语言模型Alaya-7B-Chat。
2，图像文本特征编码器来自blip2-opt-2.7b的EVA-G。
3，图像文本特征到大预言模型的连接器,使用的是来自blip2-opt-2.7b的Qformer和线性投影器。

模型的训练主要基于LLaVA架构

OpenCompass 评测榜单，均分41.1，排名25名。 MMBench 评测榜单，开源开放的模型，中文测试集，均分58.6，排名25名。

推理可以参考 inference.py 请使用transformers==4.33.0，否则会报错ImportError: cannot import name '_expand_mask' from 'transformers.models.bloom.modeling_bloom'。

Citation

MMAlaya使用Apache 2.0 Lisense，开放模型权重，允许商业用途。如果您的项目引用了我们的MMAlaya，请标明出处，并点个小星星 ⭐ ：

@misc{datacanvas2024mmalaya,
    author = {DataCanvas Ltd.},
    title = {mmalaya},
    year = {2024},
    howpublished = {\url{https://github.com/DataCanvasIO/MMAlaya}},
}

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
data		data
README.md		README.md
chang_chen.jpg		chang_chen.jpg
inference.py		inference.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MMAlaya

Citation

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

MMAlaya

Citation

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages