LLaVA:大型语言和视觉助手
加拿大
行业导航 AI导航 行业导航
LLaVA:大型语言和视觉助手

LLaVA:大型语言和视觉助手

LLaVA 代表了一种新颖的端到端训练的大型多模态模型,它结合了视觉编码器和 Vicuna 以实现通用视觉和语言理解,实现了模仿多模态 GPT-4 精神的令人印象深刻的聊天功能,并设定了新的状态-科学质量检查的艺术准确性。

相关导航

暂无评论

暂无评论...