龙虾模型排行榜,评估不同模型在真实 Agent 自动化任务中的能力
由美国加州大学伯克利分校推出的AI模型评估平台
专注于AI语言模型和API提供商的独立分析平台
首个具备原生计算机使用能力的通用模型,支持跨应用的复杂工作流程
Meta推出的一款开源大语言模型
小米公司自研的开源推理大模型系列,专注于高效推理与多模态交互
MiniMax 自主研发了一系列多模态通用大模型,具备强大的代码和 Agent 能力,以及超长上下文处理能力