Limingdao 正在加载

PinchBench

龙虾模型排行榜，评估不同模型在真实 Agent 自动化任务中的能力

AI大模型 #pinchbench

站点详情介绍

PinchBench

PinchBench

龙虾模型排行榜，评估不同模型在真实 Agent 自动化任务中的能力

相关导航推荐

Arena.ai

由美国加州大学伯克利分校推出的AI模型评估平台

Artificial Analysis

Artificial Analysis

专注于AI语言模型和API提供商的独立分析平台

GPT

GPT

首个具备原生计算机使用能力的通用模型，支持跨应用的复杂工作流程

Llama

Meta推出的一款开源大语言模型

MiMo

MiMo

小米公司自研的开源推理大模型系列，专注于高效推理与多模态交互

MiniMax

MiniMax 自主研发了一系列多模态通用大模型，具备强大的代码和 Agent 能力，以及超长上下文处理能力