GPT-4.1深夜偷袭，OpenAI掏出史上最小、最快、最便宜三大模型，百万token上下文-灵析社区

OpenAI发布了最新的GPT-4.1系列模型，包含三款新模型：GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。相较于之前的GPT-4o和GPT-4o mini，GPT-4.1系列模型在编码、指令遵循和长文本理解方面表现更为优异。 GPT-4.1性能概览： - 编码能力：GPT-4.1在SWE-bench测试中的得分为54.6%，显著超过GPT-4o和GPT-4.5，表现更为出色。 - 指令遵循：在MultiChallenge基准测试中，GPT-4.1的得分为38.3%，比GPT-4o提高了10.5%。 - 长文本理解：在Video-MME基准测试中，GPT-4.1在无字幕视频理解上的得分为72.0%，超越了GPT-4o。 GPT-4.1 nano：这是GPT-4.1系列中最快、最经济的版本，特别适合对延迟敏感的场景。其在MMLU测试中的得分为80.1%，比GPT-4o mini更为优秀。应用场景：GPT-4.1的性能优化使其在编码、指令遵循和长文本理解方面为开发者提供了更强的支持。OpenAI表示，GPT-4.1将为智能系统和复杂应用的构建开辟新的可能性。价格优化：GPT-4.1的成本比GPT-4o低26%，并且在重复查询时，OpenAI提供了高达75%的缓存折扣。性能测试示例： - 编码能力：GPT-4.1在代码任务上显著超越了GPT-4o，特别是在多语言差异和编辑大型文件方面更为高效。 - 指令遵循能力：GPT-4.1在多轮自然对话中的表现提升了10.5%。 - 长文本理解：GPT-4.1能够处理百万token级别的上下文，适合用于大规模的代码库和长文档的解析。总体来说，GPT-4.1系列的发布不仅提升了模型的性能，也在性价比和处理能力上为开发者提供了更大的优势。