Skip to main content

AI 模型比较

在 副驾驶聊天 中比较可用的 AI 模型,并为你的任务选择最佳模型。

比较 GitHub Copilot 的 AI 模型

GitHub Copilot 支持具有不同功能的多个 AI 模型。 你选择的模型会影响 副驾驶聊天 和 Copilot 内联建议的响应质量和相关性。 某些模型提供较低的延迟,而另一些模型则提供更少的幻觉现象或在特定任务上表现更佳。 本指南可帮助你根据任务(而不仅仅是模型名称)选择最佳模型。

注意

  • 不同的模型根据其令牌定价以不同的费率使用 AI credits 。 有关详细信息,请参阅 GitHub Copilot 的模型和定价
  • 选择模型时选择 “自动 ”选项会自动根据模型可用性和任务复杂性为任务选择最佳模型。 如果你使用的是付费 Copilot 计划,则当你使用 “自动 ”选项时,你有资格获得模型成本的折扣。 请参阅“关于 Copilot自动模型选择”。

使用下表快速查找合适的模型,请在以下部分中查看更多详细信息。

型号任务领域在(主要用例)方面表现出色其他阅读材料
GPT-5 mini
                               | General-purpose coding and writing | Fast, accurate code completions and explanations        | [GPT-5 mini model card](https://cdn.openai.com/gpt-5-system-card.pdf) |

| | | GPT-5.3-Codex | Agentic software development | Agentic tasks | GPT-5.3-Codex model card | | | | GPT-5.4 | Deep reasoning and debugging | Multi-step problem solving and architecture-level code analysis | GPT-5.4 model card | | | | GPT-5.4 mini | Agentic software development | Codebase exploration and is especially effective when using grep-style tools | GPT-5.4 mini model card | | | | GPT-5.5 | Deep reasoning and debugging | Multi-step problem solving and architecture-level code analysis | GPT-5.5 model card | | | | Claude Fable 5 | Long-horizon, autonomous coding and knowledge-work | First-attempt correctness through upfront reasoning, aggressive parallel tool batching, and proactive verification of pre-existing test state before debugging | Claude Fable 5 model card | | | | Claude Haiku 4.5 | Fast help with simple or repetitive tasks | Fast, reliable answers to lightweight coding questions | Claude Haiku 4.5 model card | | | | Claude Opus 4.7 | Deep reasoning and debugging | Complex problem-solving challenges, sophisticated reasoning | Claude Opus 4.7 model card | | | | Claude Opus 4.8 | Deep reasoning and debugging | Complex problem-solving challenges, sophisticated reasoning | Not available | | | | Claude Opus 4.8 (fast mode) (preview) | Deep reasoning and debugging | Complex problem-solving challenges, sophisticated reasoning | Not available | | | | Claude Sonnet 4.5 | General-purpose coding and agent tasks | Complex problem-solving challenges, sophisticated reasoning | Claude Sonnet 4.5 model card | | | | Claude Sonnet 4.6 | General-purpose coding and agent tasks | Complex problem-solving challenges, sophisticated reasoning | Claude Sonnet 4.6 model card | | | | Claude Sonnet 5 | General-purpose coding and agent tasks | Complex problem-solving challenges, sophisticated reasoning | Not available | | | | Gemini 2.5 Pro | Deep reasoning and debugging | Complex code generation, debugging, and research workflows | Gemini 2.5 Pro model card | | | | Gemini 3 Flash | Fast help with simple or repetitive tasks | Fast, reliable answers to lightweight coding questions | Gemini 3 Flash model card | | | | Gemini 3.1 Pro | Deep reasoning and debugging | Effective and efficient edit-then-test loops with high tool precision | Not available | | | | Gemini 3.5 Flash | Fast help with simple or repetitive tasks | Fast, reliable answers to lightweight coding questions | Gemini 3.5 Flash model card | | | | MAI-Code-1-Flash

1 | General-purpose coding and writing | Fast, accurate code completions and explanations | MAI-Code-1-Flash model card | | | | Qwen2.5 | General-purpose coding and writing | Code generation, reasoning, and code repair / debugging | Qwen2.5 model card | | | | Raptor mini | General-purpose coding and writing | Fast, accurate code completions and explanations | Coming soon | | | | Kimi K2.7 Code | General-purpose coding and agent tasks | Fast, reliable answers to lightweight coding questions | Kimi K2.7 Code model card | | |

任务:常规用途的编码和编写

将这些模型用于需要平衡质量、速度和成本效益的常见开发任务。 如果没有特定要求,这些模型是不错的默认方案。

型号为什么它很合适
GPT-5.3-Codex在复杂的工程任务(如功能、测试、调试、重构和评审)中,无需冗长指令即可交付更高质量的代码。
GPT-5 微型这是适合大多数编码和编写任务的可靠默认方案。 快速、准确且跨语言和框架工作良好。
猛龙迷你专门用于提供快速而准确的内联建议和解释。
MAI-Code-1-Flash强大的指令跟踪和自适应推理使其成为日常编码任务、编写和多轮次开发工作流的可靠默认值。

何时使用这些模型

如果要执行以下操作,请使用这些模型之一:

  • 编写或查看函数、短文件或代码变更。
  • 生成文档、注释或摘要。
  • 快速解释错误或意外行为。
  • 在非英语编程环境中工作。

何时使用其他模型

如果要处理复杂的重构、体系结构决策或多步骤逻辑,请考虑使用深层推理和调试中的模型。 若要完成更快、更简单的任务(如重复编辑或一次性代码建议),请参阅快速帮助完成简单或重复的任务

任务:快速帮助完成简单或重复的任务

这些模型针对速度和响应能力进行了优化。 它们非常适合快速编辑、实用工具函数、语法帮助和轻型原型制作。 你将获得快速答案,而无需等待不必要的深度或较长的推理链。

型号为什么它很合适
克劳德·海库 4.5平衡快速响应与高质量输出。 非常适合小型任务和轻型代码解释。
MAI-Code-1-Flash处理具有自适应效率的快速编码任务,为简单请求保持简洁,并提供快速、准确的响应,而无需不必要的深度。

何时使用这些模型

如果要执行以下操作,请使用这些模型之一:

  • 编写或编辑小型函数或实用工具代码。
  • 询问快速语法或语言问题。
  • 以最少的设置建立创意原型。
  • 获取有关简单提示或编辑的快速反馈。

何时使用其他模型

如果要处理复杂的重构、体系结构决策或多步骤逻辑,请参阅深层推理和调试。 有关需要更强常规用途的推理或更结构化输出的任务,请参阅常规用途的编码和编写

任务:深层推理和调试

这些模型专为需要分步推理、复杂决策或高上下文感知的任务而设计。 当你需要结构化分析、深思熟虑的代码生成或多文件理解时,它们就很合适。

型号为什么它很合适
GPT-5 微型提供深度推理和调试能力,与 GPT-5 相比,响应速度更快,资源使用率更低。 非常适合交互式会话和分步代码分析。
GPT-5.5擅长复杂的推理、代码分析和技术决策。
克洛德十四行诗 4.6对 Sonnet 4.5 版本进行了改进,在压力下能够更可靠地完成任务并进行更智能的推理。
克劳德·奥普斯 4.7Anthropic 的最强模型。 在 克洛德作品4.6 基础上进行了改进。
双子座 3.1 专业版长篇语境中的高级推理和科学或技术分析。

何时使用这些模型

如果要执行以下操作,请使用这些模型之一:

  • 在跨多个文件的上下文中调试复杂问题。
  • 重构大型或互连的代码库。
  • 跨层规划功能或架构。
  • 在库、模式或工作流之间进行权衡。
  • 分析日志、性能数据或系统行为。

何时使用其他模型

若要完成快速迭代或轻型任务,请参阅快速帮助完成简单或重复的任务。 有关常规开发工作流或内容生成,请参阅常规用途的编码和编写

任务:使用视觉对象(图表、屏幕截图)

如果要询问有关屏幕截图、图表、UI 组件或其他视觉输入的问题,请使用这些模型。 这些模型支持多模态输入,非常适合前端工作或视觉对象调试。

型号为什么它很合适
GPT-5 微型这是适合大多数编码和编写任务的可靠默认方案。 快速、准确,并支持视觉推理任务的多模式输入。 在不同的语言和框架中都能良好运作。
克洛德十四行诗 4.6对 Sonnet 4.5 版本进行了改进,在压力下能够更可靠地完成任务并进行更智能的推理。
双子座 3.1 专业版深度推理和调试,非常适合复杂的代码生成、调试和研究工作流。

何时使用这些模型

如果要执行以下操作,请使用这些模型之一:

  • 询问有关图表、屏幕截图或 UI 组件的问题。
  • 获取有关视觉草稿或工作流的反馈。
  • 通过视觉上下文了解前端行为。

提示

如果在不支持图像输入(如代码编辑器)的上下文中使用模型,则看不到视觉推理的优势。 可以使用 MCP 服务器间接访问视觉输入。 请参阅“使用 MCP(模型上下文协议)服务器扩展 GitHub Copilot 对话助手”。

何时使用其他模型

如果任务涉及深层推理或大规模重构,请考虑使用深层推理和调试中的模型。 若要完成纯文本任务或更简单的代码编辑,请参阅快速帮助完成简单或重复的任务

后续步骤

选择正确的模型可帮助你充分利用 Copilot。 如果不确定要使用哪种模型,请从常规用途选项开始 GPT-5 微型,然后根据需求进行调整。

Footnotes

  1. MAI-Code-1-Flash is a continuously improving model. Performance and behavior may evolve over time as new checkpoints are released.