谷歌 Gemini 2.5 Flash 船新版本!你可以控制它思考的程度!

7 min read

嘿,各位开发者和AI 工具发烧友们!准备好迎接 AI 生产力的新浪潮了吗?谷歌今天放了个大招——Gemini 2.5 Flash 预览版正式上线啦!🚀

简单来说,这货就是大家熟悉的 2.0 Flash 的超级升级版。它不仅继承了前辈的速度快、成本低的优良传统,更在“脑子”(也就是推理能力)上来了个史诗级增强!关键是,它还是谷歌首款能让你控制“思考开关”的混合推理模型

允许开发者通过开关控制模型是否进入 “思考”过程(thinking process),控制成本而且性能不俗!

能“思考”的 AI,不止是强还便宜?

以前的 AI 可能拿到指令就直接开干,但 Gemini 2.5 系列模型不一样,它们会先“想一想”。遇到复杂的任务,比如解数学题、分析研究问题,它会先理清思路、拆解步骤、规划答案,然后再给你结果。这个“思考”过程,让它在处理需要多步推理的难题时,表现得更准确、更全面。 不吹不黑,在 LMArena 的硬核提示词挑战(Hard Prompts)中,Gemini 2.5 Flash 的表现仅次于它的大哥 2.5 Pro,实力杠杠滴!

性能不俗,价格更是惊喜

更让人“麻了”的是,2.5 Flash 的性能指标足以媲美市面上其他领先模型,但成本和模型大小却低得多

性价比之王 + 精细化“思考”控制 = 你的新利器!

2.5 Flash 不仅延续了性价比优等生的称号,还给了开发者前所未有的控制权

我们知道,不同的应用场景对质量、成本和延迟的要求各不相同。所以,谷歌这次贴心地加入了 “思考预算”(thinking budget) 功能。你可以精细地控制模型在“思考”阶段最多消耗多少 token。

思考预算越高,推理质量随之提升 而且模型很聪明,它会根据任务的复杂度自动判断需要“思考”多久,不会无脑用光你的预算。

看看它能帮你搞定哪些事儿?(不同思考量级示例)

立即上手体验 Gemini 2.5 Flash!🛠️

心动不如行动!现在,你就可以通过以下途径,抢先体验带“思考”能力的 Gemini 2.5 Flash 预览版:

  1. Gemini API (通过 Google AI Studio): 点击直达 (界面友好,适合快速测试)
  2. Gemini API (通过 Vertex AI): 点击直达 (谷歌云平台,适合深度集成)
  3. Gemini App: 在应用里找到专属的下拉选项即可体验。

试试调整 thinking_budget 参数,看看这个可控的“思考”能力如何帮你解决更复杂的问题吧! 这里有个 Python 代码示例,让你快速上手:

from google import genai
# 替换成你的 API Key
genai.configure(api_key="YOUR_GEMINI_API_KEY")
# 创建模型客户端
model = genai.GenerativeModel(
  model_name="gemini-2.5-flash-preview-04-17"
)
# 定义生成配置,设置思考预算
generation_config = genai.types.GenerationConfig(
    # 这里设置思考预算为 1024 tokens
    thinking_config=genai.types.ThinkingConfig(
      thinking_budget=1024
    )
)
# 发起请求
response = model.generate_content(
  "你掷两个骰子。它们加起来等于 7 的概率是多少?",
  generation_config=generation_config
)
print(response.text)

最后这是官方介绍

最全面一手信息已经看过,这是赛博程序员赵师傅给你整理的干货,如果觉得还不错,可以顺手点个关注~