谷歌 Gemini 2.5 Flash 船新版本！你可以控制它思考的程度！

嘿，各位开发者和AI 工具发烧友们！准备好迎接 AI 生产力的新浪潮了吗？谷歌今天放了个大招——Gemini 2.5 Flash 预览版正式上线啦！🚀

简单来说，这货就是大家熟悉的 2.0 Flash 的超级升级版。它不仅继承了前辈的速度快、成本低的优良传统，更在“脑子”（也就是推理能力）上来了个史诗级增强！关键是，它还是谷歌首款能让你控制“思考开关”的混合推理模型！

允许开发者通过开关控制模型是否进入 “思考”过程（thinking process），控制成本而且性能不俗！

能“思考”的 AI，不止是强还便宜？

以前的 AI 可能拿到指令就直接开干，但 Gemini 2.5 系列模型不一样，它们会先“想一想”。遇到复杂的任务，比如解数学题、分析研究问题，它会先理清思路、拆解步骤、规划答案，然后再给你结果。这个“思考”过程，让它在处理需要多步推理的难题时，表现得更准确、更全面。不吹不黑，在 LMArena 的硬核提示词挑战（Hard Prompts）中，Gemini 2.5 Flash 的表现仅次于它的大哥 2.5 Pro，实力杠杠滴！

性能不俗，价格更是惊喜

更让人“麻了”的是，2.5 Flash 的性能指标足以媲美市面上其他领先模型，但成本和模型大小却低得多！

性价比之王 + 精细化“思考”控制 = 你的新利器！

2.5 Flash 不仅延续了性价比优等生的称号，还给了开发者前所未有的控制权。

我们知道，不同的应用场景对质量、成本和延迟的要求各不相同。所以，谷歌这次贴心地加入了 “思考预算”（thinking budget） 功能。你可以精细地控制模型在“思考”阶段最多消耗多少 token。

想要极致速度和低成本？ 没问题，把思考预算设为 0！即使这样，性能也比 2.0 Flash 有提升。
处理复杂任务，追求高质量结果？ 把预算调高点（最高可达 24576 tokens），让它“多想一会儿”，答案质量自然提升。

思考预算越高，推理质量随之提升 而且模型很聪明，它会根据任务的复杂度自动判断需要“思考”多久，不会无脑用光你的预算。

看看它能帮你搞定哪些事儿？（不同思考量级示例）

几乎不用思考（低预算/预算0）：
- “谢谢”用西班牙语怎么说？ (Gracias)
- 加拿大有多少个省份？ (10 个)
需要动动脑筋（中等预算）：
- 掷两个骰子，点数之和为 7 的概率是多少？ (需要简单计算)
- 帮我规划一下工作日去健身房打球的时间表，既要满足 5 小时篮球时间，又要避开我的工作时间 (9-6pm) 和健身房的开放时间 (周一三五 9-3pm, 周二周六 2-8pm)。(需要逻辑规划)
得好好想想（高预算）：
- 计算悬臂梁的最大弯曲应力（涉及物理公式和计算）。
- 编写一个 Python 函数 evaluate_cells 来计算电子表格单元格的值，处理依赖关系、运算符优先级和循环引用检测。（涉及复杂编程逻辑）

立即上手体验 Gemini 2.5 Flash！🛠️

心动不如行动！现在，你就可以通过以下途径，抢先体验带“思考”能力的 Gemini 2.5 Flash 预览版：

Gemini API (通过 Google AI Studio): 点击直达 (界面友好，适合快速测试)
Gemini API (通过 Vertex AI): 点击直达 (谷歌云平台，适合深度集成)
Gemini App: 在应用里找到专属的下拉选项即可体验。

试试调整 thinking_budget 参数，看看这个可控的“思考”能力如何帮你解决更复杂的问题吧！这里有个 Python 代码示例，让你快速上手：

from google import genai
# 替换成你的 API Key
genai.configure(api_key="YOUR_GEMINI_API_KEY")
# 创建模型客户端
model = genai.GenerativeModel(
  model_name="gemini-2.5-flash-preview-04-17"
)
# 定义生成配置，设置思考预算
generation_config = genai.types.GenerationConfig(
    # 这里设置思考预算为 1024 tokens
    thinking_config=genai.types.ThinkingConfig(
      thinking_budget=1024
    )
)
# 发起请求
response = model.generate_content(
  "你掷两个骰子。它们加起来等于 7 的概率是多少？",
  generation_config=generation_config
)
print(response.text)

最后这是官方介绍

最全面一手信息已经看过，这是赛博程序员赵师傅给你整理的干货，如果觉得还不错，可以顺手点个关注～