在上周的Cloud Next大会上,Google宣布Gemini 2.5 Flash模型即将推出,并带来重大改进。今天,Google宣布通过Google AI Studio和Vertex AI在Gemini API中推出Gemini 2.5 Flash预览版。Gemini用户也可以通过模型选择器使用此新模型,并可与Canvas配合使用,轻松优化文档和代码。
J%09^5:-z
3s\.cG?`r 继上一代Gemini 2.0 Flash之后,Gemini 2.5 Flash在推理能力方面进行了显著提升,且成本和延迟均有所降低。Google声称这款新机型拥有卓越的性价比。具体价格如下:
0R{dNyh{ * _a@z1 每100万输入词元0.15美元
f=C ,e/sw ;c~cet4 每100万个输出词元收费0.60美元(无需推理)
X[`bMa7IB( \$0F-=w`8 每100万个输出词元(含推理)收费3.50美元
S5~VD?O, \^ghdU 这是Flash 2.5的早期版本,但相比Flash 2.0版本,它已展现出巨大的性能提升。
JlMT<;7\ 'WaPrCw@Mf 如有需要,您可以完全关闭思考功能,并使用此模型作为Flash 2.0的直接替代品。
mxb(<9O i1H\#;`$ 它可在Gemini API、AI Studio、Vertex和Gemini应用中使用!
yFDv6yJ. R|O8RlH —Logan Kilpatrick( OfficialLoganK)
6qcO?U 'YNT8w/3 Gemini 2.5 Flash是Google首款完全混合推理模型,允许开发者选择开启或关闭推理功能。据称,这可以帮助开发者根据目标质量、成本和延迟来优化响应。请查看下方此新模型的基准测试。
wP[t0/dl
!Mi;*ZR 如上表所示,尽管成本低廉,但与Anthropic和Grok的前沿模型相比,Gemini 2.5 Flash似乎仍不失优势。OpenAI近期发布的o4-mini似乎性能优于Gemini 2.5 Flash预览版,但价格却高得多。
o-}R?>