在上周的Cloud Next大会上,Google宣布Gemini 2.5 Flash模型即将推出,并带来重大改进。今天,Google宣布通过Google AI Studio和Vertex AI在Gemini API中推出Gemini 2.5 Flash预览版。Gemini用户也可以通过模型选择器使用此新模型,并可与Canvas配合使用,轻松优化文档和代码。
</"4 zD|
Q<(YP.k 继上一代Gemini 2.0 Flash之后,Gemini 2.5 Flash在推理能力方面进行了显著提升,且成本和延迟均有所降低。Google声称这款新机型拥有卓越的性价比。具体价格如下:
_5Bcwa/ ,'fxIO 每100万输入词元0.15美元
TQ@d~GR ]wVk+%e 每100万个输出词元收费0.60美元(无需推理)
aA'TD:&p1 -yAQ 每100万个输出词元(含推理)收费3.50美元
\nqkA{;B{ DKL@wr}8 这是Flash 2.5的早期版本,但相比Flash 2.0版本,它已展现出巨大的性能提升。
Z|lU8`'5 `#P$ ]: 如有需要,您可以完全关闭思考功能,并使用此模型作为Flash 2.0的直接替代品。
PmpNAVE' dl-l"9~; 它可在Gemini API、AI Studio、Vertex和Gemini应用中使用!
`:NaEF?Sj wK_]/Q-L —Logan Kilpatrick( OfficialLoganK)
%ysZ5:X \nNXxTxX! Gemini 2.5 Flash是Google首款完全混合推理模型,允许开发者选择开启或关闭推理功能。据称,这可以帮助开发者根据目标质量、成本和延迟来优化响应。请查看下方此新模型的基准测试。
!^oV #
'9p@vi{\ 如上表所示,尽管成本低廉,但与Anthropic和Grok的前沿模型相比,Gemini 2.5 Flash似乎仍不失优势。OpenAI近期发布的o4-mini似乎性能优于Gemini 2.5 Flash预览版,但价格却高得多。
YY((#"o;l