Google正在发布一种新的人工智能模型,旨在提供强大的性能并注重效率。该模型名为Gemini 2.5 Flash,即将在Google的AI开发平台Vertex AI上推出。该公司表示,该模型提供“动态且可控”的计算能力,允许开发人员根据查询的复杂性调整处理时间。
KQ`=t
Qe$k3! Google在一篇博客文章中写道:“用户可以根据自己的特定需求调整速度、准确性和成本平衡。这种灵活性对于在高容量、成本敏感的应用中优化Flash性能至关重要。”
_*6v|Ed? lMifpK Gemini 2.5 Flash的发布正值旗舰AI模型价格持续上涨之际。像2.5 Flash这样价格更低、性能更强大的模型,虽然牺牲了一定的准确度,但却为昂贵的顶级产品提供了一个极具吸引力的替代方案。
Q0cRH"!: la^
DjHA$ Gemini 2.5 Flash是一款“推理”模型,类似于OpenAI的o3-mini和DeepSeek的R1。这意味着它需要更长的时间来回答问题,以便进行事实核查。
#A<P6zJXR *fc-gAj Google表示,2.5 Flash非常适合客户服务和文档解析等“大容量”和“实时”应用。
~?Omy8# %0-wpuHc(] Google在其博客文章中表示:“这款主力机型专门针对低延迟和降低成本进行了优化。对于响应式虚拟助手和实时摘要工具而言,规模效率至关重要,因此它是理想的引擎。”
?mYYt]R ofdZ1F Google尚未发布Gemini 2.5 Flash的安全或技术报告,这使得了解该模型的优势和不足之处变得更加困难。该公司此前曾表示,它不会发布其认为是“实验性”的模型的报告。
<4`eQ !<n"6KA. Google周三还宣布,计划从第三季度开始将2.5 Flash等Gemini模型引入本地环境。该公司的Gemini模型将在Google分布式云(GDC)上提供,GDC是Google为有严格数据治理要求的客户提供的本地解决方案。Google表示,它正在与NVIDIA合作,将Gemini模型引入符合GDC标准的NVIDIA Blackwell系统,客户可以通过Google或其首选渠道购买。
z/]q)`G