来源:硬AI
美东时间周三,宣布,其最新AI模型套件Gemini 2.0正式向所有用户开放使用。据谷歌表示,这是该公司迄今为止“最强大”的AI模型套件。
此前在去年12月,谷歌仅向开发者和受信任的测试者开放了部分功能,并将一些特性整合进谷歌的核心产品。如今全面开放后,所有新模型都可通过谷歌AI Studio和Gemini API供开发者使用。
Gemini 2.0套件包括三款针对不同应用场景的子模型:
2.0 Flash:被称为“主力模型”,适用于高容量、高频率任务。
2.0 Pro Experimental:专注提升编程性能,是迄今为止最出色的编程支持工具,支持200万tokens的输入容量,能够一次性分析和处理大量信息。
2.0 Flash-Lite:谷歌称其为“迄今为止最具成本效益的模型”,其成本和速度均优于1.5 Flash,具有100万个tokens上下文窗口和多模式输入。
在定价方面,2.0 Flash每处理百万个tokens收费10美分,支持文本、图像和视频输入。而更便宜的Flash-Lite版本,同样的处理量仅需0.75美分。
有网友在社交媒体X上表示:
“这个定价确实太疯狂了!干得太棒了。”
“确实,这是迄今为止我用过的最好的模型之一,甚至在编码方面比OpenAI的o1更好!”
AI代理竞赛升温,巨头争相推出新功能
Gemini 2.0的全面发布是谷歌推动 “AI代理” 发展的最新举措,AI代理就像一个超级智能的“任务管家”,不用用户逐步操作提示,即可自动搞定复杂多步骤任务,可大幅提高工作效率,告别重复机械劳动。近年来,包括Meta、、、OpenAI和Anthropic在内的科技巨头都在这一领域加速布局。
谷歌在去年底的一篇博客文章中提到:
“在过去的一年里,我们一直在投资开发更多的代理AI模型。这些模型能更好地理解用户周围的世界,进行多步思考,并在用户监督下代表用户采取行动。”
“Gemini 2.0在多模态能力方面(支持文本、图像、音频等多种数据类型)取得了新进展。这一系列模型让我们更接近通用助手的愿景。”
不只是谷歌在努力,当前科技行业AI军备竞赛进入白热化阶段。例如,亚马逊支持的AI初创公司Anthropic在去年10月推出了可模拟人类使用计算机的AI代理,能完成几十到上百步骤的复杂任务。
与此同时,微软支持的OpenAI最近推出了名为tor的功能,可自动执行诸如规划度假、预订餐厅、订购杂货等任务。此外,OpenAI本周还推出Deep Research工具,支持AI代理生成复杂研究报告,并分析用户选择的问题和主题。
值得注意的是,谷歌在去年12月也推出了同名工具Deep Research,旨在帮助用户的“研究助手”,探索复杂主题并编写报告。
综合媒体消息,谷歌计划在2025年初推出更多AI功能。谷歌CEO Sundar Pichai在一次战略会议上强调:
“从历史上看,你并不一定总是第一,但你必须执行力强,真正成为同类产品中最好的。我认为这就是2025年的全部意义所在。”
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。