谷歌发布更强模型迎战OpenAI 提到AI共121次
谷歌今天在I/O年度开发者大会发布性能更强人工智能模型Gemini 1.5 Pro、轻量模型Gemini 1.5 Flash,会中提到AI共121次强调其重要性,并试图于AI市场与OpenAI公司较劲。
抢在谷歌 I/O大会前夕,美国新创公司OpenAI于13日推出更高性能、更高效人工智能(AI)技术模式GPT-4o,能进行逼真的语音对话,将巩固旗下生成式工具ChatGPT地位,而且对所有使用者免费。
面对OpenAI来势汹汹,谷歌今天于美国加州山景城总部海岸线圆形剧场举办I/O开发者大会,以AI为核心发布新技术与服务,现场活动仅邀请全球部分开发者及媒体参与。
随着开场音乐响起,谷歌执行长皮查伊缓缓走上台表示,“我们还在AI非常早期的阶段”,现在看到这么多机会,推动这些机会的正是Gemini。目前有超过150万名开发者,在谷歌平台上使用Gemini模型。
皮查伊说,Gemini 1.5 Pro模型从一次可处理100万个词元脉络长度,将扩增到200万个,是目前为止可提供最长脉络处理的基础模型。现在开发者和谷歌 Cloud的客户可加入等候名单,使用200万个词元脉络长度的Gemini 1.5 Pro。
从实际应用来看,Gemini 1.5 Pro可以读懂1500页的文件、为100封电子邮件摘要,或处理长达1小时的影片内容。
为满足开发者需要更快速、更具成本效益的,谷歌 DeepMind执行长哈萨比斯宣布推出轻量模型Gemini 1.5 Flash,特别针对大规模、高频率的任务进行最佳化。
哈萨比斯也公布Astra计划的最新进展,让AI助理即时分析手机拍摄的画面,提供语音回答,展现AI助理未来的可能性。
现场播放的一段示范影片中,测试人员拿着手机开启可以即时录影与收音的App,Gemini会识别并回答看到的扬声器功能、分析电脑屏幕上显示的程序码用途;甚至测试人员忘记眼镜放在哪里时,Gemini也记得正确位置,引起观众热烈掌声。
在主题演讲最后,皮查伊笑说,今天光是AI这个字就被提到121次,也意味着AI已经成为谷歌发展技术的核心。
此外,谷歌也通过专门为谷歌搜索量身打造的全新Gemini模型,能够将Gemini的先进能力,像是多步骤推理、计划和多模态等特性,与谷歌的搜索系统进一步整合。
有时候用户只想快速找到答案,但没有时间看网络上的大量资讯,谷歌的AI总览功能就可以派上用场。目前使用者已经通过Search Labs推出的实验功能来使用AI总览,次数已经高达数十亿次。
谷歌宣布从今天开始将率先在美国推出AI总览,并于日后支持更多国家。从本周起,将有数亿使用者可以进一步体验AI总览,谷歌也预计于今年底前让超过10亿的使用者能够使用这项新功能。