全球技术地图

全球

欧盟

英国

中国

美国

印度

以色列

日本

其他

谷歌发布多模态AI模型Gemini，功能从自然图像、音频和视频理解拓展到数学推理

2023-12-09 美国来源：其他作者：刘纪铖领域：信息

关键词：

据品玩网12月7日消息，谷歌发布多模态AI模型Gemini，功能从自然图像、音频和视频理解拓展到数学推理。Gemini可以归纳、理解、操作以及组合不同类型的信息。不仅能够处理文本，图像、视频和音频，还可以完成复杂的数学、物理等科学领域任务，并能理解和生成各种编程语言的高质量代码。谷歌表示，在被大型语言模型研究和开发中广泛使用的32项学术基准中，Gemini Ultra的性能有30项都超越了目前ChatGPT所代表的最先进水平。

消息来源：https://www.pingwest.com/a/290792