谷歌发布多模态AI模型Gemini,功能从自然图像、音频和视频理解拓展到数学推理

2023-12-09  美国 来源:其他 作者:刘纪铖 领域:信息

关键词:

据品玩网12月7日消息,谷歌发布多模态AI模型Gemini,功能从自然图像、音频和视频理解拓展到数学推理。Gemini可以归纳、理解、操作以及组合不同类型的信息。不仅能够处理文本,图像、视频和音频,还可以完成复杂的数学、物理等科学领域任务,并能理解和生成各种编程语言的高质量代码。谷歌表示,在被大型语言模型研究和开发中广泛使用的32项学术基准中,Gemini Ultra的性能有30项都超越了目前ChatGPT所代表的最先进水平。

消息来源:https://www.pingwest.com/a/290792