AI新战场开启 Google与OpenAI决战多模态大语言模型

AI新战场开启 Google与OpenAI决战多模态大语言模型 (图:shutterstock)(photo:CnYes)

据外媒报导，随着 AI 竞争加剧，Google(GOOGL-US) 和 OpenAI 的较劲进入白热化，双方均力图抢先推出下一代「多模态 (multimodal)」大型语言模型 (LLM)。

报导称，这些多模态模型可以处理图像和文本，例如，使用者只需要提供模型一张网页草图，模型就可以为网站生成程式码，或向使用者提供可视图表的文本分析。

先前有报导称，Google 正在接近这个目标，并已经与一小部分外部公司分享了名为 Gemini 的多模态大型语言模型。

不过，OpenAI 似乎想要抢在 Google 之前发布。知情人士透露，这家人工智慧新创公司正将其最先进的大型语言模型 GPT-4 与多模态功能结合，其新模型的代号为 Gobi。

与 GPT-4 不同，Gobi 从一开始就被设计成多模式，不过似乎 OpenAI 公司尚未开始训练这个模型。

此外，随着关于 GPT-5 的传言逐渐传播开来，但目前并没有相关消息。

报导形容，这场竞赛类似于人工智慧版的苹果与安卓之争。而 Gemini 的到来，将可看出 Google 和 OpenAI 之间的差距到底有多大。

外媒 The Information 上周独家报导称，Gemini 可能很快准备好进行测试发布，并将整合到像 Google Cloud Vertex AI 等服务中。

一位使用过 Gemini 早期版本的人透露，与现有的模型相比，Gemini 似乎产生的错误答案更少。

这场人工智慧大战，目前由 OpenAI 领先并成功带领风潮，但一直有分析师看好 Google 的潜力，主因是 Google 拥有更丰富的文字、图像、影片和音讯相关的专有数据，这一优势也会有利于他们向多模态模型的推动。

超级央行日全球金融大警戒
全球新闻 • 财经贸易 • • WendyWu(-61)