AI新战场开启 Google与OpenAI决战多模态大语言模型

  • 发表时间:
    , 文章来源:CnYes, 新闻取自各大新闻媒体,新闻内容并不代表本网立场

    AI新战场开启 Google与OpenAI决战多模态大语言模型 (图:shutterstock)(photo:CnYes)
    AI新战场开启 Google与OpenAI决战多模态大语言模型 (图:shutterstock)(photo:CnYes)

    据外媒报导,随着 AI 竞争加剧,Google(GOOGL-US) 和 OpenAI 的较劲进入白热化,双方均力图抢先推出下一代「多模态 (multimodal)」大型语言模型 (LLM)。

    报导称,这些多模态模型可以处理图像和文本,例如,使用者只需要提供模型一张网页草图,模型就可以为网站生成程式码,或向使用者提供可视图表的文本分析。

    先前有报导称,Google 正在接近这个目标,并已经与一小部分外部公司分享了名为 Gemini 的多模态大型语言模型。

    不过,OpenAI 似乎想要抢在 Google 之前发布。知情人士透露,这家人工智慧新创公司正将其最先进的大型语言模型 GPT-4 与多模态功能结合,其新模型的代号为 Gobi。

    与 GPT-4 不同,Gobi 从一开始就被设计成多模式,不过似乎 OpenAI 公司尚未开始训练这个模型。

    此外,随着关于 GPT-5 的传言逐渐传播开来,但目前并没有相关消息。

    报导形容,这场竞赛类似于人工智慧版的苹果与安卓之争。而 Gemini 的到来,将可看出 Google 和 OpenAI 之间的差距到底有多大。

    外媒 The Information 上周独家报导称,Gemini 可能很快准备好进行测试发布,并将整合到像 Google Cloud Vertex AI 等服务中。

    一位使用过 Gemini 早期版本的人透露,与现有的模型相比,Gemini 似乎产生的错误答案更少。

    这场人工智慧大战,目前由 OpenAI 领先并成功带领风潮,但一直有分析师看好 Google 的潜力,主因是 Google 拥有更丰富的文字、图像、影片和音讯相关的专有数据,这一优势也会有利于他们向多模态模型的推动。