xAI公司展示首个多模态模型,有望为下游赋能


Grok-1.5 Vision能处理文档、图表、截图和照片中的内容。今日重要性:✨

当地时间4月12日,马斯克旗下人工智能公司XAI推出首个多模态模型Grok-1.5 Vision,不仅能理解文本,还能处理文档、图表、截图和照片中的内容。xAI还分享了Grok-1.5V的跑分情况,在RealWorldQA基准测试中,比GFT-4V、Gemini Pro 1.5等主流竞争对手更为优异。

开源证券认为,国内外AI多模态模型能力持续突破,并逐步开启商业化,或持续赋能影视制作、IP开发、广告营销、教育教学、音乐创作、游戏研发等领域降本提效。多模态模型的竞争,也有望推动训练端对图像、视频、音频类语料需求增加。看好AI影视、AI营销、AI教育、AI音乐、AI游戏等投资主线。

公司方面,据上证报表示,

昆仑万维:公司的自研大语言模型“天工3.0”将于4月17日正式开启公测,并将同步开源4000亿参数MoE混合专家型。

拓尔思:公司拥有合规安全的中文、图文、视频等多模态语料库,已为小米、云之声、云天励飞等头部大模型厂商提供预训练数据集服务。

*免责声明:文章内容仅供参考,不构成投资建议

*风险提示:股市有风险,入市需谨慎

    扫码下载APP

    微信公众号二维码 公众号
    用户反馈
    回到顶部