xAI公司展示首个多模态模型，有望为下游赋能

当地时间4月12日，马斯克旗下人工智能公司XAI推出首个多模态模型Grok-1.5 Vision，不仅能理解文本，还能处理文档、图表、截图和照片中的内容。xAI还分享了Grok-1.5V的跑分情况，在RealWorldQA基准测试中，比GFT-4V、Gemini Pro 1.5等主流竞争对手更为优异。

开源证券认为，国内外AI多模态模型能力持续突破，并逐步开启商业化，或持续赋能影视制作、IP开发、广告营销、教育教学、音乐创作、游戏研发等领域降本提效。多模态模型的竞争，也有望推动训练端对图像、视频、音频类语料需求增加。看好AI影视、AI营销、AI教育、AI音乐、AI游戏等投资主线。

公司方面，据上证报表示，

昆仑万维：公司的自研大语言模型“天工3.0”将于4月17日正式开启公测，并将同步开源4000亿参数MoE混合专家型。

拓尔思：公司拥有合规安全的中文、图文、视频等多模态语料库，已为小米、云之声、云天励飞等头部大模型厂商提供预训练数据集服务。

*免责声明：文章内容仅供参考，不构成投资建议

*风险提示：股市有风险，入市需谨慎