Page 1 of 1

AI 模型对决:文本、图像和视频生成的最佳选择

Posted: Sun Mar 23, 2025 9:53 am
by mdarafat5724
如今有这么多的 AI 模型,很难决定从哪里开始。Quora 的 Poe 最近的一项研究为那些不确定选择哪种模型的人提供了指导。

该研究分析了数百万次互动,以突出最受欢迎的文本、图像和视频生成工具。

几乎每家科技公司都提供 AI 解决方案,因此选择太多,让人眼花缭乱。Poe 的数据明确了哪些模型值得信赖且得到广泛使用。

无论您是 AI 新手还是经验丰富的专家,此报告都会显示可以帮助您找到最佳模型的趋势。请记住,这些数据代表 Poe 订阅者,可能无法反映更广泛的 AI 社区。

文本生成趋势
双向竞争
研究表明,在 Poe 用户中,Anthropic 模型正迅速变得与 OpenAI 一样受欢迎,尤其是在 Claude 3.5 Sonnet 发布之后。两家提供商的文本模型使用量现在几乎平分秋色。

快速采用新版本
即使忠于特定品牌,Poe 用户也经常会切换到最新型号。例如,人们会迅速从 OpenAI 的 GPT-4 转向 GPT-4o,或者从 Claude 3 转向 Claude 3.5。


新兴玩家
DeepSeek 的 R1 和 V3 已捕获 Poe 上约 7% 的消息。谷歌的 Gemini 系列在 Poe 用户中的使用率略有下降,但仍是关键参与者。

图像生成趋势
先行者的市场份额

DALL-E-3 和 StableDiffusion 曾经是图像生成领域 阿富汗电话号码数据 的领导者,但它们的份额已下降约 80%。这种下降发生在图像生成模型的数量从 3 个增加到 25 个左右的时候。

领先车型

BlackForestLabs 的 FLUX 系列目前是领先的图像模型,占有近 40% 的份额,而谷歌的 Imagen3 系列占有约 30% 的份额。

较小型号

规模较小的图像提供商(如 Playground 和 Ideogram)经常更新其服务,这有助于他们维持忠实的用户群。然而,他们仅占 Poe 图像生成使用量的 10% 左右。

视频生成趋势
新兴产业

直到 2024 年底,Poe 上才几乎不具备视频生成功能,但这一功能很快就流行起来。现在,至少有 8 家提供商提供此功能。

时装秀:最常使用的模型

Runway 的单一视频模式处理了 30–50% 的视频生成请求。虽然它的使用率比以前低了,但许多人仍然选择这个品牌。

新玩家:Veo-2

自从在 Poe 上推出以来,谷歌的 Veo-2 已经占据了约 40% 的市场份额,这表明客户偏好变化的速度非常快。其他新型号,如 Kling-Pro v1.5、Hailuo-AI、HunyuanVideo 和 Wan-2.1,占据了约 15% 的市场份额。

关键要点及展望
数据显示,用户偏好中新型号取代旧型号​​的趋势十分明显。如果您想要获得最佳性能,请使用最新版本,而不是坚持使用熟悉但过时的型号。

这些使用模式是否会保持稳定或继续转变仍有待观察。在某种程度上,成本将成为采用的障碍,因为新型号每次发布都会变得更贵。

在未来的报告中,Poe 计划分享不同模型如何适应不同任务和价格点的见解。