Poe 近日釋出2025年早期人工智能生態系統趨勢報告,基於其平台上數百萬用戶的使用數據,分析了AI領域的最新發展趨勢。作為擁有100多個來自頂尖AI公司文本、圖像、視頻和音頻模型的平台,Poe 提供了獨特視角,讓我們得以窺探這個快速發展的產業生態。
文本AI領域:雙雄並立,競爭激烈

報告顯示,在文本消息分享中,OpenAI和Anthropic兩家公司共佔據約85%的市場份額,形成雙雄割據的局面。特別值得注意的是,自Claude 3.5 Sonnet於2024年6月發布以來,Anthropic在Poe訂閱者中的使用率迅速增長,與OpenAI的模型使用量幾乎持平,顯示出文本模態領域競爭日益激烈。
隨著前沿實驗室不斷推出更強大的模型,新旗艦產品迅速取代舊版本成為常態。例如,GPT-4被GPT-4o取代,Claude-3被Claude 3.5取代(近日更升級成 Claude 3.7 )。與此同時,DeepSeek-R1和-V3從2024年12月的零使用率躍升至高峰期的7%信息分享水平,遠高於之前的任何開源模型系列如Llama和Mistral。
谷歌的Gemini家族在2024年10月前不斷增長,但此後有所下降。同期,”其他”官方模型的使用量也在增長,反映用戶對模型多樣性的需求日益增加。
圖像生成領域:新興力量崛起

在圖像生成領域,早期模型如DALL-E-3和各種StableDiffusion版本雖然開創了先河,但隨著官方圖像生成模型數量從3個增長至約25個,它們的相對使用份額下降了近80%。
BlackForestLabs的FLUX家族在2024年中期異軍突起,自此一直保持領先地位,佔據近40%的信息分享。同時,谷歌的Imagen3家族自2024年底發布以來持續增長,已佔據近30%的使用份額,包括其首個Imagen3模型和更優化的Imagen3-Fast。
專注於圖像生成的提供商如Playground和Ideogram也保持著相關性,它們透過頻繁的模型更新和刷新來維持競爭力,但總體市場份額僅約10%。
視頻生成領域:谷歌強勢挑戰Runway

視頻生成類別自2024年末起迅速擴展,目前已有超過八個提供商根據用戶的確切需求提供多樣化選項。
Runway雖然自2024年9月推出以來在其API中僅提供單一模型,且使用率隨時間有所下降,但其視頻生成消息仍保持在30%-50%的強勁水平。然而,谷歌的Veo-2自近期發布後迅速崛起,在短短幾週內就佔據了近40%的總視頻生成消息。
值得注意的是,包括Kling-Pro-v1.5、Hailuo-AI、HunyuanVideo和Wan-2.1在內的中文模型也在推動行業技術邊界的擴展,共佔約15%的視頻生成消息。Poe特別指出,這些模型的官方提供者均位於美國,受到Poe隱私政策約束,不會將數據發送到中國大陸。
未來前景展望
Poe表示,未來希望深入探討現實世界的使用模式,包括用戶在特定任務中偏好的生成AI模型、不同價格水平下的選擇傾向、這些偏好與公開報告的基準的一致性,以及是否出現模型組合或用戶忠誠度的有意義趨勢。
報告還強調,所有用戶信息的處理均遵循Poe的隱私政策,明確禁止模型提供商出於訓練目的使用通過Poe提交的任何輸入。Poe也肯定了Anthropic等組織在保護用戶隱私方面所做的努力。
TechApple 觀點:AI格局正迎來真正的多極化時代
這份報告透露了一個引人深思的事實:AI行業的霸主地位正在動搖。OpenAI不再是那個無可撼動的王者,Anthropic已經成功分得半壁江山。更令人驚訝的是,中國技術公司所研發的模型(儘管通過美國實體提供)正在悄然崛起,特別是在視頻生成這一前沿領域。
這一趨勢表明,技術壁壘正在被打破,AI的民主化進程正在加速。未來一年,我們很可能會看到更多的”黑馬”湧現,而那些目前享有市場主導地位的公司必須持續創新,否則將面臨被超越的風險。
尤其值得一提的是,隨著視頻生成技術的迅速普及和平民化,我們可能很快就會面臨一個深偽內容氾濫的世界,在那裡,分辨真實與虛構變得前所未有的困難。政策制定者和技術公司需要緊急合作,制定有效的監管框架和認證機制,以防止可能的社會混亂。
AI行業的星辰大海才剛開始探索,而這場競賽的結果,將重塑我們與技術互動的方式。無論是投資者、開發者還是普通用戶,都應密切關注這個領域的每一次變革。