一、用戶量:海外加速出圈,迅速登頂全球下載榜單
1、網頁端:重度用戶為主,DeepSeek 在 24 年 12 月 26 日推出V3(對標 GPT4o),因其顯著的性能,用戶迅速開始增長,同時在 1月 20 日發布 R1(對標 GPT-o1)后,進一步出圈。
2、APP 端:大眾用戶為主,R1 推出后,追平 GPT-o1,迅速出圈海外。根據點點數據,從 DeepSeek 在美國下載排名從 1 月 22 日的 201名,迅速在 1 月 27 日登頂第一名;根據七麥數據,截止 1 月 30 日,DeepSeek 在 168 個國家位居下載榜第一名。
二、DeepSeek 偏好激進性創新:架構(MOE+MLA)+精度(FP8)
1、MOE 架構創新:相比過去主流模型的 MOE 專家模型停留在8~16 個,而 DeepSeek 每個 MoE 層包含 1 個共享專家和 256 個路由專家,有助于降低模型推理時激活的參數量。
2、MLA 架構創新:MLA 通過聯合壓縮鍵值矩陣為低秩向量,將多個頭的鍵值信息融合,使推理時僅需緩存少量低秩向量,大幅降低 KV 緩存需求,減少內存占用。
3、訓練特色:突破大模型訓練固定思維(一般模型權重和梯度使用 FP16,優化器參數使用 FP32),敢于嘗試在低精度 FP8 的模式下訓練大模型,并且該嘗試同樣出現了較好的效果。
三、DeepSeek 開源對 AI 應用和 AI 終端的影響:產品力競爭時代
DeepSeek 從 V3 到 R1,將進一步推動全行業大模型的提升,更快的追趕 GPT4o 和 GPT-o1;同時成本的下降,有助于 AI 應用和 AI 終端的普及。未來行業競爭將進入“產品能力競爭”,巨頭的流量優勢將進一步凸顯。
四、DeepSeek 對推理成本的影響:用戶規模和使用頻次
未來推動推理成本增加的核心因素:用戶規模和用戶使用頻次的增加。根據 Grok 創始人,過去 60 年,每10年計算成本降低約1000倍,但人們的購買量增加了 10 萬倍,總支出反而增長了 100 倍。
附件:DeepSeek帶來的AI變革,在低精度FP8的模式下訓練大模型,計算成本降低約1000倍

DeepSeek大模型的開源,低成本和高性能將大幅降低大模型的獲得,部署和應用成本,將加快大模型在 B 端和 C 端應用場景的落地;已應用于端側、教育、金融、辦公、傳媒、醫療、智能汽車、企業服務等多個應用場景,應用領域廣闊
DeepSeek 降低了單個模型的部署成本,AI 應用有望大規模落地, 推理算力需求將顯著增長,相關廠商有望加速進入業績兌現期,在 AI 應用前沿落地 場景中,全球 AI 應用產業有望迎來共振期
PI 調用層面,DS/OpenAI 的輸入費用分別為 0.55/15 美元/百萬 token,DS 推理使用成本僅為 OpenAI 的 4%,顯著的降低資金門檻,推動了 AI 技術平權
精準數據洞察與自動化效能提升方法論;DeepSeek將在企業服務、科研創新等垂直領域深度滲透;DeepSeek將通過開源戰略擴大開發者社區規模,并推出模型微調平臺和低代碼部署工具
周鴻祎以DeepSeek帶來的變革為切入點,深入剖析AI行業發展趨勢,并分享了AI技術于創業的應用前景,未來應用將從六大方向實現爆發,企業內部未來一定是多個大模型組合工作
AI生成的回答重復相似,缺乏新意,即使改變提問,無法提供不同的結論;使用更多樣的訓練數據和算法,提高AI的多樣性;優化訓練參數, 避免模型陷入局部最優
模型難以處理訓練集外的復雜場景,模型過度依賴參數化記憶,普通用戶難以辨別AI內容的真實性,可能對醫療建議、法律咨詢等專業場景的可 靠性產生長期懷疑
DeepSeek技術突破與應用場景,冷啟動數據與多階段優化,本地部署與端云協同,垂直領域深耕(醫療、金融、教育);智能協作與自動化轉型,消費決策與商業研究賦能
你想要生成什么樣的文案? 這樣的文案具備哪些特征? 你要針對什么生成類似文案? 篇幅、用詞、結構優化;批量生成新媒體文案
提示語(Prompt)是用戶輸入給AI系統的指令或信息,包括指令、上下文和期望,為了更有效地進行任務分解,可以采用SPECTRA模型,能夠掃描讀取各類文件及圖片中的文字內容
講座為DeepSeek原理和應用系列研討的講座之一,聚焦提示詞工程與產業實踐兩大核心模塊,延續前序對AIGC底層邏輯的探討,系統拆解如何通過自然語言交互充分釋放DeepSeek潛能
進一步探討大模型和AIGC的底層工作機制,旨在幫助讀者突破工具應用的局限,理解DeepSeek和AIGC的深層次價值。最后,介紹如何科學選擇與高效使用 AI 工具,為大家提供更具深度與實用性的應用場景的指導,給聽眾帶來更落地的AI應用價值