AI邁向平民化,DeepSeek改寫賽局

在今年農曆春節前夕,1月20日 中國的DeepSeek發布R1開源模型,讓美股在1月27日一舉下跌。其在晶片限制下,卻能用低成本訓練演算法造就媲每OpenAI o1,引發美股恐慌性下跌。

過往的語言模型需要獨力承擔訓練模型的成本,而後進者則能藉由蒸餾法的方式搭便車達到一定效果,DeepSeek就是利用蒸餾法,透過向大模型提問後,紀錄回應訓練小模型,DeepSeek就不需砸大錢從零開始訓練,能站在巨人的肩膀借力開發。
晶片取得及開發低成本爭議
DeepSeek 宣稱僅耗資 600 萬美元並使用 2048 塊 GPU 訓練其 AI 模型 R1,這一說法引發廣泛關注。相較於以往動輒數億美元的訓練成本,這讓業界重新審視 AI 模型的開發方式,並引發對其技術與資源取得方式的討論。
AI 晶片供應長期緊張,各大企業爭相競購以提升語言模型的運算能力。為維護國家安全並保持科技優勢,美國政府對先進 AI 晶片實施出口管制,使中國科技公司更難獲取高效能晶片。然而,有分析認為,DeepSeek 可能透過多種管道取得 H100,並混合使用 H800 和 H20 晶片進行訓練,從而克服硬體限制。
除了硬體來源,DeepSeek 的開發成本也備受關注。語言模型的訓練通常需要龐大資金,而 DeepSeek 宣稱的 560 萬美元成本明顯低於業界預期。然而,技術文件顯示,這一數字僅指最終訓練階段,不包含從研發到完整訓練的所有費用,實際成本遠高於此數據。
DeepSeek 也承認,其報告的成本僅涵蓋正式訓練,而不包括早期研究與實驗。進一步的分析表明,其 AI 開發支出可能超出最初公開的數據,但具體金額仍待進一步確認。儘管外界對 DeepSeek 的成本效益仍存疑問,其技術發展速度與成果已獲專業人士肯定,並被視為 AI 領域的重要競爭者,可能對市場格局帶來影響。
既是挑戰也是機會
與傳統語言模型相比,DeepSeek 的 API 定價僅為 OpenAI O1 的 10% 左右,這既是挑戰也是機會。對使用者而言,更低的成本意味著 AI 應用的普及度將進一步提升,使更多人能夠以較低門檻體驗 AI 技術。
同時,這也促使大型企業重新思考 AI 的發展模式。過去,AI 的演進往往伴隨著高昂的資金投入,包括硬體升級與軟體優化。然而,DeepSeek 在有限資源下打造出與 O1 相當的模型,顯示出 AI 開發可能存在不同的路徑,並不一定需要依賴大規模資本與算力投入。
對台灣而言,DeepSeek 的研發模式或許值得借鏡。如果能夠善用現有資源,探索更具成本效益的 AI 開發策略,台灣或許能在 AI 領域開創自己的發展方向。
筆者觀點
DeepSeek 的出現引發許多討論,也帶來一些省思。在我的使用體驗中,DeepSeek 模型在中文回答上的確優於許多其他語言模型,展現出較強的語言理解與表達能力。然而,該模型在敏感議題上的審查機制以及資料隱私問題,使我對其可靠性抱持保留態度。
針對中國歷史等敏感議題,DeepSeek 的回應模式較為一致,與中國的意識形態相符,卻與國際主流觀點有所差異。此外,其服務資料會回傳至中國伺服器,這也引發對數據隱私與安全性的疑慮。
雖然對我而言,DeepSeek 的使用體驗仍有不少限制,但其開源模型的推出,對於目前主導市場的封閉式 AI 模型公司帶來競爭壓力,使 AI 開發的成本降低,也為業界提供了不同的選擇。
資料來源
遠見雜誌,DeepSeek便宜又好?專家紛打臉,卻讚中國AI帶來兩啟示,曾子軒www.gvm.com.tw/artic...
遠見雜誌三月 P110-P113,雙向DeepSeek改寫賽局,AI開發邁向平民化,曾子軒
數位時代,DeepSeek解析1|神秘AI公司掀起全球AI風暴,一篇看懂553天關鍵布局www.bnext.com.tw/art...
Yahoo!財金,DeepSeek|引爆美股「小股災」 Nvidia一夜蒸發6000億美元破紀錄
Like my work? Don't forget to support and clap, let me know that you are with me on the road of creation. Keep this enthusiasm together!