
我覺得,行業大模型并非一個行業對應一個模型,而是一個場景對應一個模型。行業大模型底下會分成不少不同的場景,也可以說它是場景模型的集合。像體檢報告預測不代表整個醫療領域,只代表醫療里的個場景,或者說是慢病管理的場景。這些場景可能涉及特殊的模態,比如醫療場景可能是體檢報告,金融場景可能是信用報告。基于這些特殊的模態,要去構建生成式AI模型。
各個行業的大模型不可能全靠第四范式一家來解決。我們不打算發布幾千、幾萬個模型,而是發布一個行業大模型的開發和管理平臺,這也是先知AIOS 5.0的核心價值。企業要開發行業大模型時,可以把特定模態的數據上傳到這個平臺,低門檻開發出所需的行業大模型。我們解決各行各業的場景問題,其實是要降低模型開發的門檻。
我相信未來第四范式開發的模型只會是其中的千分之一、萬分之,甚至更少。絕大多數模型得由行業里的人來開發。最難的其實不是技術。行業大模型的訓練主要也基于Transformer架構。Transformer的出現降低了生成式AI的構建成本,也就是預測下一個字或者其他模態的“X”的成本降低了?,F在,我們能用過去同樣的成本做出更大的模型。行業大模型構建的難點在于,場景多了之后,沒辦法在每個場景都安排最優秀的科學家來參與。這一行的科學家人數實在太少了。