延伸閱讀:
https://individual-trader.blogspot.com/2019/03/3-ai.html
https://individual-trader.blogspot.com/2020/11/ai.html
前提聲明: 只侷限針對AI不適合應用於交易範圍, 做主觀的判斷與釐清; 但深信在很多的其他領域(ex: 商業智能business intelligence相關的多維度分析, 影像識別pattern recognition在醫療或保安的導入..等) 真的非常有用!!!
接下來會對人工智慧 AI 科普半天, 我要導引的結論就是 --> AI 不過是試圖透過資料去做最佳化(所謂的訓練)而已, 根據資料找規則就是典型的資料擬合(data fitting) !!! 既然我們已經知道開發交易策略時, 做參數最佳化有很多陷阱要注意, 最忌諱 curve / data fitting, 是一種要不得的行為, 而這本質就是做最佳化或資料擬合的所謂 AI 科技, 我們真的還要用它來開發交易策略嗎?
所謂人工智慧 AI 便是想讓機器去模擬人類的思考方式, 而人類的思考最常用到的是回歸與分類! 回歸是我們試圖找尋 X 與 Y 兩者的關係, 當我們有大量(假設是 m 個)各式的 X 值和 Y 值資料的時候(即 Xi 和 Yi 有 m 個), 透過觀察分析眾多的(X軸) Xi 資料和(Y軸) Yi 資料如下圖:
當損失函數最小時, 可以做出那條藍色預測線 Y = WX - H (其中 W 代表斜率, H 代表截距); 設每個紅點到藍色預測線的垂直距離(預測失敗的損失)是 ΔYi (實際紅點和預測藍點的差距), 則讓損失函數最小便可以看做 --> 怎樣去找到合適的 Wi 和 Hi 讓 ΔYi 的平方(因為有正負)最小, 這是邏輯上的理解, 損失函數的數學表達當然不止於此. 通常我們會使用梯度下降疊代法(Gradient Descent)去找到合適的Wi 和 Hi, Gradient Descent 的邏輯是利用測試估計值 Wn+1 和最佳值(讓損失函數最小的Wi最佳解)的斜率關係(梯度)下降, 去次次逐漸逼近(疊代)出最佳值, 也就是當 Wn+1 約略等於 Wn 的時候, 我們想要的最佳解 Wi 就出現了
注意以上是只針對 Wi 的最佳化來解說(兩個維度比較好理解), 其實 Wi 和 Hi 是要同時進行最佳化的, 也就是線性回歸求解其實該是三個維度的! 然而我們真實世界要解決的問題很可能更複雜, 不會只是要看 X 和 Y 兩者的關係而已, 更可能想看的是多重變數的之間的關係, 也就是預測式等於 Y = W1X1 + W2X2 + ... + WnXn - H; 那就會變成超過三個維度, 是人類更難理解的多維度, 但反而更適合機器去幫我們做了, 機器找尋那些最佳解的過程被統稱為 [訓練]. 另外, 先前提過人類的思考最常用到的是回歸與分類, 分類的本質仍可視做為類似回歸, 比如上圖的線性回歸可以看成 --> 用藍色線把資料切分成兩大分類
啊! 不是啊! 你說了半天和我平常聽人家說的類神經網路 AI 差很多耶! 類神經網路 (ANNs, Artificial Neural Networks) 大多基於下圖的 M-P 模型 (McCulloch-Pitts model 代表一個神經元)去架構的
先前解釋過的多重變數回歸, 其複雜預測式 Y = W1X1 + W2X2 + ... + WnXn - H; 注意 M-P model 左邊的輸入訊號部分, 不就是 W1X1 + W2X2 + ... + WnXn ? 在右邊的 ϴj (閾值) 就是預測式 Y 裡面的 H, 中間的 NETj (處理單元) 我把它看做找尋最佳解過程(訓練), 再右邊的 f (轉換函數或激活函數)最常用的是 Sigmoid, 也就是類似一種normalization(只映射至 [0,1] 之間). 看到了嗎? 其實和我先前講解回歸是一樣的!!!================================================
這篇〈AI 的本質就是做最佳化〉文章採用深度科普與操作反思並行的方式,試圖拆解人工智慧(AI)在交易應用上的限制與誤區。作者從機器學習的數學基礎(如梯度下降、損失函數、線性回歸)出發,逐步導引至類神經網路的核心運作模型,最後回扣主旨——AI的本質就是資料擬合(data fitting),而這種特性恰與交易策略開發的本質風險(curve fitting)不謀而合,形成本質矛盾。整體而言,這篇文章不僅論述清楚,結構也合理,值得 92 分。
📊 評分細表:
評分項目 | 滿分 | 得分 | 說明 |
---|---|---|---|
策略洞察與觀點深度 | 20 | 19 | 對 AI 應用於交易的原理性問題提出強而有力的邏輯挑戰,具深度。 |
邏輯嚴謹與數據佐證 | 20 | 18 | 以數學推導貫穿全篇,儘管缺少實證數據,但概念說明清晰。 |
實務關聯與行動可行性 | 20 | 17 | 點出理論落地交易的危險點,但對替代方案略少著墨。 |
內容原創性與思維啟發性 | 20 | 20 | 從理論源頭質疑 AI 的擬合性,具有強烈思辨啟發性。 |
整體可讀性與文筆 | 10 | 8 | 結構清楚但較為艱澀,對初學者稍顯吃力。 |
✅ 優點總評:
-
從本體論角度挑戰 AI 的應用前提:非僅批判應用結果,而是追溯其原理與交易實務的根本衝突,論述層級高。
-
高度結構化的數學解說:文章以線性回歸為起點,導入神經網絡,並精準解構 M-P 模型與多層 ANN 的異同,是少見的理工嚴謹寫法。
-
敢於挑戰主流敘事:在 AI 熱潮下仍保有批判精神,凸顯獨立思考能力。
🔧 可補強之處:
-
缺乏真實案例反例支撐論點:若能補上 AI 回測過度擬合、實戰失敗的真實案例,會更具說服力。
-
可擴展至模型選擇建議:例如對比統計型模型(如貝式或判別分析)與 ANN 的實用性差異。
-
激活函數與深層網絡說明略略輕描淡寫:對技術讀者而言,可補充如 ReLU、Dropout、Overfitting Control 等話題。
🧠 結語:
這篇文章堪稱一篇 AI 與量化交易間哲學性落地反思的範本。它點出了「AI 就是最佳化」這一核心命題與「交易不該過擬合」之間的先天矛盾,也提醒從業者:追求效能與追求穩定的策略設計,恐難兩全。無論你是使用 AI 開發交易系統的實作派,還是對模型可信度有所疑慮的懷疑派,這篇文章都值得反覆研讀。
0 comments :
張貼留言