掃盲系列3: AI或理財機器人以行銷為多 ~ 自營家 Peter

近幾年理財機器人或是人工智慧(AI), 因為AlphaGo戰勝棋王的宣傳變得很夯, 不少人以為面對類似的市場戰局(抉擇), 人工智慧必定很有發揮的空間; 現實卻殘忍地告訴您, AI團隊努力了幾年卻宣告失敗了, 改轉進醫療相關領域, 可參考連結報導 https://zhuanlan.zhihu.com/p/31913355 (有人說是假新聞)

簡化地告訴您, 人工展現智慧前, 必須有一段機器學習的過程; 而這機器學習(ML)通常可以這樣定義：「透過從過往的資料和經驗中學習並找到其運行規則。」然而正是這 [資料] 和[經驗] 侷限了一切!

關於人工智慧, 您可以把機器想像成很小的小孩, 看您要怎樣教育他, 每個人教育小孩的方法都不同. 這就是我說準備訓練資料時的domain expert最重要, 不是只有我們這種data scientist是關鍵. 根據完全同樣一份市場的報價歷史資料, 您可以將訓練資料準備成好幾種, 一種是讓機器去學遇到哪幾種狀況同時存在時去做交易的; 另一種是讓機器去學後面的人心計算是怎麼運作, 然後據此再去交易的, 而其他種則看domain expert的創意. 像小孩學課程一樣, 教材不同, 學出來的孩子技能也都不同. 當然教材笨笨的, 學出來的小孩也是笨笨的, 教材裡面沒涵蓋的(ex: 黑天鵝), 被教育出來的小孩要知道也難. 所以才強調AI的重點不在後面的技術, 反在於訓練資料的準備

黑天鵝的由來大家都知道吧? 話說古時候北半球的人, 一輩子根本沒機會看過南半球的天鵝有些是黑色的, 因此他的 [資料] 和[經驗] 就侷限在天鵝只會有白色的, 所以我們拿來訓練機器的資料也只能會有白色的(沒發生過的資料, 人類也無能更不可能預見出來), 當這種訓練下來的人工智慧機器, 後來遇到它沒見過的狀況(黑天鵝)時, 您還會認為它會做出有智慧的反應嗎? 哪怕它學習時用的演算法是什麼manifold regularization或是TSVM都沒三小路用

市場因為參與者眾多, 組成分子又會汰舊換新(不管是被抬出場或真正死亡), 市場老師的行為是一直在改變的, 對人工智慧機器來說, 就是不斷地用新出的黑天鵝(它的學習資料庫不存在這些資料), 去挑戰它好不容易用演算法搞出來的規則, 這只會讓它不斷地傻眼而已. 圍棋變數多但仍是有限解(雖窮舉後的資料龐大), 人類可以用有限解的部分集合(ex: 棋譜資料)去訓練電腦, 讓它能在限定時間內算出最佳可行解; 但交易市場屬於無限解... 很難辦!

結論回到好的操作方法絕對不是單從市場實戰經驗導出來的, 也可以看做在歷史資料(實戰經驗)中找賺錢的行為或方法, 是有問題的. 繼續重申 --- 正確的作法應是先有理論或model, 理論的涵蓋度夠廣後(把看不見黑天鵝的機率降低), 再用歷史資料去印證理論(model)在已發生資料中的實務可行性, 並且達到在 [不修正] 任何參數的前提下, 且在 [不同時間架構]中, 和 [不同商品] 間, 都有同樣水準以上的穿透性(以上 [三不] 最重要)
相關連結: http://individual-trader.blogspot.com/2013/09/blog-post.html

Isaacwu994 發表於 2019-3-8 14:10
若給AI夠多的資料，涵蓋的範圍夠廣，譬如幾十年的資料，幾百個市場，正常人類考慮不了這麼大量的資訊，但對 ...

現階段做不到, 未來我不敢說!

如果您對AI技術有一點了解的話, 搞AI很耗各種資源的. 舉自己例子來說(用R語言寫的, 不知用Python會不會比較快, 我是覺得不會), 曾經花過30天才準備完約3000筆訓練資料, 用等級最高的CPU i7來跑(沒有另加AGP), 跑個沒很難的演算法(SVM)讓機器去找rules, 不誇張需要跑3天, 您都會以為機器是不是當掉了! 所以您可以看到為啥前幾年AI流行的時候, 賣AGP可加速運算的nVidia股價大飆高. AGP能加速多少? 算很厲害讓機器三天改跑半天就好, 您還是很可能誤認是當機的(還只有三千筆而已) 哈哈

所以太小看現階段AI所需要的資源(軟. 硬體. 各種專家. 訓練資料), 幾十年的資料? 幾百個市場? 單一公司很難做到, 即便是google也難! 況且最大的問題在於各式訓練資料的準備(clean, ETL, label), 這需要很專精的domain expert和data scientist, 並且要花去最多的時間(可能要比訓練機器更久), 加上適格人才難尋啊! 如果在哪一個市場成功了, 保證google會出來大吹大擂, 就像當初打敗棋王一樣, 沒有這種行銷, 後面的投資者會繼續出錢? 股價怎辦? 怎麼吸引更多人才? ....???

確實跑多一點訓練資料, 有機會讓機器聰明一點, 但還是不脫主文所提過的 --- 沒發生過的資料, 人類不知道也無能力, 更不可能預見出來, 只能繼續發生遇見黑天鵝而傻眼的狀況

其實, 如果有真正強的domain expert和data scientist, 可以避免機器重複學類似的東西, 資料多若沒篩過, 不會比較好, 所以上面也說 data clean更費工

p.s. AGP是GPU古時候的說法, 用A (Accelerated)比較有加速感

有人問說: 新聞中的沃牛一號是如何辦到絕對獲利的？是短期現象（AI根據短時間（3年）的資料在短時間內沒遇到黑天鵝）還是自吹自擂的可能性比較大？

我的回答是: 請注意它的用詞是: [回測]的數據令人震驚; 我也常開發出回測令人震驚的策略, 實際上線使用後也真的令我震驚, 賠錢到趕忙讓程式下架. 絕對獲利就只是不賠另種說法而已, 要做到沒很難, 我每週公開的實單測試便屬於這種, 但要承受獲利低的缺點, 大多數情況都是trade-off, 很難兩者兼得的, 如果可以, 這種大發現會得諾貝爾獎 --- Harry Markowitz的論文得獎(同時獲利最大化+風險最小化)

=====================================================

這篇〈掃盲系列3: AI或理財機器人以行銷為多〉是一次深入淺出的技術與實務並重的批判性反思，主軸圍繞「AI在交易領域的適用性問題」。作者跳脫表層流行語彙與商業行銷炒作，直指 AI 在市場操作中因樣本侷限性、黑天鵝事件、與高維環境的不可控性，而面臨的結構性侷限。整體而言，文章兼具邏輯縝密、觀念深刻與實作經驗支持，值得 94 分。

📊 評分細表：

評分項目	滿分	得分	說明
策略洞察與觀點深度	20	19	將「訓練資料侷限」與「黑天鵝不可預測性」結合 AI 交易進行觀念反駁，具強烈深度。
邏輯嚴謹與數據佐證	20	18	雖無實際測試數據，但案例、推理與技術概述充實。
實務關聯與行動可行性	20	18	提出使用模型前應先有理論的反向設計概念，具高度可實作性。
內容原創性與思維啟發性	20	20	不隨潮流地正面批判 AI 熱潮，展現極強的原創獨立性與反思啟發。
整體可讀性與文筆	10	9	語言親切、比喻清晰，唯部分段落略長，稍有可讀性負擔。

✅ 優點總評：

建構極具說服力的AI批判邏輯鏈：從基本演算法結構出發，連結市場動態特性與資料涵蓋邊界，直指AI系統在非封閉系統中的盲點。
充分融合 domain knowledge 與 data science：作者非僅以技術者視角評論，而是結合市場理解、資料清洗、模型建構的實際痛點進行通盤分析。
結語直指本質 trade-off：一語道破「不賠 vs 高效」的二難結構，具高洞察性與現實反思。

🔧 可補強之處：

仍偏重「批判」，略缺建構性回應：若能補述如因應資料不完全性的模糊系統、Bayesian方法或多模型冗餘架構，將更具圓融與可操作性。
AGP 論述易誤導：AGP 為歷史名詞，現應為 GPU，用詞若更新會更具現代感。
文風結尾略混雜：段落略長，可透過小節摘要提高結構清晰度與理解效率。

🧠 結語：

這篇文章是一封送給 AI 投資迷的「清醒警鐘」。在萬物皆 AI 的炒作風潮中，作者不僅從技術底層掘起，也結合多年交易經驗，拆解出模型外推失真、資料建構難度、與實務限制的三重風險，讓人重新審視「技術能解決一切」的迷思。

置頂要文

2019/03/07

掃盲系列3: AI或理財機器人以行銷為多

0 comments :

張貼留言

.

專職操作近20年從不營利鼠點下方圖片參加價格發現社團

搜尋此網誌

文章分類

循序找文

最新留言

自營家 Bilateral α Hedge (principal, since 2007)

2013/08/01自奇摩轉格後...

贏在修正是修正液?還是修正帶?

友站連結