2013/12/26

[轉貼] 資料探勘的正值偏頗

引用自: 小肥牛 @yahoo blog (關閉了)

所謂「資料探勘的正值偏頗」就是根據過去歷史資料或是經驗所發展出來的策略,它的回測績效一定會過度高估績效與低估 max drawdown。
當一個期貨交易者,開發出或是得到一套系統,第一件事情,就是跑回測,若是看到回測有不錯的績效,可能就開始在想,這個績效每年的投資報酬率有多少,我若是能準備多少金額,以複利的操作績效,多少年後就可以有多少獲利,儼然就要成為巴菲特第二了,但在實戰中,他們發現他們的程式回測績效往往是不可以相信的。

有經驗一點的期貨交易者,會想到程式是否有過度最佳化,於是他會重新檢視程式,儘量去除可能過度最佳化的部分,然後測試是否有參數孤島,若是用心一點的交易程式測試者,可能還會檢測 Walk Forward Analysis,若通過這些檢測,可能會想這樣回測績效應該是可以相信了吧,而且即使績效差一點,只要是賺錢就可以,只是少賺一點,而且我也考慮的歷史的 max drawdown,我的操作資金也是比 max drawdown 還要多,我的風險控制應該沒有問題吧?

的確,通過 參數孤島 與 Walk Forward Analysis 檢測是否有過度最佳化,但我之前的文件有提到,交易系統一定避免不了訊號與系統雜訊,而且市場屬性會隨著時間改變,另外「資料探勘的正值偏頗」,都會讓這些回測績效在未來表現低於你的預期。

為什麼會有「資料探勘的正值偏頗」呢在 David Aronson 的 讓證據說話的技術分析(Evidence Based Technical Analysis)一書中,提到若是有一個程式開發者,他很認真的研究出了50種技術策略,每一個策略並沒有作最佳化,但在測試區間中績效還是會有好有壞,最後他當然是選測試區間是最好的績效策略來操作,而這個「最佳」策略在測試區間中的報酬率為 37%。

但不幸是,他發展的 50 個策略其實都沒有預測功能,也就是每一個期望報酬率是為 0%,但程式開發者並不知道,但因為在測試區間中的平均績效有好有壞,他會用最好績效的策略,並且認為它績效的平均報酬率為 37%,所以有了 37% 的「資料探勘的正值偏頗」。

再舉藍大最近的文章資金曲線模擬器(http://tw.myblog.yahoo.com/Blue-Speculator/article?mid=2627)的例子作一個變化,若是程式開發者開發出四個不同的策略(A,B,C,D),但每一策略平均贏的機率都是40%,而每筆交易贏錢的平均金額是$20,000,而輸錢的平均金額是$10,000。所以每一筆的獲利是 0.4 * 20000 - 0.6 * 10000 = 2000 / 次 就是理論上的預期報酬率。  但這四個相同預期報酬率的不同策略,在回測相同的歷史區間,可能會有差異相當大的回測報酬率,假設不同的策略 A,B,C,D,所產生的回測報酬率就是(http://tw.myblog.yahoo.com/Blue-Speculator/article?mid=2627)的四張圖,對大部分的人,最後應該會選回測報酬率最佳的策略,也就 B 這一個策略,但這個策略的回測報酬率 6000 / 次,也就是 「回測報酬率」與「理論上的預期報酬率」差了三倍。同樣地在回測績效中,也會低估了 drawdown。

因此雖然我們沒有作參數作佳化,我們在開發策略的過程中,已經自動作了策略「選擇的最佳化」。

這篇並不是說回測不重要或是沒有參考價值,而是強調程式交易只是一個工具,使用工具時一定要先了解他們隱藏的風險與陷阱,要用更客觀的態度來看回測績效時,過度相信回測績效可能讓自已曝露太多的風險在市場上。

只有穩賺不賠的回測績效,沒有保證未來一定獲利的策略。 務必做好自已的風險管理。

(補) 盤後日誌 2013 12/25





看法:

A. 歐美指數繼續歡慶耶誕, 台指期受此激勵開高, 鎮日維持盤上不墜, 雖絕對漲點仍小, 但在8500的鍋蓋附近有此徘徊, 多頭算是強勢了的
B. 日線需要更大的漲點或創新高, 才能由空手訊變化成買訊
C. 中線多頭無須懷疑


操作:

受激勵開高的第一盤, 系統判定多方攻擊有效, 酌量加多SP 84 + BP 81的組合, 台指期尾盤上拉也是有效的, 隔日開盤看狀況加多


留倉:


2013/12/25

20131225 看盤操作


13:46
尾盤最後30分的多方拉抬有效, 明天看狀況酌量加碼多單

10:15
今天沒大行情的機率不小, 去做自己的事情卡贏

9:30
維持以往一貫 --- 下單追進後立馬吃虧, 即使知道很大機率如此還是要按訊號紀律去做
8500點真是心理關卡, 每次往上攻擊後都下壓

9:20
台指期開盤後的向上攻擊有效, 加碼SP 84 + BP 81的組合

9:05
歐美為了慶祝耶誕漲不停, 或許台股可以比照辦理喔
端看多方攻擊是否能有效, 確認後再加碼多單

2013/12/24

盤後日誌 2013 12/24





看法:

A. 台指期高低差只有25點, 受外資放假影響, 原本就死氣沉沉的台股, 益發地變為不動的死水
B. 日線維持中立的空手訊
C. 中線多頭穩定存在


操作:

狹幅震盪盤不做無謂的買賣進出


留倉:

與前一交易日相同

20131224 看盤操作


11:35
這種高低差只有25點的盤, 你要做嗎? 我不要!!!



10:00
操作猶如出海捕魚, 不存在每天都有撒網的機會, 要確認看到魚群才下網, 不然就是等待與持續搜尋
尤其是OP賣方為主的人, 不要像神人極短線沖來沖去, 便當錢沒賺到, 反讓營業員增加不少業績

9:39
多頭主控的盤, 如果留倉已經偏多, 放著看戲就好



9:23
多頭不夠有連續性, 歐美國際盤強多了, 或許是人家的經濟展望比台灣好吧?
先靜觀不動即可



8:55
先敬祝大家聖誕節快樂

2013/12/23

盤後日誌 2013 12/23





看法:

A. 台指期開高後, 盤中創短線新高, 且30分系統判定多方攻擊有效
B. 現貨的日線系統, 可惜仍維持空手訊, 代表上方壓力大, 多頭還不夠強
C. 中線多頭架構堅實


操作:

早盤判定多方有效攻擊後, 加碼多單SP 84 + BP 81, 受迫之SC 84未達認賠標準, 先暫留來當作可能回檔的抵補


留倉:


20131223 看盤操作

12:39
下單的時候不要斤斤計較入場價, 要計較的是該不該下單, 要下多單還是空單; 通常我都 [讓分] 來使單子肯定成交為要

11:26
目前多頭主控無誤, 切勿隨意做空啊



10:30
期指維持正價差卻沒有往上急攻, 上方空間讓大家遲疑啊

9:22
確認加碼訊號成立後, 酌量做了SP 84 @54 + BP 81 @7.2

9:11
稍安勿躁, 沒有等到確認的訊號不動作, 不要學神人去假會給學生看, 不是裝神收學費的真正操作者, 要對自己的帳戶負責
操作時間拉長一點, 快一兩分鐘或慢幾秒鐘. 幾分鐘, 差別真的沒有很大, 自己回測一下就知道

8:59
台指期開高突破12/19高點, 看持續力如何, 伺機加碼多方



2013/12/20

重讀交易經典文章

韓國首爾 - 光化門廣場

整個2013年度績效欠佳 (低於定存1年期利率),重讀經典文章 - 交易的中心哲學,節錄重點如下,或能從中汲取一些該當有的省思:

1. 長期、穩定的贏利是期貨交易所追求的目標;“客觀——規則”,這是始終貫穿交易思想的主線,這也是交易思想的真相交易系統的建立和趨勢是交易思想最為重要的兩個內容,而規則的制定需要融入其中

2. 獲利的前提是安全,寧願不獲利,也不能虧損,即先求不輸再求贏,這是原則因此,一個優秀的交易員的定義應該是,能夠連續多年獲得穩定持續的連續複利回報,經年累月地賺錢而不是一朝暴富,常賺而不是大賺
3. 兩個關鍵因素,“長期”和“穩定”,“長期”需要你有自己的交易規則、策略及交易系統等等,才能保證你長久地贏利;“穩定”需要你做好資金管理、止損以及風險控制等工作
4. 沿著不斷提升判斷水準從而看清市場然後賺到錢這條道路是走不通的。走不通的根源在於我們所擁有資源的有限性,有限的時間,有限的精力,有限的資金,有限的認知能力等等等等
5. 大多數投資人面臨的問題是願意主觀分析而不願意放棄自己的地位,所以總是受到主觀性和客性之間關係的困擾。解脫此類困擾的基本辦法,也就是如何對市場做到客觀的分析?客觀的分析要靠明確的規則,不論主觀的分析和客觀的分析是否矛盾,都應該嚴格遵守客觀規則, 投資者的任務就回到了如何制定規則和遵守規則
6. 交易的真相正是----規則以“分析行情”來做為交易手段無疑是最大的交易誤區
7. 如果僅僅是“知”而無法去“行”,那麼自己認為正確卻依然反著做,有正確的認識又怎樣,結果還不是一樣。將“知”與“行”對接的辦法就是規則,仍然是規則,將自己所有對市場特徵的認識都演化為客觀的規則(而不是去分析預測),並嚴格加以執行
8. 系統化交易便是操作完全規則化、客觀化、科學化的一個終極交易思路,並無任何的神秘之處
9. 成功的交易者是可以通過訓練與學習而得的,這無關乎聰明才智,全在於交易者的方法、原則及其交易系統交易思想的核心是建立人性化、適合自己的交易系統,並對其輔助於機械化的執行建立交易系統解決了兩個問題:將規則融入其中和克服人性的弱點; 實際交易應結合自己的實際狀況設定適合自己的原則
10. 止損是交易系統中非常重要的一環,因為任何時候保本都是第一位,賺錢是第二位的
11. 交易系統的建立應該是人性化的、適合自己的系統交易系統的建立,必須是在交易者的性格、興趣、市場敏銳度、風險承受力、綜合判斷力等因素的共同作用下,通過大量的交易實踐才能夠逐步形成
12. 交易系統是——通過正確的交易思想,正確的概念定義和正確的參數設置來建立適合自己的交易系統從而得出正確的價值判斷,並在自律的保證下輔以機械化的執行
13. 期貨市場中最為客觀的反映就是價格,因為價格能反映一切,包容一切,任何變化都會反映在價格上。價格變化是供求關係的最基本反映,它消化了基本面和技術面的變化,消化了大戶的心理和散戶的心理抓住價格這條主線,擯棄主觀性的判斷,才能把握價格變化的客觀性的規律。而價格變化的反映就是趨勢
14. 利物莫說過一句話堪為經典:“趨勢是簡單的嚇人的,簡單到可以這樣描述--在多頭市場中作多,在空頭市場中做空,事情就是這樣子,…可是我花了好長的一段時間,才牢牢抓住這個毫不稀奇的原則...”趨勢是如此簡單,你只需要有簡單的思考就會有簡單的結論。

2013 十二月績效檢討


12月台指期結算點數是8338, 相較上月的8219點, 漲幅約1.45%; 本月除了在開倉的第一天11/21有較像樣的下跌外, 後來皆是一連串的上漲與整理, 尤其是期初的連續6根紅K, 出乎大家的意料之外, 相信外資連續地回補台指期淨空單, 應該也討不了解好處

上月的檢討報告已經先預告過, 自己深知自己的個性與缺點, 卡在這個月有韓國滑雪之行, 會有幾個交易日不在國內的緣故, 肯定是微量經營口數,輸贏不大!由結果來看,果然如此!

總結投入的總資金 (含資金控管裡的全部預備金), 獲利率由上月的正0.94%, 變為負的0.31%, 累計績效年率低於銀行平均年利率1.37%,創了歷年來獲利最低的一年,僅勉強守住 【先求不輸再求賺】的大原則而已


2013/12/19

盤後日誌 2013 12/19





看法:

A. 雖然QE每月減量100E還是有在退場, 但股市的不確定性去除後的大漲, 讓之前陷入整理的美股創了新高, 連帶地牽動了今日台指期開高, 也使得短線多空趨勢改變;雖然演出開高走低的十字線, 仍無礙多頭主控為先
B. 日線維持多空不明的空手等待訊,在這個尷尬點位,不管站在多空的哪一邊,都不要重倉,等趨勢明朗再說
C. 中線多頭獲得喘息的一漲,買訊可以延續一陣子才對


操作:

短線趨勢由空轉多,操作當然要跟上因應,BC 85替原來的SC 84買滿保險,另做SP 84 + BP 81來暫時贊助多頭一下


留倉:


.

.