搜尋此網誌

2018年3月23日 星期五

機械學習

探討機械學習的應用於賽事數據,筆者嘗試了兩個算法

1. k最接近的數據(kNN)

2. C4.5(產生決策樹的算法)

兩個算法得出的馬匹各有勝負,但有些場次有六七隻,有些場次一隻也沒有,不能控制所選的馬匹隻數,方法算出新參賽馬匹是入圍與否,沒有可以用作排序的特性,故沒有採用。

相對而然使用邏輯迴歸所算出的是勝出機會率,不論高低也可以用作排序用途,而且這方法可以用加權,溯測試也能得出更高勝出率,故被採納。

沒有留言:

張貼留言