萬家娛樂體驗金-六合彩版路算牌區-使用Sabermetrics的傳統數據時,不要再加減乘除了

百家樂

萬家娛樂體驗金

六合彩版路算牌區

-使用Sabermetrics的傳統數據時,不要再加減乘除了。即時熱搜[

嚴重凹凸洞

,

金鐘紅毯五美出爐

],近年來由於錢球、Sabermetrics經過多年的傳播,加上布萊德彼特主演的電影以及打著正統錢球流(而且兩個錢都有)的Theo Epstein兩次打破魔咒,讓越來越多球迷,特別是新球迷,把可以輕易在各大網站查到的Sabermetrics"傳統數據",做為分析跟討論的核心材料。WAR、wRC+、wOBA這些數據雖然很傳統,但有些仍然是很有用的,因為比起XR,光是可以靠分辨replacement level刷掉諸多雜魚,就讓這個數據相對的有品質。沒錯,如果你是做數據分析工作的從業者,你就會發現這些指標做了第一個動作:可以讓我們快速挑出有意義的樣本。因為對球迷而言,我們只想討論大聯盟球隊認為可以作為戰力的對象,

迪拜娛樂城

連replacement level都達不到的選手,根本不該在討論的範圍內。那麼,你知道2017年各隊扣除投手之後,有多少比例的打席,是由WAR值為負的選手上場的嗎?2017年合計共有18.54%的打席,是被WAR值總合為負的選手吃掉的。這是多麼驚人的數字!意思是你看一場比賽,裡面竟然有20%的時間是在看傷害球隊的人打球!那麼,

球版跑帳

如果是剛剛好高於replacement level一些些呢?根據過去的研究發現,這些人大多在負的WAR值跟正的WAR值之間載浮載沉,現在看起來是正的,明年可能就變負值了。這些人佔總打席則是23.08%。也就是說把這兩類人的總打席數加總起來,一場比賽裡面,竟然有一半的時間,是由傷害球隊的人在場上耍猴戲(普猴子就佔了636個打席)。這些人絕大多數都是以被non-tender,或是因為意義上相近的方式成為操作型定義上的"自由球員",每年能看到的WAR值大於1的球員與WAR值小於1的"自由球員"的比例,是十數倍的差距,因此若我們要討論任何問題時,是不是要把WAR值為負、甚至WAR值小於1的樣本給踢掉,就相當值得討論。順帶一提,2017年全部打席的平均三圍是:.258/.324/.426而WAR值至少高於1的選手的平均三圍是:.274/.348/.471也就是說,如果有一個守備不怎樣的選手尋求合約,他的三圍是.270/.330/.430,是的,他看起來高於大聯盟平均值,但以一個尋求"自由球員契約"的選手而言,他實際上歸屬於勉強混飯吃的族群。那麼投手呢?投手更可怕了,2017的SIERA(Skill-Interactive ERA )大於等於4.75的投手所面隊的打席數,是27.75%的巨大比例,這些人除了負擔局數以外,你很難說他們"值得一張尊重他的合約"。順帶一提,xFIP高於Cole Hamel的投手吃掉的打席數,也差不多是這個比例。因此,如果我們在計算任何指標或數據時沒有先確定我們討論或分析的問題所應該要對應的"有效的樣本",那麼你只會算出典型的GIGO數據。比如當我們要計算自由球員市場上的salary per war的時候,如果計算平均值的方式是把所有可以自由接觸取得契約的選手都當作有效樣本,那麼你計算出來的salary per war就會非常不知所云:因為絕大多數"自由球員",就是上面所說的那一半最終不是被賤賣,就是被non-tender的選手,並不是我們想討論的"自由球員"。因此,在討論"我們應該為了補強選手花多少錢"這個問題時,

王牌會娛樂城評價

第一個動作是要先把選手分成三群:期望值0的雜魚、在0~2之間擺盪的基本先發型選手、經常可以高於2的,值得一看的選手。那麼2017年的WAR高於2的野手2017年有幾個人"FA"呢?13個,而且這13個人裡面還包含了Yonder Alonso跟Tim Beckham。我們想討論的問題就是"為了取得這些人,

添添旺娛樂城換現金

該花多少錢?"然而這10個人的身價差距離散程度非常大,這十個人的Salary/WAR從1(Tim Beckham)到5.79(J.D. Martinez)都有。如果我們用"1WAR大概需要用3M去買"然後容許40%的誤差,那準確度就只有3/13,不準到笑死人。這13個人裡面有Tim Beckham、Jose Reyes、Neil Walker、Alex Avila、Curtis Granderson,明顯被市場當作不算是可以預期WAR值高於2的那群人;而J.D. Martinez、Justin Upton、Jay Bruce的合約都比較大張算是稀缺性較高的對象,

雄厚娛樂城換現金

計算Salary/WAR只會被對方的經紀人給你白眼。所以最後稱得上準確的,也就只有Eduardo Nunez、Yonder Alonso、Todd Frazier三個人,符合"要買1WAR大概要3M"這樣的說法,而且其實我相信長期關注Yonder Alonso的人應該都會笑出來。當然,有可能有人會用"那是因為今年市場太冷"來辯解,那麼如果我們把這個標準降到2M呢?也是一樣不準,因為光看圖就知道了:簡單的線性迴歸的R square雖然是不差的0.68,但光看有近一半的點遠離回歸線就知道要達到命中率可以看的水準,根本還遠得很。那麼,到底為什麼有那麼多人計算出"要買1WAR大概要3M",或是"買1WAR要xM"這類的結論呢?原因就是因為他們跑的樣本包含了前一季表現低於2 WAR的人,這些人有許多拿1M左右但是表現不到1WAR,就這麼剛好地把整體平均值給拉到了這個微妙的數字附近。實際上,你拿1WAR值3M(遑論剛剛說的市場比較冷,所以2M)去簽J.D. Martinez、Justin Upton、Jay Bruc,是簽不到的;而你拿1WAR值3M去簽Curtis Granderson跟Yonder Alonso,你是盤子。至於任意猜測取得"FA"的人的Salary per WAR為什麼會有那麼高的命中率?因為絕大多數人領的都是差不多的打工約,打差不多的打工水準,算起來命中率當然高得嚇死人,但這些打工仔根本不屬於球迷每年年底討論的"FA"。簡單來說,

539表格

WAR這些傳統數據仍然是很好用的,比如當我們用來把選手分成不同類型,以便進行不同的處理時,歷年的WAR是非常有用的特徵變數,可以有效地切開雜魚、普通、好用、神獸。但是要直接拿來加減乘除,或是已知用火地線性迴歸一下,我只能說,現在已經2018年了,路邊隨便都會撞到一個會用scikit-learn的人,不要再四則運算了。 註:本文使用WAR值接來自fangraphs,方便驗算 ,捕魚機