1. 토토 노하우
  2. MLB 경기 예측방법-데이터의 영향

MLB 경기 예측방법-데이터의 영향


MLB 예측: 데이터가 도움 또는 방해가 되는 이유

위에서 언급했듯이, 야구에서 사용할 수 있는 데이터는 수없이 많습니다. 아마도 데이터 양이 가장 많은 스포츠일 것입니다. 팀들이 세이버매트릭스를 활용해 좋은 성적을 거두기 시작하면서 데이터를 활용하는 일이 더 흔해졌습니다(Billy Beane의 Oakland A 이야기가 가장 유명한 예시일 것입니다). 이제 베팅 시장과 판타지 스포츠는 물론 일반적인 팬까지 데이터를 활용하고 있습니다.

ERA+, FIP, WAR, wOBA, wRC+(외 다수)와 같은 고급 측정법은 이제 MLB 예측의 기본 요소로 간주됩니다. 그러나 데이터를 그냥 사용하는 것과 효과적으로 사용하는 것에는 명백한 차이가 있습니다.

데이터를 수집한 다음 단계는 해당 데이터를 분석하고 예측 모델을 구축하는 것입니다. MLB 예측에 사용할 수 있는 데이터 입력과 모델 함수는 너무 많습니다. 점수 회귀 분석을 사용하여 총계 베팅에 대한 우위를 찾을 수 있으며, 모든 종류의 입력이 있는 순위 모델을 머니 라인 매치업에 사용하고, 개별 팀 분석을 사용하여 시즌 승 수 총합 예상에 사용할 수 있습니다.

데이터를 활용해 MLB 예측을 할 때 야구의 독특한 측면을 고려하는 것은 중요한 부분입니다. 일정, 날씨, 경기 장소, 시즌 중 경기 시점과 같은 사항을 고려하지 않으면 예측과 베팅 시 얻는 결과에 큰 영향이 미칠 수 있습니다.

데이터를 활용함으로써 얻을 수 있는 모든 혜택에도 불구하고, 존재하는 패턴이나 분명한 우위를 발견했어도 철저한 테스트를 거친 후에만 이러한 발견 사항들이 타당한지 그리고 베팅 시장에 활용할 수 있는지 알 수 있습니다. 이는 마크 트웨인의 말로 요약할 수 있습니다. "곤경에 빠지는 건 몰라서가 아니다. 확실히 안다는 착각 때문이다."

데이터 분석 및 모델링과 관련된 흔한 실수를 방지하는 데 도움이 되는 유용한 리소스가 많이 있습니다. Nassim Taleb은 그의 책 행운에 속지 마라(Fooled by Randomness)에서 우리가 '가지고 있는 데이터가 많을수록 그 안에 매몰될 가능성이 커지는' 이유에 대해 잘 설명하고 있습니다. 이는 대부분 스포츠에 적용되는 사실이지만 이용 가능한 데이터가 풍부한 야구에 특히 적합합니다.

Joseph Buchdahl은 Squares & Sharps, Suckers & Sharks에서 확률과 불확실성의 과학에 대해 상세히 집필했으며, 피나클의 베팅 정보에서도 상관관계와 원인의 차이와 같은 기사를 많이 다루고 있습니다. 더 구체적으로 야구 데이터 분석을 다룬 저서는 Jim Albert와 Jay Bennett이 집필한 야구 통계에 대한 에세이 모음집인 커브볼(Curve Ball)입니다.