Фора и рейтинг.
Комментарии183
сначала новые / сначала старые / по рейтингуМишин подход пытается как раз и нивелировать влияние того, что распределение может быть неизвестным априори. Про монотонность я сомневаюсь
ответ на комментарий osmar920Диапазоны---- Например. 100 до 500, от 500 до 900, от 900 до 1300 при Спрэде рейтинга игроков в 200очков в первом диапазоне может быть фора 2, во второй 3,в третьей снова 2. Получится как бы нормальное распределение. Если у вас в первой зоне от 1 форы до 2фор спрэд рейтинга может быть шаг 100, то во второй зоне может быть 150, а в третьей снова 100 Но ситуация может skewed ( мне так легче выражаться) в какую-либо сторону, что и необходимо выявить статистически Срэд- опечатка, СПРЭД( разница в рейтинге)
Понял. Ну там будет монотонно возрастать с увеличением рейтинга. Мишина статистика это явно показывает, так же как и общие соображения.
Диапазоны---- Например. 100 до 500, от 500 до 900, от 900 до 1300 при Спрэде рейтинга игроков в 200очков в первом диапазоне может быть фора 2, во второй 3,в третьей снова 2. Получится как бы нормальное распределение. Если у вас в первой зоне от 1 форы до 2фор спрэд рейтинга может быть шаг 100, то во второй зоне может быть 150, а в третьей снова 100 Но ситуация может skewed ( мне так легче выражаться) в какую-либо сторону, что и необходимо выявить статистически Срэд- опечатка, СПРЭД( разница в рейтинге)
ответ на комментарий osmar920Следовательно, и увеличение форы на 1 очко должно захватывать разные рейтинговые диапазоны, при этом не исключено, что величина этих диапазонов может быть в виде нормального распределения, а может и skewed/
Это предложение я не понял. Или я тупой, или здесь пропущена куча слов. Что значит "увеличение форы захватывает диапазоны"? Что значит "величина диапазонов в виде нормального распределения"? Как-то неточно выражаетесь. И для skewed есть русское слово , погуглите. [quote]А отсюда следует, что привязываться с разнице рейтингов не корректно.[/quote] Вы это вообще к чему? Последние постов 20 мы с Мишей обсуждаем что привязываться к ОТНОШЕНИЮ рейтингов некорректно. При чем здесь разница? Или вы решили тему перевести? [quote]Ваша упрощенная методика не имеет смысла, поскольку это можно сделать и на пальцах, разбить рейтинговый диапазон на примерно равные величины( по срэду) , установить максимальную фору в 5 очков и равномерно разбросать.[/quote] А здесь непонятно что такое срэд. Имхо, следует использовать термины известные кому-то еще кроме вас, если хотите чтобы вас понимали. По крайней мере, гугл тоже не знает что это такое.
Следовательно, и увеличение форы на 1 очко должно захватывать разные рейтинговые диапазоны, при этом не исключено, что величина этих диапазонов может быть в виде нормального распределения, а может и skewed/ А отсюда следует, что привязываться с разнице рейтингов не корректно. Ваша упрощенная методика не имеет смысла, поскольку это можно сделать и на пальцах, разбить рейтинговый диапазон на примерно равные величины( по срэду) , установить максимальную фору в 5 очков и равномерно разбросать.
ответ на комментарий osmar920Я уверен из практики, что вероятность не имеет линейной зависимости от разницы рейтингов
Естественно, не имеет. Кто-то говорил о линейной зависимости?
Очень легко проверить , что верно разница или соотношение. Построить регрессию и посмотреть на R^2. Я уверен из практики, что вероятность не имеет линейной зависимости от разницы рейтингов
При чем тут метод Эло? Где я его использовал? Может хватит уже выдумывать? Или вы пытаетесь методом тыка угадать? Может просто стоит прочитать мой комментарий с описанием метода, наконец? Как вы вообще спорите, если даже не понимаете что я сделал? Я вот как раз ваш метод и ваши формулы понимаю ( хотя там конечно и понимать особо нечего), а вы мои - нет, получается немного односторонне. По поводу того, что мои цифры расходятся со статистикой - ну разумеется. И я даже написал - почему, какие факторы я не учел. Можно поправить мой метод с учетом статистики, учесть что более сильные игроки более стабильны, к примеру, но нужна статистика. Не куцая, собранная вручную по нескольким игрокам, и не по сетам, а по партиям, потому что сеты в условиях турнира ничего не значат. Люди без проблем отдают сеты более слабым ( просто по прихоти), называют неправильный счет по сетам и так далее. Но речь не о моем методе совсем, я его недостатки знаю, и о них в том же самом посте с его описанием и написал, ничего нового вы не открыли. А вот недостатки вашего метода, если его можно так назвать - вы упорно не желаете видеть. Я ведь спорю не просто так, а чтобы вы подумали еще, и придумали что-то получше, раз уж вам эта тема настолько интересна. Поймите, наконец, нужна не формула с кучей подогнанных под статистику коэффициентов. Потому что всегда, под любые точки на графике можно придумать формулу, это совсем не означает что эта формула будет иметь хоть какой-то смысл. Нужна какая-то модель, которая бы объясняла - формула должна быть именно вот такой. Есть у вас такая модель? Вот представьте себе у человека есть две точки. f(1) = 2. f(2) = 4. Он берет и говорит: ну конечно, формула f(x) = 2*x. Потом выясняется что f(3) = 8. Он говорит: а, поправочка, на самом деле формула f(x) = 2*x + (x-1.5)^2 - 0.25, так точнее. Далее он ему указывают f(4) = 16. Тут он говорит: ну, моя формула 2*x + (x-1.5)^2 - 0.25 - правильная, просто 4 это уже за границами интервала, поэтому там просто ее не используйте. Это примерно как вы, Миша, отсекли всех с рейтингом
Это что, такой троллинг? Слова против цифр – несерьезно. Вот цифры из «большой» статистики (есть на графиках) : 200 vs 400 6,4%, 300 vs 600 5,8%, они практически равны. И вторая чуть ниже не потому, что разница изменилась, а по причинам, изложенным в большом посте. Адекватность модели подтверждена множеством точек. Вы реально думаете, что Вам поверят, после того как Вы морочили всем голову, пытаясь приспособить метод Эло к рейтингу РТТФ ? Получив одинаковую вероятность выигрыша сета 4,6% и для 200-400, и для 400-600, и для 500-700? (Реальные цифры 6,4%, 12,9%, 18,5%). Так что насчет понимания Вами физического смысла – не надо.
[quote=Misha]Вроде Вы закончили обсуждение. Нагадить пришли? Решили 2%-ную коррекцию ошибки с известной причиной (дисбаланс числа игроков) выдать за зависимость форы от разницы. Ну-ну. Тогда пользуйтесь старым файлом, последний удалил. И передергивать больше не нужно - первый график, подтверждающий мою правоту, был построен БЕЗ коэффициентов в формуле. Вот он [url]http://dropmocks.com/mD9mPA[/url] .[/quote] Мда, печаль. Вы действительно этого не понимаете? В первом графике вы рассматривали только выборку игроков с рейтингом 400 и смотрели как она играет с близкими по рейтингу соперниками. Естественно, что для маленькой и гомогенной выборки нужно меньше подгонок, чем для того чтобы учесть более разнообразную выборку. Чем больший интервал рейтингов вы возьмете - тем больше вам нужно будет коэффициентов и подгонок. Просто потому что изначально выбрали неверный тип формулы. Но вы не понимаете этого, и поэтому просто предпочитаете либо сокращать интервалы типа "а давайте игроков с рейтингом
Вроде Вы закончили обсуждение. Нагадить пришли? Решили 2%-ную коррекцию ошибки с известной причиной (дисбаланс числа игроков) выдать за зависимость форы от разницы. Ну-ну. Тогда пользуйтесь старым файлом, последний удалил. И передергивать больше не нужно - первый график, подтверждающий мою правоту, был построен БЕЗ коэффициентов в формуле. Вот он [url]http://dropmocks.com/mD9mPA[/url] .
Посмотрел файл. Ну что, очевидно, чем больше статистических данных, тем больше Misha понимает что предложенная им изначально люмпенская формула "поделить поделить один рейтинг на другой" не работает. Формула все усложняется и усложняется, появляется все больше и больше разных дополнительных слагаемых и коэффициентов, разные цифры взятые с потолка ( в прошлый раз это были - 60 , в этот раз уже несколько коэффициентов - 4, 100, 2, 149, 500 и т.п. ) , более того некоторые коэффициенты уже начинают зависеть от разности рейтингов, хотя изначально Misha со мной спорил что от разности что-то зависит. Проблема в том, что Misha не понимает, что всегда можно подобрать формулы и коэффициенты для кривой так чтобы она проходила через заданные точки. Это совсем не означает что данная формула имеет хоть какой-то физический смысл, т.к. она была изобретена уже ПОСЛЕ того как мы получили точки т.е. является подгонкой под них. Формула должна получаться из какой-то разумной модели независимой от точек, она должна предсказывать новые точки. А рассуждения типа "вот у нас точки на графике, сейчас поподбираю коэффициенты в Экселе чтобы у меня тоже было похоже" - это тупиковый путь, при всем уважении к проделанной работе. Хотя данные собраны интересные.
Спасибо. Самым сложным было научиться делать вставку в эксель через текстовый файл :). И еще понять, что с точки зрения математики НТ это игра ошибок : нужно не ошибиться самому и заставить ошибиться соперника (совокупность этих качеств определяет силу игрока). Поэтому независимо от различия в рейтинге слабый всегда имеет шанс выиграть очко. Дальше – все быстро.
Миша, какую же работу ты проделал!!! :O
Оценка точности предложенного метода расчета форы незаметно для меня превратилась в исследование рейтинга РТТФ ;). Поскольку ручная обработка статистики РТТФ утомительна, решил автоматизировать процесс. Для этого написал несколько несложных формул, позволяющих «вытащить» нужные встречи и счета из истории игр с сайта. Для 700 (+/-35) против 600 это выглядит так.. [url]http://dropmocks.com/mEYL46[/url] . Столбцы A-E – копипаст истории, столбцы G-L – получение нужных счетов (они находятся в K и L, остается только просуммировать). В итоге вместо ~3600 полученных руками сетов для построения 6 точек на графике получилось в 12 раз больше и раз в 5 быстрее. Полученные статистические вероятности выиграть сет (и мои теоретические) здесь.. [url]http://dropmocks.com/mEYOVJ[/url] . Видно, что теоретическая и статистическая кривые начинают расходиться для высоких рейтингов. Вероятно, это связано с занижением величины высоких рейтингов (на 2-4% по моей оценке) из-за дисбаланса числа игроков сильнее и слабее. Точечная диаграмма рейтингов позапрошлой недели и плотность распределения здесь.. [url]http://dropmocks.com/mEX9PU[/url] . На диаграмме : по горизонтали - № участника в списке, по вертикали – его рейтинг; на гистограмме : по горизонтали - диапазоны рейтинга 0-75, 75-150 и т.д., по вертикали – количество игроков, попавших в диапазон. Это же подтверждается цифрами из статистической выборки: при игре 700 против 600 отобрался 481 сет, 700 против 800 – 115 сетов. Бонусов, видимо, недостаточно для того, чтобы компенсировать часто возникающие ситуации, при которых игрок повысить свой рейт не может, а понизить может весьма существенно. Например, рейт 700, потеряв 20 очков при игре против рейта 600, компенсировать их сможет минимум за 10 матчей. Но из 10 он по статистике 1.8 раза снова проиграет. Аналогичных ситуаций разом «отхватить» 20 очков в 3-4 раза меньше. Если сравнить сумму бонусов у рейтов 700 с числом изменений рейтинга на 20 и более (в обе стороны), то видно, что бонусы не покрывают «убытки». Количество «медалек» за призовые места здесь.. [url]http://dropmocks.com/mEYJcq[/url] (из-за малого числа игроков мне пришлось объединить 3 старших диапазона в один 751-975). Поскольку полученные бонусы со временем «отбираются» соседями (вероятность победы не изменилась, а дельта для перерасчета стала другой), имеет смысл посмотреть на медальки «на душу населения».. [url]http://dropmocks.com/mEYQxT[/url] . Эти два фактора (разное число игроков сильнее и слабее и бонусы) я учел в новом файле для расчета форы. Ссылка – в постскриптуме. Точным расчетом заморачиваться не стал, так как нет смысла добиваться идеального совпадения (1 очко форы дает минимум 6% прибавки к вероятности), поэтому обошелся аппроксимацией ошибки. Графики стали такими.. [url]http://dropmocks.com/mEYYGJ[/url] . Вывод : рейтинг РТТФ практически линейно (с точностью до 4%) отражает абсолютную силу игрока***. Недостатком являются большие колебания рейтингов, но взамен имеем простоту и наглядность расчета. Логичным продолжением темы был бы подсчет матожидания баллов при расчете рейтинга для уменьшения колебаний и повышения точности и последующая симуляция «идеальной» системы рейтингов (на основе истории по-новому посчитать). Но на это пока нет времени/желания. *** - Под силой игрока в рамках предложенного подхода я подразумеваю способность выиграть очко. Количественная оценка силы – вероятность выиграть очко у «эталонного игрока». Следствие этого - отношение сил игроков равно отношению вероятностей выиграть очко в очной встрече, подтверждено статистикой. P.S. Новая версия файла для расчета форы здесь.. [url]http://yadi.sk/d/JK8fHdVcPGh2Y[/url] . Его можно использовать в широком диапазоне рейтингов. Все, как в предыдущей версии : вводим рейтинги и подбираем фору, чтобы вероятность выиграть сет стала близка к 50%. Добавил вероятность выиграть матч, а также вероятности различных счетов матча, они внизу страницы, нужно пролистать.
вообще, конечно можно сравнивать уровни игры как среднюю температуру по разным отделениям больницы, вроде бы как умение+понимание.. но..вот смотрю на мастеров МЕЖДУНАРОДНОГО между прочим уровня, съевших собак и видавших разные виды, и все равно не понятны порой нелепые ошибки против китайцев, избежав которые можно завязать с ними равную игру хотя бы 1го-2го уровня - то бишь прием подачи не отдавая 100%-ной инициативы + выход игры из короткой на сильный прокрут мяча без ломовой скорости..дальше конечно тяжко физически..но даже и этого практически нет..ошибки в приходящих вращениях и отскоках просто ужасны..и это люди уровней мсмк..мыслей мешок, конечно..
после просмотра встречи XU Xin vs Stefan FEGERL можно сделать вывод, что 1я ракетка мира может смело дать 48й примерно 6 очков форы в каждом сете :)
ответ на комментарий osmar920Вывод логичен и совпадает с моими наблюдениями
, я бы на месте Романа, заменил "и" на "так как" :P
Доработал метод расчета. Теперь вероятности выигрыша сета практически совпадают со статистикой (проверил еще две точки - 1212 сетов). Файл для расчета здесь.. [URL]http://yadi.sk/d/Yd26VVDBNKqKd[/URL] . Можно скачать и пользоваться. Вводить рейтинги и фору нужно в голубые поля, смотреть - на зеленое, добиваясь близости к 50%. В диапазоне 200-600 считает весьма точно. Выше – дисбаланс числа игроков сильнее и слабее игрока с высоким рейтингом возможно приведет к неточному отражению его силы. Нужно проверять по статистике. Есть еще небольшой нюанс, связанный с расслабленной игрой против низких рейтов, но на расчет форы он имхо не влияет. Все цифры – в среднем «по больнице». Если хочется персонально для пары подобрать фору, введите фору =0 и подбираете такую величину одного из рейтингов, чтобы вероятность выиграть сет совпадала с вероятностью из статистики. Например, Османов vs Подобед, счета по сетам 53 : 39. Вероятность выиграть сет для Сергея = 39/(53+39)=0,4239. При рейтах 559 и 600 получается эта цифра. Далее подбираем фору. Она равна 1 очку. Но число сетов желательно иметь большое.
< Самые яркие молодые игроки - Xu Xin (Факты биографии и видео)Темы из старого форума (архив)Мазунов Андрей производит набор в детские и взрослые группы >
VoikaTT
Интересно мнение форумчан в таком вопросе. Какое соответствие в разнице рейтинга между двумя игроками должна компенсировать фора? Есть мнение, что 100 очков рейтинга-1 очко форы. Сразу оговорюсь, что эти цифры были озвучены для уровня 600-900 и 700-1000. То есть игрок с рейтингом 900 должен давать для равной борьбы 3 форы игроку с рейтингом 600.