Комплект для игры Го
Игра Го (Вейци, Бадук) в Сибири
Комплект для игры Го
  Rambler's Top100
Гостиная
Форум
ЧАВО: ВОПРОСЫ ПО РЕЙТИНГ-СИСТЕМАМ И ОТВЕТЫ НА НИХ

Публикуются материалы дискуссии по вопросам рейтинг-систем (РС), которая проходит на различных го-форумах, а также результаты обсуждения РС при общении автора (С.Павлов) с игроками, тренерами, членами президиума и руководителями РФГ(Б).

Предварительно несколько слов по вопросу: что же такое - рейтинг?

Понятие "рейтинг" тесно связано с понятием "экспертная система", "эксперт". Если есть ЛПР - "лицо, принимающее решение" (руководитель, орган управления, просто человек и т.д.), и есть ГЭ - "группа экспертов" (специалисты в области, в которой принимается решение, группа лиц, организация и т.д.), то ЛПР может обратиться к ГЭ и получить заключение по конкретному вопросу. На основании этого заключения и принимается решение.

В спортивных состязаниях ЛПР - это организация, проводящая соревнование, ГЭ - судейская коллегия. С другой стороны, все участники турнира в шахматах или го также ГЭ, так как по результатам встреч "ЛПР = судейская коллегия" принимает решение.

В случае с рейтингом мы имеем аналогичную, но еще более общую ситуацию, так как ГЭ - это все игроки участвующие в рейтинговых турнирах, а свои "заключения" они дают в каждой партии - путем сравнения со своим уровнем игры. В роли ЛПР выступает рейтинг-комиссия, которая публикует рейтинг-лист, расставляющий всех по ранжиру. Ранжировка - наиболее часто ставящаяся задача перед ГЭ во всех сферах деятельности.

Так что вопросы рейтинг-системы - это не только го или шахматы, это гораздо шире и важнее. В частности, использование рейтинг-систем описанного в обсуждаемом проекте типа для оценки работы спортивных судей в целях отбора на ответственные соревнования наиболее квалифицированных, позволило бы избежать тех неприятностей и скандалов, которые так часто возникают, например, в фигурном катании, спортивной гимнастике или фристайле.

СОДЕРЖАНИЕ:

КОЕ-ЧТО О РЕЙТИНГЕ

В заключительной части дискуссии по рейтинг-системе затрагивались вопросы о "липовых данах" первых лет советского го, о форме распределения ошибок игроков в партии. Первое сообщение: 14/06/03 21:01, последнее: 07/07/03 12:47

С.Павлов: Сначала цитата из выступления В.Ф.Корсака в теме "Кто доволен рейтингом":

...От многих слышно, что вот 10 (15-20) лет назад был 5 (2-4) даном, а сейчас на 2-3 дана меньше, хотя вроде бы играю не слабее. Я, конечно, не помню сам, так как я в то время Го не знал, но по рассказам в те годы даны присваивались следующим образом. Из Японии приезжал Маэстро (3-6 дан), играл несколько партий на форе с нашими игроками и делал заключение - да, этот парень играет на 5 (2-4) дан. Легко допустить, что с целью популяризации игры (а именно с такой целью японцы и приезжали) и поощрения наших игроков они давали слегка завышенные (на 1-2 дана, цифры можно обсуждать) заключения. Но после того как тебе сам Маэстро сказал что у тебя 4 дан и выдал тебе бумажку, ты уже будешь стоять насмерть, но никогда не согласишься на то чтобы тебя включили в турнир хотя бы с 3 даном. Таким образом сформировалась первая волна данов, по которым уже равнялись следующие поколения.

Я с уважением отношусь ко всем участникам дискуссии по рейтинг-системам, в том числе и к В.Ф.Корсаку. Но здесь, мне кажется, уважаемый Владимир Федорович, "перегнул палку". Так, "походя", взять и объявить, "по рассказам", все даны 80-х, и других лет становления Го в СССР - липовыми!

Да, в те годы, несомненно, был наиболее значим экпертный метод оценки уровня игры советских игроков. Возможно, отдельные дипломы присваивались в пропагандистских и популяризационных целях. Костюм иногда тоже "шьется на вырост". Я сам лично присутствовал при вручении диплома 7-го дана Валерию Асташкину в 1990 году, когда он был Президентом Федерации Го СССР. Какое это имеет отношение к рейтингу и несоответствию уровня игры и данов тех лет? Асташкин вообще уже давно не играл тогда в турнирах. А вот Г.Нилов получил 5 дан в 1975 году и с тех пор практически не потерял уровень (хотя и понизился несколько в рейтинге). И таких примеров - десятки. Не надо, уважаемый Владимир Федорович, обижать всех владельцев тех замечательных дипломов. А, кстати, Вы видели в "натуре" так сказать, те дипломы? И почему Вы уверены, что все обладатели тех "бумажек" нисколько не выросли потом, даже если и получили свой дан авансом? Или будете снова утверждать, что этот аванс через 15-20 лет привел к сползанию рейтига?

Мне посчастливилось тоже получить "липовый" 4 дан из рук 9р профессионала Кояма из Кансай-Киин. И Ирина Гуськова, первая чемпионка СССР среди женщин, тоже получила - вместе со мной и с В.Асташкиным (см. выше). Наш рейтинг в РЛ Всесоюзной федерации Го был около 2400 и даже немного выше - очков на 30-40. О каком несоответствии речь? В 1991 году я был в Японии и играл в примерно десяти клубах г. Саппоро. Ни один из встреченных мной игроков не имел японского любительского диплома. Но в клубах мне ставили 5д в турнирах, а однажды даже 6д, после выигрыша на двух камнях у их 7 дана. Да, это подтверждает мнение, что японские любительские даны (в клубах, а не по дипломам!) слабее российских и европейских на 1-2 дана. Но я не вижу оснований считать, что сползание рейтинга обусловлено "липовостью" российских данов первых лет. Число дипломов, полученных российскими игроками, среди активно играющих сегодня вряд ли превышает один-два процента, да и превысили сегодня они, скорее всего, уровень тех дипломов. А подробнее об истинных причинах сползания рейтинга - читайте всю дискуссию по РС, ЧаВо на сайте Сибго ну и т.д. - все ссылки в моих сообщениях.

P.S. Вот прикидка: если 10% игроков получили липовые дипломы со средним завышением на 1 дан и нисколько не выросли, то насколько они сместят рейтинг всех, при условии что остальные-то точно имеют достоверный рейтинг? - На 0,1 дана. 8-). Ах, да. У них у всех был завышен рейтинг на 1-2 дана, поэтому и не заметили... а теперь вот расхлебывают. В Европе тоже должен был быть завышен, ну не на 1-2 так на 0,5-1 дана... и т.д. В общем, во всем мире рейтинг завышен! Спасаемся, кто может!

Олег Сапач: Это хорошо, что периодически дискуссия переходит на новую тему, а то про Хикару уже читать невозможно :))

Рейтинг всё же относительный показатель и все неувязки появляются при столкновении разных систем (Украина, Европа). Усилия надо прилагать для увязки между РС. А что касается абсолютного значения рейтинга, то у нас в Питере в своё время действовала т.наз. лига "11 дан", так Е.Матвеев тогда достиг аж 13-го дана. Ни хуже, ни лучше от этого он играть не стал. Кстати пример с Г.И.Ниловым не показателен. Все, наверное, видели его в начале и в конце игрового дня.

Гришин Игорь: Согласен, Олег! Главное - именно увязка рейтингов. Эля отвечает за привязку к Е-рейтингу. Почему она молчит? Что, все нормально что ли? Кубок Посла Японии прошлого года не пересчитан для Е-листа. Мне стыдно говорить об этом, так как я - его директор, Эля была его главный судья. Даже если не главный судья... Ответственный - должен обсчитывать все международные турниры, таблицы которых появляются на сайте Го.аспект. И это - как минимум. Брать, скачивать , и обсчитывать. Если ты этого не делаешь ты - безответственный, а не ответственный. О том, что рейтинг не пересчитан я узнал неделю назад от победителя турнира, не думаю, что Андрей ошибается... Как проверить эту информацию? Механизмов нет...

Как исправлять ситуацию? Люди должны либо исполнять свои обязанности, либо освобождать свои места для тех, кто хочет работать.

Если начался такой разговор о рейтингах, то сейчас нельзя отмалчиваться. Разобраться со всем этим надо в этом году, и до конца.

Вадим Хавин: Вся привязка заключается в том, чтобы турнирные таблицы отослать в определенном формате по определенному адресу, где их собственно и обсчитывают. Выходит, что никто этого не сделал. Единственный способ проверить, попал ли определенный турнир в европейский обсчет, это выбрать участника этого турнира и регулярно отслеживать последний обсчитанный турнир для данного человека. При этом вероятность правильного ответа несколько меньше 100%. А вообще это первое известное мне недовольство по данному поводу за последнее время. Получается, что сейчас таких неотосланных таблиц стало меньше, чем год-два назад.

С.Павлов: Проблемы российского рейтинга - больше организационные, что и подтверждают прямо или косвенно почти все участники дискуссии. Что касается упоминания Г.Нилова как примера - я сделал это с максимально возможным уважением к одному из основоположников российского го, "ветерану" нашего го-движения, и всем советую поступать аналогично.

...Кстати, об ошибках. Совершенно верно, что уровень решающей ошибки - это и есть уровень игры. Больше добавить и нечего. В этом смысле примерно и было мое предыдущее высказывание... А в последних результатах, полученных по рейтинг-системам, этот вывод был подтвержден математикой (при росте уровня игры вероятность выигрыша более сильного при фиксированной разнице в силе игры возрастает обратно пропорционально расстоянию до идеального игрока - "Го-Бога", так как максимально возможная ошибка быстро приближается к минимуму, т.е. к нулю).

Илья Ветров: Кстати, есть мнение, что нормальное распределение - фактически безосновательная и лишь формально удобная модель. Кто-нибудь пытался реально наблюдать эту лапласиану? Может быть другие колокольчики ближе к фактам (правда, я знаю только гауссовский)?

С.Павлов: Кратко: с 50-х годов ХХ века пользуются рейтинг-системой Эло и ей подобными. А кто-нибудь где-нибудь встречал обоснование, строгое в научном плане, вида функции вероятности? - Ну, вроде как если все вокруг "нормально", то и эта функция могла бы поддержать "общее стремление".

Чисто экспоненциальная форма в РС ЕГФ и некоторых других - просто аппроксимация функции распределения нормального закона, т.е. интеграла от е**(-х**2). С другой стороны и исходная интегральная функция распределения с экспоненциальной плотностью (Гаусс), и ее аппроксимации экпоненциального вида в точке DR=0, соответствующей равным соперникам (вероятность равна 1/2), имеют некоторую первую производную, т.е. тангенс угла наклона графика. Во всех моделях этот наклон почему-то разный: в ЕГФ зависит от уровня игрока, в АГА равен (0.83-0.5)/1дан, в действующей российской (0.66-0.5)/1дан.

А вторая производная во всех моделях в этой точке равна нулю, т.е. все эти функции в окрестности точки DR=0 ведут себя как линейные функции от DR, с точностью до членов третьего по DR порядка.

Честно говоря, я с самого начала, как только стал заниматься вопросами рейтинга, считал единственно правильной нормальную форму функции вероятностей. Главным аргументом было то, что результат отдельной партии складывается как сумма большого числа маленьких (но иногда и не очень) ошибок соперников, т.е. есть предпосылки применения так называемых предельных теорем теории вероятностей, которые и сводят распределения таких сумм к нормальному закону.

И вот в 1990 году мой друг, профессор по теории вероятностей, Саша Саханенко мне говорит: характер функциональной зависимости вероятности победы от разницы рейтингов не является существенным с точки зрения оценок конечного результата: к чему идет схема Эло при большом числе пересчетов. Так возникло первое сомнение: а зачем тогда все эти премудрости с расчетом экспонент, всякими там заумными таблицами и т.д.? Но хочется, чтобы все было "нормально"!

Последние тщательные исследования статистики ЕГФ (108631 партия!) окончательно опровергли предположение о "нормальности" вида функции вероятности. Кстати, угол наклона, упоминавшийся выше, в российской РС "в среднем" по группе данов соответствует статистике. Это и понятно, так как в 1990 году конкретные параметры функции вероятности (и значит угол наклона в точке DR=0) были рекомендованы исходя из российской статистики по группе данов (усредненно). Правда статистика была куда скромней сегодняшней европейской - всего-то около 400 партий. Но факт остается фактом! Значит, статистические данные в этой группе имеют высокую устойчивость и выявленным по ним закономерностям можно доверять.

Итак, нормальная форма для функции вероятности не годится (а жаль!). Однако в ЕГФ по-прежнему цепляются за старую экспоненциальную формулу, еще и обосновывая ее надуманными "произведениями вероятностей", не разглядев в статистике противоречия с нормальным законом.

Так что "не все нормально в гошном королевстве".

Максим Подоляк: Очень сильно!

Я подозревал, что, в случае массы людей, играющих в Го, шахматы, Чапаев, плотность вероятности победы одного игрока над другим НЕ распределяется по нормальному закону (прежде всего, из-за человеческого фактора). И вот, г-н Серпов с цифрами статистики в руках подтверждает это.

Ясно, что чем более стабильны игроки, тем более распределение вероятности победы приближается к гауссову. Но стабильных - единицы. Это те, кто не изменяет силу игры.

ЭЙ!!! Есть такие, кто хочет, чтобы их игра не менялась?! Отзовитесь!

Поскольку все хотят вырасти (и не в рейтинге, а в Игре), распределение не нормальное, а "человеческое".

Г-н Серпов, Вам на заметку тема диссертации :"Статистическое обоснование влияния человеческого фактора на принятие оптимальных решений в игре Го". :)

Не забудьте пригласить на банкет.

С.Павлов: Спасибо за приглашение Вас ко мне на банкет... А человеческий фактор в го, оказывается, имеет определенную функциональную форму. Но об этом - на заседании ученого совета...

Неверно, что чем стабильнее, тем ближе к нормальному. Нормально распределены ошибки каждого игрока в рамках его индивидуальной амплитуды ошибок, если рассматривать идеальную ситуацию, например при анализе отдельных позиций не в процессе игры. Но взаимодействие этих распределений в конкретных партиях, да еще плюс человеческий фактор, дают совсем "ненормальное" распределение. Сильное влияние оказывает наличие конечного предела - "Го-Бога", распределение вероятности у которого - вообще разрывная функция.

Нормальное распределение имеет свойство: вероятность выходит на 1 только в пределе при DR стремящемся к бесконечности. В реальности всегда есть конечная величина, где вероятность в математической модели должна задаваться уже равной 1 (это не означает, что выигрыш более слабого становится невозможным - в этом есть один из известных парадоксов теории вероятностей для непрерывных случайных величин).

Сумма очков, набранных игроками в партии, "должна" подчиняться нормальному закону, если нет систематических ошибок. Но кто может сказать, что отдача группы не является той самой систематической ошибкой, нарушающей условия применимости ЦПТ? А попытки обострить игру в худшей позиции? Это явные неравномерности, нарушающие "нормальность". Другой момент: у профессионалов настолько снижена верхняя граница ошибок при отдельном ходе, что тоже нарушается равномерность. Многие члены просто равны нулю, и только отдельные - принимают конечные числовые значения.


КТО ДОВОЛЕН РЕЙТИНГОМ

В ходе дискуссии по рейтинг-системе один из наиболее часто возникающих вопросов - зачем что-то менять, всех и так все устраивает. Другой вопрос - якобы российский рейтинг был (и есть) завышен по сравнению с Европой. Излагаемые материалы проясняют многие моменты в этих вопросах. Первое сообщение: 29/05/03 15:05, последнее: 05/06/03 07:49

С.Павлов: Постоянно возникают возражения по поводу предложения изменить систему расчета рейтинга. Один из аргументов - всех устраивает так как есть, ничего менять не надо.

Вот аргумент, так сказать, в числах.

Анализ рейтинга за последний десяток лет дает неутешительный результат. Игроки, которые всегда считались стабильными и показывающими игру на своем уровне от 2-го до 6-го дана, оказывается не могут считаться таковыми, если верить рейтинг-листам.

Давайте спросим у тех, кто потерял очки рейтинга (и не 10-15, а сотни очков), довольны ли они рейтинг-системой. Вот постоянная за 10 лет группа игроков из верхней части рейтинг-листа, разбитая на две двадцатки (указана разница текущего и максимального рейтингов):

Нилов Г.И.        5д 199      Кашевник М.Б.     4д 276
Попов И.Э.        5д 191      Тюменцев А.А.     4д 264
Зайцев Н.В.       5д 149      Емельянов С.А.    4д 243
Пермяков Е.В.     5д 147      Межов С.А.        5д 236
Сахабутдинов Р.М. 6д 144      Сахабутдинов Н.М. 5д 235
Гоменюк А.В.      5д 142      Шикшин В.Д.       4д 234
Плющ Ю.Н.         5д 136      Зильберберг В.В.  2д 183
Богданов В.И.     6д 131      Горжалцан В.И.    3д 183
Богацкий А.М.     5д 129      Фрёлих Э.Э.       5д 145
Хмыров А.В.       6д 123      Успенский С.А.    3д 141
Лазарев А.В.      6д 115      Лопатенко К.П.    4д 132
Соловьев В.Д.     6д 114      Хмыров Л.В.       2д 106
Попов А.П.        5д 114      Сонин С.В.        2д 104
Яценко Д.А.       5д 102      Возников К.Э.     2д 101
Гатауллин Р.М.    5д  95      Савицкий Г.В.     2д  99
Трунилин И.А.     4д  75      Панюков Е.Л.      3д  95
Ежов Д.И.         5д  65      Винокуров С.И.    2д  83
Сайфуллин Р.В.    6д  54      Литвин В.В.       3д  68
Босенко Д.А.      5д  49      Беляев Ю.М.       4д  56
Сурин Д.Н.        6д  35      Ерохин В.А.       5д  55

Итого в среднем по 121 очку в первой двадцатке и по 152 очка - во второй. Сюда вошли практически все ведущие игроки, наблюдавшиеся в РЛ все 10 лет, в том числе почти все сегодняшние гроссмейстеры.

Далее отдельной строкой - Альмухаметов И. 5д 403 очка!

Разве такая РС может всех устраивать? Или они все разучились играть за эти годы?

Кстати, эти цифры подтверждают, что самый верх пострадал меньше средней группы данов. А также меньше пострадали 1-2 даны, что уже раньше отмечалось при обсуждении с указанием механизма этого явления в сегодняшней РС.

Нормальным отставанием текущего рейтинга от максимального должно быть число порядка среднего квадратического отклонения (может с некоторым коэффициентом, например 2 - тогда разница в среднем в 25-30 очков не должна была бы смущать).

На форуме клуба "Восхождение" Вадимом Хавиным было высказано замечание:


Не следует утверждать, что все из перечисленных "пострадали" только от несовершенства рейтинг-системы. Думаю, на самом деле получается 50 на 50.

Вот несколько причин, не имеющих отношения к конкретной рейтинг-системе.

1. Кое-кто из перечисленных по разным причинам имеет тенденцию к снижению рейтинга.

2. Не все из перечисленных (в т.ч. из числа ведущих) отличаются высокой стабильностью. Я и сам отношусь к этой категории.

3. Российский рейтинг в среднем завышен относительно европейского. Об этом говорилось уже неоднократно. Соответственно массовые выезды в Европу привели к коррекции (преимущественно в сторону снижения).

Есть однако причины и в недостатках собственно системы...

Никто и не утверждал, что все вышеперечисленные - стабильные игроки в смысле рейтинга. Я считаю, что их колебания, пусть даже на 1 дан то в одну, то в другую сторону, не меняют картины - везде ведь берется среднее значение. А насчет тенденции снижения - тоже не может игрок, достигший однажды 5-го дана, вдруг спуститься на 3-й дан. Так что 50 на 50 - это чисто эмоциональная субъективная оценка.

Вот числа. Один растущий игрок на каждые 100 стабильных (средний уровень не меняется, хотя колебания возможны любые) при повышении на 10 кю понижает всю сотню этих игроков в среднем на 10 очков. А если таких игроков 1 на 10? - понижение будет 1 дан. На самом деле будет чуть меньше, так как коэффициенты Эло у различных игроков могут отличаться.

Теперь о Европе. А Вы слышали когда-либо о корректировке европейского рейтинга в сторону повышения? Что, Европа чем-то отличается от остального мира? Если есть механизм понижения в системе типа Эло, то он работает и в Европе. Я утверждаю, что в европейском рейтинге та же картина, только менее заметная. Растущая молодежь, прежде чем выйти в Европу, сначала пожинает рейтинговые плоды в своей стране.

Кстати, выезд в Европу, Вы считаете, приводит к потере российскими игроками рейтинга. А Вы посчитали? Нет никакой потери. Чем мы, как региональная структура, компенсировали бешеный отсос рейтинга растущими игроками? Интересные таблички опубликованы на сайте ЕГФ (см. основную страницу Рейтинг, левая колонка). Посмотрите на проценты побед более слабого игрока. Сдвиги национального рейтинга, заявленного в данах, относительно европейского тоже приводятся - см. таблицу ниже. Одна из самых благополучных по этому показателю - Россия (один из самых маленьких сдвигов - 14, причем на плюс, а не на минус! - то есть наш рейтинг в Европе еще и чуть выше, чем заявленные даны). У подавляющего большинства стран рейтинг в Европе существенно отстает от заявленных данов. Этот сдвиг может объясняться, в частности, описанным механизмом отсоса.

Таблица смещения национальных рейтингов


Таблица показывает как отличается европейский рейтинг и ранг в кю и данах в различных странах. Колонки, обозначенные ARGD (RGD = рейтинг - ранг в очках, то есть 2100 для 1d и т.д.) показывают среднюю разность между го-рейтингом, и го-рангом. Числа игроков, включенных в базу данных, обозначены NP (только игроки, присутствующие в текущем рейтинг-листе), среднее число турниров - ANT (по игрокам из данной страны). Страны указаны согласно их интернет-кодам, и мы включили также некоторые страны, которые не в Европе географически (AM = Армения, IL = Израиль).
------------------------------------------------------------
|         |      | Dan players | Kyu players | All players |
| Country |  ANT |   NP   ARGD |   NP   ARGD |   NP   ARGD |
+---------+------+-------------+-------------+-------------+
|   AD    |  3.0 |    0     -- |    1     19 |    1     19 |
|   AM    |  2.5 |    2    -35 |    2    -76 |    4    -55 |
|   AT    | 17.4 |   27    -69 |   18    -29 |   45    -53 |
|   BA    | 10.2 |    7   -166 |   18    -63 |   25    -92 |
|   BE    | 13.8 |   15    -77 |   47    -41 |   62    -50 |
|   BY    |  3.0 |    1   -102 |    5    -75 |    6    -79 |
|   CH    |  9.2 |   18    -53 |   49    -40 |   67    -43 |
|   CZ    | 24.5 |   37     -8 |  183     28 |  220     22 |
|   DE    | 11.9 |  307    -53 |  752    -49 | 1059    -50 |
|   DK    | 13.2 |   16    -47 |   17    -44 |   33    -45 |
|   ES    |  5.5 |   16    -14 |  110     -1 |  126     -2 |
|   FI    | 10.5 |   14    -32 |  108    -23 |  122    -24 |
|   FR    | 13.4 |  129    -12 |  538    -18 |  667    -17 |
|   HR    | 11.9 |   11   -121 |   51    -32 |   62    -48 |
|   HU    | 15.3 |   29    -32 |   69     -8 |   98    -15 |
|   IE    |  6.7 |    2    -48 |   10    -46 |   12    -47 |
|   IL    |  3.3 |    2    -40 |    1   -127 |    3    -69 |
|   IT    |  9.5 |   17    -50 |  126    -26 |  143    -29 |
|   LT    |  6.3 |    8    -22 |   35    -20 |   43    -21 |
|   LU    |  7.1 |    1     29 |    7     17 |    8     19 |
|   NL    | 18.3 |   88    -20 |  173    -64 |  261    -49 |
|   NO    |  8.4 |    9    -32 |   16    -27 |   25    -29 |
|   PL    | 15.8 |   29    -28 |  184    -10 |  213    -13 |
|   PT    |  8.0 |    1   -163 |    3     21 |    4    -25 |
|   RO    | 14.5 |   59    -39 |   61    -31 |  120    -35 |
|   RU    | 14.4 |   83     14 |  138      4 |  221      8 |
|   SE    |  9.1 |   25    -47 |   83    -43 |  108    -44 |
|   SI    | 19.6 |   25    -62 |   18    -76 |   43    -68 |
|   SK    | 27.4 |   11     22 |   69     -7 |   80     -3 |
|   TR    |  2.5 |    2    -18 |    0     -- |    2    -18 |
|   UA    |  6.5 |   26     17 |  160      8 |  186      9 |
|   UK    | 16.5 |  120    -56 |  255    -51 |  375    -53 |
|   YU    | 19.2 |   23   -140 |   20    -50 |   43    -98 |
+---------+------+-------------+-------------+-------------+
|  EURO   | 13.7 | 1160    -38 | 3327    -27 | 4487    -30 |
------------------------------------------------------------
 

Смещение рейтинга первых 50-ти российских игроков

Первая колонка - рейтинг в ЕГФ, вторая - российский

    1  Dinerstein Alexandr      Kaz    1P   2762    2878   +116
    2  Lee Hyuk                 Mos    7D   2736    2876   +140
    3  Shikshina Svetlana       Kaz    1P   2693    2669    -24
    4  Zatonskikh Anton         Kha    6D   2607    2623    +16
    5  Lazarev Alexej           Pet    6D   2604    2680    +76
    6  Surin Dmitrij            Iva    6D   2592    2662    +70
    7  Kulkov Andrej            Kaz    6D   2587    2633    +46
    8  Sajfullin Ruslan         Kaz    6D   2549    2611    +62
    9  Mezhov Oleg              Mos    6D   2540    2565    +25
   10  Bogdanov Viktor          Pet    6D   2537    2589    +52
   11  Khmyrov Andrej           Mos    6D   2530    2565    +35
   12  Solovjev Valerij         Kaz    5D   2519    2506    -13
   13  Sakhabutdinov Rustam     Mos    5D   2503    2518    +15
   14  Cheburakhov Andrej       Mos    5D   2497    2510    +13
   15  Shikshin Ilja            Kaz    5D   2492    2487     -5
   16  Ezhov Dmitrij            NN     5D   2489    2528    +39
   17  Gataullin Roman          Kaz    4D   2487    2466    -21
   18  Popov Alexandr           Mos    4D   2456    2466    +10
   19  Gomenjuk Andrej          Mos    5D   2430    2456    +26
   20  Sakhabutdinov Nai        Kaz    3D   2428    2294   -134
   21  Dugin Timur              Kaz    4D   2425    2403    -22
   22  Trunilin Ilja            Eka    4D   2419    2408    -11
   23  Solovjev Jurij           NN     3D   2410    2387    -23
   24  Beljaev Jurij            Izh    3D   2397    2345    -52
   25  Nilov Georgij            StP    5D   2392    2395     +3
   26  Matveev Evgenij          StP    4D   2391    2410    +19
   27  Permjakov Evgenij        Per    3D   2386    2352    -34
   28  Frelikh Eduard           StP    4D   2385    2371    -14
   29  Pavlov Sergej            Nov    4D   2377    2408    +31
   30  Popov Igor               Mos    4D   2376    2316    -60
   31  Popov Alexej             Pet    3D   2373    2370     -3
   32  Khavin Vadim             Mos    3D   2372    2381     +9
   33  Zajcev Nikolaj           Pet    3D   2356    2354     -2
   34  Burdakova Dina           Che    4D   2355    2412    +57
   35  Kulikovskij Ivan         Pet    3D   2351    2371    +20
   36  Leshcheva Irina          StP    4D   2349    2396    +47
   37  Sankin Timur             Izh    3D   2342    2316    -26
   38  Gorchakov Alexej         StP    3D   2327    2411    +84
   39  Dugin Artem              Kaz    2D   2322    2272    -50
   40  Simonov Alexej           StP    3D   2311    2335    +24
   41  Nemlij Igor              Kaz    2D   2311    2249    -62
   42  Andrienko Vasilij        Iva    2D   2309    2217    -92
   43  Shvecov Vladimir         Seg    2D   2305    2328    +23
   44  Hao Hu                   Mos    2D   2304    2268    -36
   45  Promyslov Ivan           Izh    3D   2301    2273    -28
   46  Kovaleva Natalja         Che    2D   2301    2254    -47
   47  Matveev Daniil           StP    4D   2299    2317    +18
   48  Mezhova Olga             Mos    2D   2297    2266    -31
   49  Mezhov Sergej            Mos    4D   2293    2264    -29
   50  Khandov Alexej           StP    3D   2272    2281     +9
   ------------------------------------------------------------
                                                    Итого: +266
 

Т.е. на каждого игрока в среднем по 5 очков, причем из общей суммы первая десятка набрала аж +579 очков! Остальные -313. Таким образом, не может быть никакого разговора о якобы завышенном российском рейтинге. А вот завышение рейтинга нескольких игроков на самом верху - это есть, причем по причине несоответствия вероятностей: заложенной в РС и той, которая на самом деле должна использоваться (значительно ниже, чем 34%, как это предполагается в российской РС, при встрече с Динерштейном игрока, отстающего на 1 дан - 100 очков рейтинга, например по европейскому рейтингу).

Олег Попов: А я вот так думаю: всё дело только в отсутствии программы.

Если кто-то возьмётся, и реализует разработанную Павловым усовершенствованную РС в виде удобной и устойчивой программы для компьютера (лучше под Винды), то всё остальное решится само собой: Панюков с удовольствием начнёт её использовать при обсчёте рейтингов, и у нас будет хорошая новая РС.

Так что дело, в общем-то, за малым: найти программера, договориться об условиях (не знаю уж насчёт бесплатно), поставить задачу, принять продукт; или я не прав?

С.П.: Программа - не главное. Можно даже интерактивную сделать в инете. Вопрос организационный, так как можно давно было и в старой программе правильные настройки сделать. Но не захотели, сколько ни убеждал. Ответ один - нам так удобно.

Олег Сапач: Сложно обсуждать проблему, когда идет такой безличный разговор - кто не захотел, кого убеждал, кому - так удобно?

Проблема быстрорастущих молодых игроков действительно существенна - тут надо что-то решать.

А Вадим Хавин правильно говорит - со временем сила игры может и снижаться, особенно если не играть:-) Какой смысл замораживать рейтинг ведущих игроков?

Это для профи важно - зарплата выше(?) Вон в Японии сколько сейчас 9-х данов - что, они все на одном уровне?

С.П.: В ходе дискуссии у меня складывается впечатление, что суть вопроса не очень интересует большинство, так как ни проекта не читали, ни тем более ЧаВо (на страницу ЧаВо заходило десятка два человек, вряд ли все - игроки го). Иначе не задавали бы многкратно повторяющиеся вопросы, на которые уже давались ответы.

...

Ну чтож, повторюсь в который раз. Рейтинг считает Е.Панюков. Ездил он в командировку в Новосибирск. Два дня я его убеждал, что не так считает рейтинг. При личных встречах на турнирах - только встает в позу обиженного (я вам рейтинг считаю, а вы критику...). Или у нас кто-то еще считает рейтинг? Между прочим, по чужой программе и чужому, в основном, алгоритму.

Олег Сапач: Проблема быстрорастущих молодых игроков действительно существенна - тут надо что-то решать.

А Вадим Хавин правильно говорит - со временем сила игры может и снижаться, особенно если не играть:-) Какой смысл замораживать рейтинг ведущих игроков?

C.П.: Ну чтож, опять упрекну Вас, уважаемый Олег, что наверное сообщение мое не прочитали внимательно. О каком замораживании вы говорите? О каких неиграющих игроках? Я мало играю - меня там нет. Может Лазарев мало играет, или Богданов?

Надо бы корректнее дискуссию вести. В примере почти все игроки - активно выступающие в российских турнирах в последние 10 лет (а не только в текущем месяце :)).

Илья Ветров: О! Кстати! Сколько сейчас профи? Какой состав по полу, возрасту, стажу, странам, данам? Где-нибудь подобрана статистика?

И еще - по теме. Я не спец по рейтингам, но по-моему дефекты рейтинг-систем почти безвредны. Ну опустился игрок на пару ступеней, оказался среди "растущих", восстановился. Об чем слезы лить?

C.П.: И я о том же - неинтересно все это большинству игроков. Но как только возникает вопрос, в какую группу МакМагона включать, кого отправлять на тот или иной турнир, кому какие звания присваивать - тут все про рейтинг вспоминают.

И.В.: И еще - по теме. Я не спец по рейтингам, но по-моему дефекты рейтинг-систем почти безвредны. Ну опустился игрок на пару ступеней, оказался среди "растущих", восстановился. Об чем слезы лить?

C.П.: А здесь, Илья, Вы просто заблуждаетесь. Когда идет отсос рейтинга ВСЕМИ без исключения растущими игроками (а не только быстро растущими), то раз опустившись, игрок со стабильным уровнем НЕ сможет вернуться к прежнему рейтингу (в действующей РС). Для этого он должен был бы снова начать расти, а у каждого свой предел есть.

И.В.: Сергей, по-моему это ужЕ конфликт профессионализма и любительства. Для профессионала (и вообще спортсмена) рейтинг - высшая ценность. А для любителя - всего лишь средство правильно установить фору или подобрать противника в бесфоровом турнире по Макмагону. "Правильно" - то есть для обеспечения азарта, непредсказуемости и прочих любительских радостей. Поэтому для меня (как любителя) желательно (но не слишком важно), чтобы рейтинг-система была простой, а ошибка в 1 ступень допустима, в 2 ступени - терпима. Но что касается престижа, спонсорства, права преподавания и прочих призов - это важно для спортсменов (даже если это дети), и для них рейтинг должен быть максимально точным.

Может разделить эти рейтинг-системы, чтобы любители не путались под ногами у профессионалов и кандидатов, а те не грузили своими сложностями беззаботных любителей?

P.S: Извините, не успеваю читать. Как это - игрок опуститься может, а подняться - нет? А те быстрорастущие, которые отобрали рейтинг у игрока, разве не выросли? Или Вы о том, что быстрорастущие снижают средний рейтинг? По-моему тут достаточно разовой всеобщей поправки, но - см. выше.

С.П.: Да, конечно, в общем Вы правы, но рейтинг-то должен быть общим, в этом все дело. А насчет возврата - да, это точно, не сможет никто вернуться, увы. Для примера рассмотрите примитивную ситуацию: один 1д, другой - 10к. Играют, играют... пока 10к не станет 1д (по силе игры). А 1д - не растет (достиг потолка). Какой рейтинг у них будет в конце? Правильно, у каждого - соответствующий 5к.

Насчет единовременных поправок. А как их делать? Один сыграл 100 партий, а другой - 5, один вроде бы рос и отнимал рейтинг у других, а другой десять лет как стабилизировался, и т.д. Так мы и будем бесконечные разовые поправки делать. А попробуйте вычислить, на сколько надо сделать поправку? Все это неочевидные вопросы. Система должна быть устойчивой и самонастраивающейся - такой, по крайней мере, я хочу ее сделать.

Можно еще раз повториться и здесь сказать, что традиционная система кю-данов - тоже рейтинг-система, и вполне удовлетворяющая любителей без особых претензий. Тогда зачем огород городить?

И.В.:

"...но рейтинг-то должен быть общим..."

Вообще-то не обязательно, но тогда придется запретить рейтинговые игры между любителем и спортсменом, а это само по себе плохо.

"...Для примера рассмотрите примитивную ситуацию: один 1д, другой - 10к. Играют, играют... пока 10к не станет 1д. А 1д - не растет (достиг потолка). Какой рейтинг у них будет в конце? Правильно, по 5к у каждого."

То есть если Ваши поправки к рейтинг-системе будут приняты, то Вы обещаете правильность среднего рейтинга (а не только относительного внутри региона)? Круто!

"...Насчет единовременных поправок. А как их делать?"

Я имел в виду - собрать региональных Главных по рейтингу и пусть решат в каком регионе насколько сдвинуть рейтинг - всем сразу. Но то, о чем говорите Вы - безоговорочно лучше.

"...Система должна быть устойчивой и самонастраивающейся - такой, по крайней мере, я хочу ее сделать."

Великолепно! И даже правдоподобно. И технически достаточно просто реализуемо, если все нужные Вам параметры алгоритма заготовлены, а Вы беретесь их установить. По крайней мере ни одного возражения по существу Ваших предложений и обещаний здесь не прозвучало...

"...Можно еще раз повториться и здесь сказать, что традиционная система кю-данов - тоже рейтинг-система, и вполне удовлетворяющая любителей без особых претензий."

А что это за "традиционная система кю-данов"? Там игрок сколько-то раз подряд выигрывает или проигрывает разным противникам, чтобы сменить ступеньку рейтинга?

"...Тогда зачем огород городить?"

Мне всегда казалось , что для спортсменов с их естественными "особыми претензиями" к качеству рейтинг-системы ...

С.П.: Наконец-то встретил того, кто все понял правильно!

А система кю-данов существует в самом примитивном виде и сейчас. В Японии в клубах играют так: два раза проиграл дающий фору - фора уменьшается, три раза выиграл - повышается (несимметрию уже объяснял в ответах). Так выстраивается относительная шкала. Абсолютная шкала - по привязке к профессионалам и сильным любителям, с необходимой поправкой, если надо. Большой элемент экспертной оценки присутствует. Все дипломы, которые получали российские игроки от японских профессионалов - по этому принципу давались. Даже я успел получить в 1990 году 4д от Кансай-Киин.

И.В.: Спасибо за комплимент. Только это было иллюзорное понимание. И черт меня дернул все-таки прочитать Ваш проект! Точнее - я попробовал прочитать. Может я "аномально" тупой , но чтобы понять и оценить проект по существу, мне нужно будет потратить примерно столько же лет, сколько Вам - на разработку.

Сложность - не грех. Лично я склонен поверить, что Вы не ошиблись и не ошибетесь. Но все-таки внедрение Вашего проекта - рискованный эксперимент. Значит надо на период проверки и отладки вести "двойную бухгалтерию", сохраняя живую (хотя и критикуемую) рейтинг-систему в качестве официальной. Пусть кто-то начнет публиковать альтернативный рейтинг-лист по Вашему новому способу. Тогда и поглядим. "Проверка и отладка - забота разработчика".

С огромным уважением, Илья Ветров

С.П.: Илья! А что происходило все последние 10-12 лет? Ведь считали, "почти", по первоначально предложенному мной алгоритму! Разве это Вас не убеждает? Я же есть разработчик действующего алгоритма и нового, улучшенного, варианта! Я же и программист - кроме программы, написанной Ю.Беляевым, по которой считает Е.Панюков, у меня была своя версия программы еще в 1989 году. Кто же сделает за меня эту работу, т.е. усовершенствует то, что уже прошло проверку временем и показало работоспособность. Тем более, что многие идеи того алгоритма перенимаются и в Украине, и в Европе (частично, в идейном плане, например - понятие аномального роста).

Главное, что я вижу недостатки и пытаюсь их устранить, одновременно разъясняя всем остальным суть проблем. Ведь эти недостатки (сползание рейтинга главным образом) присущи всем без исключения рейтинг-системам как типа Эло, так и итерационного типа (сервер КГС). Можете мне поверить на слово, что проблема вовсе не в алгоритме, а как у нас водится, в организации. Как вводилась действующая РС? В 1990 году я сделал специальный доклад на первом чеспионате СССР, все выслушали, согласились и... года на два забыли. Я же был далеко - из Новосибирска в то время не очень-то выбраться в Европу было. Потом появился Е.Панюков, который только начинал свою деятельность в сфере го, в том числе с Кайдаловым, который выпускал журнал "Интеллектуальные игры". Ю.Беляев передал ему свою программу и машина покатилась. Но сразу же стали возникать и разногласия между разработчиками - мной и Ю.Беляевым, с одной стороны, и пользователями - Е.Панюковым и некоторыми ведущими игроками - с другой. В результате в алгоритм были внесены "поправки" типа аномального результата на понижение, пересчет только скопом за квартал (потом - за два месяца) и пр. Привязка вообще была выкинута из алгоритма.

Так что почти критикую самого себя, но не только.

В.Ф.Корсак: Внимательно слежу за развернувшейся дискуссией, так как эта тема меня интересует давно. Но постоянно не хватает времени чтобы высказаться самому, хотя на каком-то из форумов даже что-то написал. Если проанализировать то что было написано, то можно найти очень много ценных мыслей.Попытаюсь поделиться некоторыми своими, может быть тоже кто-нибудь найдет и в них что-то полезное. Начнем с самого главного - зачем нужен нам рейтинг? В первую очередь он нам нужен для установления некоторого внутреннего порядка. А порядок всегда устанавливался и поддерживался некоторой авторитарной властью. Таким образом рейтинг это в некотором смысле атрибут власти. Очевидно что игрок А с рейтингом 2398 вряд ли считает что он играет слабее игрока Б с рейтингом 2403. Но если решением власти какие-либо льготы оканчиваются на цифре 2400 и эта же власть определяет по заранее определенным правилам что у А рейтинг 2398, а у Б - 2403, то А может только посетовать на удачу, на себя в конце концов, но должен смириться с тем что так оно и будет. И это все при том что все - и А, и Б, и власть, понимают, что рейтинг это вещь довольно таки неточная и быть абсолютно точной в принципе не может. Но рейтинг-система (РС) даже со всеми её минусами в сочетании с, еще раз подчеркиваю, авторитарной властью обеспечивает этот порядок.

Рейтинг-систем как и рейтинг-листов (РЛ) может быть любое количество. Это не вредно. Главное, чтобы все кто их использует понимали, что их РС и РЛ являются атрибутами местной власти (города, клуба, улицы, дома и т.д.) и не смотря на то что они помогают навести порядок на местном уровне, так как они будут достаточно правильно отражать соотношение сил внутри группы (трудно придумать такую РС, которая не выполняла бы эту функцию), они не всегда будут восприниматься вышестоящими или паралельными органами. Для того чтобы было взаимопонимание необходимо использовать согласованную РС (как правило она должна заимствоваться у вышестоящего органа). В идеале должна быть единая РС. Но для этого ВСЕ уровни должны иметь ЕДИНЫЙ откалиброванный инструмент для расчетов, на ВСЕХ уровнях должны быть подготовленные люди, которые этим инструментом могли бы пользоваться. И у вышестоящих органов должно быть доверие к расчетам, выполненным нижестоящими органами. В этом случае отпадет необходимость в Москве (или в Челябинске) собирать таблицы турниров (или даже отдельных партий) сыгранных в районном центре Н-ской области. Какая организация проводит турнир - такая его и обсчитавает. И регулярно подает сведения наверх. Но это конечно идеал, на пути к которому ряд технических и еще больше организационных трудностей. Практически не достижимо, особенно в условиях того, что большинство все-таки любит играть в Го и не заниматься какими-то не до конца понятными расчетами, а просто периодически заглядывать в рейтинг-лист, который составляет все тот же, как и десять лет назад, Панюков. Кстати, в Украине мы понемногу приближаемся к этому идеалу. У нас есть РС которая лишена некоторых (правда не всех) недостатков РС России, у нас есть откалиброванный инструмент (программа, достаточно простая в управлении - по крайней мере за пару часов можно обучить ей пользоваться практически любого человека, имеющего хоть какое-то представление о рейтинге) и у нас ни у кого нет никаких претензий по поводу того как считается рейтинг. Здесь, конечно есть свои объективные причины. Нас все-таки меньше, авторы РС, программы и власть практически сосредоточены в одном лице, что исключает какие либо разногласия. Что же не устраивает сегодня игроков в действующей РС РФГО? Я отброшу организационные факторы, а отановлюсь только на технике дела и математике.

Как я понял главные причины следующие.

1. Снижение рейтинга у группы ведущих игроков. Здесь на мой взгляд виновата не столько РС, как то что сопутствует ей. А именно - исходные рейтинги с которыми люди входили в рейтинг-лист и система проведения соревнований. Начнем с первого. От многих слышно, что вот 10 (15-20) лет назад был 5 (2-4)даном, а сейчас на 2 - 3 дана меньше, хотя вроде бы играю не слабее. Я, конечно, не помню сам, так как я в то время Го не знал, но по рассказам в те годы даны присваивались следующим образом. Из Японии приезжал Маэстро (3-6 дан) играл несколько партий на форе с нашими игроками и делал заключение - да, этот парень играет на 5 (2-4) дан. Легко допустить, что с целью популяризации игры (а именно с такой целью японцы и приезжали) и поощрения наших игроков они давали слегка завышенные (на 1-2 дана, цифры можно обсуждать) заключения. Но после того как тебе сам Маэстро сказал что у тебя 4 дан и выдал тебе бумажку, ты уже будешь стоять насмерть, но никогда не согласишься на то чтобы тебя включили в турнир хотя бы с 3 даном. Таким образом сформировалась первая волна данов, по которым уже равнялись следующие поколения. Но более поздние уже пропахивали на животе весь рейтинг лист от 100 до 2200 и становились действительно вторыми данами, отнимая рейтинговые очки у бывших 4-х и 5-х данов. Эту мысль подтверждает и то, что сегодняшние японские любительские даны (та линейка по которой Маэстро выдавал дипломы) на 1-2 дана слабее европейских (российских, украинских). Вывод простой (может я этим обижу некоторых уважаемых всеми, в том числе и мною людей - заранее прошу извинения) никакого снижения уровня нет (за исключением естественного - возрастного), просто раньше рейтинг был несколько завышен, а сейчас он вошел в норму. По крайней мере он достаточно хорошо согласуется (на уровне данов) с европейским. И имено в этом его ценность (при отсутствии единой РС) - обслуживая свою группу по возможности согласовываться с РС вышестоящей. Есть конечно исключения: Ли Хек, Динерштейн, но это уже особенности РС РФГО. С этим связана и проблема быстрого роста молодых игроков. Для этого введено понятие аномального результата и поощрительные очки за сыгранные партии. Подбором границы аномального результата и размера поощрительных очков можно добиться того, чтобы стабилизировать рейтинги стабильных игроков, усредненно, конечно. Но на аномальный результат сильно влияет ситема проведения соревнования. Анализируя таблицы Российских турниров, я прихожу к выводу что в России ширина группы Мак-Магона составляет 300 - 700 очков рейтинга. При таком подходе показать аномальный результат практически невозможно. Опыт Украины показывает, что для аномального ркезультата необходимо выиграть или все партии или по крайней мере все минус одну. Хотя был уникальный случай когда получился аномальный результат с 4 победами и 2 поражениями. Так вот, при такой ширине группы Мак-Магона уже после двух побед тебя встречает противник с рейтингом как минимум на 500 пунктов сильнее. А если повезет обыграть и этого, то силу следующего противника даже представить себе трудно. В результате 90 % участников заканчивает турнир с результатом от 2 до 4 побед из 6. Исключение составляют только победители турнира, так как им подыматься уже некуда и конечно самые слабые. В Украине все турниры играются по Мак-Магону 1 разрад - 1 очко. В этом случае чтобы выиграть 5 из 5 достаточно обыграть соперника имеющего рейтинг на 300 пунктов больше своего. Поэтому практически в каждом турнире несколько человек получают такой результат. И дольнейшее развитие событий показывает, что пересчет был обоснованным. Да и граница аномального результата у нас несколько либеральнее существующей российской. И интуитивно она понятна и легко представима. Аномальным результатом мы считаем такую прибавку в рейтинге, которая примерно соответствует выигрышу всех партий в турнире с равними по рейтингу соперниками. По поводу поощрительных очков. Они необходимы. Дело в том, что если встречаются два игрока например с рейтингом 2200 и 1900, то они имеют разный коэффициент развития (динамичности). Для существующей российской системы это 10 и 20. Если принять, что вероятность победы сильнейшего равно 0.8, то по существующим базовым формулам в случае победы сильнейшего он прибавит 2 очка, в то время как слабейший потеряет 4, в сумме минус 2. А если победит слабейший он прибавит 16, а сильнейший потеряет 8, в сумме плюс 8. Но все-таки сильнейшие выигрывают чаще, что приводит к уменьшению суммарной массы рейтинга, которую необходимо компенсировать. Мне могут возразить, что мол компенсация происходит в тех случаях когда слабейший выигрывает, что хоть и реже, но все-же случается. Да, математически все правильно, там вероятность 0.8, здесь 0.2 - все сходится. Но дело в том, что рейтиноговая масса должна оставаться постоянной, только тогда, когда остается постоянной суммарная сила игры. И в случае когда всегда выигрывает сильнейший, можно только говорить о том, что не проявляется суммарный прогресс, но не о том, что начался суммарный регресс (об этом мы уже говорили и пришли к выводу, что сила игры за редкими исключениями не падает). Таким образом логика подсказывает, что суммарного уменьшения рейтинга быть не должно ни в каких случаях. Другое дело когда выигрывает слабейший. Это означает только одно, что слабейший прогрессирует и что суммарная сила игры растет и следовательно должна расти и рейтинговая масса. В сумме поощрительные очки и грамотное использование понятия аномального результата вполне способны защитить РС от быстро растущих игроков. В Украине есть опыт такой борьбы, можем поделиться. Как вы знаете у нас нет недостатка в молодых быстро растущих игроках но всем им находится достойное место в нашем РЛ.

2. Аномальный результат вниз. Здесь я полностью поддерживаю Павлова. Он не нужен. Если игрок снижает свой уровень, то его результат пересчитанный в снижение рейтинга будет достаточным отражением изменения силы его игры.

3. Согласование с Европейским рейтинг-листом. Здесь уже нужно играть по правилам ЕФГО. Пересылайте как можно больше таблиц и ЕФГО будет реально (на их взгляд) отражать силу вашей игры среди других европейских игроков, которые, кстати, тоже наверняка присылают не все турниры. И у них (ЕФГО) тоже не будет абсолютной объективноти пока они не навяжут всем свои принципы расчета и не позволят считать турниры внутри страны и не станут доверять национальным расчетам и т.д. Все о чем я говорил выше.

4. Согласование с Украиной. Извините, у нас, как мы считаем, хорошая РС и другой мы пока не хотим. Так что единая пока вряд-ли получится, хотя все может быть, может быть сможем договориться. Это все нужно обсуждать. А пока советуем в своих турнирах принимать украинцев по украинскому рейтингу, если разница между украинским и российским составляет для данов например 50 очков, а для остальных 100 очков. Поверьте, у нас рейтинги нисколько не завышенные, разве что только у тех, кто давно не играл.

5. Согласование с традиционной форовой системой. Здесь, конечно, есть проблема. От традиций отступать не хочется, но видно придется. Я думаю очень трудно придется играть Диме Богацкому на 4 форах с Лопатюком, или же Гальченко на 3 камнях с Жураховским. И такое положение останется до тех пор, пока не будут играться форовые турниры. Но здесь свои проблемы с определением победителей. Хочу высказать свое мнение и по этому вопросу, обсуждающемуся на другой дорожке форума. Симпатично выглядит система с различной оценкой стоимости победы (в зависииости от форы). Но мне кажется более логичной другая схема. Начисление очков традиционное. Просто группы Мак-Магона формируются в соответствии с форовыми группами. 6-е даны начинают с 26 очками, 5-е с 25-ю, и т.д.В предположении того, что фора уравнивает шансы, вероятность того, что победит действительно сильнейший самая высокая. Кроме этого не играются партии с 8 - 9 форами, часто не представляющие интереса ни для кого, и при соответствующем обсчете таких турниров если их будет достаточно много РС может быть согласована с традиционной форовой. Прошу извинения, что занял много места, да и времени на то чтобы это прочесть, на я старался не злоупотреблять математикой, которую, как я понял по отзывам Павлова многие не любят, т.к. не желаю в ней разбираться, а излагать все по-простому. Может что-то и забыл из того что хотел написать, но это уже в следующий раз.

Василий Скочко: Прочитал письмо Корсака. Практически со всем согласен. Особенно в том, что РЛ России имеет значительные расхождения с Европейским и Украинским РЛ. Лично мой российский рейтинг (2341) на 50-60 пунктов ниже украинского и европейского( в них мой рейтинг сбалансирован до 2-3 пунктов). Я не говорю про Кокозеев, Жураховских, Лопатюков. Да, как сказал Корсак, интересно посмотреть как с такими будут играть на форе 5-6-е даны(ну, не даст мне Гальченко две форы, при всем желании). Думаю, если на LG украинцев "поведут" по российскому рейтингу, то опять ровенцы и киевляне повыигрывают все что можно.

С.П.: В принципе, все говорят достаточно правильные слова. У меня нет возражений ни против использования Украиной своей РС, ни против "плохости" сегодняшней РС России. Но вот парадокс. В.Ф.Корсак говорит о том, что неплохо бы иметь единый рейтинг, но от украинской РС - ни на шаг! Именно поэтому у нас никогда не будет единого рейтинга.

В.С.: Сергей! Если украинская РС- хороша, а российская- не совсем хороша, то кто должен что-то менять? Наша РС согласована с европейской (достаточно близкие значения), а ваша? Думаю, те, кто занимается российской РС могут обратится к Корсаку В. (он занимается украинской РС) для обмена опытом. Возможно, это поможет создать хорошую российскую РС, которая будет согласована с другими РС и не будет вызывать нареканий. В согласованности РС заинтересованы не только российские игроки го, но и украинские. И не только россиянам не нравится то, что сейчас происходит.

С.П.: Василий, так читайте "Проект..." и все, что с ним связано. Все хорошее, что есть в РС Украины, надо использовать, а если Вы внимательно читали и понимаете суть систем ЕРС, УРС, действующей РС России и "Проекта", то без труда обнаружите единство в идейном плане тех положительных моментов, которые есть во всех этих системах, а также то, от чего надо отказаться. Например, эмпирическая формула в УРС на самом деле переформулировка принципа превышения дисперсии выше некоторого уровня нормальности в схеме Бернулли (вынужден, к сожалению, использовать по минимуму мат. терминологию). Аномальный результат - понятие, вытекающее именно из анализа этой схемы. "Призовые" очки - неизбежное зло в УРС, которое можно заменить саморегулирующимся механизмом на основе анкеров и соответствующих вычисляемых поправок. Другая часть механизма "саморегуляции" - учет различия в дисперсии для групп игроков разного уровня, т.е. задание вероятностей побед с учетом более низкой дисперсии у игроков с более высоким уровнем (см. РС ЕГФ и статистические материалы на сайте ЕГФ). Если Динерштейн, имея на самом деле вероятность победы с 6-м даном более 90% будет в РС получать за победу как с вероятностью 75-80%, то его рейтинг будет все более отрываться от основной группы данов (что и наблюдаем в российской РС). То же самое и для других групп, но в меньшей степени. И так далее и т.п.

И.В.: Сергей, браво!!! Ваши слова для меня - как музыка, точных смыслов нет, лишь постановка задач и намеки на путь решения, но читаю и душа радуется.

Знаете старую легенду - якобы в древнем Китае были построены золотые ворота изумительной красоты, с тончайшей сюжетной росписью, но на одной половине ворот одна фигурка была изображена вверх ногами - чтобы боги не прогневались за чрезмерное совершенство.

Конкретное предложение: постарайтесь, пока не поздно, внести в Ваш проект какую-нибудь грубую ошибку, мы все хором укажем Вам на нее, Вы покаетесь, исправитесь - и наконец сделаете рейтинг-систему такой как надо.

С.П.: Точные смыслы в проекте... А вообще-то надо изложить краткий курс элементарной теории вероятностей, главу написать про экспертные рейтинг-системы, матстатистику с ее методами не забыть и т.д. Но, боюсь, это интересно только специалистам :-))

Сергей Межов: Сергей, Илья абсолютно прав. Зеленая собака необходима в любом проекте.

С.П.: А мне кажется, что "зеленых собак" впоне хватает и в обсуждаемом проекте :-)).

Марианна: Люблю потрепаться, извините заранее, что длинно. Один раз мой папа занимался с моим братом-школьником математикой. И, объяснив одно и то же раз 5, потерял терпение и закричал: "Я не понимаю, что ты не понимаешь!!"

Вот эта фраза должна быть эпиграфом всей дискуссии по РС. Я в университете изучала теорию вероятности и мат. стат. Думаю, и многие другие тоже, Сергей абсолютно прав. Нечего и обсуждать.

Вот еще пример. Приходит человек в автосалон и начинает расспрашивать, как устроена машина. Ему нужно точно знать, ведь от этого может зависеть его жизнь. Жаль только, инженерного образования нет.... Так и не поняв, как она работает, уходит, ничего не купив. Ездит на лошади - это ему понятно.

Есть математики. Они ЗНАЮТ. Это факт. Мы доверяемся чужому знанию очень часто. А тем более, Сергей доказал, что он знает. Тем, кто не знаком с математикой в нужном объеме - придется поверить. Это не обидно, это всегда так бывает.

С.П.: Ну что ж, Марианна совершенно права. Давно хотел сказать что-нибудь в том же духе...

О.С.: Сергей всё доказывает, что он прав... Так с этим, по-моему, никто и не спорит. Вопрос в том - что же дальше? Кто напишет программу? Кто будет вести РЛ?

С.П.: Я, естественно, не всегда прав. Как и любой другой человек, хочу иметь право на ошибку. Ведь и с проектом нет полной ясности по всем вопросам (работа продолжается). Что касается Ваших вопросов, Олег, то главный до сих пор открыт: с 1990 года я настаиваю, чтобы была создна рейтинг-комиссия при президиуме РФГ. Все соглашаются на словах, в том числе и наш уважаемый президент, но прошел конгресс "Кониси", было заседание президиума, а воз и ныне там же...

Конечно, можно взять и начать "альтернативный" расчет, как предлагалось в некоторых выступлениях на форуме. Но мне лично этот вариант не очень нравится. Ведь я как бы сам с собой должен вступать в конфликт в этом вопросе, как один из разработчиков применяемой РС. Если меня таковым считают и сегодня, то почему бы просто не прислушаться к моему мнению и не скорректировать давно РС? Разве так важно, кто вносит данные в программу?

К сожалению, некоторые из "неправильностей", присутствующих в действующей РС, внесены (необосновано с моей точки зрения), как говорят, по инициативе авторитетных игроков, членов президиума (не называю фамилии, поскольку сам с ними не разговаривал и не убедился в этом факте лично).

Олег Попов: Как думаете, может, в следующей версии программы (если, разумеется, её всё же начнут использовать для ведения РС) следует несколько ограничить возможность настроек? Во-первых, сделать регулируемыми лишь необкодимый минимум параметров. Во-вторых, диапазон их регулировок также ограничить максимально. Таким образом можно уменьшить возможности нецелевого вмешательства в РС.

Если же в РС возникнет необходимость внести существенные изменения, это сделает автор алгоритма на основе решения какого-нибудь органа РФГ.

С.П.: Олег, если программа не есть ехе-файл (в нашем случае написана на паскале), то о каких зажатых настройках можно говорить? Тем более, что можно вообще другую программу написать. Кто это проконтролирует?

Нет, это путь тупиковый. Я уже высказывал соображение, что программа должна быть общедоступной в инете, тогда каждый может ввести любые данные и посчитать рейтинг по любому турниру. Это снимает любые вопросы контроля. А за разработку, настройку, ведение РЛ и т.д., конечно же, должен отвечать соответствующий орган - рейтинг-комиссия РФГ.

С.П.: Уже наверное в течение десятилетий (одного по крайней мере) неустанно повторяют "и стар и млад", что де российские игроки имеют завышенный рейтинг в Европе (точнее, якобы наши даны слабее соответствующих данов из других стран), поэтому и очки рейтинга теряют и аномалку вниз надо бы применять, чтобы исправить хоть как-то положение и т.д.

Не говоря об успехах российского го на европейской арене (что само по себе не очень вяжется с этим "последним мифом"), будем опираться на официально опубликованные данные.

Выше приведена таблица, показывающая сдвиги национальных заявленных данов и кю по отношению к европейскому рейтингу, т.е. таблица показывает как отличается европейский рейтинг и ранг в кю и данах в различных странах. Страны указаны согласно их интернет-кодам, и включены также некоторые страны, которые не в Европе географически (AM = Армения, IL = Израиль).

Из таблицы видно, что в подаляющем большинстве стран европейский рейтинг существенно ниже заявленных данов и кю. А в России в среднем даны на 14 очков имеют рейтинг выше соответствующего уровня.

Вадим Хавин: Самое смешное, что выравнивание рейтингов российского и европейского - это во многом следствие недостатков российской рейтинг-системы. Теперь, когда прежнего расхождения примерно в 1 разряд не стало, настало подходящее время эти недостатки устранить, т.е. перейти на новую системе.

С.П.: Дело в том, что сегодняшние даны российских игроков были заявлены много лет назад (преимущественно), поэтому тот сдвиг данов относительно европейского рейтинга, о котором я говорил (14 очков) никак не связан с возможным выравниванием российского и европейского рейтингов. На самом деле основная часть данов, за исключением верхушки, опустилась значительно ниже в российском рейтинге, и партии в евротурнирах тут ни причем. Кстати, те же явления в средней группе данов и в Украине, а они ведь давно независимо от нас считают рейтинг. В общем - еще раз посмотрите таблицы смещения и комментарий. И давайте прекратим говорить голословные вещи.

Если был завышен - покажите! У каких игроков (или групп), насколько, по каким причинам и т.д. Приведите числа, таблицы, ссылки на достоверные источники, а не на разговоры в кулуарах турниров... А эмоционально оценивать: "мне кажется, что разница была в 1 дан..." или "... на 1,5 дана..." или еще на сколько? Если мы имели завышенный рейтинг и теперь уравнялись, то что с теми странами, у кого теперь завышенный рейтинг? А у некоторых - аж на 160 очков. Так по сравнению с кем у нас был завышен рейтинг? с теми, кто имел "правильный" рейтинг, а теперь вдруг оказался со смещенным?

Интуитивные, так сказать "экспертные", оценки смещения очень обманчивы. Посмотрите на таблицу смещения российских игроков. Первое, что бросается в глаза: сплошные "плюсы" в верхней части, значит "эмоционально" можно заявлять: рейтинг российских игроков завышен! Но после вычитания Динерштейна и Хёка, явно не тот у них рейтинг и об этом уже говорилось (причина в несоответствии вероятностей), оказывается нет никакого смещения! Хотя плюсов все равно остается, кажется, очень много.

Вадим, Вы уже говорили, что аномалка вниз была введена для якобы уменьшения пресловутого смещения. Но аномальный результат даже на 200 очков в масштабе всего рейтинг-листа дает только... 1/3 очка рейтинга на каждого игрока! Ради чего было обижать людей? Это же надо, чтобы каждый второй давал аномальные результаты вниз, тогда только РС почувствовала бы что-то реально... Общая картина рейтинга такова: большой дисбаланс, но нет серьезных отклонений в среднем от европейского рейтинга; в целом точность не превышает +-40 очков при достоверности не более 80%, причем далеко не для всех игроков и эта скромная точность обеспечена.

С уважением,
С.Павлов.

P.S. Изучение таблиц смещения полностью подтверждает предварительный анализ причин сползания средней части группы данов (но при этом в целом может и не быть сползания, как мы видим по таблице сдвига рейтингов ЕГФ и РГФ). Верхняя часть российского РЛ, за счет несоответствия вероятностей, получала дополнительные очки рейтинга, в результате чего рейтинг некоторых игроков забрался на заоблачные высоты. Остальная часть игроков из ведущей группы едва компенсировала общий отсос, о котором уже много сказано. Ну а 2-4 даны, естественно, понизили существенно свой рейтинг.

Кратко: если "вычесть" Динерштейна и Хёка, то на сегодня суммарный сдвиг первых 50-ти российских игроков (разница рейтингов в ЕГФ и в РГФ) составляет всего... 10 очков рейтинга, то есть 0,2 очка на игрока.


АНАЛИЗ СОСТОЯНИЯ РЕЙТИНГА В РОССИИ

В ходе дискуссии по рейтинг-системе возникло множество вопросов. На часть из них были даны ответы на форумах, все систематизировалось в ЧАВО. В данном сообщении, посвященном углубленному анализу ситуации с рейтингом в РФГ(Б), в частности, даются ответы на некоторые новые вопросы:
-- Почему учитывается аномалка вниз. Необходимо отменить аномальный результат вниз…
-- РС в том виде, как она сегодня существует, вполне устраивает всех. Это видно и по обсуждению - никто не высказывает никаких критических замечаний…
-- РС должна быть наглядной настолько, чтобы можно было в уме подсчитать изменение рейтинга, пусть даже в ущерб точности…
-- Зачем особая точность такому измерительному прибору как РС, если все равно колебания уровня игры гораздо больше, т.е. точнее не определить в принципе?

Итак, аномалка вниз? - я и не знал, что ее применяют, надо переадресовать вопрос к Е.Панюкову или президиуму РФГ. Если это так - то еще более убеждаюсь, что контроль над рейтингом должен быть в квалифицированных руках. Получается абсурд какой-то: понятие аномального результата было предложено в 1990 году как метод борьбы с понижением рейтинга основной группы игроков, когда туда врывается молодой быстро прогрессирующий, и потому имеющий существенно заниженный рейтинг, игрок. А так получается - что компенсируем, то и возвращаем… Еще несколько слов по аномалке: все знают, что можно не спать ночь, иметь другие проблемы, заболеть и т.д. - в результате спортивная форма упала эдак на 1 или больше данов и выступление на турнире провалено. Но это сиюминутный фактор, за него не надо наказывать аномалкой вниз. А вот встречали ли Вы таких, у кого с утра озарение на плюс 1 дан - да на весь турнир чтоб хватило, а потом пропало? А мы ему (ай-яй-яй) аномальный результат вверх! Вот здесь тоже несимметрия есть. Систематическая ошибка в устоявшейся и достоточно точной РС может быть только в сторону занижения рейтинга (не берем только что вошедших - у них и так будет высокий коэффициент динамичности).

На счет удовлетворительности и т.д. Вопрос очень субъективный, однако из тех обсуждений, которые все-таки прошли на форумах, я выявил достаточно много людей, которые задавали примерно один и тот же вопрос: почему вчера был 5-дан, а сегодня 3-дан? Ясно, что подавляющее число "сползших" по рейтингу не могут быть довольны, ведь они не потеряли уровень, скорее даже немного выросли - большинство, а кто если и понизился, то не настолько же. Но здесь вроде бы расхождений во мнениях нет - растущие игроки отнимают рейтинг у всех. Механизм я подробно описал в ответах на ЧАВО. Относительные рейтинги любая РС, если она базируется на правильной математической модели, будет показывать более или менее хорошо. А вот с обоснованием точности, достаточно строгим в математическом смысле - у разных моделей очень даже по-разному. Важно учитывать также, что с ростом массовости (а на это сейчас решительно настраивается руководство РФГ) эти моменты приобретут еше большее значение.

Важность математического обоснования лично у меня не вызывает ни малейших сомнений. Как бы ни говорили про интуитивное представление об относительной силе игры тех или иных игроков - все это не математика, а в основном эмоциональная и субъективная оценка. Вообще любая квалификационная система как бы состоит из двух компонентов:

-- уровень игры, мастерства, то есть то, что называется обычно классом игры; достигнутый класс, как правило, не утрачивается;

-- спортивная составляющая, зависящая от множества сиюминутных факторов и характеризующаяся большой переменчивостью - в отличие от класса игры; эта составляющая и должна максимально контролироваться рейтинг-системой (РС должна демпфировать высокочастотные колебания, но откликаться оперативно на достаточно плавные изменения уровня игры).

Так вот, класс игры виден, что называется, невооруженным глазом и ему РС не нужна. Но для объективного отбора в спортивных целях (а как это важно - не надо объяснять) должна быть не просто РС, с которой молча все (или почти все) соглашаются, может быть и опираясь на интуитивные представления об относительной силе игры. Нужна строго обоснованная (в рамках выбранной математической модели, конечно) РС, чтобы всегда можно было сказать: вот у этих игроков стабильный рейтинг, имеющий точность -25, +25 очков с достоверностью 90%, а вот у этих соответственно и достоверность не та, и интервал шире. Цифры эти не "с потолка", а соответствуют моей оценке в модели при среднем числе партий в турнирах порядка 6, как это и есть сегодня в России. Грубо оценка получается из вычисления дисперсии в схеме Бернулли (а ее мы берем в качестве базисной математической модели при обосновании РС типа Эло) и нажождения вероятности попадания в доверительный интервал. Кстати, как мне говорили, коэффициенты динамичности были увеличены в 1,5 раза примерно для средней группы данов, что соответственно увеличило дисперсию рейтинга. К тому же пересчет так и продолжают вести один раз в два месяца, а не после каждого турнира, как я настаивал еще в 1990 году. В результате доверительный интервал вырос по крайней мере до -40,+40 очков. Этот интервал всех устраивает?

Наглядность не является определяющим фактором. Большинство РС (не только в го) отличаюся полным отсутствием наглядности. Примеры: большой теннис - вообще невозможно что-либо просчитать в уме; в шахматах примерно как в го; на игровых (не го) серверах - там в большинстве своем применяются системы типа Эло, то есть типа шахматной; при объяснении ограничиваются общей схемой и формулы дают только для специалистов ( в уме не просчитать, только прикинуть, так как надо экспоненциальные выражения рассчитывать). Последний пример - игровые го-серверы. Здесь и подавно никто подробно не описывает, с точностью до конкретных формул. На некоторых серверах используют вообще итерационные алгоритмы: сервер КГС, например, очень популярный сегодня у российских игроков, благодаря наличию русской игровой комнаты с поддержкой русского интерфейса. Даже Сахабутдинов, ранее высказывавший мнение, что, мол, обсуждать особо и нечего, признал в дискуссии, что "проблема РС не так проста как кажется" - после того, как поиграл на КГС.

Кстати, а все ли читали Проект РС и ЧаВо на данном сайте? Я регулярно обновляю - последний раз на днях вставил ссылку на описание РС Эло (на английском языке). Не буду повторяться подробно, но я отмечал уже, что точность, достоверность, соответствие интуитивному представлению и т.д. - очень неравномерны сегодня по всей совокупности игроков по ряду причин. Прежде всего - из-за неравномерности участия в турнирах, неравномерности состава, однобокости "МакМагона", отсутствия форовых турниров и т.д. Дисперсия результатов (количество набранных очков) в турнирах очень устойчивая вещь - я имею ввиду схему Бернулли, а не изменение рейтингов. Я брал как-то произвольный турнир с неравномерным составом (разброс 4 дана), "круговик" без форы, и строил гистограмму набранных очков - очень точно соответствует нормальному закону, что и должно быть, если верить в математику и применимость на практике ее моделей, т.к. математика утверждает, что асимптотически схема Бернулли "сходится" в вероятностном смысле к нормальному закону: поэтому понятие аномальности правильно привязывается к дисперсии результатов конкретного игрока - наличие большего отклонения, чем среднее квадратическое отклонение в схеме Бернулли, говорит, как правило, о систематической ошибке - то есть несоответствии рейтинга (выросшему) уровню игры. Про понижение не говорим, потому что есть несимметрия - все игроки больше растут, чем понижаются, и ошибка в сторону повышения менее существенна, к тому же она быстро диспергирует; психологически же ошибка на понижение сильно угнетает (не нужны, и даже вредны аномалки вниз!).

Цикл "развития" каждого игрока имеет некоторый стандартный вид: сначала не очень быстрый рост (освоение техники, углубление понимания, набор опыта - количественный фактор), затем количество переходит в качество и начинает расти производная; когда она максимальна - можно ожидать аномальных результатов; таких ступенек может быть несколько, с промежуточной стабилизацией на каком-то уровне; постепенно рост производной прекращается, начинается снижение, колебания уровня игры около константы, а производная меняет знак в этих колебаниях; и так продолжается довольно долго (может всю жизнь), и у большинства рост прекращается (стабильный класс игры) и с возрастом производная становится отрицательной, но немного. Аномальности здесь быть не должно, поэтому и не следует понятие аномального результата применять. А вот нестабильность - чисто индивидуальный фактор, как у Альмухаметова (зря для него, аномалку вниз применили!). Для таких случаев и нужен коэффициент стабильности, который влияет на коэффициент динамичности (так правильнее их разделять - последний это множитель в формуле Эло). У нестабильного игрока коэффициент динамичности будет постоянно выше, чем у стабильных игроков. Да, точность РС для такого игрока (индивидуально, а не в среднем по РЛ) будет почти всегда ниже, т.е. не -25,+25 очков (90%), а, например, -40,+40 с доверительной вероятностью 80% (цифры индивидульны, в каждом конкретном случае можно прикинуть).

Роль РС как измерительного прибора - наиболее важна. Но точность прибора должна превосходить флуктуации измеряемой величины, по крайней мере в несколько раз. Имеются ввиду колебания уровня игры, а не сиюминутные вещи типа выспался - не выспался перед конкретной партией, что влияет прежде всего на так называемую спортивную форму. Эти то факторы все равно усреднятся. Так что за точность будем бороться, если считаем, что наши даны - устоявшееся понятие. А то можно было бы и поперечислять - времени жалко. Достаточно открыть два РЛ - за 1996 и сегодняшний, и взять разницу по всем более или менее часто выступающим дан-игрокам. С другой стороны, можно говорить о точности конкретной РС только в рамках принятой математической модели. Как уже говорилось, любая "не совсем дурная" РС выстраивает всех по ранжиру, но не для всех РС можно указать обосновано доверительный интервал и соответствующую доверительную вероятность. Например, это нельзя сделать для итерационных РС. Здесь можно бы успокоиться и на все плюнуть - как говорят, сейчас 30 очков точности есть (!?) - но лично мне это кажется сомнительным очень.

С другой стороны, есть Европа, есть Украина, есть Нихон-Киин и т.д. Есть, в конце концов, традиционная система кю-данов, основанная на форовом принципе. Все это надо увязать в одну систему, чтобы ничто ничему не противоречило, не расшатывало, не уводило в сторону. Есть ли Го-Бог или нет - нам не известно, теоретический предел уровня игры должен существовать, однако это - только теорема существования, а не конструктивное построение решения (интересное эссе на этот счет есть в докладе Ales Cieply - автора европейской РС, точнее, системы Эло с конкретизированными коэффициентами на основании статанализа европейских турниров). Мне видится здесь стройная система, все это вместе увязывающая следующим образом.

Все игроки, любители го и профессионалы, естественным образом разбиты на группы по национально-территориальной принадлежности, по степени профессионализации. Зафиксируем некоторый верхний уровень - скажем, профессионалов Японии, Китая, Кореи как некоторый эталон, "наиболее приближенных к Го-Богу". Это самый верхний уровень. Самый нижний - не так важен, пусть даже снизу нет границы. Теперь представим себе, что все остальные группы тоже более или менее выделены и в каждой группе вводится понятие "анкера". Для профессионалов это те игроки, которые имеют 9р и постоянно выступают в важнейших турнирах (можно считать им рейтинг, привязываясь, скажем, к 3000 очков для среднего 9р). Можно также вычислять для профессионалов коэффициент стабильности - нет проблем, так как это понятие универсальное. То есть, считаем анкером того игрока 9р, кототрый, во-первых, имеет КС=1, во-вторых, сыграл выше среднего числа партий по их группе. Группа анкеров - переменного состава, на каждый новый контрольный период она определяется снова. Контрольный отрезок времени, скажем, 0,5 года (обсуждаемо, зависит от количества играющихся в среднем партий). Средний рейтинг этой группы выравниваем по 3000 очков (суммарный сдвиг делится на среднее число сыгранных в этой группе партий и каждому добавляется или отнимается пропорционально числу его партий).

Теперь представим себе, что все выделенные группы как кольца в связке ключей нанизаны друг на друга. Первое кольцо - профессионалы. Далее на этом кольце - региональные любительские Го-Федерации (ЕФГ, АГА), начиная с 4д, например. Затем - национальные федерации любителей с дан-уровня, и т.д. В каждом кольце свои анкеры. Часть анкеров нижележащей группы попадает в верхнюю группу (А.Динерштейн и С.Шикшина у нас), или наоборот, пересечение из верхней группы автоматически входит в группу анкеров для нижележащей. Тогда дополнительно, кроме смещения по группе анкеров внутри группы, корректируется смещение группы анкеров по сдвигу рейтинга по сравнению с рейтингом в подгруппе, входящей в более верхнюю группу (там ведь свой рейтинг). Именно в среднем учитываются сдвиги, тогда каждая партия влияет на индивидуальный рейтинг, но в среднем игроки из верхней группы не сдвигаются в партиях с игроками из нижней группы. Это и есть привязка анкеров более низкой группы по отношению к выше расположенной. А внутри группы - для анкеров вычисляется сдвиг во внутреннем рейтинге и он учитывается для корректировки рейтинга всех остальных. В итоге строится единый рейтинг по вертикали. Горизонтальные обмены - анкеры из групп на одном уровне (нанизанные на одно кольцо) дают информацию по смещению (также выравниваем, но с меньшим коэффициентом, нежели по вышестоящим группам - 0,5). Ну и так далее - вся система балансируется как по вертикали, так и по горизонтали. Во всех турнирах все играют со своим текущим рейтингом, каждая региональная, национальная и т.д. группа обсчитывает сама свою часть рейтинга по единой методике. И не надо тогда в одно место собирать все турниры и все их там обсчитывать, да еще с запозданием на несколько месяцев.

Ну и не забываем про существенную зависимость дисперсии от уровня игры. Это значит - чем выше, тем дисперсия ниже. Рейтинг должен идти за уровнем в этом смысле тоже. Значит базовые (т.е. для стабильных игроков с КС=1) коэффициенты динамичности (они определяют дисперсию рейтинга - не уровня игры) тоже должны быть тем ниже, чем выше класс, то есть "кольцевая" группа. Соответственно, при корректировке рейтинга каждый игрок получает поправку пропорционально сыгранным партиям и с коэффициентом, пропорциональным своему коэффициенту динамичности, т.е. в итоге более низкие разряды "поправляются" больше. В такой системе отпадает необходимость в достаточно искусственном повышении рейтинга за счет призовых очков за сыгранные партии в нижних группах рейтинга (этот подход плох потому, что не учитываются индивидуальные особенности игроков: один растет за каждую партию на какое-то количество очков, а другому надо в десять раз больше партий для такого же роста наиграть).

Я понимаю, что выше изложена достаточно идеализированная схема и ее не так легко внедрить в жизнь. Но начинать с чего-то надо. Шахматисты с 70-х годов имеют единый рейтинг. Чем мы хуже? Может кто-то не заинтересован в едином рейтинге? Что касается России, то уже сейчас можно привязаться к нашим двум профессионалам, задав им средний рейтинг 2800 или 2750 для внутреннего пользования, так сказать. А там - посмотрим, как они будут на профессиональной арене смотреться.

Часто вспоминают как положительный момент старой РС - примеры аномальных повышений, очень даже оправдавших себя - наблюдаемые попадания в новое значение рейтинга были просто блестящие. Но куда смотрела РС? Ясно же, что поднимать рейтинг этим игрокам надо было раньше.

А РС смотрела на свою несовершенную, скачком возникающую, "аномальность". В новой непрерывной схеме аномальщики начнут сразу прибавлять существенно выше, чем по обычной схеме, как только выйдут за S - среднее квадратическое отклонение в схеме Бернулли (в пересчете на очки рейтинга это для 6 туров - около 12 очков при К=10, 18 очков при К=15). Раньше только при 2S, что и равно примерно 25 очкам, включалась аномальность, причем с запаздыванием - по нижней границе аномальности ведь брали, а не по принципу "максимального правдоподобия", который фактически означает расчет рейтинга как для нового входа в РС. Конкретно, в новой схеме если +15 очков рейтинга - это аномальность на 25%, то есть интерполируем между обычным повышением +15 и аномальным, скажем +115, в пропорции 3:1, получаем +40. Точнее, не +15 надо брать, а с коэффициентом динамичности, увеличенным на 25%, но это уже детали - разница в три очка всего.

Кстати, что касается динамичности новой схемы. Я проводил эксперименты "на руках". Задавал реальный график изменения силы игры с большой производной и исходя из реальных вероятностей (не по отстающему рейтингу) задавал частоты побед с воображаемыми соперниками. Получалось, что новая система за один-два турнира выводит рейтинг в границы доверительного интервала! Можно написать программку и погонять варианты с датчиком случайных чисел, но до этого руки не доходят - и так много писанины за поледние 1,5 месяца. Вот, в частности, и ответ на замечание, что новая РС вряд ли будет лучше успевать за растущими игроками.

К вопросу о времени - мол, у меня его много, наверное, поэтому и занимаюсь этой треклятой РС. Ну да ладно, просто возможность у меня сейчас была, а будет ли дальше - не знаю. Так что - ждать 2004 года, как предлагают некоторые в руководстве РФГ? Все остынет, забудется, дискуссия - псу под хвост, начинай все с начала...

По поводу молодых и не очень - кое-кем предлагается аномальность считать только до определенного возраста. РС не должна знать такие категории, должны работать только формализованные алгоритмы.

Насчет упрощений - была дискуссия на форуме (читай ЧаВо!). Нет такой проблемы. Да и вышеприведенный пример показывает - можно аномалку в новой схеме посчитать в уме. Не надо только переводить все сразу в очки рейтинга - надо сначала считать все в схеме Бернулли. Там таблица постоянная на все времена: среднее квадратическое отклонение S=1,225 для 6 туров, вычисляй, насколько попал между S и 2S - вот и все! Все быстро запомнят, тем более что 2S*К почти совпадает с привычными 25 очков. Правда, изменили сейчас К, вроде для 4д он равен 15. Вот таблица на все случаи (при небольшой разнице рейтингов как в наших турнирах по МакМагону):

N = 2, 3, ... S = 0,707; 0,866; 1,0; 1,118; 1,225; 1,323; 1,414; 1,5; 1,581 (S = 10) ... S = sqrt(Np(1-p)) ~= sqrt(N)/2; р - вероятность выигрыша в отдельной партии со средним соперником, для р вплоть до 70% sqrt(p(1-p)) достаточно близко к 0,5.

Последнее замечание. Хотя все это уже в ЧаВо было, опять скажу - очень большая неравномерность влияния всех отрицательных моментов применяемой РС по группам игроков - именно поэтому надо бы поторопиться. Как тоже уже было сказано, верхние даны практически не почувствовали влияния сползания из-за более низкой дисперсии силы игры (а рейтинг-дисперсия, которая коэффициентом динамичности определяется, для них завышена была!). Более того, этот фактор, а также отсутствие форовых турниров, растягивает самый верх - вверх, среднюю часть данов - вниз. Чем быстрее проведем реорганизацию, тем лучше - меньше будет обиженных. А потом ведь все равно всех собак повесят на разработчиков - как у нас принято... Ладно, отобьемся!


РС: ПРЕДЫСТОРИЯ И РАЗВИТИЕ

"...Раньше Украина считала по другой системе (может и Павлова). / Вася Скочко /"

Да, действительно в 1990 г. я передал А.Явичу описание алгоритма. Это были, фактически, тезисы выступления по поводу РС на 1-ом Чемпионате СССР (Ленинград, январь 1990).

После чемпионата Юра Беляев, который принимал активное участие в обсуждении деталей алгоритма, написал программу и передал ее Евгению Панюкову - так и появилась Российская РС.

Теперь кратко по существу РС.

Главная идея РС-90 заключалась именно в быстрой корректировке рейтинга молодых растущих игроков - ни в одной системе из мне известных этого не было. В европейской РС (ЕРС, принята в 1998 году, автор A.Cieply) - есть более примитивный механизм скачкообразного изменения рейтинга при смещении вверх от минимальной отметки на 200 очков. А до той поры ... сами знаете, что происходит, пока молодой игрок наберет эти 200 очков. В российской РС корректировка была оперативной и математически обоснованной. Вот только, говорят, кое-какие коэффициенты из исходного алгоритма подкрутили, не спросив у специалистов...

"...старая РС(Украины) была построена на базе шахматной РС..."

Все современные РС базируются сегодня на принципах, заложенных Эло в конце 50-х годов. Шахматная РС - первая из них. Шахматисты же первыми заметили недостатки чистой Эло-системы. Но реально в шахматах, кроме начального присвоения, ничего так и не было предложено нового. ЕРС (A.Cieply) также РС типа Эло, и даже более Эло, чем Российская РС. А недовольных любой РС всегда было, есть и будет достаточное число...

"...Когда в России (СССР) впервые был введен рейтинг?"

Весь вопрос в том, что понимать под рейтингом. Традиционная система "кю-данов" - это уже простейшая рейтинг-система. В Японии до сих пор в клубах ведут таблицы учета индивидуальной форы для каждой пары игроков. Проиграл более сильный две партии кряду - фора снижается на 1 камень. Выиграл 3 подряд - фора повышается. Кстати, несимметрия объясняется просто: одни камень форы - это не один дан, а только 0.5 дана, два камня - 1.5 дана и т.д. Значит, в традиционной схеме игрок, дающий фору (белые), имеет вероятность выигрыша несколько больше, чем 50%. Таким образом, изменение на 1 дан достигается при превышении побед над поражениями примерно на 2.5. В сегодняшних РС для этого надо получить превышение примерно +10 - +15 очков, а то и больше (без "аномальности").

Если считать рейтинг-системой конкретный алгоритм расчета числовых коэффициентов, то в СССР, по-моему, первые (шахматные) таблицы стали применяться в го в начале 80-х годов в Москве, в секции при Центральном шахматном клубе Советской армии, когда там работал Сергей Межов. А вопрос начал рассматриваться в 1977-78 гг., когда был создан Всесоюзный рейтинг-клуб и игрались межрегиональные рейтинг-партии на форе. В то же время и я начал изучать (как математик) проблемы, связанные с рейтинг-системами. По этим вопросам велась активная переписка с В.Асташкиным, Г.Ниловым, П.Игнатьевым, С.Межовым, Н.Михайловским и другими игроками и активистами го-движения. Помню, В.Асташкин передал мне голландский журнал с напечатанным в нем рейтинг-листом; там были, кажется, игроки вплоть до 70 кю! Тогда же была предложена первая "таблица вероятностей", подобная шахматной (но несколько отличавшаяся от последней).

В середине 80-х, в связи с появлением Всероссийской секции го, был введен рейтинг-коэффициент, с учетом предыдущего опыта и на основе экспертных оценок рейтинга тех игроков, которые мало участвовали во всероссийских и всесоюзных мероприятиях. РС тогда практически совпадала с шахматной РС профессора Эло.

Поскольку недостатки чисто шахматной РС стали быстро проявляться (см. ниже "О смещении рейтинга" и другие разделы), стал актуальным вопрос о пересмотре базового алгоритма пересчета рейтинга, его модификации. В конце 80-х годов к обсуждению вопросов рейтинга активно подключился Юра Беляев. И вот, во время проведения I Чемпионата СССР в 1990 году в Ленинграде, совместными усилиями автора этих строк и Ю.Беляева был представлен проект рейтинг-системы, где многие сегодня используемые механизмы стабилизации и корректировки рейтинга были изложены в общих, принципиальных чертах. Например - понятие "аномального" результата и что с ним делать, а также: о привязке РС, о разделении расчета в верхней и нижней частях рейтинг-листа, о переменных коэффициентах динамичности ("развития" - как их называет В.Ф.Корсак) и т.п. Коэффициенты РС были обоснованы статистически, на базе стат. анализа результатов российских и других турниров второй половины 80-х годов. К сожалению, не все эти идеи были сразу "включены" при практическом расчете.


О СМЕЩЕНИИ РЕЙТИНГА

"...У меня лет 5-6 назд был 5 дан, а сейчас - только 3-й.../вопрос одного из российских игроков/"
"...3 дан сьогодні - це 4-5 дан 5-7 років назад. Хотілося б почути думки з приводу цього /вопрос на Форуме УФГО/"

Сползание рейтинга игроков дан-группы, в основном 2-5 данов середины 90-х годов, объясняется несовершенным механизмом компенсации роста силы игры и плохой стабилизацией рейтинг-систем. Рассмотрим подробнее на примерах.

Почти все турниры в России проводятся по системе Мак-Магона. Вроде хорошо - встречаются, как правило, игроки с разницей рейтинга не более 1 дана. Но это в среднем турнире, со средним составом верхней группы 2-3 дан. Если играют несколько сильных игроков 5-6 дана, то остальная часть менее однородная и существенно отстает от них по рейтингу. Имея более высокий уровень стабильности, эти игроки с более высокой вероятностью, чем заложено в РС, выигрывают свои партии у "низших по званию". Поэтому, если приглядеться повнимательнее к РЛ за последние 10 лет, то мы обнаружим, что верхняя группа игроков 5-6 данов сохраняет почти стабильно "средний групповой рейтинг", а группа 3-4 данов явно провалилась за эти годы на 1-2 дана! Что, они стали хуже играть? А ведь это всегда были стабильные игроки (даже Альмухаметова можно считать в среднем "стабильным" - у него как падения, так и взлеты бывали). Что, Сахабутдинов должен давать сегодня Альмухаметову 4 камня? То есть, необходимо, для верхней части рейтинг-листа, функцию вероятности выигрыша более сильного игрока изменить, с учетом большей стабильности ("класса игры"), т.е. более низкой дисперсии силы игры (не рейтинга! рейтинг - только теоретико-вероятностная оценка уровня игры).

Другой причиной отмеченного "сползания" рейтинга является недостаточно эффективный механизм корректировки роста всех игроков (не только "аномальных"). Входя в РС, скажем, с 1000 очков рейтинга, средний игрок стабилизируется на уровне 2000 очков. Откуда он берет эти 1000 очков? - только отбирая у других, уже стабилизировавшихся ранее. (Отсюда ясно, почему надо отделять расчет рейтинга данов и кю: чтобы вход в верхнюю часть как-бы не зависел от "предистории" и эти 1000 очков не тянули верхнюю группу вниз).

Именно средняя группа 2-4 данов прежде всего и "страдает" от этого - им чаще других (опять в силу Мак-Магона!) приходится "нарываться" на быстро прогрессирующих игроков, с большим отставанием рейтинга от реальной силы игры.

Кстати, 5-6 даны, если и теряют здесь очки (опосредованно - через буфер из 3-4 данов!), то они же компенсируют их, как правило, участвуя в европейских турнирах.

Прекрасным способом стабилизации могут быть форовые турниры с максимально точной компенсацией разницы рейтингов, так как вероятность победы в партии в таком случае сводится к 50%, а вблизи этого значения все искажения в РС минимальны. В сочетании с другими методами стабилизации, такими как привязка к "анкерам", это обеспечит высокую достоверность и точность рейтинг-системы. Вот пример. Сервер WING (японский игровой сервер) является одним из самых стабильных: хотя и у них снижение происходит (по-видимому, не используется привязка), но соотношение рейтингов хорошо соблюдается. Все рейтинг-партии здесь играются исключительно на форе, строго соответствующей разнице в рейтингах (с точностью до 1 очка). Другая противоположность - китайский сервер HGS. Здесь почти не играются форовые партии (по-видимому, из-за неудачной рейтинг-системы). В результате игроки, имеющие на КГС 2-3 дан, на NNGS, IGS 1-2 дан, здесь быстро опускаются ниже 4-5 кю.

"...Когда я перебрался в Штаты - был в Украине где-то между первым и вторым даном. На первом же турнире (группа данов, форовый, 1-е место) сделал третий дан и с тех пор постоянно подтверждаю. Но тут практически нет детей! /вопрос на Форуме УФГО/"

Проблема "сползания" рейтингов характерна для всех РС, если нет эффективного механизма стабилизации и корректировки. В шахматах эта проблема была сразу же замечена (еще в 70-х годах) и были приняты меры: фактически единый рейтинг рассчитывался только для элиты (начиная с международных мастеров, кое-где с национальных мастеров), а также были введены специальные условия входа для молодых мастеров.

В РС-90 было введено понятие "аномального" результата, но этого сегодня уже недостаточно. Только при комплексном сочетании всех мер: привязки к анкерам, корректировки РС с учетом межсистемных контактов (а еще лучше - введением единого мирового рейтинга), а также корректно учитывая рост (не только явно "аномальный") уровня игры, - можно добиться высокой стабильности и достоверности рейтинга.

"...что такое анкер? /вопрос одного из любителей го/"

Понятие "анкер" ("якорь" - по английски) взято из практических РС таких игровых серверов, как NNGS. Анкер - это игрок с наиболее стабильным рейтингом на данном контрольном отрезке времени. Естественно, желательно включать в анкеры игроков из верхней части РЛ. Стабильность означает не неизменность (тот, кто не играет, попадал бы тогда в анкеры, что неразумно), а низкую дисперсию результатов в смысле схемы Бернулли (см. Описание проекта РС). Другими словами, анкер - это достаточно активный игрок, результаты которого близки к прогнозируемым. Группа анкеров позволяет отслеживать "дрейф" всей рейтинг-системы, хотя сама группа может менять свой состав.


ОБ АНОМАЛЬНОСТИ И СОГЛАСОВАННОСТИ

"...что такое аномальный результат?/начинающий игрок/"

Если предполагать, что рейтинг игрока стабилизировался, то можно достаточно точно прогнозировать его результат в любом турнире (примерно с точностью до одного очка). В этом случае существенное отклонение результата в сторону увеличения с большой вероятностью свидетельствует о серьезном отставании рейтинга игрока от его, по-видимому быстро выросшего, уровня игры. Можно написать формальный критерий выявления такой ситуации и объявлять соответствующий результат "аномальным". В предлагаемом проекте аномальность непрерывно "возникает" и возрастает с момента выхода результата за величину среднего квадратического отклонения в схеме Бернулли (Описание проекта РС). В старом проекте РС-90 (и других РС, например в Украине) возникновение аномальности происходит скачком, так что два игрока в одном и том же турнире, показав близкий результат, могут изменить свой рейтинг существенно по-разному (один попадет в "аномальные" и прибавит очков 100, например, а другому чуть чуть не хватит и он прибавит только очков 20-25). В новой системе это невозможно.

"...введено понятие аномального результата (в РС Украины и в российской РС - СП). Несколько лет использования этой системы и сравнение ее с другими привели к мысли о необходимости ее коррекции, не меняя основных принципов расчета. Величины коэффициентов развития (коэффициенты динамичности - СП) были взяты из европейской системы, так как в ней тоже имеется зависимость коэффициентов развития от исходного рейтинга, причем эта зависимость, в отличие от ступеньчатой Павловской, более плавная./В.Ф.Корсак/"

Насчет аномальности в ЕРС -- я читал доклад A.Cieply на конференции в Сеуле в 2001 году -- там именно скачком корректируется аномальный рост (когда +200 очков от некоторого фиксированного уровня). В российской РС скачкообразность корректировки -- дань некоторому упрощению. Но не забывайте -- это 1990 год! А сейчас уже 2003. Конечно, давно пора кое-что менять.

А вообще-то я поддерживаю предложение A.Cieply о введении единого -- мирового рейтинга, включая и профессионалов. Технические трудности в ХХI веке -- ерунда. Шахматисты единый рейтинг ввели практически в 70-х годах.

"...пересчет рейтинга желательно максимально упростить , пусть в ущерб гибкости , но чтобы любой игрок мог рассчитывать свой рейтинг сам.../ Илья Ветров/"

Здесь помог В.Ф.Корсак:

...Мы не видим необходимости упрощать систему. То, что имеем - это результат долгих раздумий и прошло проверку. Но для тех кто хочет сам иметь возможность проводить расчеты своего рейтинга скажу, что эти расчеты должны быть неофициальными, чтобы не вносить смуту и не ставить под сомнение компетентность специально уполномоченного органа...

...рейтинги игроков до 2000 пунктов областные федерации могут вести сами. С учетом того, что компьютеры сейчас распространены, количество людей или клубов, которые могут сами считать рейтинг, может увеличиваться..

Всегда в России предполагалось, что региональные организации сами ведут свой внутренний рейтинг. И только когда игрок выходит на межрегиональный уровень - ему требуется установить общероссийский рейтинг. В 1990 году было предложено ОТДЕЛИТЬ расчет рейтинга 1д и выше от кю-уровня. Все игроки дан-уровня рассчитывались бы только централизовано и помещались бы в Российский РЛ. Вхождение игрока во Всероссийский РЛ строго регламентировалось: он получал рейтинг только после проверки его в турнирах с игроками из РЛ. К сожалению, на практике этим пренебрегли, несмотря на все возражения.

Для региональных организаций такой подход давал бы ориентир при корректировке внутреннего рейтинга и оставлял им свободу эксперимента с рейтинг-системами. Фактически мы в Новосибирске так всегда и поступали: я рассчитывал рейтинг сам, а в РЛ России долго только я и присутствовал. При необходимости производили корректировку. Главное - чтобы региональные организации были вооружены единой методикой (и согласились ее применять!). Ведь никогда, наверное, не удастся осуществить голубую мечту: пересчитывать рейтинг на всех по всем турнирам и в одном месте.

"...А что, по-вашему, нужно делать для синхронизации различных систем, хотя бы с той же Украиной, да и с Европой? /Олег Попов/"

В каждой системе, если она замкнута (нет контактов с другими системами) выстраивается статистически правильная лестница -- ранжировка игроков по силе игры (естественно в среднем, локальные отклонения неизбежны в силу именно вероятностно-статистического характера распределений всех числовых параметров).

Для синхронизации надо правильно учитывать межсистемные контакты. Например, провели статанализ всех встреч и построили гистограммы: 1-е даны одной РС выиграли у 1-х данов другой -- 60%, и т. д.; тогда можно методами матстатистики рассчитать разницу (в среднем) рейтингов. Это только набросок схемы -- реально все может быть сложнее, например из-за существенной разницы в алгоритмах расчета рейтингов. Но если все системы согласованы, например, с форовым принципом, то проблем нет.

Насколько я помню, российские игроки выступают в Европе с рейтингом ЕГФ и он должен учитываться для согласования российской РС и ЕРС. Иностранцы в России играют со своим рейтингом, или имеют российский. При встречах российских игроков с российским рейтингом и иностранцев с иностранным рейтингом -- учет этих партий в российской РС автоматически, хотя и слабо, синхронизирует соответствующие РС.

Наиболее часто международные контакты происходят в группе сильнейших -- они регулярно выступают на крупных турнирах. Поэтому при правильном учете выступлений на международных турнирах каждая национальная РС привязывается к ЕРС.


ФОРОВЫЕ РЕЙТИНГ-ТУРНИРЫ

В одной из тем был затронут вопрос о программе жеребьевки турниров. Заодно впомнили и о рейтинг-программе (Марианна) и о системах проведения турниров. Здесь приводится почти полное изложение дискуссии по этим вопросам. Первое сообщение: 14/06/03, последнее: 19/08/03

"...Будет ли предлагаемая Вами система учитывать форовые, однодневные (малотуровые) и другие, именно любительские, соревнования? /Игорь Гришин/"

И РС-90, и новая версия рейтинг-системы одинаково хорошо приспособлены для расчета любых турниров - на равных, на форе, соответствующей разнице рейтингов или же нет - не имеет никакого значения. Алгоритм в этом смысле универсален. Просто при вводе данных указывается конкретная фора, на которой игралась та или иная партия, а в программе автоматически учитывается возможное несоответствие. Количество партий в одном турнире - тоже несущественно.

"...в чем основная идея форовых турниров, какие цели и задачи? /Игорь Гришин/"

Во-первых, форовые турниры - традиция культуры го, а о традициях нехорошо забывать.

Во-вторых, партии на форе, максимально выравнивая шансы сторон, снижают психологическое напряжение, способствуют более раскрепощенному творчеству за доской. Через изменение психологического климата в партиях - к изменению атмосферы турниров, возвращаясь постепенно к модели фестивального типа.

В-третьих, как уже отмечалось, форовые турниры стабилизируют рейтинг-систему в целом, устраняют перекосы, помогают в статистическом анализе и, как следствие, способствуют уточнению коэффициентов из алгоритма расчета рейтинга.

В-четвертых, через форовые турниры вовлекаются в активную го-деятельность новые силы, популяризируется сама игра, и т. д.

"...зачем нужны форовые турниры на всероссийском уровне? Пусть себе играют в регионах - учат начинающих..."

В конце 70-х Асташкиным был создан ВРК - "Всесоюзный Рейтинг-Клуб", в котором все высокие даны были обязаны играть межрегиональные рейтинг-партии только на форе. Цель была - согласовать региональные рейтинг-системы (дисбаланс составлял 1-2 дана, а кое-где, например в Азербайджане - и того больше).

Сегодня тоже возник дисбаланс, не совсем региональный, скорее по группам рейтинга. Причины - в некоторых ошибках, допущенных при применении, в принципе правильных, алгоритмов пересчета (были изменены параметры, сроки пересчета тоже важны, нельзя прямую лестницу всех данов и кю считать скопом - по ряду причин, прежде всего из-за неоднородности многих параметров и неравномерности участия в турнирах, их состава и т.д. - см. подробнее выше О смещении рейтинга).

Форовые турниры с максимально точной компенсацией разницы рейтингов - прекрасный способ стабилизации (вероятность сводится к 50%, а вблизи этого значения все искажения минимальны). В сочетании с другими методами стабилизации это обеспечит высокую достоверность и точность российского рейтинга.

"...Какие турниры всероссийского уровня Вы видите дополнить форовыми или сделать форовыми? /Игорь Гришин/"

Вопрос не прост. Предвижу скептическое отношение в группе ведущих игроков, заинтересованных в призах. Одна идея - совместить с игрой по интернету. Т.е. вводится что-то вроде ОКР, но с форой и через интернет. Подаются заявки от игроков дан-уровня (остальные могут участвовать без предварительной заявки, только рейтинг должен быть подтвержден региональной организацией - с учетом предполагаемого разделения расчета рейтинга данов и кю уровня). Координирующий орган определяет пары и назначает сроки. Очки зачета, призы и т.д. - все обсуждаемо. Надо заинтересовать ведущих игроков. Использовать русскую комнату на КГС. Возможны варианты. Возможны очные турниры. Пусть все любители го проявят изобретательность и инициативу!

Вариант: после того, как игроки дан-уровня наиграют по несколько партий (можно каждый месяц подводить промежуточный итог), из них формируются пары по принципу МакМагона, например. Следующий месяц (или другой период?) - все по новой. В конце года - вручение форового ОКР лучшему "дану" и лучшему "кю".

"...Весь вопрос заключается в том: как это сделать - внедрить в практику рейтинговые форовые турниры /Валерий Шикшин/";
"...Надо возрождать форофые турниры, а как их организовывать в рамках уик-енда?"
"...Если мы понимаем форовые турниры как возрождение новой волны любительского интереса к Го, то, по-моему, надо разрабатывать всю систему их проведения тоже. Тогда - масса вопросов. ... 1. система проведения /Игорь Гришин/"

Начать с планирования - с РФГ. Если в календарь будут вставлены такие турниры, с какими-то стимулами для ведущих игроков (надо всем думать), то может дело сдвинется.

На местах проще - сделайте, например, "форовый кубок" Казани:
-- предварительный отбор (любая система, МакМагон, естественно, отпадает сам собой, превращаясь в швейцарскую систему);
-- плей-офф (число участников - степень двойки: 2, 4, 8, 16 ...).

Вопрос выявления призеров. Да, в форовом турнире побеждает не сильнейший. Но в этом и привлекательность для основной массы любителей. В Саппоро в 1991 году я неоднократно участвовал в таких турнирах. Более того, в любительской среде там практически других турниров и не бывает.

Однажды в одном из клубов одновременно играло около 150 человек. Все были разбиты на группы по 4, победитель выходил в плей-офф. Турнир прошел примерно за день (без перерыва на обед; в каждом клубе есть возможность перекусить, выпить чая или кофе). Максимальное число туров - 5 или 6. Все партии игрались на форе, строго соответствующей разнице разрядов. Часы не применялись (!!).

Трое из четырех победителей оказались россиянами (выиграл Антон Затонских, у которого был тогда 3 дан). Я в плей-офф не попал, проиграв 1 партию и поделив 1-2 место в группе с 7-даном (у которого выиграл на 2-х камнях, после чего мне срочно изменили рейтинг и поставили 6 дан; это подтверждает существующее мнение, что японские любительские даны на 1-2 разряда ниже европейских). Дополнительным критерием для выхода в плей-офф являлась не личная встреча, а то, кто последним проиграл.

Вот и получился пример конкретной системы проведения. Еще один пример. В Новосибирске последнее первенство проводилось в два этапа:
-- отборочный турнир по круговой (7 туров);
-- финальная часть (плей-офф).

Так вот, первый этап был проведен всего за субботу и воскресенье, причем играли только с обеда, примерно с 14-00 до 20-21 часа, 3-4 тура в день.

С учетом этого и более раннего опыта проведения однодневных турниров с участием японцев в МКЦ "Сибирь-Хоккайдо" - именно форовых турниров - поддерживаю формулу "4+4", только обязательно использовать бёёми, хотя бы 5/20, т.е. 5 мин. на 20 ходов, без поражения при просрочке: ввести штраф в виде камней, которые не успел выставить.

Эта система беёми (для более крупных турниров - 10/20) используется давно в Японии, в России и других странах, а также на игровых серверах.

Штраф - наше изобретение. Придумал это Володя Языков лет 7-8 назад. С тех пор в Новосибирске только так и играем. Снимается куча проблем: с судейством, с отсчетом времени беёми, с осадком от поражения, когда падает флаг в абсолютно выигранной позиции и т.д. и т.п. (Особенно рекомендую для форовых турниров, где часто играют не очень искушенные в игре с часами новички - СП)

Единственное возражение - как-то, мол, искажается ход борьбы этим штрафом... Но разве не самое ужасное искажение, когда в цейтнотной горячке "ляпаются" ходы куда попало? Или делаются кикаси только ради выигрыша времени? Если разница в очках по ходу партии достаточна, то всегда можно не бояться просрочить время и заплатить за это несколькими камнями. А общее время игры не затягивается - это подтверждает весь наш многолетний опыт. За все время - ни одного конфликта, ни одного судьи!

"...А мне всегда казалось, что штраф - изобретение Инга .../А.Динерштейн/"

Дело в том, что мы, в силу своей оторванности от остального го мира, не имели понятия ни об "Инге", ни об игровых серверах. Потом - когда это все было? Да и именно в такой форме - сколько не успел выставить, столько и отдай! (Почти линейная функция от дефицита времени).

Главное же -- н и к а к и х проигрышей по времени! Затягивания туров как-то не отмечалось, с 1996 года все-таки так играем.

"...Если играют между собой 6-дан и 3-дан в наших турнирах, о чем каждый из них в это время думает?"

О чем думает 6-дан можно только догадываться, а вот 3-дан думает: "как бы доиграть до сотого хода и сдаться вовремя, чтобы "не потерять лица".

В 1977 году у меня был 1 кю. Я играл с Георгием Ивановичем Ниловым - одним из двух корифеев того времени, у которого был уже 5 дан. После ходов 35-40 у меня было, по-видимому, не просто плохо, а очень плохо. Правда, ни одной большой упавшей группы, но... Я, конечно, так плохо свою позицию не оценивал. В центре доски, потеряв бдительность, Георгий Иванович ввязывается в ко-борьбу почти на весь перевес в партии на тот момент (очков 40, как потом выяснилось), и... проигрывает. Но он все еще сохранял преимущество, однако психология в таких ситуациях не на стороне потерявшего инициативу. Одна ошибка (очков 6), другая... Партия проиграна в 21 очко. О чем тогда думал Г.И.? Незнаю. Позже я сам не раз оказывался в похожих ситуациях, проигрывая при превосходстве в рейтинге на 3-4 дана. Как правило - в результате грубой ошибки. Сначала - холодный пот как холодный душ, а потом думаешь: ну и что? жизнь на этом не кончается, каждый имеет право на ошибку.

"...Проблема в том, что для победы в форовом турнире выгодно занизить свой рейтинг... Помочь могло бы снижение ценности победы черными на большой форе. Играется швейцарка без разбивки по Мак-Магону. За победу белым цветом участник турнира получает 10 очков. За победу черным цветом 10 минус фора. За поражение - 0 очков. За ничью (в тройном ко) 5 очков. Тогда, если я хочу выиграть побольше партий, я постараюсь занизить рейтинг и брать большие форы без шансов получить приз. Если же я пытаюсь занять 1-е место, я лучше завышу свой рейтинг, чтобы мои победы были более значимыми. В целом борьба в турнире должна получиться более честной и менее предсказуемой..." /Илья Ветров/

Я думаю, любые системы проведения имеют право на существование. С точки зрения РС - формальному алгоритму все равно, какая система. Занижение или завышение начального рейтинга - вопрос чисто организационный: есть ли действующая РС, или же каждый сам себе назначает рейтинг.

Конкретно по предложенной системе проведения. Можно так проводить - похожий опыт был, например, в Новосибирске в 1977 году. Клуб образовался только осенью 1976 года и весной решили провести серьезный форовый турнир - 15 участников по круговой системе. Когда турнир шел полным ходом, было получено сообщение о проведении первых всесоюзных соревнований на звание сильнейшего игрока страны и предлагалось провести свои отборочные турниры.

Что делать? Жалко бросать турнир, проводившийся с таким "размахом", с участием японского ученого М.Миякава (1д, правда в турнире он был 1кю - по его просьбе, так как считал себя понизившимся из-за редкой игры). Решили не организовывать нового турнира, а ввести новый зачет для определения чисто спортивного результата - условные очки с учетом "компенсации за фору". Кстати, М.Миякава занял второе место, выиграв ровно 50% партий. Могли, конечно, возникнуть трения: как определить приоритет, если бы один выиграл все, но давал фору меньшую, а другой немного отстал по победам, но за счет компенсации вырвался вперед. В том турнире все обошлось, т.к. занявший первое место получал фору только от Миякавы, выиграв все 100% партий, хотя и давал остальным фору - вот пример быстро прогрессирующего игрока, когда его (автора этих строк :) 3 кю существенно отстал от реального уровня игры.

"...Линейность форы (разница в разряд - камень) штука обманчивая. ...линейная фора дает нелинейное распределение на большом интервале... Два камня это 15 очков. Три камня - около тридцати. Шесть - это уже 90"./Сахабутдинов Р./

Еще в РС-90 предлагалось учитывать нелинейность форы: кажется, в книге "Стратегические концепции" указывается, что для выравнивания шансов при 9-ти камнях для профессионалов одного уровня нужно давать компенсацию 140 очков. При 6,5 очка коми сегодня получается такая шкала (привожу сразу интерполяционную формулу для произвольной форы):

Коми = 7 (2 n + 1/24 n (n-1) - 1),

где Коми - это компенсация в очках при игре равных по силе соперников. Данная интерполяция получается из упомянутого факта о 140 очках коми при форе 9. В табличной форме это будет выглядеть так:

  1 2 3 4 5 6 7 8 9 число камней форы
дан 0,5 1,5 2,5 3,5 4,5 5,5 6,5 7,5 8,5 разница по линейной шкале
очки: 7 22 37 53 69 86 103 121 140 реальный эквивалент

Из этой интерполяции видно, что 6 камней равны 86 очкам, что близко к 90. Для дальнейших уточнений нужны партии на форе и в большом количестве, а их нет.

"...Я не думаю, что имеет смысл возвращаться к форовым турнирам. Что же касается начинающих - уровень слабее 15 кю, или, скажем слабее 20 кю на серверах, то там практически любая система будет одинаково работать, или не работать.../Сахабутдинов Р./"

Я всегда знал, что форовые турниры не привлекают игроков из верхней части рейтинг-листа. А ведь кому как не гроссмейстерам России поддерживать форовые турниры на российском уровне...

"...Тогда - прямой вопрос. Кто и каким образом будет возрождать форовые турниры? /Игорь Гришин/"

Никто, никакой директор не сделает привлекательным для большинства организацию форовых турниров и участие в них, если мы все не захотим их проводить.

Надо разъяснять, убеждать и т.д., что форовые турниры нужны. Ну и, конечно, предлагать схемы их проведения. Одна интересная схема была изложена в ходе дискуссии по РС и форовым турнирам. Зачетные очки определяются с учетом форы: "10 - фора" за победу, например, для получающего фору.

Другой вариант: проведение форового кубка России, где в зачет идут три лучших результата из всех форовых турниров за год (в отличие от ОКР здесь именно так - чтобы до конца года у каждого была надежда улучшить результат). Ранг форовых турниров определяется в конце года по участию в них тех, кто показал за весь период наилучшие результаты. В соответствии с рангом повышается или понижается вес соответствующего турнира. Детали можно обсуждать, но схема мне кажется интересной. Можно учитывать суммарную фору, которую давали игроки. Зачет отдельно среди "дающих фору", и среди "получающих".

Можно учесть и спортивный фактор. Скажем, выделять места в финале первенства России для призеров, при условии соблюдения квалификационного ограничения, например 4 д (победа в форовых соревнованиях достается чаще прогрессирующим игрокам - вот стимул молодым).

Вопрос со спонсорством - он всеобщий и не зависит от вида турнира. Скорее даже форовый турнир более привлекателен, так как результат менее предсказуем.

"...Я как-то предлагала написать программу жеребьёвки. Давно, года 3 назад или около того. Мне сказали, что имеющаяся программа нормально работает, главное настройки правильно указать. Ну, не надо и не надо. Сама я жеребьёвку не делаю, поэтому не могу судить о достоинствах и недостатках нынешней программы. Но кажется, мне говорили, что в Европе все ей пользуются? А результаты до 12 лет действительно странные...(речь о детском турнире на LG - СП) Если же делать сейчас российскую программу, то надо её интегрировать с РС. Чтобы программа турнирная брала данные о игроках из рейтинг-листа, и потом выдавала какой-то файл, который сразу можно дать рейтинг-программе для пересчёта /Марианна/"

Марианна права в том, что программа жеребьевки (или точнее - программа по обеспечению проведения турниров) должна быть интегрирована с рейтинг-программой. Такой план сейчас и намечено реализовать (может, Юра Беляев напишет общую программу, но помощь от кого бы то ни было не возбраняется). Что касается достоинств и недостатков используемой программы, то еще в 1990 году первые проблемы возникли при проведении чемпионата СССР. Во-первых, программа "отказалась" рассчитывать турнир на равных и не по Мак-Магону, да еще в 11 туров. Пришлось всем поставить 1кю, а последний тур проводить при ручной жеребьевке. А претензии по жеребьевке есть практически на каждом турнире. Вот и на LG я неоднократно слышал о "дурдоме" с жеребьевкой.

Теперь непосредственно по заявленной теме.

Однобокость "Мак-Магона" всем известна. Надо бы разнообразить системы проведения турниров, но есть какая-то работающая программа и все под нее подстраиваются, мне так кажется. Будет хорошая универсальная программа, да еще сразу же с расчетом нового рейтига - никто не откажется от удовольствия попробовать разнообразить турнирное го-меню.

Сама система "Мак-Магона" (ММ) была придумана как