Косяки

Вроде бы все знают об этом и в то же время мало говорят. Фактически уже закончился онлайн турнир, и самое время подвести итоги. Вот целый список весьма существенных недочетов.

  1. Неравномерная этапность. Если в первом туре за 10 ханчанов выходило 25% участников, то во втором уже всего за 4 ханчана отсеивались 25%. В четверть- и полуфиналах же за 3 ханчана отсеивались по 50%.
  2. Идея отсеять слабых игроков в начале, чтобы дальше было всё равно, как играть, казалась хорошей, однако она не сработала — в финал прошел Kat666, который имеет для 2го дана крайне низкий рейтинг в 1379 пунктов.
  3. Рандом в рассадке игроков. За весь путь к финалу лично я сыграл 20 ханчанов. Но ни разу не играл с Kat666 или с ~Shadow~, которые тоже в финале! Зато играл по 7 раз с Kinuki, IIPU3PAK и Masyanya! При этом с первыми двумя в 1/8 финала и в ½, а с последней в ½ и в ¼.
  4. Мое среднее место в четверть-финале: 2,(6) — за два ханчана я не собрал ни одной руки! Среднее профессионала российской лиги Ильи Монакова, игравшего за соседним столом: 2,(3) — я прошел в полуфинал, а он нет. Justice!
  5. Разброс по рейтингу игроков за одним столом доходил до абсурдного: 2000 пунктов у InDa228 против менее чем 1400 у Kat666. При этом Kat666 в финале, а InDa228 — Константин Ермаков, еще один профессионал Лиги — нет.
  6. Ощущение затянутости при общей несбалансированности. Турнир длится почти целый месяц, отнимает выходные дни... а ради чего? В худшем раскладе средний рейтинг финального стола всё равно мог быть ниже 1500 пунктов! Ради такого финала было бы глупо тратить на турнир больше дня.

Разумеется, я написал об этом не чтобы кого-то обидеть или раскритиковать Юрия Синенко — главного организатора. Напротив, я рад что хоть такой турнир всё же у нас состоялся и очень ценю старания Юрия. Но вопрос о том, как мы будем бороться в будущем с обозначенным проблемами, стоит как никогда актуально...

Косяки: 15 комментариев

  1. Мне кажется, теперь когда есть лига все становится легче. Если турниры проводить под ее эгидой, то она может сеять игроков по своим правилам: основываясь на рейтингах, данах, статусе профессионала и т.д.

  2. Это очень спорно. Может быть профессионалы Лиги и могут оценить тех, чью игру они видели, но во-первых, эти оценки всё равно субъективны, во-вторы, непонятно как быть с теми, чью игру про не видел. Однако я Юре уже предлагал сделать ранжирование на три группы: пуро, игроки со слитым рейтом и среднячки. Всех, кто не идентифицируется однозначно причислять к среднечкам. Такой подход позволит нормировать столы по силе и даже не дистанции в 4-5 ханчанов отсеиваться будут чаще слабые игроки. Проблема в «чаще». Юра пока видит отсев на каждом этапе в 50% для будущего турнира, я же считаю, что отсев на каждом этапе должны быть не более 25-30%, однако при числе участников за 100, такой турнир рискует затянуться на пару месяцев, что не всем интересно. Однозначно простого решение, боюсь, тут нет.

  3. Тут как раз суть в том, что у Лиги авторитет потенциально выше, чем у любого человека. Соответственно в спорных моментах ее решения станут более легитимными.

  4. А профессионалы лиги должны придумать, в таком случае, набор формальных правил для оценки уровня игроков. Можно же оценивать не только по рейтингу на тенхо, учитывать и другие сервера

  5. Насчет разницы в рейтинге. Не знаю существует ли общепринятая система расчета вероятности выигрыша в зависимости от разницы рейтингов, но я сделал несколько прикидок исходя из условия что процент выигрышей должен быть таким, чтобы рейтинг не ухудшался.

    Взял случай когда рейтинг игрока превышает рейтинг стола на 600 пунктов, и посчитал несколько моделей:

    1. Варьируется процент первых мест игрока, а остальные три места распределяются равномерно.

    Выигрывать должен 62.5% игр

    2. Варьируется процент первых и вторых мест (допустим их число одинаково), а остальные 2 места распределяются равномерно.

    Выигрывать (1+2) должен 87.5% игр

    3. Как кажется наиболее приближенный к реальности (???). Вероятность победы експоненциально зависит от места, чем ближе к первому тем больше вероятность.

    Итог по местам: 52.5% 26.8% 13.7% 7%

    Так на всякий случай, 3-й вариант для случая разницы со столом 100 баллов

    28,9% 26,1% 23,6% 21,4%

    Так что или ретинги не очень соответствуют уровню игры, тот же Kat666 мог его слить учась играть или еще как, и реально он выше. Ну или выпал «тот самый шанс»

  6. Если честно, я не понял ни что посчитано, ни как это было сделано :) На всякий случай напомню, что рейтинг на тенхе зависит от занятого места, среднего рейтинга стола и количества сыгранных игр. Впрочем, это и не нужно считать. Есть сопоставление данов и рейта, например, средний рейт для 2го дана ~1650 пунктов (для остальных можно посмотреть вот здесь: tenhou.net/ranking.html) У Кат666 рейт ниже 1400 пунктов, а это значит, что даже самые младшие кю в среднем на дистанции играют лучше. К сожалению, arcturus.su/tenhou/ranking сейчас не работает, иначе можно было бы еще оценить места занятые в сыгранных играх. Самый простой способ — поделить список на две половины и посчитать среднее место в первой и во второй. Если роста среднего не произошло, значит и уровень игрока тоже не вырос, что и отражает рейт, не смотря на все полученные даны.

  7. Как считается рейтинг на тенхе я естесвенно знаю. Иначе бы не стал ничего считать :)

    В «вакууме» рейтинг отражает силу игрока. Ну т.е. если взять теоретического игрока с неизменным уровнем игры, то при достаточно большой выборке его рейтинг будет точно соответствовать силе его игры.

    Рейтинг, по сути, отражает расчетное распределение мест в зависимости от рейтинга (т.е. силы) других игроков.

    И если в шахматах, нардах и других играх где играют один на один, подобные рейтинги определяют вероятность победы или поражения. В маджонге все сложнее.

    Во первых средний рейтинг стола это очень условная вещь, например оппоненты с рейтингом 1400 1400 2000, средний 1600 игрок с рейтингом 1500, по статистике чаще всего будет занимать 2-е место. А играя против трех игроков с рейтингом 1600 (средний тоже 1600 :) ), чаще всего последнее, потому как все трое сильнее его на 100 пунктов.

    Кроме всего прочего. Не понятно какую выбрать функцию для задания распределения мест. Ну например в шахматах она очень проста: если вероятность выигрыша первого игрока p, то второго 1-p. В маджонге же p1, p2, p3 и 1- (p1+p2+p3). Соответственно я попробовал просчитать несколько моделей изменения этого распределения, так чтобы вероятности зависели от одного параметра, который и вычислял в зависимости от разницы в рейтинге игрока и стола.

    Но посыл, то в другом: с большой долей достоверности рейтинг Кат666 не соответствует его силе. Это с точки зрения математики не вдаваясь в подробности игры. Никто естественно не отменяет удачу, кто-то и в лотерею выигрывает.

    Кстати, возможно любопытное отступление. Нарды давно полностью просчитаны компьютером. И боты заведомо сильнее любого человека. Так вот, в онлайне, чтобы защитить клиентов от мошенников играющих с помощью ботов, партии в которых слабый игрок вдруг выигрывает у сильного автоматом анализируются. И если слабый игрок вдруг играл без ошибок (ну или почти без ошибок) — ситуация разбирается людьми.

    Если человек изначально стабильно играет на мировом уровне, с ним связываются, предлагают оплатить поездку на турнир. Если человек начинает юлить и отказываться, то тоже могут обвинить в мошенничестве.

    Я к тому, что может за этим ником скрывается кто-то другой. Тут уже эксперты могут просмотреть его партии в турнире и последние партии до того. И понять, он просто стал сильнее играть последнее время, он резко стал сильнее играть на турнире, или ему просто проперло несколько ханчанов — он делал кучу ошибок но удача была сильнее.

  8. Да, теперь примерно понял о чем речь. Но в риичи рейтинг определяет вероятность победы не в ханчане, а на дистанции и даже чтобы получить рейтинг ниже 1400 придется играть долго, если не поддаваться, конечно. Отдельные ханчаны в маджонге отличаются от шахмат. Если в шахматах один игрок всё время грубо ошибается он гарантированно проиграет (при условии, что его противник не допускает серьезных ошибок в игре), в риичи если один игрок всё время грубо ошибается, он всё равно может выиграть (даже если его противники также не ошибаются). Вот пример:

    tenhou.net/0/?log=2013012...c8dd45&tw=3&ts=0

    Третий ход — сброс 1 ман из формы 13, при наличии в руке изолированной 8 соу (и двух вышедших 9 пин) — грубейшая ошибка сбора руки.

    Следующий ход — снос 9ки соу при том, что получение 8 соу давало рянмен и чи с потенциалом на иццу, а 3ка ман при получении 2 ман давала фуритен из-за предыдущего сноса — еще одна грубая ошибка сбора руки.

    Вторая сдача также начинается с серьезной технической ошибки — при раннем объявлении слева (в худшем случае — чиницу с ака-дорой — ханеман) и наличии в руке 9 разных терминалов и достоинств вместо объявления пересдачи, принимается решение собирать кокуши.

    Вероятность сбора кокуши: 0.035%, вероятность чиницу: 1.285% Считаем матожидание: 32000 * 0.035 = 1120 против 8000 * 1.285 = 10280. То есть на дистанции мы проигрываем даже одному камича, если он собирает чиницу (основания полагать это у нас есть).

    PS

    Вероятности сбора яку в разных лобби, можно посмотреть здесь: tenhou.net/sc/prof.html

  9. Вероятность победы в ханчане никак не отличается от вероятности победы на дистанции. Если игрок выигрывает 350 ханчанов из 1000, то и выиграть один ханчан в тех же условиях у него вероятность 35%. Естественно в шахматах от мастерства зависит гораздо больше чем от везения. Но доля случайности есть, иначе не играли бы матчи по много партий, хватало бы одной.

    Ну если человеку везло, что же бывает. В первой сдаче да согласен совсем не оптимально и с ошибками сыграно.

    Во второй... Ну понятное дело, что пересдача математически выгоднее. Но тут еще и некий кураж — собрать кокуши в турнире заманчиво :) И еще, вероятность сбора кокуши 0.035 это же не из той руки, что у него была, а в неком усреднении — сколько вообще собирается, как и чиницу кстати. Чтобы начать защищаться против чиницу надо сообразить, что открылся сильный игрок и это не просто якухай или хоницу или может какое саншоку. Учитывая, что игрок впереди и может просто хочет побыстрее закончить. Я только учусь нормально играть, потому не готов спорить про игру, но пока судя по себе, без второго открытия в масти не начинаю ожидать сразу дорогой одноцвет. Возможно имея больший опыт, зная пристрастия игрока к одноцветам и нелюбовь к ранним открытиям, такое и можно предположить...

    Но это все лирика. Реально ты и/или другие сильные игроки могут просмотреть игры и экспертно оценить уровень игры по сравнению с другими и решить это только везение или нет.

    Еще, к слову одно отступление: первые турниры по покеру игрались по иной схеме чем сейчас. Тогда собирались десять лучших игроков, играли что-то типа марафона на сутки и потом голосованием выбирали победителя. Но никто не оценивает хоккей или футбол с помощью жури как фигурное катание, посчитали количество голов и все, пофигу, что выиграла слабейшая команда которой один раз повезло забить.

    Опять же количество ханчанов требуемых для определения победителя с нужной достоверностью в теории можно рассчитать математически. Но для этого надо много статистики, хорошая модель и время. Притом и так понятно, чем ближе рейтинг игроков друг к другу, тем больше нужно игр. Поэтому всегда придется выбирать компромисные решения.

  10. >Вероятность победы в ханчане никак не отличается от вероятности победы на дистанции.

    Далее идет верная поправка: «в тех же условиях», однако в реальности это никогда не выполняется, если мы, конечно, не играем одним составом стола с одинаковой рассадкой. И именно в разных соперниках и кроется проблема. Если хороший игрок играет с 3-мя другими хорошими игроками и его вероятность занять первое место 28%, то когда он сядет играть с 3-мя очень плохими игроками (рандомные каны, бесполезные открытия и т.п.), то его вероятность занять первое место будет не выше, а ниже! И тем ниже, чем хуже играют его противники (потому что выше вероятность, что случайно выиграет хотя бы один из них). Впрочем, даже если играют 4-ро абсолютно равных по силе игроков, мы не увидим у каждого среднего места 2,5 ни на одном дискретном отрезке дистанции — только на бесконечной дистанции среднее будет стремиться к 2,5. Но какое дело людям до бесконечности? Они оценивают игроков по среднему месту на определенной дистанции! Это вторая проблема. Максимум чего можно добиться в риичи-маджонге свести первую проблему ко второй, ограничив доступ сильных игроков в слабые лобби и слабых игроков в сильные лобби, что и сделано на тенхочке (игрок с рейтом ниже 1800 — никогда не пройдет дальше первого данового лобби).

    >количество ханчанов требуемых для определения победителя с нужной достоверностью в теории можно рассчитать математически.

    Только в сухой теории. На практике даже если равные игроки с равным рейтингом начнут играть, то уже после первого ханчана их рейтинги поменяются, чего, очевидно, не должно происходить, т.к. игроки по определению равные. Снова выровнять их рейтинги в реальности окажется, скорее всего, невозможно — для этого придется играть неопределенно долгую серию игры, которая может быть и бесконечной в худшем случае.

    Сама механика маджонга не позволяет достоверно определять силу игроков. Однако чем больше разница в рейтинге (двух игроков или игрока от среднего рейтинга группы) — тем дальше по силе игрок отстоит от другого или группы и тем более вероятно, что это действительно так, чем больше игр им и его противниками сыграно. Собственно, для этого изначально и был придуман рейтинг и утверждать, что рейтинг игрока может не соответствовать его реальной силе как-то странно, если это не какой-то специфический частный случай.

  11. Р2, по поводу второй сдачи из того реплея, кюсюкюхай же можно объявить только на непрерванном первом круге, так что у него даже кнопка не появилась, не о чем и думать было.

  12. Угу, я затупил что-то. Но даже в этом случае кокуши не были идеальным решением же: в руке рянмен с акой и хороший потенциал на сбор якухая.

  13. У тебя местами превратное представление о теории вероятности. Для вероятности нет разницы одно действие совершается или бесконечное количество повторяющихся действий. Поправка «в тех же условиях» нужна только для того чтобы получить равные условия. Для каждого отдельного ханчана существует конкретная вероятность выигрыша, так и занятия прочих мест. Рассчитать ее точно теоретически естественно не возможно. Но она есть и вполне конкретная. Получить ее статистически можно только сыграв бесконечное количество ханчанов в тех же условиях, для того и указана поправка.

    >Если хороший игрок играет с 3-мя другими хорошими игроками и его вероятность занять первое место 28%, то когда он сядет играть с 3-мя очень плохими игроками (рандомные каны, бесполезные открытия и т.п.), то его вероятность занять первое место будет не выше, а ниже!

    Извини тут ты скорее не прав. Во втором случае будет больше дисперсия, но вероятность выигрыша должна даже увеличится. Тут накладываются два фактора: рандомныме действия приближают вероятность распределения мест к 0.25 0.25 0.25 0.25, превращая маджонг в подбрасывание монетки, но все-таки хороший игрок собирает руки более оптимально следовательно, выигрывает раздачи чаще и чаще получает прибыль с левых канов, плюс лучше защищается.

    > Впрочем, даже если играют 4-ро абсолютно равных по силе игроков, мы не увидим у каждого среднего места 2,5 ни на одном дискретном отрезке дистанции — только на бесконечной дистанции среднее будет стремиться к 2,5

    Тут опять ты смешиваешь реальные вещи, статистику и теорию вероятности. Расчетное среднее место у них будет 2.5, статистически при длительной игре место каждого тоже приблизится к 2.5. Ну а реально за несколько ханчанов может быть, что угодно.

    Это как с подбрасыванием монетки. Все знают вероятность выпадения решки 0.5. Но если подбрасывать монетку нечетное количество раз, например три мы никогда не получим «ожидаемого» среднего результата. Но это не отменяет, того что вероятность выпадения решки 0.5.

    Ну и опять же есть теория вероятности. В ней есть механизм оценки достоверности.

    Ну условно: с достоверностью 95% за 10 ханчанов 35% из них выиграет игрок A, 30% игрок B, 20% и 15% остальные. При этом повышения уровня достоверности в разы увеличивает требуемую выборку.

    >Собственно, для этого изначально и был придуман рейтинг и утверждать, что рейтинг игрока может не соответствовать его реальной силе как-то странно, если это не какой-то специфический частный случай.

    Рейтинг игрока обычно соответствует его силе, никто не спорит. Но бывают специфические случаи, то что сходу пришло в голову:

    1. Игрок учился играть на тенхо, а потом ушел на другой сервер, где усилился в игре. Рейтинг на техно не соответствует его текущему уровню, если он поиграет там какое-то время, то естественно рейтинг подтянется.

    2. Играет вообще другой игрок каким-то образом получивший логин, причины не важны

    3. Возможно существуют какие-то механизмы манипуляции рейтингом, непонятно зачем но возможно. Тупо проиграть десяток игр слабым игрокам.

    Своими выкладками я как раз и пытался просчитать ситуацию соответствия силы и рейтинга

  14. >рандомныме действия приближают вероятность распределения мест к 0.25 0.25 0.25 0.25

    Именно так. Но за счет этого и повышаются шансы трех слабых игроков, а значит наши шансы на победу уменьшаются. Более того, за такими столами опытному игроку приходится менять манеру своей игры. Классическая ситуация — объявление риичи. Если у хороших игроков оно всегда обосновано, то у слабых игроков это случайное действие, вплоть до фуритен риичи с ожиданием в дырку. Против таких риичи не существует эффективной стратегии защиты (когда гембуцу закончатся все тайлы становятся почти одинаково опасными), а значит значительная часть навыков опытного игрока становится бесполезна, что уже снижает его шансы.

    >хороший игрок собирает руки более оптимально

    Это тоже ему не поможет при игре против трех абсолютных рандомаек. Дело в том, что оптимальность сбора рук основана не столько на формах в руке, сколько на выходах тайлов в дискарды и действиях других игроков. Но если дискарды и действия противников почти случайны (или непонятны нам, что одно и то же в данном случае), то опытной игрок в значительной степени опять же лишается своих преимуществ.

    Теперь нужно вспомнить, что мы играем не против каждого из троих игроков в отдельности, но против их совокупных действий. То есть лишены возможности влиять на их набрасывания друг другу. Да, нам они тоже набрасывают, но их трое, а мы одни.

    Конечно, я согласен, что на дистанции опытный игрок всё равно будет чаще в плюсе и победит. Однако с плохими соперниками хороший игрок покажет худший результат, чем с хорошими, как в отдельном ханчане, так и на дистанции. Кроме того, за счет более высокой дисперсии, для победы (выхода в плюс) потребуется гораздо большая дистанция, чем при нормальной игре.

    В итоге, если у игрока 28% первых мест, мы не можем утверждать, что его шансы на победу в произвольном ханчане равны 28%. Эта цифра достоверна только для «нормальных условий», если же приходится играть с гораздо более сильными или слабыми соперниками, достоверность резко падает.

    И если мы играем вне «нормальных условий», логично, что наш рейтинг не будет соответствовать нашей силе игры. Замечу также, что с точки зрения рейтинга выгодно как раз играть с соперниками лишь немного превосходящими нас, чтобы иметь оптимальное соотношение шансов на победу и изменения рейтинга.

  15. Ну да я поприкидывал. Даже сварганил небольшую модельку чтобы посмотреть, в ней конечно куча допусков. Но выходит, что если слабые игроки начинают «валять дурака» то результаты начинают чуть выравниваться.

    Если у игрока некий процент первых мест это ничего не значит, кроме того что у него такой процент в среднем. Но на основании его рейтинга и среднего по столу можно посчитать какой процент побед он должен одерживать в этих условиях, чтобы поддерживать этот рейтинг. Собственно, если считать, что рейтинг соответствует силе, то получится просто вероятность победы. Естественно погрешность получается достаточно приличной. Кроме того, система рейтинга, используемая на тенхо, имеет большую дисперсионность и игроки с одинаковой силой в конкретный момент времени легко могут иметь 100 очков разницы в рейтинге.

Добавить комментарий