Теория игр

Сообщение №4426 от vsergeui 08 августа 2002 г. 17:19
Тема: Теория игр

Прошу прощение, если это офф-топик, не могу сразу сообразить куда чего. Я новичок и мне интересна теория игр. Не подскажите что лучше почитать и есть ли какая-то литература по моделированию коалиционных экономических игр/олигополии? Заранее спасибо.


Отклики на это сообщение:

> Прошу прощение, если это офф-топик, не могу сразу сообразить куда чего. Я новичок и мне интересна теория игр. Не подскажите что лучше почитать и есть ли какая-то литература по моделированию коалиционных экономических игр/олигополии? Заранее спасибо.

http://www.gametheory.net/html/lectures_t.html


Ты наверно " Игры разума" насмотрелся. Если интересно то берешь и идешь в ближайшую библиотеку.


> Ты наверно " Игры разума" насмотрелся. Если интересно то берешь и идешь в ближайшую библиотеку.

Смешно... Нет, просто я изучал ее, вместе с теорией Неша в техническом приложении в универе, сейчас хочу немного посмотреть ою экономико-сойиальном приложениии


> ...я изучал ее, вместе с теорией Неша в техническом приложении в универе, сейчас хочу немного посмотреть ою экономико-сойиальном приложениии

У меня есть некие сомнения, что специалисты понимают, о чем говорят, когда употребляют слово «стратегия» (а употребляют они его весьма часто).

Возьмем, к примеру, нормальную форму игры. Скажем, такой простой случай, как дилемма подозреваемых. Напоминаю: это когда есть два подозреваемых соучастника по одному делу и у каждого из есть возможность выбора из двух вариантов - расколоться или отпираться. Если оба раскололись - плохо обоим. Если оба отпираются - обоим хорошо. Но если раскололся только один, то расколовшемуся лучше всего, а отпиравшемуся - хуже всего. Естественно, ход одновременный, т.е. результаты становятся известны только после того, как ходы сделаны.

В такой постановке стратегией называются именно варианты выбора {«расколоться»,«отпираться»}. (Сошлюсь хотя бы на лекции М.Мёбиуса, прочитанные в прошедшем учебном году в Гарварде.) В этой постановке игра имеет уникальное строгое равновесие по Нэшу - оба должны расколоться.

Но есть и более продвинутая постановка: если игра повторяется многократно, после каждого повторения предыдущие ходы становятся известны обоим игрокам, а окончательные результаты получаются усреднением по всем повторениям. В этом случае игрок имеет возможность оценивать поведение своего сотоварища и как-то реагировать на него. Такая постановка моделирует затяжной процесс, в ходе которого подозреваемые могут раскалываться не сразу, а по отдельным мелким пунктам. В экспериментах Аксельрода, на которые ссылаются те же лекции Мёбиуса, было выявлено, что игроки склонны к стратегии «око за око»: это когда они отпираются до тех пор, пока не расколется сотоварищ, в случае же раскола сотоварища следует однократный раскол на следующем шаге («в наказание»). Было и теоретически показано, что эта стратегия является эффективной: она выгодна обоим игрокам (в результате они почти всегда дружно отпираются) и устойчива к «изменам» сотоварища.

Вы заметили, что в этой постановке под стратегией понимается нечто совершенно иное? На первый взгляд разницы нет никакой: есть множество возможных алгоритмов выбора ходов в повторяющейся игре в зависимости от предшествующих ходов, это множество мы и считаем множеством возможных стратегий. Остается только выбрать оптимальный (скажем, в смысле Нэша или, скажем, в смысле минимакса) алгоритм. Если бы выбор хода определялся только предыдущими ходами, это бы так и было: мы бы имели конечное (хотя и очень большое) множество стратегий и нормальное табличное представление игры. Но он может определяться и какими-то другими обстоятельствами, например, знанием о том, что сотоварищ вменяем и в состоянии понять, скажем, что против него систематически применяется стратегия «око за око», а не просто случайные «измены». Если такое понимание не подразумевается, очевидно, что стратегия «око за око» не будет оптимальной ни в каком смысле.

Так что же такое стратегия? Включает ли она в общем случае элементы знаний о стратегиях противников? Но если это так, то мы получаем тавтологию: стратегия определяется через стратегию.


> Так что же такое стратегия? Включает ли она в общем случае элементы знаний о стратегиях противников? Но если это так, то мы получаем тавтологию: стратегия определяется через стратегию.

Чистая стратегия, в любом случае (как нормальной, так и развернутой игры) - это отображение из множества информации доступной игроку в множество действий игрока. Соответственно, смешанная стратегия - случайная величина в пространстве действий с вероятностной мерой индуцированной таковой на информационном пространстве.

Очевидно, что в случае развернутой игры никакой тавтологии нет - стратегия это всего лишь отображение из множества информации доступной к определенному моменту времени в множество действий доступных в этот же момент времени. Примерно так же определяыется адаптированный случаайный процесс (в дискретном времени) - сножество случайных величин, проиндексированных "временем" T, измеримых относительно элемента фильтрации "до" T.

Думаю, что любые лекции по теории игр не для дошкольников (=экономистов нематематиков) должны содержать эти определения.


> Соответственно, смешанная стратегия - случайная величина ...........

Поздравляю.


> > Соответственно, смешанная стратегия - случайная величина ...........

> Поздравляю.

google.com:

"mixed strategy" - 9,870 hits
"random element" probability theory - 2,980 hits


Я понимаю, что стратегию можно определить не тавтологично. И это в любом нормальном курсе делается (например, в том же курсе Мёбиуса, на который я ссылался; это - курс не для дошкольников, а для студентов Гарварда). Проблема в том, что для различных частных случаев даются разные определения. Таким образом определяют рамки задачи (что в этих рамках можно рассматривать как стратегию, а что нельзя), общее же представление о том, что такое игровая стратегия, остается неопределенным.

> Чистая стратегия, в любом случае (как нормальной, так и развернутой игры) - это отображение из множества информации доступной игроку в множество действий игрока.

Да, естественность этого определения интуитивно очевидна. А теперь давайте зададимся вопросом: «В множество информации, доступной игроку, в общем случае может ли входить информация о возможных стратегиях противников?». Не о возможных действиях на каждом шаге, и не о свершившихся действиях на предыдущих шагах, а именно о возможных стратегиях. Ведь это не одно и то же: из анализа предыдущих ходов в повторяющейся игре «дилемма подозреваемых» формально никак нельзя сделать вывод, использует ли противник алгоритм «око за око» или, может быть, он использует какой-то другой алгоритм, а алгоритм «око за око» он вообще не рассматривает в качестве варианта.

Рассмотрите такой алгоритм: первые сто ходов ходить по правилам «око за око», а потом начать постоянно раскалываться. Как мы отличим такой алгоритм? Очевидно, первые сто ходов - никак. А имеет ли смысл учитывать его как одну из возможностей при анализе игры? Имеем ли мы право включать в информацию, доступную игроку, знание о возможности выбора противником такого алгоритма?

> Соответственно, смешанная стратегия - случайная величина в пространстве действий с вероятностной мерой индуцированной таковой на информационном пространстве.

Переход от чистых к смешанным стратегиям не вызывает вопросов.

> Очевидно, что в случае развернутой игры никакой тавтологии нет - стратегия это всего лишь отображение из множества информации доступной к определенному моменту времени в множество действий доступных в этот же момент времени.

Если по определению положить, что информация, доступная к определенному моменту, органичивается только знанием
1) предыдущих действий и
2) множеством вариантов последующих действий,
то никаких вопросов не возникает.
Но ведь это не обязательно так! В общем случае эта информация может включать некие предположения о способах выбора противниками последующих действий из множества доступных вариантов.



> Если по определению положить, что информация, доступная к определенному моменту, органичивается только знанием
> 1) предыдущих действий и
> 2) множеством вариантов последующих действий,
> то никаких вопросов не возникает.
> Но ведь это не обязательно так! В общем случае эта информация может включать некие предположения о способах выбора противниками последующих действий из множества доступных вариантов.

Каая разница, что эта информация "содержит"? Определение понятия "стратегия" - чисто математического - от этого не изменится, как не изменится определение производной от функции к функции. В нормальной игре есть множество информации, есть множество действий. В развернутой, есть, опять же, множество информации и и опять же множество действий. В последнем случае, однако, нужно доопределить как изменяются множество информации и действий со временен.

В зависимости от того как вы все эти определения реализуете (выберите математические структуры для представления динамики информации, действий и отображений доступной информации на множество действий на следующем шаге), вы сможете или не сможете получать дальнейшие содержательные результаты. Однако базовые определения от этого не изменятся - я ведь именно так понял ваш вопрос, меняется ли определение? Нет, не меняется. А дальнейший разговор, это разговор на тему, не разные ли понятия Интеграл Римана и Интеграл Лебега?


> Каая разница, что эта информация "содержит"? Определение понятия "стратегия" - чисто математического - от этого не изменится, как не изменится определение производной от функции к функции.

Определение понятия «стратегия» ссылается на понятие «информации, доступной игроку». Таким образом, в момент определения множества стратегий понятие множества информации должно быть уже определено. В момент же определения множества информации мы не имеем право ссылаться на понятие стратегии: поскольку оно еще не определено, такая ссылка была бы тавтологией. Итак, в информационном пространстве игрока просто не может быть места представлениям о стратегиях противников?

Но это очевидным образом не согласуется с игровой практикой: при принятии решения реальный игрок руководствуется именно представлениями (информацией) о возможных стратегиях противников, а вовсе не тривиальными соображениями о возможных действиях и их результатах. Если у Вас это утверждение вызывает сомнения, попытайтесь обосновать, на чем основаны соображения об эффективности стратегии «око за око».

> В зависимости от того как вы все эти определения реализуете (выберите математические структуры для представления динамики информации, действий и отображений доступной информации на множество действий на следующем шаге), вы сможете или не сможете получать дальнейшие содержательные результаты. Однако базовые определения от этого не изменятся - я ведь именно так понял ваш вопрос, меняется ли определение? Нет, не меняется. А дальнейший разговор, это разговор на тему, не разные ли понятия Интеграл Римана и Интеграл Лебега?

У меня сомнения не в математической корректности определений теории игр, а именно в их содержательности. Математическая модель может быть логически непротиворечивой, но реально ничего не описывать. Так и происходит, когда мы ограничиваем игрока наперед заданным множеством возможных стратегий, когда на деле игрок в выборе стратегии никогда не бывает ограничен наперед заданным множеством вариантов (даже в простейших играх).


> > Каая разница, что эта информация "содержит"? Определение понятия "стратегия" - чисто математического - от этого не изменится, как не изменится определение производной от функции к функции.

> Определение понятия «стратегия» ссылается на понятие «информации, доступной игроку». Таким образом, в момент определения множества стратегий понятие множества информации должно быть уже определено. В момент же определения множества информации мы не имеем право ссылаться на понятие стратегии: поскольку оно еще не определено, такая ссылка была бы тавтологией.

Она не будет тавтологией. Стратегия привязывается по определению к моменту времени. К этому моменту времени предполагается доступной некоторая информация. Как она получена - абсолютно неважно. Главное, что она есть.

>Итак, в информационном пространстве игрока просто не может быть места представлениям о стратегиях противников?

Ничего подобного (в смысле того, что не может быть места). Очень даже может. Только не о стратегиях, а о некоторых оценках стратегий, ожидаемых стратегиях если угодно. Вся математическая статистика (как минимум) к вашим услугам.

Я уже приводил аналогию со стохастическими процессами. Одно из наиболее элементарных определений адаптированного процесса - это множество случайных величин, зависящих от параметра "время", принадлежащего упорядоченному множеству. При этом в каждый момент времени соответствующая случайная величина измерима относительно элемента фильтрации (относительно которой определяется адаптированность) соответствующего указанному моменту времени. При этом КАК получен указанный элемент фильтрации - это совершенно отдельный разговор. В частности, элемент фильтрации может содержать информацию о реализации какого-нибудь другого процесса.

Более того, в развернутой игре, если уж строить модель ожидаемых стратегий, то на основании наблюдаемой истории, при некоторых предположениях о поведенческой модели противников (например, рискующие или, наоборот, обходящие риск, или еще какие), можно построить оценку utility function противника, что, на самом деле, намного более важно, чем просто набор его возможных действий.

> У меня сомнения не в математической корректности определений теории игр, а именно в их содержательности. Математическая модель может быть логически непротиворечивой, но реально ничего не описывать.

Как и любая другая естественнонаучная модель. Для того и ставятся эксперименты, чтобы либо опровергнуть модель, либо установить пределы ее применимости на практике. Теория игр нашла применение в теории выбора и, более широко, теории микроструктуры рынка.

> Так и происходит, когда мы ограничиваем игрока наперед заданным множеством возможных стратегий, когда на деле игрок в выборе стратегии никогда не бывает ограничен наперед заданным множеством вариантов (даже в простейших играх).

Очевидно, написанное вами не относится, например, к каждому из ходов в шахматах.


> > В момент же определения множества информации мы не имеем право ссылаться на понятие стратегии: поскольку оно еще не определено, такая ссылка была бы тавтологией.

> Она не будет тавтологией. Стратегия привязывается по определению к моменту времени. К этому моменту времени предполагается доступной некоторая информация. Как она получена - абсолютно неважно. Главное, что она есть.

Развертывание по времени ничего принципиально не меняет. Всегда можно взять определенный момент времени, например, начало игры, и начать описывать с этих позиций множество возможных действий игрока, знание игрока о множестве возможных действий противников, множество стратегий игрока (отображений знаний игрока на множество его возможных действий), принципы выбора стратегии (utility function) и т.д. Должны мы при этом как-то определить множество возможных представлений игрока о текущем состоянии игры? Ведь на его основе определяется множество его стратегий. Можно, конечно, постулировать, что возможные представления игрока предопределены. Но реальный-то игрок никогда не связан предопределенными представлениями: он всегда вправе сконструировать новое представление, которое ранее не рассматривалось.

Возьмем в качестве примера такую простую игру, как чет-нечет, повторяемую неограниченно долго. (Первый игрок угадывает то, что загадал второй. Если угадал - он забирает у второго игрока рубль, если не угадал - отдает ему рубль.) Какое тут может быть пространство стратегий? Возможный действий-то - всего по два на каждый шаг с каждой стороны. Но все не так просто. Сначала нужно определить множество возможных представлений игрока о состоянии игры. Вроде, представление одно, очевидное, - возможные действия противника и его выгода известны, остальное (конкретный выбор действия) - полная неопределенность.

Как известно, эта игра имеет равновесие по Нэшу на смешанной «стратегии» Pчет = Pнечет = 1/2. Будет ли противник всегда следовать такому алгоритму действий? Может быть и будет, но это лишь одна возможность из тех, которые мы можем допустить. А как он себя поведет после того, как услышит от нас «чет» сто пятьдесят раз подряд? Можем мы предположить, что после этого он сломается и, решив, что мы дебилы, захочет на этом выгадать? А ведь на этом предположении мы можем построить стратегию, и если наше предположение окажется правильным, то мы его обыграем. А еще мы можем предположить, что наш противник рассматривает нашу возможную реакцию на то, что он предъявит нам «чет» сто пятьдесят раз подряд, что он рассчитывает на то, что мы сломаемся, и готовит на этот случай выигрышную стратегию. А мы, зная это, приготовим ему контр-стратегию. Как видите, цепочку предположений можно строить до бесконечности. Конечно, ни одно из них ничем не обосновано, но ведь это всего лишь один из возможных вариантов знания о состоянии игры, которые могут рассматриваться игроком.

Как видите, речь идет о конкретном моменте игры, а не о том, что стратегия на будущий период определяется через знание прошлого периода (и так рекурсивно до первого хода, на котором «знание» якобы содержит только условия игры).

> >Итак, в информационном пространстве игрока просто не может быть места представлениям о стратегиях противников?

> Ничего подобного (в смысле того, что не может быть места). Очень даже может. Только не о стратегиях, а о некоторых оценках стратегий, ожидаемых стратегиях если угодно. Вся математическая статистика (как минимум) к вашим услугам.

Тогда попробуйте определить информационное пространство игрока в чет-нечет перед начальным ходом в неограниченно долго повторяющейся игре. Естественно, речь идет об оценках ожидаемых стратегий.

> Я уже приводил аналогию со стохастическими процессами.

Это другой случай: оценки в различные моменты времени - это разные оценки и их можно определять друг через друга. Если при этом не возникнет петель, то не будет и тавтологии. Но у этой цепочки определений всегда есть начало, которое ни через что не определяется, а выбирается произвольным образом.

> Более того, в развернутой игре, если уж строить модель ожидаемых стратегий, то на основании наблюдаемой истории, при некоторых предположениях о поведенческой модели противников (например, рискующие или, наоборот, обходящие риск, или еще какие), можно построить оценку utility function противника, что, на самом деле, намного более важно, чем просто набор его возможных действий.

Опять же, эта оценка будет построена на неких изначальных произвольных допущениях. Причем, если посредством некоего шпионажа противник об этих допущения прознает, он будет в состоянии построить против нас более эффективную стратегию.

> > Математическая модель может быть логически непротиворечивой, но реально ничего не описывать.

> Как и любая другая естественнонаучная модель. Для того и ставятся эксперименты, чтобы либо опровергнуть модель, либо установить пределы ее применимости на практике. Теория игр нашла применение в теории выбора и, более широко, теории микроструктуры рынка.

Другие модели по крайней мере всегда имеют какую-то область полезной применимости. Постановка же многих задач теории игр имеет ту интересную особенность, что если Вы ей руководствуетесь и Ваш противник об этом знает, то Вы просто облегчаете ему жизнь: он о Вашей стратегии знает куда больше, чем Вы о его. Не всегда это дает явные игровые преимущества, но все же - это дополнительная бесплатная информация в пользу противника.

> > Так и происходит, когда мы ограничиваем игрока наперед заданным множеством возможных стратегий, когда на деле игрок в выборе стратегии никогда не бывает ограничен наперед заданным множеством вариантов (даже в простейших играх).

> Очевидно, написанное вами не относится, например, к каждому из ходов в шахматах.

Почему же? Ведь стратегия в шахматах это не e2-e4 на таком-то ходу, это, например, «Сицилианская защита». На этом самом «таком-то» ходу мы должны оценить, играет ли противник по этой схеме, или по какой-то другой, или находится еще в процессе выбора, какого именно выбора и т.д. От этой оценки будет зависеть наша собственная стратегия. Если бы эти оценки всегда можно было легко и однозначно сделать по шахматному учебнику, играть было бы неинтересно. Интерес-то в том, что изобретаются новые схемы игры, о которых до сих пор шахматная теория не знала.


> > > В момент же определения множества информации мы не имеем право ссылаться на понятие стратегии: поскольку оно еще не определено, такая ссылка была бы тавтологией.

> > Она не будет тавтологией. Стратегия привязывается по определению к моменту времени. К этому моменту времени предполагается доступной некоторая информация. Как она получена - абсолютно неважно. Главное, что она есть.

> Развертывание по времени ничего принципиально не меняет. Всегда можно взять определенный момент времени, например, начало игры, и начать описывать с этих позиций множество возможных действий игрока, знание игрока о множестве возможных действий противников, множество стратегий игрока (отображений знаний игрока на множество его возможных действий), принципы выбора стратегии (utility function) и т.д. Должны мы при этом как-то определить множество возможных представлений игрока о текущем состоянии игры? Ведь на его основе определяется множество его стратегий. Можно, конечно, постулировать, что возможные представления игрока предопределены. Но реальный-то игрок никогда не связан предопределенными представлениями: он всегда вправе сконструировать новое представление, которое ранее не рассматривалось.

Причем здесь какие-то "реальные игроки"?! Вы путаете математический метод с экспериментом. В математике мы говорим "рассмотрим функцию f(x)". А вы вставляете, "а что если в следующий момент физического времени это уже не f(x)?"

Еще раз. Вы придумываете математисческую модель. Для того, чтобы предложенная модель была именно математической, а не философской или теологической, она должна удовлетворять определенным требованиям, установленных математической логикой. Дальше можно применять эту теорию для анализа задач. Так применяйте.

Вы же этого не делаете. Вы разглагольствуете на общие темы на литературном языке, использующем терминологию. И после этого спрашиывете "из того, что мы не четко определяем термины не следует ли несодержательности теории". Следует. Но в теории игр эти термины, к счастью, четко определены.

> Возьмем в качестве примера такую простую игру, как чет-нечет, повторяемую неограниченно долго. (Первый игрок угадывает то, что загадал второй. Если угадал - он забирает у второго игрока рубль, если не угадал - отдает ему рубль.) Какое тут может быть пространство стратегий? Возможный действий-то - всего по два на каждый шаг с каждой стороны. Но все не так просто.

Все как раз просто.

>Сначала нужно определить множество возможных представлений игрока о состоянии игры. Вроде, представление одно, очевидное, - возможные действия противника и его выгода известны, остальное (конкретный выбор действия) - полная неопределенность.

Вот здесь вам и нужно определиться с тем, какая информация кому будет известна. Не на уровне общих слов, а в рамках теории.

> Как известно, эта игра имеет равновесие по Нэшу на смешанной «стратегии» Pчет = Pнечет = 1/2. Будет ли противник всегда следовать такому алгоритму действий? Может быть и будет, но это лишь одна возможность из тех, которые мы можем допустить.

Что значит "будет или не будет"? Это определяется постановкой. Либо будет. Либо не будет. Либо будет но с некоторой вероятностью, возможно условной. и исходя из этого вы сможете или не смождете доказать некие содержательные теоремы.

>А как он себя поведет после того, как услышит от нас «чет» сто пятьдесят раз подряд? Можем мы предположить, что после этого он сломается и, решив, что мы дебилы, захочет на этом выгадать? А ведь на этом предположении мы можем построить стратегию, и если наше предположение окажется правильным, то мы его обыграем. А еще мы можем предположить, что наш противник рассматривает нашу возможную реакцию на то, что он предъявит нам «чет» сто пятьдесят раз подряд, что он рассчитывает на то, что мы сломаемся, и готовит на этот случай выигрышную стратегию. А мы, зная это, приготовим ему контр-стратегию. Как видите, цепочку предположений можно строить до бесконечности. Конечно, ни одно из них ничем не обосновано, но ведь это всего лишь один из возможных вариантов знания о состоянии игры, которые могут рассматриваться игроком.

Ну так выразите все эти предположения математическим языком в рамках, например, теории вероятностей и посмотрите, что получится. КАкова ваша цель - поболотать о том, что жизнь - сложна, или получить содержательный результат?

> > >Итак, в информационном пространстве игрока просто не может быть места представлениям о стратегиях противников?

> > Ничего подобного (в смысле того, что не может быть места). Очень даже может. Только не о стратегиях, а о некоторых оценках стратегий, ожидаемых стратегиях если угодно. Вся математическая статистика (как минимум) к вашим услугам.

> Тогда попробуйте определить информационное пространство игрока в чет-нечет перед начальным ходом в неограниченно долго повторяющейся игре. Естественно, речь идет об оценках ожидаемых стратегий.

Пара из произвольного множества и пустого множества (чтобы было из чего отображать на пару действий). Иными словами - тривиальная алгебра, не содержащая никакой информации.

> > Я уже приводил аналогию со стохастическими процессами.

> Это другой случай: оценки в различные моменты времени - это разные оценки и их можно определять друг через друга. Если при этом не возникнет петель, то не будет и тавтологии. Но у этой цепочки определений всегда есть начало, которое ни через что не определяется, а выбирается произвольным образом.

Опять вы смешиваете "оценки" со стратегиями. Оценки могут возникнуть в рамках конкретной реализации метода теории игр. Их может и не быть вовсе.

> > > Математическая модель может быть логически непротиворечивой, но реально ничего не описывать.

> > Как и любая другая естественнонаучная модель. Для того и ставятся эксперименты, чтобы либо опровергнуть модель, либо установить пределы ее применимости на практике. Теория игр нашла применение в теории выбора и, более широко, теории микроструктуры рынка.

> Другие модели по крайней мере всегда имеют какую-то область полезной применимости. Постановка же многих задач теории игр имеет ту интересную особенность, что если Вы ей руководствуетесь и Ваш противник об этом знает, то Вы просто облегчаете ему жизнь: он о Вашей стратегии знает куда больше, чем Вы о его. Не всегда это дает явные игровые преимущества, но все же - это дополнительная бесплатная информация в пользу противника.

Я уже писал об области полезной применимости теории игр. Только ее надо уметь применять. Знаете, даже делить числа надо уметь, чтобы случайно не разделить на ноль. А то, что вы пишете - это не применение теории, а софистика.

> > > Так и происходит, когда мы ограничиваем игрока наперед заданным множеством возможных стратегий, когда на деле игрок в выборе стратегии никогда не бывает ограничен наперед заданным множеством вариантов (даже в простейших играх).

> > Очевидно, написанное вами не относится, например, к каждому из ходов в шахматах.

> Почему же? Ведь стратегия в шахматах это не e2-e4 на таком-то ходу, это, например, «Сицилианская защита».

Причем здесь "стратегия в шахматах"? С точки зрения теории игр, множество ходов в каждый момент времени ограничено. Соответственно, мнодежство стратегий - это множество отображений из информации на множество ходов. Охота вам анализировать шахматы методами теории игр - потрудитесь определить множество информации. ОЧЕВИДНО, что это множество может содержать все возможные последовательности ходов обеих сторон начиная с данного хода. И если вы это определите, возможно, согласно теории игр нужно будет всегда ходить конем.

Сдается мне, что вы слишком буквально воспринимаете словосочитание "теория игр". Это всего лишь словосочетание. Также как "теория катастроф". Или "теория узлов". Это все условные названия. Так же и с теорией игр. Это всего лишь некая математическая дисциплина, предлагающая модели. Однако, для ее применимости "реальные игры" должны быть переформулированы на ее языке.



Что-то я взялся перечитать пост и мне глаза резануло

> > принципы выбора стратегии (utility function) и т.д.

Стратегия и utility function - абсолютно разные вещи. Неужели Гарвардский курс их смешивает?


> Причем здесь какие-то "реальные игроки"?! Вы путаете математический метод с экспериментом. В математике мы говорим "рассмотрим функцию f(x)". А вы вставляете, "а что если в следующий момент физического времени это уже не f(x)?"

> Еще раз. Вы придумываете математисческую модель. Для того, чтобы предложенная модель была именно математической, а не философской или теологической, она должна удовлетворять определенным требованиям, установленных математической логикой. Дальше можно применять эту теорию для анализа задач. Так применяйте.

> Вы же этого не делаете. Вы разглагольствуете на общие темы на литературном языке, использующем терминологию. И после этого спрашиывете "из того, что мы не четко определяем термины не следует ли несодержательности теории". Следует. Но в теории игр эти термины, к счастью, четко определены.

Я не смешиваю математическую модель с экспериментом, я просто задаю вопросы о полезности этой модели. У меня нет никакого сомнения в том, что строго математическим языком можно сформулировать множество моделей, в которых не будет никакого содержательного смысла. Поэтому конструирование модели должно идти от потребностей ее применения. Язык же, на котором она сформулирована, вторичен. Математический язык хорош своей однозначностью (которой нет в какой-нибудь философии или литературе), но это не гарантирует нас от формулировки на этом языке таких же бессмыслиц, как многие философские трактаты.

Поэтому все вопросы в моих постингах касаются только пользы практического применения моделей теории игр, а не того, на «правильном» ли (достаточно ли математическом) языке они сформулированы.

> > Возьмем в качестве примера такую простую игру, как чет-нечет, повторяемую неограниченно долго. (Первый игрок угадывает то, что загадал второй. Если угадал - он забирает у второго игрока рубль, если не угадал - отдает ему рубль.)

> Вот здесь вам и нужно определиться с тем, какая информация кому будет известна. Не на уровне общих слов, а в рамках теории.

С точки зрения практической постановки задачи определено все, что можно. Есть правила игры. Какая еще информация может быть кому-то известна? Информация о том, что игрок №2 кретин и будет всегда загадывать «чет»? Так это не информация, а домыслы, которые игрок вправе рассматривать или не рассматривать. Математическая модель, конечно, может его органичить рассмотрением только определенного круга домыслов. Но игрок-то вправе на эти ограничения наплевать. И при этом он не выйдет за рамки практической задачи.

> Ну так выразите все эти предположения математическим языком в рамках, например, теории вероятностей и посмотрите, что получится. КАкова ваша цель - поболотать о том, что жизнь - сложна, или получить содержательный результат?

Вот, правильный вопрос. Цель - получить полезный результат (так сказать, «практическое руководство игрока») в виде формализма для достаточно общего случая. Предлагает ли его сегодня теория игр? Мне это представляется весьма сомнительным. Да, она предлагает некие формализмы, но все они основаны на определенной аксиоматике (как и любая математическая теория), которая в силу ее произвольности и составляет слабое место формализма. А в игре любое слабое место может быть использовано против игрока.

Когда математика используется для моделирования пассивной «реальности», произвольность аксиоматики является неприятным, но терпимым моментом. В конце концов, природа не пытается постоянно подлавливать нас на наших слабостях: если основанная на определенной аксиоматике модель практически работает, можно особо не переживать о ее произвольности. Но в игре-то все не так! Противники/партнеры могут и сыграть на тех произвольных допущениях, которые мы положили в основу своей стратегии (построенной в соответствии с моделью теории игр).

Конечно, задача «избавиться от произвольности аксиоматики в рамках каждой конкретной игры» кажется неразрешимой. Но какой-то выход по-моему здесь должен быть. Например, можно рассматривать стратегию игрока не как элемент предопределенного условиями задачи множества, а как понятие, конструируемое самим игроком.

> > Тогда попробуйте определить информационное пространство игрока в чет-нечет перед начальным ходом в неограниченно долго повторяющейся игре. Естественно, речь идет об оценках ожидаемых стратегий.

> Пара из произвольного множества и пустого множества (чтобы было из чего отображать на пару действий). Иными словами - тривиальная алгебра, не содержащая никакой информации.

А что такое «произвольное множество»? Это понятие можно как-то определить? Не попадем ли мы здесь в область парадоксов теории множеств типа парадокса Рассела?

> Я уже писал об области полезной применимости теории игр. Только ее надо уметь применять. Знаете, даже делить числа надо уметь, чтобы случайно не разделить на ноль. А то, что вы пишете - это не применение теории, а софистика.

По моему, применить теорию к игре - это значит рассчитать с ее помощью свою стратегию. Полезным такой расчет будет только тогда, когда такая стратегия на практике окажется более выигрышной, чем стратегии, выбираемые наугад или на основе обывательского здравого смысла. А я что-то не наблюдаю, чтобы знатоки теории выделялись своей удачливостью в различных играх.

> Причем здесь "стратегия в шахматах"? С точки зрения теории игр, множество ходов в каждый момент времени ограничено. Соответственно, мнодежство стратегий - это множество отображений из информации на множество ходов. Охота вам анализировать шахматы методами теории игр - потрудитесь определить множество информации. ОЧЕВИДНО, что это множество может содержать все возможные последовательности ходов обеих сторон начиная с данного хода. И если вы это определите, возможно, согласно теории игр нужно будет всегда ходить конем.

Ага, а мы в теории, стало быть, стратегией называем нечто совсем другое, чем в жизни? Это зачем, чтобы специально с толку сбить?

Да, стратегия - отображение информации на ход. А информация - это возможная последовательность ходов? Что-то мне это не очень очевидно. По моему - эта информация избыточна и совершенно бесполезна для практического применения. Большинстово возможных последовательностей ходов - это бессмысленные и бесконечные топтания на месте или хождения по кругу. Такие последовательности ходов даже трудно оценить с точки зрения их выигрышности/проигрышности. Очевидно, что из некоторых позиций возможен выигрыш при любой игре противника. Точно так же, начиная с некоторых позиций невозможно избежать проигрыша при правильной игре противника. Но не кажется ли Вам, что существует множество позиций, начиная с которых оба противника могут бесконечно долго избегать проигрыша? Я говорю не о тривиальных повторениях в эндшпиле и прочие патовые ситуации, а о более затяжной игре, в которой повторения начинаются через тысячи ходов? Причем «правильных» действий (т.е. исключающих поражение) на каждом шаге может быть несколько. Но никто реально так не играет. Почему? Может быть потому, что никто не рассматривает все возможные последовательности ходов, т.е. игроки пользуются совсем другой информацией?

> Сдается мне, что вы слишком буквально воспринимаете словосочитание "теория игр". Это всего лишь словосочетание. Также как "теория катастроф". Или "теория узлов". Это все условные названия. Так же и с теорией игр. Это всего лишь некая математическая дисциплина, предлагающая модели. Однако, для ее применимости "реальные игры" должны быть переформулированы на ее языке.

Что для чего существует? Реальная жизнь для того, чтобы ее можно было сформулировать на языке математики, или математика со своим языком для того, чтобы описывать реальную жизнь?

Кстати, относительно Вашего добавления: я не называл стратегию utility-функцией, я только указал на то, что принципы выбора стратегии обычно определяются через utility-function (которую этот выбор максимизирует).


> Ага, а мы в теории, стало быть, стратегией называем нечто совсем другое, чем в жизни? Это зачем, чтобы специально с толку сбить?

Мы и "производной" называем нечто совсем другое, чем в обычной жизни.

> Кстати, относительно Вашего добавления: я не называл стратегию utility-функцией, я только указал на то, что принципы выбора стратегии обычно определяются через utility-function (которую этот выбор максимизирует).

Моя ошибка. Пардон.

В общем, предммет спора явно отсутсвует. Я тоже не склонен считать теорию игр более широко применимой для анализа "реальной жизни" чем дифференциальнео иссчесление. Но основная проблема не в фиксированности аксиоматики, а в сложности постановки экспериментов и, соответсвенно, оценки параметров модели. Например, условных вероятностей и т.п. Именно поэтому теория игр, в принципе, это красивый формализм, порождающий математические изыски типа теории микроструктуры рынка. При этом практически никто этих теорий к реальной жизни не применял, это правда.


Физика в анимациях - Купить диск - Тесты по физике - Графики on-line

Реклама:
Rambler's Top100