13 янв. 2013 г.

Последнее прочитанное - "The Signal and the Noise: Why So Many Predictions Fail — but Some Don't" by Nate Silver

Решил написать про впечатления про последнюю прочитанную книгу . В основном, для того, чтобы немного навести порядок в собственной голове и закрепить впечатления от прочитанного. Давно себя поймал на мысли о том, что если читать много книг, то через некоторое время большинство из них превращается в один большой комок  разодранных впечатлений и мыслей. Поэтому надо как-то "разгружать" себя.
Теперь о книге. Называется она в американском стиле довольно длинно -
"The Signal and the Noise: Why So Many Predictions Fail — but Some Don't". Написал ее Нейт Сильвер (Nate Silver). В США Нейт Сильвер стал широко известен в первую очередь тем, что  смог правильно спрогнозировать победителя по всех штатах в ходе президентских выборов 2012 года. Об этом довольно много писали, что прибавило и книге, и ее автору популярности. Сама книга вышла совсем недавно, в конце сентября 2012 года. Что удивительно, стала довольно популярной для подобного рода литературы. Сейчас она занимает 32 место в списке бестселлеров Амазона и держит прочное место в разделах "Популярная экономика", "Технологии" и "Математика". Причем у нее достаточно высокий рейтинг на Амазоне - 4.3 из 5.
Сразу скажу, что мне книга понравилась. Если вкратце, то она научно-популярно описывает статистические модели в разных областях человеческой жизни, начиная от экономики до шахмат и "птичьего гриппа". Она рассчитана на широкую аудиторию, поэтому никаких особых требований к читателю в виде пройденного курса по статистике или математическому анализу,  она не предъявляет. В ней нет ни одной формулы, только доступные графики. И это конечно большой плюс автору, который умеет удивительно легко и понятно объяснять сложные вещи. Судя по всему, именно поэтому она взлетела в списки бестселлеров Амазона. Вообще стиль изложения мне напомнил другого отличного автора, пишущего на финансово-экономические темы для широкой аудитории - Майкла Льюиса (Micheal Lewis), автора таких книг, как "Liars Poker", "Moneyball" (да именно, тот фильм Moneyball, в котором снялся Бред Питт) и "Boomerang. Причина популярности книг Майкла Льюса и Нейта Сильвера (хотя он и написал пока единственную книгу) заключается в том, что авторы сочетают два начала  - отличный и доступный стиль изложения и глубокое понимание тех вещей, о которых они пишут.
Нейт Сильвер в разное время занимался тем, что разрабатывал систему прогнозирования будущей успешности молодых игроков в бейсболе, зарабатывал на жизнь, играя в интернет-покер и создал систему прогнозирования результатов политических выборов в США на основе агрегирования результатов различных опросов. Как я говорил, именно благодаря успехам в прогнозировании выборов он и стал широко известен и получил работу штатного блоггера в New York Times.  Поэтому разделы, которые посвящены прогнозированию в бейсболе, покере и политике - лучшие в книги. Вообще, сама книга разбита на главы, в каждой из которых Нейт рассказывает о статистических моделях в какой-либо одной области.
Я видел несколько не очень положительных рецензий на книгу от экономистов, которые критикуют Нейта за главу, в которой он описывает причины финансового кризиса 2007-2009 годов. Он пытается уместить рассказ о причинах кризиса, и рассказы про модели рейтинговых агентств и ненадежность экономических прогнозов в одну главу. Все это смотрится сваленным в одну кучу. Сказывается, видимо, и то, что у самого Нейта не было собственного опыта в области финансовых моделей. И он, судя по всему, почему-то не стал общаться с людьми из этой области - по крайней мере, я не припоминаю прямых цитат в "экономической" главе. Хотя в главах, в которых он рассказывает про модели прогнозирования погоды и климатические модели, прогнозирование землетрясений, распространение инфекционных заболеваний - в тех областях, в которых у него тоже нет своего опыта, он основывается на общении и консультациях со специалистами из этих областей. Мой совет - лучше пропустить первую главу "A catastrophic failure of prediction". К ней можно вернуться, прочитав всю книгу, если возникнет желание. К тому же экономистов -  за прогнозы "в молоко" - Нейт еще покритикует в последующих главах.
Еще одна рецензия, которую видел, укоряет Нейта за слишком вольное трактование "байесовского подхода". С этим действительно есть некоторые сложности. Еще в предисловии Нейт сообщает о том, что он является горячим сторонником байесовских методов в статистике. Но возвращается к описанию байесовских методов и собственно самой теоремы Байеса только в 8 главе, описывая подходы, которые использует профессиональный игрок в тотализатор на результаты баскетбольных матчей. До этого времени - речь просто об описании статистических моделей и как они используются в реальности. Постороннему человеку может быть непонятно при чем тут вообще Байес.
Ответ автора на вопрос, который поставлен в название самой книги, в упрощенном варианте выглядит так - байесовский подход дает лучшее качество прогнозов. Тем не менее, описание байесовского подхода для спортивных моделей и покера является одним из лучших "простых" введений в эту тему, на мой взгляд. Для серьезного и осмысленного изучения темы байесовских методов я рекомендую другую книгу -
"Doing Bayesian Data Analysis" (John Kruschke). У Нейта - хорошее общее описание, как байесовские методы используются в современных моделях, но для того, чтобы "сделать" что-то самому, нужно читать дальше другие книги.
Резюмируя, книгу "The Signal and the Noise: Why So Many Predictions Fail — but Some Don't" я рекомендую всем, кто не засыпал на университетском курсе мат. статистики :) Вам понравится!