gornal: (фото)

С одной стороны, великолепная иллюстрация равенства полов. С  другой - прекрасная история об отчетности публичной компании.

Вкратце: на сайте знакомств на 10 миллионов активных пользователей гетеросексуальных мужчин приходилось 10 тысяч активных пользователей-женщин.

http://gizmodo.com/almost-none-of-the-women-in-the-ashley-madison-database-1725558944

gornal: (фото)
Внезапно заметил, что очень существенную часть моей френдленты в ЖЖ составляют эмигранты. Среди активно пишущих их "на глазок" процентов 70, и прямо сейчас проверил - из последних 50 постов они написали 22, ещё 3 в сообществах, т. е. 22:25 среди людей.

Это много. Это куда больше, чем среди моих личных знакомых, куда больше, чем в других социальных сетях, куда больше, чем в моем представлении эмигрировало из СССР и бывшего СССР, куда больше, чем дает забугорью статистика ЖЖ, наконец.

Если есть феномен, надо, конечно, разобраться в причине. Если предположить, что это просто случайность, возникшая в не очень большой выборке, - становится неинтересно, поэтому эту причину отбросим сразу и не будем к ней возвращаться.

Что ещё это может быть? Меня осознанно или неосознанно привлекает связанная с ними тема? Скорее всего, нет, пишут они о совсем разном, про эмигрантское житье-бытьё в их журналах очень немного, из 22 постов - всего два, например. Про политику, конечно, больше, чем в среднем по больнице, но ведь найти и соотечественников с блогом про Путина и Украину не сложно, их тут каждый второй.

Я относительно случайно попал в тусовку и френжу их через комментарии друг у друга? Формально так, наверное, и происходит, но опять же - никто же не мешал смотреть других комментаторов в других журналах, да и тусовка там далеко не одна.

Другие возможности? Они могут банально лучше и интереснее писать, соответственно, я их для чтения и выбираю. Причем у этой причины может быть не меньше пяти взаимодополняющих подпричин. Во-первых, банально, возможно, уехали в среднем более умные, вот они лучше и пишут. Звучит неприятно, но ничему не противоречит. Во-вторых, похоже, у них меньше выбора, куда писать. ВКонтакте до диаспоры не дошел, в Facebook им приходится писать для тамошних знакомых, в тамошнем "несерьезном" стиле, вот уже минус две площадки для самовыражения, ЖЖ потенциальных писателей достается больше. В-третьих, статистически им может быть скучнее. Уехали, Родину и друзей потеряли, вот и сидят перед компом, вместо того, чтобы на дачах картошку сажать. В-четвертых, в ЖЖ новых регистраций крайне мало, аудитория очень сильно перекошена в ранних пользователей Интернета, а среди них эмигрантов таки может быть больше, чем в среднем - и Интернет в США развивался раньше, и уезжают больше связанные с IT люди, и основные волны отъезда были давно, средний эмигрант существенно старше моего среднего знакомого, шансов попасть в ЖЖ у него было больше. Ну и, наконец, в-пятых, смена страны проживания дает огромное количество лишнего жизненного опыта, тоже может положительно сказываться на качестве текстов.

Самый красивый вариант, конечно, что они мне эмоционально как-то ближе, свои, а я такой внутренний эмигрант, который сам этого не осознает, но к образцам невольно тянется. Facebook так глубоко не копает, подсовывает мне людей по более формальным признакам, несмотря на всю Big Data, а в ЖЖ техника не влияет, подсознание выбирает новых френдов свободно, вот заграничные и накапливаются. Опять неприятно, но опять совершенно неопровержимо.

В общем, писать про это можно, похоже, бесконечно.

"Такова тема в упрощенном виде. Argumentum omni denudatum ornamento. Я сделал бы из нее два таких тома, как
этот, - добавил иезуит.
И в порыве вдохновения он хлопнул ладонью по фолианту святого Иоанна
Златоуста, под тяжестью которого прогибался стол.
Д'Артаньян содрогнулся."
gornal: (фото)
В Москве за январь-июнь погибло в ДТП 382 человека. В Московской области - 685. Я не знаю, много это или мало по меркам мегаполиса, в сравнении с другими российскими регионами и даже предыдущими мэром и губернатором. Соответственно, не знаю, надо за этот результат хвалить, ругать или сдержанно считать его средним.

Но колебание этого значения на несколько процентов куда смертоноснее, чем вчерашняя катастрофа.
Но пострадавшим в рядовых ДТП не оказывают никакого внимания и не платят компенсаций.
Но у чиновников куда больше возможностей повлиять на обыденность, чем на катастрофы.

Но всей френдленте плевать на важное, вся френдлента пишет о неважном. И обратная связь обязательно сработает: не знаю, насколько эффективно, но на борьбу с катастрофами ресурсы потратят, а на обыденность - нет.
gornal: (фото)
Мудрый [livejournal.com profile] sigterm посоветовал мне книжку, отчет я про неё, наверное, потом, когда дочитаю, напишу а пока хочу похвастаться новым знанием, которое из неё извлек.

Предположим, есть какая-то настольная более-менее интеллектуальная игра, в которой игроки в сумме набирают 100 очков, кто набрал больше, тот победил. Предположим, Вася выиграл у Пети со счетом 70:30 в первой партии, и больше ничего мы про них не знаем. На приближение к какому результату следует ставить во второй? Интуитивно кажется, что 70:30 - другой информации у нас нет, кто из них набрался больше опыта в первой игре, угадывать бесполезно. Однако правильный ответ это, скорее, 60:40 и логика тут следующая.
- Часть всех мировых выигрышей произошла благодаря случайности, а не мастерству.
- Соответственно, возможно, что и наш случай был именно из этой категории, а в следующий раз ветер будет дуть в другую сторону, и Петя сыграет лучше.
- Конечно, возможен и расклад, что везло именно Пете и справедливый (а значит и ожидаемый) результат это 90:10, но так как победа положительно коррелирует с везением, он менее вероятен.

Открыли эту идею уже больше ста лет назад, назвали регрессией к среднему, при более полных данных там и математика к логике прилагается и я, наверное, потерял часть уважения окружающих, признавшись в том, что раньше о ней не знал. Тем не менее, она же просто потрясающая, да ещё и применимая чуть ли не во всех областях человеческой деятельности до потенциальной аннексии Донбасса включительно.

Например, совсем практическое. Людей я всю жизнь принимал или не принимал на работу, исходя из результатов собеседования, к которому человек мог прийти неподготовленным, невыспавшимся, да и просто тормозя именно на моих любимых темах, вопросах и задачах. А есть люди, которые в основном судили по резюме, а не по разговору - может быть, правы именно они? Резюме это ведь именно то среднее, к которому будет регрессировать кандидат, с математикой не поспоришь...
gornal: (фото)
Кормя тролля в чужом журнале, нашел интересную статистику.

1. Про легальный оборот алкоголя.

Потребление россиянами алкоголя в 2013 году снизилось по сравнению с предыдущим на 13 процентов. Об этом в четверг, 17 октября, сообщает РИА Новости со ссылкой на главного нарколога РФ Евгения Брюна.

По его словам, в 2013 году средний уровень потребления алкоголя составил примерно 13,5 литра на душу населения. В то же время в 2012 году этот показатель равнялся 15,6 литра. При этом Брюн отметил, что еще в 2010 году годовое потребление алкоголя в России составляло около 18 литров на душу населения.


2. Про нелегальный оборот алкоголя.

Количество смертей от отравлений алкоголем в РФ. Взял с fedstat.ru, но ссылку на конкретный отчет там не поставить.

1990 16 056
1991 16 653
1992 26 209
1993 45 425
1994 55 473
1995 43 461
1996 35 233
1997 27 924
1998 26 065
1999 29 872
2000 37 214
2001 41 091
2002 44 698
2003 45 049
2004 42 715
2005 40 877
2006 32 982
2007 25 202
2008 23 947
2009 21 337
2010 19 132
2011 16 288
2012 15 226
gornal: (Спартак)
Полтора года назад про Олимпиаду в Лондоне классик сказал, что По причинам, выяснение которых выходит за рамки данного исследования, страна-хозяйка Олимпиады всегда набирает существенно больше медалей, чем обычно. ... Если произвольно объявить "лишними" и перестать учитывать половину хозяйских успехов ...

Естественно, интересно применить этот подход и к Сочи тоже. После "произвольного уполовинивания" медалей у России остается 6.5 + 5.5 + 4.5 - по золотым заметно лучше, по общему числу медалей примерно так же, как в катастрофическом Ванкувере'2010. Но по всем параметрам хуже, чем в Турине'2006. Но по всем параметрам лучше, чем в Солт-Лейк-Сити'2002. Но хуже, чем в Нагано'1998.

Выводы из этой странной арифметики я бы сделал такие:
- В зимних видах спорта систематического ухудшения результатов со временем не происходит. Хотя этот вывод уже 8 лет назад можно было сделать.
- Россия смогла использовать преимущество своей площадки на том же уровне, что истинные мастера честной игры - англичане. Это безусловный успех, причем куда более важный, чем любые спортивные достижения.
- В 2018-ом ожидаем места в районе третьего или четвертого.
gornal: (Феликс)
Объединил три таблички: историю курсов доллара, инфляции в РФ и инфляции в США. Ждал слегка другого результата, но вышло любопытно.

Дата Курс $ Инфляция за предыдущий год, % Курс того времени в современных рублях и долларах
В РФ В США
25.01.2014 34,26 6,45 1,5 34,26
10.01.2013 30,42 6,58 2,1 31,91
11.01.2012 31,87 6,10 3,2 34,89
01.01.2011 30,35 8,78 1,6 34,16
01.01.2010 30,19 8,80 -0,4 36,38
01.01.2009 29,39 13,28 3,8 38,69
10.01.2008 24,44 11,87 2,8 35,11
10.01.2007 26,45 9,00 3,2 41,35
11.01.2006 28,48 10,91 3,4 47,03
01.01.2005 27,75 11,74 2,7 49,15
01.01.2004 29,45 11,99 2,3 56,76
01.01.2003 31,78 15,06 1,6 67,05
01.01.2002 30,14 18,80 2,8 72,00
04.01.2001 28,16 20,10 3,4 77,75
01.01.2000 27,00 86,59

Официальную инфляцию в России, кстати, принято объявлять заниженной. 
gornal: (фото)
Скомпоновал две статьи из википедии (статистика авиаперевозок, авиакатастрофы и одно число пришлось в поисковике искать) в единую таблицу. Выводы делать не буду.

Гражданская авиация в России.

Пассажиропоток (в миллионах) Жертвы Скользящее среднее жертв Скользящее среднее жертв на миллион пассажиров
1991 118
1992 62,6 84 67 1,1
1993 41,5 0 95 2,3
1994 33,8 200 99 2,9
1995 32,1 98 146 4,6
1996 28,2 141 96 3,4
1997 26,2 50 64 2,4
1998 23,3 0 17 0,7
1999 22,4 0 0 0,0
2000 23 0 70 3,0
2001 26,5 210 101 3,8
2002 28 93 101 3,6
2003 30,9 0 61 2,0
2004 35,2 90 39 1,1
2005 36,5 28 138 3,8
2006 39,6 295 110 2,8
2007 45,1 6 130 2,9
2008 49,8 88 31 0,6
2009 45,1 0 34 0,7
2010 56,9 13 39 0,7
2011 64,1 104 54 0,8
2012 74 46 67 0,9
2013 75 51 49 0,6


(Только самолеты, только гражданские перевозки, без учета грузовых, тренировочных, спортивных, военных, только РФ).

Иллюстрация того, что такое одна жертва на миллион: это опасность погибнуть в ДТП за два дня жизни (не обязательно вождения!) в РФ. 
gornal: (фото)
Очень много интересной статистики можно свести к следующим кратким утверждениям:

Мигрантов >5% от населения РФ.
Молодые мужчины в 3-4 раза более склонны к совершению преступлений, чем остальные люди.
Молодых мужчин среди мигрантов непропорционально много.
Мигранты совершают в РФ 3% преступлений.
Москва и Московская область принимают на себя львиную долю миграции, 40% молодых мужчин в Москве и МО - мигранты.
gornal: (фото)
В дополнение к сказанному.

Во-первых, сделанный Чейзом анализ диагноз подтвердил.
Во-вторых, выяснилась причина везения Навального. Он, оказывается, довольно много прогнозов делал и существенно разных. В точку попал не финальный, а один из промежуточных. Финальный отличается от действительности весьма существенно.
gornal: (Феликс)
Хаус. Что у нас сегодня?
Чейз. В скорую привезли социологов, результат Собянина завышенный, результат Навального заниженный.
Хаус. Кремлянка. 2 милиграмма совести внутривенно, ежедневное независимое финансирование - к следующим выборам будут как новенькие.
Форман. В скорой тоже так подумали, пока не заметили ещё повышенной явки, а она кремлянкой не объясняется.
Хаус. Это уже интересно. Берем дело!

(Через час)

Хаус. Итак, группа социологов. Симптомы почти у всех одинаковы - завышенный прогноз по одному, заниженный по другому, явка на 20% больше реальной. Другая клиническая картина у социологов Навального, у них та же проблема с явкой(*) и проваленный exit-poll. Дифдиагноз!
Кэмерон. Что-то генетическое? Криворукость?
Чейз. Криворукость так быстро не развивается, ещё полтора года назад они предсказывать умели хорошо.
Форман. Аутоимунное? Они пытаются подстроиться под фальсификации, фальсификаций в этот раз не было, а поправки остались - вот и ошибка.
Чейз. Не объясняет явку.
Хаус. А что говорят о социологии в стране кенгуру? И когда я говорю "говорят", я имею в виду новые гипотезы.
Чейз. Окружающая среда. Может быть, голосовать за Навального социально-неприемлимо? Люди стыдятся в этом признаться, вот и результаты опросов низкие. А когда разговаривают с его собственными социологами - естественно признаются.
Хаус. И опять не объясняет явку.
Кэмерон. А может быть, и не было раньше никакой угаданной явки? Всегда была примерно как сейчас, только вбрасывали тоннами, вот и совпадало с завышенным прогнозом. Тогда криворукость подходит.
Хаус. Кто может подсчитать? Сойдется?
Форман. Предыдущие выборы, по Москве явка 58%, Путин 47%. Если реальная явка строится в такой же пропорции от предсказанной как в этом году, то, берем по Леваде, реальная должна быть 64/52*32=39%. Вброс 58-39=19%, без них у Путина было бы (0.47*0.58-0.19)/0.39=22%.
Хаус. Смотрите-ка, а черных детей неплохо учат арифметике в школе. Молодец, зануда.
Чейз. Но 22% никак не может быть правдой. Даже сейчас, даже по Навальному у Собянина в районе 50%, не в 2.5 раза он популярнее Путина.
Хаус. И мы опять в тупике. Дайте им антибиотики широкого спектра и обыщите офисы.

(В самом конце серии)

Хаус. Явка это не явка, вот в чем секрет.
Чейз. Если вы хотите, чтобы мы оценили Вашу гениальность, не могли бы Вы снизойти до нашего уровня?
Хаус. Конечно, рабы. Слушайте внимательно. Социологи ведь не угадывают, пойдет ли человек на выборы, а спрашивают его, собирается ли он это сделать. Он может ответить "точно да", "точно нет" и ещё несколько промежуточных вариантов, смотрите подробнее сами. Мы привыкли, что те, кто ответил "совершенно точно" или "скорее всего" и пойдут на самом деле на выборы. Но это не обязательство отвечающего и даже не прогноз соцслужбы, это всего лишь наблюдение, что ответивший так обычно держит свое слово. Раньше это работало, но теперь перестало. Почему оно перестало - тоже понятно. С одной стороны, это первые московские выборы в дачный сезон. Сначала пообещал, а потом о картошке вспомнил. С другой стороны, и, думаю, это важнее - власть сама эти выборы саботировала. Вы хоть с какой-то агитацией Собянина сталкивались? Или хоть с каким-то призывом сходить на участок? Ну, понятно, вы из своего Нью-Джерси носа не высовываете, но и в Москве его только в футляре видели и вообще никак не запомнили, я где-то и цифры про это видел, сейчас быстро не нашел.
Чейз. И тогда, тех, кто был готов сходить поставить галочку, в последний день не подтолкнули, и они не пошли. Вот и низкая явка.
Форман. Но как это относится к основным симптомам? К неугаданным результатам?
Чейз. Хаус думает, что аудитория Навального как раз была отлично мобилизована и пошла голосовать вся. В итоге и результат получился лучше, чем прогнозировался.
Хаус. Красавчик дело говорит.
Форман. Все говорят, что явка играла за Навального, а не против. На тех участках, где она выше, он и набрал больше.
Хаус. Всё так, только наоборот, это Навальный на явку играл. Там, где у него сторонников больше, там и явка за их счет вышла лучше. Чтобы подтвердить, кто на самом деле причина, а кто следствие, нужно аналогичную картинку для явки построить. Если я прав - график вверх пойдет. И сделаеть это тот, у кого самый смешной акцент.
(Чейз выходит)
Кэмерон. А как же тогда Навальный в точку попал?
Хаус. Он не завышать собственный результат никак не мог, он даже по exit-poll'у себе рисует лучше, чем если согласиться со всеми его собственными обвинениями в подтасовках. Если вносить в его данные такую поправку, чтобы его exit-poll с остальными примерно совпал, то и предварительный опрос примерно такой же, как у Левады, выйдет. Но, да, совпало красиво, везучий он молодой человек.
Форман. Меня больше интересует, как лечить пациента.
Хаус. А зря. Дело раскрыто, мы свою работу выполнили, а пациенты от такого не умирают. Пусть теперь Собянин думает, как ему в следующий раз компанию активнее проводить.


(*)Навальный явку впрямую не прогнозировал, но прогнозировал её косвенно тут следующей фразой: "В Москве семь миллионов избирателей. Для победы нам достаточно привести голосовать за Навального 1,5 миллиона человек. Задача выполнима." Если он в цитате победой называл свой выигрыш в первом туре и при этом подразумевал, что "привести голосовать" включает и старый, ядерный электорат, то выходит ожидание явки 1,5/50*100/7=~43% (реальная, напомню, 32%). Любые другие прочтения (а другие прочтения всё-таки более вероятны) подразумевают более высокую ожидаемую явку. При этом, по логике вещей, цифру в этом пассаже следовало преуменьшать, а не преувеличивать - чем она меньше, тем больше личная ответственность потенциальных волонтеров, тем сильнее они мотивированы. Т. е. как ни крути, у него в голове как минимум 50%+ крутились, а совсем даже не 30.

April 2017

S M T W T F S
       1
2 3 4 5 6 7 8
9 10 1112131415
16171819202122
23242526272829
30      

Syndicate

RSS Atom

Style Credit

Expand Cut Tags

No cut tags
Page generated Sep. 25th, 2017 04:20 am
Powered by Dreamwidth Studios