Автор этой работы поставила перед собой следующие задачи: ввести в практику жизнеспособные концепции проведения и интерпретации астрологических исследований, проиллюстрировать некоторые особенности теории вероятности и её применения к количественным исследованиям и обсудить принципы планирования эксперимента.
Эта статья задумана как пособие для астрологов-исследователей. По существу, это введение в использование научного метода в астрологии с объяснением некоторых особенностей, возникающих при использовании этого метода, и изложением некоторых соображений относительно тех случаев, когда метод не применим.
Лучшей стартовой точкой является определение: исследование - это изучение ясно обозначенной проблемы, с использованием определенной методологии и чёткой системы доказательств и опровержений. Исследования бывают по меньшей мере трёх типов: описательные, исторические и количественные. Именно к количественным исследованиям более всего применим научный метод.
Для начала определим, что понимается под научным методом. Чтобы сделать это, необходимо вернуться к Фрэнсису Бэкону и Блезу Паскалю. Во времена периода, названного впоследствии Просвещением, принципы, провозглашённые ими, были канонизированы. Итак, главные признаки научного процесса таковы:
(1) учёный — это беспристрастный наблюдатель;
(2) учёный создаёт новые данные в процессе изучения, выделяя некоторые особенности, представляющие интерес в свете поставленной перед ним задачи, в качестве “единственных изменяемых переменных”;
(3) любой эксперимент, который вы считаете значимым, должен допускать повторение другими исследователями;
(4) выводы получаются путем обобщения частных результатов для частных случаев на все случаи подобного вида.
В большинстве научных исследований сначала выдвигается гипотеза, достаточно детализированная для того, чтобы можно было предложить модель для её проверки. Планируется эксперимент и в ходе его проведения собираются данные. Потом эти данные анализируются, и этот анализ показывает, можно ли считать выдвинутую гипотезу значимой. Иногда в ходе анализа рождаются совершенно неожиданные для исследователя результаты.
Место научных методов в астрологии - всё ещё предмет споров. Этому есть несколько причин. Во-первых, у большинства астрологов-практиков нет хорошей научной подготовки. Как у всех людей со стандартным уровнем образования, их отношение к научным методам, в целом, основано на их представлении о месте науки в обществе.
Вторая причина заключается в том, что часть астрологов считает результаты статистических работ, выполненные до сих пор, существенно расходящимися с потребностями практической астрологии. Эти астрологи утверждают, что сектора Гоклена подходят им хуже, чем обычные астрологические дома. Получается, что в глобальном контексте результаты Гоклена в определенной мере “доказывают” или подтверждают астрологию, но их практическая пригодность довольно ограничена.
Третья причина касается недуга, поразившего западную мысль и философию в XX столетии — это беспокойство о науке и о её месте в общей картине мира.
В связи с последними открытиями в квантовой и релятивистской физике, все больше ученых стало сомневаться, что Вселенная в своей основе объективна. Одновременно с ростом академических областей истории и философии науки, всё в большей степени становятся спорными некоторые методы и процессы науки, в результате чего наука выглядит находящейся так же далеко от своих пределов, как и в конце девятнадцатого века. Так что трудно предполагать, что из её недр придут ответы на все интересующие нас вопросы.
В то время, как вокруг роли науки в нашем знании не утихает борьба, всё-таки имеется ряд её ценных применений. Так, идея использования научных (что в большинстве случаев означает статистических) методов — это способ, который может дать ряд интересных результатов.
Одна из самых больших ошибок, допускаемых при реализации исследовательских проектов, состоит в том, что намереваясь что-то изучать (скажем, музыкальный талант), исследователи стараются собрать как можно больше данных, а потом не знают, что с ними делать! Самый важный вопрос, который необходимо решить в самом начале — это вопрос о выборе модели и типе проводимых исследований. Эта пред-экспериментальная стадия технически называется планированием эксперимента. При правильно спланированном эксперименте у вас может быть очень мощный импульс для получения положительных результатов. (Хотя я не выражаю сомнения в том, что вы хотели бы получить положительный результат в ходе эксперимента.) Если вы не спланируете эксперимент должным образом, чрезвычайно велики шансы того, что вы или не получите результатов, или эти результаты будут ошибочными. Это, в свою очередь, означает, что вам придётся повторить процесс сбора данных, а ведь именно стадия сбора данных наиболее трудоемка. Следствием этого может быть то, что вас могут обвинить в подгонке данных, т.е. модификации эксперимента для получения результатов, согласующихся с вашей теорией.
Первый шаг астрологического или любого другого исследования — это постановка вопроса. Причём вопрос должен быть сформулирован в такой форме, чтобы на него можно было ответить достаточно однозначно. Например, вопрос: “Есть ли разница между людьми с музыкальными талантами и людьми без таких талантов с астрологической точки зрения?” — слишком общий. Корректнее было бы сформулировать вопрос, например, так: “Есть ли различия в суточном положении Венеры у людей с музыкальными способностями и без оных?” На этот вопрос уже можно вполне однозначно ответить экспериментальным путем.
Сначала, если у вас вообще нет идей об астрологической динамике музыкальных способностей (в нашем примере), то можно рекомендовать произвести так называемое поисковое исследование. В поисковое исследование можно включить небольшую группу людей (скажем, человек пятьдесят) с музыкальными способностями, а потом проверить эту группу любыми методами, которые вам понравятся: суточные распределения, средние точки, астероиды, уранианские планеты, гелиоцентрика, гармоники и т.д. Вы можете выбрать один или несколько факторов, которые покажутся вам интересными. После того, как у вас появятся некоторые идеи о роли этих возможных факторов, вы можете уже набрать большую группу, учитывая во время сбора данных всё, что сможет повлиять на ваши результаты впоследствии на стадии анализа данных. Какого рода могут быть эти факторы? Если вы изучаете средние точки, то вам необходимо будет более тщательно учитывать моменты рождения для средних точек типа Асц/МС, чем для точки Марс/Плутон.
Таким образом, первый шаг в астрологическом исследовании — это построение модели, которая, по вашему мнению, может описывать реальность. Есть два вида моделей: физическая и символическая. Физические модели бывают двух типов: портретные модели — это картины реальности (как фотографии или ксерокопии), которые внешне выглядят как то, что изучается вами, и аналоговые модели, которые выглядят иначе, но работают так же, как изучаемые. Пример аналоговой модели — аэродинамическая труба. Отметим, что аналоговые модели не обязательно должны иметь все компоненты рассматриваемого объекта (в аэродинамической трубе нет птиц и осадков!). От них требуется только, чтобы они описывали изучаемый процесс.
Помимо физических моделей существуют также и символические, которые подразделяются на два типа: описательные и математические. Описательная модель — это словесное описание исторического развития системы. Математическая модель характеризует систему в виде уравнений, рядов или других математических объектов. Выражение “средняя точка Меркурия и Марса равна Сатурну” можно рассматривать, или как словесное или как математическое утверждение, поскольку в астрологии мы можем перевести большинство утверждений в систему 360-градусных координат. В этом случае среднюю точку нужно будет просто выразить в виде оператора в нашей системе, подобно тому, как сложение является оператором в арифметике.
После того, как вопрос поставлен и модель сформирована, планирование завершается и начинается сбор данных. Сначала следует определить критерии для сбора данных, как в экспериментальной, так и в контрольной группах, если необходимо, а также определить способы проведения “измерений” в рамках вашей модели и выбрать статистические критерии, которые будут использоваться.
Что еще необходимо при планировании? Одна из задач поискового исследования - определить вариабельность вашей опытной группы. У всех ли талантливых музыкантов Луна находится в 10-м доме или только у 15%? Должна ли Луна быть или в угловых домах гороскопа или в соединении с Венерой? Поскольку вероятность можно выразить точной математической формулой, нужно заранее определиться, сколько параметров вы сможете выявить, если соберете большую выборку. Чем больше параметров - тем больше должна быть выборка. Как в поисковом исследовании, так и на следующей стадии, важно собрать по возможности наиболее представительную выборку, охватывающую самые различные возрастные группы. Более подробно об этом будет говориться далее, сейчас необходимо только отметить, что существуют еще астрономические факторы, которые тоже необходимо учитывать.
После завершения поискового исследования специалисты по статистике могут помочь вам определить подходящий размер выборки.
Интуитивно можно предположить, что если мы соберем данные за достаточно большой интервал времени, большинство астрономических факторов усреднятся и исчезнут. Понятно, что ретроградное движение планеты отразится на результатах, но как сильно? Графики, рассчитанные программой Марка Поттенджера "FAR", показывают, что это влияние будет существенным. На рисунках 1 и 2 приведены положения Марса на полночь каждых суток в течение всего XX столетия. Числа на горизонтальной оси - это градусы эклиптической долготы от 0° Овна (0°) до 29° Рыб (359°). Неудивительно, что гелиоцентрические графики выглядят более плавно, чем геоцентрические, на которых заметны острые пики. Однако, даже в случае гелиоцентрического графика “пик” примерно на 50% выше своего основания.
Рис. 1. Геоцентрические долготы Марса. Для 36524 положений между 1900 и 1999 гг.
Рис. 2. Гелиоцентрические долготы Марса. Для 36524 положений между 1900 и 1999 гг.
Причина появления пика состоит в том, что Марс, как и любая другая планета, имеет эллиптическую орбиту в соответствии с законами Кеплера (рис. 3), и движется с переменной скоростью, зависящей от его положения на орбите. Если соединить радиус-вектором положение планеты на орбите с Солнцем, то этот радиус-вектор за равные промежутки времени будет описывать равные площади. Это происходит из-за того, что на участке орбиты, находящемся ближе к Солнцу, планета движется быстрее. Если мы наложим на рис. 3 круг зодиака, то придем к выводу, что в перигелии будет наименьшая частота зодиакальных градусов, а наибольшая частота — в афелии. В примере с Марсом в XX веке наибольшая частота — в Деве и наименьшая — в Рыбах, что соответствует перигелию и афелию его орбиты.
Рис. 3. Второй закон Кеплера: каждая планета движется вокруг Солнца с такой скоростью, что радиус, соединяющий планету с Солнцем, за равные промежутки времени описывает равные площади.
Геоцентрический график выглядит более неровным, поскольку он включает ещё и ретроградное движение. Это означает, что некоторые градусы фигурируют чаще других.
Однако, есть и другие факторы, помимо ретроградного и эллиптического движений. Рассмотрим рис. 4 — 5. Гелиоцентрический график угловых расстояний между Нептуном и Сатурном выглядит плавным, за исключением двух скачков. Причина этих скачков заключается в том, что синодический период обращения планеты не совпадает в точности с изучаемым интервалом времени. Например, в течение 50 лет, показанных на рис. 4, был только один полный синодический цикл (период около 38 лет), а также окончание старого (градусы примерно от 330 до 360) и начало нового цикла (после соединения в 1989). Геоцентрический график, показанный на рис. 5 - это полнейшая анархия, не видно никакой регулярности! Это связано с тем, что обе планеты имеют длительные ретроградные периоды. Попытки найти астрологическое влияние среди этого хаоса — воистину поиски иголки в стоге сена!
Рис. 4. Гелиоцентрические угловые расстояния между Нептуном и Сатурном. Для 18262 положений между 1950 и 1999 гг.
Рис. 5. Геоцентрические угловые расстояния между Нептуном и Сатурном. Для 18262 положений между 1950 и 1999 гг.
Эти факторы могут затруднить или даже сделать невозможной статистическую проверку астрологического влияния зодиакальных знаков. Именно эти астрономические факторы, как я уверена, являются причиной отрицательных результатов многих исследований. Целым рядом исследователей было отмечено, что результаты поиска влияния знаков не удавалось воспроизвести повторно. Возникло ощущение, что такого влияния вовсе не существует. Необходимо сразу отметить, что отрицательные результаты исследований вовсе не означают отсутствие влияния знаков, а лишь только то, что знаки не поддаются простой статистической проверке.
Совместное действие всех астрономических факторов можно видеть в таблице 1, показывающей распределение геоцентрических положений Меркурия, Венеры, Марса и светил в знаках зодиака.
Большие отклонения в таблице соответствуют максимальным колебаниям графика, это определяется характеристиками видимого орбитального движения планет. Согласно законам статистики рекомендуется рассматривать среднее значение плюс-минус удвоенное стандартное отклонение. (Обычно принято использовать утроенное отклонение - так называемое правило “трёх сигм”. - Прим.ред.) Отклонения, которые больше этой величины, представляют возможный значимый результат. Для Марса и Венеры получается, что удвоенное стандартное отклонение больше, чем среднее значение! С точки зрения анализа мы имеем дело с явлением, которое в радиотехнике называется отношением сигнал/шум: чем более точно вы настраиваете свой приемник, тем больше становится это отношение. Другими словами, было бы чрезвычайно трудно получить какие-либо результаты влияния знака для геоцентрических Меркурия, Венеры или Марса, не имея очень большой выборки, или же сам “сигнал” должен быть достаточно сильным для того, чтобы значительно перекрыть астрономический “шум”.
Таблица 1. Распределение планет в знаках, 1940 - 1980.
(В среднем каждая планета попадает в каждый знак по 1248 раз)
Лишь положение Луны распределено достаточно равномерно в течение длительного времени, для изучения эффектов ее влияния приемлемы и небольшие выборки. Вариации для Солнца и Меркурия больше, но, вероятно, и с ними можно работать, имея достаточно большую выборку. Становится более понятно, почему исследования Гоклена были такими успешными: астрономические эффекты в суточном цикле значительно меньше, чем эффекты, влияющие на распределение планет в знаках!
Поскольку Меркурии и Венера являются “нижними” планетами и находятся на небольшом угловом расстоянии от Солнца, их распределения будут подобны распределению Солнца. В реальности имеется годичный или сезонный ритм, выражающийся в том, что в разные месяцы года рождается разное число людей. К сожалению, этот цикл значительно варьируется в зависимости от географического положения и года. Больше всего новорожденных в период нахождения Солнца в Близнецах, а значит и распределения Меркурия и Венеры будут иметь пики вблизи Близнецов. Этот годовой ритм стал несчастьем для многих исследователей-любителей; они рассматривают изучаемую выборку, находят пик в расположении Солнца в Близнецах и радостно сообщают: “Эврика! Есть результат!” Этот пример показывает нам важность контрольной группы.
В прежние времена до введения медицинского наблюдения дети рождались согласно суточному ритму: больше всего — в ранние часы перед восходом. Сейчас, из-за возможности стимулировать рождения, большее число детей рождается в обычные рабочие часы с понедельника по пятницу. При большой доле естественных рождений Солнце чаще будет наблюдаться вблизи Асцендента (больше людей рождается перед восходом), это также будет относиться к Меркурию и Венере!
В то время, как взаимосвязь между Солнцем и внутренними планетами очевидна, интуитивно кажется, что положения внешних планет меньше будут зависеть от положения Солнца в суточном цикле. Изучив 570 рождений, Мишель Гоклен сообщил результаты взаимных положений Солнца и Марса, изобразив распределение Марса в секторах, пронумерованных в порядке удаления их от Солнца (если бы эффект был нулевой, то во всех колонках должны были быть одинаковые числа).
Номер сектора при удалении от Солнца
0 1 2 3 4 5 6 7 8 9 10 11
Частоты
72 72 56 43 37 26 16 29 36 46 66 71
Здесь мы наглядно видим распределение геоцентрических угловых расстояний между Марсом и Солнцем. Это распределение показывает, что вблизи Солнца Марс может наблюдаться в несколько раз чаще, чем в оппозиции с ним. Эта зависимость стала одной из основных причин для нападок Комитета по научному исследованию паранормальных случаев (CSICOP - the Committee for Scientific Investigation of Claims of the Paranormal) - одной из групп-разоблачителей, на работу Гоклена. Скептики утверждали, что эффект Марса, показанный Гокленом, может быть полностью объяснен тем, что Деннис Роулинз назвал эффектом восходящего Марса, а именно - преобладанием рождений на восходе вследствие избыточного присутствия Марса вблизи Солнца, как было показано выше. Как мы теперь знаем, эффект восходящего Марса не вполне достаточен для объяснения результатов Гоклена (в распределении чемпионов спорта восходящий Марс был в 22% случаев, а вышеуказанный эффект мог объяснить только 17%), но вполне достаточен для того, чтобы подвергнуть опасности исследовательские проекты, если исследователь окажется невнимателен!
Существенный вопрос, стоящий за каждым статистическим вопросом — есть ли разница между изучаемой вами группой и людьми (или другими объектами) в целом. Как мы уже видели на примере астрономических факторов, определить это не всегда просто. Однако, есть несколько способов контроля.
В контрольной группе предпочтительно иметь такой же вид календарного распределения, как и в экспериментальной группе. Например, такое или почти такое же преобладание Солнца в Близнецах. Если изучается суточное распределение, две группы должны иметь похожие распределения Солнца по домам. (Это снова показывает трудности в изучении Солнца: если мы имеем два различных распределения Солнца, то эти различия могут быть следствием несогласования выборок).
При изучении суточных эффектов есть другая возможность — внутренний контроль. Внутренний контроль — это контроль, который основан на данных самой выборки. В этом случае вы можете взять дату и место рождения из карты номер 1, а время — из карты номер 2, затем использовать время третьей карты с датой второй, и так до тех пор, пока для даты последней карты не будет использовано время первой карты. Любое нужное количество контрольных выборок может быть порождено таким “сдвигом временной рамки” — если сдвигать более, чем на одну карту.
Нужно упомянуть еще один принцип контроля: в зависимости от используемого статистического теста, количество контрольных объектов может значительно превышать экспериментальную группу: иногда на порядок и даже более.
Главная проблема при сборе данных — сделать это несмещённым образом. (То есть, без систематического смещения данных в какую-то одну сторону. — Прим. ред.) Этого можно добиться несколькими способами.
Во-первых, если вы собираетесь использовать свою собственную базу данных, то убедитесь в том, что вы используете все доступные данные, а не их часть. Это снижает шансы неосознанного смещения отбора. Возможно, неплохо будет взять более широкую выборку, чем ваша. Помните, что делая отбор, вы не только сами выбираете нужных людей для того, чтобы познать их, но и Космос выбирает их для вас.
Хорошо, если вы можете собирать данные от людей астрологически наивных, особенно, если ваша гипотеза довольно очевидна. Позволяя своим объектам знать слишком много о своем эксперименте, вы тем самым позволяете им “помогать” вам. Это большая проблема для многих начинающих исследователей: объявив цель исследования, они стремятся получить данные с такими подробностями, что другие астрологи легко могут неосознанно (или умышленно) предлагать только те карты, которые подтверждают (или отвергают) модель. Лучше просто сказать, что вы исследуете алкоголизм, чем говорить, что вы исследуете алкоголизм, используя попадание средней точки Меркурий - Нептун на кардинальную ось!
Другая проблема при сборе данных - это точность момента рождения, которая иллюстрируется следующей таблицей, составленной Карлом Крафтом. Если вы задумали любой проект суточного исследования, то точность данных из строки 1 недостаточна для получения хороших результатов. Однако, если вы изучаете среднюю точку Марс - Нептун, этого уровня точности может быть вполне достаточно.
Эти несколько примеров покажут важность проблемы:
Таблица 2.
Точность моментов рождения
Серия 1. 7:00 11:00 16:00 20:00
Серия 2. 7:00 10:30 16:00 20:30
Серия 3. 7:00 10:45 16:10 20:25
Строка 1: точность до часа, макс. ошибка 1/2 часа, средняя ошибка 15 минут.
Строка 2: точность до 1/2 часа, макс. ошибка 15 минут, средняя ошибка 7.5 минуты.
Строка 3: точность до 5 минут, макс. ошибка 2,5 минуты, средняя ошибка 1,25 минуты.
И последнее предупреждение при сборе данных. Легче исследовать факторы, которые не противоречат общественному мнению или нормам морали. Дело в том, что объекты исследования могут не признаться добровольно, что они, к примеру, алкоголики или гомосексуалисты.
После того, как вы собрали данные, есть несколько способов для их упорядочения. Например, если у вас есть средние точки Меркурий-Нептун в эклиптической долготе, вы можете составить их список в возрастающем порядке.
Для получения частотного распределения данные необходимо распределить по группам: например, по интервалам 0 - 10°, 10 - 20°, 20 - 30° и т.д. Почему именно так? Если заносить данные в каждый из 360 градусов, разброс на полученном графике может выглядеть полностью бессмысленным. Сгруппировав данные в группы, можно увидеть гораздо больше.
Огромное количество информации можно получить из графиков. Но прежде нужно понять, какого типа график подойдет больше. Гистограмма - это представление данных, объединенных в группы. Количество измерений на каждом интервале (обычно равной длины — Прим. ред.) показывается вертикальными столбиками. Поскольку вы рассматриваете группы, то не увидите связь данных одной группы с другой. У вас нет представления и о том, как распределены данные внутри каждой группы. Некоторая часть информации при этом теряется. Если вы подвергаете эти данные статистической обработке, то свои контрольные данные необходимо объединить в такие же группы. Таким образом, статистический анализ данных сводится к ответу на вопрос: действительно ли форма экспериментального распределения отличается от формы контрольного распределения?
Пример гистограммы. Распределение 381 российского математика по знакам зодиака (из статьи В.В.Г., Исследования в астрологии, 1-1996)
Кривая частот, в отличие от гистограммы, показывает непрерывное распределение данных. При этом мы имеем больше информации о том, что происходит на каждом зодиакальном градусе, но теряем из виду более общую картину, которую дает гистограмма. Вероятно, стоит проанализировать данные обоими этими способами: так вы сможете увидеть больше.
Пример частотного графика: распределение долгот Солнца на даты рождения 2492-х священников. Слева - стандартное отклонение (сигма).
Возникает вопрос, какое количество групп наиболее оптимально. Например, если взять четыре группы длиной по 90° каждая, впадины и пики графика могут скомпенсировать друг друга, создавая впечатление небольшой вариации данных. Такой подход был использован некоторыми из скептиков, когда они желали опровергнуть астрологические эффекты. Например, в данных, относящихся к новолунию и полнолунию, можно задать группы настолько большими, что результаты окажутся бессмысленными, а более подробное распределение покажет значимый эффект. Этого можно добиться, задавая границы групп на середине пиков графика или объединяя впадины с пиками. С другой стороны, если группы построить правильно, они скорее могут подчеркнуть информацию, чем затушевать ее. Это одна из составных частей искусства статистики: найти способ представления, который бы выделял нужную информацию, а не затемнял её. (Обычно берут 10-20 групп данных — Прим. ред.)
Другой способ графического представления данных - это представление отклонений от средней величины. В этом случае данные показаны в виде разностей, а не абсолютных величин. Единственная опасность такого вида графического представления - это то, что величина разностей может быть сильно преувеличена из-за того, что шкала обрезана снизу и и мы не видим абсолютной величины данных.
Вариантом такого представления данных являются сравнительные гистограммы Гоклена, приведённые здесь для данных по чемпионам спорта. Распределения всех пяти планет показаны на одном и том же графике для того, чтобы было удобнее сравнивать между собой формы пяти отдельных гистограмм. Вы можете сравнить здесь четкий пик Марса с небольшими пиками других планет. На этом рисунке пунктирные линии представляют контрольные значения, таким образом сразу видны отклонения от этой линии.
Распределение планет по секторам Гоклена для 2088 чемпионов спорта
Другой вид графика, особенно полезного в астрологии - это круговая диаграмма. Для её построения в центр графика ставится нуль, а все частоты представляются в виде кругов, проведенных из центра. Пример взят из результатов Гоклена для врачей. Здесь частоты, которые приводятся на вертикальной оси обычного графика, показаны как окружности, самая маленькая внутри - 10 единиц, потом — 20 и т.д. Можно видеть, что распределение внутри 18-ти секторов, показанных здесь, изменяется от 20 (смотри положение на 11:00, если ориентироваться по циферблату часов) и почти до 50 (положение на 9:30).
Такой график более естественно представляет данные: один день плавно переходит в другой, Рыбы — в Овен, и т.д. Любое линейное представление астрологических результатов заключается в “разрезании” круга в некоторой произвольной точке, а круговая диаграмма этого не делает. Она может быть очень удобна для представления периодических данных.
Последний приём, который я хочу упомянуть— это полулогарифмический. В этом случае по одной шкале наносятся логарифмы чисел, а по другой — числа в обычной десятичной форме. Это особенно полезно при работе с данными, охватывающими несколько порядков величины. Полулогарифмический график хорошо аппроксимирует данные для показа изменений в процентах.
Рассмотрев основные типы графиков, остаётся выяснить, что такое уровень значимости. Когда автор заявляет, что значимость находится на уровне 0.01, это означает: вероятность того, что различие между экспериментальной группой и большой выборкой случайно, составляет один шанс из ста. Другими словами, насколько низка вероятность того, что утверждение ложно! Вся концепция статистики основана на предпосылке того, что вы можете количественно рассчитать правдоподобие ваших результатов. Большинство наук традиционно имеют свои уровни значимости. В одной области может считаться достаточным уровень значимости 0.05 (5%), тогда как в другой — 0.01. К сожалению, для астрологии достаточный уровень значимости ещё не установлен.
С одной стороны, заявления об уровне вероятности могут казаться элементарными. Например, если я имею результаты на уровне 0.05, то это значит, что я ошибаюсь в одном случае из двадцати. Однако, если я буду подходить к исследованиям напрямую, исследуя каждую планету, среднюю точку, дом или астероид, который можно найти в карте, тогда я смогу сделать сотни подобных заявлений и, таким образом, по законам теории вероятности некоторые из моих “результатов” будут ошибочны. Когда вы увеличиваете количество производимых исследованиё, вы также увеличиваете вероятность появления ошибок. Это снова показывает необходимость поисковых исследований для того, чтобы уменьшить количество проверок до разумных пределов, как по времени, требуемому для выполнения эксперимента, так и для более надёжного получения результатов.
На стадии планирования эксперимента необходимо решить, какой уровень значимости необходим для ваших данных. Не нужно сразу требовать уровня 0.01, ибо в ходе исследования вы можете прийти лишь к уровню 0.1, и вам придется менять свою точку зрения. Поисковое исследование не только покажет тенденцию в ваших данных, но и даст предварительное знакомство с данными, что, в свою очередь, позволит более сознательно выбрать уровень значимости.
Существует ряд возможных статистических критериев, которые могут быть использованы для интерпретации конкретного эксперимента. Прежде чем перейти к этим критериям, необходимо немного подробнее остановиться на теории вероятности.
“Мы движемся по кругу
И лишь предполагаем,
Ответ же спрятан в центре,
Его-то мы не знаем.”
Роберт Фрост
Вероятность - это степень правдоподобия события. Она может определяться таким простым способом, как подбрасывание монеты, или же гораздо более сложным путём. Существует несколько видов распределения вероятности. Необходимо знать, какой из них характерен для ваших данных, чтобы выбрать соответствующий метод анализа.
Первый вид распределения называется биноминальным. К биноминальному распределению предъявляют четыре требования:
(1) имеются только два взаимоисключающих результата;
(2) вероятность не изменяется во время опытов;
(3) каждое испытание независимо от других;
(4) существует конечное число испытаний.
Первое требование — наличие двух взаимоисключающих результатов— означает, что возможны только два ответа — “да” или “нет”. Второе — отсутствие изменения вероятности между отдельными опытами — означает, что при многократном повторении эксперимента, должно получаться одинаковое распределение результатов. (Конечно, как астрологи, мы изучаем время в его уникальности и всегда могут быть некоторые астрологические или астрономические различия, но если их нет или они исключены, результаты опытов должны повторяться). Третье требование — независимости опытов — означает, что какой-либо результат конкретного опыта не влияет на последующие результаты, например, то, что выпало у меня в данном броске монет, не влияет на результаты броска монеты через пять минут. И последнее требование — конечности количества опытов (т.е. бросков монет) — означает, что имело место 100 бросков монет, 500 отсчётов и т.д.
Распределение Пуассона походит на биноминальное распределение, за исключением того, что 4-е условие не выполняется. Его требования:
(1) имеются только два взаимоисключающих результата;
(2) среднее количество событий в единицу времени или на протяжении всего периода не изменяется за время действия процесса;
(3) процесс непрерывен. (Точнее, процесс бесконечен. Он может быть связан с некоторым непрерывным, так называемым пуассоновским процессом, о котором идет речь ниже. — Прим. ред.)
Распределение Пуассона используется в тех случаях, когда нелегко разделить независимые опыты. Другими словами, вы имеете непрерывный процесс. Примером может служить число вызовов, поступающих на телефонную станцию за определённое время суток. В астрологии мы можем считать время непрерывным, рождения - это “события” во времени. Однако, неясно — всегда ли это распределение применимо к астрологии на практике.
Третье основное распределение вероятности — нормальное распределение. Нормальное распределение имеет непрерывную область значений. Например, распределение положений планет не ограничивается такими дискретными величинами, как одна планета в Овне, две — в Тельце. Положение планеты в зодиакальном круге вычисляется с такой точностью, на которую способен ваш компьютер. Это отличается от бросков монеты, где могут выпасть только “орел” или “решка” (броски монет представляются биноминальным распределением).
Классический пример работы с вероятностью — это оценка результатов бросков монеты. Вероятность получения “орла” - 50%, поэтому в половине бросков должны выпасть “орлы”. Если я брошу монету десять раз и получу семь “орлов” и три “решки”, то это может означать, что я сделал недостаточное количество бросков или монета с дефектом.
Одна из замечательных особенностей астрологии состоит в том, что почти каждое сделанное утверждение можно выразить в численной форме. Например, определим вероятности нахождения Луны в соединении, оппозиции или квадратуре с Ураном, используя семиградусный орбис.
Таблица 3
Соединение: 7° до + 7° после = 14°
Оппозиция: 7° до + 7° после = 14°
Квадратура (90°): 7° до + 7° после = 14°
Квадратура (270°) : 7° до + 7° после = 14°
Полная вероятность: Р = (14+14+14+14)/360 = 15,6%
5-градусный орбис: Р = (10+10+10+10)/360 = 11,1%
10-градусный орбис: Р = (20+20+20+20)/360 = 22,2%
В подобных вычислениях вероятности необходимо:
(1) указать все допускаемые аспекты;
(2) указать допускаемые орбисы;
(3) использовать орбис как для сходящегося, так и для расходящегося аспекта;
(4) учитывать все аспекты по два раза (кроме соединения и оппозиции) - правые и левые аспекты.
Число, которое получается в результате таких вычислений - это теоретическая вероятность, не включающая астрономические факторы. Цель выполнения вычислений - попытаться почувствовать вашу гипотезу (модель, которую вы пытаетесь изучать), а также определить, нет ли у вас ошибки при отборе образцов. Как это определить? Давайте рассмотрим еще один пример.
Несколько лет тому назад, Роберт Янски и Эйлин Номан предложили модель гомосексуальности, которая включала три компонента:
(1) связь между Ураном и 8-м домом (4 варианта);
(2) 8-ой дом антагонистичен 5-му дому (4 варианта);
(3) Марс или Плутон связаны с 12-м домом (6 вариантов).
Если попробовать вычислить вероятность этой модели, получится 90.5%. Получается, что 90% карт, которые вы подберете, должны удовлетворять этой модели! В то же время, максимальные оценки гомосексуальности среди населения составляют 10%. Здесь слишком много вариантов для того, чтобы модель была истинной, поэтому даже не рассматривая выборку можно сказать, что модель совершенно ошибочна. (Может быть она просто неполна, а вовсе не “совершенно ошибочна”? — Прим.ред.)
При построении модели, если рассматриваются несколько условий, важно правильно использовать логические операторы “или”/“и”. Соединение двух условий оператором “или” означает, что любое из этих условий может быть истинным и при этом удовлетворять модели; использование оператора “и” означает, что оба условия должны выполняться для того, чтобы удовлетворять модели. Если условия соединяются оператором “или”, то отдельные вероятности суммируются, что увеличивает суммарную вероятность. Если же используется оператор “и”, вероятности умножаются и, т.к. все величины вероятности находятся в интервале между 0 и 1, при умножении дробей общая вероятность снижается. (Не совсем точно. Вероятности суммируются, если условия несовместны, т.е. не могут удовлетворяться одновременно, и умножаются в том случае, если условия независимы. — Прим.ред.)
Из таблицы видно, что модель с оператором “и” реже бывает истинна, чем модель “или”.
Таблица 4
Если имеются два условия А и В, соединённые логическими операторами, то результат будет следующий (плюс - истина, минус - ложь)
А |
В |
“или” |
“и” |
истина |
истина |
+ |
+ |
истина |
ложь |
+ |
- |
ложь |
истина |
- |
+ |
ложь |
ложь |
- |
- |
Обычно теория вероятности должна использоваться на стадии формулировки гипотезы. Вычисление вероятностей может уберечь вас от некоторых разочарований, если гипотезу можно проверить заранее. Если я считаю, что контакты Венеры с Юпитером влияют на атеросклероз, то прежде я могу рассчитать естественную вероятность появления этих аспектов, а потом сравнить эту вероятность с долей населения, страдающего от этой болезни. Таким образом я смогу что-нибудь сказать о правдоподобии моей модели до того, как начну собирать карты для её проверки.
Общая цель любого статистического исследования — ответить на вопрос: отличается ли одна выборка от другой. На рисунке дано графическое представление этого вопроса.
Распределение двух перекрывающихся групп населения. Цель статистических методов - разделить, по возможности, обе эти группы.
Мы имеем две кривые распределения (нормального). Вопрос заключается в следующем: действительно ли это два различных распределения или “различие” вызвано тем, что каждая кривая просто представляет свою подвыборку населения Земли в целом.
Статистические методы оценивают величину фактора случайности. Этот фактор, или шум, представляет долю вероятности, которая является результатом каприза случайной Вселенной. Возвращаясь к нашему примеру с монетой, фактор случайности вытекает из того факта, что в то время, как вероятность выпадения “орла” при каждом броске равна 1/2, нет правила, которое бы определяло какой-либо частный результат. Средняя частота равна 50%, но выборка может включать длинные ряды “орлов” и “решек”. Обычный вывод состоит в том, что если различие бросков меньше случайного, то никакого вывода сделать нельзя. Если различие больше случайного, то это ещё не доказывает, что различие действительно есть (хотя оно может присутствовать). В данный момент нас интересует, что может сказать нам теория вероятности об этих априорных моделях.
Многие астрологи предполагают, что все исследовательские проекты подобны и что их результаты должны одинаково интерпретироваться. Это случай, когда почти автоматически применяется проверка на “хи-квадрат”, что не всегда правильно, поскольку различные статистические тесты имеют специальные требования для своего применения. Если наше исследование не удовлетворяет требованиям одного теста, тогда вместо него можно использовать другой тест. Что это за требования? Их несколько:
(1) являются ли данные отсчётами, измерениями или рядами;
(2) большая выборка данных или маленькая;
(3) какой тип распределения вероятности имеет выборка;
(4) относится ли этот тест к нормальному распределению или анализируются различия между группами;
(5) сколько использовано групп;
(6) сравниваются ли средние значения или же их отклонения.
“Хи-квадрат” правомерно использовать только для сравнения соотношений в больших группах. Это означает, что вы сравниваете соотношения в каждой группе, например, соотношение Овнов, Тельцов и т.д. Другие критерии пригодны для нормального распределения, которое сравнивает отклонения между экспериментальной и контрольной группами.
Кроме того, выбор нужного критерия во многих случаях зависит от размера выборки. Минимальный размер выборки при использовании критерия “хи-квадрат” (который основан на степенях свободы) — на единицу меньше количества групп; в случае анализа на знаки или дома этот размер составляет 11. Лучший способ для определения размеров выборки — это проведение поискового исследования, что в большинстве случаев поможет сэкономить время.
Таблица 6 — это часть таблицы значений “хи-квадрат”, приведена для того, чтобы показать как определяется значимость. Формула для хи-квадрат даёт число, которое в сущности является мерой вариации между экспериментальной и контрольной группами. Четыре колонки в таблице — это проценты значимости: чем меньше число, тем выше значимость. В левой колонке — N —число степеней свободы.
Таблица 6. Значения параметра “хи-квадрат”
уровни значимости в % |
||||
|
10 |
5 |
1 |
0.1 |
1 |
2.706 |
3.841 |
6.635 |
10.827 |
2 |
4.605 |
5.991 |
9.210 |
13.815 |
3 |
6.251 |
7.815 |
11.345 |
16.266 |
4 |
7.779 |
9.488 |
13.277 |
18.467 |
5 |
9.236 |
11.070 |
15.086 |
20.515 |
6 |
10.645 |
12.592 |
16.812 |
22.457 |
7 |
12.017 |
14.067 |
18.475 |
24.322 |
8 |
13.362 |
15.507 |
20.090 |
26.125 |
9 |
14.684 |
16.919 |
21.666 |
27.877 |
10 |
15.987 |
18.307 |
23.209 |
29.588 |
11 |
17.275 |
19.675 |
24.725 |
31.264 |
12 |
18.540 |
21.026 |
26.217 |
32.909 |
13 |
19.812 |
22.362 |
27.688 |
34.528 |
14 |
21.064 |
23.685 |
29.141 |
36.123 |
15 |
22.307 |
24.996 |
30.578 |
37.697 |
16 |
23.542 |
26.296 |
32.000 |
39.252 |
17 |
24.769 |
27.587 |
33.409 |
40.790 |
18 |
25.989 |
28.869 |
34.805 |
42.312 |
19 |
27.204 |
30.144 |
36.191 |
43.820 |
20 |
28.412 |
31.410 |
37.566 |
45.315 |
Если проследить значения в любой колонке таблицы слева направо, то можно увидеть, что значения растут. Это отражение того факта, что чем больше значимость, тем больше различии между экспериментальной и контрольной группами должно быть для соответствия этому уровню значимости.
Вычисление критерия “хи-квадрат” включает в себя множитель, вычисляемый как сумма квадратов разностей между ожидаемым значением и реальными данными. Этот множитель присутствует во многих статистических уравнениях. “Хи-квадрат” применяется только для больших выборок: в небольших выборках реальные разности, возведенные в квадрат, могут быть слишком маленькими для того, чтобы дать положительные результаты.
На этом закончим наше достаточно краткое введение в статистику для астрологов. (Надо сказать, местами несколько запутанное. — Прим.ред.) Моей целью было рассказать о ряде факторов, влияющих на статистический анализ. Должно быть ясно, что необходим достаточно творческий подход при проведении такого типа исследований, и что это творческое начало в значительной степени необходимо ещё до начала сбора данных.
Ключевая идея, которую я пыталась здесь выразить, это то, что статистика и теория вероятности могут быть полезны астрологам для того, чтобы:
(1) обеспечить процедуру приближённого подсчёта для оценки многих астрологических заявлений,
(2) проверить астрологические гипотезы и
(3) охарактеризовать состав астрологической выборки.
Помните, статистика — это не инструмент для предсказаний. Это метод, показывающий разницу между подвыборкой и общей выборкой. И это далеко не единственный способ изучения астрологических проблем. Однако, эксперименты, которые могут быть проведены этим способом, могут дать нам много интересной информации.
Перевод с английского А.Шашкина
под редакцией С.Масликова и Д.Куталёва.
Вернуться на основную страницу