На простом языке разберем, как незамысловатые элементы статистики и математики могут сильно помочь на финансовых рынках. Где встречается нормальное распределение, что за шапка жандарма такая, откуда берутся 1, 2 или 3 сигмы, как определить математическое ожидание стратегии — после прочтения статьи вам будет все понятно.
Что такое нормальное распределение и где оно встречается
Многое, что нас окружает, имеет нормальное распределение. Средняя, нормальная скорость, с которой передвигаются машины в городе, средние зарплаты, средняя продолжительность фильма, среднее время, проведенное в инстаграмме и т.д. Среднее и нормальное движение цен финансовых инструментов — не исключение (о них — чуть позже).
Скорее всего, вы видели колоколообразную кривую нормального распределения. Разберем ее на примере среднего роста человека.
Допустим, у нас есть данные о всех взрослых людях планеты и их росте за последние 1000 лет. Нам не составит труда узнать средний рост такого человека — он равняется 165 см. Самый низкий рост человека — 54,6 см, а самый высокий — 272 см. Выше на графике ось X показывает как раз значения роста взрослого человека, ось Y — вероятность встречи человека с определенным ростом. И если перевести график на простой язык, будет звучать примерно так:
С большей вероятностью мы будем встречать людей с ростом от 150 до 180 см. А вот взрослых людей с ростом ниже 100 см и выше 200 см мы будем встречать крайне редко.
Ок, теперь разберем, что такое стандартное отклонение.
Что такое стандартное отклонение и откуда оно берется
В статистике дается следующее определение:
Стандартное отклонение (отображается как греческая буква σ — сигма) — мера, которая показывает разброс величин от среднего значения.
Корень из суммы квадратов разниц между элементами выборки, деленной на количество элементов в выборке минус 1. Если что, это все автоматически можно вычислить в Excel по формуле «СТАНДОТКЛОН».
Правило 3-х сигм — 3-х стандартных отклонений
Получив значение стандартного отклонения, мы можем узнать, где и с какой вероятностью окажутся наши исследуемые данные, используя правило 3-х сигм. Для этого обратимся к рисунку ниже.
Если в нуле у нас то самое среднее значение (которое также называется математическим ожиданием и обозначается буквой мю — μ. О мат. ожидании скоро поговорим чуть подробней), то 1, 2 и 3 сигмы — отклонения от среднего значения. На одно, два и три значения соответственно.
Правило 3-х сигм говорит вот о чем:
- с вероятностью 99,7% наши исследуемые данные окажутся именно в этой выборке — от -3 до +3 стандартных отклонений. ((34,1% + 13,6 + 2,1%) * 2 = 99,7%)
- С вероятностью 68,2% наши данные окажутся в пределах от -1 до +1 стандартных отклонений. (34,1% + 34,1% = 68,2%)
- Вероятность того, что наши данные выйдут из 3 стандартных отклонений — крайне мала, а именно — около 0,3%
Стандартное отклонение еще называют среднеквадратичным отклонением, потому что является квадратным корнем дисперсии — меры, которая показывает разброс значений от среднего (от того самого нуля, или μ). Нет необходимости погружаться в формулы, так как дисперсия тоже автоматически считается в том же Excel (по формуле «ДИСП»). Но если все же хотите разобраться с дисперсией подробней, вот ссылка на статью Википедии.
Ок, с матчастью разобрались, теперь к примерам из финансовых рынков.
Нормальное распределение и стандартное отклонение на финансовых рынках
Теперь мы знаем, что нормальное распределение должно встречаться и в разных сферах финансовых рынков — от доходностей торговых стратегий до движения котировок внутри дня. Давайте исследуем эту гипотезу экспериментально.
Нормальное распределение в доходностях торговых стратегий
В статье Ценность стоп-лосса, выявленная из 2 365 алгоритмов мы уже приводили результативность стратегий и их среднюю доходность. Вот какая выборка данных была:
- количество бэктестов: 109 912
- количество сделок: 44 214 423
- среднее историческое окно: 5.25 лет
- среднее количество сделок в каждом бэктесте: 402
- бэктестов с доходностью выше нуля: 25 706, или 23%
- бэктестов, подходящих для лайв-трейдинга (коэффициент восстановления > 0.5 и количество сделок > 30): всего 2 365 или 2.15%
Угадайте, что получили? Да, шлем жандарма.
По оси X — соотношение прибыльных сделок в исследуемых стратегиях. В нашем случае — от 20% до 75%. По оси Y — количество алгоритмов, которые попали в определенную доходность (всего их во всех гистограммах — 2 365 штук). Чем выше гистограмма, тем больше алгоритмов туда попало, — значит, выше вероятность такого события. Опять же, давайте переведем все на человеческий язык, как на примере со средним ростом человека. Вот как сформулируем:
Вероятней всего, в среднем у стратегий будет от 35% до 45% прибыльных сделок. Шанс того, что среднее количество сделок будет 55% и выше — крайне мал.
И небольшое отступление. Распределение не всегда бывает нормальным. Слово «нормальное» в нашем термине подразумевает зеркальные значения что слева от среднего, что справа. Идеальная зеркальность нам и не нужна.
А вообще, вот какие типы распределений бывают:
Есть теорема (центральная предельная теорема — ЦПТ), которая приводит ненормальное распределение к нормальному. Это все, что нам нужно знать в рамках этой статьи.
С этим разобрались. Это была средняя доходность. А что, если посмотреть на среднюю просадку?
Нормальное распределение в просадках торговых стратегий
И в средних просадках должно все повторяться. Давайте проверим это с помощью метода Монте-Карло. Подробнее о методе вы можете прочесть в статье Как определить вероятностный результат торговой стратегии, используя метод Монте-Карло. Сейчас же просто посмотрим на распределения.
Ок, допустим, у нас есть некая стратегия, которая в среднем дает 50% прибыльных сделок, а соотношение стоп-лосса к тейк-профиту составляет 1 к 1. Вот как будет выглядеть среднее распределение по просадке:
MDD — Maximum Drowdown — максимальная просадка. И здесь тоже видим уже знакомую нам кривую почти нормального распределения. Как показывает эта кривая, средняя просадка, вероятнее всего, будет в районе 3,8%.
И еще один пример для закрепления.
«Толстые хвосты» нормального распределения
Об этом любит писать в своих книгах и публикациях Нассим Талеб. Что за «толстые хвосты» такие? Сейчас расшифруем.
По правилам 3-х отклонений, (тех самых 3-х сигм) все, что выходит за их рамки — крайне редкие события, которые можно вообще и не встретить в жизни (мы уже знаем, что шанс встретиться с таким событием — примерно 0,3%). Но парадокс в том, что редкие события на финансовых рынках, они же «черные лебеди», встречаются значительно чаще, чем об этом говорит статистика.
«Хвосты» — те самые края нормального распределения. И если у синего распределения они тонкие (то есть вероятность события действительно низка), то у красного распределения они шире.
Мы помним, что по оси Y у нас вероятность встречи события, а по оси X — его значение. Так и получается, что чем «толще» хвосты, тем выше вероятность реализоваться крайне неожиданному и экстремальному событию.
Индикаторы с использованием стандартного отклонения
Вот несколько индикаторов, в основе которых лежит логика нормального распределения и стандартного отклонения.
Классический индикатор стандартного отклонения — Standard Deviation
Задача индикатора Standard Deviation — показывать всплески волатильности от средних значений. По классической настройке индикатор включается с периодом 20, то есть берет 20 последних свечей и вычисляет от них то самое среднее значение.
Рост индикатора — рост ценовой активности, снижение индикатора — снижение активности.
Так как этот индикатор показывает лишь всплески волатильности, в отдельности он практически не используется. Волатильность достаточно легко определить на глаз, без каких-либо приборов.
Полосы Боллинджера
Этот индикатор популярней, так как автоматически помогает с определением тренда, волатильности и стандартного отклонения. Не будем подробно описывать здесь принципы его работы, так как уже сделали это в прошлой статье: Трендовая стратегия на индикаторах SMA и полосах Боллинджера (Bollinger Bands). Просто покажем, как выглядят линии на графике:
Линия посередине — то самое среднее значение. Линии выше и ниже — +2 сигмы и -2 сигмы, то есть вероятностное движение цены как в рост, так и в падение.
Источник: empirix.ru