На простом языке разберем, как незамысловатые элементы статистики и математики могут сильно помочь на финансовых рынках.

Где встречается нормальное распределение, что за шапка жандарма такая, откуда берутся 1, 2 или 3 сигмы, как определить математическое ожидание стратегии — после прочтения статьи вам будет все понятно.

Что такое нормальное распределение и где оно встречается

Многое, что нас окружает, имеет нормальное распределение. Средняя, нормальная скорость, с которой передвигаются машины в городе, средние зарплаты, средняя продолжительность фильма, среднее время, проведенное в инстаграмме и т.д. Среднее и нормальное движение цен финансовых инструментов — не исключение (о них — чуть позже).

Скорее всего, вы видели колоколообразную кривую нормального распределения. Разберем ее на примере среднего роста человека.

 

Допустим, у нас есть данные о всех взрослых людях планеты и их росте за последние 1000 лет. Нам не составит труда узнать средний рост такого человека — он равняется 165 см. Самый низкий рост человека — 54,6 см, а самый высокий — 272 см. Выше на графике ось X показывает как раз значения роста взрослого человека, ось Y — вероятность встречи человека с определенным ростом. И если перевести график на простой язык, будет звучать примерно так:

С большей вероятностью мы будем встречать людей с ростом от 150 до 180 см. А вот взрослых людей с ростом ниже 100 см и выше 200 см мы будем встречать крайне редко.

Ок, теперь разберем, что такое стандартное отклонение.

Что такое стандартное отклонение и откуда оно берется

В статистике дается следующее определение:

Стандартное отклонение (отображается как греческая буква σ — сигма) — мера, которая показывает разброс величин от среднего значения.

Корень из суммы квадратов разниц между элементами выборки, деленной на количество элементов в выборке минус 1. Если что, это все автоматически можно вычислить в Excel по формуле «СТАНДОТКЛОН».

Правило 3-х сигм — 3-х стандартных отклонений

Получив значение стандартного отклонения, мы можем узнать, где и с какой вероятностью окажутся наши исследуемые данные, используя правило 3-х сигм. Для этого обратимся к рисунку ниже.

Стандартное отклонение и нормальное распределение
1, 2 и 3 сигмы (σ) — те самые отклонения от среднего.

Если в нуле у нас то самое среднее значение (которое также называется математическим ожиданием и обозначается буквой мю — μ. О мат. ожидании скоро поговорим чуть подробней), то 1, 2 и 3 сигмы — отклонения от среднего значения. На одно, два и три значения соответственно.

Правило 3-х сигм говорит вот о чем:

  • с вероятностью 99,7% наши исследуемые данные окажутся именно в этой выборке — от -3 до +3 стандартных отклонений. ((34,1% + 13,6 + 2,1%) * 2 = 99,7%)
  • С вероятностью 68,2% наши данные окажутся в пределах от -1 до +1 стандартных отклонений. (34,1% + 34,1% = 68,2%)
  • Вероятность того, что наши данные выйдут из 3 стандартных отклонений — крайне мала, а именно — около 0,3%

Стандартное отклонение еще называют среднеквадратичным отклонением, потому что является квадратным корнем дисперсии — меры, которая показывает разброс значений от среднего (от того самого нуля, или μ). Нет необходимости погружаться в формулы, так как дисперсия тоже автоматически считается в том же Excel (по формуле «ДИСП»). Но если все же хотите разобраться с дисперсией подробней, вот ссылка на статью Википедии.

Ок, с матчастью разобрались, теперь к примерам из финансовых рынков.

Нормальное распределение и стандартное отклонение на финансовых рынках

Теперь мы знаем, что нормальное распределение должно встречаться и в разных сферах финансовых рынков — от доходностей торговых стратегий до движения котировок внутри дня. Давайте исследуем эту гипотезу экспериментально.

Нормальное распределение в доходностях торговых стратегий

В статье Ценность стоп-лосса, выявленная из 2 365 алгоритмов мы уже приводили результативность стратегий и их среднюю доходность. Вот какая выборка данных была:

  • количество бэктестов: 109 912
  • количество сделок: 44 214 423
  • среднее историческое окно: 5.25 лет
  • среднее количество сделок в каждом бэктесте: 402
  • бэктестов с доходностью выше нуля: 25 706, или 23%
  • бэктестов, подходящих для лайв-трейдинга (коэффициент восстановления > 0.5 и количество сделок > 30): всего 2 365 или 2.15%

Угадайте, что получили? Да, шлем жандарма.

Ценность стоп-лосса
Нормальное распределение доходностей среди 2 365 алгоритмов.

По оси X — соотношение прибыльных сделок в исследуемых стратегиях. В нашем случае —  от 20% до 75%. По оси Y — количество алгоритмов, которые попали в определенную доходность (всего их во всех гистограммах — 2 365 штук). Чем выше гистограмма, тем больше алгоритмов туда попало, — значит, выше вероятность такого события. Опять же, давайте переведем все на человеческий язык, как на примере со средним ростом человека. Вот как сформулируем:

Вероятней всего, в среднем у стратегий будет от 35% до 45% прибыльных сделок. Шанс того, что среднее количество сделок будет 55% и выше — крайне мал.

И небольшое отступление. Распределение не всегда бывает нормальным. Слово «нормальное» в нашем термине подразумевает зеркальные значения что слева от среднего, что справа. Идеальная зеркальность нам и не нужна.

А вообще, вот какие типы распределений бывают:

Стандартное отклонение и нормальное распределение
Виды кривых распределений.

Есть теорема (центральная предельная теорема — ЦПТ), которая приводит ненормальное распределение к нормальному. Это все, что нам нужно знать в рамках этой статьи.

С этим разобрались. Это была средняя доходность. А что, если посмотреть на среднюю просадку?

Нормальное распределение в просадках торговых стратегий

И в средних просадках должно все повторяться. Давайте проверим это с помощью метода Монте-Карло. Подробнее о методе вы можете прочесть в статье Как определить вероятностный результат торговой стратегии, используя метод Монте-Карло. Сейчас же просто посмотрим на распределения.

Ок, допустим, у нас есть некая стратегия, которая в среднем дает 50% прибыльных сделок, а соотношение стоп-лосса к тейк-профиту составляет 1 к 1. Вот как будет выглядеть среднее распределение по просадке:

Стандартное отклонение и нормальное распределение
Практически нормальное распределение по просадке.

MDD — Maximum Drowdown — максимальная просадка. И здесь тоже видим уже знакомую нам кривую почти нормального распределения. Как показывает эта кривая, средняя просадка, вероятнее всего, будет в районе 3,8%.

И еще один пример для закрепления.

Стандартное отклонение и нормальное распределение
Нормальное распределение, где средняя просадка уже 26,6%.

“Толстые хвосты” нормального распределения

Об этом любит писать в своих книгах и публикациях Нассим Талеб. Что за «толстые хвосты» такие? Сейчас расшифруем.

По правилам 3-х отклонений, (тех самых 3-х сигм) все, что выходит за их рамки — крайне редкие события, которые можно вообще и не встретить в жизни (мы уже знаем, что шанс встретиться с таким событием — примерно 0,3%). Но парадокс в том, что редкие события на финансовых рынках, они же «черные лебеди», встречаются значительно чаще, чем об этом говорит статистика.

Нормальное распределение
Те самые “хвосты” распределения.

«Хвосты» — те самые края нормального распределения. И если у синего распределения они тонкие (то есть вероятность события действительно низка), то у красного распределения они шире.

Мы помним, что по оси Y у нас вероятность встречи события, а по оси X — его значение. Так и получается, что чем «толще» хвосты, тем выше вероятность реализоваться крайне неожиданному и экстремальному событию.

Индикаторы с использованием стандартного отклонения

Вот несколько индикаторов, в основе которых лежит логика нормального распределения и стандартного отклонения.

Классический индикатор стандартного отклонения — Standard Deviation

Задача индикатора Standard Deviation — показывать всплески волатильности от средних значений. По классической настройке индикатор включается с периодом 20, то есть берет 20 последних свечей и вычисляет от них то самое среднее значение.

Стандартное отклонение и нормальное распределение
График валютной пары NZD/JPY H1 и индикатор стандартного отклонения с периодом 20.

Рост индикатора — рост ценовой активности, снижение индикатора — снижение активности.

Так как этот индикатор показывает лишь всплески волатильности, в отдельности он практически не используется. Волатильность достаточно легко определить на глаз, без каких-либо приборов.

Полосы Боллинджера

Этот индикатор популярней, так как автоматически помогает с определением тренда, волатильности и стандартного отклонения. Не будем подробно описывать здесь принципы его работы, так как уже сделали это в прошлой статье: Трендовая стратегия на индикаторах SMA и полосах Боллинджера (Bollinger Bands). Просто покажем, как выглядят линии на графике:

Стратегия на индикаторах SMA и линиях Боллинджера
Линии Боллинджера и уже знакомые вам отклонения (сигмы).

Линия посередине — то самое среднее значение. Линии выше и ниже — +2 сигмы и -2 сигмы, то есть вероятностное движение цены как в рост, так и в падение.