Автор оригинала: FreeCodeCapm Team.
Рохан Джозеф
Центральная предельная теорема утверждает, что распределение выборки образец образца приближается к нормальному распределению, поскольку размер выборки становится больше.
Средства образца сходятся к нормальному распределению независимо от формы населения. То есть население может быть положительно или отрицательно перекошено, нормально или не нормально.
Центральная предельная теорема тесно связана с законом больших чисел, в которых говорится, что:
Итак, как эти два связаны?
CLT утверждает, что – как размер выборки имеет тенденцию к бесконечности, форма распределения напоминает форму колокола (нормальное распределение). Центр этого распределения образцов средств становится очень близким к значению населения – что по сути является законом большого количества.
Давайте проиллюстрируем это в Python с классическим рулоном. Перед тем, как мы смоделируем, давайте рассчитаем ожидаемое значение из рулона Die.
Это общая формула для расчета ожидаемого значения эксперимента (который имеет 6 результатов и 6 вероятностей, связанных с ним).
Итак, теперь давайте рассчитаем ожидаемое значение из рулона под давлением.
Несмотря на то, что невозможно получить 3,5 на одном рулоне матрицы, с увеличением количества рулонов под давлением, среднее значение роликов под давлением было бы близко к 3.5.
- Для визуализации этого в Python сначала импортируйте необходимые библиотеки: Numpy, MatPlotlib и палочка Отказ Убедитесь, что вы устанавливаете ImageMagick для сохранения участков в качестве GIF.
2. Теперь создайте 1000 симуляций 10 рулонов Die, а в каждом симуляции найдите среднее значение вытекания.
Это то, что будут выглядеть первые 10 ожидаемых значений курильника:
3. Напишите функцию для построения гистограммы вышеупомянутых значений. Кроме того, используя функцию анимации, мы можем визуализировать, как гистограмма медленно напоминает нормальное распределение.
Выход:
4. Вы можете сохранить анимацию в качестве GIF, используя следующий кусок кода.
Из этого эксперимента мы можем наблюдать:
- С меньшим количеством образцов гистограмма разбросана по всему и не имеет определенного шаблона.
- Однако, увеличивая размер выборки, распределение выборки начинает напоминать нормальное распределение. Это Центральная предельная теорема.
- Кроме того, с увеличением размера выборки частота для «среднего от Dile.5» является самой высокой – которая является ожидаемой стоимостью рулона под давлением. Это демонстрирует Закон большого количества.
Итак, как используется центральная предельная теорема?
Подключиться на LinkedIn И проверить GitHub (ниже) для полной ноутбуки.
ROHANJOSEPH93/Центральная предельная теорема Визуализировать CLT в Python. Способствовать развитию ROHANJOSEPH93/Central-Limit-теорема, создав счет на … github.com.