Статистика распределения

Большинство статистических процессов выполняются с использованием нормального распределения. Это позволяет использовать статистические методы, чтобы сделать прогнозы о популяции (Популяция) из набора данных проб (Проба). Классическая статистика основывается на концепции нормального распределения (Нормальное распределение), которое может определяться Средним (Среднее) и Стандартным отклонением (Стандартное отклонение).

Нормальное распределение удобно использовать с данными, которые не имеют сильной анизотропии. То есть с данными, которые не сильно смещены (имеются в одном и другом конце) на типе графика гистограмма. Даже там, где данные имеют незначительную анизотропию, среднее повторяющихся проб из популяции будут нормально распределенным (центральная предельная теорема). Это свойство позволяет таким распределениям быть задействованными в классическом статистическом тесте.

Большинство собранных данных, которые подвергаются статистическому анализу, имеют нормальное распределение. Тем не менее, геологические данные, особенно содержания проб, часто показывают распределения, которые отличаются от нормального распределения. Во множестве случаев натуральный логарифм значений имеет нормальное распределение. Такое распределение называется Логнормальное распределение.

Данные, скорее всего, будут нормально распределены, если их можно характеризовать как данные, содержащие большое количество наблюдений (результатов) на низких значениях и длинный хвост высоких значений. Наиболее высокими значениями могут быть множество порядков магнитуды выше низких значений. Например, среднее содержание золота в минерализованной зоне может быть 2.5 г/т, но может также существовать выдержанный диапазон значений в порядке увеличения 1,000 г/т

Данные, которые имеют почти логнормальное распределение часто могут быть трансформированы в логнормальные данные с использованием аддитивной постоянной. Она добавляется ко всем значениям до преобразования в натуральный логарифм. Она будет иметь больший эффект на низкие значения, чем на высокие. (Например, если аддитивная постоянная равна 2, добавление ее к значению 0.05 даст относительно большее увеличение данных, чем добавление ее к значению 555.) Использование аддитивной постоянной особенно полезно при работе с такими данными как содержания золота, которые имеют много значений около или ниже предела обнаружения. Эти значения способствуют искажению нижнего предела распределения данных.