Технологии машинного обучения в практике моделирования технологических показателей извлечения металла

Снизить затраты на геолого-технологическое картирование (ГТК) рудных месторождений возможно расчитывая технологические показатели руды аналитическим методом через их зависимость от данных химического и минералогического анализа. Перспективность аналитического подхода основана на более низкой трудоемкости выполнения работ в сочетании с высокой экспрессностью и надежностью оценок технологических характеристик руд. Это уже было ранее апробировано при выполнении нескольких проектов ГТК месторождений Кедровое, Морозкинское, Вернинское и др.

В рассматриваемом ниже проекте геолого-технологического картирования одного из золотосеребряных месторождений изучалась возможность предсказания типов руд, исходя только из данных химического состава, которые могут быть массово получены при выполнении геологоразведочных работ.

Для анализа наличия зависимостей между технологическими показателями извлечения и химическим составом руд выполнялась обработка данных следующими аналитическими методами:

• Регрессионный анализ (MR — linear multiple regression) как один из наиболее известных статистических методов, в основе которого лежит возможность по значению одного или нескольких признаков (которые называются предикторами или факторами) сделать прогноз о предполагаемом значение другого признака.

• Предсказания технологических параметров окончательно выполнялись с помощью двух методов машинного обучения — Multivariate Adaptive Regression Splines (MARSpline) и искусственных нейронных сетей (Artificial neural network (ANN)).

Первым этапом анализа для отбора значимых переменных является множественный пошаговый регрессионный анализ. Если случайная величина Y зависит от нескольких независимых переменных x1, x2, …, xn, то исследование зависимости между Y и X составляет предмет множественного регрессионного анализа. Некоторые переменные или предикторы, участвующие в регрессионном анализе, могут оказаться незначимыми. В такой ситуации используют пошаговый отбор факторов. При пошаговой регрессии с исключением в исходную модель вначале включаются все предикторы X (результаты анализа РФА [рентгенофлуоресцентный анализ] по 12 элементам) и производится последовательное исключение тех из них, которые несущественно влияют на отклик Y (Извлечение серебра). При пошаговой регрессии с включением, наоборот, последовательно включаются в модель предикторы в порядке убывания их влияния на отклик.

Таблица 1. Итоговый результат пошагового отбора факторов для исследуемой зависимой переменной — Извлечение серебра

N=248	Итоги регрессии для зависимой переменной: Извлеч. Ag R= .4256 R2= .1812 Скоррект. R2= .1573 F(7,240)=7.5879 p
N=248	БЕТА	Ст.Ош. (БЕТА)	B	Ст.Ош. (B)	t(240)	p-знач.
Св.член			77.69	2.15	36.12	0.00
Au. г/т	0.25	0.06	2.34	0.60	3.93	0.00
Mn. %	-0.32	0.09	-2.28	0.65	-3.51	0.00
Zn. %	0.18	0.08	18.35	8.60	2.13	0.03
Pb. %	-0.18	0.08	-16.13	6.92	-2.33	0.02
Fe. %	0.12	0.07	1.44	0.84	1.72	0.09

Вывод по результатам предварительного регрессионного анализа: качество предсказания технологических показателей извлечения методом пошаговой регрессии, выраженное коэффициентом корреляции 0,43, оценивается как низкое, однако при этом удалось сократить количество предикторов, отсекая менее важные.

Выполняется анализ зависимостей для прогнозирования извлечения серебра (как экономически наиболее значимого показателя в данном проекте) с применением методов машинного обучения.

На данном этапе с помощью первого и наиболее точного из исследуемых методов машинного обучения — метода Multivariate Adaptive Regression Splines (MARSpline) — значительно улучшается качество предсказания технологических показателей извлечения серебра, выраженное высоким коэффициентом корреляции 0,96 и высокой величиной достоверности аппроксимации 0,92. Диаграмма рассеяния и предполагаемый бизнес-эффект применения данной методики прогнозирования, а также возможные риски ошибочного прогноза приведены на рис. 1.

Кроме того, алгоритм машинного обучения также в свою очередь анализирует количество ссылок для каждого из рассматриваемых предикторов и также выбирает наиболее значимые. В результате подтверждается или корректируется (при необходимости) окончательный выбор значимых переменных.

С помощью второго и контрольного метода машинного обучения — метода Искусственных нейронных сетей (ANN) — подтверждается качество предсказания технологических показателей извлечения серебра. Достаточно высокие значения коэффициента корреляции (0,83) и достоверности аппроксимации (0,69) приведены на диаграмме рассеяния на рис. 2.

Таким образом, решающим условием для успешного продолжения технологических исследований является необходимость учитывать следующие выводы и результаты прогнозирования:

а) состав руды неоднороден. Так же, как и содержание полезного компонента, коэффициент извлечения — величина переменная, определенным образом распределенная в трехмерном пространстве;

б) одной из основных проблем технологического моделирования является постоянная ограниченность количества лабораторных определений коэффициента извлечения;

в) качество прогнозирования методами MARS и нейронными сетями оказалась примерно одинаковым. При этом модель MARS является лучшей по качеству прогноза и выдает человекочитаемое уравнение регрессии с указанием в явном виде роли каждого предиктора и поэтому рекомендуется к применению при моделировании.

Выявленные зависимости между обогатимостью руды и вещественными критериями химического состава руд, а также разработанные методики моделирования позволяют выполнить построение геолого-технологической блочной модели, в которой для каждого блока трехмерной модели будут рассчитаны показатели извлечения с более низкой себестоимостью выполнения работ и с высокой точностью и надежностью.

Далее методами блочного моделирования была выполнена интерполяция (с помощью метода обратных расстояний) технологических показателей извлечения серебра, в результате которой для каждой ячейки геологической модели рассчитаны показатели извлечения, которые в свою очередь были рассчитаны благодаря возможности предсказания показателей извлечения серебра, исходя только из данных химического состава, массово полученных методом РФА. На основании построенной блочной модели, включающей интерполяционные значения технологических показателей извлечения серебра, проводилось разделение общего суммарного количества запасов руды на цианируемые и упорные (углистые) руды и оценка возможности селективной выемки отдельных технологических типов и сортов руды.

Классификация (типизация) по обогатимости определяется величиной извлечения серебра (*) и предусматривает два типа руд:

Классификация руды	Извлечение Ag
Рядовая (цианируемая)	80,5% и более
Упорная углистая (направляется на переработку по технологии флотации)	менее 80,5%

Примечание*: Граничное значение извлечения серебра рассчитывается по данным технико-экономических расчетов доходности при переработке руд в зависимости от режимов переработки.

В качестве заверочной модели дополнительно также интерполировались данные прямых (лабораторных) определений показателей извлечения Ag, по которым дополнительно выполнено построение блочной модели по данным прямых (фактических) технологических показателей — таким образом построена Модель Обучающей Выборки. Соответственно выполнено сопоставление интерполяционных значений показателей извлечения по Обучающей Выборке (данные прямых определений показателей извлечения с одной стороны) и Прогнозной (на основе регрессионных зависимостей, с другой стороны) выборкой.

В качестве цифровой проверки с использованием QQ графиков квантилей сравнивались значения показателей извлечения серебра, полученных моделированием по различным выборкам, которые дают возможность сравнить и оценить корреляцию.

Дополнительно по различным выборкам были проанализированы результаты построения геолого-технологической блочной модели на диаграммах анализа частостей относительного количества (долевого соотношения) руды по соответствующим различным значениям извлечения серебра.

Статистическое представление коэффициента извлечения серебра в виде распределения частостей по обучающей (с одной стороны) и прогнозной (с другой стороны) выборке путём их сравнения на гистограмме (см.рис. 4), а также на графике квантилей (см. рис. 3) позволяет удостовериться в надежности оценок, полученных по данным геолого-технологической блочной модели.

Таким образом, на основе данных геолого-технологической блочной модели на выходе были получены следующие практические результаты, проиллюстрированные на рис. 5 и 6:

1. Проведена классификация (типизация) руд по обогатимости. Выделено два типа руд под различные технологии переработки, показанные на рис. 5.

2. Стабилизация качества входящего сырья за счет регулирования шихты на основе использования данных по извлечению серебра, рассчитанных в каждой точке пространства блочной модели, которые достаточно сильно могут отличаться от камеры к камере.

Вывод

Значительное сокращение времени и снижение производственных затрат при высокой степени точности и надёжности прогноза технологических показателей, а также максимальный эффект за счет использования пространственных трехмерных моделей является конечной целью и результатом современных методов моделирования.

Об авторе