Технологии машинного обучения в практике моделирования технологических показателей извлечения металла

Мальцев Е.Н. гл.спец.отдела геологии
НИИПИ ТОМС (С-Петербург)

Снизить затраты на геолого-технологическое картирование (ГТК) рудных месторождений возможно расчитывая технологические показатели руды аналитическим методом через их зависимость от данных химического и минералогического анализа. Перспективность аналитического подхода основана на более низкой трудоемкости выполнения работ в сочетании с высокой экспрессностью и надежностью оценок технологических характеристик руд. Это уже было ранее апробировано при выполнении нескольких проектов ГТК месторождений Кедровое, Морозкинское, Вернинское и др.

В рассматриваемом ниже проекте геолого-технологического картирования одного из золотосеребряных месторождений изучалась возможность предсказания типов руд, исходя только из данных химического состава, которые могут быть массово получены при выполнении геологоразведочных работ.

 

Для анализа наличия зависимостей между технологическими показателями извлечения и химическим составом руд выполнялась обработка данных следующими аналитическими методами:

• Регрессионный анализ (MR — linear multiple regression) как один из наиболее известных статистических методов, в основе которого лежит возможность по значению одного или нескольких признаков (которые называются предикторами или факторами) сделать прогноз о предполагаемом значение другого признака.

• Предсказания технологических параметров окончательно выполнялись с помощью двух методов машинного обучения — Multivariate Adaptive Regression Splines (MARSpline) и искусственных нейронных сетей (Artificial neural network (ANN)).

 

Первым этапом анализа для отбора значимых переменных является множественный пошаговый регрессионный анализ. Если случайная величина Y зависит от нескольких независимых переменных x1, x2, …, xn, то исследование зависимости между Y и X составляет предмет множественного регрессионного анализа. Некоторые переменные или предикторы, участвующие в регрессионном анализе, могут оказаться незначимыми. В такой ситуации используют пошаговый отбор факторов. При пошаговой регрессии с исключением в исходную модель вначале включаются все предикторы X (результаты анализа РФА [рентгенофлуоресцентный анализ] по 12 элементам) и производится последовательное исключение тех из них, которые несущественно влияют на отклик Y (Извлечение серебра). При пошаговой регрессии с включением, наоборот, последовательно включаются в модель предикторы в порядке убывания их влияния на отклик.

 

Таблица 1. Итоговый результат пошагового отбора факторов для исследуемой зависимой переменной — Извлечение серебра

N=248

Итоги регрессии для зависимой переменной: Извлеч. Ag
R= .4256 R2= .1812 Скоррект. R2= .1573
F(7,240)=7.5879 p

БЕТА

Ст.Ош. (БЕТА)

B

Ст.Ош. (B)

t(240)

p-знач.

Св.член

 

 

77.69

2.15

36.12

0.00

Au. г/т

0.25

0.06

2.34

0.60

3.93

0.00

Mn. %

-0.32

0.09

-2.28

0.65

-3.51

0.00

Zn. %

0.18

0.08

18.35

8.60

2.13

0.03

Pb. %

-0.18

0.08

-16.13

6.92

-2.33

0.02

Fe. %

0.12

0.07

1.44

0.84

1.72

0.09

 

Вывод по результатам предварительного регрессионного анализа: качество предсказания технологических показателей извлечения методом пошаговой регрессии, выраженное коэффициентом корреляции 0,43, оценивается как низкое, однако при этом удалось сократить количество предикторов, отсекая менее важные.

 

Выполняется анализ зависимостей для прогнозирования извлечения серебра (как экономически наиболее значимого показателя в данном проекте) с применением методов машинного обучения.

На данном этапе с помощью первого и наиболее точного из исследуемых методов машинного обучения — метода Multivariate Adaptive Regression Splines (MARSpline) — значительно улучшается качество предсказания технологических показателей извлечения серебра, выраженное высоким коэффициентом корреляции 0,96 и высокой величиной достоверности аппроксимации 0,92. Диаграмма рассеяния и предполагаемый бизнес-эффект применения данной методики прогнозирования, а также возможные риски ошибочного прогноза приведены на рис. 1.

Кроме того, алгоритм машинного обучения также в свою очередь анализирует количество ссылок для каждого из рассматриваемых предикторов и также выбирает наиболее значимые. В результате подтверждается или корректируется (при необходимости) окончательный выбор значимых переменных.

 

С помощью второго и контрольного метода машинного обучения — метода Искусственных нейронных сетей (ANN) — подтверждается качество предсказания технологических показателей извлечения серебра. Достаточно высокие значения коэффициента корреляции (0,83) и достоверности аппроксимации (0,69) приведены на диаграмме рассеяния на рис. 2.

 

Таким образом, решающим условием для успешного продолжения технологических исследований является необходимость учитывать следующие выводы и результаты прогнозирования:

а) состав руды неоднороден. Так же, как и содержание полезного компонента, коэффициент извлечения — величина переменная, определенным образом распределенная в трехмерном пространстве;

б) одной из основных проблем технологического моделирования является постоянная ограниченность количества лабораторных определений коэффициента извлечения;

в) качество прогнозирования методами MARS и нейронными сетями оказалась примерно одинаковым. При этом модель MARS является лучшей по качеству прогноза и выдает человекочитаемое уравнение регрессии с указанием в явном виде роли каждого предиктора и поэтому рекомендуется к применению при моделировании.

 

Выявленные зависимости между обогатимостью руды и вещественными критериями химического состава руд, а также разработанные методики моделирования позволяют выполнить построение геолого-технологической блочной модели, в которой для каждого блока трехмерной модели будут рассчитаны показатели извлечения с более низкой себестоимостью выполнения работ и с высокой точностью и надежностью.

 

Далее методами блочного моделирования была выполнена интерполяция (с помощью метода обратных расстояний) технологических показателей извлечения серебра, в результате которой для каждой ячейки геологической модели рассчитаны показатели извлечения, которые в свою очередь были рассчитаны благодаря возможности предсказания показателей извлечения серебра, исходя только из данных химического состава, массово полученных методом РФА. На основании построенной блочной модели, включающей интерполяционные значения технологических показателей извлечения серебра, проводилось разделение общего суммарного количества запасов руды на цианируемые и упорные (углистые) руды и оценка возможности селективной выемки отдельных технологических типов и сортов руды.

 

Классификация (типизация) по обогатимости определяется величиной извлечения серебра (*) и предусматривает два типа руд:

Классификация руды

Извлечение Ag

Рядовая (цианируемая)

80,5% и более

Упорная углистая (направляется на переработку по технологии флотации)

менее 80,5%

 

Примечание*: Граничное значение извлечения серебра рассчитывается по данным технико-экономических расчетов доходности при переработке руд в зависимости от режимов переработки.

 

В качестве заверочной модели дополнительно также интерполировались данные прямых (лабораторных) определений показателей извлечения Ag, по которым дополнительно выполнено построение блочной модели по данным прямых (фактических) технологических показателей — таким образом построена Модель Обучающей Выборки. Соответственно выполнено сопоставление интерполяционных значений показателей извлечения по Обучающей Выборке (данные прямых определений показателей извлечения с одной стороны) и Прогнозной (на основе регрессионных зависимостей, с другой стороны) выборкой.

В качестве цифровой проверки с использованием QQ графиков квантилей сравнивались значения показателей извлечения серебра, полученных моделированием по различным выборкам, которые дают возможность сравнить и оценить корреляцию.

Дополнительно по различным выборкам были проанализированы результаты построения геолого-технологической блочной модели на диаграммах анализа частостей относительного количества (долевого соотношения) руды по соответствующим различным значениям извлечения серебра.

 

Статистическое представление коэффициента извлечения серебра в виде распределения частостей по обучающей (с одной стороны) и прогнозной (с другой стороны) выборке путём их сравнения на гистограмме (см.рис. 4), а также на графике квантилей (см. рис. 3) позволяет удостовериться в надежности оценок, полученных по данным геолого-технологической блочной модели. 

 

Таким образом, на основе данных геолого-технологической блочной модели на выходе были получены следующие практические результаты, проиллюстрированные на рис. 5 и 6:

1. Проведена классификация (типизация) руд по обогатимости. Выделено два типа руд под различные технологии переработки, показанные на рис. 5.

2. Стабилизация качества входящего сырья за счет регулирования шихты на основе использования данных по извлечению серебра, рассчитанных в каждой точке пространства блочной модели, которые достаточно сильно могут отличаться от камеры к камере.

 

Вывод

Значительное сокращение времени и снижение производственных затрат при высокой степени точности и надёжности прогноза технологических показателей, а также максимальный эффект за счет использования пространственных трехмерных моделей является конечной целью и результатом современных методов моделирования.

 

Об авторе

 


-4+3
Уникальные посетители статьи: 1019, комментариев: 9       

Комментарии, отзывы, предложения

Николай , 13.12.22 10:40:00

Заменить ГТК на компьютерную обработку химических анализов, может быть хорошо и наверняка дешевле. Но ваше утверждение "при высокой степени точности и надёжности" - ничем не подтверждено. Геологические данные у вас есть?

Мальцев, 13.12.22 16:10:05 — Николаю

На ваш взгляд, не подтверждают высокую достоверность прогноза ? следующие результаты:

1. диаграммы на рис 1-4

2. По результатам аналитической проверки и сопоставления получается, что максимальное относительное расхождение между фактическими значениями коэффициента извлечения по данным лабораторных тестов ( с одной стороны) и спрогнозированными значениями коэффициента извлечения серебра на основе зависимостей между обогатимостью руды и химическим составом по замера РФА (с другой) составило - 17 %. При этом, количество проб, где это расхождение превышает 5 % (составляет всего 52 пробы от общего количества 248 проб в обучающей выборке)

Тогда по вашему что является подтверждением ?

Геологические данные - это понятие очень широкое и поэтому вопрос не понятен.

Василий Кокушев, 15.12.22 16:55:34 — всем

Удивительно, но на интереснейшую тему один скромный вопрос.

Не потому ли, что не за что больно укусить.

Подобная работа была проведена на месторождении Удокан в Забайкалье.

Выводов сделать нет возможности.

Для заверки прогнозов необходимо серьезно расширять лабораторию. Пока не достает рупий.

Поэтому вопрос о полезности повис в воздухе.

Магадан, 16.12.22 02:10:57 — Мальцеву Е.Н.

Спасибо, Евгений Николаевич, что пытаетесь рассказать о новых делах и возможностях. Будем надеяться, что компьютерное моделирование не умрет на наших предприятиях.

Уточните пожалуйста, что надо для использования вашего метода?

Какие программы и технику должно иметь предприятие?

Василий Кокушев, 17.12.22 09:04:48 — Мальцеву

"При этом модель MARS является лучшей по качеству прогноза и выдает человекочитаемое уравнение регрессии с указанием в явном виде роли каждого предиктора и поэтому рекомендуется к применению при моделировании".

Евгений. Просьба немного рассказать о модели MARS. Какой софт вы использовали?

Мальцев, 17.12.22 14:31:03

Полезность исследований доказывается на практике (если я правильно понял, Василий, ваш первый комментарий) и соответственно становится понятно какой бизнес-эффект дают сравнительно небольшие затраты на эти исследования. Основную долю самих затрат на исследования составляют затраты на лабораторные технологические тесты (как в данном проекте – бутылочные тесты). Массовые замеры РФА (в описываемом проекте) были уже проведены в составе ГРР и предоставлены предприятием заказчика . Для выполнения анализа и моделирования требуется только знание и квалификация специалиста, но с учетом общей девальвации квалифицированного наемного труда в стране – это совсем мизерные затраты. Ответ на вопрос с софтом для блочного моделирования думаю большинству понятен, что - это Micromine (в моем случае) и ему аналогичные ГГИС. С разным софтом для машинного обучения и нейронных сетей я знаком еще недостаточно хорошо и рекомендовать что-то не берусь . Мой скромный опыт начинался с модуля Регрессия в обычном Екселе (на нем кстати сделана первая регрессионная модель, описанная в статье https://zolotodb.ru/article/12213 ) , дальше были Statistica ( модуль SAAN) и Matlab . Модели MARS и AAN (метод Искусственных нейронных сетей) которые строит SAAN это по сути тоже регрессионные зависимости, дающие более точный прогноз за счет способности самообучения .

Интересно было бы узнать о подобной работе на месторождении Удокан !

Василий Кокушев, 19.12.22 09:37:36 — Мальцеву

Kokushev@mail.ru

Пишите. Свяжемся.

ааа, 19.12.22 13:04:45

Спасибо автору за интересную публикацию. Принцип понятен, логичен и, естественно, это будет работать. Единственное прокомментирую, что восприятие нейронных сетей в современных реализациях многими не верно воспринимается как самообучение. Это все же случайный подбор параметров для решения очень узкой задачи. Пока до самообучающихся систем мы все же не дошли.

Мальцев, 20.12.22 10:09:34

Возможно, в терминологии могу быть немного не точен, но главное, как вы правильно заметили, - ЭТО работает. Спасибо за интерес, вопросы и поддержку!

Уважаемые посетители сайта! Пожалуйста, будьте как дома, но не забывайте, что в гостях. Будьте вежливы, уважайте родной язык и следите за темой: «Технологии машинного обучения в практике моделирования технологических показателей извлечения металла»


Имя:   Кому:


Введите ответ на вопрос (ответ цифрами) "один прибавить 1":