Study of the efficiency of machine learning algorithms based on data of various rocks

Bakhytzhan K. Assilbekov; Бакытжан Калжанович Асилбеков; Асилбеков Бакытжан Калжанович; Nurlykhan Ye. Kalzhanov; Нұрлыхан Ерланұлы Қалжанов; Қалжанов Нұрлыхан Ерланұлы; Darezhat A. Bolysbek; Дәрежат Абілсеитұлы Болысбек; Болысбек Дәрежат Абілсеитұлы; Kenboy Sh. Uzbekaliyev; Кенбой Шералиугли Узбекалиев; Узбекалиев Кенбой Шералиугли; Bakbergen Ye. Bekbau; Бақберген Ермекбайұлы Бекбау; Бекбау Бақберген Ермекбайұлы; Alibek B. Kuljabekov; Алибек Бахиджанович Кульджабеков; Кульджабеков Алибек Бахиджанович

doi:10.54859/kjogi108649

Исследование эффективности алгоритмов машинного обучения на основе данных различных горных пород

Авторы: Асилбеков Б.К.¹^,2, Қалжанов Н.Е.²^,3, Болысбек Д.А.¹^,3, Узбекалиев К.Ш.¹, Бекбау Б.Е.¹, Кульджабеков А.Б.¹^,2
Учреждения:
1. Satbayev University
2. KBTU BIGSoft
3. Казахский национальный университет имени аль-Фараби
Выпуск: Том 5, № 3 (2023)
Страницы: 5-19
Раздел: Геология и геофизика
URL: https://vestnik-ngo.kz/2707-4226/article/view/108649
DOI: https://doi.org/10.54859/kjogi108649
ID: 108649

Цитировать

Полный текст

Аннотация
Полный текст
Об авторах
Список литературы
Дополнительные файлы
Статистика

Аннотация

Обоснование. Абсолютная проницаемость играет важную роль в изучении течения жидкостей в пористых средах при разработке нефтегазовых месторождений, закачке СО₂ в пласты для хранения, мониторинге миграции загрязнителей в подземных водоносных слоях, а также моделировании каталитических систем. Следовательно, точная и оперативная оценка её значений является актуальной задачей.

Цель. Целью настоящей статьи является изучение применимости методов машинного обучения для прогнозирования абсолютной проницаемости карбонатных образцов, а также путей улучшения прогноза проницаемости.

Материалы и методы. В качестве входных используются данные 408 мини-объемов, отобранные из четырех цилиндрических карбонатных образцов, практически полностью состоящих из кальцита. Входные данные включают общую и связанную пористости, удельную площадь поверхности, радиусы всех пор, а также радиусы только соединенных между собой пор, координационные числа, радиусы и длины горловины пор, извилистость и абсолютную проницаемость. Оценка проницаемости осуществляется с помощью регрессионных методов машинного обучения, таких как метод случайного леса, чрезвычайно случайных деревьев и модифицированный метод повышения градиента. Параметры (данные) мини-объемов были определены при помощи поромасштабного моделирования течения воды в их поровом пространстве с применением специализированного программного пакета Avizo.

Результаты. Были проанализированы данные мини-объемов, отобранные из трещиноватого и нетрещиноватых образцов, и результаты показали, что имеются хорошие взаимосвязи между многими параметрами мини-объемов. Например, связанная и общая пористости имеют полиномиальную взаимосвязь второй степени с высоким коэффициентом корреляции. С помощью вышесказанных регрессионных методов машинного обучения были спрогнозированы значения абсолютной проницаемости при разделении входных данных на данные обучения и тестирования в соотношении 80/20 и 70/30.

Заключение. Использование логарифма проницаемости, а также раздельное рассмотрение трещиноватого и нетрещиноватых образцов позволили увеличить точность прогноза абсолютной проницаемости с применением вышеупомянутых методов машинного обучения до 90%. Метод чрезвычайно случайных деревьев является наиболее точным из трех рассмотренных методов машинного обучения для нашей задачи.

Ключевые слова

машинное обучение, Random Forest, XGBoost, Extra Trees, абсолютная проницаемость, карбонатная порода, рентгеновская микрокомпьютерная томография

Полный текст

Введение

Абсолютная проницаемость является важной макроскопической характеристикой при течении жидкостей в поровом пространстве горных пород, и её определение является актуальной задачей, например, при оценке рациональности разработки нефтегазовых месторождений и эффективности закачки СО₂ в пласты, эффективности работ каталитических систем, загрязненности подземных вод и т.д. Обычно ищется зависимость между проницаемостью и другими характеристиками пористых материалов на основе множественных лабораторных измерений на керновых образцах, что занимает много времени и требует специального оборудования. Кроме этого, лабораторные условия позволяют осуществлять измерения проницаемости керновых материалов только в сантиметровом масштабе, что является грубоватой оценкой проницаемости, а течение жидкостей в пористых средах происходит в масштабе пор, и, следовательно, должны быть учтены более мелкие масштабы при оценке проницаемости пород.

Альтернативным способом определения проницаемости пород является расчёт по аналитическим формулам. Широко используемым является уравнение Козени-Кармана, которое связывает проницаемость k с пористостью ф, удельной площадью поверхности и извилистостью пористой среды [1, 2]. Однако уравнение Козени-Кармана дает неправильные значения k для большинства реальных пористых материалов [2, 3]. В литературе также широко используются уравнения, описывающие связь между проницаемостью и общей пористостью k~фⁿ [4–6], проницаемостью и связанной пористостью k ~ фⁿ_con. [7], проницаемостью и перколяционным порогом пористости k~(ф – ф_с)ⁿ (n – показатель степени) [7, 8]. Кроме этого, применяется уравнение, связывающее проницаемость с характерным размером пористой среды l: k~фl²[9, 10]. Однако вышеприведенные уравнения имеют как свои преимущества, так и недостатки, и их применимость ограничена такими факторами, как точность расчётов, сложная поровая структура горных пород и труднодоступность многих параметров (связанная пористость, перколяционный порог пористости, характерный размер среды).

За последнее десятилетие машинное обучение стало довольно популярным инструментом в классификации, регрессии и обработке изображений, которые встречаются в различных задачах. Прогнозирование проницаемости пористых сред осуществляется с применением регрессионных методов машинного обучения и методов глубокого машинного обучения. Для прогнозирования проницаемости методы глубокого машин- ного обучения используют изображения горных пород как входные данные, полученные с помощью рентгеновской микрокомпьютер- ной томографии, и в качестве метода обуче- ния применяются свёрточные нейронные сети [11, 12].

Регрессионные методы машинного обучения широко применяются при прогнозировании проницаемости пористой среды, т.к. они являются более удобными в реализа- ции и не требуют изображений образцов в обучающих целях, что не всегда доступно. Эти методы также подходят при классификации типов пород по их петрофизическим характеристикам [13] и прогнозировании проницаемости пород по данным геофизического исследования скважин (далее – ГИС) [14, 15].

Erofeev и др. [16] применили несколько регрессионных методов машинного обучения для прогнозирования изменения пористости и проницаемости после удаления соли из 102 керновых материалов. Их результаты показали, что лучшими методами среди использованных оказались метод опорных векторов и нейронные сети. Они также отметили, что количество независимых признаков (входных параметров) заметно влияет на результаты прогнозирования пористости и проницаемости. Так, например, при использовании всего одного признака для прогнозирования пористости достоверность прогноза составила 69%, а в случае использования всех доступных признаков этот показатель составил 90%.

Tembely и др. [17] использовали регрессионные методы машинного обучения вместе с методами глубокого машинного обучения для прогнозирования абсолютной проницаемости пород на основе данных 1159 карбонатных образцов. В качестве входных признаков для построения моделей были использованы пористость, фактор образования и проницаемость, вычисленная с помощью поросетевого моделирования. Результаты показали, что лучшими методами оказались модифицированный метод повышения градиента (XGBoost) и глубокие нейронные сети, которые спрогнозировали проницаемости с достоверностью 90% и 92% соответственно.

Rezaee и Ekundayo [14] показали, что метод градиентного спуска (GBoost) и случайного леса (Random Forest) являются наиболее мощными во время теста и валидации, хотя GBoost показал наихудший результат при проведении слепого теста. Они использовали данные ГИС в качестве входных признаков в методы машинного обучения, но авторы выбрали искусственные нейронные сети как самый лучший метод для прогнозирования проницаемости пород, т.к. он даёт практически одинаковые результаты при различных количествах признаков и является самым быстрым.

Mohammadian и др. [13] изучили влияние классификации пород по их типу на результаты прогнозирования абсолютной проницаемости с помощью XGBoost. Они показали, что, если произвести классификацию пород по их индексу зоны течения (FZI), можно достичь высокой точности прогнозирования проницаемости пород. Авторы получили проницаемости с помощью метода машинного обучения с 97%-й точностью по данным 128 образцов кернов, для которых диапазон изменения проницаемости составил 0,11–122,7 мД.

В настоящей статье изучаются пути улучшения прогноза абсолютной проницаемости методами машинного обучения. Разделение данных по признаку трещиноватости и использование логарифма проницаемости вместо самой проницаемости привело к заметному улучшению результатов прогноза проницаемости.

Материалы и методы

Обучение и тестирование методов машинного обучения проводились по данным 408 мини-объемов (объемом около 512 мм³), которые были отобраны из 4 карбонатных цилиндрических образцов до и после закачки в них растворов соляной кислоты. На рис. 1 (а) показаны трехмерные цифровые модели цилиндрических образцов №2, 7, 10 и 13, которые были испытаны во время проведённых нами экспериментов по закачке кислотных растворов [18]. Тёмно-синими областями на светло-синем фоне выделены каналы растворения. Диаметр и длина образцов составили около 3 и 5 см соответственно. Результаты рентгеновской дифрактометрии показали, что все образцы практически полностью состоят из кальцита, содержание кварца составляет менее 1%. Краткая информация по кислотным растворам и образцам до и после закачки, приведена в табл. 1. Трехмерные цифровые модели образцов до и после закачки кислотных растворов были построены с помощью программного пакета Avizo на основе их томографических изображений.

Рисунок 1. 3D цифровые модели образцов (а), отбор мини-объемов (б) и отображение имеющихся трещин в образце №2 (в)

Figure 1. 3D digital models of samples (a), extraction of small volumes (b) and display of existing fractures in sample #2 (c)

Таблица 1. Краткая информация по кислотным растворам и образцам до и после закачки Table 1. Summary of acid solutions and samples before and after injection

№ образца Sample number	Пористость до закачки, % Porosity (before injection), %	Концентрация HCl в растворе, % HCl concentration in solution, %	Скорость закачки, мл/мин Injection rate, ml/min	Проницаемость до закачки, µм² Permeability (before injection), µm²	Проницаемость после закачки, µм² Permeability (after injection), µm²
2	20,6	18	8	0,43	3,79
7	20,9	12	8	0,71	3,85
10	19,0	18	2	0,29	0,98
13	20,0	12	4	0,45	4,1

Процесс отбора кубических мини- объемов из цилиндрических образцов схематически проиллюстрирован на рис. 1 (б), где красный квадрат обозначает место отбора. Идентичность мини-образцов из цифровой модели одного и того же образца до и после закачки кислотного раствора была максимально обеспечена. Поровые пространства отобранных мини-объемов, которые далее использовались для построения поровой сети, показаны синим на рис. 1 (б). Отметим, что образец №2 имеет явно выраженные трещины, направление которых показаны красной линией на рис. 1 (в). С целью отображения трещин показаны изображения только разного сечения образца, где Z показывает их расстояние от входного сечения. Также отметим, что основной целью отбора мини-объемов являлось увеличение количества пористых сред для формирования входного слоя в методы машинного обучения.

После того как были отобраны мини-объемы, были извлечены их поровые се- ти (рис. 1, в). Затем была проведена симуляция течения воды на поровых сетях мини-объемов с помощью подходов поромасштабного моделирования с целью расчёта их микроскопических и макроскопических характеристик (табл. 2). Поромасштабное моделирование было проведено с помощью программного пакета Avizo.

Таблица 2. Наименование рассчитанных характеристик мини-объемов Table 2. Name of the computed characteristics of small volumes

Удельная площадь поверхности (S), µм^-1

Specific surface area (S), µm^-1

Связанная пористость (ф_с)

Connected porosity (ф_с)

Общая пористость (ф_t)

Total porosity (ф_t)

Радиус всех пор

(r_p), µм

Radius of all pores

(r_p), µm

Извилистость (τ)

Tortuosity (τ)

Координационное число (N_c)

Coordination number (N_c)

Радиус горловины (r_t), µм

Throat radius

(r_t), µm

Длина горловины (l_t), µм

Throat length

(l_t), µm

Радиус связанных пор (r_pc), µм

Radius of connected pores (r_pc), µm

Проницаемость (k), µм²

Permeability

(k), µm²

В качестве методов машинного обучения были выбраны метод случайного леса (Ran- dom Forest), модифицированный метод повышения градиента (XGBoost) и чрезвычайно случайных деревьев (Extra Trees). Все характеристики мини-образцов, кроме проницаемости, были использованы в качестве входных данных методов машинного обучения, а проницаемость являлась целевой переменной, которую нужно прогнозировать. Отметим, что управляемые параметры всех рассмотренных методов машинного обучения были использованы по умолчанию. Метод Random Forest основан на использовании множеств независимых друг от друга деревьев решений, в котором окончательное значение прогнозируемой величины получается осреднением прогнозов по всем деревьям решения [16]. Метод XGBoost является более упорядоченной формой обычного метода повышения градиента и использует расширенную регуляризацию, которая улучшает возможности обобщения модели. XGBoost обеспечивает более высокую производительность по сравнению с обычным методом повышения градиента [19]. Метод Extra Trees является методом, основанным на алгоритме оптимизации обучения методом наименьших квадратов [20]. Методы Extra Trees и Random Forest создают множество деревьев решений, но выборка для каждого дерева является случайной, без замены. Это создаёт набор данных для каждого дерева с уникальными образцами.

Результаты и их обсуждения

Прогноз проницаемости методами машинного обучения

Прежде чем прогнозировать проницаемость, был проведен анализ исходных данных. На рис. 2 (а) показана визуализация исходных данных в виде попарных зависимостей между каждыми признаками и диаграммы распределения каждого признака. Как видно на рисунке, имеется четкая взаимосвязь между всеми признаками, за исключением взаимосвязи между извилистостью и остальными признаками. Извилистость остаётся практически постоянной. Отметим, что проницаемость меняется в очень широком диапазоне (0,0002–893 µм²) со средним значением в 6,3 µм², следовательно, распределение проницаемости проиллюстрировано не лучшим образом. В связи с этим далее в статье рассмотрен логарифм от проницаемости вместо самой проницаемости в целях улучшения не только её распределения, но и прогноза её значений.

Рисунок 2. Попарные зависимости (а) и корреляционная матрица (б) исходных данных

Figure 2. Pairwise (a) and correlation matrix (b) for the initial data

На рис. 2 (а) видна чёткая взаимосвязь между связанной и общей пористостями, которая подтверждается высоким коэффициентом корреляции (0,99) (рис. 2, б). Общая пористость образца породы может быть высокой, но, как известно, течение жидкостей в поровом пространстве в основном характеризуется связанной пористостью, т.е. пористостью соединенных между собой пор образца. В среднем для большинства горных пород связанная пористость состав- ляет приблизительно 85–95% общей пористости. В нашем случае этот показатель составляет 86%.

Взаимосвязь между связанной и общей пористостями позволяет определить так называемый перколяционный порог пористости ф_p, ниже которого поровое пространство образца считается непроводимым, т.е. проницаемость превращается в ноль [7]. Знание перколяционного порога пористости позволяет оценить вместительные и транспортные свойства пород, например, для закачки воды или газа с целью вытеснения нефти из плас- тов или перед закачкой СО₂ в пласты для дальнейшего его хранения. В настоящем исследовании ф_p был определен как положительный корень квадратного уравнения ф_c= –1,48ф²_t+ 1,71ф_t– 0,09, которое описывает взаимосвязь между связанной и общей пористостями, и составил ≈5%.

Из рис. 2 (а) также заметим, что удельная площадь поверхности S имеет корреляцию со многими признаками. Особенно важной является взаимосвязь между S и пористостью с коэффициентом корреляции -0,49 (рис. 2, б). Koponen et al. [7] описывали взаимосвязь между S и пористостью уравнением S=–2ф_tlnф_t/18,6. В нашем случае данная связь описывалась линейным уравнением S=–0,061ф_t+ 0,036 с коэффициентом корреляции 0,24. Раздельное рассмотрение трещиноватого и нетрещиноватых образцов привело к уравнениям S=–0,099ф_t+ 0,037 и S=–0,077ф_t+ 0,041 с коэффициентами корреляции 0,72 и 0,61 соответственно.

Рис. 2 (а) раскрывает линейную взаимосвязь между радиусом и длиной горловины пор с высоким коэффициентом корреляции 0,96 (рис. 2, б). Это означает, что вместе с ростом радиуса горловины длина горловины также растёт, например, во время растворения породы при закачке кислотных составов в образцы, что указывает на объединение/укрупнение пор.

На рис. 2 (б) показаны коэффициенты корреляции между признаками, где красный цвет указывает на прямые корреляции, а синий – на обратные. Как видно, удельная площадь поверхности имеет обратные связи с остальными признаками, за исключением извилистости. Как показывает рис. 2 (б), целевая переменная (проницаемость) имеет низкие коэффициенты корреляции с входными признаками, т.к. проницаемость имеет нелинейный характер при изменении входных признаков. Рис. 2 (б) указывает на очень важный фактор – исключение тех входных признаков, которые имеют очень высокие коэффициенты корреляции с остальными входными признаками из общего количества признаков. Например, можно исключить либо общую пористость, либо связанную пористость, т.к. они имеют чёткую взаимосвязь между собой. Благодаря лёгкому, по сравнению со связанной пористостью, определению общей пористости, очевидно, что нужно оставить общую пористость в общем количестве входных признаков. Уменьшение количества входных признаков позволяет снизить время обучения и прогноза.

На рис. 3 показаны прогнозированная и истинная проницаемости мини-объемов при разделении входных данных в соотношении 70/30 (рис. 3, а) и 80/20 (рис. 3, б).

Рисунок 3. Прогнозная и истинная проницаемости при разделении данных в соотношении 70/30 (а) и 80/20 (б)

Figure 3. Predicted and true permeability for data division in the ratio of 70/30 (a) and 80/20 (b)

Как видно на рис. 3, все рассмотренные методы машинного обучения прогнозировали проницаемость с низкими коэффициентами достоверности при обоих соотношениях разделения входных данных. Низкие значения проницаемости были переоценены, указывая на то, что распределение проницаемости имеет нелинейный характер при низких значениях пористости.

Наоборот, высокие значения проницаемости (>1 µм²), полученные с помощью методов машинного обучения, близко находятся к истинным значениям проницаемости. Плохая прогнозирующая способность рассмотренных методов машинного обучения низких проницаемостей также может быть связана с присутствием данных мини-объемов, отобранных из трещиноватого образца. Далее используется логарифм проницаемости вместо самой проницаемости и отдельно рассматривается трещиноватый образец с целью улучшения прогнозирующей способности методов машинного обучения при низких значениях проницаемости.

Значимость входных признаков при прогнозировании проницаемости методами Random Forest, Extra Tree и XGBoost показана на рис. 4. Как видно на рисунке, Random Forest и XGBoost считали извилистость и удельную площадь поверхности наиболее важными при прогнозировании, тогда как Extra Tree выбрал наиболее важными извилистость и пористость. Отметим, что эти параметры являются основными составляющими факторами в уравнении Козени-Кармана.

Рисунок 4. Значимость входных признаков при прогнозировании проницаемости методами Random Forest (слева), Extra Tree (в центре) и XGBoost (справа)

Figure 4. Feature importances in permeability prediction using Random Forest (left), Extra Tree (center), and XGBoost (right) methods

Использование логарифма проницаемости

Здесь и далее будем использовать (натуральный) логарифм проницаемости вместо самой проницаемости. Логарифмическая функция резко меняется в интервале (0; 1], и это позволяет считать низкие значения проницаемости наиболее сопоставимыми с ее высокими значениями в логарифмической шкале.

Повторное прогнозирование проницаемости показало, что взаимосвязи между логарифмом проницаемости и входными признаками явно выражены (рис. 5–6) по сравнению со случаем, когда использовалась абсолютная проницаемость (рис. 2, а). Рис. 5 (б) показывает, что коэффициенты корреляции между логарифмом проницаемости и входными признаками существенно увеличились. Например, если коэффициенты корреляции проницаемости с общей пористостью и удельной площадью поверхности составили 0,23 и -0,28 (рис. 2, б) соответственно, то в случае использование логарифма проницаемости эти коэффициенты соответственно выросли до 0,67 и -0,68 (рис. 5, б). Это означает, что логарифм проницаемости имеет лучшую корреляцию с входными признаками, чем просто проницаемость. Причиной этому может быть то, что в общем случае связь между проницаемостью и другими параметрами пористой среды является нелинейной (степенной закон).

Рисунок 5. Попарные зависимости (а) и корреляционная матрица (б) исходных данных

Figure 5. Pairwise (a) and correlation matrix (b) for the initial data

Как показывает рис. 6, все три рассмотренных метода машинного обучения показали лучшие результаты по сравнению со случаем использования самой проницаемости в качестве целевой переменной. Коэффициенты достоверности прогноза этими методами превысили 80% (рис. 6), тогда как эти коэффициенты имели значения чуть больше 10% в случае использования самой проницаемости (рис. 3). Основной причиной улучшения было адекватное прогнозирование низких проницаемостей, которые стали гораздо ближе к истинным значениям проницаемости. Отметим, что сначала был прогнозирован логарифм проницаемости, после чего обратно преобразовали его к самой проницаемости, чтобы сравнить с истинной проницаемостью. Использование большего количества входных данных для обучения (рис. 6, б) слегка улучшило результаты прогноза проницаемости. Отметим, что метод Extra Tree показал сравнительно лучшие результаты.

Рисунок 6. Прогнозная и истинная проницаемости при разделении данных в соотношении 70/30 (а) и 80/20 (б)

Figure 6. Predicted and true permeability for data division in the ratio of 70/30 (a) and 80/20 (b)

Рисунок 7. Попарные зависимости и диаграммы распределения данных мини-объемов, отобранные из нетрещиноватых (а) и трещиноватых (б) образцов

Figure 7. Pair-plots and distribution diagrams of small volumes, extracted from non-fractured (a) and fractured (b) samples

Как видно из рис. 8, наблюдается укрепление связи между логарифмом проницаемости и входными признаками для образцов без трещин по сравнению с трещиноватым образцом. Например, если коэффициент корреляции между логарифмом проницаемости и общей пористостью для трещиноватого образца равняется 0,63 (рис. 8, б), то этот же коэффициент для образцов без трещин составляет 0,85 (рис. 8, а). Подобная крепкая связь наблюдается и для остальных признаков, кроме извилистости, для которой наоборот данный коэффициент уменьшился.

Рисунок 8. Корреляционная матрица между исходными данными мини-объемов, отобранными из нетрещиноватых (а) и трещиноватых (б) образцов

Figure 8. Correlation matrix for the initial data of small volumes, extracted from non-fractured (a) and fractured (b) samples

Спрогнозированные с помощью рассмотренных методов машинного обучения проницаемости в сопоставлении с истинными проницаемостями для образцов с трещинами и без приведены на рис. 9 и 10. Как наглядно показано на рисунках, точность прогноза проницаемости улучшилась, когда из общего количества данных удалили данные трещиноватого образца (рис. 9). Коэффициент достоверности прогноза при обоих разделениях входных данных достиг практически 90% (рис. 9). Все три рассмотренных метода показали практически одинаковые результаты. В случае, когда отдельно рассматривали трещиноватый образец (рис. 10), точность прогноза проницаемости была выше, чем когда все образцы были рассмотрены вместе (рис. 6). Из рис. 10 можно заметить, что разброс в рас- пределениях параметров трещиноватого образца передавался в прогнозные значения проницаемости.

Рисунок 9. Прогнозная и истинная проницаемости мини-объемов, отобранные из нетрещиноватых образцов, при разделении данных в соотношении 70/30 (а) и 80/20 (б)

Figure 9. Predicted and true permeabilities of small volumes extracted from non-fractured samples for the data division in a ratio of 70/30 (a) and 80/20 (b)

Рисунок 10. Прогнозная и истинная проницаемости мини-объемов, отобранные из трещиноватого образца, при разделении данных в соотношении 70/30 (а) и 80/20 (б)

Figure 10. Predicted and true permeabilities of small volumes extracted from a fractured sample for the data division in a ratio of 70/30 (a) and 80/20 (b)

Далее проведены два слепых теста с целью спрогнозировать проницаемости мини-объемов трещиноватого образца, обучая и тестируя методы машинного обучения на данных мини-образцов, отобранных из нетрещиноватых образцов (рис. 11, а) и наобо- рот (рис. 11, б). С этой целью использовали только метод Extra Trees, т.к. он показал лучшие результаты по сравнению с остальными. Данные в обоих случаях были разделены в соотношении 80/20, т.е. 80% на обучение, а 20% – на тестирование. После того как Extra Trees был обучен и тестирован на данных мини-объемов, отобранных из нетрещиноватых образцов, проницаемости мини-объемов трещиноватого образца были прогнозированы. После этого Extra Trees обучается на данных мини-объёмов из трещиноватого образца, чтобы спрогнозировать проницаемости мини-объёмов из нетрещиноватых образцов.

Рисунок 11. Прогнозная и истинная проницаемости мини-объемов, отобранные из трещиноватого (а) и нетрещиноватых (б) образцов, во время слепых тестов

Figure 11. Predicted and true permeabilities of small volumes extracted from (a) fractured and (b) non-fractured samples during blind tests

Прогнозированная с помощью Extra Trees и истинная проницаемости мини-образцов трещиноватого и нетрещиноватых образцов показаны на рис. 11. Как показывает этот рисунок, машинное обучение спрогнозировало проницаемости с точностью 52% (рис. 11, а) и 59% (рис. 11, б) во время слепых тестов, хотя точность была высокой (около 90%) во время обычных тестов. Это означает, что используемые данные для обучения, обычного и слепых тестов должны иметь похожую структуру, чтобы достичь максимальной точности прогнозов, или же следует использовать уже классифицированные данные образцов, по крайней мере, по их поровой структуре (трещиноватость, однородность и кавернозность).

Заключение

В статье были рассмотрены регрессионные методы Random Forest, XGBoost и Extra Trees для прогнозирования абсолютной проницаемости 408 мини-объемов карбонатных образцов, которые практически полностью состоят из кальцита. Входные данные включали девять параметров и один выходной параметр (абсолютная проницаемость). Параметры мини-объемов были определены при помощи поромасштабного моделирования течения воды в их поровом пространстве с применением специализированного программного пакета Avizo. По результатам исследования можем сделать следующие выводы:

Связанная и общая пористости имеют полиномиальную взаимосвязь ф_c= –1,48ф²_t+ 1,71ф_t– 0,09 с коэффициентом корреляции 0,99. Это позволило определить перколяционный порог пористости для рассмотренных карбонатных образцов, значение которого составило ≈5%. Это означает, что 5% порового пространства является непроводимым, и абсолютная проницаемость превращается в ноль.
Удельная площадь поверхности зерен линейно коррелирует с общей пористостью соотношениями S = –0,099ф_t+ 0,037 и S = –0,077ф_t+ 0,041 для трещиноватого и нетрещиноватых образцов соответственно. Коэффициенты корреляции составили 0,72 и 0,61. Это позволяет использовать уравнение Козени-Кармана для оценки абсолютной проницаемости образца при отсутствии данных по удельной площади поверхности.
Использование набора данных без какой-либо предобработки привело к прогнозу проницаемости с низкой точностью (9–17%). Использование логарифма проницаемости вместо самой проницаемости позволило повысить точность прогноза абсолютной проницаемости до 86%.
Раздельное рассмотрение трещиноватого и нетрещиноватых образцов позволило увеличить точность прогноза абсолютной проницаемости почти до 90%.
Прогнозная модель, обученная и протестированная на основе данных мини-объемов трещиноватого образца, плохо прогнозировала проницаемость мини-объемов, отобранных из нетрещиноватых образцов, и наоборот.
Метод Extra Trees оказался наиболее точным среди рассмотренных методов машинного обучения для нашей задачи.

В будущем авторы планируют рассматривать другие дополнительно имеющиеся карбонатные образцы, тем самым увеличивая количество мини-объемов, а также использовать изображения образцов из микрокомпьютерной томографии с целью эффективного прогнозирования их абсолютной проницаемости и других макроскопических характеристик. Кроме этого, планируется использовать методы глубокого машинного обучения (искусственные нейронные сети) вместе с регрессионными методами машин- ного обучения.

ДОПОЛНИТЕЛЬНО

Источник финансирования. Данное исследование было профинансировано Комитетом Науки Министерства науки и высшего образования Республики Казахстан в рамках проекта AP09058419 «Прогнозирование характеристик пористой среды с учетом режимов растворения породы в масштабе пор на основе машинного обучения».

Конфликт интересов. Авторы декларируют отсутствие явных и потенциальных конфликтов интересов, связанных с публикацией настоящей статьи.

Вклад авторов. Все авторы подтверждают соответствие своего авторства международным критериям ICMJE (все авторы внесли существенный вклад в разработку концепции, проведение исследования и под- готовку статьи, прочли и одобрили финальную версию перед публикацией). Наибольший вклад распределён следующий образом: Асилбеков Б.К. – разработка методики проведения исследовании, применение методов машинного обучения, анализ результатов исследования, написание рукописи, Калжанов Н.Е. – обзор и применение методов машинного обучения, Болысбек Д.А. – обработка данных микрокомпьютерной томографии, построение трехмерной цифровой модели цилиндрических образцов, вычисление параметров мини-объемов, Узбекалиев К.Ш. – вычисление параметров мини-объемов, обработка данных с микрокомпьютерной томографии, построение трехмерной цифровой модели цилиндрических образцов, Бекбау Б.Е. – разработка методики проведения исследований, анализ результатов исследований, Кульджабеков А.Б. – разработка методики проведения исследованиий анализ результатов исследований.

ADDITIONAL INFORMATION

Funding source. This study was funded by the Committee of Science of the Ministry of Science and Higher Education of the Republic of Kazakhstan under the project AP09058419 “Prediction of porous media characteristics taking into account rock dissolution patterns at pore scale based on machine learning”.

Competing interests. The authors declare that they have no competing interests.

Authors’ contribution. All authors made a substantial contribution to the conception of the work, acquisition, analysis, interpretation of data for the work, drafting and revising the work, final approval of the version to be published and agree to be accountable for all aspects of the work: Bakytzhan K. Assilbekov – development of research methodology, use of machine learning techniques, analysis of research results, writing a manuscript; Nurlykhan Ye. Kalzhanov – review and use of machine learning techniques; Darezhat A. Bolysbek – processing data from microcomputed tomography, building a 3D digital model of cylindrical samples, computing of parameters of small volumes; Kenboy Sh. Uzbekaliyev – computing of parameters of small volumes, processing data from microcomputed tomography; Bakbergen Ye. Bekbau – development of research methodology, analysis of research results; Alibek B. Kuljabekov – development of research methodology, analysis of research results.

Об авторах

Бакытжан Калжанович Асилбеков

Satbayev University; KBTU BIGSoft

Email: assibekov.b@gmail.com
ORCID iD: 0000-0002-0368-0131

PhD

Казахстан, Алматы; Алматы

Нұрлыхан Ерланұлы Қалжанов

KBTU BIGSoft; Казахский национальный университет имени аль-Фараби

Email: nurkal022@gmail.com
ORCID iD: 0009-0008-5776-0971
Казахстан, Алматы; Алматы

Дәрежат Абілсеитұлы Болысбек

Satbayev University; Казахский национальный университет имени аль-Фараби

Автор, ответственный за переписку.
Email: bolysbek.darezhat@gmail.com
ORCID iD: 0000-0001-8936-3921
Казахстан, Алматы; Алматы

Кенбой Шералиугли Узбекалиев

Satbayev University

Email: kzkenbai@gmail.com
ORCID iD: 0009-0000-6917-4963
Казахстан, Алматы

Бақберген Ермекбайұлы Бекбау

Satbayev University

Email: bakbergen@gmail.com
ORCID iD: 0000-0003-2410-1626

PhD

Алматы

Алибек Бахиджанович Кульджабеков

Satbayev University; KBTU BIGSoft

Email: alibek.kuljabekov@gmail.com
ORCID iD: 0000-0003-4384-6463

PhD

Казахстан, Алматы; Алматы

Список литературы

Carman P.C. Fluid flow through granular beds // Chem Eng Res Des. 1997. Vol. 75. P. 32–48. doi: 10.1016/S0263-8762(97)80003-2.
Eichheimer P., Thielmann M., Fujita W., et al. Combined numerical and experimental study of microstructure and permeability in porous granular media // Solid Earth. 2020. Vol. 11, N 3. P. 1079–1095. doi: 10.5194/se-11-1079-2020.
Mostaghimi P., Blunt M.J., Bijeljic B. Computations of Absolute Permeability on Micro-CT Images // Math Geosci. 2013. Vol. 45, N 1. P. 103–125. doi: 10.1007/s11004-012-9431-4.
Luquot L., Rodriguez O., Gouze P. Experimental Characterization of Porosity Structure and Transport Property Changes in Limestone Undergoing Different Dissolution Regimes // Transp Porous Media. 2014. Vol. 101, N 3. P. 507–532. doi: 10.1007/s11242-013-0257-4.
Noiriel C., Gouze P., Bernard D. Investigation of porosity and permeability effects from microstructure changes during limestone dissolution // Geophys Res Lett. 2004. Vol. 31, N 24. P. 1–4. doi: 10.1029/2004GL021572.
Smith M.M., Sholokhova Y., Hao Y., Carroll S.A. CO2-induced dissolution of low permeability carbonates. Part I: Characterization and experiments // Adv Water Resour. 2013. Vol. 62. P. 370–387. doi: 10.1016/j.advwatres.2013.09.008.
Koponen A., Kataja M., Timonen J. Permeability and effective porosity of porous media // Phys Rev E. 1997. Vol. 56, N 3. P. 3319–3325. doi: 10.1103/PhysRevE.56.3319.
Mavko G., Nur A. The effect of a percolation threshold in the Kozeny-Carman relation // GEOPHYSICS. 1997. Vol. 62, N 5. P. 1480–1482. doi: 10.1190/1.1444251.
Bernabe Y., Brace W.F., Evans B. Permeability, porosity and pore geometry of hot-pressed calcite // Mech Mater. 1982. Vol. 1, N 3. P. 173–183. doi: 10.1016/0167-6636(82)90010-2.
Nishiyama N., Yokoyama T. Permeability of porous media: Role of the critical pore size // J Geophys Res Solid Earth. 2017. Vol. 122, N 9. P. 6955–6971. doi: 10.1002/2016JB013793.
Elmorsy M., El-Dakhakhni W., Zhao B. Generalizable Permeability Prediction of Digital Porous Media via a Novel Multi-Scale 3D Convolutional Neural Network // Water Resour Res. 2022. Vol. 58, N 3. doi: 10.1029/2021WR031454.
Tian J., Qi C., Sun Y., Yaseen Z.M., Pham B.T. Permeability prediction of porous media using a combination of computational fluid dynamics and hybrid machine learning methods // Eng Comput. 2021. Vol. 37, N 4. P. 3455–3471. doi: 10.1007/s00366-020-01012-z.
Mohammadian E., Kheirollahi M., Liu B., Ostadhassan M., Sabet M. A case study of petrophysical rock typing and permeability prediction using machine learning in a heterogenous carbonate reservoir in Iran // Sci Rep. 2022. Vol. 12, N 1. P. 4505. doi: 10.1038/s41598-022-08575-5.
Rezaee R., Ekundayo J. Permeability Prediction Using Machine Learning Methods for the CO2 Injectivity of the Precipice Sandstone in Surat Basin, Australia // Energies. 2022. Vol. 15, N 6. P. 2053. doi: 10.3390/en15062053.
Gholami R., Shahraki A.R., Jamali Paghaleh M. Prediction of Hydrocarbon Reservoirs Permeability Using Support Vector Machine // Math Probl Eng. 2012. Vol. 2012. P. 1–18. doi: 10.1155/2012/670723.
Erofeev A., Orlov D., Ryzhov A., Koroteev D. Prediction of Porosity and Permeability Alteration Based on Machine Learning Algorithms // Transp Porous Media. 2019. Vol. 128, N 2. P. 677–700. doi: 10.1007/s11242-019-01265-3.
Tembely M., AlSumaiti A.M., Alameri W. A deep learning perspective on predicting permeability in porous media from network modeling to direct simulation // Comput Geosci. 2020. Vol. 24. N 4. P. 1541–1556. doi: 10.1007/s10596-020-09963-4.
Akasheva Z., Bolysbek D., Assilbekov B. Study of carbonate rock dissolution using x-ray microcomputed tomography: impact of acid flow rate // News Natl Acad Sci Repub Kazakhstan Ser Geol Tech Sci. 2023. Vol. 1, N 457. P. 20–32. doi: 10.32014/2023.2518-170Х.256.
Shahani N.M., Zheng X., Liu C., Hassan F.U., Li P. Developing an XGBoost Regression Model for Predicting Young’s Modulus of Intact Sedimentary Rocks for the Stability of Surface and Subsurface Structures // Front Earth Sci. 2021. Vol. 9. doi: 10.3389/feart.2021.761990.
Hameed M.M., AlOmar M.K., Khaleel F., Al-Ansari N. An Extra Tree Regression Model for Discharge Coefficient Prediction: Novel, Practical Applications in the Hydraulic Sector and Future Research Directions // Math Probl Eng. 2021. P. 1–19. doi: 10.1155/2021/7001710.

Дополнительные файлы

Доп. файлы

Действие

1. JATS XML

Скачать

2. Рисунок 1. 3D цифровые модели образцов (а), отбор мини-объемов (б) и отображение имеющихся трещин в образце №2 (в)

Скачать (217KB)

Метаданные

3. Рисунок 2. Попарные зависимости (а) и корреляционная матрица (б) исходных данных

Скачать (310KB)

Метаданные

4. Рисунок 3. Прогнозная и истинная проницаемости при разделении данных в соотношении 70/30 (а) и 80/20 (б)

Скачать (144KB)

Метаданные

5. Рисунок 4. Значимость входных признаков при прогнозировании проницаемости методами Random Forest (слева), Extra Tree (в центре) и XGBoost (справа)

Скачать (115KB)

Метаданные

6. Рисунок 5. Попарные зависимости (а) и корреляционная матрица (б) исходных данных

Скачать (324KB)

Метаданные

7. Рисунок 6. Прогнозная и истинная проницаемости при разделении данных в соотношении 70/30 (а) и 80/20 (б)

Скачать (120KB)

Метаданные

8. Рисунок 7. Попарные зависимости и диаграммы распределения данных мини-объемов, отобранные из нетрещиноватых (а) и трещиноватых (б) образцов

Скачать (401KB)

Метаданные

9. Рисунок 8. Корреляционная матрица между исходными данными мини-объемов, отобранными из нетрещиноватых (а) и трещиноватых (б) образцов

Скачать (245KB)

Метаданные

10. Рисунок 9. Прогнозная и истинная проницаемости мини-объемов, отобранные из нетрещиноватых образцов, при разделении данных в соотношении 70/30 (а) и 80/20 (б)

Скачать (92KB)

Метаданные

11. Рисунок 10. Прогнозная и истинная проницаемости мини-объемов, отобранные из трещиноватого образца, при разделении данных в соотношении 70/30 (а) и 80/20 (б)

Скачать (101KB)

Метаданные

12. Рисунок 11. Прогнозная и истинная проницаемости мини-объемов, отобранные из трещиноватого (а) и нетрещиноватых (б) образцов, во время слепых тестов

Скачать (95KB)

Метаданные

Имя пользователя
Пароль
Запомнить меня

Забыли пароль?	Регистрация

Имя пользователя
Пароль
Запомнить меня

Забыли пароль?	Регистрация

Исследование эффективности алгоритмов машинного обучения на основе данных различных горных пород

Полный текст

Аннотация

Ключевые слова

Полный текст

Введение

Материалы и методы

Результаты и их обсуждения

Прогноз проницаемости методами машинного обучения

Использование логарифма проницаемости

Заключение

ДОПОЛНИТЕЛЬНО

ADDITIONAL INFORMATION

Об авторах

Бакытжан Калжанович Асилбеков

Нұрлыхан Ерланұлы Қалжанов

Дәрежат Абілсеитұлы Болысбек

Кенбой Шералиугли Узбекалиев

Бақберген Ермекбайұлы Бекбау

Алибек Бахиджанович Кульджабеков

Список литературы

Дополнительные файлы

Данный сайт использует cookie-файлы