Әртүрлі тау жынысының деректері негізінде машиналық оқу алгоритмдерінің тиімділігін зерттеу

Мұқаба


Дәйексөз келтіру

Толық мәтін

Аннотация

Негіздеу. Абсолютті өткізгіштік мұнай және газ кен орындарын игеруде, сақтау мақсатында СО2 қабаттарға айдауда, жер асты суы қабаттарын ластаушы заттардың миграциясын бақылауда кеуекті орталардағы сұйықтардың ағысын және каталитикалық жүйелерді модельдеуде маңызды рөл атқарады. Сондықтан оның мәндерін дәл және тез анықтау маңызды мәселе болып табылады.

Мақсаты. Бұл мақаланың мақсаты – карбонат үлгілерінің абсолютті өткізгіштігін болжау үшін машиналық оқыту әдістерін қолдану мүмкіндігін, сондай-ақ өткізгіштікті болжауды жақсарту жолдарын зерттеу.

Материалдар мен әдістер. Кіріс деректері ретінде, толығымен дерлік кальциттен тұратын төрт цилиндрлік карбонат үлгілерден алынған 408 шағын-көлемдер қолданылды. Кіріс деректері жалпы және байланысқан кеуектілікті, беттің меншікті ауданын, барлық және тек байланысқан кеуектердің радиустарын, координация санын, кеуек мойнының радиусы мен ұзындығын, бұралуды және абсолютті өткізгіштікті қамтиды. Өткізгіштікті болжау кездейсоқ орман, өте кездейсоқ ағаштар және модификацияланған градиентті күшейту сияқты регрессиялық машиналық оқыту әдістерін қолдану арқылы жүзеге асырылады. Шағын көлемдердің параметрлері (деректері) арнаулы Avizo бағдарламалық пакетін пайдалана отырып, олардың кеуекті кеңістігіндегі су ағысын кеуек-масштабта модельдеу арқылы анықталды.

Нәтижелері. Сызатты және сызатсыз үлгілерден алынған шағын-көлемдердің деректері талданды және талдаулар шағын-көлемдердің көптеген параметрлері арасында жақсы байланыс бар екенін көрсетті. Мысалы, байланысқан және жалпы кеуектілік жоғары корреляция коэффициентімен екінші дәрежелі полиномдық байланысқа ие. Жоғарыда аталған регрессиялық машиналық оқытудың әдістерін қолдана отырып, кіріс деректерін оқыту және тестілеу деректеріне 80/20 және 70/30 қатынасында бөлу кезінде абсолютті өткізгіштік мәндері болжанды.

Қорытынды. Өткізгіштіктің орнына оның логарифмін қолдану, сонымен қатар сызатты және сызатсыз үлгілерді бөлек қарастыру арқылы, жоғарыда аталған машиналық оқыту әдістерін пайдалана отырып, абсолютті өткізгіштікті болжаудың дәлдігін 90%-ға дейін арттыруға болады. Өте кездейсоқ ағаштар әдісі біздің есеп үшін қарастырылған машиналық оқытудың үш әдісінің ішінде ең дәлі болып табылды.

Толық мәтін

Введение

Абсолютная проницаемость является важной макроскопической характеристикой при течении жидкостей в поровом пространстве горных пород, и её определение является актуальной задачей, например, при оценке рациональности разработки нефтегазовых месторождений и эффективности закачки СО2 в пласты, эффективности работ каталитических систем, загрязненности подземных вод и т.д. Обычно ищется зависимость между проницаемостью и другими характеристиками пористых материалов на основе множественных лабораторных измерений на керновых образцах, что занимает много времени и требует специального оборудования. Кроме этого, лабораторные условия позволяют осуществлять измерения проницаемости керновых материалов только в сантиметровом масштабе, что является грубоватой оценкой проницаемости, а течение жидкостей в пористых средах происходит в масштабе пор, и, следовательно, должны быть учтены более мелкие масштабы при оценке проницаемости пород.

Альтернативным способом определения проницаемости пород является расчёт по аналитическим формулам. Широко используемым является уравнение Козени-Кармана, которое связывает проницаемость k с пористостью ф, удельной площадью поверхности и извилистостью пористой среды [1, 2]. Однако уравнение Козени-Кармана дает неправильные значения k для большинства реальных пористых материалов [2, 3]. В литературе также широко используются уравнения, описывающие связь между проницаемостью и общей пористостью k~фn [4–6], проницаемостью и связанной пористостью k ~ фncon. [7], проницаемостью и перколяционным порогом пористости k~(ф – фс )n (n – показатель степени) [7, 8]. Кроме этого, применяется уравнение, связывающее проницаемость с характерным размером пористой среды l: k~фl2 [9, 10]. Однако вышеприведенные уравнения имеют как свои преимущества, так и недостатки, и их применимость ограничена такими факторами, как точность расчётов, сложная поровая структура горных пород и труднодоступность многих параметров (связанная пористость, перколяционный порог пористости, характерный размер среды).

За последнее десятилетие машинное обучение стало довольно популярным инструментом в классификации, регрессии и обработке изображений, которые встречаются в различных задачах. Прогнозирование проницаемости пористых сред осуществляется с применением регрессионных методов машинного обучения и методов глубокого машинного обучения. Для прогнозирования проницаемости методы глубокого машин- ного обучения используют изображения горных пород как входные данные, полученные с помощью рентгеновской микрокомпьютер- ной томографии, и в качестве метода обуче- ния применяются свёрточные нейронные сети [11, 12].

Регрессионные методы машинного обучения широко применяются при прогнозировании проницаемости пористой среды, т.к. они являются более удобными в реализа- ции и не требуют изображений образцов в обучающих целях, что не всегда доступно. Эти методы также подходят при классификации типов пород по их петрофизическим характеристикам [13] и прогнозировании проницаемости пород по данным геофизического исследования скважин (далее – ГИС) [14, 15].

Erofeev и др. [16] применили несколько регрессионных методов машинного обучения для прогнозирования изменения пористости и проницаемости после удаления соли из 102 керновых материалов. Их результаты показали, что лучшими методами среди использованных оказались метод опорных векторов и нейронные сети. Они также отметили, что количество независимых признаков (входных параметров) заметно влияет на результаты прогнозирования пористости и проницаемости. Так, например, при использовании всего одного признака для прогнозирования пористости достоверность прогноза составила 69%, а в случае использования всех доступных признаков этот показатель составил 90%.

Tembely и др. [17] использовали регрессионные методы машинного обучения вместе с методами глубокого машинного обучения для прогнозирования абсолютной проницаемости пород на основе данных 1159 карбонатных образцов. В качестве входных признаков для построения моделей были использованы пористость, фактор образования и проницаемость, вычисленная с помощью поросетевого моделирования. Результаты показали, что лучшими методами оказались модифицированный метод повышения градиента (XGBoost) и глубокие нейронные сети, которые спрогнозировали проницаемости с достоверностью 90% и 92% соответственно.

Rezaee и Ekundayo [14] показали, что метод градиентного спуска (GBoost) и случайного леса (Random Forest) являются наиболее мощными во время теста и валидации, хотя GBoost показал наихудший результат при проведении слепого теста. Они использовали данные ГИС в качестве входных признаков в методы машинного обучения, но авторы выбрали искусственные нейронные сети как самый лучший метод для прогнозирования проницаемости пород, т.к. он даёт практически одинаковые результаты при различных количествах признаков и является самым быстрым.

Mohammadian и др. [13] изучили влияние классификации пород по их типу на результаты прогнозирования абсолютной проницаемости с помощью XGBoost. Они показали, что, если произвести классификацию пород по их индексу зоны течения (FZI), можно достичь высокой точности прогнозирования проницаемости пород. Авторы получили проницаемости с помощью метода машинного обучения с 97%-й точностью по данным 128 образцов кернов, для которых диапазон изменения проницаемости составил 0,11–122,7 мД.

В настоящей статье изучаются пути улучшения прогноза абсолютной проницаемости методами машинного обучения. Разделение данных по признаку трещиноватости и использование логарифма проницаемости вместо самой проницаемости привело к заметному улучшению результатов прогноза проницаемости.

Материалы и методы

Обучение и тестирование методов машинного обучения проводились по данным 408 мини-объемов (объемом около 512 мм³), которые были отобраны из 4 карбонатных цилиндрических образцов до и после закачки в них растворов соляной кислоты. На рис. 1 (а) показаны трехмерные цифровые модели цилиндрических образцов №2, 7, 10 и 13, которые были испытаны во время проведённых нами экспериментов по закачке кислотных растворов [18]. Тёмно-синими областями на светло-синем фоне выделены каналы растворения. Диаметр и длина образцов составили около 3 и 5 см соответственно. Результаты рентгеновской дифрактометрии показали, что все образцы практически полностью состоят из кальцита, содержание кварца составляет менее 1%. Краткая информация по кислотным растворам и образцам до и после закачки, приведена в табл. 1. Трехмерные цифровые модели образцов до и после закачки кислотных растворов были построены с помощью программного пакета Avizo на основе их томографических изображений.

 

Рисунок 1. 3D цифровые модели образцов (а), отбор мини-объемов (б) и отображение имеющихся трещин в образце №2 (в)

Figure 1. 3D digital models of samples (a), extraction of small volumes (b) and display of existing fractures in sample #2 (c)

 

Таблица 1. Краткая информация по кислотным растворам и образцам до и после закачки Table 1. Summary of acid solutions and samples before and after injection

образца

Sample number

Пористость до закачки, %

Porosity (before injection), %

Концентрация HCl в растворе, %

HCl concentration in solution, %

Скорость закачки,

мл/мин

Injection rate, ml/min

Проницаемость до закачки, µм²

Permeability (before injection), µm²

Проницаемость после закачки, µм²

Permeability

(after injection), µm²

2

20,6

18

8

0,43

3,79

7

20,9

12

8

0,71

3,85

10

19,0

18

2

0,29

0,98

13

20,0

12

4

0,45

4,1

 

Процесс отбора кубических мини- объемов из цилиндрических образцов схематически проиллюстрирован на рис. 1 (б), где красный квадрат обозначает место отбора. Идентичность мини-образцов из цифровой модели одного и того же образца до и после закачки кислотного раствора была максимально обеспечена. Поровые пространства отобранных мини-объемов, которые далее использовались для построения поровой сети, показаны синим на рис. 1 (б). Отметим, что образец №2 имеет явно выраженные трещины, направление которых показаны красной линией на рис. 1 (в). С целью отображения трещин показаны изображения только разного сечения образца, где Z показывает их расстояние от входного сечения. Также отметим, что основной целью отбора мини-объемов являлось увеличение количества пористых сред для формирования входного слоя в методы машинного обучения.

После того как были отобраны мини-объемы, были извлечены их поровые се- ти (рис. 1, в). Затем была проведена симуляция течения воды на поровых сетях мини-объемов с помощью подходов поромасштабного моделирования с целью расчёта их микроскопических и макроскопических характеристик (табл. 2). Поромасштабное моделирование было проведено с помощью программного пакета Avizo.

 

Таблица 2. Наименование рассчитанных характеристик мини-объемов Table 2. Name of the computed characteristics of small volumes

Удельная площадь поверхности (S), µм-1

Specific surface area (S), µm-1

Связанная пористость с )

Connected porosity с )

Общая пористость t )

Total porosity t )

Радиус всех пор

(rp ), µм

Radius of all pores

(rp ), µm

Извилистость )

Tortuosity )

Координационное число (Nc )

Coordination number (Nc )

Радиус горловины (rt ), µм

Throat radius

(rt ), µm

Длина горловины (lt ), µм

Throat length

(lt ), µm

Радиус связанных пор (rpc ), µм

Radius of connected pores (rpc ), µm

Проницаемость (k), µм²

Permeability

(k), µm²

 

В качестве методов машинного обучения были выбраны метод случайного леса (Ran- dom Forest), модифицированный метод повышения градиента (XGBoost) и чрезвычайно случайных деревьев (Extra Trees). Все характеристики мини-образцов, кроме проницаемости, были использованы в качестве входных данных методов машинного обучения, а проницаемость являлась целевой переменной, которую нужно прогнозировать. Отметим, что управляемые параметры всех рассмотренных методов машинного обучения были использованы по умолчанию. Метод Random Forest основан на использовании множеств независимых друг от друга деревьев решений, в котором окончательное значение прогнозируемой величины получается осреднением прогнозов по всем деревьям решения [16]. Метод XGBoost является более упорядоченной формой обычного метода повышения градиента и использует расширенную регуляризацию, которая улучшает возможности обобщения модели. XGBoost обеспечивает более высокую производительность по сравнению с обычным методом повышения градиента [19]. Метод Extra Trees является методом, основанным на алгоритме оптимизации обучения методом наименьших квадратов [20]. Методы Extra Trees и Random Forest создают множество деревьев решений, но выборка для каждого дерева является случайной, без замены. Это создаёт набор данных для каждого дерева с уникальными образцами.

Результаты и их обсуждения

Прогноз проницаемости методами машинного обучения

Прежде чем прогнозировать проницаемость, был проведен анализ исходных данных. На рис. 2 (а) показана визуализация исходных данных в виде попарных зависимостей между каждыми признаками и диаграммы распределения каждого признака. Как видно на рисунке, имеется четкая взаимосвязь между всеми признаками, за исключением взаимосвязи между извилистостью и остальными признаками. Извилистость остаётся практически постоянной. Отметим, что проницаемость меняется в очень широком диапазоне (0,0002–893 µм²) со средним значением в 6,3 µм², следовательно, распределение проницаемости проиллюстрировано не лучшим образом. В связи с этим далее в статье рассмотрен логарифм от проницаемости вместо самой проницаемости в целях улучшения не только её распределения, но и прогноза её значений.

 

Рисунок 2. Попарные зависимости (а) и корреляционная матрица (б) исходных данных

Figure 2. Pairwise (a) and correlation matrix (b) for the initial data

 

На рис. 2 (а) видна чёткая взаимосвязь между связанной и общей пористостями, которая подтверждается высоким коэффициентом корреляции (0,99) (рис. 2, б). Общая пористость образца породы может быть высокой, но, как известно, течение жидкостей в поровом пространстве в основном характеризуется связанной пористостью, т.е. пористостью соединенных между собой пор образца. В среднем для большинства горных пород связанная пористость состав- ляет приблизительно 85–95% общей пористости. В нашем случае этот показатель составляет 86%.

Взаимосвязь между связанной и общей пористостями позволяет определить так называемый перколяционный порог пористости фp, ниже которого поровое пространство образца считается непроводимым, т.е. проницаемость превращается в ноль [7]. Знание перколяционного порога пористости позволяет оценить вместительные и транспортные свойства пород, например, для закачки воды или газа с целью вытеснения нефти из плас- тов или перед закачкой СО2 в пласты для дальнейшего его хранения. В настоящем исследовании фp был определен как положительный корень квадратного уравнения фc= –1,48ф2t + 1,71фt – 0,09, которое описывает взаимосвязь между связанной и общей пористостями, и составил ≈5%.

Из рис. 2 (а) также заметим, что удельная площадь поверхности S имеет корреляцию со многими признаками. Особенно важной является взаимосвязь между S и пористостью с коэффициентом корреляции -0,49 (рис. 2, б). Koponen et al. [7] описывали взаимосвязь между S и пористостью уравнением S=–2фtlnфt/18,6. В нашем случае данная связь описывалась линейным уравнением S=–0,061фt + 0,036 с коэффициентом корреляции 0,24. Раздельное рассмотрение трещиноватого и нетрещиноватых образцов привело к уравнениям S=–0,099фt + 0,037 и S=–0,077фt + 0,041 с коэффициентами корреляции 0,72 и 0,61 соответственно.

Рис. 2 (а) раскрывает линейную взаимосвязь между радиусом и длиной горловины пор с высоким коэффициентом корреляции 0,96 (рис. 2, б). Это означает, что вместе с ростом радиуса горловины длина горловины также растёт, например, во время растворения породы при закачке кислотных составов в образцы, что указывает на объединение/укрупнение пор.

На рис. 2 (б) показаны коэффициенты корреляции между признаками, где красный цвет указывает на прямые корреляции, а синий – на обратные. Как видно, удельная площадь поверхности имеет обратные связи с остальными признаками, за исключением извилистости. Как показывает рис. 2 (б), целевая переменная (проницаемость) имеет низкие коэффициенты корреляции с входными признаками, т.к. проницаемость имеет нелинейный характер при изменении входных признаков. Рис. 2 (б) указывает на очень важный фактор – исключение тех входных признаков, которые имеют очень высокие коэффициенты корреляции с остальными входными признаками из общего количества признаков. Например, можно исключить либо общую пористость, либо связанную пористость, т.к. они имеют чёткую взаимосвязь между собой. Благодаря лёгкому, по сравнению со связанной пористостью, определению общей пористости, очевидно, что нужно оставить общую пористость в общем количестве входных признаков. Уменьшение количества входных признаков позволяет снизить время обучения и прогноза.

На рис. 3 показаны прогнозированная и истинная проницаемости мини-объемов при разделении входных данных в соотношении 70/30 (рис. 3, а) и 80/20 (рис. 3, б).

 

Рисунок 3. Прогнозная и истинная проницаемости при разделении данных в соотношении 70/30 (а) и 80/20 (б)

Figure 3. Predicted and true permeability for data division in the ratio of 70/30 (a) and 80/20 (b)

 

Как видно на рис. 3, все рассмотренные методы машинного обучения прогнозировали проницаемость с низкими коэффициентами достоверности при обоих соотношениях разделения входных данных. Низкие значения проницаемости были переоценены, указывая на то, что распределение проницаемости имеет нелинейный характер при низких значениях пористости.

Наоборот, высокие значения проницаемости (>1 µм²), полученные с помощью методов машинного обучения, близко находятся к истинным значениям проницаемости. Плохая прогнозирующая способность рассмотренных методов машинного обучения низких проницаемостей также может быть связана с присутствием данных мини-объемов, отобранных из трещиноватого образца. Далее используется логарифм проницаемости вместо самой проницаемости и отдельно рассматривается трещиноватый образец с целью улучшения прогнозирующей способности методов машинного обучения при низких значениях проницаемости.

Значимость входных признаков при прогнозировании проницаемости методами Random Forest, Extra Tree и XGBoost показана на рис. 4. Как видно на рисунке, Random Forest и XGBoost считали извилистость и удельную площадь поверхности наиболее важными при прогнозировании, тогда как Extra Tree выбрал наиболее важными извилистость и пористость. Отметим, что эти параметры являются основными составляющими факторами в уравнении Козени-Кармана.

 

Рисунок 4. Значимость входных признаков при прогнозировании проницаемости методами Random Forest (слева), Extra Tree (в центре) и XGBoost (справа)

Figure 4. Feature importances in permeability prediction using Random Forest (left), Extra Tree (center), and XGBoost (right) methods

 

Использование логарифма проницаемости

Здесь и далее будем использовать (натуральный) логарифм проницаемости вместо самой проницаемости. Логарифмическая функция резко меняется в интервале (0; 1], и это позволяет считать низкие значения проницаемости наиболее сопоставимыми с ее высокими значениями в логарифмической шкале.

Повторное прогнозирование проницаемости показало, что взаимосвязи между логарифмом проницаемости и входными признаками явно выражены (рис. 5–6) по сравнению со случаем, когда использовалась абсолютная проницаемость (рис. 2, а). Рис. 5 (б) показывает, что коэффициенты корреляции между логарифмом проницаемости и входными признаками существенно увеличились. Например, если коэффициенты корреляции проницаемости с общей пористостью и удельной площадью поверхности составили 0,23 и -0,28 (рис. 2, б) соответственно, то в случае использование логарифма проницаемости эти коэффициенты соответственно выросли до 0,67 и -0,68 (рис. 5, б). Это означает, что логарифм проницаемости имеет лучшую корреляцию с входными признаками, чем просто проницаемость. Причиной этому может быть то, что в общем случае связь между проницаемостью и другими параметрами пористой среды является нелинейной (степенной закон).

 

Рисунок 5. Попарные зависимости (а) и корреляционная матрица (б) исходных данных

Figure 5. Pairwise (a) and correlation matrix (b) for the initial data

 

Как показывает рис. 6, все три рассмотренных метода машинного обучения показали лучшие результаты по сравнению со случаем использования самой проницаемости в качестве целевой переменной. Коэффициенты достоверности прогноза этими методами превысили 80% (рис. 6), тогда как эти коэффициенты имели значения чуть больше 10% в случае использования самой проницаемости (рис. 3). Основной причиной улучшения было адекватное прогнозирование низких проницаемостей, которые стали гораздо ближе к истинным значениям проницаемости. Отметим, что сначала был прогнозирован логарифм проницаемости, после чего обратно преобразовали его к самой проницаемости, чтобы сравнить с истинной проницаемостью. Использование большего количества входных данных для обучения (рис. 6, б) слегка улучшило результаты прогноза проницаемости. Отметим, что метод Extra Tree показал сравнительно лучшие результаты.

 

Рисунок 6. Прогнозная и истинная проницаемости при разделении данных в соотношении 70/30 (а) и 80/20 (б)

Figure 6. Predicted and true permeability for data division in the ratio of 70/30 (a) and 80/20 (b)

 

Рисунок 7. Попарные зависимости и диаграммы распределения данных мини-объемов, отобранные из нетрещиноватых (а) и трещиноватых (б) образцов

Figure 7. Pair-plots and distribution diagrams of small volumes, extracted from non-fractured (a) and fractured (b) samples

 

Как видно из рис. 8, наблюдается укрепление связи между логарифмом проницаемости и входными признаками для образцов без трещин по сравнению с трещиноватым образцом. Например, если коэффициент корреляции между логарифмом проницаемости и общей пористостью для трещиноватого образца равняется 0,63 (рис. 8, б), то этот же коэффициент для образцов без трещин составляет 0,85 (рис. 8, а). Подобная крепкая связь наблюдается и для остальных признаков, кроме извилистости, для которой наоборот данный коэффициент уменьшился.

 

Рисунок 8. Корреляционная матрица между исходными данными мини-объемов, отобранными из нетрещиноватых (а) и трещиноватых (б) образцов

Figure 8. Correlation matrix for the initial data of small volumes, extracted from non-fractured (a) and fractured (b) samples

 

Спрогнозированные с помощью рассмотренных методов машинного обучения проницаемости в сопоставлении с истинными проницаемостями для образцов с трещинами и без приведены на рис. 9 и 10. Как наглядно показано на рисунках, точность прогноза проницаемости улучшилась, когда из общего количества данных удалили данные трещиноватого образца (рис. 9). Коэффициент достоверности прогноза при обоих разделениях входных данных достиг практически 90% (рис. 9). Все три рассмотренных метода показали практически одинаковые результаты. В случае, когда отдельно рассматривали трещиноватый образец (рис. 10), точность прогноза проницаемости была выше, чем когда все образцы были рассмотрены вместе (рис. 6). Из рис. 10 можно заметить, что разброс в рас- пределениях параметров трещиноватого образца передавался в прогнозные значения проницаемости.

 

Рисунок 9. Прогнозная и истинная проницаемости мини-объемов, отобранные из нетрещиноватых образцов, при разделении данных в соотношении 70/30 (а) и 80/20 (б)

Figure 9. Predicted and true permeabilities of small volumes extracted from non-fractured samples for the data division in a ratio of 70/30 (a) and 80/20 (b)

 

Рисунок 10. Прогнозная и истинная проницаемости мини-объемов, отобранные из трещиноватого образца, при разделении данных в соотношении 70/30 (а) и 80/20 (б)

Figure 10. Predicted and true permeabilities of small volumes extracted from a fractured sample for the data division in a ratio of 70/30 (a) and 80/20 (b)

 

Далее проведены два слепых теста с целью спрогнозировать проницаемости мини-объемов трещиноватого образца, обучая и тестируя методы машинного обучения на данных мини-образцов, отобранных из нетрещиноватых образцов (рис. 11, а) и наобо- рот (рис. 11, б). С этой целью использовали только метод Extra Trees, т.к. он показал лучшие результаты по сравнению с остальными. Данные в обоих случаях были разделены в соотношении 80/20, т.е. 80% на обучение, а 20% – на тестирование. После того как Extra Trees был обучен и тестирован на данных мини-объемов, отобранных из нетрещиноватых образцов, проницаемости мини-объемов трещиноватого образца были прогнозированы. После этого Extra Trees обучается на данных мини-объёмов из трещиноватого образца, чтобы спрогнозировать проницаемости мини-объёмов из нетрещиноватых образцов.

 

Рисунок 11. Прогнозная и истинная проницаемости мини-объемов, отобранные из трещиноватого (а) и нетрещиноватых (б) образцов, во время слепых тестов

Figure 11. Predicted and true permeabilities of small volumes extracted from (a) fractured and (b) non-fractured samples during blind tests

 

Прогнозированная с помощью Extra Trees и истинная проницаемости мини-образцов трещиноватого и нетрещиноватых образцов показаны на рис. 11. Как показывает этот рисунок, машинное обучение спрогнозировало проницаемости с точностью 52% (рис. 11, а) и 59% (рис. 11, б) во время слепых тестов, хотя точность была высокой (около 90%) во время обычных тестов. Это означает, что используемые данные для обучения, обычного и слепых тестов должны иметь похожую структуру, чтобы достичь максимальной точности прогнозов, или же следует использовать уже классифицированные данные образцов, по крайней мере, по их поровой структуре (трещиноватость, однородность и кавернозность).

Заключение

В статье были рассмотрены регрессионные методы Random Forest, XGBoost и Extra Trees для прогнозирования абсолютной проницаемости 408 мини-объемов карбонатных образцов, которые практически полностью состоят из кальцита. Входные данные включали девять параметров и один выходной параметр (абсолютная проницаемость). Параметры мини-объемов были определены при помощи поромасштабного моделирования течения воды в их поровом пространстве с применением специализированного программного пакета Avizo. По результатам исследования можем сделать следующие выводы:

  1. Связанная и общая пористости имеют полиномиальную взаимосвязь фc= –1,48ф2t + 1,71фt – 0,09 с коэффициентом корреляции 0,99. Это позволило определить перколяционный порог пористости для рассмотренных карбонатных образцов, значение которого составило ≈5%. Это означает, что 5% порового пространства является непроводимым, и абсолютная проницаемость превращается в ноль.
  2. Удельная площадь поверхности зерен линейно коррелирует с общей пористостью соотношениями S = –0,099фt + 0,037 и S = –0,077фt + 0,041 для трещиноватого и нетрещиноватых образцов соответственно. Коэффициенты корреляции составили 0,72 и 0,61. Это позволяет использовать уравнение Козени-Кармана для оценки абсолютной проницаемости образца при отсутствии данных по удельной площади поверхности.
  3. Использование набора данных без какой-либо предобработки привело к прогнозу проницаемости с низкой точностью (9–17%). Использование логарифма проницаемости вместо самой проницаемости позволило повысить точность прогноза абсолютной проницаемости до 86%.
  4. Раздельное рассмотрение трещиноватого и нетрещиноватых образцов позволило увеличить точность прогноза абсолютной проницаемости почти до 90%.
  5. Прогнозная модель, обученная и протестированная на основе данных мини-объемов трещиноватого образца, плохо прогнозировала проницаемость мини-объемов, отобранных из нетрещиноватых образцов, и наоборот.
  6. Метод Extra Trees оказался наиболее точным среди рассмотренных методов машинного обучения для нашей задачи.

В будущем авторы планируют рассматривать другие дополнительно имеющиеся карбонатные образцы, тем самым увеличивая количество мини-объемов, а также использовать изображения образцов из микрокомпьютерной томографии с целью эффективного прогнозирования их абсолютной проницаемости и других макроскопических характеристик. Кроме этого, планируется использовать методы глубокого машинного обучения (искусственные нейронные сети) вместе с регрессионными методами машин- ного обучения.

ДОПОЛНИТЕЛЬНО

Источник финансирования. Данное исследование было профинансировано Комитетом Науки Министерства науки и высшего образования Республики Казахстан в рамках проекта AP09058419 «Прогнозирование характеристик пористой среды с учетом режимов растворения породы в масштабе пор на основе машинного обучения».

Конфликт интересов. Авторы декларируют отсутствие явных и потенциальных конфликтов интересов, связанных с публикацией настоящей статьи.

Вклад авторов. Все авторы подтверждают соответствие своего авторства международным критериям ICMJE (все авторы внесли существенный вклад в разработку концепции, проведение исследования и под- готовку статьи, прочли и одобрили финальную версию перед публикацией). Наибольший вклад распределён следующий образом: Асилбеков Б.К. – разработка методики проведения исследовании, применение методов машинного обучения, анализ результатов исследования, написание рукописи, Калжанов Н.Е. – обзор и применение методов машинного обучения, Болысбек Д.А. – обработка данных микрокомпьютерной томографии, построение трехмерной цифровой модели цилиндрических образцов, вычисление параметров мини-объемов, Узбекалиев К.Ш. – вычисление параметров мини-объемов, обработка данных с микрокомпьютерной томографии, построение трехмерной цифровой модели цилиндрических образцов, Бекбау Б.Е. – разработка методики проведения исследований, анализ результатов исследований, Кульджабеков А.Б. – разработка методики проведения исследованиий анализ результатов исследований.

ADDITIONAL INFORMATION

Funding source. This study was funded by the Committee of Science of the Ministry of Science and Higher Education of the Republic of Kazakhstan under the project AP09058419 “Prediction of porous media characteristics taking into account rock dissolution patterns at pore scale based on machine learning”.

Competing interests. The authors declare that they have no competing interests.

Authors’ contribution. All authors made a substantial contribution to the conception of the work, acquisition, analysis, interpretation of data for the work, drafting and revising the work, final approval of the version to be published and agree to be accountable for all aspects of the work: Bakytzhan K. Assilbekov – development of research methodology, use of machine learning techniques, analysis of research results, writing a manuscript; Nurlykhan Ye. Kalzhanov – review and use of machine learning techniques; Darezhat A. Bolysbek – processing data from microcomputed tomography, building a 3D digital model of cylindrical samples, computing of parameters of small volumes; Kenboy Sh. Uzbekaliyev – computing of parameters of small volumes, processing data from microcomputed tomography; Bakbergen Ye. Bekbau – development of research methodology, analysis of research results; Alibek B. Kuljabekov – development of research methodology, analysis of research results.

×

Авторлар туралы

Бакытжан Калжанович Асилбеков

Satbayev University; KBTU BIGSoft

Email: assibekov.b@gmail.com
ORCID iD: 0000-0002-0368-0131

PhD

Қазақстан, Алматы қаласы; Алматы қаласы

Нұрлыхан Ерланұлы Қалжанов

KBTU BIGSoft; Әл-Фараби атындағы Қазақ Ұлттық Университеті

Email: nurkal022@gmail.com
ORCID iD: 0009-0008-5776-0971
Қазақстан, Алматы қаласы; Алматы қаласы

Дәрежат Абілсеитұлы Болысбек

Satbayev University; Әл-Фараби атындағы Қазақ Ұлттық Университеті

Хат алмасуға жауапты Автор.
Email: bolysbek.darezhat@gmail.com
ORCID iD: 0000-0001-8936-3921
Қазақстан, Алматы қаласы; Алматы қаласы

Кенбой Шералиугли Узбекалиев

Satbayev University

Email: kzkenbai@gmail.com
ORCID iD: 0009-0000-6917-4963
Қазақстан, Алматы қаласы

Бақберген Ермекбайұлы Бекбау

Satbayev University

Email: bakbergen@gmail.com
ORCID iD: 0000-0003-2410-1626

PhD

Алматы қаласы

Алибек Бахиджанович Кульджабеков

Satbayev University; KBTU BIGSoft

Email: alibek.kuljabekov@gmail.com
ORCID iD: 0000-0003-4384-6463

PhD

Қазақстан, Алматы қаласы; Алматы қаласы

Әдебиет тізімі

  1. Carman PC. Fluid flow through granular beds. Chem Eng Res Des. 1997;75:S32–S48. doi: 10.1016/S0263-8762(97)80003-2.
  2. Eichheimer P, Thielmann M, Fujita W, et al. Combined numerical and experimental study of microstructure and permeability in porous granular media. Solid Earth. 2020;11(3):1079–1095. doi: 10.5194/se-11-1079-2020.
  3. Mostaghimi P, Blunt MJ, Bijeljic B. Computations of Absolute Permeability on Micro-CT Images. Math Geosci. 2013;45(1):103–125. doi: 10.1007/s11004-012-9431-4.
  4. Luquot L, Rodriguez O, Gouze P. Experimental Characterization of Porosity Structure and Transport Property Changes in Limestone Undergoing Different Dissolution Regimes. Transp Porous Media. 2014;101(3):507–532. doi: 10.1007/s11242-013-0257-4.
  5. Noiriel C, Gouze P, Bernard D. Investigation of porosity and permeability effects from microstructure changes during limestone dissolution. Geophys Res Lett. 2004;31(24):1–4. doi: 10.1029/2004GL021572.
  6. Smith MM, Sholokhova Y, Hao Y, Carroll SA. CO2-induced dissolution of low permeability carbonates. Part I: Characterization and experiments. Adv Water Resour. 2013;62:370–387. doi: 10.1016/j.advwatres.2013.09.008.
  7. Koponen A, Kataja M, Timonen J. Permeability and effective porosity of porous media. Phys Rev E. 1997;56(3):3319–3325. doi: 10.1103/PhysRevE.56.3319.
  8. Mavko G, Nur A. The effect of a percolation threshold in the Kozeny-Carman relation. GEOPHYSICS. 1997;62(5):1480–1482. doi: 10.1190/1.1444251.
  9. Bernabe Y, Brace WF, Evans B. Permeability, porosity and pore geometry of hot-pressed calcite. Mech Mater. 1982;1(3):173–183. doi: 10.1016/0167-6636(82)90010-2.
  10. Nishiyama N, Yokoyama T. Permeability of porous media: Role of the critical pore size. J Geophys Res Solid Earth. 2017;122(9):6955–6971. doi: 10.1002/2016JB013793.
  11. Elmorsy M, El-Dakhakhni W, Zhao B. Generalizable Permeability Prediction of Digital Porous Media via a Novel Multi-Scale 3D Convolutional Neural Network. Water Resour Res. 2022;58(3). doi: 10.1029/2021WR031454.
  12. Tian J, Qi C, Sun Y, Yaseen ZM, Pham BT. Permeability prediction of porous media using a combination of computational fluid dynamics and hybrid machine learning methods. Eng Comput. 2021;37(4):3455–3471. doi: 10.1007/s00366-020-01012-z.
  13. Mohammadian E, Kheirollahi M, Liu B, Ostadhassan M, Sabet M. A case study of petrophysical rock typing and permeability prediction using machine learning in a heterogenous carbonate reservoir in Iran. Sci Rep. 2022;12(1):4505. doi: 10.1038/s41598-022-08575-5.
  14. Rezaee R, Ekundayo J. Permeability Prediction Using Machine Learning Methods for the CO2 Injectivity of the Precipice Sandstone in Surat Basin, Australia. Energies. 2022;15(6):2053. doi: 10.3390/en15062053.
  15. Gholami R, Shahraki AR, Jamali Paghaleh M. Prediction of Hydrocarbon Reservoirs Permeability Using Support Vector Machine. Math Probl Eng. 2012;2012:1–18. doi: 10.1155/2012/670723.
  16. Erofeev A, Orlov D, Ryzhov A, Koroteev D. Prediction of Porosity and Permeability Alteration Based on Machine Learning Algorithms. Transp Porous Media. 2019;128(2):677–700. doi: 10.1007/s11242-019-01265-3.
  17. Tembely M, AlSumaiti AM, Alameri W. A deep learning perspective on predicting permeability in porous media from network modeling to direct simulation. Comput Geosci. 2020;24(4):1541–1556. doi: 10.1007/s10596-020-09963-4.
  18. Akasheva Z, Bolysbek D, Assilbekov B. Study of carbonate rock dissolution using x-ray microcomputed tomography: impact of acid flow rate. News Natl Acad Sci Repub Kazakhstan Ser Geol Tech Sci. 2023;1(457):20–32. doi: 10.32014/2023.2518-170Х.256.
  19. Shahani NM, Zheng X, Liu C, Hassan FU, Li P. Developing an XGBoost Regression Model for Predicting Young’s Modulus of Intact Sedimentary Rocks for the Stability of Surface and Subsurface Structures. Front Earth Sci. 2021;9. doi: 10.3389/feart.2021.761990.
  20. Hameed MM, AlOmar MK, Khaleel F, Al-Ansari N. An Extra Tree Regression Model for Discharge Coefficient Prediction: Novel, Practical Applications in the Hydraulic Sector and Future Research Directions. Armaghani D, ed. Math Probl Eng. 2021;2021:1–19. doi: 10.1155/2021/7001710.

Қосымша файлдар

Қосымша файлдар
Әрекет
1. JATS XML
2. Figure 1. 3D digital models of samples (a), extraction of small volumes (b) and display of existing fractures in sample #2 (c)

Жүктеу (217KB)
3. Figure 2. Pairwise (a) and correlation matrix (b) for the initial data

Жүктеу (310KB)
4. Figure 3. Predicted and true permeability for data division in the ratio of 70/30 (a) and 80/20 (b)

Жүктеу (144KB)
5. Figure 4. Feature importances in permeability prediction using Random Forest (left), Extra Tree (center), and XGBoost (right) methods

Жүктеу (115KB)
6. Figure 5. Pairwise (a) and correlation matrix (b) for the initial data

Жүктеу (324KB)
7. Figure 6. Predicted and true permeability for data division in the ratio of 70/30 (a) and 80/20 (b)

Жүктеу (120KB)
8. Figure 7. Pair-plots and distribution diagrams of small volumes, extracted from non-fractured (a) and fractured (b) samples

Жүктеу (401KB)
9. Figure 8. Correlation matrix for the initial data of small volumes, extracted from non-fractured (a) and fractured (b) samples

Жүктеу (245KB)
10. Figure 9. Predicted and true permeabilities of small volumes extracted from non-fractured samples for the data division in a ratio of 70/30 (a) and 80/20 (b)

Жүктеу (92KB)
11. Figure 10. Predicted and true permeabilities of small volumes extracted from a fractured sample for the data division in a ratio of 70/30 (a) and 80/20 (b)

Жүктеу (101KB)
12. Figure 11. Predicted and true permeabilities of small volumes extracted from (a) fractured and (b) non-fractured samples during blind tests

Жүктеу (95KB)

© Assilbekov B., Kalzhanov N., Bolysbek D., Uzbekaliyev K., Bekbau B., Kuljabekov A., 2023

Creative Commons License
Бұл мақала лицензия бойынша қол жетімді Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

Осы сайт cookie-файлдарды пайдаланады

Біздің сайтты пайдалануды жалғастыра отырып, сіз сайттың дұрыс жұмыс істеуін қамтамасыз ететін cookie файлдарын өңдеуге келісім бересіз.< / br>< / br>cookie файлдары туралы< / a>