Similar presentations:
Методы построения калибровочных моделей для прогнозирования свойств индивидуальных углеводородов
1. «Методы построения калибровочных моделей для прогнозирования свойств индивидуальных углеводородов»
2. Интеллектуальный анализ данных
Интеллектуальный анализ данных (ИАД) или Data mining:Исследование и обнаружение вычислительной машиной (алгоритмами, средствами искусственного
интеллекта) в сырых данных скрытых знаний, которые ранее были не известны, нетривиальны,
практически полезны, доступны для интерпретации человеком.
3. Примеры применения
Казначейство США◦ Финансовые преступления - поиск подозрительных транзакций
Управление по борьбе с наркотиками
◦ Анализ телефонных переговоров подозреваемых
HSBC
◦ Снижение затрат на рассылки за счет анализа клиентской базы
Финансовая группа Capital One
◦ Анализ клиентской базы и подбор соответствующих продуктов и идентификация мошенников
BBC
◦ Использование ИАД для составление сетки вещания
Boeing
◦ Улучшение тех. процессов
Southern California Gas Company
◦ Применение ИАД как средства стратегического маркетинга
4. Интеллектуальный анализ данных в нефтегазовой отрасли
Основное направление – анализ геологических данных.◦ Классификация коллектор – не коллектор.
◦ Анализ изображений в литологии.
Регрессионный анализ и деревья решений
◦ Зависимости между уплотнением сетки скважин и характеристиками месторождения.
◦ Зависимости между оценками конечной (суммарной) добычи и геологическими/пластовыми характеристиками.
Нейронные сети
◦ Идентификация литофаций с помощью карт Кохонена.
◦ Прогнозирование оценки конечной (суммарной) добычи из геологических характеристик.
Визуализация и поиск трендов
Хемометрика
◦ Контроль качества
◦ Экспресс-методы анализа
5. Хемометрика
Хемометрика – это химическая дисциплина, применяющая математические,статистические и другие методы, для построения или отбора оптимальных методов
измерения и планов эксперимента, а также для извлечения наиболее важной информации
при анализе экспериментальных данных
6. Методы определения ОЧ
• Моторные методы:Арбитражные
Экспресс
• ГОСТ Р 52946-52947-2008
• ГОСТ 8226-82
• ГОСТ 511-82
• ASTM D2699 – 2700
• EN ISO 5163 - 5164:2005
• Хроматография
• По диэлектрической проницаемости
• ИК-Фурье-спектрометрия
• По показателю преломления
7. Методика определения ОЧ
УглеводородИзмерение
спектра
Диапазон длин волн:400- 4000,
4000-12500 см-1 ,
Оптическое разрешение: 2 см-1
Построение
градуировочной
модели
Предсказание
ОЧ
Выбор характеристических областей.
Использование метода ПЛС с кроссвалидацией
8. Компоненты модельных смесей бензинов
Индивидуальныеуглеводороды
Для предсказания ОЧ использовались индивидуальные углеводороды,
потенциально входящие в состав бензинов (23 соединения).
Н-парафины (Нормальные алканы) – 4 - вещества
Изо-парафины (Метилы) – 11 веществ
Арены (Ароматические) – 8 веществ
9. Исходные данные
10. Результаты спектроскопии
Спектры углеводородов в БИК-диапазоне(NIR)(4000-12000 см-1)
Спектры углеводородов в среднем ИКдиапазоне(MIR) (400-4000 см-1)
11. Подготовка данных
Импорт данных в RapidMiner StudioИспользование Метода главных компонент
Метод Главных Компонент (англ. Principal Components
Analysis, PCA) — один из основных способов уменьшить
размерность данных, потеряв наименьшее количество
информации.
12. Регрессия на главные компоненты
IМГК
II
Многомерная
Линейная
Регрессия
Многомерная линейная
регрессия — это линейная
регрессия в n-мерном
пространстве. Задачей
множественной линейной
регрессии является построение
линейной модели связи между
набором непрерывных
предикторов и непрерывной
зависимой переменной.
Регрессионный анализ используется для прогноза, анализа
временных рядов, тестирования гипотез и выявления
скрытых взаимосвязей в данных.
13. Нейронные сети
Иску́сственная нейро́нная се́ть (ИНС) — математическая модель, построенная попринципу организации и функционирования биологических нейронных сетей — сетей
нервных клеток живого организма.
Оператор перебора параметров
Optimize parameters (Grid)
14. PLS
15. Деревья решений (регрессии)
Дерево решений – бинарное дерево, где в каждом узле происходит проверка условияКаждая ветвь представляет собой результат такой проверки. В каждом листе получается
предсказанное значение
16. Сравнение результатов
Октановое число для 3-х классов веществ и всех веществ, в среднем ИК диапазонеГруппы веществ
PLS
изо-алканы
Ароматические углеводороды
алканы
все вещества
2,47
0,02
0,48
1,57
Деревья решений
31,13
2,97
177,20
72,64
17. Сравнение результатов
Октановое число для 3-х классов веществ и всех веществ, в ближнем ИК диапазонеГруппы веществ
PLS
изо-алканы
Ароматические углеводороды
алканы
все вещества
3,17
0,31
3,94
2,90
Деревья решений
64,71
7,76
194,91
62,25
18. Сравнение моделей
ОКТАНОВОЕ ЧИСЛОMIR
14,758
16
NIR
14
10,840
12
RMSE
10
9,849
7,375
7,184
8
5,969
6
2,903
4
1,567
2
0
PLS(OPUS)
PCR
Методы
NN
PLS
19. Сравнение моделей
PCRRMSE (MIR)
30,000
26,134
25,000
NN
23,972
22,085
22,382
20,000
13,249
11,648
15,000
10,000
7,184 7,375
4,799 4,305
5,000
0,000
ОКТАНОВОЕ
ЧИСЛО
ТЕМПЕРАТУРА
КИПЕНИЯ
КОЭФФИЦИЕНТ
ПРЕЛОМЛЕНИЯ
МОЛЯРНАЯ
РЕФРАКЦИЯ
ПЛОТНОСТЬ
20. Сравнение моделей
RMSE (NIR)30,000
27,198
PCR
NN
25,000
17,727
20,000
24,864
16,872
15,121
15,000
10,840
9,351
10,000
5,969
4,892 4,998
5,000
0,000
ОКТАНОВОЕ
ЧИСЛО
ТЕМПЕРАТУРА
КИПЕНИЯ
КОЭФФИЦИЕНТ
ПРЕЛОМЛЕНИЯ
МОЛЯРНАЯ
РЕФРАКЦИЯ
ПЛОТНОСТЬ
21. Сравнение моделей
PСR30,000
26,13427,198
MIR
NIR
25,000
23,97224,864
20,000
15,121
13,249
15,000
10,840
10,000
7,184
4,799 4,892
5,000
0,000
ОКТАНОВОЕ
ЧИСЛО
ТЕМПЕРАТУРА
КИПЕНИЯ
КОЭФФИЦИЕНТ
ПРЕЛОМЛЕНИЯ
МОЛЯРНАЯ
РЕФРАКЦИЯ
ПЛОТНОСТЬ
22. Сравнение моделей
NEURAL NET25,000
22,382
20,000
MIR
NIR
17,727
22,085
16,872
15,000
10,000
11,648
9,351
7,375
5,969
4,305 4,998
5,000
0,000
ОКТАНОВОЕ
ЧИСЛО
ТЕМПЕРАТУРА
КИПЕНИЯ
КОЭФФИЦИЕНТ
ПРЕЛОМЛЕНИЯ
МОЛЯРНАЯ
РЕФРАКЦИЯ
ПЛОТНОСТЬ
23. Сравнение моделей
Октановое Число (MIR)18,000
PCR
NN
15,511
16,000
14,000
12,000
10,000
8,000
6,000
4,000
2,000
3,849
2,597
3,092
1,560
1,061
0,000
АРОМАТИКА
ИЗО-ПАРАФИНЫ
АЛКАНЫ
24. Сравнение моделей
Октановое Число (NIR)9,000
PCR
NN
7,663
8,000
7,000
6,000
5,000
3,401
4,000
3,000
3,737
2,226
2,000
1,000
0,880
0,696
0,000
АРОМАТИКА
ИЗО-ПАРАФИНЫ
АЛКАНЫ
25. Выводы
Результатомреализации
рассмотренных
методик
стали
модели,
способные
спрогнозировать химические и физические свойства индивидуальных углеводородов по их
среднему и ближнему инфракрасному спектру. Полученные модели были исследованы и
оценены, проведено детально сравнение этих моделей между собой. Данные модели могут
быть применены на производстве углеводородов в качестве методов экспресс-анализа
веществ и для контроля в реальном времени.