Патентная документация ЕАПВ

 
Запрос :  ea201170574a*\id

больше ...
Термины запроса в документе


Полный текст патента

(57) Реферат / Формула:

Способ идентификации геологических особенностей из геологических или атрибутивных данных с использованием выполняемого в окне анализа главных компонент (или независимых компонент). Трудно уловимые особенности делают идентифицируемыми в частичных или остаточных массивах данных. Остаточные массивы (24) данных создают, исключая (36) данные, не захваченные самыми выделяющимися главными компонентами (14). Частичные массивы данных создают (35), проецируя данные на выбираемые главные компоненты. Способ пригоден для идентификации физических особенностей, указывающих на углеводородный потенциал.


Евразийское (21) 201170574 (13) Al
патентное
ведомство
(12) ОПИСАНИЕ ИЗОБРЕТЕНИЯ К ЕВРАЗИЙСКОЙ ЗАЯВКЕ
(43) Дата публикации заявки 2011.10.31
(22) Дата подачи заявки 2009.09.30
(51) Int. Cl. G01V1/00 (2006.01)
(54) ВЫПОЛНЯЕМЫЙ В ОКНЕ СТАТИСТИЧЕСКИЙ АНАЛИЗ ДЛЯ ОБНАРУЖЕНИЯ АНОМАЛИЙ В НАБОРАХ ГЕОФИЗИЧЕСКИХ ДАННЫХ
(31) (32) (33)
(86) (87) (71)
(72)
(74)
61/114,806; 61/230,478 2008.11.14; 2009.07.31
PCT/US2009/059044
WO 2010/056424 2010.05.20
Заявитель:
ЭКСОНМОБИЛ АПСТРИМ РИСЕРЧ КОМПАНИ (US)
Изобретатель:
Ку маран Кришнан, Ван Цзинбо, Хуссенедер Стефан, Гиллард Доменик, Медема Гай Ф., Шредер Фред В., Брови Роберт Л., Димитров Павел
(US)
Представитель: Медведев В.Н. (RU)
(57) Способ идентификации геологических особенностей из геологических или атрибутивных данных с использованием выполняемого в окне анализа главных компонент (или независимых компонент). Трудно уловимые особенности делают идентифицируемыми в частичных или остаточных массивах данных. Остаточные массивы (24) данных создают, исключая (36) данные, не захваченные самыми выделяющимися главными компонентами (14). Частичные массивы данных создают (35), проецируя данные на выбираемые главные компоненты. Способ пригоден для идентификации физических особенностей, указывающих на углеводородный потенциал.
2420-176202ЕА/052
ВЫПОЛНЯЕМЫЙ В ОКНЕ СТАТИСТИЧЕСКИЙ АНАЛИЗ ДЛЯ ОБНАРУЖЕНИЯ АНОМАЛИЙ В НАБОРАХ ГЕОФИЗИЧЕСКИХ ДАННЫХ
ОПИСАНИЕ
Перекрестные ссылки на родственные заявки
По этой заявке испрашивается преимущество приоритетов предварительной заявки №61/114806 на патент США, которая была подана 14 ноября 2008 года, и предварительной заявки N'61/230478 на патент США, поданной 31 июля 2009 года, раскрытия которых во всей их полноте включены в эту заявку путем ссылки.
Область техники, к которой относится изобретение
Изобретение в основном и в целом относится к области геофизических исследований, а более конкретно к способу обработки геофизических данных. В частности изобретением является способ выделения областей в одном или нескольких наборах геологических или геофизических данных, таких как сейсмические данные, которые представляют реальные
геологические особенности, в том числе потенциальные залежи углеводородов, без использования предшествующих обучающих данных и в тех случаях, когда необходимые физические особенности могут проявляться в необработанных данных только в трудно уловимой форме, завуалированными более выделяющимися аномалиями.
Уровень техники изобретения
Наборы сейсмических данных часто содержат сложные картины, которые являются едва различимыми и проявляются в многочисленных массивах сейсмических или
атрибутивных/производных данных в многочисленных
пространственных масштабах. В течение нескольких последних десятилетий геологи и геофизики разработали ряд способов для выделения многих важных картин, которые указывают на присутствие углеводородов. Однако большая часть этих способов включает в себя изучение известных или в общих чертах обозначенных картин с заданными характеристиками в одном
массиве данных или в лучшем случае в двух массивах. В этих способах "на основе шаблона" или "на основе модели" часто пропускаются трудно уловимые или непредвиденные аномалии, которые не согласуются с такими заданными характеристиками. Далее эти способы не будут рассматриваться в этой заявке, поскольку они имеют мало общего с настоящим изобретением за исключением того, что они направлены на решение той же самой технической проблемы.
Большая часть этих известных способов включает в себя изучение человеком-интерпретатором известных или в общих чертах обозначенных картин с заданными характеристиками в одном массиве данных или в лучшем случае в двух массивах. В этих способах "на основе шаблона" или "на основе модели" часто пропускаются трудно уловимые или непредвиденные аномалии, которые не согласуются с такими заданными характеристиками. Поэтому желательно разработать способы статистического анализа, посредством которых можно автоматически выделять аномальные области в одном или нескольких массивах сейсмических данных в различных пространственных масштабах без предшествующей информации о том, что они представляют собой и где они находятся. Настоящее изобретение соответствует этому требованию.
Сущность изобретения
В одном осуществлении изобретением является способ идентификации геологических особенностей в одном или нескольких двумерных или трехмерных дискретизированных наборах геофизических данных или атрибуте данных (каждый такой набор данных называется "исходным массивом данных"), представляющем подземную область, содержащий этапы, на которых: (а) выбирают форму и размер окна данных; (Ь) для каждого исходного массива данных перемещают окно во множество перекрывающихся или неперекрывающихся положений в исходном массиве данных так, что каждый воксел данных включается в по меньшей мере одно окно, и формируют для каждого окна вектор I окна данных, компоненты которого состоят из значений вокселов из пределов этого окна; (с) используют векторы окна данных для выполнения
статистического анализа и вычисления распределения значений данных, при этом статистический анализ выполняют совместно в случае множества исходных массивов данных; (d) используют распределение значений данных для идентификации выбросов или аномалий в данных; и (е) используют выбросы или аномалии для прогнозирования геологических особенностей подземной области.
Геологические особенности, которые идентифицируют, используя способ настоящего изобретения, затем могут использоваться для прогнозирования наличия залежей углеводородов.
Краткое описание чертежей
Настоящее изобретение и его преимущества станут более понятными при обращении к нижеследующему подробному описанию и сопровождающим чертежам, на которых:
В качестве тестовых примеров применения способа настоящего изобретения на фиг.1А показано изображение (двумерный временной срез) из трехмерного массива синтетических сейсмических данных; на фиг.1В показан остаток исходного изображения, образованный способом настоящего изобретения, выделенный с помощью первых шестнадцати главных компонент, которыми учитываются 90% информации; и на фиг.1С показаны первые шестнадцать главных компонент в формате 30x30;
фиг. 2 - схематичное представление основных этапов в одном осуществлении способа настоящего изобретения, в котором используют анализ остатков;
фиг. 3 - блок-схема последовательности действий, показывающая этапы применения выполняемого в окне анализа главных компонент согласно осуществлению настоящего изобретения к многочисленным массивам данных с использованием окна одного размера;
фиг.4А-В - представления двумерного среза массива данных (большая прямоугольная область) и выборочной совокупности этих данных (небольшая прямоугольная область) для различных пикселов в окне, при этом на фиг.4А показана выборочная совокупность данных для пиксела (1, 1) и на фиг.4В показана выборочная
совокупность данных для 1-го пиксела; и
фиг.5А-В - иллюстрация подразделения данных, не находящихся в выборочной совокупности, в случае двумерного набора данных из фиг.4А-В, предназначенного для эффективного вычисления ковариационной матрицы.
Фиг.1А-С и 2 являются черно-белыми репродукциями цветных изображений.
Изобретение будет описано применительно к примерам осуществлений. В той части, в которой нижеследующее описание является специфическим для конкретного осуществления или конкретного использования изобретения, оно предполагается только иллюстративным и не должно толковаться как ограничивающее объем изобретения. И наоборот, оно предполагается охватывающим все варианты, модификации и эквиваленты, которые могут быть включены в объем изобретения, определенный прилагаемой формулой изобретения.
Подробное описание вариантов осуществлений
Настоящее изобретение представляет собой способ обнаружения аномальных картин в многомассивных сейсмических данных или других геофизических данных (например, электромагнитных данных) в многочисленных пространственных масштабах без использования предшествующих обучающих данных. Способ изобретения основан на выполняемом в окне статистическом анализе, который в одном осуществлении изобретения включает в себя следующие основные этапы:
1. Выделение статистического распределения данных в пределах окон с задаваемым пользователем размером и формой. Могут использоваться стандартные статистические методы, такие как анализ главных компонент (АГК), анализ независимых компонент (АНК), кластерный анализ.
2. Выделение аномальных областей в данных путем (а) вычисления вероятности появления (или эквивалентной метрики) каждого окна данных в выделенном распределении, (Ь) идентификации маловероятных областей данных в качестве возможных аномалий.
Особенно удобное осуществление изобретения включает в себя
сочетание выполняемого в окне анализа главных компонент (ОАГК), анализа остатков и кластерного анализа, которое будет описано подробно ниже. Однако любой специалист в данной области техники без труда поймет, каким образом другие методы статистического анализа можно использовать или соответствующим образом приспосабливать для решения аналогичных задач.
Полезным обобщением анализа главных компонент (АГК) является метод, известный как анализ независимых компонент
(АНК), который является предпочтительным в случаях, когда распределение данных сильно отличается от стандартного многомерного гауссова распределения. В этом случае способ настоящего изобретения соответственно обобщают, чтобы использовать выполняемый в окне анализ независимых компонент
(ОАНК), за которым следует обобщение анализа остатков, называемого обнаружением выбросов. Согласно одному
осуществлению в настоящем изобретении используют анализ главных компонент в скользящих окнах, за которым следует вычисление внутренних произведений и остатков данных на основании главных компонент (ГК), которые, как полагают, предпочтительно применять не только в сейсмических областях, а в более широкой области обработки многомерных данных. Она охватывает области обработки изображений, речи и сигналов.
Анализ главных компонент (АГК) представляет собой хорошо известный классический метод анализа данных, впервые предложенный Pearson ("On lines and planes of closest fit to systems of points in space", Philos. Magazine, v.2, pp.559-572
(1901)) и в дальнейшем усовершенствованный Hotelling ("Analysis of a complex of statistical variables into principal components", Journal of Education Psychology, v.24, pp.417-441
(1933)). Считается, что первое известное применение анализа главных компонент к сейсмическим данным имело место в виде преобразования Карунена-Лоэва, названного в честь Kari Karhunen и Michel Loeve (Watanabe, "Karhunen-Loeve expansion and factor analysis", Transactions of the Fourth Prague Conference, J. Kozesnik, ed., Prague, Czechoslovakia Academy of Science
(1967)). В этом способе анализ главных компонент использовался
для описания информационного наполнения в наборе сейсмических трасс, при этом набор входных данных формировался из всех сейсмических трасс, без многомерных окон переменного размера. Первоначальное применение способа Watanabe относилось к разложению всех сейсмических трасс и использованию первых нескольких трасс с главными компонентами для восстановления энергии наиболее когерентных волн, и тем самым фильтрации негеологического шума.
Анализ главных компонент чаще всего используют при сейсмическом анализе, чтобы уменьшать количество измеряемых характеристик для статистически независимого набора атрибутов (см., например, Fournier & Derain, "A statistical methodology for deriving reservoir properties from seismic data", Geophysics, v.60, pp.1437-1450 (1995); и Hagen, "The application of principal components analysis to seismic data sets", Geoexploration, v.20, pp.93-111 (1982)). В процессе интерпретации сейсмических данных из исходных данных часто образуют многочисленные производные продукты. Поскольку эти атрибуты взаимосвязаны в различной степени, анализ главных компонент представляет собой изящный способ уменьшения числа атрибутов при сохранении большого количества информации.
В настоящее время считается, что нет статистических способов обнаружения выбросов методом скользящего окна, предназначенных для нахождения представляющих интерес геологических особенностей на основе наблюдения и исследования геологических и геофизических данных. Однако такие способы применяют по отношению к специфическим поднаборам или областям сейсмических данных при специализированной обработке сигналов или при решении задачи построения модели коллектора. Key и Smithson ("New approach to seismic reflection event detection and velocity determination", Geophysics, v.55, pp.1057-1069 (1990)) применяли анализ главных компонент в двумерных скользящих окнах для сейсмических данных до суммирования и использовали полученное в результате отношение собственных значений в качестве меры когерентности сигнала. Сами главные компоненты для обнаружения особенностей в сейсмических данных
до суммирования не использовали. Sheevel и Payrazyan ("Principal component analysis applied to 3D seismic data for reservoir property estimation", Society of Petroleum Engineers Annual Conference and Exhibition (1999)) вычисляли основанные на трассах главные компоненты, используя небольшие одномерные скользящие вертикальные окна, и вводили те главные компоненты, которые больше всего оказывались относящимися к геологии, в алгоритм классификации, который прогнозирует свойства коллектора без калибровки скважины. И на этот раз в этом одномерном способе с единственным набором данных не делалась попытка автоматически идентифицировать аномалии или выбросы в данных. Cho и Spencer ("Estimation of polarization and slowness in mixed wavefields", Geophysics, v.57, pp.805-814 (1992)) и Richwalski et al. ("Practical aspects of wavefield separation of two-component surface seismic data based on polarization and slowness estimates", Geophysical Prospecting, v.48, pp.697-722 (2000)) использовали выполняемый в двумерном окне анализ главных компонент в частотной области, чтобы моделировать распространение заданного количества продольных и поперечных волн.
Задача Wu et al. ("Establishing spatial pattern correlations between water saturation time-lapse and seismic amplitude time-lapse", Petroleum Society's 6th Annual Canadian International Petroleum Conference (56th Annual Technical Meeting (2005)) заключалась в оптимальной корреляции данных одного массива сейсмических данных или массивов сейсмических данных мониторинга с данными моделирования течения в модели коллектора, чтобы оценивать фактические, периодически контролируемые значения насыщения пространственных картин. Их способ заключается в выполнении сравнений от точки к точке не на основании исходных массивов данных, а на основании проекции этих данных на первый главный собственный вектор из анализа главных компонент. Таким образом, их задача заключается в корреляции сейсмических данных с известной моделью, а не идентификации аномальных картин в сейсмических данных.
В патенте США №5848379, Bishop ("Method for characterizing
subsurface petrophysical properties using linear shape attributes", (1998)), раскрыт способ прогнозирования свойств подземной породы и классификации сейсмических данных при анализе фаций или текстуры, а не идентификации представляющих интерес геологических особенностей на основе наблюдения и исследования, которая является технической задачей, на которую направлено настоящее изобретение. Bishop выполнял
статистический анализ, используя анализ главных компонент для разложения сейсмических трасс на линейную комбинацию баз ортогональных волновых сигналов, называемых линейными формами, в пределах заданного временного или глубинного интервала. Атрибут линейной формы (АЛФ) определялся как поднабор весов (или собственных значений), используемых для восстановления формы конкретной трассы. Кроме того, Bishop не раскрывает перекрывающихся окон, одновременного анализа многочисленных массивов данных или использования статистического распределения для обнаружения аномальных областей данных.
В других способах статистического анализа геологических и геофизических данных используют, например, методы искусственных нейронных сетей, генетических алгоритмов и многоточечной статистики, но без решения задачи автоматического обнаружения аномальных картин. В дополнение к этому эти методы обычно приносят ограниченный успех, поскольку их внутренние механизмы часто завуалированы, и для них часто требуются большие количества обучающих данных, и они сильно зависят от них.
Как установлено ранее, анализ главных компонент и анализ независимых компонент представляют собой методы, которые обычно используют для разделения высокоразмерных (то есть многомерных или многоатрибутивных) сигналов на статистически
некоррелированные (то есть независимые) компоненты. В выполняемых в окнах анализе главных компонент и анализе независимых компонент согласно настоящему изобретению анализ компонент применяют к набору данных, который получают на основании исходных данных путем представления каждой - точки в исходных данных в виде совокупности точек в ее окрестности (то есть, окне). Для иллюстрации этой концепции далее с обращением
к блок-схеме последовательности действий на фиг.3 описана реализация выполняемого в окне анализа главных компонент относительно единственного трехмерного массива данных при использовании фиксированного размера окна. Аналогичная процедура или эквивалентная анализу независимых компонент может быть применена к двумерному массиву данных или одновременно к многочисленным двумерным или трехмерным массивам данных. (См. этап 31 из фиг.З). Рассмотрим трехмерный массив сейсмических данных размером Nx х Ny х Nz :
(Этап 32) Выбор формы окна (например, эллипсоидной или кубовидной) и размера (например, радиуса г, пх хлу х nz ) .
Каждый воксел в трехмерном массиве сейсмических данных, J-i,j,k ' представляют как вектор 1±^,к размерностью лх х пу х nz ,
который содержит значения вокселов в пределах каждой заключенной в окно окрестности воксела.
(Этап 33) Вычисление матрицы средних значений и
ковариационной матрицы всех их л-мерных (л = пх х лу хп2) векторов
{l1:jrk}, N = (Nx - пх) х {Ny - пу) х {Nz - nz) , в следующем виде:
iV 1,3,к ij,k
W(t, к)
Вычисление корреляционной матрицы W{t, к) = , , где
¦Jw(t, t)-yjw(k, к)
t и к являются двумя индексами вектора I и поэтому представляют два различных набора пространственных координат в трех измерениях.
(Этап 34) Вычисление собственных значений (главных значений) {\ > Л2 > . . . > Лп} и собственных векторов (главных
компонент) {vir v2, . . . , vn} матрицы N. Как вариант могут быть вычислены собственные значения ковариационной матрицы; они будут отличаться от собственных значений корреляционной матрицы только масштабным коэффициентом. Эти собственные векторы будут иметь размер лх х пу х nz и после видоизменения из их векторной
формы обратно в оконную форму представят различные (независимые) пространственные картины в данных, упорядоченные
от наибольшей общей до наименьшей общей. Соответствующие собственные значения представляют, сколько имеется исходных данных (то есть, величину дисперсии), которые учитываются каждым собственным вектором.
Образование одного или нескольких нижеследующих частичных массивов сейсмических или атрибутивных данных, которые затем исследуют на наличие аномалий, которых не смогли выявить в исходном массиве данных:
(a) (Этап 35) Проекция: Часть исходных данных, которую можно восстановить, используя каждую главную компоненту или группы главных компонент (выбираемые, например, на основании кластерного анализа). Ее получают, используя внутреннее произведение средне-центрированного и нормированного массива сейсмических данных на каждую главную компоненту или группу главных компонент. Поэтому проекция вектора А на вектор В означает проекция(А) = (А-В)В / | В \2 и является вектором в направлении В .
(b) (Этап 36) Остаток: Оставшийся сигнал в исходном массиве, который не был захвачен первыми к - 1 (то есть,
наиболее общими) главными компонентами. В предпочтительном осуществлении изобретения его получают, проецируя средне-центрированный и нормированный массив сейсмических данных в подпространство, порожденное {vk, vk+1, . . . , vn}, так что
k-l п
^ Л1 > -R"Z Л1 i где R является задаваемым пользователем пороговым
i=l i=l
значением между 0 и 1. Как вариант можно добавлять проекции снизу вверх, но в некоторых случаях это будет более обременительным в вычислительном отношении.
(c) Выброс: Анализ остатков из пункта (Ь) представляет собой способ нахождения "степени аномалии" каждого воксела, которую определяют в одном осуществлении изобретения. Для массивов атрибутивных данных из (а) и (Ь) нет необходимости в альтернативном способе вычисления "степени аномалии" каждого воксела, которая будет обозначаться R' (поскольку она связана с остатком R, определенным выше, но не является тождественной
ему) и дается следующей формулой:
Используя эту меру степени аномалии, формируют частичный массив данных. В эту меру также отбирают "выбросы", которые лежат в пространстве, порожденном небольшим количеством первых собственных векторов, но в некоторых случаях для этого может потребоваться более значительный объем вычислений, чем для двух этапов, упомянутых выше. Однако можно заметить, что в этом случае этап 34, изложенный выше, можно пропустить или просто заменить разложением Холецкого корреляционной матрицы, что даст возможность быстрее оценивать R' .
Имеются варианты описанного выше основного способа, в которых используют различные схемы нормирования данных. Способ можно распространить на произвольное количество массивов сейсмических данных. Регулируемыми параметрами, над которыми пользователь может экспериментировать, являются (1) форма окна, (2) размер окна и (3) пороговое значение R остаточной проекции.
Результат применения выполняемого в окне анализа 3x3 главных компонент по отношению к двумерному срезу сейсмических данных показан на фиг.1А-С. На фиг.1А показано изображение (двумерного временного среза) из трехмерного массива синтетических сейсмических данных. На практике это изображение обычно представляют в цвете, где цвета показывают амплитуды сейсмических отраженных волн (например, синий - положительные, красный - отрицательные). На фиг.1В показан остаток исходного изображения после учета первых шестнадцати главных компонент для получения 90% информации. Остаток имеет большие значения на аномальных картинах, которые в этом случае представляют разрывы. В цветной версии фиг.1В синий цвет может указывать на небольшую величину остаточной аномалии, а более теплыми цветами может выделяться аномальная система сбросов, которую в этом случае можно ясно видеть на изображении остатка из фиг.1В. На фиг.1С показаны шестнадцать самых важных (то есть, первых) главных компонент 14 в окне формата 30x30. Можно видеть, что в
нижних двух рядах разрывы захвачены в нескольких главных компонентах.
Результат применения выполняемого в окне анализа 9x9 главных компонент по отношению к двумерному разрезу синтетических сейсмических данных показан на схематичной блок-схеме последовательности действий из фиг.2. Позицией 21 показан двумерный разрез из трехмерного массива синтетических сейсмических данных. Как обычно, цвета использованы для представления амплитуд сейсмических отраженных волн. Небольшая 8-миллисекундная антиклиналь, очень малозаметная для обнаружения глазом, включена в фоновое горизонтальное отражение. Первые четыре главные компоненты (собственные векторы (СВ)) входного изображения показаны позицией 22. На виде 23 показана проекция исходного изображения на первые четыре собственных вектора, в которой учитывается 99% информации. На виде 24 показан остаток после того, как спроецированное изображение вычтено из исходного. Теперь включенная едва различимая особенность обнаруживается на глубине (соответствующей двойному времени пробега) около 440 мс между трассами под номерами 30-50 (определяющими поперечное положение в одном измерении). При отображении в цвете "горячие" цвета можно использовать для выявления местоположения включенной едва различимой особенности.
На блок-схеме последовательности действий из фиг. 3 представлено осуществление способа настоящего изобретения, в котором выполняемый в окне анализ главных компонент применяют к многочисленным массивам данных, используя окно одного размера.
Обобщения и эффективность при построении канонических картин
В следующих разделах описаны улучшения выполняемого в окне анализа главных компонент согласно настоящему изобретению, которые делают более удобным его применение благодаря уменьшенному объему вычислений и позволяют лучше использовать результаты за счет интерпретации главных или независимых компонент и их избирательного сохранения или удаления.
Вычислительная эффективность: Прямой способ вычисления ковариационной матрицы, изложенный выше, при больших наборах данных является обременительным в вычислительном отношении с учетом требований к запоминающему устройству и процессору. Поэтому в этой заявке раскрыт альтернативный способ, в котором используют то, что отдельные векторы из анализа главных компонент являются окнами, скользящими от края до края данных. Рассмотрим, например, одномерный набор данных со значениями 12, . . . , IN} . Для оценивания ковариационной матрицы окон размера К < N первый момент и второй момент вводимых данных можно вычислять следующим образом:
N-K+i
E(Xi) = Xi=- Ylk при 1 <1 <К,
N - К f^i
N-K+i
E(X1Xj) = --- J]!^, при l N - К k=1
Можно заметить, что этот способ включает в себя использование только средних и внутренних произведений подвекторов данных (субматриц более высоких размерностей) и следовательно, исключается запоминание и преобразование многочисленных малоразмерных окон, получаемых на основании исходных данных. Поэтому это видоизменение вычислительного способа позволяет использовать объектно-ориентированное программное обеспечение с эффективным индексированием массива (такое как Matlab) и таблицы суммарных областей, структуру данных, описанные Crow в "Summed-area tables for texture mapping", Computer Graphics 18, 207 (1984), для вычисления ковариационных матриц с минимальными затратами на запоминание и вычисление.
Как вариант вычислительную эффективность можно повысить, представляя вычисление ковариационной матрицы рядом операций взаимной корреляции в постепенно уменьшающихся областях. Для иллюстрации способа рассмотрим двумерный набор данных, показанный на фиг.4А-В, размером п = пх * пу и двумерное окно
размером т = тх * ту . В таком случае корреляционную матрицу W{t, к)
можно получать, сначала вычисляя среднее каждой выборочной
совокупности данных, затем вычисляя матрицу внутреннего произведения и далее нормируя эту матрицу и вычитая средние.
Во-первых, средние можно вычислять, свертывая массив данных с ядром размером выборочной совокупности данных (например, DS1), состоящей из элементов, совместно равных 1/(число пикселов в DS1). В результате этой операции образуется большая матрица, но средние представляют собой значения, расположенные в окне размером л! , находящемся в верхнем левом углу этих выходных данных. В общем случае операция этого типа будет обозначаться corrW(kernel, data) и ее результатом является окно размером т, показанное выше. Для выполнения операции с использованием быстрого преобразования Фурье (БПФ) требуется время, пропорциональное п*1од(п) и не зависящее от размера
выборочного окна. Когда т достаточно большое по сравнению с log (п), этот способ с быстрым преобразованием Фурье является более быстрым, чем прямой способ.
Во-вторых, вычисляют матрицу U{t, к) внутреннего
произведения, выполняя ряд операций corrW над подвыборками из набора данных. Можно заметить, что строку i этой матрицы, обозначенную U(i, : ) можно вычислить как U(i, : ) = corrW(DSi, data) .
Следовательно, для популяции матрицы таким способом затрачивается время, пропорциональное m*nlog(n), или меньшее.
Однако более предпочтительно вычислять U(t, к), выполняя несколько операций corrW по отношению к различным подобластям данных. В частности, можно перезаписать
corrW{DSi, data) = corrW{data, data) - corrW(data, DNSi),
где corrW(data, DNSi) обозначает взаимную корреляцию DNSi с данными в окрестности DNSi, то есть в пределах тх или т локализации DNSi. Операцию corrW{data, data) необходимо выполнять только один раз для всех строк и затем необходимо т раз вычислять corrW(data, DNSi) . Преимущество обычно возникает из того, что DNSi обычно намного меньше, чем размер набора данных, так что corrW{data, DNSi) представляет собой взаимную корреляцию относительно намного меньшего числа входных данных, чем corrW(data, data) . Точно так же вычисление corrW(data, DNSi) можно
сократить до нескольких операций corrW или даже до меньшего числа подобластей.
Многочисленные части DNSi являются одинаковыми для различных выборочных совокупностей и в один момент времени различаются только вдоль одного измерения выборочного окна. Например, рассмотрим изображение на фиг.5А-В. Области на фиг.5А, обозначенные А, В и С, взятые вместе, составляют всю зону массива данных, которая не выбирается пикселом 1. Она является зоной, которую можно дополнительно подразделять, чтобы выполнять меньшее количество вычислений. Рассмотрим "вертикальную" зону, образованную А и С, и сравним с другой выборочной областью DSi, показанной на фиг.5В. Аналогичная вертикальная зона образована объединением нескольких небольших областей: С1+С2+СЗ+С4+А1+А2. (Эквивалентное разделение области В на фиг.5А представлено объединением В1+В2 на фиг.5В.) В общем случае имеются только тх таких неодинаковых возможных зон, каждая из которых соответствует однозначному поперечному местоположению DSi . Иначе говоря, данные, содержащиеся в А+С, будут одинаковыми для многих различных выборочных совокупностей DSi данных, так что необходимо выполнять действия только тх раз, при этом исключаются вычисления относительно этой зоны. Поэтому вычисление corrW{data, DNSi) можно оптимизировать в этом способе и вычислять в соответствии с
corrW(data, DNSI) = corrW{data, А + С) + corrW{data, В + С) - corrW{data, С) , где области, обозначенные буквой, означают объединение всех областей, помеченных этой буквой и цифрой; например, С в уравнении относится к области С на фиг.5А и к С1+С2+СЗ+С4 на фиг.5В, таким же образом А+С представлено А1+А2+С1+С2+СЗ+С4 на фиг.5В. Поскольку вычисление corrW{data, А + С) необходимо
выполнять только один раз для т строк U[t, к) и аналогичным образом вычисление corrW(data, В + С), то частью, которую только необходимо вычислять для каждой строки, является corrW(data, С) . Повышение эффективности следует из того, что область, обозначенная С, обычно значительно меньше других областей. Продолжая таким образом, алгоритм распространяют на трехмерные
наборы данных и окна (а в действительности, на любую размерность).
Наконец, матрицу W(t, к) взаимной корреляции получают, соответствующим образом нормируя матрицу U и вычитая средние. W(t, к) = U{t, к) / nDS - mean(DSt) * mean(DSk),
где nDS является количеством элементов в каждой выборочной совокупности данных.
Использование масок: При очень больших наборах данных даже вычислительной эффективности, описанной выше, может быть недостаточно при имеющихся вычислительных ресурсах, чтобы своевременно получать результаты. В таких случаях можно применять (а) вычисление внутреннего произведения с собственными векторами или (Ь) вычисление главных компонент на заранее заданной маске. Маска представляет собой пространственный поднабор данных, по отношению к которому выполняют вычисления. Маска может образовываться (а) интерактивно пользователем или (Ь) автоматически с использованием производных атрибутов. Примером (Ь) будут заранее выбираемые области данных, которые имеют большие локальные градиенты при использовании алгоритмов оценивания градиента. Вычисление внутреннего произведения является более обременительным, чем вычисление главных компонент, что мотивирует применение маски по мере необходимости к одному или обоим вычислениям.
Применение канонических картин
Кроме того, вычисленные главные/независимые компоненты могут быть объединены в группы, которые представляют аналогичные картины, определяемые текстурой, неупорядоченностью или другими характеристиками. Наряду с остаточным объемом, проецированием исходных сейсмических данных на отдельные главные составляющие или группы главных составляющих образуют множество производных массивов сейсмических данных с выделенными аномальными картинами. Эти осуществления способа настоящего изобретения описаны более подробно далее.
Многочисленные окна/пространственные масштабы: Кроме того,
можно сократить объем работы при вычислении ковариационных матриц для многочисленных вложенных размеров окон в иерархическом порядке по сравнению с прямым способом вычисления их поодиночке. И опять рассмотрим одномерный пример с двумя размерами К1 <К2 окон. Сначала вычисляют первый и второй моменты для К2 , используя способ, изложенный выше, после чего те же самые величины для Кг могут быть вычислены следующим образом:
EKl(X1)= 1
N - К1
ЕХг{Х1)*(Ы-Кг)+
при 1 < i < Кг,
Е. {Х,ХЛ
N - Кг
N-K1+i
EKi{X1Xj)*(N-K2) + Y,IkIw
k=N-K2+i
при 1 < i < j < K1 .
Заметим, что приведенными выше формулами обеспечивается вычисление величин для меньших окон при возрастании объема работы. Несложно распространить этот способ на вложенный ряд окон более высокой размерности.
Использование главных компонент и проекций: Имеются многочисленные способы, которыми главные компоненты и проекции, образуемые способом настоящего изобретения, можно использовать, комбинировать и визуализировать. Одно предпочтительное осуществление включает в себя идентификацию аномалий путем использования остатка, описанного выше. В равной мере способ применим для выполнения избирательных проекций исходных данных на выбранный поднабор главных компонент. Поднабор может выбираться (а) интерактивно пользователем или (Ь) автоматически с использованием вычислительных метрик относительно главных компонент. Примером (Ь) может быть выбор с использованием автоматического геометрического алгоритма главных компонент, которые имеют особенности, напоминающие "каналы" или трубчатые структуры. Другим примером может быть снижение шума во входных данных путем создания проекции, из которой исключены "зашумленные" главные компоненты, с использованием алгоритма обнаружения шума или дисперсионной метрики. Специалисты, которые работают в данной области техники, на основании этого описания выявят другие примеры.
Альтернативные применимые способы визуализации результатов выполнения проекций при различных размерах окон включают в себя визуализацию (а) выбираемых пользователем или автоматически комбинаций проекций главных компонент, (Ь) остатков при различных пороговых значениях остатков или (с) шумовых составляющих. Другой применимый вариант включает в себя визуализацию "классификационного массива", которая включает в себя цветное кодирование каждого местоположения данных цветом, который однозначно определяет, какая проекция главных компонент имеет самое высокое значение на этом месте.
Итеративный, выполняемый в окне анализ главных компонент: Обнаружено, что остаточный массив, образующийся при выполнении последовательности действий, представленной на фиг.З, имеет более высокие значения в областях, которые содержат больше аномальных картин. Вследствие этого в остаточном массиве едва различимые картины во входных данных часто маскируются более очевидными аномалиями. Для повышения чувствительности выполняемого в окне анализа главных компонент к трудно различимым картинам можно использовать два альтернативных итеративных способа:
Итеративное удаление собственного вектора: Эта первая альтернативная процедура может включать в себя следующие этапы:
1. Выполнение первых четырех этапов из блок-схемы последовательности действий на фиг.З (с помощью собственного вектора и собственного значения).
2. Идентификация тех собственных векторов, в проекции которых восстанавливаются большое значение фонового сигнала и наиболее очевидные аномалии.
3. Проецирование данных только на поднабор собственных векторов, которые не были идентифицированы на предшествующем этапе (фоновый сигнал и те из наиболее очевидных аномалий, которые должны быть ослаблены в этом проецируемом изображении).
4. Выполнение в окне анализа главных компонент относительно спроецированного изображения, образованного на предшествующем этапе.
5. Повторение этапов 1-3 при необходимости.
Итеративное маскирование или удаление данных: Эта вторая альтернативная процедура может включать в себя следующие этапы:
1. Выполнение первых четырех этапов из фиг.З (с помощью собственного вектора и собственного значения).
2. Идентификация тех областей во входных данных, которые соответствуют наиболее очевидным аномалиям, на основании изучения различных остаточных массивов.
3. Выполнение в окне анализа главных компонент относительно данных, за исключением идентифицированных областей, путем
a. приравнивания всех значений атрибутов в этих областях к нулю до выполнения в окне анализа главных компонент или
b. без включения этих областей в качестве входных данных для выполняемого в окне анализа главных компонент.
4. Выполнение в окне анализа главных компонент относительно нового набора данных.
5. Повторение этапов 1-3 при необходимости.
Классификация на основе выполняемого в окне анализа главных компонент: Главные компоненты можно использовать для классификации изображений на основании интенсивности проекций. Такая классификация будет способствовать идентификации областей со специфическими картинами, представляемыми в выбранных главных компонентах с помощью удобной визуализации, особенно в случае, когда исходные данные состоят из многочисленных массивов. Этот вариант может включать в себя следующие этапы:
1. Выполнение первых четырех этапов из фиг.З (с помощью собственного вектора и собственного значения).
2. Назначение каждой точке в данных число, которое соответствует собственному вектору, который восстанавливает наибольший сигнал в окне вокруг точки. Этим образуют классификационный массив, в котором каждая точка имеет число между 1 (то есть, первый собственный вектор) и N - пх х ny х л2
(то есть, последний собственный вектор).
3. Следующим шагом визуализация результатов классификации с назначением каждого значения (или группы значений) от 1 - N
однозначному цвету или прозрачности (или сочетанию их) . Эта процедура представляет собой форму основанной на образах классификации А/-мерных изображений. Благодаря выводу категорий, основанных на величине сигнала в проецируемых изображениях, а не на непрерывных спектральных остаточных или проекционных значениях, на этой процедуре меньше сказывается недостаток чувствительности к едва различимым особенностям.
Таким образом, способ настоящего изобретения является предпочтительным для выделения особенностей из больших многомерных наборов данных, таких как сейсмические данные. Большая часть опубликованных способов с применением анализа главных компонент, например, к сейсмическим данным подобна способу настоящего изобретения только в том, что в них выполняют разложение на собственные моды в окнах данных. Примером является способ Wu и соавторов, упомянутый выше. Их способ отличается от настоящего изобретения несколькими фундаментальными особенностями. Во-первых, они применяют только небольшие одномерные, вертикально скользящие окна к сейсмическим данным в качестве входных данных для анализа главных компонент. Трехмерные скользящие окна используют только по отношению к данным моделирования течения. Во-вторых, только первую главную компоненту используют для восстановления сейсмических данных мониторинга и данных моделирования течения. Не выполняют других проекций или математических комбинаций, таких как построение остаточного массива. Наконец, не пытаются одновременно исследовать многочисленные массивы сейсмических данных, не говоря уже о выделении картин, присущих сейсмическим данным (то есть, не выполняют привязку к уже существующей геологической модели).
Приведенное выше описание обращено к конкретным осуществлениям настоящего изобретения для иллюстрации его. Однако для специалиста в данной области техники должно быть очевидно, что возможны многочисленные модификации и варианты к осуществлениям, описанным в этой заявке. Все такие модификации и варианты предполагаются находящимися в объеме настоящего изобретения, определенном в прилагаемой формуле изобретения.
ФОРМУЛА ИЗОБРЕТЕНИЯ
1. Способ идентификации геологических особенностей в одном или нескольких двумерных или трехмерных дискретизированных наборах геофизических данных или атрибуте данных (каждый такой набор данных называется "исходным массивом данных"), представляющем подземную область, содержащий этапы, на которых:
(a) выбирают форму и размер окна данных;
(b) для каждого исходного массива данных перемещают окно во множество перекрывающихся или неперекрывающихся положений в исходном массиве данных так, что каждый воксел данных включается в по меньшей мере одно окно, и формируют для каждого окна вектор I окна данных, компоненты которого состоят из значений вокселов из пределов этого окна;
(c) используют векторы окна данных для выполнения статистического анализа и вычисления распределения значений данных, при этом статистический анализ выполняют совместно в случае множества исходных массивов данных;
(о!) используют распределение значений данных для идентификации выбросов или аномалий в данных; и
(е) используют выбросы или аномалии для прогнозирования геологических особенностей подземной области.
2. Способ по п.1, в котором распределение значений данных вычисляют, используя один или группу методов статистического анализа, состоящих из:
(i) формирования объединенного вектора из всех векторов окна данных и вычисления матрицы средних значений и ковариационной матрицы объединенного вектора;
(ii) анализа независимых компонент;
(iii) использования метода группировок для группировки данных; и
(iv) другого метода статистического анализа.
3. Способ по п. 2, в котором статистический анализ выполняют, используя (х), и при этом он дополнительно содержит использование анализа главных компонент.
4. Способ по п.З, в котором вычисляют собственные значения и собственные векторы ковариационной матрицы, при этом
упомянутые собственные векторы являются набором главных компонент из соответствующего исходного массива данных;
и в котором этапы (d) и (е) содержат проецирование исходного массива данных на выбираемый поднабор собственных векторов для образования частичного спроецированного массива данных, при этом упомянутый поднабор собственных векторов выбирают на основании их соответствующих собственных значений, и определение остаточного массива данных, при этом часть исходного массива данных не захватывается в спроецированном массиве данных; затем идентификацию аномальных особенностей в остаточном массиве данных и использование их для прогнозирования физических особенностей подземной области.
5. Способ по п.1, в котором окно данных является W-мерным, где N является целым числом, таким, что 1 является размерностью набора данных.
6. Способ по п.З, в котором матрицу средних значений и ковариационную матрицу для выбранных размера и формы окна вычисляют, используя дополнительные окна, причем дополнительное окно, соответствующее каждому месту в окне, выбираемому на (а), представляет набор значений данных, которые показываются на этом месте, когда окно перемещают на протяжении исходного массива данных.
7. Способ по п. 4, в котором выбираемый поднабор выбирают на основании внутреннего подобия картин, определяемого текстурой, неупорядоченностью, или другими данными, или геометрическими атрибутами.
8. Способ по п. 4, в котором выбираемый поднабор собственных векторов определяют, суммируя собственные значения, упорядоченные от наибольшего до наименьшего, до тех пор, пока сумма наибольших N собственных значений, деленная на сумму всех собственных значений, не превысит заранее выбранное значение R, где 0 связанных с N наибольшими собственными значениями.
9. Способ идентификации геологических особенностей из двумерного или трехмерного дискретизированного набора
геофизических данных или атрибута данных ("исходного массива данных"), представляющего подземную область, содержащий этапы, на которых:
(a) выбирают форму и размер окна данных;
(b) перемещают окно во множество перекрывающихся или неперекрывающихся положений в исходном массиве данных так, что каждый воксел данных включается в по меньшей мере одно окно, и формируют для каждого окна вектор I окна данных, компоненты которого состоят из значений вокселов из пределов этого окна;
(c) формируют объединенный вектор из всех векторов окна данных и вычисляют ковариационную матрицу объединенного вектора;
(d) вычисляют собственные векторы ковариационной матрицы;
(e) проецируют исходный массив данных на выбираемый поднабор собственных векторов для образования частичного спроецированного массива данных; и
(f) идентифицируют выбросы или аномалии в частичном спроецированном массиве данных и используют их для прогнозирования геологических особенностей подземной области.
10. Способ по п. 9, в котором выбираемый поднабор собственных векторов для образования частичного спроецированного массива данных определяют, исключая собственные векторы на основании их связанных собственных значений.
11. Способ по п.9, в котором выбираемый поднабор собственных векторов выбирается интерактивно пользователем или на основании автоматически идентифицированного шума или геометрических характеристик.
12. Способ по п.9, в котором выбираемый поднабор собственных векторов определяют, придумывая критерий для определения очевидных аномалий в исходном массиве данных, выбирая одну или несколько очевидных аномалий с использованием критерия и идентифицируя один или несколько собственных векторов, связанная компонента данных которых (проекция исходного массива данных на собственный вектор) вносит вклад в выбранные очевидные аномалии или является причиной более
высокой чем заданная величина фонового сигнала, затем выбирая некоторые или все оставшиеся собственные векторы; в котором этап (f) дает возможность открытия аномалий, которые являются более трудно уловимыми, чем упомянутые очевидные аномалии, используемые для определения выбираемого поднабора собственных векторов.
13. Способ по п.12, дополнительно содержащий после этапа (е) повторение этапов (a)-(e) с использованием частичного спроецированного массива данных вместо исходного массива данных, образование обновленного частичного спроецированного массива данных, который затем используют на этапе (f).
14. Способ идентификации геологических особенностей в двумерном или трехмерном дискретизированном наборе геофизических данных или атрибуте данных ("исходном массиве данных"), представляющем подземную область, содержащий этапы, на которых:
(a) выбирают форму и размер окна данных;
(b) перемещают окно во множество перекрывающихся или неперекрывающихся положений в исходном массиве данных так, что каждый воксел данных включается в по меньшей мере одно окно, и формируют для каждого окна вектор I окна данных, компоненты которого состоят из значений вокселов из пределов этого окна;
(c) формируют объединенный вектор из всех векторов окна данных и вычисляют ковариационную матрицу объединенного вектора;
(d) вычисляют собственные значения и собственные векторы ковариационной матрицы;
(e) выбирают способ вычисления степени аномалии воксела и используют его для определения частичного массива данных, состоящего из вокселов, вычисленных для большего количества аномальных особенностей, чем заданный порог; и
(f) идентифицируют одну или несколько аномальных особенностей в частичном массиве данных и используют их для прогнозирования геологических особенностей подземной области.
15. Способ по п.14, в котором степень R' аномалии воксела,
обозначенную х, у, z-индексами i, j, к , вычисляют из
где Ь является компонентой вектора окна данных из (Ь) ,
который включает в себя воксел i, j, к ;
i,j,k '
где дискретизированный исходный массив данных состоит из NxxNyxNz вокселов, выбранные форма и размер окна составляют
пх х пу х л2 вокселов и IV = (АГх - лх) х (Ny - пу) х {Nz - nz) .
16. Способ по п.14, в котором степень аномалии определяют, проецируя исходный массив данных на выбираемый поднабор собственных векторов для образования частичного
спроецированного массива данных, при этом упомянутый поднабор собственных векторов выбирают на основании их соответствующих собственных значений, и определяя остаточный массив данных, при этом часть исходного массива данных не захватывается в спроецированном массиве данных, упомянутый остаточный массив данных является частичным массивом данных, используемым для прогнозирования физических особенностей подземной области на
17. Способ по п.14, в котором степень аномалии определяют, проецируя исходный массив данных на выбираемый поднабор собственных векторов, чтобы образовать частичный массив данных для использования на (f).
18. Способ по п.1, дополнительно содержащий использование прогнозируемых геологических особенностей подземной области для вывода заключения о нефтегазовом потенциале или отсутствии его.
19. Способ по п.1, в котором идентификация выбросов или аномалий в данных содержит (i) вычисление вероятности появления (или эквивалентной метрики) каждого окна данных в распределении значений данных, (ii) идентификацию маловероятных областей данных как возможных выбросов или аномалий.
20. Способ добычи углеводородов из подземной области, содержащий этапы, на которых:
(f) -
(a) получают результаты геофизического исследования подземной области;
(b) получают прогноз относительно нефтегазового потенциала подземной области на основании по меньшей мере части физических особенностей области, идентифицированных с использованием способа, описанного в п.1, который включен в этот пункт путем ссылки;
(c) в ответ на положительный прогноз относительно нефтегазового потенциала пробуривают скважину в подземную область и добывают углеводороды.
21. Способ по п. 9, в котором вычисление ковариационной матрицы выполняют, вычисляя ряд операций взаимной корреляции относительно постепенно уменьшающихся областей массива данных.
22. Способ по п. 2, в котором статистический анализ выполняют, используя (i) , и вычисление ковариационной матрицы выполняют, вычисляя ряд операций взаимной корреляции относительно постепенно уменьшающихся областей в каждом окне.
По доверенности
1/5
176202ЕА
2/5
о к
CD CL
400 800 1200 1600
21-ч Импульс J Рикера, 15 Гц
22-^ Операции АГК, 9X9
Операция проецирования на главную компоненту
0 20 40 60 80 100
Номер трассы
СЕН so% СВ2
а < • 1 --"гтт
СВ3 97% СВ4 99%
шов
¦юн
Вычитание
"с?
400
проекции из
исходных
800
данных
CD Q.
1200
1600
О 20 40 60 80 100
Номер трассы
ч't --. " *1
jft....... iwy ......нт
0 20 40 60 80 100
Номер трассы
ФИГ. 2
3/5
f31
2-мерный срез, 2-мерный разрез или 3-мерный массив сейсмических
данных с атрибутами
(Ai, А2,.., AN) В каждой точке
г г32
Выбор формы окна (например, эллипсоидной или кубовидной) и размера (например, радиуса г, Пх X Пу X П^)
гзз
Вычисление ковариационной матрицы*, ? объединенного вектора (При желании через маску) (Ai, А2-, AN).....(А1, А2.., AN)(iwh)
-34
Вычисление собственных значений и собственных векторов^;
%г..., > v|Wh), (Pi, Р2.....Piwh) ¦" ^1 2: &2-2.'Mwh)
Задание верхнего и/или нижнего порогов (U, L) остатков
Выбор поднабора собственных векторов
Определение отношения: /Н> Й
Последовательное вычитание проекций данных на собственные векторы:
уу-*.уу . (pj. щ pfi Начало в момент,
когда Г/ впервые превышает L. Окончание в момент, когда оно впервые превышает U
(При желании через маску)
Последовательное накопление проекций данных на выбираемый поднабор собственных векторов. Сначала с пустой структуры данных, J=0. Для каждого собственного вектора выполнение J-J + (PrW)Pi.
(При желании через маску)
"Ковариационная матрица случайного вектора:
E(XiXj)-X;Xj
Ьу - -
4 OfOj
Фиг.з
4/5
' Выборочная совокупность 1 , V\ ; (DS1) данных c^s^".' ?
Нет данных в выборочной совокупности (DNS1)
ФИГ 4 А
Нет данных в выборочной совокупности (DNSi)
ФИГ. 4В
5/5
(DS1)
ФИГ. 5 А
DSi
ФИГ. 5 В