В данном разделе собраны некоторые примеры задания поисковых значений, позволяющие наиболее точно спрогнозировать результат поиска, а также описание дополнительных средств и методов, позволяющих увеличить вероятность нахождения требуемых документов.

ВЫБОР СТРАТЕГИИ ПОИСКА

Система ЕАПАТИС оптимизирована под проведение поиска по атомарным терминам, объединенным в логическую конструкцию любой сложности. Проведение контекстного поиска основывается на исполнении атомарных запросов с последующей дополнительной обработкой полученных результатов. В то же время в системе реализовано ведение и использование внутреннего кэша запросов (т.е. сохранение результатов поиска по ранее использованным терминам для увеличения скорости обработки сложных запросов). Поэтому рекомендуется прежде, чем переходить к использованию контекстного поиска по фразам (с учетом морфологии и контекстного расстояния), провести поиски по отдельным терминам, в том числе - для уточнения способов их указания (с морфологией или с усечением).

Перед началом поиска всегда следует иметь в виду, что скорее всего не удастся составить такой один универсальный запрос, который позволит найти сразу все интересующие документы. Следует предполагать, что интересующая предметная область может быть описана разными авторами с использованием разных слов, могут быть применены сходные или замещающие термины, классификация МПК также может быть неоднозначной.

Таким образом, можно рекомендовать использовать следующую стратегию поиска: лучше произвести несколько отдельных простых запросов, постепенно приблизившись к нужным документам и найдя весь массив интересующих документов как пересечение по ИЛИ нескольких запросов, чем пытаться использовать один объёмный запрос, который вернёт много документов, но в котором ещё нужно будет проводить работу по изучению и отбору нужных документов.

ИСПОЛЬЗОВАНИЕ МОРФОЛОГИИ И ПОИСКА С УСЕЧЕНИЕМ

В системе реализован механизм морфологического анализа текстов на русском и английском языках. Морфологическая обработка терминов применяется для поисковых индексов NM, AB и TX. Данная система позволяет проводить поиск терминов представленных в разных словоформах. Например, для термина "шарнир" будут найдены документы, содержащие термины: шарнир, шарнира, шарнирами, шарнирная, шарнирно, шарнирное, шарнирной, шарниров, шарниром, шарниру.

Также в системе допустимо использование поиска с усечением - в этом случае будут найдены все термины, содержащие термин с различными написаниями усекаемой части. В этом случае можно найти производные слова, которые морфологически не родственны, однако могут быть найдены также и термины, не имеющие отношения к искомому. Например, по запросу "бур*" будут найдены морфологически не родственные, но подходящие по смыслу термины "бурильных", "буронабивных", "бурошнековой", но вместе с тем будут найдены документы, содержащие термины "буртик", "буравчика", "бурелом" и т.п.

Таким образом, использовать усечение "*" нужно с осторожностью - т.к. можно получить большой массив документов, не имеющих отношения к искомой предметной области. Также следует учитывать, что поиск с усечением выполняется медленнее чем обычный поиск с применением морфологии.

Также в системе поддерживается список "стоп-слов". Например, по таким словам как : "ОСУЩЕСТВЛЯЕТ", "ПОВЛЕЧЕТ", "ОПИСЫВАЕМОЕ", "ПОД", "ВМЕСТО" и т.п. поиск проводиться не будет. Результатом поиска будет - 0 найденных документов. Полный список таких "стоп-слов" для русского и английского языков можно просмотреть по ссылке "Перечень стоп-слов", представленной в блоке информационных материалов.

ИСПОЛЬЗОВАНИЕ ТАБЛИЦЫ ТРАНСЛИТЕРАЦИИ

Для повышения эффективности реализации поисковых запросов по индексу NM (Патентообладатели / Заявители / Авторы) рекомендуется обратиться к таблице транслитерации, размещенной на веб-портале ЕАПО по адресу - http://www.eapo.org/rus/ea/eapatis/table2.html.

Электронная таблица транслитерации используется при проведении именного поиска в БД ЕАПВ. Использование таблицы транслитерации позволяет повысить точность и полноту данного вида поиска ввиду наличия различных вариантов перевода и написания на русском языке некоторых наименований заявителей, изобретателей и патентообладателей. Фрагмент таблицы транслитерации, сформированной для БД ЕАПВ, приведен на рис. 14. В таблице для каждого написания наименования заявителя, изобретателя и патентообладателя на латинице указываются присутствующие в БД ЕАПВ варианты их транслитерации на русский язык, а также количество вхождений термина на русском языке и количество выданных патентов.

Таблица транслитерации используется следующим образом. Перед проведением именного поиска в БД ЕАПВ вначале по значению (слову) индекса NM производится поиск в таблице транслитерации, и определяются все возможные варианты написания этого значения (слова) на русском языке. Далее формируется запрос, содержащий все выявленные слова, связанных логической функцией "ИЛИ". Например, для слова ADRIAN встречается четыре варианта написания на русском языке: АДРИААН, АДРИАН, АНДРИАН, ЭДРИАН. Поисковый запрос будет выглядеть следующим образом:

АДРИААН\NM OR АДРИАН OR АНДРИАН\NM OR ЭДРИАН\NM.

ПОИСК ПАТЕНТОВ-АНАЛОГОВ

Поиск патентов аналогов по номеру приоритетной заявки не всегда оказывается результативным из-за несовпадения форматов, применяемых различными патентными ведомствами для указания приоритетных данных.

Для решения указанной проблемы рекомендуется проводить поиск , включая в запрос фамилию автора (патентообладателя) и дату приоритета.

Пример:
Для поиска патентов аналогов по евразийской заявке EA199700348, имеющей дату приоритета 01.05.1995, автором Фишера Ричарда и др., а также патенообладателем Ю. ЭС. БОРАКС ИНК. поисковый запрос будет иметь вид:

С использованием полнотекстового поиска
С использованием "Конструктора запросов"
(19950501\AN) AND (Fisher ^ Фишер)\NM

AN: 19950501
NM: Fisher ^ Фишер


или

(19950501\AN) AND (BORAX ^ Боракс)\NM

AN: 19950501
NM: BORAX ^ Боракс

Примечание: При помощи знака ^ в примерах показаны пробелы.

В результате поиска в базе данных ЕПВ по указанным запросам будет найден европейский патент EP 824502B1.