Продукция компании Fohow - Феникс для восстановления и поддержания здоровья и здорового долголетия
Категория
 

Информационно-поисковая система АРМ Метапоиска


АРМ Метапоиска является одной из подсистем ИКС-Патент, предназначенной для осуществления поиска информации через Интернет путем взаимодействия с поисковыми системами Google, Yandex и другими поисковыми системами, а также с системой поиска предоставляемой сервисом поисковой службы ФИПС.

Задачи АРМ Метапоиска


1. Многофункциональный поиск по локальным базам данных;
2. Патентный поиск через Интернет по запросу;
3. Поиск научно-технической и иной информации через Интернет по запросу;
4. Поиск патентной, научно-технической и иной информации через Интернет на основе построения и использования логических и семантических онтологий (гипотез) поиска;
5. Формирование и ведение виртуального электронного каталога патентной, научно-технической и иной информации, полученной через Интернет;
6. Ввод и хранение в локальной БД информации, найденной путем поиска в Интернете, в соответствии с классификацией электронного каталога информационной поисковой подсистемы.

Особенности АРМ Метапоиска


1. АРМ Метапоиска обеспечивает возможность формирования виртуального каталога, в качестве названия рубрик выступают термины. Для каждого термина создается описание, которое может содержать в себе названия других рубрик, помеченных как ссылка. Для каждого термина создается список терминов ассоциаций (отношение ассоциативности) и список терминов, являющихся частными для него (отношение общее-частное).
2. В процессе поиска АРМ Метапоиска формирует запросы к поисковым системам Google и Яndex, каждый из которых состоит из названия рубрики и списка слов-ассоциаций к этому названию.
3. Результаты поиска АРМ Метапоиска выдаёт в виде таблицы, причём, для каждого документа хранит его заголовок, сниппеты и ссылку на него (источник).
4. Каждый документ, полученный в результате поиска, передается модулю классификатора, который классифицирует каждый документ по разным аспектам.
5. Результативность поиска может быть улучшена путём отсеивания поискового спама, например, при помощи классификатора, а также путем ранжирования выдачу по каким-либо критериям.

Сравнение АРМ Метапоиска с существующими поисковыми системами


В качестве прототипа предлагаемой в проекте поисковой подсистемы (АРМ Метапоиска) могут быть рассмотрены любые поисковые системы в Интернете.

Информационно-поисковая система даёт возможность поиска ресурсов по запросу пользователя. Многие поисковые системы предоставляют также возможность так называемого расширенного поиска. По существу расширенный запрос является достаточно простой булевой комбинацией утверждений вида «данное слово встречается в тексте».

Интернет-каталог состоит из структурированного набора Интернет-ресурсов, разбитых на рубрики и подрубрики – обычно несколько уровней вложенности. Все ссылки, содержащиеся в каталоге, привязаны к этим рубрикам. Для поиска требуемого Интернет-ресурса нужно выбрать подходящую рубрику и просмотреть список относящихся к ней ссылок.

Информационно-поисковые системы и Интернет-каталоги имеют свои преимущества и недостатки. В результате работы информационно-поисковых систем достигается полнота и актуальность найденной информации. Алгоритмы поиска таковы, что обеспечивается высокая релевантность и низкое количество поискового шума. Тем не менее, при этом не только не решается, но по существу и не ставится корректно задача достижения пертинентности (смысловой цели пользователя).

Интернет-каталоги имеют ясный и понятный пользователю интерфейс, но содержат малое количество ссылок на реально имеющиеся Интернет-ресурсы, и в них отсутствует наиболее свежая информация.

Предлагаемое нами решение этой проблемы состоит в синтезе информационно-поисковых систем и Интернет-каталогов – виртуальный каталог. Мы пытаемся объединить преимущества двух представленных выше методов информационного поиска: простоту и ясность каталогов, полноту и актуальность найденной информации, обеспечиваемую информационно-поисковыми системами.

Интерфейс виртуального каталога внешне напоминает интерфейс обычного Интернет-каталога: в его основе лежит дерево рубрик, соответствующих иерархии подобластей данной предметной области. В качестве названий рубрик каталога берутся разделы и подразделы данной предметной области. Каждой рубрике сопоставлено объяснение её смысла на естественном языке. Наличие описания рубрик устраняет один из недостатков каталогов, а именно, отсутствие справочной информации. Пользователь выбирает определённую рубрику и получает список Интернет-ресурсов, которые ей соответствуют.

Однако, в отличие от обычного Интернет-каталога, виртуальный каталог не хранит ссылок на конкретные Интернет-ресурсы. Вместо этого, по названию рубрики определяется запрос к информационно-поисковой системе. Для обеспечения релевантности информационного поиска каждой рубрике сопоставлен набор специальных эвристик. Эти эвристики являются ключевыми терминами данного раздела предметной области и другими ассоциациями к названию рубрики. Эвристики определяют один или несколько поисковых запросов таким образом, что найденная по нему информация полностью соответствует тематике данной рубрики и, следовательно, является той, которую ожидает получить пользователь.

В порядке развития подхода, основанного на виртуальном каталоге, в рамках проекта запланировано повышение качества поиска путём разработки новых метапоисковых средства семантического анализа данных, основанные на онтологических моделях.

 

Главная | О компании | Проекты | Сотрудничество | Статьи | Новости | Вопросы | Контакты |
© 2010 Интеллектуальные системы. All Rights Reserved