Все новости от 17 октября 2003 г. э-Арахноиды Avalanche
В учебном центре компании "Мегапьютер" на семинаре "Интеллектуальные технологии поиска, мониторинга и анализа маркетинговой информации.
Конкурентная разведка в Интернете" были представлены программные решения на основе технологии Avalanche российского консорциума Inforus.org, помогающие аналитикам в ежедневном целевом поиске информации в сети.
Первое программное решение на базе данной технологии появилось в прошлом году как результат работы над заказным зарубежным проектом.
Существовавшие в мире поисковые продукты в тот момент (да и сейчас тоже) не решали комплексно такие задачи, как отсечение дублирующейся информации при повторном поиске (т. е. ссылок, которые пользователь уже видел), фильтрование ненужной информации (скажем, упоминаний продуктов в прайс-листах), соблюдение анонимности ищущего, определение тона изложения материала (позитив -- негатив), а также не позволяли отличать краткую новость от статьи и т. д.
Продукты на базе Avalanche были созданы для ликвидации этой бреши и предназначены для профессионального периодического целевого поиска информации во Всемирной паутине по некоторым смысловым шаблонам, формируемым пользователем (например, поиск информации о клонировании племенных скакунов, опубликованной за последние два месяца в периодических изданиях Великобритании).
Технология Avalanche базируется на трех "китах": концепции "умных папок" (Smart Folders), автономном интеллектуальном поисковом роботе ("пауке") и встроенной базе данных, допускающей преобразование в "персональную энциклопедию".
"Умные папки" -- это своего рода рубрикатор с расширенными возможностями, не только отображающий документы, найденные в Интернете, но и хранящий дополнительную информацию, конкретизирующую смысловой шаблон (по сути, папки представляют собой модель предметной области в том виде, в котором она существует в голове ищущего).
Работа с "умными папками" напоминает обычную работу с каталогами в проводнике Microsoft Windows. Однако "умные папки" позволяют отсортировать найденные документы по словам, по стоп-словам, по датам, по выражению и по подобию.
Поисковый робот предназначен для поиска в Сети информации по заранее заданному расписанию, прохода по нескольким уровням ссылок и оценки адекватности найденных ссылок, загрузки найденной информации на локальный компьютер пользователя.
С помощью Avalanche можно провести экспорт имеющейся базы данных в персональную HTML-энциклопедию, что позволяет в удобном виде представить и хранить информацию в форме персонального Интернет-сайта.
Главная особенность Avalanche -- авторские алгоритмы семантической рубрикации, обеспечивающие автоматическую рубрикацию загруженной из Сети информации в соответствии со структурой "умных папок", хранение рубрицированной информации на локальном ПК, перерубрикацию хранимой информации (можно менять настройки папок и пересортировывать загруженную из Интернета информацию).
Возникнув как заказное решение, сегодня Avalanche превратилась в линейку тиражных программных продуктов:
- Avalanche -- стандартная версия интеллектуальной поисковой системы. Предназначена для облегчения рутинной работы по поиску информации для одного человека;
- Avalanche pro -- корпоративная версия. Включает в себя средства коллективной работы с общей базой данных;
- Avalanche lite -- компактная версия, в основе которой тоже лежат алгоритмы полнофункциональных версий. Однако она создавалась только для облегчения поиска и обновления новостных разделов Интернет-сайтов.
Для пользования продуктами на основе технологии Avalanche аналитик должен четко сформулировать свой запрос (может быть, в результате нескольких итераций) и настроить систему на поиск (по всему Интернету либо по отдельным сайтам или страницам).
Этого достаточно, чтобы на персональном компьютере начала действовать персональная поисковая система, повышающая эффективность работы аналитиков, экспертов, обозревателей и других "исследователей" Сети, затрачивающих много времени на поиск нужной информации.
Полезность Avalanche очевидна при анализе результатов PR- и предвыборных кампаний, при необходимости систематически отслеживать самую свежую информацию (возможно оперативное получение данных, не зависящее от цикла обновления информации в стандартных поисковиках Интернета).
К недостаткам существующих реализаций Avalanche, пожалуй, можно отнести требовательность к вычислительным ресурсам (для удобства одновременной работы с другими приложениями нужны весьма современные конфигурации) и отсутствие версий системы для платформ, отличных от Microsoft Windows.
|