Все новости от 14 сентября 2001 г. «МедиаЛингва» обновила «Следопыта»
В четверг на выставке IT-Format '2001, закрывающейся сегодня в московском «Манеже», компания «МедиаЛингва» объявила о выпуске новой версии своей поисковой системы «Следопыт 3.0».
Система, предыдущая версия которой «Следопыт 2.0» была оценена пятью звездами в рейтинге ZDNet, предназначена для поиска документов с учетом морфологии языка. При этом запрос может быть задан как в виде обычной фразы на естественном языке (допускается смешанное использование русских и английских слов), так и с использованием формального псевдоязыка (с применением логических операторов И, ИЛИ, НЕ). Так называемые «шумовые» слова (например, местоимения) в дальнейшей обработке не учитываются.
Сам поиск осуществляется на основе информации, собранной при индексировании исходных документов. Создание индекса возможно для различных областей поиска, например для папок на локальном диске ПК. В новой версии добавлена возможность поиска в локальной сети, а также хранения индексов съемных носителей (CD/DVD/ZIP). Само индексирование проводится довольно быстро: на относительно слабом по сегодняшним меркам компьютере с процессором Pentium 233 МГц и 32 Мбайт памяти скорость составляет порядка 100 Мбайт/мин.
В предыдущей версии «Следопыт» осуществлял поиск с использованием нечеткой морфологии: слова разбивались на составные части (приставку, корень, суффикс и окончание), а при поиске сравнивались только корни. В этой системе, например, слова "соль" и "соловей" оказывались родственными. Для решения проблемы в «Следопыт 3.0» был добавлен поиск с использованием словарной морфологии при более детальном разборе всех слов в запросе. Правда, возможность нечеткого поиска в третьей версии также сохранилась.
Помимо уже известных ему форматов Microsoft Office, TXT и HTML, «Следопыт» научился разбирать также файлы PDF (Adobe Acrobat), почтовые сообщения Outlook и архивы zip. Одним из важных достоинств новой версии разработчики называют документацию: «МедиаЛингва» обещает значительно переработанное руководство пользователя.
«МедиаЛингва» планирует начать продажи нового «Следопыта» в середине или конце октября. Стоимость персональной версии «Следопыта» составит менее 10 $, профессиональной — 40-50 $, корпоративной — порядка 100 $.
|