Все новости от 29 ноября 2005 г. Nigma замахнулась на весь Рунет
Во вторник, 29 ноября, поисковый проект Nigma.ru, основанный весной текущего года бывшим вице-президентом и одним из акционеров компании Mail.ru Виктором Лавренко, заявил о своем намерении проиндексировать Рунет.
Предполагается, что до конца года закончится альфа-тестирование алгоритма поиска, и будет заказано оборудование, необходимое для индексации всего российского интернета, насчитывающего, по некоторым данным, более одного миллиарда документов.
К сегодняшнему дню Nigma проиндексировала уже около 25 тыс. наиболее популярных сайтов «в глубину» (по несколько тысяч страниц с каждого сайта). Еще 200 тыс. сайтов проиндексировано поверхностно — для полноты поиска. Объем «переработанной» информации в тестовой базе составил около 220 ГБ.
Как рассказал IT-daily Виктор Лавренко, в настоящее время идут переговоры с одним из сборщиков компьютерной техники, который, судя по всему, и обеспечит проект оборудованием. Назвать сборщика г-н Лавренко не захотел, но сказал, что это — не глобальный сборщик, поскольку поисковой компании требуется не серийная, а специфическая техника. По предварительным оценкам, стоимость необходимого оборудования составит несколько десятков тысяч долларов. Деньги на технику готов выделить сам г-н Лавренко, а также его друзья.
При этом вопрос об окупаемости поисковой системы на данном этапе не стоит. Nigma, по словам Виктора Лавренко, просто занимается разработкой новых поисковых технологий, основанных на искусственном интеллекте, и не ставит перед собой коммерческих целей. Необходимость в собственной индексации возникла в связи с тем, что у сотрудников поискового проекта появились идеи, связанные с применением в этом деле технологии искусственного интеллекта. Кроме того, свой индекс должен позволить Nigma более адекватно производить кластеризацию результатов поиска. (Ранее Nigma анализировала не все содержимое сайтов, а только аннотации к ним, которые выдавали другие поисковые системы.)
Предыдущие публикации:
|