На главную страницу AlgoNet В сотрудничестве с ZDNet
АРХИВ СТАТЕЙ 2007-6-22 на главную / новости от 2007-6-22
AlgoNet.ru
поиск
   Статьи по датам:
Май 2007
ПнВтСрЧтПтСбВс
 123456
78910111213
14151617181920
21222324252627
28293031   
 
Июнь 2007
ПнВтСрЧтПтСбВс
    123
45678910
11121314151617
18192021222324
252627282930 
 
Март 2007
ПнВтСрЧтПтСбВс
   1234
567891011
12131415161718
19202122232425
262728293031 
 
Апрель 2007
ПнВтСрЧтПтСбВс
1234567
891011121314
15161718192021
22232425262728
2930     
 
Январь 2007
ПнВтСрЧтПтСбВс
1234567
891011121314
15161718192021
22232425262728
293031    
 
Февраль 2007
ПнВтСрЧтПтСбВс
   1234
567891011
12131415161718
19202122232425
262728    
 
Ноябрь 2006
ПнВтСрЧтПтСбВс
  12345
6789101112
13141516171819
20212223242526
27282930   
 
Декабрь 2006
ПнВтСрЧтПтСбВс
    123
45678910
11121314151617
18192021222324
25262728293031
 
Сентябрь 2006
ПнВтСрЧтПтСбВс
    123
45678910
11121314151617
18192021222324
252627282930 
 
Октябрь 2006
ПнВтСрЧтПтСбВс
1234567
891011121314
15161718192021
22232425262728
293031    
 
Июль 2006
ПнВтСрЧтПтСбВс
     12
3456789
10111213141516
17181920212223
24252627282930
31      
 
Август 2006
ПнВтСрЧтПтСбВс
 123456
78910111213
14151617181920
21222324252627
28293031   
 

 

Место для Вашей рекламы!

 

Все новости от 22 июня 2007 г.

Xerox взялась улучшить результаты поиска

Группа синтаксического и семантического анализа при Европейском научно-исследовательском центре Xerox во Франции разработала инструмент поиска FactSpotter, который не просто ищет ключевые слова, а анализирует смысл текста.

FactSpotter выполняет грамматический разбор текста, пытаясь получить дополнительную информацию — например, определить, применяются ли неоднозначные слова в качестве существительных или глаголов и на кого указывает местоимение. Такой анализ позволяет выяснить, что выражения «Билл Гейтс», «он» и «глава Microsoft» в одном и том же документе, вероятно, относятся к одному и тому же лицу. При этом программа должна также установить, что фразы «Билл Гейтс сказал...» и «Друг Билла Гейтса сказал...» предшествуют высказываниям разных людей — в таких случаях поисковые машины, основанные только на ключевых словах, скорее всего, выдадут неадекватные результаты.

Одной из первых служб, использующих FactSpotter, станет Xerox Litigation Services, которая в будущем году встроит его в предназначенный для юристов комплекс программного обеспечения e-discovery. На стадии следствия, когда приходится просеивать миллионы сообщений e-mail и других документов, новый инструмент поможет определять отправителя и получателей сообщений и выбирать информацию о событиях и датах. Эти результаты можно будет использовать для восстановления картины событий, из которой станет исходить следствие.

Для описания грамматической системы разработчики создали специальный метаязык. Пока они используют его для голландского, английского, французского, немецкого, итальянского, португальского и испанского языков. Совместная команда исследователей Fujitsu-Xerox применила этот метаязык и для описания японской грамматики, чтобы продемонстрировать возможность его использования для языков с другой системой письма.

Сам FactSpotter написан на языке программирования С, а дополнительные модули на Java и Python позволяют ему взаимодействовать с другими приложениями. Хотя программа анализирует только тексты, ее можно связать с инструментами распознавания речи, чтобы искать в радио- и ТВ-архивах. Компания уже участвует в нацеленных на это совместных проектах.


 
 Предыдущие публикации:
2007-05-25   Google предложила многоязычный поиск
 В продолжение темы:
2007-12-21   IBM предлагает систему семантического поиска для корпоративной e-mail
Обсуждение и комментарии
Ермаков Александр
22 Jun 2007 3:01 PM
Туфта полная! В мире уже с десяток лет известные коллективы умеют проводить грамматический и прочий анализ текста. В частности, мы (http://www.rco.ru) А эти ребята -очевидные лохи, как, впрочем, и журналисты, которые, как и всегда, фуфло читателям толкают!
 

 

← май 2007 18  19  20  21  22  25  26  27  28 июль 2007 →
Реклама!
 

 

Место для Вашей рекламы!

 

 

 


© 1997-2008
info@media.algo.ru | реклама у нас
Техническая поддержка - ADT Web Solutions