Все новости от 16 апреля 2007 г. Web 3.0 наступает на пятки Web 2.0
В самый разгар выставки Web 2.0 Expo 2007 на авансцену выходит Web 3.0. В понедельник производители инструментов программирования, компании TopQuadrant и Franz планируют анонсировать среду разработки и базу данных для семантического веба, которые позволят сделать компьютеры чуточку смышленее.
Большинству людей сочетание TopQuadrant TopBraid Composer и базы данных Franz AllegoGraph 64-bit RDF Store ни о чем не говорит. Но смысл — это именно то, что собираются предложить две компании.
Семантический веб — это попытка сделать онлайновые документы и данные более понятными для компьютеров. Он особенно актуален для крупных организаций, которым приходится соединять большие наборы данных. Например, при слиянии двух баз данных по учету кадров, одна из которых содержит только штатных сотрудников, а другая — временных или на неполный рабочий день, могут возникнуть серьезные проблемы.
Семантическая технология полезна и для поисковых приложений, так как позволяет делать выводы о неявно выраженных отношениях между элементами данных. Так, поиск по ключевым словам обычно выдает только те документы, которые просто содержат искомый термин. Семантический же поиск позволит искать документы, содержащие этот термин в определенном значении (например, военные танки, а не емкости для воды), а также его синонимы (например, бронированные машины).
Семантического веба, который обычно относят к подмножеству веб-технологий следующего поколения, называемых Web 3.0, по сути, еще не существует — за отсутствием серьезных инструментов для решения подобных задач. В крупных организациях семантические приложения применяются, но это специальные разработки, требующие больших усилий.
Например, в разведке семантическая технология используется для выявления связей между людьми при борьбе с терроризмом. Вся информация о террористах хранится в трехуровневой системе Resource Description Framework (RDF), построенной на стандартной базе данных. Для управления сложным процессом обработки этих данных системе требуется 22 Тбайт оперативной памяти, и работает она нестабильно, а на восстановление системы после сбоя уходит неделя. Такое решение практичным не назовешь — нужна стабильная трехуровневая база данных.
Уже созданы спецификации, протоколы и языки для семантического веба, в том числе RDF, OWL Web Ontology Language и SPARQL, а также родственные технологии, такие как XML. Весь этот набор букв позволяет разработчикам организовать данные в семантическую структуру. А комбинация TopQuadrant/Franz добавляет к этому графическую среду разработки приложений семантического веба и масштабируемую базу данных, способную работать с RDF большого объема.
Компания Eastman Kodak разрабатывает с помощью AllegroGraph семантическую технологию, которая поможет ее заказчикам справляться со все более неуправляемыми коллекциями цифровых фотографий. Она пытается извлекать смысл из визуальных данных. В январе 2006 года на выставке Consumer Electronics Show генеральный директор Kodak Антонио Перес рассказал о том, как его компания собирается использовать семантическую технологию:
«Понимание смысла снимает препятствия, стоявшие между потребителями и их желанием рассказать о себе как можно больше. Благодаря этой технологии фотографии начинают узнавать друг друга — без вмешательства человека фотография будет использовать свои метаданные для поиска других фотографий, и все они станут объединяться по смыслу в новые группы». В продолжение темы:
| eXOR 27 May 2007 1:42 PM |
семантические сети - очередная панацея. каковой в свое время был xml/xsl. а то что у них база данных ложится регулярно и требует диких объемов памяти - это вопрос качественной реализации и архитектуры. |
|
|