Все новости от 5 ноября 2002 г. MIT и HP наводят порядок на полках цифровой библиотеки
Массачусетский технологический институт и компания Hewlett-Packard ввели в действие систему электронного архивирования книг, конспектов лекций и научных данных, которая может послужить моделью академических библиотек будущего.
Новая система, называемая DSpace, по существу представляет собой централизованное электронное хранилище больших объемов интеллектуальной собственности, созданной исследовательскими институтами, говорит заместитель директора MIT Libraries и руководитель проекта DSpace Маккензи Смит (Mackenzie Smith).
Сохранение данных в доступной форме становится все более острой проблемой университетов и госучреждений. Сам MIT производит порядка 10 тыс. единиц электронного контента в год — с учетом трудов конференций и технических отчетов.
Некоторые документы слишком массивны и труднодоступны. Например, карты океанского дна содержат 30 Тбайт данных.
«Мы начали этот проект, чтобы обеспечить хоть какой-то территориальный контроль за всеми этими исследованиями, — говорит Смит. — Если повезет, некоторые из них можно найти через Google, но большая часть информации вообще никак не индексирована».
Теоретически развитие системы DSpace ведет к созданию виртуальной библиотеки, в которой объединены коллекции нескольких университетов. MIT уже обсуждает возможность включения в систему библиотек Кембриджа и Корнелла; корпорации и госучреждения также проявляют интерес к системе.
Сердцем DSpace служит система хранения и выборки данных — ПО с открытым исходным кодом. Каждому академическому подразделению отведен специальный портал для размещения материалов. Профессора и научные сотрудники могут загружать материалы в систему через этот портал напрямую или после оценки коллегами — в зависимости от установленных в подразделении правил.
Чтобы впоследствии находить документы, можно пользоваться указателем. В последующих версиях будет доступен поиск по автору и тексту.
«Факультеты говорят: „Наш персонал слишком занят, чтобы заниматься поиском”», — пояснила Смит.
По ее словам, использование ПО с открытым исходным кодом позволило сократить расходы. Система MIT, которая сегодня способна хранить два терабайта данных, может быть воспроизведена за 100-500 тыс. $, причем львиная доля этой суммы приходится на оборудование. ПО лицензируется бесплатно на условиях лицензии Berkeley.
Система допускает расширение. Со временем она сможет обслуживать более петабайта (тысячи триллионов байт) данных.
DSpace идеально подходит для эффективного хранения документов и научных материалов, тем не менее электронная память не бесплатна, поэтому со временем академическим учреждениям и библиотекам неизбежно придется решать, что хранить, а что выбросить.
Проект стартовал примерно 18 месяцев назад, и его разработку MIT вел совместно с НР. Компания совместно с университетом работает над несколькими проектами. Недавно партнеры перевели в цифровую форму все материалы MIT Press, включая неиздававшиеся труды, и поместили их в базу данных с возможностью поиска.
Предыдущие публикации:
В продолжение темы:
|