На главную страницу AlgoNet В сотрудничестве с ZDNet
АРХИВ СТАТЕЙ 2003-4-21 на главную / новости от 2003-4-21
AlgoNet.ru
поиск

 

Место для Вашей рекламы!

 

Все новости от 21 апреля 2003 г.

IBM предлагает бесплатный инструмент для поиска ДНК

Ученые, работающие с ДНК, могут бесплатно скачать технологию веб-сервисов у IBM, которая ударными темпами прокладывает себе путь в перспективную сферу наук о жизни.

Big Blue объявила также о заключении многомиллионного соглашения с Proteome Systems о совместном обеспечении компании Charles River Laboratories технологией для изучения структуры и функций белков.

IBM бесплатно предоставляет ученым опытное ПО, предназначенное для совершенствования поиска информации, хранящейся в Национальном центре биотехнологической информации. Здесь хранятся общедоступные базы данных PubMed, содержащие выдержки из биомедицинских журналов, и GenBank, содержащие генетические коды. Поиск информации в этих базах становится все более трудной задачей из-за их колоссальных размеров. Например, GenBank содержит свыше 22 млн последовательностей нуклеотидов.

IBM утверждает, что технология веб-сервисов позволит ученым решать такие задачи, как точный поиск нужных генов, относящихся к определенным диагнозам из PubMed, и извлечение соответствующих последовательностей нуклеотидов из GenBank.

Веб-сервисами называется набор веб-стандартов и протоколов, позволяющих организациям соединять различные приложения и обмениваться данными. Программное обеспечение IBM Web Services for Life Sciences можно загрузить с ее веб-сайта AlphaWorks.

Сфера наук о жизни считается очень перспективной для поставщиков информационных технологий. По оценкам IDC, инвестиции в ИТ для биологических наук увеличатся с 12 млрд $ в 2001 году до 30 млрд $ в 2006 году. IBM утверждает, что ее отделение наук о жизни — самое быстро растущее. Оно образовано в 2000 году, а в прошлом году демонстрировало темпы роста в сотни процентов.

Компания Charles River Laboratories, которая производит продукты и услуги, относящиеся к фармацевтическим исследованиям и разработкам, использует технологию IBM и Proteome Systems в своем отделении Charles River Proteomics Services. Эта технология, называемая ProteomIQ, основана на IBM DB2 Universal Database, системе управления доступом и хранением данных Tivoli и серверах IBM p690 pSeries. 

 Предыдущие публикации:
2001-11-23   ДНК-компьютер заработал
2002-12-20   Веб-сервисы: платформа для инноваций
2003-04-03   Звезды первой величины прольют свет на теорию большого взрыва
 В продолжение темы:
2003-10-23   Intel займется диагностикой заболеваний на своем производственном оборудовании
Обсуждение и комментарии
Chkaloff
22 Apr 2003 2:58 PM
Сейчас придет ggv и скажет, что это конечно надо было через RPC делать :-)
 

ggv
22 Apr 2003 3:43 PM
Chkaloff - не скажу. Так как практически ничего не знаю по поводу задач, стоящих перед теми ученными. Я приводил конкеретную ситуацию, совершенно конкретный проект работы с GSM SMS посредством WS, и то, чем это закончилогсь - сначала провайдер услуг фиксил постоянно свой сервис, потом заявил - есть корпоративный стандарт, SMPP, вот и давайте на нем.
Если мне закажут и оплатят разработку задания и возможно реализацию проекта по поиску генов/чего-там-еще - тогда после какого-то периода изучения проблемы у меня возниктен мнение. А по поводу чтения этой статьи - нет, не возникло.
Нифига не ясно, то ли это маркетинговый ход, то ли действительно техническая необходимость.
так что no comments
А RPC приходиться применять повсеместно, и ну никуда от этого пока не деться, и никакими WS пока не заменить.
 

ggv
22 Apr 2003 4:06 PM
хотя кой-какая мысля есть. по предыдущему опыту работы с физиками, могу предположить что покатит что=то типа MQseries. Ни в коем случае не подумайте что я призываю тут же все переделать на нем :)
Но если там _очень_ много данных, возможно что поиск будет длиться долго или очень долго, возможны прочие всякие условия, которые могут сделать пакетную не-реалтайм обработку основанную на собщениях не требующих соединения с сервером более выгодными, ну как сервис сообщений.
Хотя опять же - без уяснения задачи, оценки обстановки, все это не более чем болтовня.
 

Mike
23 Apr 2003 3:03 AM
А я вот как раз этой самой проблемой и занялся.
Все просто замечательно обрабатываеся и выдается
с помощью бесплатных продуктов, типа MySQL, Perl, Java
И затык вовсе не в вычислительной мощности или отсутствии
софта, а в понимании генома как такового. На осмысление
результата, который считается часы уходят недели или даже месяцы
 

Arekus - arekusngs.ru
23 Apr 2003 11:50 AM
Вот и банзай приблежается для отличного от США мира.
Счас Амрик опустил ООН и взял контроль над нефтью. И пока политиканы будут расскачивать мировую лодку, местные яйцеголовые спокойно дойдут до всяких офигенных биологических штуковин, которые, при необходимости, поставят весь мир на колени.

(хоть и пишу простым языком - я достаточно хорошо ориентируюсь в теме)
 

Chkaloff
23 Apr 2003 3:51 PM
Mike
>с помощью бесплатных продуктов, типа MySQL, Perl, Java
Ты не понял. База уже есть, вопрос в создании универсального инструмента, позволяющего програмным образом обращатся к этой базе данных. Было сделано на WS, что в данном случае вполне логично.

ggv на первый взгляд считает, что это нужно делать на чем-то вроде MQseries (почему не MSMQ :-).

Сразу встает вопрос, нужно ли для эго ставить клиентскую часть для Messaging? Библиотеки для всех языков? Как быть с 80тым портом? (ggv опять запнется на этом сейчас :-)
 

ggv
23 Apr 2003 4:29 PM
Chkaloff - (don't have russian now) - don't understand what is a problem with port 80... So far as HTTP is the worst protocol if your work with the huge dely.
And as I said - can't tell anything without technical specification.
If you dude is so cool that can make a deductions based on the info given in the article - respect .
Don't see any base for the future discussion.
 

Mike
24 Apr 2003 1:41 AM
2Chkaloff
Я как раз понял. Базу данных может скачать любой желающий.
Совокупность текстовых файлов длиной в сотни мегабайт. При
наличии нормального канала выкачивается за несколько часов.
Вопрос не в этом. Вопрос понять что зачат эти бесконечные комбинации ACTGN
Так вот, понимание продвигается гораздо медленнее, чем компьютеры
успевают выдавать информацию. Еще никто не пожаловался, что мы
медленно что-то общитываем. Вот когда все станет ясно, лет через
100, тогда и большие скорости понадобятся, только тогда будут
анализироввать не некий обобщенный геном, а геном каждого индивидума. Но тогда и компьютеры, надеюсь, другие будут.
 

ggv
24 Apr 2003 5:07 PM
мне таки кажеться что речь идет _не_ о скачивании базы, а о доступе к ней. О доступе посредством WS.
Еще раз могу подтвердить что на основании данной статьи _нельзя_ сделать вывод хорошо это или плохо - применение WS в данном конкретном случае.
А то вот Chkaloff пытаеться утверждать что применение WS это всегда хорошо :)
 

Arekus - arekusngs.ru
29 Apr 2003 7:15 AM
Тема тут какая. Скоре всего, IBM предлагает именно посковую систему по базе данных (поиск ведется по кратким содержаниям статей, abstracts, если кому интересно, ибо сами статьи достаточно объемные и стоят денег), которая находится на сервера (скачивать - никакого резона нет: а) деньги за трафик, б) постоянное обновление базы на сервере). Если в IBM не полные дураки, то в их поисковике заложен алгоритм отслеживания запросов пользователя, относительно которых можно создать алгоритм для экспертной системы, которая в дальнейшем будет производить поиск _нужной_ информации, а не просто слов для поиска (я лично не раз работал с поисковиком ПабМеда, и отлично знаю начколько это глюкавый зверь)... Блин, хотя скорее нет в поисковике Синих штуки такой, кому это надо? Думаю они какой-нить путь похитрее придумают...

2 Mike: Понять - не сложно, что эти последовательности значат (специально проводятся различные опыты ин витро для определения функциональности того либо иного участка ДНК). Сложно - объеденить все полученные знания. А вот как раз таки с этим и может справиться система с высокими оборотами. IBM идет к тому, что бы систематизировать разрозненные данные (Xperanto всякие), а с другой стороны - анализ запросов. А когда данные будут систематизированы, то сразу будут видны дыры в модели, и эти дыры будут лататься уже направленными опытами... Блин. :(

2 ggv & Chkaloff: Ребят, абсолютно пофиг чем получать доступ к базе. Главное не это, главное - получать адекватные данные из мильёнов документов.
 

DKN
24 Oct 2003 2:04 AM
ура-ура, наконец-то.
вот, для интересующихся, доступ в EMBL с помощью WS и Java.
http://www.onjava.com/pub/a/onjava/2003/09/24/java_bioinfor matics.html

Пользуюсь Pubmed и Genbank каждый день, так что могу сказать с уверенностью, что это будет кул!

Поиск там уже есть, и работает отлично, но теперь все сервисы PubMed будут доступны из прикладного ПО, чего раньше сильно не хватало.

Для интересующихся -- PubMed это набор сервисов -- поиск статей, GeneBank, поиск протеинов, доменов, 3D структуры, и тд и тп, и плюс целая куча дополнительных сервисов. Те это не одна база, а целая куча разнообразных баз и серверного ПО, более-меннее интегрированного (но не всегда).

http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?CMD=&DB=PubMe d
 

DKN
24 Oct 2003 2:11 AM
http://www.alphaworks.ibm.com/tech/ws4LS/

вот этот проект
только лазилка в geneBank довольно примитивная -- ему нужно accession numbers в явном виде передавать, а было бы интересно именно удаленный поиск выполнять. И по протеиновым базам ничего нет пока, ну ничего, хотя-бы есть начало какое-то.
 

 

← март 2003 15  16  17  18  21  22  23  24  25 май 2003 →
Реклама!
 

 

Место для Вашей рекламы!