Все новости от 23 июля 2001 г. Новый стандарт наделяет веб голосом
Перспективный стандарт, плод творчества технологических гигантов AT&T, IBM, Lucent Technologies и Motorola, создает основу для нового программного обеспечения, которое позволяет подавать по телефону — сотовому или стационарному — голосовые команды, управляющие веб-браузингом. При произнесении этих волшебных слов пользователи смогут проверять электронную почту, заказывать билеты или резервировать места в гостинице.
В настоящее время технология, называемая VoiceXML, изучается организацией по стандартизации World Wide Web Consortium, которая к концу текущего года может официально принять соответствующий стандарт.
Сторонники VoiceXML утверждают, что стандартизация имеет решающее значение для становления рынка ПО и услуг голосового доступа к вебу. Этот стандарт обеспечит производителям ПО и аппаратуры, а также сервис-провайдерам и другим компаниям, использующим данную технологию, унифицированный способ создания программ, зачитывающих по телефону информацию из веба и предоставляющих другие услуги. Однако остались не решенными еще многие технические задачи, такие как поиск формы интерфейса и конкретная реализация стандарта. Во многих случаях голосовой веб пока остается относительно примитивным и напоминает веб-интерфейс на базе HTML образца 1996 года.
«Нельзя управлять предприятием по телефону, но узнать, как идут дела, вы сможете, а это немаловажно, — говорит консультант Кевин Дик (Kevin Dick), автор книги по XML и аналитик компании Kevin Dick Associates. — Менеджер или выездной специалист тратит массу времени на то, чтобы войти в систему и получить информацию о состоянии того или иного проекта или поручить что-то исполнителям. Все эти операции можно эффективно выполнять посредством ПО VoiceXML».
Потенциальный круг пользователей этой технологии чрезвычайно широк. «Телефонов в мире в десятки раз больше, чем компьютеров. Использование для доступа к интернету телефона означает возможность формирования огромной новой аудитории, — говорит Джим Ларсон (Jim Larson), менеджер Intel Architecture Labs и председатель комитета Web Consortium, ведающего стандартом VoiceXML. — Этот стандарт позволит каждому овладеть унифицированным языком и быстрее создавать новые приложения для телефона».
Хотя спецификация VoiceXML еще не закончена, технологические компании и операторы связи спешат поддержать эту технологию и уже предлагают новое ПО и услуги, связывающие телефон с интернетом. Технология получила поддержку около 500 компаний, включая IBM, производителя сетевого оборудования Cisco Systems, разработчика СУБД Oracle и брокерскую фирму Charles Schwab. Microsoft пока медлит. Крупнейший в мире производитель ПО следит за развитием стандарта, но еще не анонсировал ни одного продукта, поддерживающего VoiceXML.
Технология VoiceXML уже применяется компаниями AT&T Wireless, Sprint PCS, Japan Telecom и Qwest Communications International — все они позволяют владельцам сотовых телефонов ориентироваться в вебе при помощи голосовых команд, чтобы заказать такси, купить билеты в кино или попросить автомат зачитать синтезированным голосом новости или маршрут движения к определенному городскому объекту.
Есть еще одна причина, почему следует поспешить с разработкой управляемых голосом веб-интерфейсов, особенно для сотовых телефонов: по крайней мере в 35 штатах рассматривается закон, запрещающий водителям, за исключением экстренных случаев, подносить к уху сотовый телефон. В Нью-Йорке такой закон уже принят. Распознавание голосовых команд с применением VoiceXML поможет операторам связи, таким как Verizon и Alcatel, предложить услуги веб-серфинга «без рук». Обе компании, а также автогигант DaimlerChrysler являются членами VoiceXML Forum — организации, основанной AT&T, IBM, Lucent и Motorola для разработки спецификации VoiceXML.
Ожидается, что к концу года ряд компаний предложит сервисы на базе VoiceXML. Сервис компании Net2Phone, специализирующейся на интернет-телефонии, позволит звонить через интернет, просто взяв трубку и назвав имя абонента. Синтезированный голос будет зачитывать сообщения e-mail, персональное расписание и контактную информацию. Другие компании планируют предоставить возможность устно заказывать авиабилеты или торговать на бирже, не вступая в контакт с оператором. Со временем ПО, поддерживающее VoiceXML, позволит агентам по продаже входить в корпоративную сеть и справляться, например, о состоянии заказа того или иного клиента.
Технологические компании не видят большой проблемы в поддержке стандарта, который еще не принят. Представители Cisco сообщили, что по требованию своих клиентов-операторов связи компания уже встроила VoiceXML в некоторые новые устройства интернет-телефонии. А когда разработка VoiceXML завершится и выйдет официальный стандарт, Cisco просто модернизирует ПО. «Мы делали это много раз, — говорит менеджер продуктов Cisco Мэтью Лодж (Mathew Lodge). — Проекты всех интернет-стандартов существенно менялись, но мы их поддерживаем».
Поговори со мной
VoiceXML — лишь один из вариантов XML (Extensible Markup Language), веб-стандарта обмена информацией, который не только позволяет компаниям легко и дешево производить онлайновые операции со своими клиентами и партнерами, но и обеспечивает возможность доставлять через веб аудио, видео и другие типы данных. Если у языка HTML для создания Web-сайтов есть заранее заданный словарь, то XML позволяет разработчикам определять свои собственные словари, создавая специализированные системы обмена данными. VoiceXML — это вербальный эквивалент HTML.
Аналитики считают, что обращение к вебу по обычному и мобильному телефонам может стать популярным — особенно среди тех людей, кому нужно быстро получить короткую информацию или произвести простую операцию, но ПК под рукой нет. Использование голосовых команд для навигации в вебе при помощи сотового телефона — удобная альтернатива текстовому браузингу на крошечном экране мобильного устройства.
VoiceXML в сочетании с технологией распознавания речи и программным обеспечением преобразования текста в речь позволяет улучшить и обслуживание клиентов по телефону. Например, если вы позвоните в банк, чтобы узнать баланс своего счета, то сможете спросить об этом устно, не выполняя длинной последовательности действий с нажатием кнопок на клавиатуре телефона. «Голосовой интерфейс лучше клавиатуры сотового телефона. Трубки становятся компактнее, а пальцы — нет», — говорит Билл Дикас (Bill Dykas), менеджер IBM по стратегическим альянсам и председатель VoiceXML Forum.
Однако эксперты не исключают, что технология может провалиться, если пользовательский интерфейс людям не понравится. По словам аналитика IDC Марка Уинтера (Mark Winther), современные голосовые пользовательские интерфейсы сопоставимы с простым дизайном веб-сайтов пятилетней давности. «Впереди еще очень много работы. Интерфейсы слишком неуклюжие и путаные, — говорит он. — Это может все испортить. Компании понимают это и прилагают большие усилия к поиску правильного решения». Сейчас, например, можно получить информацию из веба по телефону, произнеся в трубку одно или два слова, такие как «погода» или «спорт». В будущем же, уверен Уинтер, с вебом можно будет говорить целыми фразами на естественном языке.
Использование голосовых команд для веба можно рассматривать как потенциальную замену трудных в применении веб-браузеров для сотовых телефонов, управляемых с клавишной панели трубки. Некоторые сервис-провайдеры предлагают мобильное подключение к вебу через протокол Wireless Access Protocol (WAP). Однако Уинтер утверждает, что обе технологии могут работать рука об руку. «Если, находясь за рулем, вы звоните в голосовой веб-портал, чтобы справиться о маршруте, то эту справку гораздо удобнее получить на экран (сотового телефона), а не делать записи от руки», – поясняет он.
Компании ищут способы совместного использования обеих технологий. Полосы пропускания телефонного канала недостаточно, чтобы объединить данные сервисы, но существуют технические уловки, позволяющие это сделать. Новые версии ПО компаний Nuance и SpeechWorks, специализирующихся на распознавании речи, поддерживают VoiceXML. Их клиенты, такие как American Airlines, United Parcel Service и E*Trade, применяют существующую технологию распознавания речи для предоставления активизируемых голосом услуг по выдаче справок о полетах и времени прибытия, а также о биржевых котировках.
Вокруг VoiceXML уже образовались новые компании, такие как Tellme Networks, HeyAnita, BeVocal и VoiceGenie. Они предлагают услуги голосового портала или продают ПО, позволяющее сервис-провайдерам и предприятиям предлагать такие услуги своим клиентам. Услуги, активизируемые голосом, доставляют простую информацию, такую как курс акций, сведения о маршруте для водителей и информация о главных событиях, а также позволяют покупать в онлайне, например, билеты в кино.
Аналитики уверяют, что популярность голосовых порталов будет расти. Некоторые считают, что к концу года их будет предлагать каждый крупный оператор беспроводной связи в США. Если Sprint и Qwest берет за свои услуги небольшую ежемесячную плату, то AT&T предоставляет их бесплатно, однако, входя в систему, клиенты должны прослушать блок рекламных объявлений. Представители Tellme сообщили, что еще одна будущая служба этой компании позволит управлять электронными сообщениями посредством голосовых команд: «удалить сообщение», «перейти к следующему сообщению» и т.п.
Если рынок VoiceXML действительно оживет, это может стать благом для операторов связи, строящих голосовые сети на базе интернета, в частности Qwest, Genuity, iBasis, ITXC. Ожидается, что данная технология станет популярной как среди потребителей, так и в корпоративном мире, особенно в тех компаниях, в которых есть центры обслуживания клиентов. VoiceXML упрощает заказчикам решение их проблем, так как им не приходится говорить с представителем технической службы.
Технологические компании, например IBM и Lucent, уже продают основанные на VoiceXML продукты, позволяющие предприятиям создавать веб-сайты с голосовым интерфейсом. От представителей Microsoft мы узнали, что и эта компания намерена предложить такое ПО. Дик уже видит будущее, в котором сотрудники предприятия смогут обращаться к своей корпоративной сети посредством VoiceXML. Например, агент по продаже сможет попросить зачитать ему сведения о клиенте: скажем, дату его последнего контакта с компанией. А руководитель, набрав номер, услышит, что для него подготовлен отчет о представительских расходах. Заслушав этот отчет по телефону, он сможет устно утвердить его или отправить на доработку. В продолжение темы:
|
|
| Alexey - alexceymail.ru 23 Jul 2001 8:17 PM |
Представляю себе такую картину: - едет водитель в тачке, и вдруг ему приспичило узнать - например результат последней гонки Формула-1. Надиктовал он значит в трубу и о чудо - подгрузились на экран результаты забега. Начинает он их разглядывать и ...... врезается. А вообще круто. Буржуи технологически отрываются все дальше и дальше. |
|
| муму 23 Jul 2001 11:58 PM |
Ерунда... И у нас кое-что в запасе осталось! Не забывай, что русская литература - самая великая в мире!!! Так что не в технологии сила, и не в деньгах, а в великой национальной идее!!! |
|
| Волков 24 Jul 2001 6:03 AM |
Болван ты, Alexey. Там же ясно сказано что телефон будет синтезированным голосом отвечать на запрос. |
|
| Denis 26 Jul 2001 3:27 PM |
2 Alexey а ты почти близок к реалии: GPS в машине. Единственное, что не удобно - набирать адрес, а ведет голосом, и на карте показывает ;) |
|
| муму 28 Jul 2001 4:24 AM |
Эх... лучше бы и впрямь механического водителя сделали! |
|
| Программер - 000ppp.qu 31 Jul 2001 7:18 AM |
Обрадую больных ложным патриотизмом - Новосибирская софтовая компания "Новософт" как раз сейчас совместно с IBM занимается разработкой голосового интернет-браузера. Проект предназначен, в первую очередь, для людей с ослабленным зрением. Параллельно компания учавствует в доработке стандарта VoiceXML. Так что не стоит сетовать на технологический отрыв буржуев, лучше заниматься своим делом и все у нас будет :) |
|
| Cvunt - ulanovpcweek.ru 3 Aug 2001 2:18 PM |
Ребят с добрым утром. Стандарт VoiceXML принят 22 мая 2000 года, и уже больше года интенсивно используется в США. Эту нишу даже окрестили V-Commerce (от Voice Commerce). Чистайте PC Week/RE! |
|
| муму 3 Aug 2001 9:37 PM |
2 Программер: Ура, наконец-то!!! Неужто и расейский народ-броненосец уже освоил технологию 15-летней давности? Неужто научились пользоваться дискретным преобразованием Фурье и скрытыми марковскими моделями? Вау! Эдак лет через десять и лица распознавать научимся. |
|
| Bosch - boschpisem.net 16 Aug 2001 1:25 PM |
Сколько ни захожу на обсуждения различных тем на ZDNet'e, столько и вижу "дурак", "пошел ты" и т.п. Вам,..., (ну не могу я к вам обратиться "Господа") надо встретиться где-нибудь на улице и сразу набить друг другу морды. Пролетарии вы в большинстве своем. Не рабочие, а именно пролетарии, у которых ничего нет, да и хрен с ним. Пролетарий, это не необразованность, а состояние души. Пролетарием может быть и сверхначитанный кандидат в академики... Извините, что прорвалось все это из меня именно в обсуждении этой темы... |
|
| Dmitry - kkklll 17 Aug 2001 1:23 PM |
А наша компания Itoola Inc. еще в январе этого года сделала платформу CT, основанную на VoiceXML. Работает. Продается. Так что буржуи далеко не оторвутся :-) |
|
|