Все новости от 28 марта 2005 г. Новости, которые выбирает робот
Прошедшая неделя оказалась трудной для автоматической службы новостей Google, которая намеревается затмить традиционные газеты математическими алгоритмами и роботами, исследующими интернет.
Французское агентство France Presse (AFP) потребовало от гиганта веб-поиска убрать со своего сайта тысячи фотографий и заметок. И тут же Google раскритиковали за решение включить в индекс службы новостей статьи National Vanguard, издания, проповедующего превосходство белой расы. Google пообещала это сделать.
Оба случая говорят против теории Google о том, что компьютеры практически без помощи редактора могут выбирать главные новости дня и побеждать традиционные медиа на их собственном поле.
Сама Google, не обращая внимания на оба последних инцидента, так описывает службу, которая вот уже три года находится в стадии бета-тестирования: «Google News представляет собой необычную службу новостей, которая работает без вмешательства человека, исключительно на основе компьютерных алгоритмов».
Эти события подлили масла в огонь болезненных проблем, связанных с изменениями, происходящими в сфере потребления и распространения новостей. С одной стороны, читатели охотно пользуются агрегационными службами типа Google News, чтобы сэкономить время и прочесть те новости, которые им интересны, собранные в одном месте. Но цифровой тигель новостей поднимает также вопросы о необходимости стандартов, дополняющих возможности технологии.
«Это не что иное, как газетный киоск с возможностью поиска, и он предоставляет замечательные возможности, — говорит директор учебных программ школы журналистики при Северо-Западном университете и бывший редактор Time.com Янис Кастро. — Но мы привыкли говорить: „Это хорошая газета; это слабый материал». Поиск же выдает все в одном цвете и одного размера, никак не сортируя материалы по качеству...
Лучшие из них соседствуют с теми, которым до лучших очень далеко».
Google достается за то, что она использует свою технологию, чтобы добывать новости из глубин веба. Yahoo News тоже ищет новости, но образует для этого партнерства с поставщиками материалов, которые наполняют ее службу. Google отказалась отвечать на вопрос, заключает ли она соглашения с владельцами контента.
К тому же Google News и другие аналогичные концентраторы новостей стали значительно более мощными, вынуждая такие организации, как AFP, переосмысливать свои цели и стратегии распространения новостей. Все большее число людей обращается к поиску как способу доступа к новостям, и многие издатели не поспевают за меняющимися пристрастиями читателя.
Джон Баттель, специалист по веб-поиску и бывший издатель The Industry Standard, говорит, что издателей беспокоит то, что Google, в отличие от Yahoo, еще не сформировала модель своей агрегационной службы.
«Это создает атмосферу страха, неопределенности и сомнений вокруг их действительных намерений», — пишет он в e-mail, добавляя, что не верит в «злостность» этих намерений.
Согласно ComScore Media Metrix, с февраля 2004 года число посетителей Google News почти удвоилось и теперь составляет 5,9 млн. И все же Google News не так популярна, как ведущие новостные онлайновые издания New York Times Digital, CNN, AOL News или Yahoo News.
Google применяет специальные алгоритмы для поиска популярных новостей дня или для соединения разных источников с новостью на одну и ту же тему, собирая ссылки и фотографии от разных издателей. Однако кроме этой технологии, компания использует примерно 4500 заранее подобранных источников информации и постоянно ищет новые.
Многие критики задаются вопросом, какие стандарты использует Google для выбора источников новостей?
Читатели стали требовать прозрачности в ответ на известие о включении в индекс Google News издания National Vanguard. А согласно блогу HonestReporting.com, в индексе Google News одно время присутствовал и антисемитский веб-сайт Jihad Unspun.
Представитель Google Стив Лэнгдон сказал, что компания не допускает в свою новостную службу материалы, призывающие к межнациональной розни. «Если мы узнаем о статьях с таким содержанием, мы их удаляем», — заверил он.
При выборе источника новостей компания придерживается нескольких правил, включая требование, чтобы издание было редактируемым. Но самих этих правил на сайте нет, там говорится лишь, что «источники новостей выбираются независимо от их политических взглядов или идеологической направленности, что позволяет увидеть, как разные организации сообщают об одном и том же событии».
Собиратели против издателей
На прошлой неделе AFP подало в суд на Google за самовольное использование своих новостных заметок и фотографий. Французская компания требует возмещения ущерба в размере $17,5 млн и постоянного запрета на использование этих материалов.
Тем не менее Лэнгдон утверждает, что большинство издателей сами стремятся попасть в Google News, считая это выгодным для себя и своих читателей.
AFP обвиняет Google в нарушении авторских прав посредством воспроизведения аннотаций к новостям, заголовков и фотографий.
По словам юриста Electronic Frontier Foundation Фреда фон Лохманна, уже создан судебный прецедент, основываясь на котором веб-издатели могут давать ссылки на эскизы изображений. А использование заголовков и выдержек из аннотаций к статьям, по его словам, законно, так что правда на стороне Google.
«World Wide Web был бы совсем другим, если бы прежде, чем давать ссылку на что-либо, нужно было бы спрашивать разрешение; то же самое относится и к новостям».
И все же Google следует сделать новостную службу более прозрачной.
«Складывается очень напряженная ситуация, — говорит доцент Университета Marquette Эрик Голдман. — С одной стороны, они должны ужесточить отбор источников для включения в свой индекс, но с другой — если сделать его слишком строгим, тогда кто-нибудь может обойти их с более актуальными новостями».
Предыдущие публикации:
В продолжение темы:
|
|
| ммм 28 Mar 2005 6:49 PM |
Наверное, они используют алгоритмы поиска, нацеленные на слова типа: "Гейтс, миллион, прибыль, обижаться, пользователи, скандал"; или "Буш, Ирак, политика, миллион, прибыль, обижаться, скандал", или что-то вроде того. Что еще можно придумать в поиске горячих новостей? У них, наверное, все-таки подборку роботов проверяют редакторы. Иначе совсем лажа получится. |
|
| Весельчак У. 29 Mar 2005 2:57 PM |
2 ммм Они своим спецам платят килобаксами. Думаешь, стали бы они платить, если б те им выдали "алгоритмы поиска, нацеленные на слова типа: "Гейтс, миллион, прибыль, обижаться, пользователи, скандал"; или "Буш, Ирак, политика, миллион, прибыль, обижаться, скандал", или что-то вроде того"? Зачем глупости говорить, если нет умностей? Абы ляпнуть?
|
|
| ммм 29 Mar 2005 9:36 PM |
Ну насчет "миллион-прибыль" это я ляпнул. Но все равно непонятно, как они новости отбирают. Анализ по семантике и смыслу? Да ну, не поверю. ИИ пока еще никто не изобрел.
|
|
|