Подписаться на обновления
14 февраляВторник

usd цб 29.8873

eur цб 39.6037

днём -19
ночью -20

Восх.
Зах.



ОбществоЭкономикаВ миреКультураМедиаТехнологииЗдоровьеЭкзотикаКнигиКалендарь
Энергетика и экология  Компьютеры  Сеть  Мобильные технологии  Наука  Космонавтика  Военные технологии  Биотехнологии  Транспорт 
Владимир Харитонов   пятница, 2 апреля 2010 года, 14.00

Матрица для «Яндекса»
Крупнейший российский поисковик перешёл на новую технологию


// Коммерсантъ, Юрий Мартьянов
   увеличить размер шрифта уменьшить размер шрифта распечатать отправить ссылку добавить в избранное код для вставки в блог






Невзирая на День дурака, «Яндекс» собрал журналистов, чтобы рассказать, что такое MatrixNet и как новая технология повлияла на качество работы поискового движка и долю «Яндекса» на рынке поиска. Кроме того, руководители «Яндекса» сообщили, какие у компании планы на будущее есть, а каких — нет.

Было видно, что генеральный директор «Яндекса» Аркадий Волож и главный программист компании Илья Сегалович очень старались. Они рассказывали, насколько сложна задача поиска информации в сотнях миллионов веб-страниц, как много факторов при этом приходится учитывать, что в компании трудятся около тысячи асессоров (не путать с коллежскими асессорами), которые изо дня в день оценивают результаты поиска «Яндекс», что в компании уже давно практикуется машинное обучение (даже странно, что никто не шутил по поводу «Матрицы»), а программное обеспечение поискового движка совершенствуется, чтобы выдавать более релевантные результаты.

Но объяснить, чем механизм поиска, построенный на методе опорных векторов на основе размерности Вапника—Червоненкиса, отличается от разработанного Шапиром и Фридманом и усовершенствованного Гулиным и Карповичем методом boosting'a, собравшимся в «Рэдиссон САС Славянская» журналистам, кажется, всё равно не удалось. Волож и Сегалович даже показали фотографии всех этих симпатичных математиков, но пресс-конференция была слишком короткой, чтобы разобраться, в чём состоит преимущество «регуляризации значений в листах вместо ограничения на количество самплов в листе».

В конце концов, они потратили слишком много сил на «Студень» — встречу со студентами, будущими инженерами, программистами и математиками (пресс-конференция проходила как раз параллельно с этим мероприятием), где сотрудники «Яндекс» объясняли не только картинками, но и с формулами, на какой математике сейчас работает крупнейшая российская IT-компания.

В общем, остаётся верить «Яндексу» на слово: его поиск теперь базируется на другой, более сложной математической модели, которая предполагает учёт значительно большего количества факторов для ранжирования за приемлемое время, тем самым делая поиск более качественным.

Не успел «Яндекс» объявить, что закрывает «пузомерку», как точно такие же на первый взгляд сервисы (благо «Я» решил свободно поделиться своими технологиями со всеми желающими) появились на artlebedev.ru и WhoYOUgle. Их влияние на блогосферу пока равно нулю, а реальным претендентом на место «Яндекса» может стать только Google.

Пришедший на смену «Арзамасу» поисковый движок «Снежинск» («Яндекс» явно тяготеет к тому, чтобы приобщиться к осколкам советского «ядерного архипелага»), базирующийся на технологии MatrixNet, появился не вчера. Его запуск состоялся ещё 17 ноября 2009 года, что моментально заметили и конкуренты компании, и специалисты по веб-оптимизации, однако громогласно объявлять об этом событии «Яндекс» не стал, решив посмотреть, какими будут результаты. По «внутренним ощущениям», то есть по собственным критериям, благодаря новой технологии качество поиска «Яндекса» выросло сразу на 5%.

«Внутренним ощущениям» компании можно и не верить, но если заглянуть в статистику liveinternet.ru, то можно увидеть, за четыре месяца — с декабря 2009 по март 2010 — доля «Яндекса» на рынке поиска выросла на 4%, достигнув 62,9% рынка. За тот же период доля конкурирующих поисковиков — Google и Mail.Ru — немного снизилась. «Яндекс» считает, что столь значительным ростом компания обязана именно MatrixNet.

Повышение качества поиска, конечно, может привести к росту числа пользователей — только так ли быстро? У пользователей есть свои привычки, которые, как и всякие привычки, они не склонны менять скоропалительно. Судя по ненулевой доле Rambler, есть ненулевое количество пользователей, которые не готовы менять свои привычки, несмотря ни на что. С другой стороны, кардинальное изменение поиска на Mail.Ru, например, который больше не обслуживается «Яндексом», могло привести к увеличению доли последнего на рынке весьма значительно: разочарованные привычными результатами, пользователи главного российского почтовика могли обратиться именно к «Яндексу». Кстати, удивлены решением Mail.Ru были не только пользователи, но и, по словам Аркадия Воложа, сам «Яндекс». Настолько удивлён, что вряд ли решится вернуться, даже если Mail.Ru «одумается» и позовёт обратно.

Планов обслуживать поисковый сервис Mail.Ru у «Яндекса» теперь нет. Нет и других планов. Например, покупать ICQ: не так давно СМИ активно обсуждали перспективы этой всё ещё популярной в России службы мгновенных сообщений «продаться кому-нибудь», и «Яндекс» фигурировал среди главных претендентов на громкое приобретение. Но с математикой у «Яндекса», судя по MatrixNet, кажется, всё нормально, поэтому 1% поискового трафика от ICQ компании довольно. «А больше нам ничего и не надо», — радостно заметил Аркадий Волож. И в этот момент он напоминал человека, которому попытались втюхать китайский портативный пылесос для автомобиля, но он удачно избежал бессмысленных трат.

Кстати, о китайцах. Несмотря на то, что у «Яндекса» достаточно серверов и математиков, нет у него и планов выхода на китайский рынок. Google из Китая, видимо, уходит, и под боком у Baidu.com освободилось место для второго поисковика. Но воспользоваться этим шансом «Яндекс» не собирается и в Китай не стремится: того уровня государственного регулирования рынка, который есть в России, ему, судя по всему, хватает выше крыши, и прорываться через Великую китайскую стену китайской бюрократии ему явно не хочется. «Яндекс» готов помочь Baidu.com с математикой: технологии главного китайского поисковика находятся на уровне, не слишком отличающемся от Infoseek десятилетней давности. Но не более того.

«Очки Google» (Google Goggles) — это, конечно, не очки Терминатора, но первый реальный шаг к возможности мгновенного получения информацию об окружающей реальности — вещах, нас окружающих, а также достопримечательностях и т.д. После запуска программы вы можете навести объектив телефона на попавшуюся вам книгу — и тут же получить информацию о ней. Или на этикетку винной бутылки — и узнать мнения знатоков. Сфотографировав визитку, «Очки Google» предложат занести данные её владельца в адресную книгу или найти в Сети информацию о фирме, которую этот человек представляет. Вы не уверены в своих познаниях в истории культуры? «Очки» помогут вам опознать картину.

Помимо планов, которых у «Яндекса» нет, есть у него планы, над реализацией которых он активно работает. Илья Сегалович рассказал оживившимся после презентации MatrixNet журналистам, что разработчики «Яндекса» трудятся над технологиями распознавания речи. Более того, уже в этом году такие функции появятся у пользователей мобильных приложений компании. Занимается «Яндекс» и распознаванием образов. Недалёк тот день, когда простой российский гражданин, проходя по Тверской и обнаружив там памятник неизвестному поэту, сможет навести на него объектив телефона, и MatrixNet «Яндекса» мгновенно определит, что это, и правда, Пушкин.

Хорошо, что определит, а не нарисует. В общем, даже счастье, что MatrixNet, несмотря на использование boosting'а, — это ещё не Матрица.




ОТПРАВИТЬ:       



 




Статьи по теме:



Безошибочный веб-дизайн

Создание сайта — работа для мастеров своего дела. Соблюдение 5 простых принципов поможет начинающему веб-мастеру в профессиональном росте

Наверное, каждому веб-мастеру знакомо навязчивое чувство, что он что-то упустил при создании сайта. Закончив один проект и приступая к следующему, мы часто осознаём, что дизайн далеко не так впечатляющ, как представлялось вначале, или что в процессе разработки что-то пошло не так. Как правило, это осознание приходит, когда уже слишком поздно что-то менять.

11.01.2012 15:02, Дмитрий Морозов


Дудлы Google-2011

«Наутилус» в день рождения Жюля Верна, трибьют для Чарли Чаплина и гитара от Леса Пола

Благодаря поисковику Google весь мир узнал, что такое дудлы. Ведь многие становятся художниками по неволе, проводя долгие часы на лекциях и совещаниях, выводя какие-то каракули на бумаге. Google же превратил их в настоящее искусство: дизайнеры изобразили такие дудлы как праздничные логотипы, которые на время заменили привычные буквы на главной странице поисковика.

23.12.2011 09:56, Мария Селезнёва


Сетевое табу

Web-цензура в Казахстане, Туркменистане и Узбекистане

Обзорный документ под названием “Центральная Азия: Цензура и контроль Интернета и других новых средств коммуникации”, представленный Международным партнерством по правам человека, Нидерландским хельсинкским комитетом, Казахстанским международным бюро по правам человека и соблюдению законности, Туркменской инициативой по правам человека и Инициативной группой независимых правозащитников Узбекистана в ноябре 2011 года, рассматривает проблемы цензуры и контроля Интернета и других новых средств коммуникации в Центральной Азии.

16.12.2011 12:56


Национализм online

Эксперты пытаются разобраться в теме русского национализма через исследования в Рунете

В спецприемник, где сидят арестанты с Чистых прудов, на днях пришла посылка с лавашами, сулугуни, чурчхелами и мандаринами. В записке был указан адресат: «Алексею Навальному от Кавказа, который хватит кормить»… Да, митинг на Болотной продемонстрировал уход от «русской темы» к общечеловеческому недовольству результатами выборов, а редкие попытки некоторых демонстрантов проскандировать что-нибудь соответствующее или «кинуть зиги» пресекались внутри толпы митингующих. Однако тема эта жива и никуда не исчезает.

13.12.2011 15:48, Павел Кошкин


«Как тут не нарисовать что-нибудь про Браму или там Вишну?»

«Про власть», «Про богов» и про ТО 420 - создателей этих мультфильмов

Гениальные, но не менее скрытные создатели мультфильмов «Про власть», «Про богов» и многих других веселых хитов YouTube в лице исполнительного продюсера ТО «420» Василия Чагина сделали вид, что рассказали обо всем главном.

09.12.2011 11:10


Грегори Хаус не оставил шансов преследователям

10 самых популярных сериалов на iPhone

Американские телесериалы – новое и, пожалуй, главное развлечение для широких масс. С тех пор, как Голливуд увлекся комиксами и стал выпускать максимум 3-4 классных фильма в год, ведущие сценаристы, режиссеры, а теперь и актеры дружно переехали в ящик. «Гаджет» составил рейтинг самых скачиваемых сериалов для iPhone с главного российского торрент-сайта Рутрекер.

18.11.2011 17:33


Типогаджеты

12 типографских символов, о которых вы не подозревали

Типогаджеты — символы, которыми можно сделать многое и сразу. Кажется, этим функциональным штуковинам нужно найти применение, и если вам не нравится исходный смысл этих закорючек, вы легко можете придумать свой. Вот лишь несколько примеров.

07.11.2011 20:00


ЗаDDoSили

Алексей Навальный: «Ранее неполитизированные пользователи начнут выражать критическое отношение к власти»

Блогеры высказали мнения о DDoS-атаках. Большинству участников дискуссии кажется, что всему виной боты кремлёвской администрации, пытающиеся таким образом лишить российскую публику главной независимой дискуссионной площадки. Другие же видят в произошедшем пиар-кампанию ЖЖ.

06.04.2011 11:50, Зинаида Троицкая


Старые добрые глушилки

Антон Носик о последних DDoS-атаках

К сожалению, многолетний опыт наблюдения за действиями наших кибергопников не оставляет много простора для иных прогнозов. Например, что их будут искать, найдут и посадят. Или что они сами раскаются. Или что их заказчикам надоест пилить чёрный нал на таких «спецоперациях».

31.03.2011 15:40, Антон Носик


Виртуальный брендинг

Как повысить капитализацию нематериальных активов

Несмотря на бурное развитие веб-отрасли, работой над своим брендом могут похвастаться единицы, а брендинг по-прежнему остаётся уделом традиционных отраслей производства, например производителей колбасы. В отличие от них, веб-компании продают неосязаемый продукт, но от этого их внимание к управлению нематериальными активами должно быть ещё выше.

17.03.2011 11:01, Алексей Чубат






 
 

Новости

В патентных войнах наметился новый поворот
Microsoft, Apple и Cisco предлагают пакт о ненападении.
The Pirate Bay полностью откажется от торрент-файлов
Файлообменник перейдёт на «магнитные ссылки», которые идентифицируют файлы не по их расположению или имени, а по их уникальному идентификатору.
Google+ в России обогнала Twitter
Новой социальной сетью, появившейся в июне прошлого года, хотя бы раз в неделю пользуются уже более 2 млн человек.
Минкомсвязи готовит закон о «чёрных списках» безнравственных сайтов
В «белый» список попадут только те ресурсы, которые прошли проверку и безопасны для детей.
ГЛОНАСС подорожает втрое
Россия запустит в космос 35 «ГЛОНАССов» на 330 млрд бюджетных рублей.

 

 

 

Мнения

fritzmorgen

Почему предали Медведева

Лично я считаю отвратительной ситуацию, когда вчерашние друзья отворачиваются от вышедшего на пенсию или сменившего место работы влиятельного человека

Терпеть не могу шакалов и предателей. Наверное, если бы хороший психолог покопался в моей голове, он бы нашёл там корни этого комплекса. И объяснил бы мне, что предательство — это нормально, и что кусать промахнувшегося Акеллу — это более чем естественно для вчерашних обезьян.

Малек Яфаров

Остановите Брейвика!

Русский мip и русские мифы – 9: Последняя любовь Гагарина

За полчаса до выезда на старт к Гагарину подошел главный электрик, отвел в сторону и, смотря ему куда-то за спину, так как немного косил, сказал: "Юра, я совершаю должностное преступление, но ты должен это знать: код доступа к системе спуска 5, 2, 1. Повтори".

dolboeb

Кристина, Маша и социальный лифт

«Если ты принцесса, то никакой Вася тебе не нужен. А если ты деревенское у...ще, то никакой Вася тебя не спасёт»

Есть одно очень простое, зато принципиальное отличие между взломом почты Потупчик и Навального. Вернее, отличий этих стопицот, начиная со статуса потерпевших, но одно касается чисто морального аспекта.

Михаил Эпштейн

Хитро-добрые

K вопросу о теодицее

Добрые люди подчас бывают хитроваты, лукавы, как будто что-то скрывают. Обычно хитрость ассоциируется с тайным умыслом, а раз он тайный, значит, в нем есть что-то недоброе, опасное, постыдное. Евангелие говорит, что нет ничего тайного, что не стало бы явным, все грехи так или иначе выплывут наружу. «Нет ничего сокровенного, что не открылось бы, и тайного, чего не узнали бы» (Лука, 12:2).

Малек Яфаров

Спасибо, что не мой!

Русский мip и русские мифы – 8: Низкий потолок высокого контента

Но Михалков этого уже не слышал: в ярости он продирался сквозь приветливо улыбающихся ему людей. Пришел в себя он только в подъезде собственного дома, когда ухмыляющийся вахтер показал на оставленный для него ящик коньяка.

Денис Драгунский

Авторитарный человек и его речь

«По газонам не ходить! Штраф сто рублей. Администрация»

Политика должна быть эффективная. Экономика – современная. Развитие – динамичное. Лидер – энергичный. Деятель – крупный. Программа – долговременная.

Лили Пулен

Волчий взгляд

«Я устал, открывая чужие конверты, сигареты и кофе, кофе и сигареты» («Сегодня ночью»)

Он работает в правоохранительных органах младшим оперуполномоченным в одном из районов нашей столицы. Его зовут Андрей. Ему тридцать два года. Глаза у него добрые, но сильно уставшие. И взгляд какой-то... затравленный.

Календарь

Максим Кравчинский

Живой бог русской музыки

13 февраля 1873 года родился Фёдор Шаляпин

Ко дню рождения великого русского певца «Часкор» публикует фрагмент книги Максима Кравчинского «Русская песня в изгнании». Это первая книга об эстраде русского зарубежья, которая не ограничивается периодом 20—30-х годов XX века. Автор повествует о судьбах, взлётах и падениях артистов русского зарубежья: Бориса Рубашкина, Дины Верни, Александра Вертинского, Петра Лещенко. И, конечно, Федора Шаляпина.

Виталий Куренной

Актуальность Дарвина

12 февраля 1809 года родился учёный, расколовший современную культуру

История воздействия «Происхождения видов» Дарвина — одна из самых сложных и неоднозначных. Эта книга буквально расколола современную культуру: появились и продолжают существовать как яростные противники, так и яростные сторонники дарвинизма (само это слово поначалу использовалось как бранное).

Глеб Давыдов

Голос его хозяина. Опыт толкования трейдмарка

Ко дню рождения Томаса Алва Эдисона, изобретателя фонографа и создателя традиции начинать телефонный разговор с «Алло»

11 февраля — день рождения Томаса Эдисона, одним из самых заметных изобретений которого стал фонограф (первый прибор для записи и воспроизведения звука, патент на него выдан 19 февраля 1878 года). А в минувшем сентябре исполнилось 112 лет самому знаменитому и узнаваемому товарному знаку в истории мировой музыкальной индустрии (и одному из старейших товарных знаков в мире).

Игорь Субботин

Русский Данте

11 февраля родился поэт Юрий Поликарпович Кузнецов

Незадолго до смерти он закончит поэму «Сошествие в ад», из-за чего современники будут с усмешкой говорить, что поэт метит в один ряд с автором «Божественной комедии». На протяжении всего творческого пути Юрию Кузнецову приходилось терпеть непонимание читателей и враждебность критиков. Что ни стихотворение – либо сумерки античности, либо дремучий русский миф. Но кузнецовская поэзия заслуживает отдельного места в мировой литературе, и называть его «русским Данте» можно без тени иронии.

Игорь Фунт

Пушкин в джинсах Levis

К 175-летию со дня преступной дуэли

Каждый раз, когда приходится вспоминать об ужасном событии, нет возможности подавить рвущийся из груди невольный вздох: мы не можем простить судьбе и её орудию, Дантесу, их жестокости – Пушкина у нас нет, вместе с ним ушли навсегда в могилу бесценнейшие перлы художественного творчества.

Радиф Кашапов

Двойная жизнь Бориса Пастернака

10 февраля (29 января) 1890 года родился Борис Пастернак

Проживший долгую жизнь Борис Пастернак на первый взгляд написал не так уж и много — все его стихи помещаются в один большой том. Обычно объясняется это тем, что у него всегда не хватало времени на творчество. Необходимость зарабатывать деньги многочисленными переводами, трудности с жильём, душевные терзания.

Бежан Дарувалла

Гороскоп по лунным неделям

7 - 13 февраля. Полнолуние во Льве

Это очень удачливый этап. Вы вкалываете с серьезной и сосредоточенной решимостью. Акцент смещен на собственность, землю, недвижимость, строительство и совместные вложения. Будут твердые доходы, приобретения, накопления. Все просто падает вам в руки. Легко будет делать правильный выбор, и путь вперед окажется гладким. Вероятно путешествие и подписание многих новых соглашений. Вы строите планы и много зарабатываете. С любимыми вас ожидают прекрасные мгновения. Ганеша благословляет вас.


 

Интервью

Константин Жеребятьев: «Создание робота для меня хобби, патриотизм. А зарабатываем мы на другом»

Талантливый инженер рассказал о своём главном творении и ещё о многом

На въезде в село Ягодное, что в Самарской области, слева можно увидеть неприметное двухэтажное строение. Это один из корпусов компании «Робокон», которая помимо различной автоматизации high-tech производств, единственная в России создает настоящего промышленного робота, полностью отечественной разработки. Одного из таких, которых директор бывший АвтоВАЗА Владимир Каданников мечтал поставить на конвейер завода, но денег не хватило.

Медиа, инновации и история

«Развитие новых медиа важно не само по себе, а своим эффектом – трансформацией коммуникаций»

Современные информационно-коммуникационные процессы усложняются, исследовательские практики медиатизируются. Как на эти вызовы отвечает российская историческая наука? Об этом интервью с Олегом Реутом, доцентом кафедры истории стран Северной Европы Петрозаводского государственного университета.

Рано Кубаева: «О некоторых странностях «неженской» профессии»

Стоя по ту сторону камеры, никто тебе не даст поблажки, потому что ты женщина, потребуют точно так же, как с мужчины

Рано Кубаева – актриса, режиссер и продюсер (иногда она делает это одновременно) – представляет собою интересный феномен: не только чисто профессиональный, но и, так сказать, личностный. Называя себя «гастарбайтером», - то есть человеком извне, со стороны, наблюдающим московскую жизнь словно через призму, она, тем не менее, постоянно пытается «нащупать почву», понять, как встроиться в чуждое ей пространство.

Екатерина Дайс: «Новейшее время закончилось…»

Беседа с культурологом о тайных культурных культах, мистериальной традиции в современной культуре, «рифмах френдленты» и половой принадлежности Бога

На протяжении 2000 лет, с момента оформления христианства как института, существуют разнообразные тайные течения, которые надо рассматривать не по отдельности, а в совокупности: как единую, цельную линию. О том и разговор.

Аркадий Ипполитов: «Символическое содержание? Я его создаю…»

Если под артефактом вы подразумеваете искусственно созданный объект, имеющий знаковое или символическое содержание - то я с ним не работаю, я его создаю - ведь произведение не искусственно созданный объект, а естественно появившийся, артефактом же его делает наша интерпретация.