Поисковые системы как средства доступа к информации Илья Сегалович Яндекс
Рандеву должно состояться 4 Поисковые системы не умеют индексировать 4 Вебмастера не умеют создавать сайты 4 Рандеву должно состояться
Технологии ПС 4 Интернет = масс-медиа 4 Нагрузка - предмет основных забот: 3.1 млн (4.5 млн) запросов 4 Уникальные процедуры (160 серверов), атаки 4 Open-source OS
Развитие ПС 4 Форматы: PDF, Office, Flash, CSS; проблемы 4 Языки: i18n, ЕЯ 4 Свежесть 4 Совершенствование ранжирования
ПС: принципы и ранжирование 4 Слагаемые успеха: внутренняя атмосфера, ориентация на пользователя (деньги – опосредованно) 4 Алгоритмические способы: анализ линков (сообщества, легкость хорошего ранжирования: searchking?), ВИЦ (pagerank) 4 Эвристики и факторы - внутреннее дело 4 Неиспользование трафик-анализа 4 Запреты на манипулирование
Задачи вебмастера 4 Коммуникативная: цвет, интерфейс, визуальный ряд (Flash, CSS), удобство = «юзабилити» (javascript, DHTML) 4 Информативная: навигация, функциональность (frames, сессии, структура сайта, URL API) 4 Репрезентативная: нетрадиционные клиенты: поисковые системы, закладки
Индексирование: добавление 4 Автомат: послойный обход, очередь ссылок 4 Вручную: без гарантий, перепроверка через некоторое время, формы запрещаются 4 Рунет / «нерунет» 4 Зеркала, 1 страницу, доработанные сайты, редиректы 4 Образ сайта: robots.txt, типичные ошибки 4 meta names=robots, noindex
Переиндексация 4 Автоматом: зависит от разных факторов 4 Полуручная: переезды и прочие срочные действия: delurl, «подсветка», robots.txt 4 Смена описаний: description, описания в каталогах 4 Зеркала: автоматическое удаление, ручной запрет 4 Платная: КОНТРА: «это нечестно и может исказить результаты», «не должны платить, чтобы вас отранжировали» 4 Платная: ПРО: декларируется отсутствие преимуществ в ранжировании, улучшения для обоих сторон: свежесть, скорость, динамические сайты, качество
Обратная связь 4 Сообщения об ошибках addurl 4 Расширенный поиск и Язык Запросов 4 Статистика переходов 4 Не придавайте значение 1-му слову
Динамические сайты 4 Пертинентный URL 4 Осмысленное содержание и без средств идентификации пользователя 4 Уникальность 4 ПЛОХО: экспоненциальный мусор 4 ПЛОХО: повторы: дубликаты и почти дубликаты 4 ПЛОХО: «случайные» URL
Советы 4 Наличие не-javascript-новых ссылок (см. напр 4 URL: namespace, мнемоника, пертинентность 4 Орфография, не использовать plaintext 4 404, а не 200, last modified, if modified since, перенаправление 4 Кодировки, зеркала, эвристики по выбору лучшего имени
Поисковый спам 4 Малый процент спаммеров 4 Попытка обмана: "attempt to deceive" 4 Явно: Клоакинг: выдача полностью отличного содержания противоречит нашем идеалу, даже если с добрыми намерениями 4 Явно: цвет букв, малый шрифт, неотрисовываемый текст
Как стать первым 4 Вырастить сайт: популярность до позиции в искалках, а не наоборот: телега впереди лошади 4 Начинать надо не с поисковика: продукт, сообщество, сервис: в противном случае нам очень трудно судить 4 Дружить со всеми, давать интересную информацию, не рисковать 4 Гарантию новому сайту дает реклама