Использование метаданных (HTTP-EQUIV, NAME, REL, REV, BASE) при создании HTML документов

ОГЛАВЛЕНИЕ

Описание и формат мета-тегов HTML. Использование метаданных (HTTP-EQUIV, NAME, REL, REV, BASE) при создании HTML документов.

META-теги имеют два возможных атрибута

- <META HTTP-EQUIV="имя" CONTENT="содержимое">
- <META NAME="имя" CONTENT="содержимое">

META-теги должны находиться в заголовке HTML-документа между <HEAD> и </HEAD> (особенно это важно для документов, использующих фреймы).

 Атрибут HTTP-EQUIV

META-теги с атрибутом HTTP-EQUIV эквивалентны HTTP-заголовкам. Обычно они управляют действиями броузеров и могут быть использованы для совершенствования информации, выдаваемой обычными заголовками. Тэги такой формы могут дать такой же эффект, что и HTTP-заголовки, и на некоторых серверах автоматически могут быть переведены в настоящие HTTP-заголовки. HTTP-заголовки описываются в RFC1945 (HTTP/1.0) и RFC2068 (HTTP/1.1).

HTTP-заголовки могут быть сгенерированы с помощью CGI-скриптов. Это позволяют сделать серверы Apache и CERN. В других серверах могут использоваться другие механизмы генерирования заголовков. Некоторые генерируемые сервером поля заголовков не могут быть подменены значениями из META-тегов (в частности Date), другие подменяются только при ненормальном статус-коде (<>200). Когда заголовок не понятен, то значение HTTP-заголовка превалирует над значением META-тегов.

Expires

 

Источники: HTTP/1.1 (RFC2068)

Дата устаревания. Управление кэшированием в HTTP/1.0. В Netscape Navigator это выглядит следующим образом: если указанная дата прошла, то очередной запрос этого html-документа вызывает повторный сетевой запрос, а не подгрузку html-документа из кэша. Дата со значением "0" интерпретируется как "сейчас". Такое значение заставляет броузер каждый раз при запросе проверять - изменялся ли этот html-документ. Это, кстати относится и к прокси-агентам. Поисковые роботы могут либо совсем не индексировать такой документ, либо постоянно "обнюхивать" его.

Дата должна быть задана в формате, описываемом в RFC850,

<META HTTP-EQUIV="expires" CONTENT="Wed, 26 Feb 1997 08:21:57 GMT">

что эквивалентно HTTP-заголовку

Expires: Wed, 26 Feb 1997 08:21:57 GMT

Pragma

Контроль кэширования для HTTP/1.0. Значением должно быть "no-cache". Очень полезный контейнер, я всегда использую его при выдаче результатов работы любого скрипта.

Content-Type

Источники: HTTP/1.0 (RFC1045)

Указание типа html-документа. Может быть расширено указанием кодировки страницы (charset). Если же указывать charset в содержании META-тега, то Netscape Navigator выводит такую html-страницу уже в заданном charset. Однако будьте аккуратны, если текст страницы в кодировке Windows, а значение charset=KOI8-r, то никакими силами пользователь не сможет поменять encoding, чтобы увидеть нормальные слова!

<META HTTP-EQUIV="Content-type" CONTENT="text/html; charset=ISO-2022-JP">

Content-language

Источники: HTTP/1.0

Указание языка документа. Может использоваться поисковыми машинами при индексировании html-страниц. Комбинация поля Accept-Language (посылаемого броузером) с содержимым Content-language может быть условием выбора сервером того или иного языка.

<META HTTP-EQUIV="Content-language" CONTENT="en-GB">

что эквивалентно HTTP-заголовку

В недавно вышедшей спецификации HTML 4.0 появилась другая возможность явного указания языка - <html lang="en">

Content-language: en-GB

Язык описывается парой значений (язык-диалект). В примере: Английский-Великобритания

Refresh

Источники: Netscape

Определение задержки в секундах, после которой броузер автоматически обновляет html-документ. Дополнительная возможность - автоматическая загрузка другого документа.

<META HTTP-EQUIV="Refresh" Content="3, URL=http://www.name.com/page.html">

что эквивалентно HTTP-заголовку

Refresh: 3; URL=http://www.name.com/page.html

В Netscape Navigator это дает такой же эффект, что и нажатие на кнопку Reload.

Window-target

Источники: Jahn Rentmeister

Определяет окно текущей страницы; может быть использован для прекращения появления новых окон броузера при применении фреймовых структур. Действует для многих (но не для всех) броузеров.

<META HTTP-EQUIV="Window-target" CONTENT="_top">

что эквивалентно HTTP-заголовку

Window-target: _top

Ext-cache

Источники: Netscape

Определяет имя альтернативного кэша для Netscape Navigator

<META HTTP-EQUIV="Ext-cache" CONTENT="name=/some/path/index.db; istructions=User Instructions">

PICS-Label

Platform-Independant Content rating Scheme. Обычно используется для определения рейтинга "взрослости" (adult) содержания (sex,violence, ...):-)) однако это довольно гибкая схема и может использоваться для других целей.

Cache-Control

Источники: HTTP/1.1

Определяет действия кэша по отношению к данному html-документу. Возможные значения:

  • Public - документ кэшируется в доступных для всех кэшах
  • Private - только в частном кэше
  • no-cache - не может быть кэширован
  • no-store - может быть кэширован, но не сохраняется

Vary

Источники: HTTP/1.1

Определяет доступные альтернативы для указанных в CONTENT полей HTTP-заголовка.

<META HTTP-EQUIV="Vary" CONTENT="Content-language">

что эквивалентно HTTP-заголовку

Vary: Content-language

Lotus

Lotus-редакторы генерируют свои собственные поля Bulletin-Date и Bulletin-Text атрибуты. Bulletin-Text содержит описание документа


Атрибут NAME

META-теги с атрибутом NAME используются в случаях, когда поля не соотносятся с HTTP-заголовками. Иногда ясность теряется: некоторые агенты могут интерпретировать тег "Keywords" описанный как NAME, другие - как HTTP-EQUIV

Robots

Источники: Spidering

Управление индексацией страницы для поисковых роботов.

<META NAME="Robots" CONTENT="NOINDEX,FOLLOW">

Возможные значения:

  • ALL
  • NONE
  • INDEX
  • NOINDEX
  • FOLLOW
  • NOFOLLOW

Description

Источники: Spidering, Altavista, Infoseek

Краткая аннотация содержания html-документа. Используется поисковыми системами для описания html-документа. Этот тег сильно полезен в случаях, когда в html-документе мало текста, когда это управляющий фреймами файл (frameset) или в начале документа используются скрипты. Длина текста до 100 символов.

<META NAME="Description" CONTENT="Документ содержит словарь META-тегов">

Keywords

Источники: Altavista, Infoseek

Используется поисковыми системами для индексирования html-документа. Обычно здесь указываются синонимы к словам в заголовке (title) или альтернативный заголовок. Длина списка до 1000 символов. Не допускается использование одного и того же ключевого слова более 7 раз, поисковые системы просто будут игнорировать это слово.

<META NAME="Keywords" CONTENT="теги,тэги,метаданные,список">

Document-state

Источники: Spidering

Управление индексацией html-страницы для поисковых роботов. Определяет частоту индексации - или один раз индексировать, или реиндексировать документ регулярно.

<META NAME="Document-state" CONTENT="Static">

Возможные значения:

  • Static
  • Dynamic

URL

Источники: Spidering

Управление индексацией html-страницы для поисковых роботов. Определяет частоту индексации - или один раз индексировать, или реиндексировать документ регулярно.

<META NAME="URL" CONTENT="absolute_url">

Author

Источники: HTML редакторы

Обычно имя автора, формат произвольный.

Generator

Источники: HTML редакторы

Обычно название и версия редактора, с помощью которого создана эта страница. Может быть использована для определения доли рынка, занимаемого тем или иным продуктом.

Copyright

Источники: HTML редакторы

Обычно описание авторских прав на html-документ в произвольном формате

Distribution

Возможные значения

  • global
  • local
  • iu (internal use)

Resource-type

Текущее состояние данного файла. Важен для поисковых систем, т.е. если его значение document, то поисковая система приступает к его индексированию.

Прочие

  • Classification
  • Formatter
  • Site-languages
  • Version
  • Template
  • Operator
  • Rating
  • Creation
  • Host
  • Document
  • Subject
  • Build
  • Random text (<META NAME="Joe Smith">)

Помимо перечисленных более или менее стандартных тегов существует еще множество других специализированных, например, для конкретной поисковой машины тегов.


Тэг LINK

Тэг LINK предоставляет html-документу независимый от среды метод определения отношения данного html-документа к другим документам и ресурсам Сети. Используется с аргументами REL и REV. С помощью тега LINK можно:

  • создавать в html-документе специальные навигационные кнопки или меню
  • управлять процессом отображения набора HTML файлов в печатные документы
  • привязывать такие ассоциированные ресурсы, как таблицы стилей и скрипты
  • предоставлять альтернативные формы для данного документа

<LINK rel=help xhref="http://www.name.com/help.html">

где http://www.name.com/help.html - страница помощи по данному документу.

Атрибуты REL и REV могут также использоваться с тегом A. Тэги LINK могут использоваться только в заголовке документа (head)

Атрибут REL

HTML 3.2 REL-теги

top, contents, index, glossary, copyright, next, previous, search

Некоторые из рекомендованных типов взаимосвязей:

rel=top
Данная связь указывает на вершину в некой иерархической структуре, например на первую, либо титульную страницу в неком наборе документов.
rel=contents
Данная связь указывает на некий файл, где приводится оглавление к данному документу.
rel=index
Данная связь указывает на другой html-документ, который можно использовать в целях индексного поиска по текущему документу.
rel=glossary
Данная связь указывает на некий html-документ, где содержится глоссарий терминов, относящихся к текущему документу.
rel=copyright
Данная связь ссылается на текст, где указаны авторские права на данный документ.
rel=next
Данная связь указывает на следующий html-документ в неком заранее предопределенном маршруте просмотра. Например, она может использоваться для упреждающей автоматической загрузки браузером следующей страницы.
rel=previous
Данная связь ссылается на предыдущий документ в неком предопределенном маршруте просмотра.
rel=help
Данная связь указывает на html-документ, предлагающий некую помощь, например это может быть текст, дающий более развернутое описание и предлагающий ссылки на другие документы по этой теме. Назначение этой связи - оказание помощи тем читателям, кто потерял свой путь в Web.
rel=search
Данная ссылка ведет к поисковой странице, контролирующей некий набор страниц, связанных общей темой.
Многие системы изобретают свои дополнительные значения аргументов REL и REV
  • Тэг Schema

    Этот тег содержит URL документа-шаблона. Действие всех метаданных из документа-шаблона будут распространены на документ с тегом Schema (так работает Dublin Core).

    <META NAME="VW96.objecttype" CONTENT="Dictionary">

    <LINK REL=SCHEMA.VW96 xhref="http://vancouver-webpages.com/VWbot/VW96-schema.html">

    ViewCall REL-теги

    home, bookmark, tickertape, vmail, icon, prefetch, keyn, fastxx

    AOLpress REL-теги

    AOLpress использует несколько дополнительных, по сравнению с HTML 3.2, тегов

    Home, ToC, Index, Glossary, Copyright, Up, Next, Previous, Help, Bookmark, First, Last

Атрибут REV

Используется в конструкции LINK для индикации обратного соотношения html-документов.

<LINK rev=help xhref="http://www.name.com/index.html">

где текущая страница является страницей помощи для документа http://www.name.com/index.html

Использование <LINK rev=made xhref="mailto:document-owner"> в случае использования Lynx вызовет автоматическую отсылку почты по адресу document-owner.

Тэг BASE

Этот тег определяет для данного html-документа базовый адрес URL, который затем будет использоваться для переопределения относительных адресов. Тег BASE полезен, если документ может быть скопирован в другое место или запрошен по другому пути с использованием символической ссылки, или редиректа с imagemap, и т.д.

 А. Аликберов, Адрес электронной почты защищен от спам-ботов. Для просмотра адреса в вашем браузере должен быть включен Javascript.