HTMLデータ形式

文字種

属性値は、大文字小文字を区別のするものとしないものがあり、基本的に次の5つに分類されます。

CS
大文字と小文字を区別し「a」「A」は違う文字であると解釈します。
CI
大文字と小文字を区別せず、「a」「A」は同じ文字であると解釈します。
CN
数字または文書文字集合に含まれる1文字など、文字種の変化がない値です。
CA
要素あるいは属性の定義自体に大文字と小文字の区別が定義されている値です。
CT
大文字と小文字の区別はデータ形式の定義で決まります。
たとえば、スクリプトの時は大文字と小文字が区別されるかは言語に依存します。

SGML基本形式

SGMLで予約されているデータ形式です。

#PCDATA(Parsed Character DATA)
SGML的に解釈される文字データです。
< や & などの文字はタグの区切りなどとして扱われ、文字参照は文字に置きかえられます。
CDATA(Character DATA)
SGML的に解釈されない文字データです。
< や & などの文字はそのまま扱われ、文字参照も文字に置きかえられません。
ただし、属性値として使われる場合は文字参照が有効になります。
ID
アルファベット(A〜Z, a〜z)で始まり、アルファベット、数字(0 〜 9)、「 - 」「 _ 」「 : 」「 . 」のみで構成され文字列です。大文字と小文字の区別があります。
XHTMLの場合は大文字小文字にかかわらず、xml で始まる名前は使用できない。
NAME
アルファベット(A〜Z, a〜z)で始まり、アルファベット、数字(0 〜 9)、「 - 」「 _ 」「 : 」「 . 」のみで構成され文字列です。
NMTOKEN
アルファベット(A〜Z a〜z)、数字( 0 〜 9 )、ハイフン( - )、 アンダースコア( _ )、コロン( : )、ピリオド( . )のみで構成された文字列です。
XHTMLの場合は大文字小文字にかかわらず、xml で始まる名前は使用できない。
NMTOKENS
NMTOKEN の複数形です。空白文字で区切って列記された複数の NMTOKEN を書くことができます。
IDREF
1つの ID を参照。つまり、別の場所で記述された ID の値をそのまま書くということ。
IDREFS
IDREF の複数形です。空白文字で区切って列記された複数の ID を書くことができます。
NUMBER
半角数字( 0 - 9 )を含む最低1桁以上の数値。

テキスト(Text strings)

「人間が読んで解る」ような普通の文字列です。

URI、URIs

URI を示します。URI とは RFC2396 で定義されているもので、URL はこれに含まれています。
URI は大文字・小文字を区別します。
大文字小文字が区別されない URI も存在しますが、安全性の面から URI は常に大文字小文字を区別すると覚えたほうがいいです。

URIs は、URI をスペースで区切って複数指定することができます。

座標

CDATA型の値です。
Length値をコンマで区切って列挙します。
200,10,230,20

URIs は、URI をスペースで区切って複数指定することができます。

色(Colors)

色の値は16進数でR値G値B値を指定する形式(「#」記号と6桁の16進数)で指定するか、色名で指定します。
大文字・小文字の区別はありません。

  • Black (#000000)
  • Silver (#C0C0C0)
  • Gray (#808080)
  • White (#FFFFFF)
  • Maroon (#800000)
  • Red (#FF0000)
  • Purple (#800080)
  • Fuchsia (#FF00FF)
  • Green (#008000)
  • Lime (#00FF00)
  • Olive (#808000)
  • Yellow (#FFFF00)
  • Navy (#000080)
  • Blue (#0000FF)
  • Teal (#008080)
  • Aqua (#00FFFF)

長さ(Length)

HTMLには属性値として3つの長さの形式があります。
なお、長さの形式には大文字・小文字の区別はありません。

ピクセル(Pixels)
整数値のピクセル数で指定します。
長さ(Length)
ピクセル数または割合(パーセント)で指定します。
複合長(MultiLength )
複数の長さを一度に指定できます。ピクセルとパーセントの他に、相対比率を指定することが可能です。相対比率は整数値の右に「 * 」を付して表します。
これらが一度に指定された場合は、まずピクセルとパーセントで指定された分が確保され、残りの範囲を相対比率の割合で分配します。

コンテントタイプ/MIMEタイプ (Content Type)

リソースのデータ形式を RFC2045 と RFC2046 で定義された値で指定します。大文字小文字を区別しません。

text/plain
プレーン(ノーマル)テキスト形式
text/html
HTML(Hyper Text Markup Language)形式
text/css
カスケードスタイルシート(CSS)形式
text/xml
XML(eXtensible Markup Language)形式
text/javascript
JavaScript形式
text/vbscript
VBScript形式
image/png
PNGイメージ形式
image/gif
GIFイメージ形式
video/mpeg
MPEG動画形式

これ以外のMIMEタイプはftp://ftp.isi.edu/in-notes/iana/assignments/media-types/を参照してください。

言語コード(Language Codes)

言語の種類を RFC1766 で定義されたコードで指定します。なお言語コードは大文字小文字を区別しません。

ja
日本語
en
英語
fr
フランス語
de
ドイツ語
it
イタリア語
nl
オランダ語
es
スペイン語
pt
ポルトガル語
ar
アラビア語
he
ヘブライ語
ru
ロシア語
zh
中国語

文字コード(Character encodings、文字符号化方法)

IANAに登録されている文字コードセットを指定します。
大文字・小文字の区別はありません。

iso-2022-jp
一般的なJIS。
Shift_JIS
シフトJIS。
EUC-JP
EUC。UNIX系で多く使用されています。

1文字(Character)

ISO10646で定義されている文字の中から1文字を指定します。
&amp;のように文字参照を使うこともできます。

日時(Dates and times)

日付と時間を表します。書式は以下のとおりです。
YYYY-MM-DDThh:mm:ssTZD

  • YYYY = 年(4桁)
  • MM = 月(2桁)
  • DD = 日(2桁)
  • hh = 時(2桁/00〜23)
  • mm = 分(2桁/00〜59)
  • ss = 秒(2桁/00〜59)
  • TZD = タイムゾーン(Z, +hh:mm, -hh:mm)
    • Z = UTC (協定標準時)
    • +hh:mm = 現地時間(UTCより先)
    • -hh:mm = 現地時間(UTCより後)

リンク形式(Link types)

指定先の文書は当該文書に対してどのような役割を果たすのかをあらわします。
rel 属性や rev 属性で指定します。

  • rel 属性…今表示している文書にとって指定先の文書はどんな関係になるか
  • rev 属性…今表示している文章は指定先の文書にとってどんな関係になるか。
Alternate
当該文書の代替文書であることを示します。
lang属性と併用した場合は当該文書の翻訳版(英語版やフランス語版など)を示し、media属性との併用は別メディア版(印刷用のバージョンなど)を示します。
Stylesheet
外部スタイルシートであることを示します。
Start
文章群の中の最初の文書であることを示します。
Next
続きものとしてページ分割されている文書の次の文書であることを示します。
Prev
続きものとしてページ分割されている文書の前の文書であることを示します。
Contents
目次ページであることをしめします。
Index
索引である文書を示します。
Glossary
用語集である文書を示します。
Copyright
文書の著作権表示を示します。
Chapter
文書群の中の章部分である文書を示します。
Section
文書群の中の節部分である文書を示します。
SubSection
文書群の中の小節部分である文書を示します。
Appendix
文書群の中の附記ページである文書を示します。
Help
ヘルプのページを示します。
Bookmark
ブックマークを示します。

出力メディア(Media descriptors)

screen
コンピュータのスクリーン
tty
端末、ポータブル機器などの表示能力に制限のある携帯機器
tv
低解像度で、色やスクロール能力に制限があるテレビ型機
projection
プロジェクター
handheld
画面が小さくモノクロ、ビットマップ画像、帯域幅に制限があるモバイル機器
print
印刷プレビューモードでのスクリーン出力
braille
点字ディスプレイ
aural
自動音声読み上げソフト(スピーチ・シンセサイザ)
all
すべての出力に適合する。

スクリプト

スクリプト言語を記します。スクリプト言語はSCRIPT要素の内容である場合とイントリンシック・イベント属性(onClick、onMouseUpなど)の値である場合とがあります。 スクリプトデータが大文字小文字を区別するかどうかはスクリプト言語に依存します。

XHTMLではスクリプト内に、< や & などの文字を使用することはできません。 どうしても使用したいときは CDATA マーク区間内に記述するか外部スクリプトを使用してください。

スクリプト言語名

スクリプト言語名を記します。

JavaScript
JavaScript
JScript
JavaScript
VBScript
VisualBasicScript
VBS
VisualBasicScript

スタイルシート

スタイルシート言語を記します。STYLE要素の内容である場合とstyle属性の値である場合とがあります。 大文字小文字を区別するかどうかはスタイルシート言語に依存します。

XHTMLではスタイルシート内に、< や & などの文字を使用することはできません。 どうしても使用したいときは CDATA マーク区間内に記述するか外部スタイルシートを使用してください。

フレーム・ターゲット名

予約済み名称を除き、目標フレーム名はアルファベットで始めなければいけません。

_blank

新しい名前の無いウインドウに表示します。

_self

元のドキュメントと同じフレームに表示します。

_parent

現在のフレームの親フレームに表示します。
フレーム定義文書が入れ子になっている場合は直接の親であるフレーム分割だけを解除します。
親フレームが無い場合には、「_self」と同様になります。

_top

すでにあるフレームをすべて解除して、ウインドウいっぱいに表示します。
他人のサイトへ飛ぶときやフレーム分割から完全に抜けたいときに使用します。
親フレームが無い場合には、「_self」と同様になります。

文書内容においての役割

banner
Web ページの上部に現れる広告を示します。Web サイトや企業のロゴ、またはその他の重要な宣伝要素が含まれます。
contentinfo
文章の内容に関する情報を表します。たとえば脚注や著作権の情報、プライバシーに関する説明へのリンクなどが属します。
definition
関連する要素の内容は、用語や概念などの定義を表します。内容の中に dfn 要素 ([XHTMLMOD] にて定義) が存在する場合、その要素は定義される用語を表します。
main
文書内の主要な内容である部分を定義します。
navigation
文書内での誘導や、関連する文書へのリンクをまとめたものを表すのに適します。
note
文書内の主要な内容を表すリソースに対して、その挿入句や補助的な情報などを表します。
search
Web 文書にある検索セクションを表します。通常は Web サイト内の検索や、または一般的な検索サービスに使われる検索フォームを指します。
secondary
文書内にある独自のセクションを表します。ポータルサイトを例に取れば、時計や天気、株価情報などの部分が当てはまります。
seealso
ページの主要な内容に関連する内容を表します。
Copyright © 2nd All Rights Reserved.