HTML文書の要素の内容や属性の値などで使われるデータ形式について
このページの内容
文字種
属性値は、大文字小文字を区別のするものとしないものがあり、基本的に次の5つに分類されます。
- CS
- 大文字と小文字を区別し「a」「A」は違う文字であると解釈します。
- CI
- 大文字と小文字を区別せず、「a」「A」は同じ文字であると解釈します。
- CN
- 数字または文書文字集合に含まれる1文字など、文字種の変化がない値です。
- CA
- 要素あるいは属性の定義自体に大文字と小文字の区別が定義されている値です。
- CT
- 大文字と小文字の区別はデータ形式の定義で決まります。
たとえば、スクリプトの時は大文字と小文字が区別されるかは言語に依存します。
SGML基本形式
SGMLで予約されているデータ形式です。
- #PCDATA(Parsed Character DATA)
- SGML的に解釈される文字データです。
< や & などの文字はタグの区切りなどとして扱われ、文字参照は文字に置きかえられます。
- CDATA(Character DATA)
- SGML的に解釈されない文字データです。
< や & などの文字はそのまま扱われ、文字参照も文字に置きかえられません。
ただし、属性値として使われる場合は文字参照が有効になります。
- ID
- アルファベット(A〜Z, a〜z)で始まり、アルファベット、数字(0 〜 9)、「 - 」「 _ 」「 : 」「 . 」のみで構成され文字列です。大文字と小文字の区別があります。
XHTMLの場合は大文字小文字にかかわらず、xml で始まる名前は使用できない。
- NAME
- アルファベット(A〜Z, a〜z)で始まり、アルファベット、数字(0 〜 9)、「 - 」「 _ 」「 : 」「 . 」のみで構成され文字列です。
- NMTOKEN
- アルファベット(A〜Z a〜z)、数字( 0 〜 9 )、ハイフン( - )、 アンダースコア( _ )、コロン( : )、ピリオド( . )のみで構成された文字列です。
XHTMLの場合は大文字小文字にかかわらず、xml で始まる名前は使用できない。
- NMTOKENS
- NMTOKEN の複数形です。空白文字で区切って列記された複数の NMTOKEN を書くことができます。
- IDREF
- 1つの ID を参照。つまり、別の場所で記述された ID の値をそのまま書くということ。
- IDREFS
- IDREF の複数形です。空白文字で区切って列記された複数の ID を書くことができます。
- NUMBER
- 半角数字( 0 - 9 )を含む最低1桁以上の数値。
URI、URIs
URI を示します。URI とは RFC2396 で定義されているもので、URL はこれに含まれています。
URI は大文字・小文字を区別します。
大文字小文字が区別されない URI も存在しますが、安全性の面から URI は常に大文字小文字を区別すると覚えたほうがいいです。
URIs は、URI をスペースで区切って複数指定することができます。
座標
CDATA型の値です。
Length値をコンマで区切って列挙します。
200,10,230,20
URIs は、URI をスペースで区切って複数指定することができます。
色(Colors)
色の値は16進数でR値G値B値を指定する形式(「#」記号と6桁の16進数)で指定するか、色名で指定します。
大文字・小文字の区別はありません。
- Black (#000000)
- Silver (#C0C0C0)
- Gray (#808080)
- White (#FFFFFF)
- Maroon (#800000)
- Red (#FF0000)
- Purple (#800080)
- Fuchsia (#FF00FF)
- Green (#008000)
- Lime (#00FF00)
- Olive (#808000)
- Yellow (#FFFF00)
- Navy (#000080)
- Blue (#0000FF)
- Teal (#008080)
- Aqua (#00FFFF)
長さ(Length)
HTMLには属性値として3つの長さの形式があります。
なお、長さの形式には大文字・小文字の区別はありません。
- ピクセル(Pixels)
- 整数値のピクセル数で指定します。
- 長さ(Length)
- ピクセル数または割合(パーセント)で指定します。
- 複合長(MultiLength )
- 複数の長さを一度に指定できます。ピクセルとパーセントの他に、相対比率を指定することが可能です。相対比率は整数値の右に「 * 」を付して表します。
これらが一度に指定された場合は、まずピクセルとパーセントで指定された分が確保され、残りの範囲を相対比率の割合で分配します。
コンテントタイプ/MIMEタイプ (Content Type)
リソースのデータ形式を RFC2045 と RFC2046 で定義された値で指定します。大文字小文字を区別しません。
- text/plain
- プレーン(ノーマル)テキスト形式
- text/html
- HTML(Hyper Text Markup Language)形式
- text/css
- カスケードスタイルシート(CSS)形式
- text/xml
- XML(eXtensible Markup Language)形式
- text/javascript
- JavaScript形式
- text/vbscript
- VBScript形式
- image/png
- PNGイメージ形式
- image/gif
- GIFイメージ形式
- video/mpeg
- MPEG動画形式
これ以外のMIMEタイプはftp://ftp.isi.edu/in-notes/iana/assignments/media-types/を参照してください。
言語コード(Language Codes)
言語の種類を RFC1766 で定義されたコードで指定します。なお言語コードは大文字小文字を区別しません。
- ja
- 日本語
- en
- 英語
- fr
- フランス語
- de
- ドイツ語
- it
- イタリア語
- nl
- オランダ語
- es
- スペイン語
- pt
- ポルトガル語
- ar
- アラビア語
- he
- ヘブライ語
- ru
- ロシア語
- zh
- 中国語
文字コード(Character encodings、文字符号化方法)
IANAに登録されている文字コードセットを指定します。
大文字・小文字の区別はありません。
- iso-2022-jp
- 一般的なJIS。
- Shift_JIS
- シフトJIS。
- EUC-JP
- EUC。UNIX系で多く使用されています。
1文字(Character)
ISO10646で定義されている文字の中から1文字を指定します。
&のように文字参照を使うこともできます。
日時(Dates and times)
日付と時間を表します。書式は以下のとおりです。
YYYY-MM-DDThh:mm:ssTZD
- YYYY = 年(4桁)
- MM = 月(2桁)
- DD = 日(2桁)
- hh = 時(2桁/00〜23)
- mm = 分(2桁/00〜59)
- ss = 秒(2桁/00〜59)
- TZD = タイムゾーン(Z, +hh:mm, -hh:mm)
- Z = UTC (協定標準時)
- +hh:mm = 現地時間(UTCより先)
- -hh:mm = 現地時間(UTCより後)
リンク形式(Link types)
指定先の文書は当該文書に対してどのような役割を果たすのかをあらわします。
rel 属性や rev 属性で指定します。
- rel 属性…今表示している文書にとって指定先の文書はどんな関係になるか
- rev 属性…今表示している文章は指定先の文書にとってどんな関係になるか。
- Alternate
- 当該文書の代替文書であることを示します。
lang属性と併用した場合は当該文書の翻訳版(英語版やフランス語版など)を示し、media属性との併用は別メディア版(印刷用のバージョンなど)を示します。
- Stylesheet
- 外部スタイルシートであることを示します。
- Start
- 文章群の中の最初の文書であることを示します。
- Next
- 続きものとしてページ分割されている文書の次の文書であることを示します。
- Prev
- 続きものとしてページ分割されている文書の前の文書であることを示します。
- Contents
- 目次ページであることをしめします。
- Index
- 索引である文書を示します。
- Glossary
- 用語集である文書を示します。
- Copyright
- 文書の著作権表示を示します。
- Chapter
- 文書群の中の章部分である文書を示します。
- Section
- 文書群の中の節部分である文書を示します。
- SubSection
- 文書群の中の小節部分である文書を示します。
- Appendix
- 文書群の中の附記ページである文書を示します。
- Help
- ヘルプのページを示します。
- Bookmark
- ブックマークを示します。
- screen
- コンピュータのスクリーン
- tty
- 端末、ポータブル機器などの表示能力に制限のある携帯機器
- tv
- 低解像度で、色やスクロール能力に制限があるテレビ型機
- projection
- プロジェクター
- handheld
- 画面が小さくモノクロ、ビットマップ画像、帯域幅に制限があるモバイル機器
- print
- 印刷プレビューモードでのスクリーン出力
- braille
- 点字ディスプレイ
- aural
- 自動音声読み上げソフト(スピーチ・シンセサイザ)
- all
- すべての出力に適合する。
スクリプト
スクリプト言語を記します。スクリプト言語はSCRIPT要素の内容である場合とイントリンシック・イベント属性(onClick、onMouseUpなど)の値である場合とがあります。
スクリプトデータが大文字小文字を区別するかどうかはスクリプト言語に依存します。
XHTMLではスクリプト内に、< や & などの文字を使用することはできません。
どうしても使用したいときは CDATA マーク区間内に記述するか外部スクリプトを使用してください。
スクリプト言語名
スクリプト言語名を記します。
- JavaScript
- JavaScript
- JScript
- JavaScript
- VBScript
- VisualBasicScript
- VBS
- VisualBasicScript
スタイルシート
スタイルシート言語を記します。STYLE要素の内容である場合とstyle属性の値である場合とがあります。
大文字小文字を区別するかどうかはスタイルシート言語に依存します。
XHTMLではスタイルシート内に、< や & などの文字を使用することはできません。
どうしても使用したいときは CDATA マーク区間内に記述するか外部スタイルシートを使用してください。
フレーム・ターゲット名
予約済み名称を除き、目標フレーム名はアルファベットで始めなければいけません。
- _blank
新しい名前の無いウインドウに表示します。
- _self
元のドキュメントと同じフレームに表示します。
- _parent
現在のフレームの親フレームに表示します。
フレーム定義文書が入れ子になっている場合は直接の親であるフレーム分割だけを解除します。
親フレームが無い場合には、「_self」と同様になります。
- _top
すでにあるフレームをすべて解除して、ウインドウいっぱいに表示します。
他人のサイトへ飛ぶときやフレーム分割から完全に抜けたいときに使用します。
親フレームが無い場合には、「_self」と同様になります。
文書内容においての役割
- banner
- Web ページの上部に現れる広告を示します。Web サイトや企業のロゴ、またはその他の重要な宣伝要素が含まれます。
- contentinfo
- 文章の内容に関する情報を表します。たとえば脚注や著作権の情報、プライバシーに関する説明へのリンクなどが属します。
- definition
- 関連する要素の内容は、用語や概念などの定義を表します。内容の中に dfn 要素 ([XHTMLMOD] にて定義) が存在する場合、その要素は定義される用語を表します。
- main
- 文書内の主要な内容である部分を定義します。
- navigation
- 文書内での誘導や、関連する文書へのリンクをまとめたものを表すのに適します。
- note
- 文書内の主要な内容を表すリソースに対して、その挿入句や補助的な情報などを表します。
- search
- Web 文書にある検索セクションを表します。通常は Web サイト内の検索や、または一般的な検索サービスに使われる検索フォームを指します。
- secondary
- 文書内にある独自のセクションを表します。ポータルサイトを例に取れば、時計や天気、株価情報などの部分が当てはまります。
- seealso
- ページの主要な内容に関連する内容を表します。