リッチスニペット(構造化データ)の表示方法(後編)

公開日:2010/5/31
執筆者:世良 裕之

 前回は、最近のGoogle,Yahooにおける検索結果のリッチ表示化についての動きにについて書きました。

リッチスニペット(構造化データ)の表示方法(前編)
【前編まとめ】
構造化データを指定するための対応したマークアップ規格
Google:microdata・microformats・RDFa
Yahoo!JAPAN: microformats・RDFa
表示させるための条件
Google:専用フォームから申請。ただし、表示されるかどうかはGoogle 独自のアルゴリズムによって決定。
Yahoo!JAPAN:「Yahoo!検索プラグイン」を準備し、検索ユーザーに機能を有効にしてもらう必要がある。

 今回は、サイト運営者がこれらの検索エンジンの変化に対応した、サイトを構造化するための記述について簡単に説明します。

ウェブページを構造化するということ

 まず、ウェブページを構造化するということはどのようなことでしょうか。
通常のHTMLやxhtml+cssで書かれたコンテンツは、検索エンジンやブラウザに文書構造を伝えることは可能ですが、文章中の単語の意味や詳細な意味を伝えることはできません。形態素解析を行い、文脈からある程度の意味をとらえるなど、技術によってウェブページを解析し、意味付けを行うことも可能ですが、自然言語を検索エンジンやブラウザに理解させるには限界があります。
 そこで、予めウェブページに「意味情報(メタデータ)」を付与することで、検索エンジン等の機械が処理しやすい書式で表現しておこうということです。

 例えば、ウェブページ内に以下のような記述があったとしましょう。

<div>私の名前は世良裕之です。</div>

この記述を、RDFaという規格によって構造化したマークアップは以下のようになります。

<div xmlns:v=”http://rdf.data-vocabulary.org/#” typeof=”v:Person”>
私の名前は<span property=”v:name”>世良裕之</span>です。
</div>

 簡単に解説すると、この文章の情報タイプは人物であり(typeof=”v:Person”)、「世良裕之」という名前( property=”v:name”)が書かれていることを、検索エンジンに伝えることができるわけです。

「ウェブページを構造化する」とは、「情報を機械が処理しやすい形式にする」ということなのです。

続いて、これらの構造化データを指定するためのの3つの規格 microformats・RDFa・microdata についてまとめます。

microformats

 microformatsの開発はW3Cではなく、一般のクリエイターや開発者などによるオープンな場で進められています。標準化に向けては任意団体“microformats.org”が仕様、ドラフト、デザインなどを公開し、普及促進の活動を行なっています。

 通常 は、HTML タグ(主に <span> や <div>)内にclass 属性を使うことで、「意味情報(メタデータ)」を付与します。
例えば、先ほどの「私の名前は世良裕之です。」を、microformatsを使って記述すると以下のようになります。

<div class=”vcard”>
私の名前は<span class=”fn”>世良裕之</span>です。
</div>

 class=”vcard” 属性を設定することで、この文章は人物について記述していますよということを表し、「世良裕之」には名前のプロパティを示す class 属性 fn を割り当てています。
人物などのプロフィールに使われるプロパティには、名前の “fn” の他に、肩書をあらわす “title” や、住所をあらわす “adr” などいろいろなものがあります。
Googleが認識する人物に関するプロパティは「人物 – ウェブマスター ツール ヘルプ」を参考にしてください。

 また、人物以外にも、製品やサービスなどのレビューを表現するためのmicroformatsは class=”hreview” を、カレンダーやイベント情報を表現するためのmicroformatsは class=”vevent” によって記述することができます。
 Googleが認識する製品やサービスなどのレビューに関するプロパティは「レビュー – ウェブマスター ツール ヘルプ」、Googleが認識するカレンダーやイベント情報に関するプロパティは「イベント – ウェブマスター ツール ヘルプ
を参考にしてください。

ちなみに昨年、リンクジュースの受け渡しで話題になった rel=”nofollow” はmicroformatsのひとつで、その仕様は rel-nofollow – Microformats にあります。

microformatsに関する参考資料

RDFa

 セマンティック・ウェブの一環として、Web関連技術の標準化団体であるWorld Wide Web Consortium(W3C)が XHTML に対する仕様として策定を進め2008年10月に勧告として公開しました。
 上述の例のように、XHTMLのタグに追加する形でメタデータをWebページに埋め込むことで、構造化することができますが、より複雑な構造化をおこなうには、記述しなければならない要素や属性が増えてしまいます。また、RDFの基本や属性の使い方を学ぶ必要もあり、「セマンティック・ウェブってなに?」という人には少し難しいかもしれません。
 リッチスニペット向けのGoogleの解説「RDFa について – ウェブマスター ツール ヘルプ」を参考にしてみてください。

  また、W3Cによって、「XHTML 2」の策定を打ち切り、別のHTML次期仕様である「HTML 5」の標準化に注力すると発表されましたので、今後のXHTMLは、HTML5 に集約されて定義されていきます。
メタ情報をXHTMLで表現する仕様であるRDFaのHTML5での利用については、HTML WGよりHTML+RDFaとして公開されています。

microdata

 WHATWG および W3C が HTML4 に代わる次世代の HTML として策定を進めている「HTML5」の仕様の一部として策定が開始され、現在はW3CのHTML5仕様からは独立した仕様となっています。
新しいデータを指定する”temscope”、データの種類を指定する”itemtype”、データのプロパティを指定する”itemprop” などの HTML 属性を追加することでマークアップが可能となります。

「私の名前は世良裕之です。」を、Microdataを使って記述すると以下のようになります。

<div itemscope itemtype=”http://data-vocabulary.org/Person”>
私の名前は<span itemprop=”name”>世良裕之</span>です。
</div>

 リッチスニペット向けのGoogleの解説「microdata について – ウェブマスター ツール ヘルプ」を参考にしてみてください。

どの対応フォーマットを利用すべきか?

 本記事では、検索結果のリッチ表示化のためのWebの構造化について、セマンティック・ウェブについて全く理解の無い人向けの基本的な解説を行いましたが、より複雑な構造化をおこなうには、もう少し詳しく学習する必要があります。
class 属性を使うことで簡単にメタデータを付与できるmicroformatsは、セマンティック・ウェブに詳しくなく、ちょっとした検索結果のリッチ表示ということでしたら、一番簡単ではないでしょうか。
時代の流れとしては、Microformat → RDFa → Microdata のように進んでいますので、将来的には Microdata ということでしょうが、対応していないYahoo!JAPANでは RDFa を推奨しているようです。
自分も、まだそれぞれのフォーマットでGoogleやYahoo!で認識され、どのように表示されるかなどの比較を行っていませんので、いろいろと試したのちに再度記事にしたいと思います。
最後にGoogleとYahoo! JAPANによる関係記事をまとめておきます。

Google:

Yahoo!JAPAN:

この記事が良かったと思ったらSphinn Japanへ投稿/投票お願いします。

この記事へのコメント

コメントはまだありません »
Leave a comment