2007年3月21日
purl.org とは
RSS 関連の調査をしていると、 よく「purl.org」というドメイン名を見かける。 例えば、「RSS 1.0 specification」の リンク・アドレスは 「http://purl.org/rss/1.0/spec」となっている。 はたして、この「purl.org」は 何処のドメイン名なのか?まず、単純にブラウザーで「http://purl.org/」に行ってみる。 すると、「PURL」とは「Persistent Uniform Resource Locator」の頭文字で ウェブの世界でいうところの「リダイレクト」をサービスとして提供している、 と説明されている。 このサービスでは、例えば「RSS 1.0 specification」のアドレス 「http://purl.org/rss/1.0/spec」へブラウザーで行こうとすると、 自動的に「http://web.resource.org/rss/1.0/spec」へリダイレクトされる。 そして、この PURLサービス を提供しているのが 「OCLC(Online Computer Library Center)」 という組織である。
「OCLC(Online Computer Library Center)」 とは、 アメリカ合衆国を中心として世界各国の大学や研究機関で構成された 情報資源の共有化と図書館費用の削減を目的とした 非営利・メンバー制のライブラリーサービス機関である。 世界112の国と地域の57,000館以上の図書館がOCLCに参加している。 またOCLCは共同目録「WorldCat」サービスを提供している。
この「OCLC(Online Computer Library Center)」 について 日本語では 「紀伊國屋書店『OCLCの概要』」 で紹介されている。
【参考リンク】
- Persistent Uniform Resource Locator
- OCLC(Online Computer Library Center)
- WorldCat
- 紀伊國屋書店「OCLCの概要」
- 「purl.org、スパムサイト過多により管理不能に」
カテゴリー: Internet Service , RSS 22:42 | コメント (0) | トラックバック (0)
2007年3月20日
RSS 1.0 (RDF Site Summary) の仕様
以前のブログ 「RSS とは」 でも触れた通り、ひとことで「RSS」といっても 沢山のバージョン毎の微妙な違いは複雑怪奇と言わざるを得ない。 それらを ひとつずつ解き明かしてゆこうと思っているが、 まずは、「RSS 1.0」 別名「RDF Site Summary」と呼ばれている RSS の具体的な仕様について調査してみる。「RSS 1.0」の仕様書のオリジナルは、 「RDF Site Summary (RSS) 1.0 Specifications」 にあるが、 ありがたいことに その日本語翻訳版が、 「(財)情報処理相互運用技術協会(INTAP)」 ページ にある。 ただし、これらは、あくまでも 純粋な仕様書なので、全ての項目について 網羅的に記述されている。 「RSS 1.0」を一から勉強したいのであれば、 おなじみ「The Web KANZAKI」の 「RSS -- サイト情報の要約と公開」 に要点がまとめあるので、そちらの方が便利だ。
細かい仕様については、上記の仕様書を参照するとして、 ここでは、RSS 1.0 を記述する際の その基本的な構造を示しておく。
- <?xml version="1.0"?>
- rdf:RDF
- channel
- title
- link
- description
- items
- item
- title
- link
- description
- item
- title
- link
- description
それから上記1行目は 実際には
<?xml version="1.0" encoding="utf-8"?>のように encoding を指定するのが一般的のようだが、 通常「UTF-8」を指定する。 しかし、必ずしも「UTF-8」とは限らない。 例えば、私のこのブログ・サイトでは、 「EUC-JP」となっている。 これは、Movable Type では、 RSSページの作成にも サイト本体の Charset をそのまま利用しているためだ。
【参考リンク】
- RDF Site Summary (RSS) 1.0 Specifications
- 日本語版「RDF Site Summary (RSS) 1.0 Specifications」
- The Web KANZAKI「RSS -- サイト情報の要約と公開」
カテゴリー: RSS 22:03 | コメント (0) | トラックバック (0)
2007年3月19日
Dublin Core(ダブリン・コア) とは
今回のブログも また RSS 関連だが、 「Dublin Core(ダブリン・コア)」について調査してみよう。例によって、ウィキペディアによると Dublin Core(ダブリン・コア) とは
Dublin Core Metadata Initiative で提唱している、 メタデータ記述に使う語彙の通称。 略称DC。 その語彙が共通の認識となるように、 慎重な設計がされた基本語彙セット および それらをサポートするメタデータ語彙が公開されている。とある。 ここで言う、 「DCMI (Dublin Core Metadata Initiative)」とは、 ウェブ上のリソースを記述する共通のメタデータ標準などを開発、促進する組織 となっている。 また、Dublin Core(ダブリン・コア)の名前は、 1995年3月に米国オハイオ州のダブリン(Dublin)で開催された OCLC/NCSA Metadata Workshopでの討議結果を "Dublin Core metadata"と呼んだところに由来しているそうだ。
「Dublin Core(ダブリン・コア)」には、15の基本要素タイプ(語彙)があり、 これを「Dublin Core Metadata Element Set」といい、「DCMES」と表記する。 この DCMES についての解説のオリジナルは 「Dublin Core Metadata Element Set, Version 1.1」 ページにあり、 日本語での解説は、KANZAKI.com の 「Dublin Core: メタデータを記述するボキャブラリ」 ページに詳しく説明されている。 このDCMES は RSS (RDF Site Summary)の公式モジュールとして採用されているらしい。
「Dublin Core Metadata Element Set」の15の要素は次のとおり。
- Title : タイトル
- Creator : 制作者
- Subject : テーマ
- Description : 詳細
- Publisher : 提供者
- Contributor : 協力者
- Date : 日付
- Type : タイプ
- Format : フォーマット
- Identifier : 識別子
- Source : ソース
- Language : 言語
- Relation : 関連
- Coverage : 範囲
- Rights : 権利
【参考リンク】
カテゴリー: RSS 22:48 | コメント (0) | トラックバック (0)
2007年3月18日
OWL とは
わからない時は、例のごとく ウィキペディアで調査。 すると 「OWL」 のページでは
OWLは「Web Ontology Language」の略語であり、 インターネット上に存在するオントロジーを用いて データ交換を行うためのマークアップ言語。 OWLはRDFの語彙拡張であり、 DAML+OILに由来している。 OWLはRDFなどの他の構成要素とともに セマンティック・ウェブのツール群として位置づけられる。とある。 また、 KANZAKI.com の 「ウェブ・オントロジー言語OWL」 には、
RDFモデルとRDFスキーマによるリソースの叙述という基本ツールを使って、 ウェブに存在するものごとの分類体系(クラス)やその関係、 さらにはそれを推論していくためのルールを定義する オントロジー言語OWLが2004年2月にW3C勧告となりました。と説明されている。
上記の説明では どちらにも「オントロジー」という言葉が用いられている。 では、「オントロジー(ontology)」とは。 これまた、ウィキペディアで調査で調査してみると、 もともとは、哲学用語で存在論のことを指すらしいが、 コンピュータの世界では、
ウェブをはじめとした文書検索において、従来の方法では単語単位での一致か、 よくても類義語を含む文書を検索するのが限度であった。 ここにオントロジーの概念を導入する。 それぞれの文書の内容を説明する意味情報(メタデータ)を各文書に付加し、 メタデータを記述する用語を定義する構造を構築する。 この構造がオントロジーとなる。また、KANZAKI.com の 「ウェブ・オントロジー言語OWL」 には、
ウェブでのオントロジーとは、バーナーズ=リーらの言葉を借りれば、"「分類体系」と「推論ルール集」"、です。とある。 要するに、いわゆる「セマンティック・ウェブ」を実現するための重要な技術のひとつらしい。
[中略]
オントロジーは、セマンティック・ウェブをグローバルで誰もが利用可能なものにするための要となる部分なのです。
ところで、 「OWL」は「Web Ontology Language」の略語であるハズなのに、 なぜ「WOL」ではないのだろうか? この理由については諸説あるようだ。 例えば、 「クマのプーさんに登場するOwl(フクロウ)が自分の名前を「WOL」と書くことにちなんで名づけられたとされる」 とか、 「すでにデータ工学の分野で研究が行われている別のWOLという言語と同じ名前になるのを避けるため」 とか、 「発音のしやすさと智恵の象徴フクロウとの語呂合わせなどから、OWLという名前となった」 どれが本当かは不明だが、ともかく、 「Web Ontology Language」のことを「OWL」ということは確かだ。
【参考リンク】
カテゴリー: RSS 22:23 | コメント (0) | トラックバック (0)
2007年3月17日
OPML(Outline Processor Markup Language) とは
RSSリーダーについて調査していると、 「OPML」という言葉で出くわした。 今回のブログでは、この「OPML」について調査してみた。「OPML」とは「Outline Processor Markup Language」の頭文字で、 日本語では「アウトライン・プロセッサ・マークアップ言語」という。 ウィキペディアによると、
XML 1.0をベースとして記述されたマークアップ言語の一つで、 文書のアウトライン構造の情報を異なるOS・環境間で交換可能にするための規格である。とある。 本来は、XMLに文書のアウトライン構造を格納するためのフォーマット仕様のようだが、 最近は RSSリーダー等での利用が増えてきているようだ。 それについては
複数のWebサイトの情報をリストとして表現することも可能で、 最近ではRSSリーダーにおいて、 複数のRSSフィードのリストをOPML形式でインポート・エクスポートすることが可能になっている。とある。
【参考リンク】
カテゴリー: RSS 22:59 | コメント (0) | トラックバック (0)
2007年3月15日
RSD(Really Simple Discoverability) とは
RSS関連技術を調査していて気付いたのだが、 MovableTypeのテンプレートに「RSD(rsd.xml)」というのが定義されている。 何のことかわからなかったので少し調査してみた。まず、そのモノが何であるかは 本家本元を調べてみるのが一番だと思い、 MovableTypeの開発元である。 「シックス・アパート」のサイト をあたってみた。すると 「Movable Type マニュアル「テンプレートの種類」」 ページの インデックス・テンプレートのところに この 「RSD(rsd.xml)」についての記述があった。 それによると、
Really Simple Discoverabilityの略で、 外部のサービスがユーザーの作成したブログの情報を利用したいとき、 必要な情報をツールが自動的に取得できるように提供しているファイルです。 通常はここに手を加える必要はありません。とある。
この説明を読むと、外部サービスにブログ情報を提供するための API(Application Program Interface)情報を提供するためのモノのようだ。 確かに、RSDテンプレート内を解析してみると「api」というタグが見受けられる。 そして なんとなく「MetaWeblog」と「Blogger」に対する情報提供を定義しているように見える。
ここで、「MetaWeblog」とか「Blogger」とか 出てきたが、 これについては、同じくMovable Type マニュアルの 「XML-RPC API」 のページに記述がある。それによると、 「Blogger」については
Movable Typeは、Blogger XML-RPC APIを適用できる箇所に対し完全に実装しています。 Movable Typeがサポートしないメソッドは、getTemplateとsetTemplateの2つだけです。 これは、Movable TypeとBloggerとではテンプレートのシステムが異なるためです。とあり、また「MetaWeblog」については
また、Movable TypeはmetaWeblog XML-RPC APIを適用できる箇所に対しサポートしています。 さらにMovable Typeは、エントリーに割り当てたカテゴリーを扱うための独自のメソッドを2つ備えています。とある。
さらにこのマニュアル・ページにはサポートするAPI が一覧になっている。 ここに定義されている API を利用して、 外部から ブログに 新たに記事を投稿したり、既存記事の変更・削除、 既存の投稿記事リストの取得ができたりするようだ。
【参考リンク】
カテゴリー: RSS 22:03 | コメント (0) | トラックバック (0)
2007年3月14日
Atom とは
Atom とは 昨日のブログ 「RSS」 で調査した RSS と同様に Webサイトの見出しや要約などのメタデータを構造化して記述するXMLベースのフォーマット。 主にサイトの更新情報を公開するのに使われている。この仕様のことを 「Atom配信フォーマット(Atom Syndication Format)」 と呼んでおり、既にIETF(Internet Engineering Task Force)において 「RFC4287」として仕様が公開されている。
これは、RSSには異なるバージョンが存在(対立)したり、 RDFのXML構文が若干煩雑だったりというややこしさを理由に、 RSSの考え方は継承しつつ、新たなフォーマットを構築しようという活動から 生まれたものである。
このように「Atom配信フォーマット(Atom Syndication Format)」が RSSと基本的役割が重なっている一方、RSSと異なる試みとして、 ウェブ上のコンテンツを編集するために Atom対応のソフトウェアの統一的な呼び出し規約 「Atom出版プロトコル(Atom Publishing Protocol)」を規定している。 これは通称「Atom API」または「AtomPP」とも呼ばれる事がある。 ウェブログツールなどのプログラムがAtomAPIを実装することにより、相互に連携しやすくなる。
【参考リンク】
カテゴリー: RSS 22:01 | コメント (0) | トラックバック (0)
2007年3月13日
RDF(Resource Description Framework) とは
昨日のブログで 調査した RSS 0.9 と RSS 1.0 は 「RDF Site Summary」の頭文字から命名されている。 では、ここで使われている「RDF」とは何であろうか?「RDF」とは、「Resource Description Framework」の頭文字からきている。 この「RDF」に関して e-Wordsには、
情報についての情報(メタデータ)の表現方法についての枠組み。 RDFで記述される情報は書籍における図書カタログのようなもので、 コンピュータが扱う情報の分類や検索などの自動化・効率化を図ることができる。 Apple社によって提案されたMCFをNetscape Communications社が買い取り、 XMLをベースとしたものに改良して標準化団体W3Cに提案した。 1999年2月に正式な勧告となった。とある。 また、ウィキペディアによると、
Resource Description Framework (RDF) とは、 ウェブ上にある「リソース」を記述するための統一された枠組みであり、 W3Cにより規格化がなされている。 RDFは特にメタデータについて記述することを目的としており、 セマンティック・ウェブを実現するための技術的な構成要素の一つとなっている。となっている。
「RDF」について語る際に、必ず出てくる言葉がいくつかある。 それが、「主語(subject)」、「述語(predicate)」、「目的語(object)」 であり、これら3つの要素のことを「トリプル(triple)」と呼ぶ。 「RDF」では主語となるリソースを述語と目的語によって表現する。
RDFが定義しているのはこのトリプルに基づく抽象構文であり、 具体的な構文としてはXMLを利用したRDF/XMLが別に定義されている。 実際に記述する際には、主語はURIで示されたリソースか空白ノード。 述語はURIで、そして 目的語は Unicodeの文字列、URIで示されたリソース、空白ノード のいずれかになる。 これらを具体的に記述する場合、共通に使える語彙の定義が必要になる。 RDF自体はそのような語彙の共通に使える取り決めはないが、 「Dublin Core」 といったメタデータ記述に使う語彙が定義されている。 この「Dublin Core」は RSS(RDF Site Summary)公式モジュールとして採用されている。
【参考リンク】
- e-Words「RDF」
- ウィキペディア「RDF: Resource Description Framework」
- RDF/XML構文の簡単な説明
- ウィキペディア「OWL」
- ウィキペディア「RSS」
- ウィキペディア「Dublin Core」
カテゴリー: RSS 22:24 | コメント (0) | トラックバック (0)
2007年3月12日
RSS とは
これからRSSについて少し調査してみようと思う。 まず最初に RSSとは 何ぞや、というところから。まず「RSS」 とは、ということで その定義は ウィキペディアによると、
RSSは、ブログなど各種のウェブサイトの更新情報を簡単にまとめ、配信するための幾つかの文書フォーマットの総称である。とあり、e-Wordsによると
Webサイトの見出しや要約などのメタデータを構造化して記述するXMLベースのフォーマット。 主にサイトの更新情報を公開するのに使われている。となっている。
それでは「RSS」って、何の頭文字ですか? と訊かれると困ってしまうのが この「RSS」。 歴史的背景から バージョンについても非常に複雑で、 バージョンの数字の大きいものが上位互換性を持った後継規格というわけではない。 そのため各バージョンによって同じ「RSS」でも その名称が異なっている。 それについてウィキペディアによると、
- RDF Site Summary(RSS 0.9とRSS 1.0)
- Rich Site Summary(RSS 0.91)
- Really Simple Syndication(RSS 2.0)
それぞれについて詳しくウィキペディアに解説してある。 それによると、 最初のRSSであるRSS 0.9は、 1999年にネットスケープにより開発され、 これはコンテンツのメタデータを記述する包括的な仕様「RDF」をベースにしたものだったため 「RDF Site Summary」と呼ばれた。
その後、独自のXMLフォーマットを用いて要素を拡張し RSS 0.91 とし、 「Rich Site Summary」と呼ばれた。
その後 RSS 0.9 時代につかわれていたRDFを再び採用し、 RSSが持つ「メタデータ記述」としての側面を主眼に置いたフォーマットを採用した RSS 1.0 がRSS-DEVワーキンググループよりリリースされた。
RSS 0.9 − RSS 1.0 の流れとは別に、 RSS 0.91 を基に UserLand Softwareは RSS 0.92, RSS 0.93, RSS 0.94 と拡張を続けた。 さらに それらとの互換性をもった RSS 2.0 が 「Really Simple Syndication」と名づけられてリリースされた。
以上のように複雑な 経緯を経て、現在のところ系列としては大きく2つに分かれて、
- RDF構文を用いた RSS 0.9 と RSS 1.0 。
- XMLを用いている RSS 0.91 とそれ以降の RSS 0.94 までのフォーマットに対する上位互換の RSS 2.0 。
このように「RSS 0.9」と「RSS 0.91」とは、 バージョン番号でいうと、たった 「0.1」しか違っていないが、 全く違うものである。
また、「RSS 2.0」は「RSS 1.0」の次のバージョンのように思われるが、 これまた、全く別のものである。 この辺も、RSSの取り扱いで注意が必要な点である。
【参考リンク】
カテゴリー: RSS 22:01 | コメント (0) | トラックバック (0)