セミナーレポート

ドイツ国立図書館の電子書籍収集戦略

ドイツ国立図書館のオンラインデータ収集戦略について、講演がなされた

2013/3/28

 2013年7月から、改正国立国会図書館法が施行される。出版社が発行する電子書籍・電子雑誌などのうち、無償のものでDRMのないコンテンツが納本義務の対象となる。

 図書館のオンラインコンテンツの収集は、国内ではまだまだ手探りの状態だが、海外でも模索が続いている。2013年3月6日に行われた国会図書館の講演会では、ドイツ国立図書館(DNB)の事例が紹介された。

ドイツの事例を知るべく、図書館関係者が集まった
ドイツの事例を知るべく、図書館関係者が集まった

ドイツ国立図書館の現状


 講演したコルネリア・ディーベル氏は、DNBのオンライン情報資源タスクフォース責任者として、オンライン情報資源の収集や、その自動処理に取り組んでいる。


 ドイツでは法改正によって、2008年から電子書籍などのオンラインの出版物も納本することが定められた。DNBでは公衆ネットワーク上で利用可能な全ての電子書籍、電子雑誌、音楽ファイルを収集しているという。


 1998年にドイツの全大学が電子論文の提供、2002年にはドイツの書店協会がオンライン出版物の任意提供にそれぞれ同意しており、「(改正された)法律が施行される以前からオンライン出版物取り扱いの経験を積んでいた」とディーベル氏は述べた。


 DNBのオンライン刊行物の収蔵は年々増えており、2012年末で約70万点のオンラインデータを収集したという。この内訳は、学術論文が約12万点、科学分野を中心とした電子書籍やオンデマンドの出版物が約36万点、「e-paper」と呼ばれる新聞のコレクション約21万点となっている。


 ドイツ国立図書館の従来の収蔵フローも紹介された。ドイツ国立図書館には旧東西ドイツの国立図書館であるフランクフルト館とライプチヒ館、楽譜・レコードなどの音楽資料を扱うベルリン館がある。出版物が発行されると、保管と出版物の利用は、書籍を取り扱うフランクフルト館とライプチヒ館の2ヶ所で連携しておこなっている。文献処理の制御も2拠点で共有しながら進め、完全なコレクションの提供を実現しているという。


 オンラインコンテンツについても、「全てのDNB職員がオンラインの取り扱いを知っているわけではないので、オンライン資料でも、従来の方法で収集や目録作成ができるように目指した」(ディーベル氏)という。


 最初は少量のデータで試行錯誤しながら、メタデータなどを自動的に処理できるシステムを構築していったという。また、図書館内の業務効率だけでなく、納本義務をもつ出版社が、電子書籍を納本しやすいように支援できるように、自動化プロセスの仕組みづくりを行った。

ドイツ国立図書館のコルネリア・ディーベル氏   ドイツ国立図書館のWEBフォームログイン画面
ドイツ国立図書館のコルネリア・ディーベル氏   ドイツ国立図書館のWEBフォームログイン画面

オンライン資料の収集方法


 納本の義務が発生しているオンライン資料だが、提出にあたっては3つのインターフェースを用意している。


 1つ目は、WEBフォームでの入力。タイトル、出版日、出版社の住所などを、メタデータとともに記載する方法だ。WEBフォームでの入力は、全て手作業で行われるので、容量が軽い電子書籍や、論文や楽譜などの場合はWEBフォームから記入する。


 2つ目は、OAI-PMHという、メタデータを自動収集するためのプロトコルを用いたもの。この提出方法を選ぶ場合、クライアントからサーバにリクエストを送ると、出版社側のサーバから、電子書籍ファイルとメタデータを自動的に拾い上げる仕組みだ。DNB側も出版側も手作業はない。


 3つ目は2011年の4月から運用している「ホットフォルダ」。「ホットフォルダ」は、出版物をメタデータとともにZIP化し、SFTPか、WEBDUVといったプロトコルを利用して転送する。メタデータはカタログの中で統合され、自動的にリポジトリへ保存される。


 収集するファイル形式は、基本的にPDF、PDF/A、EPUB、ドキュメントに関してはHTLMなどで収集している。WEBサイトについては、ドイツ国内にある約1400万サイト(2011年時点)を全て収集することはできないので、公的機関のサイトを中心に収集しているという。


 収集した電子書籍などのオンライン資料は、著作権の関係から、今のところフランクフルト館とライプチヒ館の2か所からのみの閲覧となっているが、一部のコンテンツは館外からの閲覧が可能だという。


今後の展望


 質疑応答では様々な疑問が投げかけられた。「電子書籍は、どこを基準に『出版』と扱い、納本義務が発生するのか?」という質問に、ディーベル氏は「図書館が出版物をコントロールするわけではないので難しい。書籍ベースではなく、出版社に対して納本を呼び掛けている」と回答した。


 また、貴重書を含めた既存の蔵書のデジタル化については、書籍の価値ではなく、書籍の破損度に応じて優先度をつけて行っているということだ。


 WEBサイト、電子書籍などの収集は、メタデータの整合性など、様々な課題があるものの、最終的な目的は、利用者が不自由なくアクセスできることに尽きる。日本の国会図書館でオンライン資料が閲覧・館内複写が可能になるのは、2013年の10月からだが、よりよい閲覧環境が整えられることが望ましい。

(中西 啓)

注釈

*:DRM(Digital Rights Management)
デジタル著作権管理。有料ページなど、閲覧・記録を制限しているサイトなどが該当する。

【セミナーデータ】

イベント名
:電子情報の収集とメタデータ 電子納本に関するドイツ国立図書館の戦略
主催   
:国立国会図書館
開催日  
:2013年3月6日
開催場所 
:国立国会図書館(東京都千代田区)

【関連カテゴリ】

その他