英国継続・高等教育におけるイープリントおよびオープンアクセスジャーナル論文のためのモデルの開発

Alma Swan
キー・パースペクティブ社

Paul Needham
クランフィールド大学

Steve Probets, Adrienne Muir, Charles Oppenheim, Ann O'Brien, Rachel Hardy and Fytton Rowland
ラフバラ大学

Sheridan Brown
キー・パースペクティブ社

© Alma Swan, Paul Needham, Steve Probets, Adrienne Muir, Charles Oppenheim, Ann O'Brien, Rachel Hardy, Fytton Rowland and Sheridan Brown 2005


(原文: Developing a model for e-prints and open access journal content in UK further and higher education,
Learned Publishing (2005)18, 25-40)

抄録: 英国Joint Information Systems Committeeの委任を受けて、機関アーカイブや主題アーカイブ、オープンアクセスジャーナルに保管されている資料へのアクセスを提供するためのモデルを調査・検討した。各モデルの相対的な利点については、技術的側面だけではなく、(利用者向けの)効率的なイープリント配信サービスの基本要素であるイープリントの(著者による)供給をいかに達成できるかについても重点を置いて検討した。その結果、様々なアーカイブに保管されている論文のメタデータを全国サービスにより収穫、保管、改善する「収穫」モデルを推奨する。このモデルは、他の候補である全国規模の集中サービスモデルや完全な分散サービスモデルに比べて大きな利点を有している。収穫モデルに基づくサービスについていくつかの実装オプションを紹介する。

はじめに

本稿では、Joint Information Systems Committee(JISC)の委任を受けて、英国における継続・高等教育のためにイープリントおよびオープンアクセスジャーナル論文を配信・管理・アクセスするモデルを記述する。対象とするコンテンツは(i)イープリント、すなわち、購読ベースの雑誌に発表された学術研究論文のデジタル複製物をアクセスしやすいようにオンラインで利用できるようにしたもの、および、(ii)オープンアクセスジャーナルで発表された論文の2つである。計画中のサービスは、学術研究への迅速かつ最大のアクセスを提供することにより、購読ベースの雑誌の制限されたアクセスを補完し、結果的に研究のインパクトを最大化するものである。

また、そのようなシステムからは別の利益も生ずる。このシステムにより、機関に所属する各研究者の標準化されたオンライン研究業績集を作成することが可能となり、機関の内部評価や英国の全国研究評価作業(RAE)等の外部評価など、様々な評価目的で使用することができるようになるはずである。したがって、イープリントやオープンアクセスジャーナル論文を学術研究コミュニティに配信する英国の全国サービは重要な進展となるであろう。

研究者が研究成果をオープンアクセスとするには2つの方法がある。論文をオープンアクセスジャーナル(あるいは、出版手数料を払って論文をオープンアクセスにするハイブリッドジャーナル)に発表する方法と、購読ベースの雑誌に発表した論文の複製物(「イープリント」)をオープンアーカイブ(状況により様々な名称で知られているが、イープリントアーカイブや機関アーカイブ、機関リポジトリなど)にデポジット(「セルフアーカイブ」)する方法である。「機関リポジトリ」と「機関アーカイブ」という用語はしばしば互換的に使用されているが、本稿では後者を使用する。その理由は、1つは「アーカイブ」という用語が多くの正式名称で使用されている(たとえば、機関アーカイブ・レジストリやオープン・アーカイブズ・イニシアティブ)からであり、今1つは活動を反映している(著者は研究成果を「セルフアーカイブ」するのであり、「セルフリポジット」するのではない)からである。しかし、最も重要な理由は、リポジトリという用語を使うと、今では、一般に単なるイープリントアーカイブ以上の何か、すなわち、灰色文献や機関独自のデジタルコレクションなどイープリント以外の資料を含む機関コレクションを示すと思われるからである。我々の調査の付託事項は、イープリントとオープンアクセスジャーナル論文のみを対象とする配信と管理のモデルを開発することであるので、機関アーカイブという用語がもっとも正確かつ適切である。

JISCは英国内外におけるオープンアクセスに関する全般的なプログラムの一環として本調査を委任した。委任の内容は、英国の継続・高等教育コミュニティにおけるイープリントおよびオープンアクセスジャーナル論文のための配信・アクセス・管理モデルを予測することであった。調査は、英国下院科学技術特別委員会による学術科学出版に関する調査1と同時期に行われ、両者はほぼ同時に報告書を提出した。その後すぐに、米国の国立衛生研究所の勧告書 2が提出されている。

保存問題や法的問題、イープリントアーカイブの構築・運営経費など、我々の調査結果のすべてをまとめた論文が印刷中3 であり、報告書全文はJISCにより出版されている4。本稿では特に、我々が考案したモデルと、他の候補モデルではなくこのモデルを選択した理由に焦点をあてる。

配信されるオープンアクセス資料

調査の目的(および本稿)において、JISCはイープリントを次のように定義した。

... 学術研究論文のデジタル複製物であり、論文へのアクセスを改善するためにオンラインで利用できるようにされたものである。イープリントは、プレプリント (出版が正式に承認される前に配布される論文)とポストプリント(出版が承認された論文)の2種類に分けられる。

モデルは(ハーベスト可能な)イープリントとオープンアクセスジャーナル論文の両者を包含すべきであることが指定されていた。ハーベスト可能な論文(イープリントとオープンアクセスジャーナル論文の両者)とはOAIに準拠する論文である。すなわち、そのメタデータ(書誌レコード)がオープン・アーカイブズ・イニシアティブのメタデータ・ハーベスティング・プロトコル(OAI-PMH)5で規定された形で公開されている論文である。公開されているメタデータがOAI準拠である限り、メタデータはOAIサービスプロバイダによりハーベストされることができる。そして、論文がどこにあっても、サービスプロバイダのデータベースを使うことにより、利用者は興味のある論文を指定して検索することができる。既に数多くのOAIサービスプロバイダが存在する。そのもっとも有名な例は、おそらく、OAIster6(ミシガン大学)とCitebase7(サウサンプトン大学)であろう。サービスプロバイダの利用法は次の通りである。まず、利用者は検索項目(著者名やキーワードなど)を入力する。すると、ソフトウェアは、利用可能なすべての OAI準拠のオープンアクセスアーカイブからあらかじめハーベストしておいたメタデータを検索し、該当する論文のリストをフルテキストへのリンクを付けて利用者に返す。そして、利用者はオリジナルの場所にあるフルテキストにアクセスする。

オープンアクセスジャーナルについて言えば、現時点(2004年10月)でDirectory of Open Access Journals(DOAJ8)には 1,227タイトルがリストアップされており、そのうち324タイトルが論文レベルでハーベストが可能である。これらの論文は、すべてではないがほとんどは、BioMed Central 9かSciElo10プロジェクトにより出版されたものである。

既存のイープリント資料は2つの形態のオープンアーカイブ、すなわち、集中型の主題ベースのアーカイブと世界中の研究機関に設置されている分散型のアーカイブに保管されている。歴史があり有名な主題アーカイブの2つの例は、1991年に構築され、物理学、数学、および関連分野をカバーする arXiv11と、1997年に構築され、認知科学(心理学、神経科学、言語学、および関連分野)をカバーするCogprints 12である。

2つの主題ベースのアーカイブの活動を示すにはいくつかの数字が参考になるだろう。arXivは現在およそ30万件のデジタルアイテムを保管しており、1月当たり約150万回のアクセスがある。Cogprintsは現在およそ2,000アイテムを持っている。そのうち約半分(985アイテム)はポストプリント(出版済み、あるいは印刷中の雑誌論文)であり、その他、377本のプレプリント、283本の会議発表論文、44枚の会議発表ポスター、234件の図書の章を保有している。

主題ベースのイープリントアーカイブだけでなく、幅広い専門分野をカバーする分散型のアーカイブが世界中の大学や研究機関で構築されており、その数は現在では数100を数える。OAIsterは現在、351のアーカイブ(機関アーカイブや主題アーカイブ、オープンアクセスジャーナルアーカイブ)からハーベストを行っており、データベースには350万件を越えるレコードが存在する。ただし、OAIsterはイープリント以外のデジタルオブジェクトをハーベストしていたり、イープリントを持たないアーカイブからハーベストを行っていたりするので、これらのレコードのすべてがイープリントであるわけではない。

Institutional Archives Registry13は現在、イープリントを(多くの場合それ以外のデジタルオブジェクトと共に)保管する227のアーカイブをリストアップしている。そのうち、33は英国にあるアーカイブである。121のアーカイブは個々の機関が運営するアーカイブであり、研究成果資料(すなわち、イープリント)を保管している。一般にそのコンテンツは機関の全般的な学術活動を反映して、多くの専門分野をカバーしている。しかし、中には、部門アーカイブや学科アーカイブもあり、そのようなアーカイブは一般に単一の主題や分野をカバーしているだけである。32のアーカイブは、イープリントを持つ複数機関によるアーカイブであり、一般に主題ベースである傾向にある。ただし、協力関係にある機関により構築された幅広い学問分野をカバーするアーカイブも存在するので、すべてが主題ベースであるわけではない。この種のアーカイブの例としては、ヨーク大学、シェフィールド大学、リーズ大学による共同プロジェクトであるWhite Rose Consortium e-Prints Repositoryがある。

2004年5月には、RDN/e-Prints UK14プロジェクトにより20のイープリントアーカイブから25,000弱の論文がハーベストされた。論文を1つも持たないアーカイブもあれば、反対にオープンアクセス出版社であるBioMed Centralのアーカイブのように、発行している約120タイトルの雑誌の12,000件以上の論文を持っているアーカイブもあった。大学が運営するアーカイブとしてはとびきり有名なサウサンプトン大学のECS Eprintsサービスは、8,143件の論文を持っている。サウサンプトン大学が運営する他の2つのアーカイブもかなり多くの論文を持っており、e-Prints Sotonは758件、Psycprints(雑誌アーカイブ)は720件の論文を持っていた。

アーカイブに収集・保管されるデジタルオブジェクトのタイプ

イープリントのみに集中しているアーカイブもあれば、各機関の要件に特化して各々非常に異なるデジタルオブジェクトを選択して収めているアーカイブも存在する。本調査においてJISCは、2つのタイプのデジタルオブジェクト、すなわち、イープリント(プレプリントとポストプリント)とオープンアクセスジャーナル論文のアクセスと配信のためのモデルを必要としていることを指定した。下の表では、これらのデジタルオブジェクトを太字で表記した。しかし、他のタイプのオブジェクトもアーカイブされていること、および、場合によってはそれらのタイプのオブジェクトを検討に加えた方が望ましい場合もあることを、我々は常に念頭に置くようにした。英国の教育機関に設置されたアーカイブに保管される可能性のあるデジタルアイテムのタイプの例は以下のとおりである。

「灰色文献」は本調査の対象には含まれていなかったが、無視するべきではないと考えた。なぜなら、少なくとも雑誌に投稿しリジェクトされたプレプリントは結局、灰色文献となる可能性があるからである(実際、DAEDALUSプロジェクトでは正式にプレプリントを灰色文献に分類している15)。反対に、多くの定義によればイープリントはプレプリントとポストプリントに限定されるにもかかわらず、多くのイープリントアーカイブは報告書の形のコンテンツ(通常灰色文献として分類されている)をたくさん保管している。

灰色文献は本調査の対象には含まれていなかったが、以上の理由により対象に加えることにした。英国における灰色文献の現状については、MAGiC(Managing Access to Grey Literature Collections)の最終報告書16が良い入門となるだろう。手短に言うと、MAGiCプロジェクトは、英国図書館と研究支援図書館プログラム(Research Support Libraries Programme)からの助成を受けて、灰色文献の目録不足に対処するために計画され、OAIハーベスティングモデルに基づく全国的な灰色文献サービスを構築することを提案した。このサービスには電子的および(従来の)紙媒体の灰色文献の両者が受け入れられることになる。

収集・保管されるデジタルオブジェクトの形態とフォーマット

我々の調査目的において、イープリントとは、学術印刷物において発表され、著者により無料で公開された論文であると定義された。言い換えれば、アーカイブされる物は主として一般的な雑誌論文である。一部に、ある種の科学分野で生成される大規模なデータセットや映像、オーディオクリップなどの補助的なサポート資料が付随するものもある。

しかし、研究成果が別の形態をとる研究分野も存在する。たとえば、舞台芸術学では、研究成果は通常、演技の形をとる。この場合、研究成果のアーカイビングについて新たな問題が明らかになる。たとえば、演技のビデオレコードは大量のデジタル保存スペースを使用する。また、人文科学の場合、研究者は従来の雑誌に研究成果を発表することもあるが、モノグラフの形をとる大部の研究成果になる場合もある。これらを雑誌論文と同じ方法でアーカイブすることもできるが、両者の間には明らかな違いがある。モノグラフはおそらく所属が異なる複数の著者が各章を担当している場合がある。この場合はおそらく、章毎に異なる投稿規定に基づく必要がある。また、一般にモノグラフは雑誌論文に比べて大部であることが多いので、ここでも保存スペースが問題となる。さらに、モノグラフの著者には出版社から印税が支払われることが多い。その額は一般に小さいものであるが、報酬に相当する。したがって、この場合は「無料の」文献ではないことになる。

既存のイープリントアーカイブが許容するデータフォーマットの範囲はアーカイブにより異なる。たとえば、オックスフォード大学のOxford E-Printsのように、多くのイープリントアーカイブではテキストベースの文献はPDFのアップロードのみを認めている。一方、たとえば、グラスゴー大学のeprints@Glasgowなどでは、数多くのフォーマットのデジタルオブジェクトを受入れて(保管して)いる。

世界の状況

国策としてセルフアーカイビングを進めオープンアクセスを実現するという、ある種の世界規模の競争が生じている。インド、ノルウェイ、オランダ、ドイツ、カナダ、スコットランド、フランスなどにイニシアティブが存在するが、中でもオーストラリアが典型的である。オーストラリア政府は 2003年10月、「オーストラリアの研究情報を...より簡単にアクセスできるように、またより良く管理できるように」するために、1,200万豪ドルの資金を提供した17。この国の主要な研究大学はすべて機関リポジトリを持っているので、教育・科学・訓練省(DEST)は全国的連携アプローチが前進のための最適の方法であると判断した。 DESTは現在、オーストラリアの15の大学、オーストラリア国立図書館および各国図書館、産業界や様々な国際機関の代表が参加する4つのプロジェクトを支援している。 Australian Partnership for Sustainable Repositories(APSR)が設立され、オーストラリア国立大学のCentre for Sustainable Digital Collectionsにより運営されている。その目的は、幅広い学問分野をカバーするアーカイブベースのアーキテクチャによる全国的研究基盤を整備し、デジタルコレクションへの継続的なアクセスと持続可能性を保証し、国内の調整と国際的連携を促進することである。

英国におけるイープリントの状況

英国においてはイープリントの全国的配信に関連するプロジェクトやプログラムが既にいくつか立ち上がっている。将来は有望であるが、関連する複数のパイロットプロジェクトや多くの既存の機関イープリントアーカイブの間の調整に欠けているのが現状である。また、今のところ、英国図書館はイープリントアーカイビングに関与していない。次の3つの全国的イニシアティブが特に重要である。

ePrints UK

ePrints UK18プロジェクトは、OAIに準拠したオープンアーカイブリポジトリ、特に英国の大学で提供されているリポジトリに保管されているイープリントを対象とする全国的な主題ベースのサービスを開発している。インターフェースはOCLCにより提供される予定であり、Webサービスの「著者典拠」と「引用分析」(前者はOCLCが、後者はサウサンプトン大学が提供)を使用して、利用可能なアーカイブからハーベストしたメタデータの質を改善する予定である。本報の調査の目的に即していえば、ePrints UKは既に多くの電子ジャーナルリポジトリからメタデータをハーベストしており、雑誌論文とイープリントのメタデータの統合が、実用的かつ達成可能な提案であることを示していることが重要である。

SHERPA

SHERPA19プロジェクトは、多くの大学における、自由にアクセスできる研究成果の機関デジタルコレクションの構築を先導している。プロジェクトが取り組んでいる問題は、知的財産権、品質コントロール、研究者コミュニティが研究文献を自由に利用できるようにするために鍵となるその他の管理上の諸問題、リポジトリ間の相互運用性やイープリントのデジタル保存といったシステムの技術的側面である。

FAIR

JISCからの助成を受けたFocus on Access to Institutional Resources(FAIR)20プログラムは、「コンテンツの公開と共有のための様々なメカニズム(および関連の問題)を評価・検討することにより、将来にわたる長期的な関与を続けるグループが構築し、学習者コミュニティ全体が利用できるWeb情報資源の未来像を実現すること」を目的 としている。JISC情報環境は、著者が有益なコンテンツ(研究成果物など)をデポジットし、共有することのできる仮想的な場であり、JISCからの助成を受けたコンテンツからなる現在のコレクションを結合するものであると考えられている。さらに、出版社やアグリゲータが作成した外部のコンテンツを含める可能性も持っている。

英国における新サービスのためのモデルについてのその他の問題

適切なモデルの開発について審議する際に、調査・検討すべき問題が他にも存在する。問題は、技術的問題と「文化的」問題の2つのカテゴリに分けられ、以下のようにまとめることができる。

技術的問題

検討すべき技術的問題は以下のとおりである。

ソフトウェア

新システムは既存のソフトウェアパッケージを使って稼動させるべきか、あるいは、新規に独自のパッケージを開発すべきか。オープンアーカイブの運用に利用できるオープンソースの(無料の)ソフトウェアパッケージが複数存在する。最も有名なものはMITで開発されたDSpaceと、サウサンプトン大学で開発されたEPrintsである。 EPrintsもDSpaceもOAI-PMHによる相互運用性を提供する。DSpaceは、通常のURLとは異なる、デジタルアイテムの物理的配置場所が変わっても変更されることのない永続的識別子を使用している。その他の注目すべきOAI準拠のソフトウェアシステムとしては、CERNが開発したCDSwareと、アンドリュー・W・メロン財団の助成を受けてバージニア大学とコーネル大学が共同で開発したFedoraがある。

保存ポリシー

この件について全国的イープリントサービスに関係すると我々が判断した問題は、第1に、著者が論文を引き上げたいと望んだ場合に何が起こるか、第2に、最初に論文をデポジットした後に繰り返し改訂があった場合にどう扱い、追跡するか、第3に、何が最終稿であり、これをどのように示すことができるかである。

アーカイブを構築するために必要な技術上の経費と資源

技術的観点から見ると、主要な経費は、IT装置に係る初期費用と人件費およびこれらの運用経費であろう。現段階では、新運営機関に係る経費を評価することは困難である。なぜなら、そのような機関の構成や運用上の要件がわからないからである。しかし、我々は4つの大学においてアーカイブを構築・運用するために実際に必要とした経費を割り出した。これは、全国のすべての高等・継続教育機関にイープリントアーカイブを構築するために必要な全経費の概算値をJISCに提供するものである。その数値を表1に示した。すべての経費は通貨換算のため概数であり、丸めてある。

表1 機関アーカイブを構築・維持するために実際にかかった経費の例

大学 構築経費(£) 年間の運用経費(£)
MIT(DSpaceを使用) 130万 160,000
クイーン大学(カナダ)のQSpace(DSpaceを使用) 22,750 22,250
アイルランド国立大学メイヌース校(EPrintsを使用) 17,500 26,250
ノッティンガム大学(EPrintsを使用) 3,900 31,250
(3年毎のハードウェア・ソフトウェアのバージョンアップ経費を含む)

文化的問題

ここでいう「文化的問題」には政治上およびビジネス上の問題を含む。この問題に関しては、セルフアーカイビングが標準的行動になるためには文化的な変革が必要であることを示す文献において既に有益な考察がなされている21。検討する必要がある具体的な問題は次のとおりである。

アーカイブに対する機関の態度

英国においてもアーカイブを構築した機関は多いが、ほとんどの研究主導型施設はまだアーカイブを構築していない。適当な期間のうちにこれらの施設でアーカイブが構築される可能性は、我々が最終的にどのモデルに決めるかに関係するかもしれない。機関がオープンアクセスアーカイブを構築することにはいくつかの利点が存在する。第1に、オープンアクセスは学術研究のインパクトを高める22。第2に、オープンアクセスアーカイブはインパクトを測定・分析する方法を改善することができ、その結果、研究の生産性や利用率、インパクトの科学的に測定可能なより良いパフォーマンス指標を生み出すことができる。第3に、オープンアクセスアーカイブは、個々の研究者の標準化されたオンライン研究業績集を作成することができ、これを内部評価や(英国の全国研究評価作業 23などの)外部評価作業に使用することができる。第4に、オープンアクセスアーカイブはすべての研究会議の助成要件を監視し、履行を実現する助けとなる。また、我々が調査の詳細な報告書を提出したのと同時期に、下院科学技術特別委員会の勧告1が発表されたが、勧告には以下の点が含まれている。

43. 機関はリポジトリを構築するよう奨励される必要がある。本委員会は、大学の要件として、研究成果をできるだけ広く発信することを大学憲章に書くことを勧告する。さらに、すべての研究機関がリポジトリを構築・維持管理するために助成金を使用することができるようにSHERPAは教育技能省の助成を受けるべきである。
44. 学術論文の著者は現在、機関リポジトリにセルフアーカイブするための十分な動機を欠いている。本委員会は、研究会議やその他の政府助成機関が、助成を受ける研究者に研究助成の条件として、すべての論文の複製物を出版後1ヶ月以内、あるいは、適当な時期(次号の出版時点で合意されるべきである)に機関リポジトリにデポジットすることを命ずることを勧告する。

これらの勧告が政府により承認されれば、英国のすべての大学および研究主導型の機関にアーカイブが設置されることになるだろう。

アーカイブのコンテンツ量

今日存在するアーカイブに保管されているイープリントの量は、注目すべき例外はあるが、概して非常に少数である。既存のアーカイブの管理者や擁護者は多くの方法、すなわち、キャンペーンやデモ、プレゼンテーション、セミナーを主とした絶えざる宣伝活動でこの問題に取り組んでいる。副学長補佐(PVC)や研究政策担当の副学長による(暗黙の、あるいは実際の)支援が非常に重要である。

イープリントアーカイブ設置後の最大の敵は著者のやる気のなさである。「著者による諾否選択」モデルの代替案はセルフアーカイビングの義務化である。現在のところ、著者にすべての研究論文の複製物を機関イープリントアーカイブにデポジットすることを義務付けている教育機関は少数である 24。学科で義務付けている例も存在する。サウサンプトン大学の電子工学・コンピュータ科学科がその1例である。この学科は他の学科が同じように義務化する際に使用することのできるポリシーを作成している25。セルフアーカイビングの方法やその合法性に対する不安を和らげるために、Eprints.orgはこの問題に関するFAQ26やハンドブック27を作成している。

著者が出版社やアーカイブと交わす契約

著者によるセルフアーカイビングを妨害あるいは阻止するような、出版社との制約的許諾契約あるいはアーカイブとの排他的契約は存在するのか。今では多くの出版社が自社の雑誌に発表した論文を、その著者が所属する機関のアーカイブにセルフアーカイブすることを正式に認めるようになった。本稿執筆中の時点で、Eprints.orgが調査した出版社(103社)の70%以上がこの方針を採用している28。また、調査した雑誌(8,853誌)の92%が「グリーン雑誌」である(すなわち、著者が論文のプレプリントまたはポストプリントのいずれかをセルフアーカイブすることを認めている)29

アーカイブ構築のための管理上の経費と資源

これには計画、宣伝、訓練に要する人的資源が含まれる。信頼できるデータを入手することは困難であった。その理由の大部分は、アーカイブを構築した機関では、この種の経費は既存の活動経費や設備経費で負担されているからである。しかし、考察の結果、これらに現実的かつ無視できない費用がかかっていることは明らかであった。

以上の背景情報を適切に使うことにより、イープリントの配信・管理・アクセスのためのモデル候補を決定する作業を開始した。

検討したモデル

学術デジタル情報資源とそのメタデータへのアクセスを実現できる基本モデルには次の3種類が存在する。

集中モデル

このモデルでは、利用者(著者)はイープリントを中央アーカイブにデポジットする。このアーカイブは独自のサービス提供機能を持ち、利用者(読者)が必要な論文を検索・ブラウズ・入手するインターフェースを提供する。アーカイブに保管されている論文のメタデータは、他のサービスプロバイダが使用できるように、OAI-PMH(および同じ機能を有する他のプロトコル、その候補として本調査では特に、RSSと SRW/SRUを考えている)を通じても公開される。このモデルの構成を図1に示す。

図 1 集中モデル

分散モデル

このモデルでは、全国サービスは利用可能なすべてのアーカイブを検索する。メタデータは利用者が要求した際にその場で入手され、利用者には提供元のアーカイブにあるデジタル情報資源(論文)が示される。モデルは図2のように構成される。

図 2 分散モデル

「収穫」モデル

このモデルでは、計画中の新英国全国サービス(サービスプロバイダ)は利用可能なイープリントアーカイブやオープンアクセスジャーナル(データプロバイダ)からOAI-PMHを使ってメタデータをハーベストし、蓄積する。このサービスは独自のサービス提供機能を持ち、読者が論文を検索・ブラウズ・入手するインターフェースを提供する。このモデルには、他のサービスプロバイダが使用できるように論文のメタデータを OAI-PMH、SRW/SRU、RSSを通じて公開するという追加要素を含めた。図3は収穫モデルを図式的に示したものである。

図 3 収穫モデル

各モデルの技術要件の詳細な説明は詳細報告書4の付録に掲載されている。

各モデルにはそれぞれ賛成意見、反対意見があった。新英国全国イープリントサービスにどのモデルを採用することがベストであるかを決める前にこれらのモデルを評価する必要があった。各モデルの相対的な利点を検討する際には、技術的問題だけではなく、既に述べた文化的問題も考慮に入れた。特に、どうしたら(著者から)イープリントの提供を得ることができるかを重視した。なぜなら、著書からのコンテンツの提供なしには、(利用者にとって)本当に役立つイープリント配信サービスは存在しないからである。各候補モデルの利点・欠点を表2にまとめた。

表 2 各モデルの利点と欠点


利点 欠点
集中モデル サービスを運用する機関は:
  • 論文の投稿からユーザインターフェースに至る全過程を総合的に管理することができる
  • 使用するプロトコルを標準化することができる
  • もっとも適切な蓄積・出力能力を持つアーカイブソフトウェアを選択することができる
  • 保存問題に対処することができる
  • 論文を投稿する際のフォーマットを制限することができる
  • 検索能力を最大にする機能(データのカテゴリー化、主題分類など)を開発することができる
  • 開発・改良を継続する全般的な計画を立てることができる
  • すべての管理・維持機能を集中化することは高価な選択肢である
  • 既存の機関アーカイブや主題アーカイブの存在を無視し、利用価値のないものにする
  • 全国の様々な学問分野の著者が論文を1つの汎学問的中央アーカイブ、あるいは複数の中央主題アーカイブに投稿する枠組みを作成することは、政治的、文化的理由から不可能ではないとしても極めて困難と思われる
  • オープンアクセスジャーナル出版社が出版した論文を中央アーカイブに直接投稿することを期待するのは無理で、現実的でない
分散モデル
  • メタデータの複製が不要である
  • 入手されるメタデータが常に最新のものである
  • 様々な提供元のメタデータを検索・入手する際に常に同じルックアンドフィールを提供する
  • 集中モデルより比較的安価に実装できる
  • イープリントやオープンアクセスジャーナルの管理機能を改善することが不可能である
  • 必要な時(利用者が検索する時)に取り込むだけであるので、メタデータを改善することが不可能である
  • 検索する提供元の数が増えると、検索するアーカイブのうちもっとも検索が遅いサーバと同じ速度でしか検索ができず、パフォーマンスが低下する
  • クエリ記法が提供元により異なり、また、時間が経つと記法が変化する
  • 適合率で順位付けして結果を返す場合、複数の提供元の結果を意味のある形でマージすることが難しい
  • 機関アーカイブや主題アーカイブはOAI-PMHをサポートしているソフトウェアを使用している。本稿の執筆時点で、ほとんど大多数のアーカイブは Z39.50やSRW/SRUをサポートしていない。
収穫モデル
  • OAI-PMHは実装が容易な標準的なプロトコルである
  • OAI-PMHは柔軟であり、OAI準拠のためには限定子なしのダブリンコアのサポートが必須であるが、これに加えて他のより詳細で複雑なメタデータスキームを使用することもできる
  • OAI-PMHはメタデータの交換や学術知識の共有を可能とするように設計されている
  • 機関アーカイブや主題アーカイブはOAI-PMHをサポートしているソフトウェアを使用している
  • ほとんどのハーベスティングは自動化された定期的タスクで行うことができ、人間が介在する必要は最小限に抑えられている
  • ローカルデータベースに格納した後、メタデータを加工、改善して提供元のデータプロバイダや他のサービスプロバイダに再公開することができる
  • 検索能力を最大化する機能(データのカテゴリー化、主題分類など)を開発することができる
  • 開発・改良を継続する全般的な計画の基礎を作ることができる
  • 雑誌論文、イープリント、雑誌記述、コレクションレベルの記述に対して同等に対応できる安価な選択肢である。
  • 限定子なしのダブリンコアはOAIが使用する最小限のメタデータ標準として必須であるが、今のところ共通に使用されている唯一のメタデータスキームである。限定子なしのダブリンコアは最小公分母であり、意味付けの豊富さに欠け、メタデータの改善の余地も限られている
  • サービスにより公開されるメタデータは常に最新版というわけではない。機関アーカイブや主題アーカイブ、オープンアクセスジャーナルでなされたメタデータの変更は、次のハーベストを行うまで反映されない。

推奨モデル

技術的・文化的理由から、本調査では、集中モデルは計画中の英国全国サービスに採用するべきではないことを提言する。その理由は、第1に、もっとも高価な選択肢になるからである。第2に、既存の機関アーカイブ、主題アーカイブ、オープンアクセスジャーナルアーカイブの増加しつつあるコンテンツを無視することになるからである。第3に、中央アーカイビングアプローチはイープリント提供という面で「逆行する」ものであり(以下を参照)、それゆえ、他のモデルのようにサービスを成功させるために必要な量のイープリント資料を効率的に集める方法を提供しないからである。

分散モデルは、上で指摘した面で集中モデルに対して明らかな利点を持っている。しかし、運用上、我々が考えるサービスの質を達成できる可能性はなかった。特に、メタデータの一貫性や品質を、新サービスを運用する機関が制御できない点が問題である。メタデータの品質はこのようなサービスの全体的な有用性や効率性にとって非常に重要であるからである。このモデルは妥当ではあるが、最適ではないという印象を受けた。

収穫モデルがもっとも有望であることは明らかであった。このモデルは我々が想定した技術的要件や能力を満たし、メタデータと、結果的にサービスレベルを標準化し、改善・向上させる方法を提供するだけでなく、まず何よりイープリントコンテンツの 提供という「文化上の」最大の障害の1つを克服するもっとも効果的な方法も提供する。決断の決め手となった点は、イープリントを配信するためのモデルは、著者からのイープリントコンテンツの提供を最大にすると思われる場面で機能し、またそのような場を作り出す助けとならなければならないということであった。この問題は非常に重要であるので、ここでさらに検討する価値がある。

著者によるセルフアーカイビングのレベルを左右するものが2つある。著者が利用することのできるアーカイブと論文を実際にアーカイブする著者である。既存のアーカイブを観察して得られた証拠から、たとえアーカイブが利用できても、デポジットされる査読済み資料は本当に少なく、この問題のまさしく根底にあるのは著者の行動であることが明らかであった。どのようにしたらセルフアーカイブするよう著者を「励ます」ことができるだろうか。我々が得た証拠は、視認性やインパクトの向上というニンジンは研究成果をアーカイブする著者の比率を高めるが、同時に、助成や雇用の条件としてセルフアーカイビングを命ずるというムチでセルフアーカイビングを「奨励」することがベストであることを示している。

実際にそのような命令を行っている例は今のところ少ない(行っている機関では効力を発揮している25)が、登場する見込みは大きい。オープンアクセス出版に関する最近の調査では、著者は一般的かつ原則的にセルフアーカイビングに異存はなく、雇用者や助成団体がセルフアーカイビングを命じた場合はそれに従うことが明らかに示されている。すなわち、全体で77%の著者はそのような命令に従う(69%は喜んで従う)とし、従わないと応えた者はわずか3%に過ぎなかった3031

したがって、本調査の実行中に公表された機関アーカイブへのセルフアーカイビングを命ずる英国議会の勧告1は、オープンアクセスの提供にとってもっとも重要な問題を扱う上で完全に的を射たものである。学者はそうするように言えば、セルフアーカイブをするのである。雇用者や研究助成団体はそれを言う権限を持っている。しかし、著者には何をするよう言ったら良いのか、あるいはどの著者に言ったらよいのか。助成団体が命令できる者は助成金を受けている者だけであるが、(もしあれば)助成団体のアーカイブ、何らかの中央アーカイブ、研究者が所属する機関のアーカイブ、あるいはこれらのすべてから、論文のデポジット先を指定することはできる。

雇用者もこれらをすべて行うことができる。しかし、彼らは研究成果の発信という目的を研究者と共有しているだけでなく、機関アーカイブのコンテンツに付加的な価値を認め、それを利用するので、雇用者はコンテンツの量を最大にすることを特に願うだろうし、最低限でも機関アーカイブにデポジットすることを著者に要求するだろう。さらに、雇用者は、外部資金による支援を受けていない(多くの研究分野の大多数の)研究者やすべての学問分野にわたって、一律にセルフアーカイビングを命じて、監視することができる。これは、ただ助成団体の命令のみに依存することに比べて、包括的なイープリント供給のルートとしてはるかに効率的であり、最終的に全分野をカバーする中央アーカイブの設置に頼るより比較的早く分野のイープリントを提供できる可能性がはるかに高い。 機関アーカイブへのセルフアーカイビングを命ずる助成団体と雇用者(大学と研究機関)のニ方面からの攻撃が事態を前進させる最適の方法である。

最後に、多くの出版社は自社の雑誌に発表された論文の著者が、所属する機関のアーカイブや、学科や個人のWebサイトに論文をセルフアーカイブする行為を正式に認めるようになったが、「第三者」のアーカイブにセルフアーカイブすることは認めていない。新サービスのための集中モデルはおそらく「第三者」のカテゴリに入ると考えられるので、出版社の禁止規定に苦しむことになるだろう。

したがって、英国における全国的なイープリント供給のモデルにおける主要な項目であるセルフアーカイブされるコンテンツ量を最大にする可能性が最も高いのはこのシナリオであるというのが我々の結論であった。

収穫モデルの実装とそれに基づくサービス

ハーベスティングの方法

OAI準拠のアーカイブからメタデータをハーベストするにはいくつかの基本的な方法が存在する。

  1. 機関アーカイブ、主題アーカイブ、オープンアクセスジャーナルからのハーベスティングを全国的中央レベルで行う。その後、主題アーカイブやその他のサービスプロバイダはこの全国的中央サービスからその一部をハーベストするか横断検索する。
  2. 各主題分野のハーベスティングは主題ベースのサービスプロバイダで行う。その後、このプロバイダが全国サービスのためのデータプロバイダの役割を果たす。
  3. イープリント/OAジャーナル、電子学位論文、報告書など情報資源のタイプ毎に、各タイプに特化した機関がハーベスティングを行う。この機関が全国サービスのためのデータプロバイダの役割を果たす

現時点では、第1の選択肢が最も現実的であり、実行可能であると思われる。ただし、第2、第3の選択肢は、特にサービス管理のモジュラー化という利点を持っている。しかしながら、選択肢2で必要な主題ポータルや選択肢3で必要な仮想的な機関は今のところ存在しないので、現時点では全国レベルのハーベスティング(選択肢1)が作業の重複を避け、一貫性を保つ最善の方法を提供する。実際、選択肢1は既に、Eprints UKプロジェクト32というプロトタイプが存在する。

広域収穫モデル(上記選択肢1)に基づくサービスの選択肢

収穫モデルを英国におけるイープリントおよびオープンアクセスジャーナル論文の提供サービスの基礎として使用するには3つの基本的な方法が考えられる。

ePrints UK型のサービス

1つのプロトタイプであるePrints UKはイープリントアーカイブからメタデータをハーベストして、Webサービスによりメタデータを改善している。(大学やその他の研究機関である)データプロバイダはローカル側のサービスを改良するために、この改善されたレコードを逆ハーベストすることができる。一方で、ePrints UKは独自のインターフェースを通じてすべてのデータセットへのアクセスを提供している33

ポータルサービス

このモデルは単純かつ洗練されており、JISC情報環境アーキテクチャに沿っていると考えられる。欧州図書館プロジェクト34 はこのモデルを採用している。このモデルはePrints UKモデルとは異なり、Webサービスを削除し(将来システムが成熟したら再び追加するかもしれない)、利用できる機関アーカイブを持たない著者によりデポジットされる論文を「吸収する」中央アーカイブを追加したものである。モデルの構成を図4に示した。このモデルで使用されるプロトコルはすべて標準的なプロトコルであり、実装は容易かつ安価である。

図 4 ポータルモデル

Googleサービスモデル

DSpaceを使用している大学のアーカイブをOCLCに設置された検索システムを通じてGoogleにより検索する試みが現在進行中である35。試験が成功し、DSpace以外のソフトウェアを使用したアーカイブの検索にまで試行を拡大することができたら、これは他の2つのモデルを補うものになるかもしれない。

これらの詳細なサービスモデルのどれが最終的に英国における全国オープンアクセスサービスに採用されるにしても、これらの親モデルである収穫モデルが英国全国サービスの基礎となるべきモデルであることは明らかである。その利点は欠点をはるかに上回っており、全体として収穫モデルは他の選択肢である集中モデルや分散モデルより優れている。オープン・アーカイブズ・イニシアティブが採用した哲学は今まさに旬であり、収穫モデルは世界中で支持を得るようになっている。このモデルは学術情報資源に関する情報を共有することや高度な情報資源発見ツールを提供することを容易にし、その使用は世界各地に広がるようになっている。この観点から、収穫モデルを英国におけるオープンアクセスサービス提供の基礎とするべきことを推奨する。

参考文献

  1. UK House of Commons Science and Technology Select Committee Recommendations: http://www.publications.parliament.uk/pa/cm200304/cmselect/cmsctech/399/39903.htm
  2. National Institutes of Health recommendations: http://thomas.loc.gov/cgi-bin/cpquery/?&db_id=cp108&r_n=hr636.108&sel=TOC_338641&
  3. Rowland, F.,Swan, A.,Needham,P., Probets, S., Muir,A., Oppenheim, C.,O’Brien,A. and Hardy, R. Delivery, management and access model for E-prints and open access journals. Serials Review 2004, in press.
  4. Swan, A., Needham, P., Probets, S., Muir, A., O’Brien, A., Oppenheim, C., Hardy, R. and Rowland, F. Delivery, management and access model for e-prints and open access journals within further and higher education. 2004. http://www.jisc.ac.uk/journals_work.html
  5. Open Archives Initiative Protocol for Metadata Harvesting. http://www.openarchives.org/OAI/openarchivesprotocol.html. (日本語訳
  6. OAIster. http://oaister.umdl.umich.edu/o/oaister/
  7. Citebase Search. http://citebase.eprints.org/cgi-bin/search
  8. Directory of Open Access Journals (Lund University Library). http://www.doaj.org/
  9. BioMed Central. http://www.biomedcentral.com/
  10. Scientific Electronic Library Online. http://www.scielo.br/scielo.php/lng_en
  11. arXiv.org e-print archive. http://arxiv.org/
  12. Cogprints: Cognitive Sciences Eprints Archive. http://cogprints.ecs.soton.ac.uk/
  13. Institutional Archives Registry. http://archives.eprints.org/
  14. Eprints-UK statistics. http://eprints-uk.rdn.ac.uk/stats/
  15. Daedalus project at Glasgow University. http://www.lib.gla.ac.uk/daedalus/
  16. Needham, P.,Sidwell, K.,Bevan,S. and Harrington, J. The MAGiC Project. managing access to grey literature collections. Final report . October 2002. http://www.bl.uk/concord/docs/magic-final.doc(2005年3月1日現在リンク切れ)
    (新しいURL: http://www.bl.uk/about/cooperation/docs/report22.doc
  17. McGauran, P. $12million for managing university information. 2003. http://www.dest.gov.au/Ministers/Media/McGauran/2003/10/mcg002221003.asp
  18. Eprints UK. http://www.rdn.ac.uk/projects/eprints-uk/. 2004
  19. SHERPA project. http://www.sherpa.ac.uk/
  20. Focus on Access to Institutional Resources (FAIR) Programme. http://www.jisc.ac.uk/index.cfm?name=programme_fair
  21. Pinfield, S. Open archives and UK institutions: an overview. D-Lib Magazine 2003:9 (3). Available at http://www.dlib.org/dlib/march03/pinfield/03pinfield.html
  22. Harnad, S. and Brody, T. Comparing the impact of open access (OA) vs. non-OA articles in the same journals. D-Lib Magazine, 2004:10 (6). http://www.dlib.org/dlib/june04/harnad/06harnad.html日本語訳
  23. Harnad, S., Carr, L., Brody, T. and Oppenheim, C. Mandated online RAE CVs linked to university eprint archives: enhancing UK research impact and assessment. Ariadne, 2003:35. http://www.ariadne.ac.uk/issue35/harnad.
  24. Eprints.org. Registry of Departments and Institutions who have adopted an OA self-archiving policy. http://www.eprints.org/signup/fulllist.php
  25. Eprints Handbook: Actions for Departments to Achieve Open Access. http://software.eprints.org/handbook/departments.php
  26. Self-Archiving FAQ for the Budapest Open Access Initiative (BOAI). http://eprints.org/self-faq
  27. OSI Eprints Handbook. http://software.eprints.org/handbook/
  28. RoMEO self-archiving policies by publisher. http://romeo.eprints.org/publishers.html
  29. RoMEO summary statistics. http://romeo.eprints.org/stats.php
  30. Swan, A. and Brown, S. JISC/OSI journal authors survey report. 2004. http://www.jisc.ac.uk/uploaded_documents/JISCOAreport1.pdf
  31. Swan, A. and Brown, S. Authors and open access publishing. Learned Publishing, 2004:17 (3), 219-24. http://www.keyperspectives.co.uk/OpenAccessArchive/Authors_and_open_access_publishing.pdf
  32. Cliff, P. ePrints UK . architecture: 1.032003, based on project proposal. 2003. http://www.rdn.ac.uk/projects/eprints-uk/docs/technical/architecturev1.032003/
  33. Martin, R. ePrints UK: developing a national e-prints archive. Ariadne, 2003:35. http://www.ariadne.ac.uk/issue35/martin
  34. van Veen, T. and Oldroyd, B. Search and retrieval in the European Library: a new approach. D-Lib Magazine, 2004:10, Feb. http://www.dlib.org/dlib/february04/vanveen/02vanveen.html
  35. Macleod, D. Google launches research archive project. Guardian Unlimited. 2004. http://education.guardian.co.uk/higher/news/story/0,9830,1191090,00.html

    Alma Swan and Sheridan Brown
    Key Perspectives Ltd
    48 Old Coach Road, Playing Place
    Truro TR3 6ET, UK
    Email: maito:aswan@keyperspectives.co.uk

    Alma Swan

    Paul Needham
    Information & Library Services
    Cranfield University
    Cranfield, Bedfordshire MK43 0AL
    UK
    Email: paul.needham11@btinternet.com

    Paul Needham

    Steve Probets, Adrienne Muir, Charles Oppenheim, Ann O’Brien, Rachel Hardy and Fytton Rowland
    Department of Information Science
    Loughborough University
    Loughborough, Leicestershire LE11 3TU
    UK