Astrophysics Data System -Wikipedia、無料百科事典

before-content-x4

天体物理データシステム (要するに 広告 ) – NASAによって作成された天文学と物理学からの800万件を超える文書のオンラインデータベース。これらの分野の科学者によってレビューされ、非実現されています。ほぼすべての記事のオンライン要約は、GIFおよびPDF形式で保存された古い記事のスキャンと同様に無料で利用できます。データベースには、雑誌のWebサイトで公開されている新しい記事の電子版へのリンクも含まれていますが、通常、有料サブスクリプション(ほとんどの天文学研究センターが購入)を通じてのみ利用できます。ベースは、ハーバード – スミソニアン天体物理学センターによって管理されています。

after-content-x4

ADSは強力な研究ツールであり、1992年の創業以来、天文学的な研究効率に大きな影響を与えます。以前にすべての日または数週間をかけた可能性のある文献を検索することは、天文学的な問題のために開発された高度なクエリシステムのおかげで、数秒で数秒で可能になりました。調査によると、広告の使用に起因する天文学の利点は、年間数億ドルを費やすことと同等であることが示されています。 [初め] ;また、システムが天文学的な雑誌の読みを3回引き起こすと推定されています [2]

広告の使用は、世界中の天文学者の間でほぼ一般的です。つまり、ADS統計を使用して、世界の天文学研究の傾向を分析できます。これらの統計によると、天文学の分野で実施されている研究の数は、国内総生産(GDP)、一人当たり(一人当たり)の規模と強く相関していること、および国の天文学者の数はこの国のGDPに比例していることが示されています。 [2]

長年にわたり、(他の科学分野と同様に)天文学研究の問題が増えていることは、主要な天文雑誌に掲載された記事の数が、天文学者が最新の研究の結果に精通することができなかったペースで絶えず成長していることでした。 1980年、天文学者は、新興のインターネット関連のテクノロジーを効果的に使用して、天文学的な科学研究の電子インデックスシステムを構築できることに気付きました。 [3]

最初に会議で 大きなデータベースからの天文学 、1987年にGarching BeiMünchenで開催され、紙雑誌の概要のデータベースを作成することが提案されました。次の2年間、天体物理学出版物の電子アクセスシステムの基本が作成され、1991年には、利用可能なすべてのカタログ名を含むSimbadデータベースとの広告の統合に関する議論がありました。 [2]

40の作品で構成されるデータベースを備えた最初の広告バージョンは、1988年に概念研究として開始され、ADSデータベースは1993年の夏にSimbadデータベースと正しく組み合わされました。クリエイターは、それがインターネット上の最初のシステムであると確信し、大西洋の両側で科学データベースを同時に使用できるようにしました。 1994年まで、このサービスはADSネットワークのニーズに合わせて作成されたソフトウェアを介して利用可能でしたが、今年の初めには、新しいWorld Wide Webに転送されました。 Webサイトユーザーの数は、インターネットリソースへの広告サービスの導入から5週間以内に4回増加しました [2]

当初、広告で入手可能な記事は、紙の雑誌からスキャンされたビットマップ画像でしたが、1995年でした。 Astrophysical Journal 彼はオンライン版の公開を開始し、すぐに他の主要な雑誌の後に 天文学と天体物理学 王立天文学協会の毎月の通知 。広告には、最初の開示からこれらの電子版へのリンクが含まれていました。 1995年頃から、広告ユーザーの数は2年ごとに2倍になりました。広告には現在、概要を提供するほぼすべての天文雑誌と契約があります。スキャンされた記事は、19世紀初頭からウェブサイトから入手できますが、現在は合計で800万件以上の文書が含まれています。このサービスは世界中で利用可能です – 5つの大陸の12か国にある12のミラーの助けを借りて、RSYNCを使用した毎週の更新を通じてデータベースが同期され、更新が変更されたデータベースの部分のみを更新できるミラーリングツールを使用します。すべての更新は中央に実行されます [4]

after-content-x4
M101に関する1284文書は、1850年からADSで利用できます。

ドキュメントは、著者のリスト、書誌、引用などの出版物やさまざまなメタデータの記事に関する詳細情報を含む、書誌記録によってデータベースにインデックスされています。もともと、データはASCII形式で保存されていましたが、2000年のすべてのデータベースレコードがXML(拡張可能なマークアップ言語)形式に移行するため、ADS管理者によってそれに関連する制限は認識されました。書誌レコードは現在、さまざまなメタデータの形でサブエレメントがXML要素として保存されています [4]

オンライン雑誌が入手できるため、記事の公開日前または雑誌の全文がサブスクライバーが利用できるように、要約は広告にロードされます。古い記事がスキャンされ、光記号認識ソフトウェア(OCR)を使用して要約が作成されます。 1995年以前からスキャンされた記事は、通常、雑誌出版社の同意を得て無料で利用できます [5]

スキャンされた記事は、中分解能と高解像度の両方でTIFF形式で保存されます。 TIFFファイルはGIFファイルに変換され、画面またはPDFまたはPostScriptで表示されます。次に、生成されたファイルは保存され、最も人気のある記事の不必要な頻繁な再生成を排除します。 2000年には、138,789の記事が含まれている1,28,955ページをカバーする250 GBのスキャンが含まれていました。 2005年まで、このサイズは650 GBに増加し、さらなる成長は約900 GBから2007年に予想されていました [5] 。 (このテーマに関するそれ以上の情報はありません)。

データベースには当初、天文学的な出版物の参照のみが含まれていましたが、現在、天文学(惑星研究やヘリオフィ物理学を含む)、物理学(科学機器および地質学)、およびARXIVベースからの科学的研究の事前リントを含む3つのデータベースが含まれています。天文学データベースは、はるかに高度なものであり、その使用は広告の総使用量の約85%を占めています。記事は、トピックに応じて異なるデータベースに割り当てられ、1つの雑誌の記事が3つのテーマデータベースすべてに表示されるように公開されていません。データベースを分離することで、各分野で検索することで、単語を自動的に異なる割り当てできるように調整できます スケール さまざまな検索されたデータベースで、それらが指定されたフィールドにどれだけ近いかに応じて [4]

プリプリントのアーカイブのデータは、物理学と天文学の分野におけるプリプリントの主要なリポジトリであるArxivで毎日更新されます。 ADSなどのプリプリントサーバーの登場は、天文学研究の進捗状況に大きな影響を与えました。これらの文書は、雑誌で出版される数週間、さらには数週間、さらには数ヶ月前に利用できるようになるためです。 ARXIVプリプリントを広告に含めることは、検索エンジンが最新の利用可能な研究に関する情報を返す可能性があることを意味します。これは、プレプリントにレビューが含まれていないか、雑誌に必要な出版基準に修正される可能性があるという条件があります。プリプリントは、記事の公開後、可能な限り、引用符とリンクが雑誌の記事へのリンクを返すような方法で広告データベースに関連しています。 [6]

このソフトウェアは、特に書かれたシステムで機能します。これにより、天文学的なニーズへの重要な適応が可能になります。これは、汎用データベースの場合は不可能です。スクリプトは、システムプラットフォームから独立しているように設計されています。これは、さまざまなシステムで世界中で動作するミラーを動作させる必要があるために重要ですが、天文学アプリケーションのオペレーティングシステムとしてLinuxをますます頻繁に使用することで、このプラットフォームにインストールするためのスクリプトの最適化につながりました。 [4]

メインADSサーバーは、米国のマサチューセッツ州ケンブリッジのハーバードスミソニアン天体物理学センターにあります。これは、3.0 GHzの2つの4コアプロセッサを持つIntel X86アーキテクチャの64ビットサーバーであり、32 GBのRAMがLINUX Centos 5.4 5.4の制御下で動作します。 [5] 。ミラーリーはブラジル、中国、チリ、フランス、ドイツ、インド、インドネシア、日本、ロシア、韓国、イギリス、ウクライナにあります [7]

広告は現在、ほぼ200の雑誌から概要またはコンテンツの表を受け取ります。多くのソースから同じ記事のデータを受け取ると、すべてのソースからの最新のデータに基づいて1つの参考文献リンクを作成します。ほとんどすべての科学雑誌によるTEXとラテックスシステムの共同使用は、システムに書誌データを標準形式で含めることを大幅に促進し、HTMLインターネット形式に記事を簡単にインポートできます。 ADSはPerlで書かれたスクリプトを使用して、書誌データのインポート、処理、標準化を使用します [4]

著者の名前をシステム内の名前の標準録音に変換するという一見平凡なタスク(名前の名前)は、実際には自動化の最も難しいタスクの1つです。これは、世界中の命名の幅広い範囲の名前と、例えば デイビス それは最初の名前、2番目の名前または姓かもしれません。名前の正確な変換には、天文学と広告でアクティブな著者の名前に関する詳細な知識が必要です。これは、著者の名前の包括的なデータベースを維持します。これは、データベースの検索にも使用されます(以下を参照)。

電子版の記事の場合、記事の最後にあるリンクのリストは簡単にインポートされます。スキャンされた記事の場合、書誌のリストはOCRソフトウェアを使用してインポートされます。データベースは、データベース内の各ドキュメントの引用のリストを簡単に作成できます。参考文献リストは、データベースに欠落している人気のある記事を特定するために過去に使用されていました。それらのほとんどは1975年以前の記事であり、すでにシステムに追加されていました。

  1. M.J. Kurtz、Eichhorn G.、Accomazzi A.、Grant C.S.、Murray S.S.、Watson J.M. NASA Astrophysicsデータシステム:概要 。 「天文学と天体物理学の補足」。 143(1)、s。 41–59、2000。doi: 10.1051/AAS:2000170 。 arxiv: Astro -PH/0002104 。 bibcode: 2000a&as..143 … 41k 。 [アーカイブ 住所 2009-06-10]。
  2. a b c d M.J. Kurtz、Eichhorn G.、Accomazzi A.、Grant C.S.、Demleitner M.、Murray S.S. NASA天体物理学データシステムデジタルライブラリの世界的な使用と影響 。 「情報科学技術協会のジャーナル」。 56(1)、s。 36、2005。Doi: 10.1002 / But.20095 。 bibcode: 2005Jasis..56 … 36K プリプリント )。
  3. J.C.良い。 Astrophysics Data System(ADS)、Astronomical Data Analysis SoftwareおよびSystemsの概要I 。 „ A.S.P.会議シリーズ」。 25、s。 35、1992。DianaM。Worrall、Chris Biemesderfer、Jeannette Barnes。
  4. a b c d そうです A. Accomazzi、Eichhorn G.、Kurtz M.J.、Grant C.S.、Murray S.S. NASA Astrophysicsデータシステム:アーキテクチャ 。 「天文学と天体物理学の補足」。 143(1)、s。 85–109、2000。doi: 10.1051/AAS:2000172 。 arxiv: Astro -PH/0002105 。 bibcode: 2000a&as..143 … 85a 。 [アーカイブ 住所 2009-06-10]。
  5. a b c NASA広告抽象サービスミラーリング情報 。ハーバード・スミソニアン天体物理学センター、2005-06-23。 ))
  6. APS – 2007 APSマーチミーティング – イベント – Myads-Arxiv:完全にカスタマイズされたオープンアクセス仮想ジャーナル 。 Meetings.aps.org。 ))
  7. SAOのSAO/NASA広告:ミラーサイト 。 doc.adsabs.harvard.edu。 ))
after-content-x4