エンタープライズ検索 – ウィキペディア

before-content-x4

エンタープライズ検索 また。 会社 – 全体の検索 情報検索のサブエリアについて説明し、SO -Clawlerを使用してコンテンツをインデックス化する内部検索エンジンの助けを借りて、コンピューター支援コンテンツ指向の検索のプロセスを指します。

after-content-x4

ただし、検索は通常、元のデータソースではなく、検索インデックスで実行されます。このインデックスには、主に、さまざまなデータベースからのドキュメントやファイルシステムからのエントリなどの内部データソースが含まれます。

見つかったヒットまたはドキュメントは、テキスト抽出(「スニペット」)として検索クエリのコンテキストで表示されます。このプレビューは、結果の関連性をすばやく評価できます。個々のデータソースの継続的なインデックス作成により、結果の局所性が保証されます(結果セット)。

企業の観点から見ると、エンタープライズ検索の利点は、仕事に関連する情報の検索における従業員のサポートです。

ほとんどの場合、検索エンジンは、クロール/インデックス作成エンジン、クエリエンジン、ランキング/関連エンジンの3つの主要なコンポーネントで構成されています。

クロール/インデックスングエンジンは、ソースからドキュメントとデータの調達を保証し、この情報を効率的に検索可能な構造に配置します。また、結果の結果のドキュメントプレビューを提示するために使用されるドキュメントキャッシュの作成を保証します。
クエリエンジンでは、インデックスのヒットを検索し、結果のリストを作成します。
ランキング/関連エンジンは、ソートを担当するかヒットの順序。

通常、Webブラウザは表面として使用され、結果はインターネット検索エンジンの形式と同様の形式で表示されます。

多くのエンタープライズ検索メーカーは、検索ソリューションにコンテンツを表示するために、広範な企業アプリケーション用のさまざまなアダプターまたはコネクタを提供しています。顧客データベースからの直接クエリに加えて、グループメールアプリケーション、コンテンツ、またはドキュメント管理システム用のプラグインが典型的です。多くの場合、個別のファイルシステム(ネットワークドライブ)としてのインチーティングも可能です。 「Federated Search」コネクタも使用されます。これは、検索クエリをターゲットシステムに渡し、得られた部分的な結果を結果に統合します。

after-content-x4

一般に、フロントエンドとバックエンドの間に区別が行われます。

個々のコネクタに加えて、バックエンドには通常、さまざまなフロントエンドが提供する検索クエリのクローラー、インデクサー、パーサーが含まれます。これらの問い合わせは、指定されたデータベースから情報を提供する実際の検索エンジンに転送されます。

フロントエンドには、一般的に設計の自由が大きくなります。たとえば、他の関連するサブジェクト領域を表示したり、タグクラウドまたはファセット分類を介してナビゲーションを表示するタイピンググライダーの疑いのある提案により、単に入力フィールドになるか、より快適さを提供することもできます。さらなる基準によって検索クエリを補完するか、サブターム(例えば分類ツリーに沿って)を選択することにより、ヒットをさらに制限することは、ドリルダウンとしても知られています。結果のフォーマット(例えば、異なる側への分割)は、通常、フロントエンドでも行われます。フロントエンドには、通常、検索クエリを保存する可能性など、すべての純粋な快適な機能も含まれます。

同様の手法とアルゴリズムは、一般に、インターネット検索と同様にエンタープライズ検索で使用されます。一方で、これらはクローラーです。別の共通性は、関連性のある大きなインデックスとヒットの並べ替えです。

次の違いが存在します。 [初め]

安全
情報とデータを不正アクセスから保護するために、責任者はデータソースを共有する必要があります。探している情報へのアクセスは、当社の適用される規定と規則、およびデータ保護ガイドラインに準拠する必要があります。統合された権利管理により、ユーザーはまた、アクセスできる会社のデータのみを見つけることができます。言い換えれば、会社およびその外でのデータの乱用を防ぐために、ファイルとフォルダーのユーザーの承認を会社内で保証する必要があります。
gentatur
ランキングは、「ドキュメントへのリンク数」というパラメーターでは影響を受けません。ただし、一部のアプリケーションとソースには独自のインデックスがあります。検索エンジンのパフォーマンスを向上させるには、これらのインデックスを作成する必要があります。これにより、貴重なプロセスリソースが節約されます。リンクに基づいて情報の関連性を決定する可能性がない場合、メタデータの概念は会社の検索において非常に重要になります。
ソース
検索可能なデータは、Webサーバーだけでなく、他のさまざまなストレージ場所からもあります。これらには、ネットワークドライブ、イントラネット、アプリケーション、電子メールシステム、ローカルデータ、および交互のデータが含まれます。 B. USBスティックまたはCD-ROMドライブ。
コンテンツ
内容は、検索エンジンによるインデックス作成に最適化されていません。操作され、スパムはありません。これにより、構造化されたデータと非構造化データの両方が使用に適しています。

構造化されたコンテンツを管理する目的でデータベースとは対照的に、検索エンジンは主に非構造化コンテンツの開発に使用されます。検索するソースの数に関しても大きな違いがあります。エンタープライズ検索では、いくつかの異なるソースを検索できますが、データベースのクエリは通常1つに制限されます。単純なキーワードを入力できるため、SQLなどのデータベース需要言語は必要ないため、検索アーキテクチャのクエリ言語は非常に簡単です。これらの側面に加えて、検索エンジンは何倍も高速です。通常、クエリには、数時間かかる複雑なデータベースクエリとは対照的に、最大1秒かかります。

IDC市場の研究者は、彼らの研究の最近の更新で予測しています 多様で爆発するデジタルユニバース [2] デジタル情報量とフォームバリアントの実際の爆発。情報のデジタル洪水は現在、年間60%増加しています。 2011年までに、2006年と比較して迷惑に対応する約1,800個の例(10個の高い18バイト)に到達することになっています。

IDCによると、人々はこのデータの成長の70%を担当しています。それにもかかわらず、組織および企業のIT部門は、発生するデータの約85%の保管、提供、送信、データ保護に関与しています。この急速に成長し、多面的なデータの洪水は、前例のない複雑さでITマネージャーに直面しています。その必要に応じて、多くの企業は、データ管理とメンテナンスのための統一された中央の中央システムで、野生の成長を制御し続けようとしています。 Juergen Langeによると、DMSソリューションは非常に迅速に制限に達しています。その結果、従業員が必要な情報を取得することがますます困難になっています。

これは、企業が生き残るための情報を開発し、見つけます。セキュリティ関連の規定のコンプライアンスは重要な役割を果たします。これは当然のことながら、エンタープライズ検索ソリューションには当然のことですが、無料の検索エンジンソフトウェアの大部分は無料でインストールを提供しましたが、そのようなプログラムは、データとアプリケーションの動作を保存するコンピューターのデータベースに完全な目次を作成します。これらの検索エンジンは、正式にレポートを外の世界に転送します。

このようなソリューションのプロバイダーは、個人データを転送せず、動きと行動データのみを転送することを保証します。これが行われるデータ保護ガイドラインによれば、通常は秘密のままです。インストール後、多くの企業のセキュリティメカニズムはしばしば効果がありません。最初の1万語をキャプチャするインデックス作成は、多くの場合、完全なコンテンツを反映しています。ドイツまたはヨーロッパの法律地域以外のこのような知識には、計り知れない起業家の危険の可能性があります。情報と盗難と取引は、有利な市場を形成します。

ドイツとヨーロッパでは、米国と比較してエンタープライズ検索ソリューションのノウハウと能力が比較的少ない。この主要な技術を支配するドイツの企業や欧州の研究プロジェクトはほとんどありません。ここでは、ドイツの中流階級を支援するために政治が必要です。さらに、判例法は、国内およびヨーロッパのデータ保護ガイドラインを尊重するために、外国のプロバイダーを存続させなければなりません。

  • マーティン・ホワイト: 検索作業を行う。 Web、イントラネット、エンタープライズ検索の実装。 Facet Publishing、London 2007、ISBN 978-1-85604-602-2。
  • Juergen Lange: データの洪水 – 呪いや祝福?エンタープライズ検索で情報を簡単かつ安全に見つける方法。企業向けの戦略的ツール。 フランクフルター一般本、フランクフルトAMメイン2009、ISBN 978-3-89981-196-4。
  • ジュリアン・バール: エンタープライズ検索 – 会社のコンテンツを検索します。 In:Dirk Lewandowski(編): ハンドブックインターネット検索エンジン。科学と実践におけるユーザーオリエンテーション。 Academic Publishing Company、別名2009年、ISBN 978-3-89838-607-4、pp。329–355、 オンラインバージョン
  1. ウド・クルシュヴィッツ、チャーリー・ハル: 企業の検索 。の: 情報検索の基礎と傾向 、11、2017、S。1–142、 doi:10.1561/1500000053
  2. emc.com: 多様で爆発するデジタルユニバース 記念 2013年4月4日から インターネットアーカイブ ; PDF; 442 kb)
after-content-x4