検索エンジンとは |
検索エンジンは、Webページで公開されている情報を蓄えておき、検索エンジンが使用された際に、その検索キーワードにマッチした情報を検索エンジン会社独自の基準で順番に表示する仕組みです。
検索エンジンは一種のプログラムで、それを保有しているWebサイトがサービスとして提供しており、その費用はページに掲載する企業の広告料金で運営されています。
|
検索エンジンの種類
|
検索エンジンには大きく分けて3つのタイプがあります。
|
ディレクトリ型検索エンジン
ディレクトリ型検索エンジンとは、Webサイトをそれが属するテーマやトピックによって分類して掲載している検索エンジンのことを指します。掲載されているWebサイトは人間の目によって審査されています。
ディレクトリ型には下記のような特徴があります。
カテゴリーによる分類の掲載
ディレクトリ型はカテゴリーによって分類が行われています。また、このカテゴリーは階層化されており、上位階層は広いジャンルで、深い層に行くほど特定されたジャンルを対象にしています。(図1)
|
図1 カテゴリーの階層化
|
|
当Webサイトである「千葉県産業振興センター」をYahoo!JAPANで検索してみましょう。
すると2つのカテゴリーに登録されています。また、階層表示にすると表2のようになります。
|
表2 カテゴリーによる分類例
階層 |
カテゴリー |
カテゴリー |
第1階層 |
地域情報 |
ビジネスと経済 |
第2階層 |
日本の地方 |
起業、中小企業経営 |
第3階層 |
関東 |
団体 |
第4階層 |
千葉県 |
|
第5階層 |
ビジネスと経済 |
|
第6階層 |
団体 |
|
|
ロボット型検索エンジン
ロボット型検索エンジンがディレクトリ型検索エンジンと異なる点は、Webページの収集方法にあります。
ロボット型検索エンジンはスパイダー(spider)、別名クローラー(crawler)と呼ばれるソフトウェア(ロボット)を利用して、インターネット上のWebページを巡回してWebページデータを取得しています。
ロボット型検索エンジンは登録されているWebページをキーワードに応じて表示するが、その際の表示順位はそれぞれの検索エンジンが独自の方式に則って決定しています。(図2)
|
図2 ロボット型検索のしくみ
|
|
ハイブリッド型検索エンジン
ディレクトリ型検索サイトとロボット型検索エンジンの長所を合わせもったサービスで、検索結果次第で、結果を何段階かの過程を経て表示します。
|
日本の主要検索エンジンを分類する |
具体的に日本でよく使われる検索エンジンがどういった仕組みを採用して、提供しているのかを見ていきます。
まず、主要検索エンジンのWebサイトとその種類については下記の通りです。(表1)
|
表1 主な検索エンジンの種類と検索データの出力
検索サービス |
タイプ |
第1検索結果 |
第2検索結果 |
Yahoo!JAPAN |
ハイブリッド型 |
Yahoo!JAPAN |
YST |
MSN |
ハイブリッド型 |
BTLookSmart |
Inktomi |
Google |
ロボット型 |
Google |
DMOZ |
infoseek |
ロボット型 |
infoseek |
− |
|
日本で一番人気のあるYahoo!JAPANはハイブリッド型に分類されます。
|