頑張らない!でも諦めない!必死にならずにええかげん

Google™サイト内検索(カスタム検索エンジンv2)で類義語をXMLで定義する

      2014/11/22

Google or AdMax Promotion(it)

Google™カスタムエンジンによるサイト内検索フィールドを設置して、
類義語の登録を行おうと思った際には個別に入力するよりも、
バックアップも兼ねて元のデータをXMLで作成した方が便利です。

はじめに

カスタム検索エンジンをサイトに設置していて類義語の設定はされていますか?
私もこれまでは検索窓を設置しただけで特にカスタマイズをしてきませんでした。

カスタム検索エンジンには様々なオプションが用意されており多くの設定を行うことができます。
この類義語の登録もその一つです。

類義語の考え方

カスタム検索エンジンにおいての類義語とは、一般的な読み替えや表記の振れなどを示してはいません。

例えば、「ワードプレス」と検索窓に入力した場合でも、
「WordPress」や「wordpress」といった文字列でも検索結果として該当します。

こうした、表記の振れではなく「ワードプレス」や「wordpress」と入力した際に、
「コンテンツマネジメントシステム」、「CMS」、「ブログ」など、
全く別の用語を検索結果に含めたい場合に利用します。

類義語のXMLフォーマット

類義語のXMLフォーマットに関しては、
カスタム検索エンジンに既に登録した類義語をXMLエクスポートすることで触れることができます。
ダウンロードした際のデフォルトファイル名は「Synonyms.xml」です。

01_類義語XMLダウンロード

類義語XMLダウンロード

ダウンロードしたXMLファイルは以下のようなソースになっています。

このXMLファイルのフォーマットについてはGCSのサイトが参考になります。

(参考文献)CGSの類義語

GCS の設定 – Google Commerce Search — Google Developers

尚、本リンク先「Google Commerce Search」のヘルプになります。
純粋な「カスタム検索エンジン」のヘルプではありません。

ヘルプでは以下のように明記されています。

次の階層に示すように、類義語ファイルには要素が 1 つあり、複数の兄弟要素を指定できる子要素が 1 つあります:

  • Synonyms (1 つのみ)
    • Synonym term (複数の兄弟要素を指定可能)
      • VariantSynonym ごとに最大 10 個)

検索キーワードを Synonym 子要素の属性値として作成し、類義語をそれぞれ Variant 要素で定義します。検索キーワードとその類義派生語句には、1 つの単語(「cookie」など)または語句(「buttermilk cookie」、「crying over spilled milk」など)を指定できます。

項目 最大許容値
検索キーワード(Synonym term 要素)の数 複数(ただし、検索エンジンごとに派生語句の総数が 500 個を超えないこと)
検索キーワードごとの派生語句(Variant 要素)の数 10
検索エンジンごとの派生語句(Variant 要素)の総数 500
ファイル サイズ 500 KB
ファイルの数 必要な数(ただし、アカウントの全ファイルの合計サイズが 4 MB を超えないこと)

このヘルプにしたがってXMLファイルを記載します。

ExcelでXML定義の編集方法を以下でご紹介していますが、
この類義語では複数値(Variant要素)の定義になっている為、Excelでは編集が困難かと思います。
Google™サイト内検索(カスタム検索エンジンv2)のXMLファイルをExcelで作成・編集する

類義語登録の例

今回は以下のような単語を類義語として登録してみます。

02_類義語のリスト例

類義語のリスト例

作成したXMLファイルは以下のようなものです。
ファイル名は「Synonyms_edit.xml」としています。

03_類義語XMLの例

類義語XMLの例

インポートするXMLの例

ダウンロードしたXMLの例では
「<Synonyms start=”0″ num=”1″ total=”1″>」と行数の合計が記述されていました。
設定する項目数が増えてしまった場合には、行数カウントは非常に面倒なのでここでは省略します。

また1行目のXML定義に関しても削除してしまっても取り込むことができます。

ただし、上記ヘルプ記載の許容値である、
類義語の数(10個)などを超えてXML定義を行うと、XMLインポート時にエラーになります。

04_XMLアップロードエラー

XMLアップロードエラー

実際にインポートを行うと、以下のように類義語が登録され表示されます。

05_登録された類義語

登録された類義語

注意事項

今回取り込んだXMLにて「アクセス解析」というキーワードをXML上で2度定義しています。

こうした重複したキーワードを指定した場合、最後に取り込んだ属性のみが有効になります。
例では「アクセス解析≒Analytics」の類義語は上書きされ登録されていません。

また既に登録されているキーワードと同じキーワードが既に登録されている場合も、
XMLによってキーワードは上書き更新されます。

このようにして類義語を登録し、検索結果に表示することができますが、
設定を変更してから類義語の検索が有効になるまでにはしばらく時間が必要です。

サイト内に設置してからしばらくすると、類義語で検索された検索結果が表示されてくるはずです。

プロモーション(btm)

Google or AdMax Promotion (it)

さいごに

類義語の検索は個人的にはユーザーが検索してくれたキーワード以外の語句で、
検索結果に表示されてしまうことから、私は設定されることはお勧めしません。

カスタム検索エンジンが独自にリストアップしてくれる、
語句の振れの補正程度が丁度いいかなと思うところです。

あまり多くの類義語を設定してしまうと本当にユーザーが必要な情報を
検索することができなくなってしまいますので注意が必要です。


Google™はGoogle Inc. の登録商標(第4478963号及び第4906016号)です。
GoogleロゴはGoogle Inc. の国際登録商標です。
国際登録番号:881006及び926052及び1086299及び1091990及び1145934
Google AdSense™,AdSense™はGoogle Inc. の登録商標(第4899412号)です。

*本ページ内に記載されされた各社ブランド、サービス名、商標、登録商標については、
各社ブランドのロゴや商標等に関する帰属についてをご確認ください


最後までお読みいただきありがとうございました。
アルゴリズン


役に立ったと思っていただけたら、以下からシェア頂けたら幸いです^^

QRコードからもこのURLを開けます。

Pitta Promotion

アイキャッチ画像に利用させて頂いております、各社ブランドのロゴやシンボルに関しては、
各社ブランドのロゴや商標等に関する帰属についてをご確認頂けますようお願い致します。
ロゴの使用等に関する苦情・ご意見等がございましたら管理者までご連絡ください。

AdMax Promotion

カテゴリ
すべて展開 | すべて省略

Rakuten Promotion

 - Google, XML, 検索ボックス

  関連記事