Google™サイト内検索(カスタム検索エンジンv2)で類義語をXMLで定義する
2014/11/22
Google™カスタムエンジンによるサイト内検索フィールドを設置して、
類義語の登録を行おうと思った際には個別に入力するよりも、
バックアップも兼ねて元のデータをXMLで作成した方が便利です。

はじめに
カスタム検索エンジンをサイトに設置していて類義語の設定はされていますか?
私もこれまでは検索窓を設置しただけで特にカスタマイズをしてきませんでした。
カスタム検索エンジンには様々なオプションが用意されており多くの設定を行うことができます。
この類義語の登録もその一つです。
類義語の考え方
カスタム検索エンジンにおいての類義語とは、一般的な読み替えや表記の振れなどを示してはいません。
例えば、「ワードプレス」と検索窓に入力した場合でも、
「WordPress」や「wordpress」といった文字列でも検索結果として該当します。
こうした、表記の振れではなく「ワードプレス」や「wordpress」と入力した際に、
「コンテンツマネジメントシステム」、「CMS」、「ブログ」など、
全く別の用語を検索結果に含めたい場合に利用します。
類義語のXMLフォーマット
類義語のXMLフォーマットに関しては、
カスタム検索エンジンに既に登録した類義語をXMLエクスポートすることで触れることができます。
ダウンロードした際のデフォルトファイル名は「Synonyms.xml」です。
ダウンロードしたXMLファイルは以下のようなソースになっています。
|
1 2 3 4 5 6 7 |
<?xml version="1.0" encoding="UTF-8"?> <Synonyms start="0" num="1" total="1"> <Synonym term="wordpress"> <Variant>CMS</Variant> <Variant>ブログシステム</Variant> </Synonym> </Synonyms> |
このXMLファイルのフォーマットについてはGCSのサイトが参考になります。
(参考文献)CGSの類義語
GCS の設定 – Google Commerce Search — Google Developers
尚、本リンク先「Google Commerce Search」のヘルプになります。
純粋な「カスタム検索エンジン」のヘルプではありません。
ヘルプでは以下のように明記されています。
次の階層に示すように、類義語ファイルには要素が 1 つあり、複数の兄弟要素を指定できる子要素が 1 つあります:
Synonyms(1 つのみ)
Synonym term(複数の兄弟要素を指定可能)
Variant(Synonymごとに最大 10 個)検索キーワードを
Synonym子要素の属性値として作成し、類義語をそれぞれVariant要素で定義します。検索キーワードとその類義派生語句には、1 つの単語(「cookie」など)または語句(「buttermilk cookie」、「crying over spilled milk」など)を指定できます。
項目 最大許容値 検索キーワード( Synonym term要素)の数複数(ただし、検索エンジンごとに派生語句の総数が 500 個を超えないこと) 検索キーワードごとの派生語句( Variant要素)の数10 検索エンジンごとの派生語句( Variant要素)の総数500 ファイル サイズ 500 KB ファイルの数 必要な数(ただし、アカウントの全ファイルの合計サイズが 4 MB を超えないこと)
このヘルプにしたがってXMLファイルを記載します。
ExcelでXML定義の編集方法を以下でご紹介していますが、
この類義語では複数値(Variant要素)の定義になっている為、Excelでは編集が困難かと思います。
Google™サイト内検索(カスタム検索エンジンv2)のXMLファイルをExcelで作成・編集する
類義語登録の例
今回は以下のような単語を類義語として登録してみます。
作成したXMLファイルは以下のようなものです。
ファイル名は「Synonyms_edit.xml」としています。
インポートするXMLの例
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 |
<Synonyms> <Synonym term="wordpress"> <Variant>CMS</Variant> <Variant>ブログシステム</Variant> </Synonym> <Synonym term="カスタム検索エンジン"> <Variant>検索窓</Variant> <Variant>検索ボックス</Variant> <Variant>サイト内検索</Variant> </Synonym> <Synonym term="検索エンジン"> <Variant>Google検索</Variant> <Variant>Yahoo検索</Variant> <Variant>Bing検索</Variant> <Variant>goo検索</Variant> </Synonym> <Synonym term="収益化"> <Variant>AdSense</Variant> </Synonym> <Synonym term="アクセス解析"> <Variant>Analytics</Variant> </Synonym> <Synonym term="アクセス解析"> <Variant>忍者アクセス解析</Variant> <Variant>NINJA ANALYZE</Variant> <Variant>Research Artisan Lite</Variant> <Variant>FC2アクセス解析</Variant> <Variant>Netowl</Variant> <Variant>QLOOK</Variant> <Variant>ClickTale</Variant> <Variant>AccessAnalyzer.com</Variant> <Variant>UserLocal</Variant> <Variant>なかのひと</Variant> </Synonym> </Synonyms> |
ダウンロードしたXMLの例では
「<Synonyms start=”0″ num=”1″ total=”1″>」と行数の合計が記述されていました。
設定する項目数が増えてしまった場合には、行数カウントは非常に面倒なのでここでは省略します。
また1行目のXML定義に関しても削除してしまっても取り込むことができます。
ただし、上記ヘルプ記載の許容値である、
類義語の数(10個)などを超えてXML定義を行うと、XMLインポート時にエラーになります。
実際にインポートを行うと、以下のように類義語が登録され表示されます。
注意事項
今回取り込んだXMLにて「アクセス解析」というキーワードをXML上で2度定義しています。
こうした重複したキーワードを指定した場合、最後に取り込んだ属性のみが有効になります。
例では「アクセス解析≒Analytics」の類義語は上書きされ登録されていません。
また既に登録されているキーワードと同じキーワードが既に登録されている場合も、
XMLによってキーワードは上書き更新されます。
このようにして類義語を登録し、検索結果に表示することができますが、
設定を変更してから類義語の検索が有効になるまでにはしばらく時間が必要です。
サイト内に設置してからしばらくすると、類義語で検索された検索結果が表示されてくるはずです。
さいごに
類義語の検索は個人的にはユーザーが検索してくれたキーワード以外の語句で、
検索結果に表示されてしまうことから、私は設定されることはお勧めしません。
カスタム検索エンジンが独自にリストアップしてくれる、
語句の振れの補正程度が丁度いいかなと思うところです。
あまり多くの類義語を設定してしまうと本当にユーザーが必要な情報を
検索することができなくなってしまいますので注意が必要です。
Google™はGoogle Inc. の登録商標(第4478963号及び第4906016号)です。
GoogleロゴはGoogle Inc. の国際登録商標です。
国際登録番号:881006及び926052及び1086299及び1091990及び1145934
Google AdSense™,AdSense™はGoogle Inc. の登録商標(第4899412号)です。
関連記事
-
-
Google™Analyticsのレポートは明日まで待たずにすぐに確認できたんですね。実は・・・
Google or AdMax Promotion(it) 禁断の機能がau公式 …
-
-
Google™サイト内検索(カスタム検索エンジンv2)の検索機能設定
Google or AdMax Promotion(it) 禁断の機能がau公式 …
-
-
Google™アカウントの登録手順
Google or AdMax Promotion(it) 禁断の機能がau公式 …
-
-
(無料編)Gmail™サブメールアドレスの設定方法
Google or AdMax Promotion(it) 禁断の機能がau公式 …
-
-
Google™AdSense検索向けAdSense広告(カスタム検索エンジン)と検索結果ページへの広告表示について
Google or AdMax Promotion(it) 禁断の機能がau公式 …
-
-
Google™AdSenseサイト内検索(カスタム検索エンジンv2)の利用統計を確認する
Google or AdMax Promotion(it) 禁断の機能がau公式 …
-
-
Google™サイト内検索(カスタム検索エンジンv2)のデザイン設定(テーマ)
Google or AdMax Promotion(it) 禁断の機能がau公式 …
-
-
Gmailのエイリアス(サブアドレス)を利用した複数アドレスの活用と可能性
Google or AdMax Promotion(it) 禁断の機能がau公式 …
-
-
Blogger™を利用する際に実名を利用しない方法
Google or AdMax Promotion(it) 禁断の機能がau公式 …
-
-
(オーバーレイ)Google™サイト内検索(カスタム検索エンジンv2)のレイアウト導入方法と実際動作
Google or AdMax Promotion(it) 禁断の機能がau公式 …




