ウェブマスターがウェブのことを書いたら

ウェブマスターとして働いている管理人がウェブで躓いたこと、ググったことを備忘録として書いています。主に技術的なこと、WEBサイト設計のこと

Google向けサイトマップインデックスファイルの作成方法(XML形式)

   

 - サイトマップ

Google向けのXML形式のサイトマップインデックスファイルの作成方法をまとめます。サイトマップが複数ある場合、サイトマップインデックスファイルを作成すれば、サーチコンソールですべてのサイトマップを送信しなくても、このファイル1つで一括送信できるので便利です。

サイトマップインデックスファイル作成の【Googleのヘルプページ】はこちら

ファイルの制限、仕様

前回の記事、通常のXMLサイトマップの作成方法・仕様と同じで、Googleは標準のサイトマッププロトコルをサポートしているということですので、sitemaps.orgの仕様が適用できます。(※Googleのヘルプページとsitemaps.orgの仕様ルールが適用されます。)

sitemaps.orgの公式ページはこちら

以下が作成するファイルの仕様、制限です。サイトマッププロトコルのページに以下の記載があります。

ファイルサイズ1つのサイトマップインデックスファイルにリストできるURLの数
10MB(10,485,760バイト)以下に圧縮50,000個まで

必要な場合は、サイトマップファイルをgzip形式で10MB以下に圧縮してもOKです。50,000個以上のURLをリストする場合は、分割して複数ファイルを作成しましょう。

基本的なXMLの書き方

基本の記述ルールは次のとおりです。Googleのヘルプページに以下の記載があります。

  • sitemapindex – ファイルを囲む親タグ。
  • sitemap – ファイルにリストされた各サイトマップの親タグ(sitemapindex の子タグ)。
  • loc – サイトマップの URL(sitemap の子タグ)。
  • lastmod – サイトマップの最終更新日(省略可)。
<?xml version="1.0" encoding="UTF-8"?>
 <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <sitemap>
 <loc>http://www.example.com/sitemap11.xml</loc>
 <lastmod>2004-10-01T18:23:17+00:00</lastmod>
 </sitemap>
 <sitemap>
 <loc>http://www.example.com/sitemap22.xml.gz</loc>
 <lastmod>2005-01-01</lastmod>
 </sitemap>
 </sitemapindex>

上記が基本の形式です。緑字の箇所は、インデックスしたいxmlサイトマップのURLを記述します。gzip形式で圧縮している場合は、gzip形式のURLで記載。(上記例:sitemap22.xml.gzの方)

赤字のlastmod(ファイルの最終更新日)はオプションなので省略可能です。日付の記載方法はサイトマップファイルと同じです。

オプションのタグ

オプションタグはあくまでも検索エンジンは参考情報、ヒントとして使用されます。

属性説明記載方法
<lastmod>ファイルの最終更新日W3C Datetime形式で記述します。

  • YYYY (eg 1997)
  • YYYY-MM (eg 1997-07)
  • YYYY-MM-DD (eg 1997-07-16)
  • YYYY-MM-DDThh:mmTZD (eg 1997-07-16T19:20+01:00)
  • YYYY-MM-DDThh:mm:ssTZD (eg 1997-07-16T19:20:30+01:00)
  • YYYY-MM-DDThh:mm:ss.sTZD (eg 1997-07-16T19:20:30.45+01:00)

必要な場合は、時刻の部分を省略してYYYY-MM-DDの形式で記述することもできます。

サイトマップインデックスファイルの送信

通常のxmlサイトマップと同様に、Googleサーチコンソールのメニュー、「クロール」-「サイトマップ」の「サイトマップの追加」から行えます。

送信可能数

Googleサーチコンソールからは、アカウントに登録されたサイト1つにつき最大500個のサイトマップインデックスファイルを送信できます。