# Search engines to notify with the updated sitemaps # # This list is very non-obvious in what's going on. Here's the gist: # Each item in the list is a 6-tuple of items. The first 5 are "almost" # the same as the input arguments to urlparse.urlunsplit(): # 0 - schema # 1 - netloc # 2 - path # 3 - query <-- EXCEPTION: specify a query map rather than a string # 4 - fragment # Additionally, add item 5: # 5 - query attribute that should be set to the new Sitemap URL # Clear as mud, I know. NOTIFICATION_SITES = [ ('http', 'www.google.com', 'webmasters/tools/ping', {}, '', 'sitemap'), ('http', 'search.yahooapis.com', 'SiteExplorerService/V1/ping', {}, '', 'sitemap'), ('http', 'api.moreover.com', 'ping', {}, '', 'sitemap') ]
2006年11月16日、Google、Yahoo、MSNの3社は、「Google Sitemaps」と同等の機能を「Sitemaps 0.90」として統一使用することを発表しました。「Sitemaps 0.90」は、XMLのネームスペース宣言(※)が異なっていることを除いて「Google Sitemaps」と同一仕様になっています。
[Google、Yahoo!、MSNの統一フォーマット「Sitemaps 0.90」より引用]
ということで、sitemap_gen.py の全ての "http://www.google.com/schemas/sitemap/0.84" を "http://www.sitemaps.org/schemas/sitemap/0.9" に変換。これで、おしまい。そして、Sitemaps生成+ping。Googleウエブマスターツールも Yahoo の Site Explorer もちゃんと受けつけてくれたようだ。思ったより楽に作業終了。ついでに、これも検索エンジンへの通知法になるらしいので、robots.txtにSitemap: sitemap.xml.gz Sitemap: tdiary_sitemap.xmlを追加(sitemaps.org - プロトコル)。あとは、tDiaryのサイトマップ生成プラグイン google_sitemaps.rb のネームスペース宣言のところも、0.84から0.90に書き換え。更新通知先にそれぞれの検索エンジンのpingサーバのアドレスをサイトマップのアドレスを引数にして追加。で、大丈夫でしょうよ、と。
ググっていたら sitemaps を Yahoo、MSNにも読んでもらうように 0.90 の書式に書き換え を見つけました。有難くパクらせて頂きます。 $ diff -u sitemap_gen.py.orig sitemap_gen.py --- sitemap_gen.py.orig 2008-04-23 21:37:18.000000000 +0900 +++ sitemap_gen.py 2008-