Google リッチスニペットツール アップデート。Productsも範囲拡大

GoogleのRich Snippets Testing Tool がアップデートされ、HTMLを直接記述することでリッチスニペットの確認ができるようになったそうです。
たしかに、公開前にちょっとチェックするには便利そうですし、ローカルファイルのアップロードよりも手軽に使えそうです。

また、以前はたしか通常のサイトを使用例として表示していたと思いますが、今回から各コンテンツ用のサンプルが表示されるようになってました。

コンテンツタイプのサンプル種類

  • Applications
  • Authors
  • Events
  • Movie
  • Music
  • People
  • Products
  • Products with many offers
  • Recipes
  • Reviews
  • TV Series

リッチスニペットのMicrodataなどのProducts(製品)も、利用範囲が拡大したそうですが、個人的にはまだ実際にSERPで確認できてません。

どちらかというと、国内ではGoogleショッピング優勢(おすすめ?)といった感じで何でしょうか。
たしかに、データ提供なども行いやすいでしょうし、AdWordsでの表示なども含め、リッチスニペット風に検索上で表示されますしね。

好み(?)にもよると思いますが、Googleが土俵である以上、せっかくですから可能な限りは対応しておきたいと思うのと、
あとはSERP上の表示がもし変われば見てみたいという、ちょっとした興味本位も含まれますが。

ちょうど近々に今まで利用していた某ASPを使ったサイトリニューアルを行うのですが、そういったサービスも最近ではGoogleショッピングへのフィード送信などが可能になったりしてますが、
できればテンプレ書き出し時に設定してくれてると助かるのですが、実際サービス提供者側だと、具体的なメリットも伝えなければならないのかも知れませんし、そこまで気を回して…といったサービスも、まだもう少し先でしょうか。

» Official Google Webmaster Central Blog: Updates to rich snippets
» Webmaster Tools – Rich Snippets Testing Tool

microdata のスニペットをbodyタグに書く方法

Microdata のスニペットの記述については、head タグへの記述のみかと思っていましたが、body への記述でも有効なようです。

1
2
3
4
<!-- Add the following three tags to your body. -->
<span itemprop="name"></span>
<span itemprop="description">kazunoriiguchi.com – SEM and Promotions, WebDesign or diary :)</span>
<img itemprop="image" src="http://kazunoriiguchi.com/favicon.ico">
ただし、ボキャブラリーについては現状通り。

1
2
<!-- Update your html tag to include the itemscope and itemtype attributes. -->
<html itemscope itemtype="http://schema.org/Blog">

» Snippet – Google+ Platform — Google Developers

Google+ボタンのスニペットのカスタマイズ

久しぶりに+1 ボタンページを見てみると、”+スニペットのカスタマイズ” という箇所が。
Microdata用のものだと思いますが、以前からありましたっけ…。(?)

1
2
3
4
5
6
7
<!-- Update your html tag to include the itemscope and itemtype attributes -->
<html itemscope itemtype="http://schema.org/Blog">

<!-- Add the following three tags inside head -->
<meta itemprop="name" content="Title of your content">
<meta itemprop="description" content="This would be a description of the content your users are sharing">
<meta itemprop="image" content="imageUrl">

WordPress用

好みに合わせて適宜、変更してください。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
<meta itemprop="name" content="<?php wp_title( '|', true, 'right' ); ?>">
<?php if ( is_single() ) { // 単独記事ページの場合 ?>
<?php if ($post->post_excerpt){ ?>
<meta itemprop="description" content="<?php echo $post->post_excerpt; ?>">
<?php } else {
$summary = strip_tags($post->post_content);
$summary = str_replace("\n","", $summary);
$summary = str_replace("\r","", $summary);
$summary = mb_substr($summary, 0, 100). "..."; ?>
<meta itemprop="description" content="<?php echo $summary; ?>">
<?php } ?>
<?php } else { // 単独記事ページ以外の場合 ?>
<meta itemprop="description" content="<?php bloginfo('description'); ?>">
<?php } ?>
<meta itemprop="image" content="imageUrl">

» +1 ボタン

—-
2012/01/27
Google+ページ用のGoogle+ボタンに、横幅の指定やカラーのオプションが付く。
» Inside Google Plus » Blog Archive » Google Plus Badges new options
» Link your Google+ page to your site – Google+ Platform — Google Developers

Google アプリケーション用リッチスニペットが登場

サイト構造のマークアップとして、schema.org を中心に共通で利用されることになったmicrodata。
さまざまなカテゴリー用のマークアップがありますが、今回はスマホなどのアプリでの表示が可能となったそうです。

» Official Google Webmaster Central Blog

SoftwareApplication という定義らしく、マークアップの詳細については下記からご覧になれますが、
現状ではまだ(?)、http://schema.org/SoftwareApplicatioにページがないみたいです。

» Software applications – Webmaster Tools Help

ちなみに、その他のサポートされているアプリケーションの種類は以下から。
» Supported software application types – Webmaster Tools Help

テストツールも、早くschema.org 対応になって欲しいですね。

robots.txtの一文字ディレクトリ名での失敗

先日より、Google ウェブマスターツール でなぜか見かけないクロールエラーを発見。
数日様子を見てみたものの、特に改善も見られないため少し見てみることにしました。

Google ウェブマスターツール でのメッセージとしては、「robots.txt によりアクセスが制限されています」というもの。
しかしながら、該当するページについてはすべてインデックス されており、キャッシュも残っている状態でした。

そのキャッシュ日を基準アレコレ考えていると、おおよそ、新しいコンテンツ作成のためにクロール拒否を新たに行ったディレクトリを思い出し、
以下のようにrobots.txt での指定について、お恥ずかしながら始めて知った点について簡単にまとめておきました。

robots.txt の「/」スラッシュ無しで「一文字」のディレクトリ名を指定している場合

robots.txt でのディレクトリの指定で以下のように「/」スラッシュの有り無しの場合、
基本的には以下のように認識していました。

Disallow: /test/
test ディレクトリ以下全部拒否、test/index.html は許可
Disallow: /test
test ディレクトリ以下全部拒否、test/index.html も拒否

しかしながら、指定しているディレクトリ名が一文字など、
他のディレクトリ名とかぶる場合、そのディレクトリも対象となってしまうみたいです。
※Google の認識のみ

例えば、以下のように「/m/」というディレクトリを指定したい場合。

Disallow: /m

のように個人的には記述して/m/ディレクトリとm/index.html を対象としていたつもりですが、
/mobile や/moment など、正規表現でもないのに/m~ に絡むディレクトリすべて対象となってしまっていたようです。

なので、/m/ 以下全部と/m/index.html を指定したい場合、

Disallow: /m/index.html
Disallow: /m/
(一文字のディレクトリ名って使用頻度少ないかも知れませんが)

と指定するほうがベターなようです。
※違いますかね?

すでにご周知の件かと思いますが備忘録として。


7/25 追記
Google ウェブマスターツールにて、robots.txt、クロールエラーであったファイルが正常に認識されていることを確認。