闲话Schema.org规范以及In-depth Article

Schema.org_
这周算是忙完了产品方面的一些前期准备工作,包括分析调研画原型写文档之类的,然后研发还没到位,所以我又可以抽时间出来弄一下网站方面的事情了。

一些背景

在一年前,Google推出了In-depth Article(我暂且翻译为深度文章),当时我简单写了一篇东西关于如何才能让自己的网站受益。当然在评论中我也跟基友Criss说了准备在网站下次改版时进行相关的代码部署。看我博客的朋友应该知道我前段时间网站改版了,当时赶着去北京参加一个培训所以没来得及做这些。这几天抽空完成了这个事情。

在去年那篇文章里面我提到了以下几点

  1. 文章一定要高质量,够深入;
  2. 使用schema.org里面的”article”语法;
  3. 对于需要翻页的文章使用rel=next以及rel=prev标签;
  4. 提供网站的logo信息,当然也是要用schema.org的标准了;

第一点和代码无关,第三点应用的少,相信现在还在使用翻页形式来展示内容的站长已经为数不多了。剩下第二点和第四点,都要使用Schema.org标记语言来完成,所以这篇文章我会讲一下关于 Schema.org标记语言的东西。

哎呀居然一不小心就凑了四百字哈哈哈,果然写的东西越多越懂如何混字数。是的,我就是在黑那些骗钱的所谓自媒体。输出内容嘛,就要言之有物,整篇东西不是拾人牙慧,马后炮,就是炒冷饭,有意思咩?

好了不卖萌了,进入正题。

代码规范

首先,Schema.org是个啥?

简单来说,就是这门标记语言可以让我们的网页代码及内容更容易被各种搜索引擎及内容抓取系统来进行读取。

打个不太恰当的比方,我们都知道一个人身上头在哪四肢在哪心脏在哪;我牵一头驴子出来,大家也能知道头在哪四肢在哪,但是已经有一部分人不知道心脏在哪了(是的我就不知道,哪位知道的可以在评论里告诉我,哈哈);如果我弄一只啥史前生物出来,你可能就连哪是手哪是脚都不知道了。

这些千奇百怪的生物,对应的就是网络上千奇百怪的网页。我们每一个人,就是一个内容抓取系统。 Schema.org标记语言的作用,就是让我们不管面对什么妖魔鬼怪都能准确知道,哪是头哪是脚哪是心脏。对应到文章上面,就是哪是标题,哪是正文,作者是谁,发布时间是什么时候,有多少评论,有没有副标题,摘要是啥,配图优先选取哪一个,等等等等。。。

然后考虑周全的Schema.org语言不仅仅是可以针对文章,还能针对产品,电影,人物,视频等进行规范。再次用到上文的比喻,也就是不管你跟我整一个生物出来,还是整一个植物出来,或者随便啥乱七八糟的,反正只要是有Schema.org规范,我都能准确识别这玩意儿。

详细的清单见这个页面:http://schema.org/docs/schemas.html

介绍完了背景,下面就以In-depth Article的要求为例子来讲一下如何使用这门标记语言。

Google的官方说明页上,有比较详细的清单,关于有哪几个属性我们是推荐(必须)使用的。

  • headline
  • alternativeHeadline
  • image (note: the image must be crawlable and indexable)
  • description
  • datePublished
  • articleBody

这些属性的使用方式就是itemprop=”xxxxx”,比如itemprop=”headline”,itemprop=”articleBody”,然后是可以直接作为HTML标签的属性使用的。比如

文章标题

然后这些属性都是article这个类别下的,所以我们要在包裹这些属性的最外层<div>标签(不一定是<div>,此处仅为举例)中声明,这个<div>内的所有schema属性都按照article这个类别来解读,比如

文章标题

为什么要这样做?因为同一个页面内也许包含了多个schema.org支持的内容种类,比如article, video, person等等,然后每一个类别里面有些属性会是同样的语法,所以我们需要在外层声明一下,这一块里面的schema.org属性是哪一个类别里面的,这样搜索引擎或者内容抓取系统才能更准确地识别每一个属性。

以上就是如何在网页中正确使用Schema.org规范,特别要注意的就是以上两段提到的这个“内容种类—属性语法”这样的一个嵌套关系,不然部署的代码可能没办法被正确抓取。

然后继续聊一下In-depth Article,在本文开头已经阐述了需要符合哪些规范。Schema.org代码部署好之后,剩下的就是Authorship以及Organization。

Authorship不用再多介绍了,已经非常广为人知,部署代码非常简单,一行就够。


值得一提的是,在今年的一次算法更新中,Google全面取消了作者头像在SERP中的展示,可以说Authorship的实用程度已经大打折扣。反正部署一个也不麻烦,顺手弄上去,搞不好有啥隐形的好处。外加这是Google官方声明的入选In-depth Article的条件,我们也只有照做。

最后一项是Organization代码,这个也只需要一行代码。


注意这个必须是Page的地址,而不是个人profile的地址。

做完以上这些,剩下的就是看Google给不给面子,以及努力提高自己网站的权重了。

补充推荐

代码部署完毕后,推荐用Google官方的代码检测工具进行检测,正常的话应该是像下图这样。

20140815214605

20140815214837

20140815215016

以上为部分截图。

如无特别注明,本博客所有内容均为汤板唦原创,采用CC BY-NC-SA协议进行授权。如需转载,请注明来源。

如果喜欢这里的内容,你可以在右侧边栏关注我的微博或者订阅我的邮件推送,只要有新文章发布,这两个平台会自动通知。