百度目前在站內(nèi)搜索中支持5個(gè)數(shù)據(jù)模板的提交,分別是:通用、影視、小說(shuō)、游戲、論壇。在實(shí)際的工作中處理過(guò)2個(gè),所以分享下這2個(gè)的處理方法。 1、按照慣例,百度的這個(gè)提交是需要用xml地圖集的形式,先來(lái)說(shuō)說(shuō)游戲模板
<?xml version=”1.0″ encoding=”UTF-8″?> |
備注 |
<urlset> |
|
??? <url> |
|
??????? <loc>http://www.880sy.com/games/64929.html#gid.html</loc> |
著陸頁(yè) |
??????? <lastmod>2013-01-01</lastmod> |
文件一次更新時(shí)間 |
??????? <data> |
|
??????????? <name>*</name> |
游戲名稱(chēng) |
??????????? <url><![CDATA[http://www.880sy.com/games/64929.html#gid.html]]></url> |
著陸頁(yè) |
??????????? <gameCategory>移動(dòng)游戲</gameCategory> |
可根據(jù)tag調(diào)整 |
??????????? <gameSubCategory>手機(jī)游戲</gameSubCategory> |
可根據(jù)tag調(diào)整 |
??????????? <description>《魔獸》(World of Warcraft)…</description> |
測(cè)試下來(lái),站內(nèi)搜索展示前140個(gè)字符正好,如果沒(méi)有字符,別忘了要技術(shù)寫(xiě)個(gè)判斷加上些類(lèi)似“暫無(wú)介紹”的文字,不然會(huì)報(bào)錯(cuò) |
??????????? <image> |
|
??????????????? <name>*圖標(biāo)</name> |
可以是圖片的alt標(biāo)簽 |
??????????????? <url><![CDATA[http://xxxxx.xxx.jpg ]]> </url> |
游戲的展示圖片,例如手游的話是app圖標(biāo) |
??????????? </image> |
|
??????????? <datePublished>2011-12-20</datePublished> |
游戲的發(fā)布時(shí)間 |
??????????? <size>*MB</size> |
游戲大小 |
??????????? <tag>RPG,射擊</tag> |
游戲類(lèi)型,這個(gè)可以根據(jù)站點(diǎn)的tag標(biāo)簽調(diào)整 |
??????????? <developer><legalName>*</legalName></developer> |
開(kāi)發(fā)商 |
??????????? <version>V2.4.0</version> |
版本號(hào) |
??????????? <device>*</device> |
設(shè)備類(lèi)型 |
??????? </data> |
|
??? </url> |
|
</urlset> |
|
<downloadUrl><![CDATA[ http://www.wowchina.com]]></downloadUrl> |
地址,有的話放上去,不是必填項(xiàng) |
其他注意點(diǎn):整個(gè)文檔要字符串形式, 這種需要轉(zhuǎn)義,自己注意。文件量太大的話用sitemapindex索引的xml。提交后很快能在百度站內(nèi)搜索中看到結(jié)果。
? 這部分需要到樣式自定義里面去把游戲樣式調(diào)用出來(lái)。
? 2、通用模板樣式
<?xml version=”1.0″ encoding=”UTF-8″?> |
備注 |
<urlset> |
|
??? <url> |
|
|
??????? <loc>http://ky.kaoyan.com/04/467393/</loc> |
|
著陸頁(yè) |
??????? <lastmod>2013-04-10</lastmod> |
|
更新時(shí)間 |
??????? <changefreq>always</changefreq> |
|
更新平率 |
??????? <priority>0.5</priority> |
|
重要值 |
??????? <data> |
|
|
??????????? <display> |
|
|
??????????????? <title>【寫(xiě)給即將上戰(zhàn)場(chǎng)的你們】努力為王,心態(tài)為皇</title> |
|
文章標(biāo)題,建議用頁(yè)面的title格式 |
??????????????? <content>略</content> |
|
可以全部提交正文,不用等蜘蛛來(lái)抓取了,注意把圖片格式,鏈接格式全部去掉 |
??????????????? <tag>考研復(fù)習(xí)</tag><tag>經(jīng)驗(yàn)</tag> |
|
根據(jù)tag標(biāo)簽 |
??????????????? <pubTime>2012-12-04T11:20:13</pubTime> |
|
發(fā)布時(shí)間 |
??????????????? <breadCrumb title=”考研加油站” url=”http://ky.kaoyan.com/”/> |
|
相當(dāng)于面包屑的層級(jí)關(guān)系 |
??????????????? <breadCrumb title=”考研政治” url=”http://www.kaoyan.com/s/zhengzhi”/> |
|
??????????????? <thumbnail loc=”http://docs.kaoyan.com/jpg/12/1204dde3cd949ccc.jpg”/> |
|
縮略圖 |
??????????????? <image loc=”http://docs.kaoyan.com/jpg/12/12048543278e760d.jpg” title=”七個(gè)常用的泰勒展開(kāi)式”/> |
|
文章的個(gè)圖片,默認(rèn)缺省的話會(huì)調(diào)用縮略圖 |
??????????? </display> |
|
|
??????? </data> |
|
|
??? </url> |
|
|
</urlset> |
|
下圖是通用模板的自定義結(jié)構(gòu)化因子,可以增加展示整個(gè)通用模板里還有很多其他的信息。在其中還可以看到比如discount(折扣);price(價(jià)格)等影響的因素。有興趣的可以去研究整個(gè)通用模板的數(shù)據(jù)結(jié)果,都包含在里面。
下圖的面包屑的層級(jí)是用breadcrumb:title這個(gè)結(jié)構(gòu)因子產(chǎn)生出來(lái)的。并且終還可以根據(jù)你的這些標(biāo)簽(比如price)進(jìn)行排序。 
說(shuō)說(shuō)重點(diǎn)的地方: 1、希望哪,這些提交的內(nèi)容能在百度搜索引擎(不是自己的站內(nèi))結(jié)果展示上有一定的區(qū)別。
2、貌似阿拉丁百度開(kāi)放平臺(tái)里提交的數(shù)據(jù)和這個(gè)有些像,之后研究下,可以的話提交行業(yè)數(shù)據(jù)試試。
推薦閱讀
百度站內(nèi)搜索功能怎么用?用了有哪些好處?@steven | 文軍營(yíng)銷(xiāo)整體按照這個(gè)思路來(lái)寫(xiě)這2篇文章:1、百度近期不斷在推的這個(gè)站內(nèi)搜索,做個(gè)簡(jiǎn)單的公告集合,有興趣的大家可以自己去看細(xì)致的內(nèi)容;2、一些簡(jiǎn)單的功能介紹和自己網(wǎng)站上的實(shí)例截圖;3、站內(nèi)搜索支持的結(jié)構(gòu)化數(shù)據(jù)怎么處理(這個(gè)推薦有經(jīng)驗(yàn)的人看) 所以篇拋個(gè)玉,講講大概“百度站內(nèi)搜索”的基本情況,包含上面的1-2的兩點(diǎn)內(nèi)容融合在一起。 首先