如何提升開(kāi)放適配效果? |
發(fā)布時(shí)間: 2012/9/18 11:19:50 |
首先,對(duì)已有的對(duì)應(yīng)關(guān)系持續(xù)進(jìn)行適配,同時(shí)不斷建設(shè)新的對(duì)應(yīng)關(guān)系,增加適配覆蓋的范圍。
其次,要確保已經(jīng)標(biāo)注/提交的對(duì)應(yīng)關(guān)系對(duì)應(yīng)準(zhǔn)確。以下是常見(jiàn)的對(duì)應(yīng)不準(zhǔn)確錯(cuò)誤,請(qǐng)網(wǎng)站進(jìn)行自查,并及時(shí)修改。
手機(jī)頁(yè)不可用,比如死鏈。
robots封禁。放開(kāi)對(duì)百度spider的robots封禁和屏蔽,以便spider獲取您PC站與手機(jī)站之間的對(duì)應(yīng)關(guān)系。
手機(jī)頁(yè)使用了ajax等異步加載的方法加載內(nèi)容主體。
格式錯(cuò)誤。包括meta標(biāo)注的位置、格式錯(cuò)誤,對(duì)應(yīng)關(guān)系sitemap格式錯(cuò)誤等。
對(duì)應(yīng)關(guān)系錯(cuò)誤
當(dāng)PC頁(yè)為內(nèi)容頁(yè)時(shí),應(yīng)該適配到對(duì)應(yīng)的手機(jī)頁(yè)內(nèi)容頁(yè),而實(shí)際卻適配到手機(jī)頁(yè)的首頁(yè)/列表頁(yè)。
例如PC頁(yè)為http://www.qidian.com/Book/2083259.aspx,適配后的手機(jī)頁(yè)為http://qidian.cn/?from=web
手機(jī)頁(yè)本身無(wú)主體內(nèi)容/主體內(nèi)容過(guò)少。
手機(jī)頁(yè)需登錄才能瀏覽主體內(nèi)容。
PC頁(yè)內(nèi)容與手機(jī)頁(yè)內(nèi)容不存在一一對(duì)應(yīng)關(guān)系。
正確的對(duì)應(yīng)關(guān)系示例:
PC頁(yè)http://sports.sina.com.cn/j/2012-08-13/23516189909.shtml
手機(jī)頁(yè)http://sports.sina.cn/?sa=d4634022t24v4&cid=797&pos=10&vt=4
如何制作對(duì)應(yīng)關(guān)系sitemap文件(url級(jí)別)?
通過(guò)XML文件描述url級(jí)別的PC頁(yè)與手機(jī)頁(yè)的對(duì)應(yīng)關(guān)系,網(wǎng)站當(dāng)前有對(duì)應(yīng)關(guān)系的所有PC頁(yè)面url均需要給出。格式如下:
<?xml version="1.0"encoding="UTF-8"?>
<urlset>
<url>
<!--必填標(biāo)簽,表示PC頁(yè)的url地址 -->
<loc><![CDATA[http://www.yoursite.html/yoursite.html]]></loc>
<data>
<display>
<!—可選標(biāo)簽,表示該P(yáng)C頁(yè)對(duì)應(yīng)的html5版式的手機(jī)頁(yè)的url地址 -->
<html5_url><![CDATA[http://html5.yoursite.html/yoursite.html]]></html5_url>
<!—可選標(biāo)簽,表示該P(yáng)C頁(yè)對(duì)應(yīng)的wml版式的手機(jī)頁(yè)的url地址 -->
<wml_url><![CDATA[http://wml.yoursite.html/yoursite.html]]></wml_url>
<!—可選標(biāo)簽,表示該P(yáng)C頁(yè)對(duì)應(yīng)的xhtml版式的手機(jī)頁(yè)的url地址 -->
<xhtml_url><![CDATA[http://xhtml.yoursite.html/yoursite.html]]></xhtml_url>
</display>
</data>
</url>
</urlset>
例如:
<?xmlversion="1.0" encoding="UTF-8"?>
<urlset>
<url>
<loc><![CDATA[http://www.sina.com.cn/]]></loc>
<data>
<display>
<html5_url><![CDATA[http://html5.sina.com.cn/]]></html5_url>
<wml_url><![CDATA[http://wml.sina.com.cn/]]></wml_url>
<xhtml_url><![CDATA[http://3g.sina.com.cn/]]></xhtml_url>
</display>
</data>
</url>
<url>
<loc><![CDATA[http://www.sohu.com/]]></loc>
<data>
<display>
<html5_url><![CDATA[http://html5.sohu.com/]]></html5_url>
<wml_url><![CDATA[http://wml.sohu.com/]]></wml_url>
<xhtml_url><![CDATA[http://3g.sohu.com/]]></xhtml_url>
</display>
</data>
</url>
</urlset>
如何制作對(duì)應(yīng)關(guān)系sitemap文件(pattern級(jí)別)?
1、格式
Pattern級(jí)別對(duì)應(yīng)關(guān)系提交支持XML sitemap的形式,每個(gè)xml sitemap文件可包含1組或者多組pattern對(duì)應(yīng)關(guān)系。格式說(shuō)明如下:
標(biāo)簽名稱 標(biāo)簽說(shuō)明 標(biāo)簽限制 標(biāo)簽路徑 可選/必選
urlset 唯一的根節(jié)點(diǎn),標(biāo)記整個(gè)文檔的開(kāi)頭和結(jié)尾 / / 必選
url url標(biāo)記每組pattern的開(kāi)始和結(jié)束 1個(gè)或多個(gè) /urlset 必選
loc 表示PC站點(diǎn)的網(wǎng)址首頁(yè) 最大長(zhǎng)度256個(gè)字符,以"http://"開(kāi)頭 /urlset/url 必選
pc_url_pattern 表示該P(yáng)C頁(yè)的url pattern 最大長(zhǎng)度256個(gè)字符,以"http://"開(kāi)頭 /urlset/url/data/display 必選
html5_url_pattern 表示PC頁(yè)對(duì)應(yīng)的html5版式的手機(jī)頁(yè)的url pattern 最大長(zhǎng)度256個(gè)字符,以"http://"開(kāi)頭 /urlset/url/data/display 可選
wml_url_pattern 表示PC頁(yè)對(duì)應(yīng)的wml版式的手機(jī)頁(yè)的url pattern 最大長(zhǎng)度256個(gè)字符,以"http://"開(kāi)頭 /urlset/url/data/display 可選
xhtml_url_pattern 表示PC頁(yè)對(duì)應(yīng)的xhtml版式的手機(jī)頁(yè)的url pattern 最大長(zhǎng)度256個(gè)字符,以"http://"開(kāi)頭 /urlset/url/data/display 可選
各URL字段可以被CDATA標(biāo)記包含,如<![CDATA[url]]> 。
示例:
<?xml version="1.0"encoding="UTF-8"?>
<urlset>
<!-- 表示news.163.com下的一組pattern對(duì)應(yīng)關(guān)系-->
<url>
<loc><![CDATA[http://news.163.com/]]></loc>
<data>
<display>
<pc_url_pattern><![CDATA[http://news.163.com/(\d+)/(\d+)/(\d+)/(\w+).html]]></pc_url_pattern>
<xhtml_url_pattern ><![CDATA[http://3g.163.com/news/${1}/${2}/${3}/${4}.html]]></xhtml_url_pattern>
<wml_url_pattern ><![CDATA[http://wap.163.com/wml/page/ntes/${1}/${2}/${3}/${4}.wml]]></wml_url_pattern>
</display>
</data>
</url>
2、字段詳細(xì)說(shuō)明
pc_url_pattern: 表示PC頁(yè)pattern,在PC頁(yè)url的基礎(chǔ)上,首先確定url中哪些路徑或參數(shù)是可替換的。然后根據(jù)其類型,使用正則匹配符號(hào)(\d+)或者(\w+)表示該路徑或參數(shù)。(\d+)表示純數(shù)字字符串,(\w+)表示數(shù)字或字母組成的字符串。
xhtml_url_pattern / html5_url_pattern/ wml_url_pattern:表示xhtml/html5/wml版式的手機(jī)頁(yè)pattern,在手機(jī)頁(yè)url的基礎(chǔ)上,根據(jù)可替換參數(shù)在對(duì)應(yīng)的PC頁(yè)pattern中出現(xiàn)的順序,依次用${1},${2},……表示該參數(shù)。
3、舉例
以網(wǎng)易的新聞頁(yè)“漫游接電話移動(dòng)也不要錢了”為例,其PC頁(yè)url地址為http://news.163.com/09/1001/07/5KH8DE1F000120GR.html, 其對(duì)應(yīng)的xhtml格式的手機(jī)頁(yè)url地址為http://3g.163.com/news/09/1001/07/5KH8DE1F000120GR.html。
步驟一:確定PC頁(yè)中的可替換參數(shù)或者路徑,得到其位置序號(hào)和類型。
根據(jù)網(wǎng)站自身url的層次結(jié)構(gòu),其中09,1001,07和5KH8DE1F000120GR為動(dòng)態(tài)可替換的路徑。除5KH8DE1F000120GR為字母和數(shù)字混合外,其余均為純數(shù)字。
步驟二:根據(jù)可替換參數(shù)或路徑的類型,得到PC頁(yè)pattern (即sitemap中的pc_url_pattern)。
使用正則匹配符號(hào)(\d+)或者(\w+)表示該路徑或參數(shù)。(\d+)表示純數(shù)字字符串,(\w+)表示數(shù)字或字母組成的字符串。
步驟三:根據(jù)手機(jī)頁(yè)url,以及可替換參數(shù)在步驟一中的位置序號(hào),依次用${1},${2},……表示替換掉手機(jī)頁(yè)url中的可替換參數(shù)或路徑,得到手機(jī)頁(yè)pattern。
例子中,依次用${1},${2},${3}和${4}替換掉09,1001,07和5KH8DE1F000120GR,得到手機(jī)頁(yè)pattern為http://3g.163.com/news/${1}/${2}/${3}/${4}.html。
步驟四:根據(jù)手機(jī)頁(yè)的頁(yè)面類型,將手機(jī)頁(yè)pattern寫(xiě)入對(duì)應(yīng)的字段。各字段可以用CDATA標(biāo)記包含,如<![CDATA[url]]> 。
如示例中該pattern的手機(jī)頁(yè)面為xhtml版式,將pattern http://3g.163.com/news/${1}/${2}/${3}/${4}.html 寫(xiě)入到xhtml_url_pattern字段中。
最終得到sitemap文件如下:
<?xml version="1.0"encoding="UTF-8"?>
<urlset>
<!—表示news.163.com下的一組pattern對(duì)應(yīng)關(guān)系-->
<url>
<loc><![CDATA[http://news.163.com/]]></loc>
<data>
<display>
<pc_url_pattern><![CDATA[http://news.163.com/(\d+)/(\d+)/(\d+)/(\w+).html]]></pc_url_pattern>
<xhtml_url_pattern ><![CDATA[http://3g.163.com/news/${1}/${2}/${3}/${4}.html]]></xhtml_url_pattern>
<!-- 一組PC pattern可能含有多個(gè)版式的手機(jī)頁(yè)pattern -->
</display>
</data>
</url>
<!-- 下一組pattern放在一個(gè)新的url節(jié)點(diǎn)內(nèi) -->
</urlset>
備注
通過(guò)sitemap只能提交具有簡(jiǎn)單對(duì)應(yīng)關(guān)系的pattern,也即,在PC頁(yè)url與手機(jī)頁(yè)路徑或參數(shù)之間存在直接的對(duì)應(yīng)關(guān)系,使得機(jī)器能根據(jù)PC頁(yè)url按照一定的正則pattern自動(dòng)計(jì)算出與其對(duì)應(yīng)的手機(jī)頁(yè)的url。如http://news.sina.com.cn/c/2012-05-27/235824487992.shtml和http://news.sina.cn/?sa=t124v71d6155414&pos=102&vt=4雖然是對(duì)應(yīng)的,但是從url本身很難找到聯(lián)系,就不屬于簡(jiǎn)單對(duì)應(yīng)關(guān)系。
正則匹配符號(hào)不可嵌套使用,如(d+(\w+))這種形式不合法。
Pattern中,站長(zhǎng)無(wú)需考慮特殊符號(hào)的正則轉(zhuǎn)義等問(wèn)題,百度會(huì)幫您轉(zhuǎn)義成機(jī)器可以識(shí)別的正則表達(dá)式。
本文出自:億恩科技【mszdt.com】 服務(wù)器租用/服務(wù)器托管中國(guó)五強(qiáng)!虛擬主機(jī)域名注冊(cè)頂級(jí)提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |