百度對(duì)HTTPS站點(diǎn)全流程描述介紹
下面是青島優(yōu)化公司總結(jié)百度對(duì)HTTPS站點(diǎn)全流程支持方案文字描述:
HTTPS優(yōu)勢(shì)
HTTPS是基于tls和ssl加密的http協(xié)議,網(wǎng)絡(luò)傳輸是加密的,因此它的安全是顯而易見的,包括防竊聽、篡改、劫持。
HTTPS的收錄機(jī)制
1、Spider如何發(fā)現(xiàn)HTTPS
1)、根據(jù)網(wǎng)頁中的超鏈接是否是HTTPS,網(wǎng)絡(luò)中會(huì)有一些超鏈,如果是HTTPS會(huì)認(rèn)為是HTTPS站點(diǎn)。
2)、根據(jù)站長(zhǎng)平臺(tái)提交入口的提交方式,例如主動(dòng)提交,如果在文件當(dāng)中提交的是HTTPS鏈接會(huì)以HTTPS的形式來發(fā)現(xiàn)。
3)、參考前鏈的抓取相對(duì)路徑,第一個(gè)網(wǎng)頁是HTTPS的,網(wǎng)站內(nèi)容里面的路徑提供的是相對(duì)路徑,會(huì)認(rèn)為這種鏈接是HTTPS。
4)、參考鏈接的歷史狀況,使用這種方式的原因主要是為了糾錯(cuò),如果錯(cuò)誤提取HTTPS會(huì)遇到兩種情況,一種因?yàn)镠TTPS不可訪問會(huì)抓取失敗,第二即使能抓成功可能展現(xiàn)出來的可能不是站長(zhǎng)希望的,所以會(huì)有一定的糾錯(cuò)。
2、HTTPS鏈接的抓取
現(xiàn)在比較常見的兩種,第一種是純HTTPS抓取,就是它沒有http的版本,第二個(gè)是通過http重定向到HTTPS,這兩種都能正常的進(jìn)行抓取跟http抓取的效果是一樣的。
3、HTTPS的展現(xiàn)
對(duì)于HTTPS數(shù)據(jù),展現(xiàn)端會(huì)有明顯的提示
站長(zhǎng)平臺(tái)支持全站HTTPS配置
1、HTTPS配置
之前有一些站長(zhǎng)改HTTPS,會(huì)疑問為什么站點(diǎn)有些鏈接是以http的形式來抓呢?為什么沒有全站都是以HTTPS的形式來抓取呢?因?yàn)橐郧暗臋C(jī)制是url級(jí)的,HTTPS抓完一條替換一條,整站需要全抓完才能全部替換掉,現(xiàn)在大家訪問站長(zhǎng)平臺(tái)可以發(fā)現(xiàn),左邊工具欄多了HTTPS認(rèn)證的功能,站長(zhǎng)平臺(tái)已經(jīng)全站支持HTTPS,點(diǎn)這個(gè)功能后會(huì)有提示引導(dǎo)我們?nèi)ピ趺醋?,需要提醒是需要全站支持HTTPS,才進(jìn)行點(diǎn)擊,如果不支持的話對(duì)站點(diǎn)會(huì)有一些副作用。
2、HTTPS驗(yàn)證
當(dāng)站長(zhǎng)在平臺(tái)上做了配置以后首先會(huì)有HTTPS驗(yàn)證,驗(yàn)證確認(rèn)站長(zhǎng)是否誤配,具體會(huì)檢查https鏈接是不是可抓取的。另外會(huì)對(duì)HTTPS的證書校驗(yàn),包括它的合法性、是否過期、跟它本身的域名是否一致,從這三個(gè)角度做校驗(yàn)。
3、HTTPS生效
校驗(yàn)通過后,生效方式從這三個(gè)角度進(jìn)行
1)、全站抓取以HTTPS的方式來抓,這會(huì)在抓取上做一定的切換2)、全站的展現(xiàn)樣式也會(huì)直接切換成HTTPS,用了這個(gè)功能的好處是會(huì)比以前快很多,會(huì)略過已收錄的網(wǎng)頁直接到HTTPS。
常見問題:
1、站長(zhǎng)升級(jí)HTTPS是不是會(huì)影響爬蟲抓?。坎粫?huì)。爬蟲對(duì)https的合法鏈接都能抓2、站長(zhǎng)升級(jí)HTTPS是不是會(huì)影響索引量?不會(huì)的,建庫做了相應(yīng)升級(jí),HTTPS的建庫是不會(huì)有延遲的。
3、站長(zhǎng)升級(jí)HTTPS是不是會(huì)影響排名點(diǎn)擊流量?不會(huì),HTTPS改造是不涉及到域名切換,或者說老域名到新域名樣式的轉(zhuǎn)變等等這個(gè)是不涉及的,可以做到完全無損的切換。
4、站長(zhǎng)升級(jí)的HTTPS是不是會(huì)影響移動(dòng)適配?不會(huì)有這種情況。
5、站長(zhǎng)升級(jí)HTTPS是不是會(huì)影響站長(zhǎng)平臺(tái)工具?不會(huì),站長(zhǎng)平臺(tái)鏈接提交等工具已經(jīng)都支持HTTPS了。
站點(diǎn)建議
1、建議站長(zhǎng)從http到HTTPS的301跳轉(zhuǎn),不建議只有HTTPS,而無http到HTTPS的跳轉(zhuǎn)關(guān)系,只用HTTPS訪問對(duì)用戶來說,可能會(huì)遇到問題。
2、不建議HTTPS、http這兩種版本并存,這種情況存在三種問題,第一個(gè)它的維護(hù)成本比較高,需要維護(hù)兩個(gè)版本;第二個(gè)做不到絕對(duì)安全,http訪問有不安全風(fēng)險(xiǎn);第三有不一致的可能性,隨著長(zhǎng)遠(yuǎn)的發(fā)展這兩個(gè)版本可能會(huì)越來越不一致,會(huì)影響用戶體驗(yàn),我們建議站長(zhǎng)做了HTTPS之后能對(duì)HTTPS做一定的跳轉(zhuǎn)預(yù)設(shè)。
3、HTTPS回退到HTTP極不建議。例如線上已經(jīng)展示HTTPS的鏈接給用戶點(diǎn)擊,如果站長(zhǎng)回退到http,用戶在瀏覽器里面點(diǎn)開的時(shí)候會(huì)展現(xiàn)死鏈的樣式是非常不建議的,做這個(gè)之前一定考慮。如果實(shí)在想做回退,請(qǐng)?jiān)谡鹃L(zhǎng)平臺(tái)提交HTTPS校驗(yàn),并建議站點(diǎn)提前至少24小時(shí)在平臺(tái)提交回退,這樣能夠保證站長(zhǎng)的點(diǎn)擊不會(huì)出現(xiàn)死鏈的形式,這點(diǎn)非常重要。
4、HTTPS網(wǎng)頁沒有建設(shè)完成之前不要在互聯(lián)網(wǎng)上提供超鏈接,之前遇到過好幾個(gè)case,本身HTTPS并沒有做完,兩個(gè)版本都存在,但是http是用戶可訪問的,或者說HTTPS的頁面是一個(gè)臨時(shí)性的假頁面,這樣站點(diǎn)有可能就以HTTPS的形式展現(xiàn)出來,會(huì)引起用戶體驗(yàn)問題。