搜索引擎收錄網(wǎng)頁與網(wǎng)頁權(quán)重
發(fā)布時間:2013-12-06 點(diǎn)擊次數(shù):
搜索引擎收錄網(wǎng)頁與網(wǎng)頁權(quán)重之間存在著本質(zhì)的區(qū)別,也就是說收錄不是權(quán)重,權(quán)重不是收錄。
以前本人常常強(qiáng)調(diào)權(quán)重的重要性,并鼓勵網(wǎng)站不要流失權(quán)重。但是卻少有提及讓搜索引擎收錄更多網(wǎng)頁的問題,因此,在本文中,筆者會從不同的角度談該問題。其實(shí)收錄與權(quán)重有著非常大的區(qū)別,從一個簡單的說法來說即,收錄量決定著網(wǎng)站內(nèi)容在檢索結(jié)果中出現(xiàn)的頻率和次數(shù),而權(quán)重決定排名。舉一個很簡單的例子,一個IT界的門戶網(wǎng)每天都會有將近500篇文章誕生,隨著它們的產(chǎn)生,一些頁面會自動創(chuàng)建,如標(biāo)簽頁,這樣這個網(wǎng)站每天有將近1000頁新網(wǎng)頁,而在這1000頁中,搜索引擎收錄了500頁,搜錄率只有50%。而另外一個還算不錯的網(wǎng)站,每天將近有50篇網(wǎng)頁誕生,但搜錄40篇,搜錄率80%。可是實(shí)際上,在搜索引擎檢索結(jié)果中,前面的IT門戶網(wǎng)的占有率大很多,但由于后一個網(wǎng)站質(zhì)量很好,且權(quán)重較高,得到了很好的排名。
搜索引擎的收錄量有哪些因素?
搜索引擎的搜錄是有規(guī)律的,第一條就是吸引蜘蛛,這也是最難的一條。吸引蜘蛛有捷徑可循,但吸引蜘蛛之后,另外一件事是讓搜索引擎將抓取的網(wǎng)頁建立索引,加入它自身的數(shù)據(jù)庫中。那么,是什么影響這搜索引擎的收錄呢?
1.蜘蛛訪問的次數(shù)與頻率:這是絕對前提,如果蜘蛛不訪問網(wǎng)站,無從談起收錄了。當(dāng)然,蜘蛛訪問網(wǎng)站會消耗掉網(wǎng)站的流量,且會加大服務(wù)器的負(fù)擔(dān)。因此,我們要做的應(yīng)該是讓蜘蛛養(yǎng)成定期循環(huán)訪問網(wǎng)站的習(xí)慣,例如在每天晚上睡覺前訪問網(wǎng)站,了解網(wǎng)站更新了哪些內(nèi)容。
2.蜘蛛訪問的深度與廣度:蜘蛛就是搜索引擎抓取網(wǎng)頁信息的一種機(jī)器人程序,它在抓取網(wǎng)頁信息時,常常具有挑選性,例如蜘蛛會根據(jù)網(wǎng)站信息的深度來判斷當(dāng)前網(wǎng)頁的重要性,并判斷是不是要收錄它。同時,蜘蛛還會顯示出不耐煩情緒,當(dāng)網(wǎng)頁內(nèi)的哪些干擾信息比較多,如廣告、JS代碼等,蜘蛛會選擇暫停抓取。
3.網(wǎng)站或欄目甚至網(wǎng)頁的權(quán)重:權(quán)重會影響收錄,主要體現(xiàn)在高權(quán)重的網(wǎng)頁會讓蜘蛛停留更長的時間,并削弱它的挑選性,更會消除它的不耐煩。但是網(wǎng)頁的權(quán)重是經(jīng)過長期積累起來,且要有合理的網(wǎng)站權(quán)重規(guī)劃。
4.網(wǎng)站信息產(chǎn)生的速度與質(zhì)量:權(quán)威人士撰寫的網(wǎng)站內(nèi)容,例如著名作家、谷歌內(nèi)部的工程師等,他們的網(wǎng)站更新速度慢,但搜錄很快,且較為全面。
雖然上述是從搜索引擎的角度,強(qiáng)調(diào)收錄的搜索引擎主動的,而非以網(wǎng)站擁有者的意志為轉(zhuǎn)移。網(wǎng)站擁有者只能順從搜索引擎,掌握那些蜘蛛的規(guī)律,按規(guī)律辦事,或許這樣能得到搜索引擎的親睞。
如何看待收錄與權(quán)重
收錄是權(quán)重的基礎(chǔ),因為沒有收錄量,再高的權(quán)重都沒有意義(當(dāng)然這是不可能的)。權(quán)重能反過來刺激收錄量,這在上文已經(jīng)提到過了。但在這里,有一個概念性的誤解需要被澄清:本站所提到權(quán)重和收錄偶爾會引起讀者誤解,特別是在傳遞權(quán)重時,我們往往希望搜索引擎不收錄一些網(wǎng)頁,或不要將權(quán)重傳遞給某些網(wǎng)頁。那么接下來,我們就來看看收錄是如何產(chǎn)生的,權(quán)重是如何傳遞的。
收錄,顧名思義就是讓網(wǎng)頁被收集記錄到搜索引擎數(shù)據(jù)庫中,在這個過程中,搜索引擎會對網(wǎng)頁信息進(jìn)行索引,即確定該網(wǎng)頁和哪些關(guān)鍵字相關(guān)。在搜索引擎蜘蛛爬行時,首先會檢查網(wǎng)站的robots.txt文件,以確定網(wǎng)站管理人是否希望搜索引擎不要收錄其中的一些或全部網(wǎng)頁。除此之外的所有網(wǎng)頁都可能被收錄,只要蜘蛛能到達(dá)這個頁面(實(shí)際上由于上述的一些蜘蛛特性,很多網(wǎng)頁是到不了的)。因此,我們最好讓網(wǎng)站的每一個我們想被收錄的頁面都可以從首頁通過點(diǎn)擊鏈接訪問到。而且有一個特點(diǎn)是,距離首頁的點(diǎn)擊次數(shù)越少,收錄的機(jī)會越大。
權(quán)重,是搜索引擎給予一個網(wǎng)頁的評估值,這個權(quán)重可以反映出網(wǎng)頁的重要程度,權(quán)重越高,說明獲得更多搜索引擎的信任和認(rèn)可,在排名時獲得更好的排名。關(guān)鍵是,權(quán)重是怎么傳遞的。一般來說是通過鏈接,特別是帶錨文本的鏈接(超文本鏈接,鏈接文本現(xiàn)在也被計入傳遞權(quán)重的范圍)。但權(quán)重的傳遞不是等價平均的傳遞的,而是經(jīng)過計算后傳遞的。例如某頁面A的權(quán)重為1.00,而它鏈接到10個頁面,這10個頁面將獲得總和為5~6的權(quán)重值,它們也不是完全平分這5~6分,而是各不相同。有的可以繼承2的權(quán)重值,有的可能只能繼承0.5的權(quán)重值。
需要強(qiáng)調(diào)的是,凡是鏈接,都會傳遞權(quán)重,而且權(quán)重值會被分散到所有鏈接身上。就像上文所述的權(quán)重值,在這5~6分中,如果有100個鏈接來分?jǐn)偹敲疵總€鏈接分?jǐn)偟降姆謹(jǐn)?shù)會很小,即使權(quán)重傳遞不平均,但最高也會低到0.01級。可是,我們并不愿意減少鏈接數(shù)來使分?jǐn)傉咦兩伲覀兛梢允褂胷el=”nofollow”來阻止權(quán)重傳遞,也就是讓這100個鏈接有40個鏈接不傳遞權(quán)重,那么只剩下60個鏈接來分?jǐn)傔@5~6分的權(quán)重,雖然每個頁面得到的權(quán)重仍然很小,但總比更小要好。
1.收錄和權(quán)重的誤區(qū) 認(rèn)為rel=”nofollow”不會被收錄:實(shí)際上它只負(fù)責(zé)阻止傳遞權(quán)重,而并不阻止收錄鏈接所在頁。為了阻止通過鏈接收錄站外鏈接,我們往往將站外鏈接處理為一個站內(nèi)的跳轉(zhuǎn)頁面,用robots.txt阻止這一系列的跳轉(zhuǎn)頁面,最終防止收錄站外鏈接。
2.認(rèn)為只要不收錄就和權(quán)重沒關(guān)系:現(xiàn)在很多網(wǎng)站存在一個嚴(yán)重的問題,就是權(quán)重黑洞。即一些網(wǎng)頁內(nèi)的鏈接連接到一個不收錄的頁面或沒有權(quán)重傳出的頁面。如果一個頁面的權(quán)重傳遞到一個不收錄的頁面,那么這些權(quán)重就浪費(fèi)了,權(quán)重在這里進(jìn)入終結(jié)。最好的是權(quán)重能在網(wǎng)站內(nèi)部不斷的流動,最終回到首頁或要優(yōu)化的目標(biāo)頁面。
3.網(wǎng)頁跳轉(zhuǎn)沒有關(guān)系:使用meta refresh、header()、window.location.href都是不明智的,這些跳轉(zhuǎn)會造成權(quán)重流失。
無論如何,收錄量和權(quán)重在SEO里面是一對非常關(guān)鍵的概念,一方面要充分把握好它們在SEO中重要地位,另一方面,應(yīng)該避免它們造成的損害。
------------------------------------------------------------------------------------------
藍(lán)點(diǎn)網(wǎng)絡(luò)提供:網(wǎng)站建設(shè)、APP開發(fā)、微信小程序、400電話、軟件開發(fā)、服務(wù)器托管/租用等業(yè)務(wù)。
從2003年開始,我們始終堅守【網(wǎng)站建設(shè)】服務(wù),19年從未放棄!!
售前咨詢:0311-8736 0077
售后服務(wù):0311-8736 0066
值班手機(jī):189 3198 6878