WEB 2013-33:網頁等級
楊惟婷
一、何謂「網頁等級」(Page Rank)?
以Google搜尋引擎的網站排名規則來說,是由兩名在史丹福大學的博士生佩吉和布林所創見,他們發想一個給網頁價值評估的新概念。
這個概念,稱網頁級別(PageRank),這是Google 演算法的重要開端,也是Google所有網路搜索工具的基礎。
此網頁級別設計,十分倚賴導入鏈結(incoming link),並利用這種每個導入某網頁的鏈結相當於給該網頁價值投一票的理論,建立起排名規則邏輯系統,亦即越多導入鏈結,意味著該網頁越有「價值」。亦即,當從網頁 A 鏈結到網頁 B 時,Google 就認為"網頁 A 投了網頁 B 一票"。Google 根據網頁的得票數評定其重要性。
另外,除了考慮網頁得票數(即鏈結)的純數量之外,Google 還要分析投票的網頁。"重要"的網頁所投出的票就會有更高的權重,並且有助於提高其他網頁的"重要性"。所以,Google 在排列其搜索結果時,都會考慮每個網頁的級別。
當然,如果不能滿足您的查詢要求,網頁級別再高對您來說也毫無意義。因此,Google 又將網頁級別與完善的文本匹配技術結合在一起,為您找到最重要、最有用的網頁。Google 所關注的遠不只是關鍵字在網頁上出現的次數,它還對該網頁的內容(以及該網頁所鏈結的內容)進行全面檢查,從而確定該網頁是否滿足您的查詢要求。
Google此網頁評級的系統,是搜索排名演算法中的一個組成部分,級別從1到10級,10級為滿分,PR值越高說明該網頁在搜索排名中的地位越重要,也就是說,在其他條件相同的情況下,PR值高的網站在Google搜索結果的排名中有優先權。
在此網頁級別比序下,Google 在搜尋排名服務上,證明它的優異性。
因為此網頁級別規則度量了站點外因子,Google 認為它會比站點內因子更難以被動手腳(客觀性較強),在此分級制度下,Google 乃成為最普遍和最成功的搜尋引擎。
然而,道高一尺、魔高一丈。
許多網站人員已開發出破解搜尋引擎網頁級別的工具和方法。
例如,許多網站熱衷於交換、買賣大量鏈接,以影響Google送更多流量給該站,而不管內容是否對站點訪客有用,從而造成的搜索結果與實際內容不符。而這種作弊行為增加,會使網民對網頁級別原始演算法的信賴度漸漸被破壞。
此外,網際網路也已經膨脹到擁有許多非技術性的廣大族群,而他們經常無法使用先進的提問技術來取得資訊;且他們得面對比早期更龐大資料、更複雜的索引。所以,搜尋引擎也必須開發具備預測性、語義性、語言性和啟發性演算法。
目前,網頁級別仍然被顯示在Google 工具條上,不過網頁級別已變成只是Google考慮在網頁分級時超過100個因素裡中的一個。
現在,為了杜絕做弊問題,大多數搜尋引擎對它們的如何評等的演算法都保持秘密。搜尋引擎大多使用上百因素在排列目錄;且每個因素本身和因素所佔比重,也會不斷變換它們的排名演算法規則。
但每次演算法上的改變,都會讓一些排名很好的網站在一夜之間名落孫山,而失去排名的直接後果,就是失去了網站固有的可觀訪問量。
所以,每次搜尋引擎演算法的改變都會在網站之中引起不小的騷動和焦慮。我們可以說,搜尋引擎優化,也成了一個愈來愈複雜的任務。
二、摸索「網頁等級」的基本思路
儘管大多數搜尋引擎對它們的如何評等的演算法都保持秘密,但仍可歸納出搜尋引擎發展評等演算法時的一些基本思路,以下這份是Google 專利清單,也許讀者可猜出他們會走哪條路線:
• 站點的年齡
• 自該網域註冊後過多久
• 內容的年齡
• 新內容增加的規律性
• 連結的年齡,連接站點的名譽和其相關程度
• 一般站內因素
• 負面站內因素(例如,太多關鍵字敘述(meta tag),很顯然被優化過,會對站點造成傷害)
• 內容的獨特性
• 使用於內容的相關術語(搜尋引擎關聯到的術語的方式視同如何關聯到網頁的主要內容)
• Google網頁級別(只被使用在Google 的演算法)
• 外在連結、外部連結的連結文字、在那些和在站點/網頁包含的那些鏈接
• 引證和研究來源(表明內容是研究性質)
• 在搜尋引擎資料庫裡列舉的詞根與其相關的術語(如 finance/financing)
• 導入的逆向鏈結,以及該鏈結的文字
• 一些導入鏈結的負面計分(或許那些來自低價值頁、被交換的逆向鏈結等)
• 逆向連結取得速率:太多太快意味著「不自然」的鏈結購買活動
• 圍繞在導出鏈結、導入的逆向鏈結周圍的文字。
例如一個鏈結如果被 "Sponsored Links" (贊助商連結)包圍,該鏈結可能會被忽略。
• 用 "rel=nofollow" 建議搜尋引擎忽略該鏈接
• 在站點該文件的結構深度
• 從其他資源收集的網格表,譬如監視當搜尋結果導引用戶到某頁後,
用戶有多頻繁按瀏覽器的返回鈕
• 從來源像:Google AdWords/AdSense、Google 工具列等程序收集的網格表
• 從第三方資料分享協議收集的網格資料(譬如監測站點流量的統計程式提供商)
• 刪除導入鏈結的速率
• 使用子網域、在子網使用關鍵字和內容質量等等,以及從這些活動來的負面計分
• 和主文件語意上的連結
• 文件增加或改動的速率
• 主機服務商 IP 和該 IP 旗下其它站點的數量/質量
• 其他鏈結站會員(link farm / link affiliation)與
被鏈結的站(他們分享IP嗎? 有一個共同的郵遞地址在"聯絡我們(Contact Us)" 頁嗎?)
• 技術細節像利用301重定向被移除的網頁、對不存在網頁顯示404伺服器標頭而非200伺服器標頭、適當的利用 robots.txt
• 主機服務商正常運行時間
• 是否站點對不同類的用戶顯示不同的內容(掩飾(cloaking))
• 未及時矯正、無效的導出的鏈結
• 不安全或非法內容
• HTML代碼品質,以及錯誤出現數
• 由搜尋引擎自他們搜尋結果觀察到的實際點擊通過率評等
• 由最常存取搜尋結果的人手動評等
三、提升自己網站PR值(Page Rank)的基本原則
首先,當然要努力的生產好的內容,Google抓取您網站的頁面數量越多、網站更新率越高,也有助於提升PR值。
其次,然後努力的行銷、推廣網站,讓您的網站更廣為人知,讓別的網站自動放您的連結,連結進來的數量越多越好,因此,有些人會勤奮的去各大網站、blog留言(留言時也附帶自己的網址),或是努力的在書籤網站自推。
其三,留意連結自己網站的page頁面,PR值也要越高越好,這樣自然而然,就會提升PR值了。
最後,PR值的高低應該是搜尋引擎SEO所產生的自然結果。
然而,因為具有高PR網站往往最終確實產生高排名,讓不少人直接將PR與SEO劃等號,但這是不正確想法,也不利於SEO實施。
因為PR值不高的網站同樣有可能獲得好的排名,而PR高的不見得有理想的排名。
並且,在這樣錯誤的思想指導下,人們往往片面追求鏈結效應,忽略了SEO對於內容、結構、關鍵字等方面的分析和改進,而後者才是用戶和搜尋引擎長期關注的焦點。
所以,PR值的高低應該是搜尋引擎SEO所產生的自然結果,而不應作為追求的目標。