當前位置:首頁 > 網站建設

Lynx瀏覽器在SEO上的應用

時間:2019-06-04 04:41:03來源:網站建設作者:seo實驗室小編閱讀:50次「手機版」
 

sem一家之言

曾經有朋友問我怎么才能判斷一個SEOer是不是高手。我就出了一個主意,就建議他問那個SEOer是不是知道Lynx在SEO上的應用方法。這么來提問,其實能從一個側面反映這個SEOer對SEO研究有多深的。

現在SEO行業,雖然有很多以訛傳訛的言論,但是如果自己經常實踐,還是能找到很多真正有用的操作方法。實踐久了,也能判斷誰的說法正確,誰的說法有問題,這樣的SEOER,可以放心的讓他去操作一些比較重要的網站了。再進一步的給網站各個細節優化過程中,就會發現很多以前別人沒有談到過,也很難在優化一些小網站的過程中注意到的細節。這些細節,在別的地方很難找到相關的參考資料,或者根本就找不到。但是在google的《google網站質量指南》、《google黑板報》、《google中文網站管理員博客》,基本上都可以找到關于這些細節的只言片語的。只不過那里面也只是給出了一個方向,更具體的細節還是要靠你自己再去實踐。

在《google網站質量指南》 的第一頁 ,就已經建議大家去用Lynx這個工具區檢測你的網站:

使用諸如 Lynx 的文本瀏覽器來檢查您的網站,因為大多數搜索引擎信息采集軟件查看您網站的方式與 Lynx 幾乎一樣。如果諸如 Javascript、Cookie、會話 ID、框架、DHTML 或 Flash 等復雜功能造成您無法在文本瀏覽器中看到整個網站,則搜索引擎信息采集軟件在抓取您的網站時可能會遇到問題。

這里提到了“Lynx查看網站的方式和搜索引擎幾乎一樣的”。一個SEOer,如果真的到了很多細節都無法從別人那里獲取參考的程度,那這段話相信他很難忽視掉的。

我用了一段時間的Lynx,發現這個曾經的文本瀏覽器和搜索引擎爬蟲很像的。你所聽過的爬蟲特性,在這里面都能找到一點影子。

比如檢測隱藏鏈接,我們只知道搜索引擎是不喜歡的,但是具體的檢測方法是怎么樣的呢? 如果你用熟了Lynx,就發現一個非常簡單的命令就搞定了。

首先要搭建一個Lynx的運行環境。Lynx不能用那種編譯過的在windows下運行的版本,有很多功能是不能用的。建議在XP下裝一個虛擬機,然后在虛擬機里裝一個linux系統來運行Lynx。

虛擬機軟件用 VirtualBox 或者 VMWare,具體的安裝方法大家google之。 Linux系統推薦用Ubuntu,它可以在圖形界面上安裝lynx。

在裝了Lynx的Linux系統的命令模式下輸入:lynx -dump www.alibaba.com 并回車,這個頁面上的隱藏鏈接就一覽無余了。如:

檢測出了隱藏鏈接

然后再進一步的分析一下,是哪些鏈接Lynx會認為是隱藏鏈接呢?

可以看到,至少以下的一種鏈接是會被Lynx認為是隱藏鏈接的。代碼為:

<a href=”http://www.alibaba.com”> </a>

這個鏈接,即沒有文字作為錨文本,也沒有圖片或其他作為鏈接的對象。如果不去加載CSS文件或JS文件,光就這個代碼,在網頁上是看不到這個鏈接的存在的。當然這就是隱藏鏈接,毫無爭議的。

這是Lynx認為的情況,搜索引擎也是一樣的。從整個互聯網來看,這種檢測方法在99%的情況下都不會冤枉一個網站的。對于google來說,一個檢測方法,如果能有40%以上的反作弊效率,那是非常好的一個方法。

一個非作弊的網站,產生這種情況的原因,是因為網頁設計人員的一些“奇怪”的代碼寫法。如果你去檢測你的網站,說不定也能看到這些隱藏鏈接。

當然,Lynx的作用不止這個。它首先是能以一個可視化的角度來展現爬蟲看到了什么內容。用它可以挨個檢查你的網頁給搜索引擎爬蟲展現了怎么樣的內容。如:

Lynx看到的內容

然后才是其他的一些功能:

可以檢測網頁代碼的完整性。如果提示有“Bad HTML”就要注意一下。

可以和IE一樣查看源文件。 命令在附錄中。

對cookie的跟蹤是特別對待的。會提示你是不是跟蹤cookie。

對框架和表單的處理和爬蟲是一樣的。

URL太多參數,會造成瀏覽困難。

可以查看網頁返回的http頭信息

……

你會看到很多似曾相識的東西。

Lynx 的出現時期,恰好是第一個爬蟲程序誕生的時候。有相當大的理由相信他們的是一樣的理念。而且現在維護和更新Lynx的人員,有些也在維護其他開源的爬蟲程序。你其實也可以把Lynx看成一個可視化的爬蟲。

HTTrack 是一個比較宏觀的爬蟲模擬器。而Lynx就更細節一些,也更實用一點。


附錄 Lynx的簡要使用說明:

以下為引用的內容:

移動命令:下方向鍵:頁面上的下一個鏈接(用高亮度顯示)。上方向鍵:頁面上的前一個鏈接(用高亮度顯示)。回車和右方向鍵:跳轉到鏈接指向的地址。左方向鍵:回到上一個頁面。

滾動命令:+,Page-Down,Space,Ctrl+f:向下翻頁。-,Page-Up,b,Ctrl+b:向上翻頁。Ctrl+a: 移動到當前頁的最前面。Ctrl+e: 移動到當前頁的最后面。Ctrl+n: 向下翻兩行。Ctrl+p: 往回翻兩行。): 向下翻半頁。(: 往回翻半頁。#: 回到當前頁的 Toolbar 或 Banner。

文件操作命令:

c: 建立一個新文件。d: 下載選中的文件。E: 編輯選中的文件。f: 為當前文件顯示一個選項菜單。m: 修改選中文件的名字或位置。r: 刪除選中的文件。t: Tag highlighted file。u: 上載一個文件到當前目錄。

其他命令:

?,h: 幫助。a: 把當前鏈接加入到一個書簽文件里。c: 向頁面的擁有者發送意見或建議。d: 下載當前鏈接。e: 編輯當前文件。g: 跳轉到一個用戶指定的URL或文件。G: 編輯當前頁的URL,并跳轉到這個URL。i: 顯示文檔索引。j: 執行預先定義的“短”命令。k: 顯示鍵盤命令列表。l: 列出當前頁上所有鏈接的地址。m: 回到首頁。o: 設置選項。p: 把當前頁輸出到文件,e-mail,打印機或其他地方。q: 退出。/: 在當前頁內查找字符串。s: 在外部搜索輸入的字符串。n: 搜索下一個。v: 查看一個書簽文件。V: 跳轉到訪問過的地址。x: 不使用緩存。z: 停止當前傳輸。[backspace]:跳轉到歷史頁(同 V 命令)。=: 顯示當前頁的信息。: 查看當前頁的源代碼。!: 回到shell提示符下。_: 清除當前任務的所有授權信息。*: 圖形鏈接模式的切換開關。@: 8位傳輸模式或CJK模式的切換開關。[: pseudo_inlines 模式的切換開關。]: 為當前頁或當前鏈接發送一個“HEAD”請求。Ctrl+r: 重新裝如當前頁并且刷新屏幕。Ctrl+w: 刷新屏幕。Ctrl+u: 刪除輸入的行。Ctrl+g: 取消輸入或者傳送。Ctrl+t: 跟蹤模式的切換開關。;: 看 Lynx 對當前任務的跟蹤記錄。Ctrl+k: 調用 Cookie Jar 頁。數字鍵: 到后面的第 n 個鏈接。

作者:國平

來源:http://www.semyj.com/archives/426

相關閱讀

【大拿分享】你真的會寫SEO標題嗎?

問:你真的會寫標題嗎?菁菁很久沒有請我們的專家來給大家做分享啦,那今天我們就請來了一位老朋友——趙彥剛同學~他將給我們帶來一個

經驗分享:SEO新手面對新網站應該如何去優化

SEO目前是一個很尷尬的產業,你要是說SEO沒用,要完了。這肯定不會,畢竟搜索引擎所帶來的流量是很宏觀的。既然有搜索展現就一定有排名

電腦中Edge瀏覽器窗口關不掉怎么辦?

Edge瀏覽器作為win10系統中全新的瀏覽器,收到許多用戶的喜愛。不過有用戶在電腦中打開多個Edge瀏覽器頁面后,發現Edge瀏覽器窗口關

瀏覽器在線查看pdf文件 pdf.js的使用教程

谷歌瀏覽器可以直接在線查看pdf,而IE內核瀏覽器無法在線查看,默認是下載。 這里用到的是pdf.js,不僅支持IE內核瀏覽器,而且兼容手機查

贏在堅持 從龜兔賽跑感悟而來的SEO優化啟示

據說谷歌PR即將更新了,國內一些搜索引擎也再度改變算法,很多排名不錯的網站出現波動。不規則的權重賦值及網站排名跳躍,讓很多網站建

分享到:

欄目導航

推薦閱讀

熱門閱讀

三肖必中特l三肖中特期期准免费