1024x768 1280x800   Decrease font size for  - 拓展台灣數位典藏 - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 Reset to normal font size for  - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 - 拓展台灣數位典藏 Increase font size for  - 拓展台灣數位典藏
 


你不可不知道的「Alexa Internet炫風」

Tags: none 發表: 2008-01-23, 點閱: 4,254 , 加入收藏櫃 , 列印 列印 , 轉寄 轉寄

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

  內容發展分項計畫/高芷彤

 

  一位擊敗微軟,成為世界最大軟體企業,是全球第二大軟體企業甲骨文總裁賴里‧艾利森,談到,現在不再是個人電腦的時代,也非作業系統的時代,而是資訊時代,提出在資訊時代的網路世界中,內容決定一切。那麼在龐大的網際網路中,是否存有網站是提供各網站的排名,藉由排名機制將全球網站進行排名找出各自差異性,提供使用者或是經營者進行決策的參考或依據的服務呢?

  1996年Brewster Kahle及Bruce Gilliat的Alexa開啟了全球網站排名的企圖心,公佈排名數據背後的「運算機制」、「衡量指標」、「取樣人數」、…等皆面臨考驗。在此同時如何認清數據背後的意義才是避免真正陷入排名制約的窘境。

誰是Alexa.Internet
    由Brewster Kahle及Bruce Gilliat於美國創建Alexa,於1999年被Amazon.com併購為旗下子公司。Alexa網站主要分析提供各種網站的相關資訊,以其Alexa.的網站排名聞名。Alexa預設透過Alexa Toolbar,收集用戶的上網資訊,統計分析網站流量之相關資訊。

Alexa之簡史

1. 1996年4月「草創期」
   Brewster Kahle及Bruce Gilliat於美國所創建,最初以「讓使用者在分享網路資源的同時,也能積極參與網路資源的組織」為目的,也就是說使用者瀏覽網站的同時,其瀏覽記錄對於網路資源組織是有所貢獻的。例如用戶下載Alexa Toolbar來紀錄瀏覽歷程,Alexa匯整後對瀏覽某特定網站的流量進行統計和分析發布全球網站排名,對於Alexa是有直接的數據貢獻。
  
2. 1997年7月「軟體開發-Alexa Toolbar」
    藉由使用者下載Alexa Toolba紀錄使用者瀏覽每個Web頁面,以一串代碼回報給Alexa進行整合。此軟體除排名外,還提供英文搜尋引擎、阻止彈跳廣告視窗、顯示網站相關連結建、查看歷史檔案等功能。

3. 1999年4月「併購-Amazon.com」
  被美國Amazon.com收購,成為Amazon的全資子公司。

4. 2000年5月「加入合作夥伴-Google」
  藉Google本身Web爬行技術以及自己的爬行器,Alexa建構了一個龐大的資料庫,目前至少已經抓取400億的URL,數量足足超過Google等搜尋引擎。

5. 2005年12月「垂直查詢-APIs」
    Alexa系統透過廠商提供的webservice(運用在.Net 上給不同的系統間溝通用(微軟專屬)與APIs程式(可以運用在不同的OS 上給不同的系統間溝通(不限定微軟)),用來開啟展延搜尋索引與網頁爬行功能。也就是說,這些建構垂直式搜尋引擎可以運用在Alexa本身的伺服器或者其他地方,除Alexa之外其他網站也可使用。

6. 2006年4月「更換合作夥伴-Microsoft Windows」
  捨棄合作長達五年多的Google的檢索技術,Amazon改採微軟的Live Search技術。

Alexa.網站排名依據

1. Alexa網站架構

  (1)Alexa網站介面
  在首頁的框架內鍵入任何一個網站的網址,即可查詢到:
* 網站的排名詳情:流量排名、用戶量以及網頁瀏覽數
* 提供瀏覽該網站的使用者相關網站資訊
* 該網站目前狀態
* 該網站的聯絡資訊
* 使用者對於該網站的評論-1-5星等
  除此之外,Alexa.Internet還著重列出了「Hot Search」、「排名在前500名的網站」、「排名變動最大的網站」以及Alex Toolbar免費下載服務。
  

(2)Alexa網站排名類別
    Alexa.Internet的世界網站排名主要分為「綜合排名」、「分類排名」等兩種方式。
a. 綜合排名(也可稱為絕對排名)
    一個特定網站在所有Alexa Internet所包含的網站中所佔的排名。此種排名是每三個月公佈一次。依據用戶連結數(Users Reach)和頁面瀏覽數(Page Views),三個月所累積的幾何平均數的數據來排名,例如目前Alexa所公佈前三名的網站分別為:yahoo、msn、google。另外,Alexa還提供使用者以星等評價機制,讓使用者自己來評價一個網站的等級。
b. 分類排名
   有按照「主題」、「語言」等兩種不同模式的分類排名。
* 主題分類排名
    例如新聞、娛樂、購物等項目皆為以主題來分類的模式,目前Alexa共分出16大類。此分類方式是以某個特定網站在同一類型網站中相對的名次。
* 語言分類排名
是將特定網站在所有此類型網站的名次。例如中、英、法、德、日等不同國家使用語言的網站,Alexa提供21種不同國家的語言,其中對於中文更細分出繁體與簡體兩種不同中文。

2. Alexa網站排名(Traffic Rank)定義
   是以覆蓋率(Reach per million users;簡稱Reach)和頁面瀏覽量(Page Views)為衡量指標,依照每百萬Alexa Toolbar安裝用戶的三個月流量之平均數進行排名,每天對每個網站的Reach和PV值進行統計。也就是說此兩指標的幾何平均數(也就是兩者乘積的平方根)構成Alexa網站排名的依據,因此網站排名可反映網站的覆蓋率和頁面瀏覽量。

圖表 1、2006年6月Alexa上顯示的網站排名

圖表 2、2006年6月28日Alexa上顯示的數據

(1) 當日排名(Today):16
(2) 一週平均排名(1 wk Avg):18
(3) 三月平均排名(3 mos Avg):16
(4) 三個月的變化量(3 mos Change):不變(取決於網站非當日排名,而是當前排名三個月的排名數值)


3. 以域名區分不同網站

   Alexa網站排名所計算的網站流量是以域名為基準的流量。Alexa將網頁主機www.wikipedia.org、en.wikipeida.org、de.wikipedia.org作為同一網站計算流量,可看到上述皆使用了wikipedia.org。但個人網頁則是可單獨計算。也就是說當www.yahoo.com.tw申請myweb.yahoo.com.tw、hisweb.yahoo.com.tw兩個不同的個人網頁空間,將被視為三個獨立網站進行計算,而非皆歸為Yahoo.com.tw網域下的一部分統一計算。

圖表 3、2006年6月29日在Alexa上所顯示的資料

4. 排名機制的衡量指標
    Alexa提供「Reach」、「PV」兩種指標來反映該網站的訪問人數以及反映到訪的使用者對特定網站的使用率。「Reach」指每一百萬個Alexa Toolbar用戶中每天網站某依特定網站的平均人數,而某一網站的「PV」則指每天所有訪問該網站的Alexa Toolbar用戶在該網站上瀏覽的總頁面平均數。
(1) Reach(覆蓋數)
a. 計算是用戶數,反映出所有Alexa Toolbar用戶訪問特定網站的百分比。

圖表 4、2006年6月28日Alexa上顯示Wikipedia的Reach走勢

b. Alexa的美洲以及三個月平均覆蓋數皆以每天覆蓋數為基礎,取相映時間段的平均數:三格月的變化量取決於當前覆蓋數、當前覆蓋數排行以及三個月前的覆蓋數、三個月前的覆蓋數排行

圖表 5、2006年6月28日Alexa上Wikipedia的覆蓋數

(2) PV(網頁瀏覽量)
    計算使用Alexa Toolbar用戶所瀏覽的頁面數。同一個用戶再同一天瀏覽同一個頁面,無論瀏覽多少次,Alexa只計算該頁面的瀏覽量為1次。
a. 每百萬Alexa Toolbar用戶的頁面瀏覽數表明該用戶的頁面瀏覽百分分比屬於此網站,所有網站的頁面瀏覽數百分比總和=100%

圖表 6、2006年6月28日Alexa上Wikipedia的PV走勢

b. 每個Alexa Toolbar用戶的頁面瀏覽量是指每個用戶每天瀏覽為一頁面的平均數。

圖表 7、2006年6月28日Alexa上Wikipedia的頁面瀏覽量

5. Alexa運作機制
    Alexa伺服器每天接收,提取其中十幾個參數並寫入專門的資料庫後,在某個特定時間點對當天收集的數據進行分析計算,並以新的計算結果去更新當日的網站排名。具體的運作機制如下:
(1) 當用戶已裝有Alexa Toolbar的IE瀏覽器打開頁面時,Alexa的一台伺服器都會收到加密的數據組。
(2) 數據組中的核心訊息就是十幾個參數,包含有網頁網址、頁面打開時間、用戶端顯示解析度、Alexa工具欄版本等
(3) 數據組中的一個重要隱含參數-ID號碼。也就是Alexa位每個已安裝上工具條自動產生一個全球唯一的ID號碼
(4) Alexa通過ID號碼對每個反饋數據組的發出者進行唯一個標誌,此為解決PV重複計算問題和防止同一用戶多次刷新作弊的重要防弊手段。

6. 影響Alexa網站排名的一些變異數
    排名首重其機制,因此在擬定計算方式的同時,先天條件以及後天環境或是人為的影響因素皆須考慮進去,才能客觀性的了解排名的意義。正如智力測驗不能光看表面的測驗分數,應參照該類別的常模才能加以解釋測驗分數。也就是說將個人的測驗得分,與一群人的分數比較後,以其在團體中所在的位置做為測驗解釋時的依據。
(1) Alexa統計訪問量的條件:(須滿足以下三個條件,缺一不可)
* 需為Alexa Toolbar用戶,在該IE瀏覽器中使用此工具條
* Alexa Toolbar只能內崁於IE瀏覽器
* Alexa Toolbar只適用於Windows作業系統
(2) 易受「語言」、「地域」、「文化」等各方面的影響。由於目前Alexa只提供英文介面,因此相對英語網站的瀏覽數據會更容易被統計。
(3) 欲到有加密的網站時(例如https),Alexa Toolbar將自動關閉,不進行搜索和排名等動作。
(4) 由於對Alexa相關網站的需求,因此會過多瀏覽Alexa、Amazon;Archive等三個網站,也因此該瀏覽量可能會產生過高的統計數據。容易受到網站對自己宣傳程度、廣告行銷的多少、其他網站建立連結的多少所影響。
(5) 瀏覽率太小的網站統計數字可能不準確,整體上月前面的網站數字越可靠。一班而言,月訪問量在1000以下或排名在100000以後的網站統計數字是不準確的。
(6) Alexa自動搜尋程式有時無法辨識不同伺服器是否指向同一內容的網站,相對的可能導致產生域名和主頁名稱的不準確性。
(7) Alexa五星級網站,此星等是由使用者對於該網站評價的平均分數,並不是Alexa提供的認證。
(8) 由於不同類型網站友時沒有可比性,應避免一昧比較綜合型排名。
(9) Alexa的站點分類目錄取自於dmoz.org,與Google相同來源。
(10) Alexa顯示與該網站存在連結相近的網站,此數據通常取決於Google。

如何辨識Alexa排名真偽

    打開Google 試圖搜尋與Alexa相關的網路文章,在中文檢索出15,100,000條的結果中,竟有3/1都在討論Alexa排名優化或作弊的方法,是什麼原因讓虛擬網路世界擁有人性的黑暗面?考試有人帶小抄,作弊!比賽有人吃藥,作弊!LV竟然可以在路邊攤買,假貨!大陸人將腐敗的材料和色素醃製蜜餞,用動物毛做的髮菜,完全就是欺騙消費者!這麼多的真實社會事件發生在現實生活中,虛擬的世界似乎無過之而不及。究竟該如何認清排名機制下數字的意義,Alexa又是如何防止作弊手段繼續惡化。

    過去,人們多關注在某一特定網站在各大搜尋引擎上的排名問題,但排名的評價機制基於關鍵字搜尋結果,關鍵字則有在選用上的隨意性或文化差異,因此往往會導致搜尋結果和排名的不同,並且搜尋引擎有各自的排名規則、更新週期及不同收錄URL方式。是否能有一種評價指標來對一個網站的世界排名進行綜合評估,當然一個評價機制的範圍是全球網站,評價方式又是排名的同時,質疑其公平性以及內在計算的科學性皆將面臨考驗。是首當其衝所面臨的「Alexa是否公正」考驗,在南方網的一篇探討Alexa技術性報告中表示:「Alexa不公正但相對公正」,由於Alexa採用「Reach」、「PV」等兩種數值的幾何平均數,當使用者在使用Alexa工具條時,容易讓自己網站每人平均頁面瀏覽量過高,產生高估。另外,由於Alexa不需要使用者在網頁中插入Alexa代碼等來進行計算排名,因此他對於全世界的網站皆一視同仁。也因此Alexa排名不一定絕對準確,但卻是相對可信的。Alexa網站獲取統計數據作為貢獻,藉由使用工具條的人數越多,相對行業跨度越大,Alexa統計數據也相對更加準確。

    假設從如何提高網站的排名反推回Alexa運算機制的漏洞,或許可清楚了解排名機制下數字的意義。目前部份網站採用「模擬多用戶瀏覽」,也就是說利用編寫一個Alexa工具調返回碼生成器,批量產生Alexa能夠辨識的代碼串,用虛擬多用戶的方式回傳到Alexa資料庫中,如此就可讓Alexa誤認為這些數據是從不同用戶發出的。另位,由於影響Alexa排名的因素為「採集的資訊」、「計算方式」,因此安裝Alexa工具條是最基本的方法,獲改進網站結構、內容和頁面設計等,以提高Reach、PV值。當然藉由一些手法確實可以直接得到高排名或間接獲得利益,但反觀作弊手法中「採集資訊」是取樣安裝Alexa工具條的樣本,「計算方式」是改進網站結構、內容和頁面設計等,皆為Alexa排名基本依據,由於排名是採樣Alexa用戶,當你越多人下載,是否涵蓋的樣本越多,其資料庫數據會更準確。若你改進網站結構、內容和頁面設計的同時,不也是讓該網站的維持定期更新的狀態。眾多制度中皆會有弊端,wikipedia開放使用者一起撰寫內容,只規範基本撰寫原則,同樣其審核機制備受考驗,卻也造就大於線上大英百科的知識庫。與其保守探究其弊端不如深入了解Alexa是如何評價一個網站,客觀地使用這個貼心的服務吧!

 











評分:

1 Star2 Stars3 Stars4 Stars5 Stars (No Ratings Yet)
Loading ... Loading ...

回應:


請輸入圖片中的文字
請按圖片取得圖片中文字的錄音檔
Click to hear an audio file of the anti-spam word