文章分類 ‘觀察室歷史文章’

這個搜尋引擎…究竟邪不邪惡?—《翻動世界的Google》及其他

星期二, 五月 27th, 2008

內容發展分項計畫/江仁傑

翻動世界的Google (原英文書名:The Google Story )

作者: 大衛.懷司(David A. Vise)、馬克.摩西德(Mark Malseed)

譯者: 蕭美惠、林秀津

出版社:時報文化

出版日期:2006 年 03 月 20 日

The Google Story

Hardcover: 336 pages

Publisher: Delacorte Press (November 15, 2005)

Language: English

ISBN: 055380457X

—————————————————————————–

  前陣子,好多辦公室流傳著一封不知從哪裡冒出來的e-mail,上頭圖文並茂地介紹了Google美國總部種種天堂般的工作環境:免費美食、玩樂設施、健身運動設備、鋼琴、滑板車、洗衣間、帶小狗來上班、隨心所欲布置周遭、自由、開放、活力。這自然引起所有上班族的豔羨之情——當然,你最好不要就此跟你的老闆要求比照辦理,否則老闆會叫你回家吃自己,或者請你乾脆去Google上班。

【朝氣蓬勃的新興企業】

  《翻動世界的Google》這本書(以下簡稱《翻動》),變本加厲地介紹了種種網路流傳的Google事蹟(當然也可以稱作奇蹟),以致於被一些讀者稱為「這簡直是Google宣傳手冊」,也有人認為書中的資訊很遺憾地太不詳細了(除了那個Google「執行主廚」的炸雞秘方之外)。不過,書中還是很有些引人注意的故事,包括兩位創辦人的猶太人家庭背景、特立獨行的理念、從博士生研究室到萬眾矚目之新興企業的超高速發展史、拍著雪白雙翼翩然現身的「天使投資人」提供適時的幫助、全神貫注於創新的技術、與眾不同的商業模式、與各大網路公司及傳統企業的交戰或合作、IPO(股票公開上市)前後湧現的許多批評、股價不受網路泡沫影響、從85元神速地竄升為300元(現在是400),以及Google現在與未來的種種可能的或(也許)不可能的計畫——例如將搜尋引擎植入腦中這類科幻式的狂想。

  由於中英文的網路書店已經有了《翻動》的介紹、內容試閱,以及讀者評論,所以我就不必作什麼全面的介紹了吧,只要提出一些令人印象深刻的部分就行。而且,原書的出版是2005年,有些章節的資料只到2004年底,象Google這樣還不斷在「翻動」的現象,自然還需要一些補充。

【「少年成長幻想小說」式的創辦人經歷】

  首先,《翻動》跟其他介紹商業的書籍一樣,必然要對書中主角:成功的公司創辦人作一番介紹。只是這次介紹的人物,比起白手起家或辛苦經營的企業家,更具有戲劇性,更容易成為新時代崇拜的對象。在網路時代,由Google兩位創辦人布林(Sergey Brin)與佩吉(Larry Page)在短時間之內所造就的種種奇蹟,如此迅速、如此另類(或者說創辦人「有個性」),還跟自己請來的執行長施密特(Eric Schmidt)惡作劇,頗有「少年成長」類的幻想小說風格。

  眾所周知,這類小說通常是描述主角(們)在世界(真實背景或架空的)探險、成長,學習或自創神奇的武功(或魔法,或程式演算法),遭遇越來越多的困難與人物,最後成為絕世高手或其他什麼的頂尖人物。《翻動》之中關於兩位創辦人的故事,看起來就是這個味道(甚至讓我在閱讀過程中,不止一次想起黃易的玄幻小說《大唐雙龍傳》的兩位男主角…-_-|||)。也許就是因為其快速成功的真實傳奇,所以兩位創辦人很容易被視為偶像。這當然不是在影射《翻動》像小說一樣杜撰了情節,而是因為它令人驚訝的程度。

【神秘醬料:Googleware】

  《翻動》也試圖解釋Google及其創辦人的巨大成功。作者創造了一個名詞:Googleware,來形容Google具有超級的運算能力,能在越來越多的數位化資料中找出使用者所需要的東西,是集合了軟體與硬體兩方面的功能,不是只依靠一個更聰明的程式演算法,也不是只依靠使用硬體的革新方式,而是兩者的結合。

  軟體方面,所指的是佩吉演算法(Page Rank)為主的程式,能夠處理「蠕蟲」在各網頁蒐集來的網頁,將每個網頁依照被其他網頁連結的次數(如同一篇論文被其他論文引用的次數)來評分,而且被越重要的網頁(被連結次數越多的網頁)所連結,評分就越高。有了佩吉的演算法,再加上舊有的搜尋引擎處理關鍵字的能力,Google有了其他搜尋引擎所無的快速與正確性。這種運算方式,也成為外界難知細節的、可以買賣的商業機密(Google就賣給了Yahoo)。

  在硬體方面,布林與佩吉喜歡使用自己的方式(後來發展成獨門秘方)來組裝電腦,把許多台個人電腦去掉不需要的部分,然後拼成超級電腦,不但有更佳的功能,而且還更節省成本。Google的機房,也因此成為機密重地,極少人能夠參觀(或許《翻動》的作者也沒能進去)。

【依靠搜尋來賺錢的方法】

  至於Google是怎麼賺錢的,作者寫道:「許多聰明人不知道該公司如何賺錢」——我也曾經是這種聰明人——,因為Google放置廣告的方式十分靈巧。在免費提供給所有上網者的Google搜尋引擎,在搜尋結果的顯示頁面的右側,有時會出現一排有點兒語焉不詳的「贊助商連結」,事實上,那就是廣告,但很多人不知道那是廣告。Google把跟使用者搜尋之關鍵字相關的廣告,列在一旁,每次使用者的點閱,廣告商再付錢給Google,而這些廣告的排序,除了要看廣告主購買這些關鍵字的金額之外,google堅持也要跟搜尋者需不需要有關,被擊點次數越多的,排列越上面。Google說,這種廣告方式有很多好處,人們不會看到不相關的廣告,廣告商的錢也能花在刀口上。然而,搜尋結果與廣告的區分標示得有些模糊,這一點被人指責是近乎欺騙,跟Google所標舉的「不作邪惡之事」(You can make money without doing evil)的原則不符。

  不過話又說回來,在Google的作法之前,更多提供搜尋功能的網站,是明目張膽的把搜尋結果跟贊助金額掛勾,直接影響搜尋結果,而Google的處理方式,起碼把搜尋結果與「贊助商連結」作了區分,已經算是一種進步,比較能維持搜尋結果的正確性不受商業左右。此後,其他網站要嘛就是在某種程度上效法Google的作法,要不然就是等著被使用者質疑,最後被取代。

【所謂的「Google經濟體」】

  越來越多的公司願意把廣告經費投入搜尋引擎,使得標售關鍵字成為一門重要的生意,而且不限於Google得到好處而已。專門幫廣告主提高在搜尋引擎排名的公司,也應運而生,他們還會以各種經驗老到的刁鑽方式,幫助廣告主買下Google上的某些關鍵字。而關鍵字的買賣,只不過是作者所說的「Google經濟體」的一角。

  關鍵字買賣也引起官司。原本Google像Yahoo一樣,不允許已被正式註冊的商標名稱,被其他公司購買為廣告關鍵字;但在股票公開上市之前,Google卻放棄了這種規定。許多人批評,這是為了擴大營收、提高新上市的股價,Google因而出賣了自己的原則。一家大公司的商標名稱在Google上被競爭對手購買走了,因而向法院提出訴訟,指控Google在關鍵字買賣放棄把關,是一種違法行為,必須為此進行賠償。不過,Google成功的贏了這場官司,把註冊商標被搶奪的責任,歸於那些前來搶奪關鍵字的公司。

  Google的成功不僅是商業上的,它的搜尋引擎免費、快速、成功率高,是Google被大家接受的最主要基礎。這使得Google幾乎不必在行銷上花錢,主要依靠口耳相傳來建立品牌、推廣產品,另外還有傳媒報導的免費宣傳,而一些狂熱者也幫了忙。許多科技業或新聞界的使用者,成立了搜尋引擎的觀察網站或部落格,來討論這項網路利器,其中,Google經常受到良好評價,而其中一份「搜尋引擎觀察」網站,最後也從小網站成長為傳媒公司高價收購的網路報。這是Google經濟的又一例子。

【激烈的人才大戰】

  圍繞著Google的種種奇蹟,該公司怪異而有活力的企業文化,以及不斷賺錢的前景之下,甚至於道德上的制高點,在軟體業之中引起明顯的效應。許多曾待過其他大網路或軟體公司的人才,不斷被吸引到Google,Google甚至「厚著臉皮」(作者語)到微軟總部的同一條路上設立辦公室。Google與微軟搶奪軟體人才的大戰也延燒到世界各地,包括中國(以李開復從微軟跳槽到Google而吃官司的事件最為有名)。

  就目前來看,微軟在這個「人才大戰」中有些吃鱉,因為Google這家新興公司的清新形象,且提供優質免費的搜尋服務而贏得人心;而微軟方面,則被控壟斷、陷入「反托拉斯法」的爭議,使其形象看來像是個不擇手段的大怪獸。作者認為,「許多優秀的工程師對於是非、正與邪等哲學問題有著強烈感受」,因此在錢景看好的前提之下,又兼具道德上的正當性,就能化為強烈的吸引力來招攬人才,並進一步影響整個社會的觀感。

【文化上的種種影響】

  在社會文化方面的影響,也很快觸及一般人的生活。

  Google以免費搜尋為號召,改變了幾乎所有網路使用者尋找資料的方式。學者、研究者也可以使用Google Scholar找到資料,Google Print的計畫,則試圖將人所有書籍掃瞄上網,很可能將徹底改變知識儲存與傳播的途徑。對教育的影響也很顯著,學生寫報告、老師審閱報告的方式,也必定因為網路資料越來越容易搜尋而改變,Google等搜尋引擎是懶惰者的福音,也是用功者博覽知識的利器,至於認真的老師,則必須改變評量學生書面作業的方式,或者需要評斷學生是否以「複製、貼上」的方式來交差了事。某人的犯罪紀錄,可能在某個不起眼的網路角落刊登過一次,就永遠存在Google的網頁資料庫,變成一輩子的麻煩,阻礙了真正想自新者的機會;某些不太想讓人看到的尷尬相片,也因此得到永存。

  「被Google」,或者自己Google一下自己,漸漸成為很多人都有的經驗;在約會、面試、談生意之前,或純粹好奇,或多管閒事,都有即時免費的資訊可以取得。這種人際關係上的小技術,在幾年前是不可能的。

【接下來,爭議越來越多…】

  隨著Google越來越深入人們的生活,Google的不斷累積無數用戶的資料,以及公司本身不斷變大,越來越具影響力,對它的疑慮也逐漸產生。人權團體曾經反對Google在它所提供的1G免費信箱中置入廣告,因為這些廣告是與郵件內容相關才會顯示,這就表示Google會搜索使用者的私人信件。另外,也開始有人提出要在法律層面明確規範這家公司,還有許多公司因為種種商業因素而控告它,爭議性似乎越來越大。

  除了《翻動》中所敘述過的之外,在此也補充另外的一些批評。這些批評有的是因為《翻動》出版的時間限制而來不及收錄,有的則被一筆帶過,但卻十分重要。

【Google Print計畫是否侵犯了著作權?】

  Google Print計畫侵犯了智慧財產權的問題,是近來主要的爭議之一。這項計畫的野心,是要將所有人類書籍知識掃瞄上網,讓網路世界可搜索的資訊有更豐富、更可靠的來源。但是許多擁有版權的原作者,十分不滿Google的掃瞄書籍上網的一些方式。

  2005年9月20日,美國作家協會(Authors Guild)在紐約州法庭控告Google公司的Google Print Library Project(Google列印圖書館計畫) 「厚顏無恥」明目張膽地侵犯著作權,作家們聲稱,只有著作的的合法所有權人,才有資格決定如何發佈、流通其作品。 美國作家協會有8000多名作家成員,是美國最大的出版作家組織。該協會要求Google為每一次侵權支付賠償,並請求法院禁止該公司未支付費用就拷貝受版權保護的圖書內容 。

  同年10月19日,美國出版商協會(Association of American Publishers)在美國曼哈頓地區的法院對Google提起。在起訴書中,出版商協會指控Google為了追求自己的商業目的,推動Google Print Library Project,而給出版商帶來了「持久的、無可挽回、迫在眉睫的傷害」 。

  Google則聲明,書籍上網之後,使用者僅能搜尋哪些書上有沒有特定的關鍵字,並且只能看到關鍵字前後的小部分內容,不可能看完整本書(其實,網路上有流傳破解方法),查詢的部分也無法列印、複製,而且被搜尋到的每本書,都有書籍典藏所在地之圖書館的資料,或者購買該書的網路書店網址。因此,書籍內容上網的計畫屬於「合理使用」(fair use)的範圍,符合公眾利益,也並非侵犯著作權,反而是替被搜索的書籍作宣傳。

  作者與出版商控告Google公司Google Print計畫的案件,在法律上來說,雙方的勝算不相上下,因為模糊的著作權法律留下了大量的爭論空間,而且新科技衍生的問題又沒有前例可循,這使得Google和出版商之間的這場恩怨預計在二年後才會有審判結果。

  Google Print引發的疑慮,在於數位科技對著作權可能造成的侵害;更清楚地說,這是網路公司、圖書館、出版商與作者的各方利益之間,以及「著作權者的利益」與「網路上芸芸眾生的公眾利益」之間,應該如何取捨的問題。

【Google在言論自由上令人擔憂的立場】

  另外一項指控也很嚴重,雖然在法律上沒有顧慮,卻損及它清新的道德形象。Google被指為了進軍中國市場,而犧牲了「言論自由」的原則;但在另一方面,Google卻又拒絕美國政府提供使用者的資訊,被譏為「偽善」、「雙重標準」。

  人權團體嚴詞批評Google、微軟、Yahoo、及思科(Cisco)四家公司,為了在中國的商業利益,配合中國政府進行網路檢查,使某些具有政治敏感性的關鍵字,無法在設於中國的伺服器上被搜尋到(例如google.cn);Yahoo並因提供用戶資料給中國政府,導致這名用戶——中國作家施濤,為了他發表的言論而被判刑十年。這件事在崇尚言論自由的美國幾乎已經變成醜聞,引起眾怒,美國國會甚至在2月15日為此舉辦聽證會,有議員指「這太令人驚訝了」、「令人憎惡的勾結」、「簡直是恥辱」。這些網路公司之中,有些曾在別的場合中替自己解釋(在聽證會上則無):以中國的情況來說,有限制的資訊,總比完全沒有資訊來得好一些。

  但是就Google來說,情況可能更令人不能接受。2006年1月,美國司法部要求幾家網路搜尋巨擘交出使用者搜尋資料,包括微軟、Yahoo、Google、AOL(美國線上)等,以便在網路上防止、追蹤兒童色情訊息的散布。其他公司決定配合,但Google卻斷然拒絕,司法部因而提出訴訟。這雖然導致Google的股價暫時下跌,卻贏得眾多人權團體、隱私權團體和廣大網友的讚揚,因為許多人認為,司法部的過火作法侵犯了所有網路使用者的隱私。

  不過,也有人趁此機會提出更重要的疑問。例如網路權利監督組織「電子前鋒基金會」的律師質疑,Google將用戶所有搜尋列入紀錄的政策是否適當(大部分搜尋紀錄,都能辨識出用戶是誰)。不料,不久之後就傳出Google配合中國政府篩選言論的消息,使一些人對於Google具有建立「老大哥」式監控體制的潛力,感到十分憂慮;而Google對待美國政府與中國政府的不同標準,也讓人懷疑它「不作邪惡之事」的原則,是否能真正堅持。

【關於「生物竊盜」的指控】

  對於Google的最新指控,則是有關於基因資料庫研究的「生物盜竊」。反生物盜竊聯盟(Coalition Against Biopiracy)在2006年3月指出,Google與基因研究機構攜手合作,建立一個可搜尋的線上基因資料庫,是一種「生物盜竊」(biopiracy)的行為,即「壟斷基因資源」、「未經授權使用生物資源」。在《翻動》之中,介紹了Google以它強大的運算能力,協助蒐集了大量基因資料的研究機構進行分析、比對,且其精密程度足以辨識個別基因和蛋白質的運作單位。在未來,就能創造出一個基因目錄,記載地球上所有基因的特點,瞭解它們的演化過程;而一般人上網就能查詢自己的基因,也能使「個人化藥物」的時代提早來臨,醫師開藥時就可以針對每個人的基因特質來用藥,不必再以一般人的平均值做為用藥假設。但是,反生物盜竊聯盟卻認為,這種基因庫蒐集了大量基因組,又牽涉上Google這種人人都可使用的強力搜尋引擎,難保不會被遭到濫用。

  目前,對於Google在基因庫研究方面的涉入程度與細節,絕大多數人所知不多,因為Google認為此事「並不影響現今的營收與獲利」而沒有主動告知股票所有人與社會大眾。此事牽涉到每個人都有的基因,卻又如此神秘,當然要引起許多疑慮了。
  總之,Google的技術與各種活動,已經深入了越來越多的網路、經濟、社會、政治、文化、傳播、生物…等等層面,而這一切變化,都是在不到十年的時間造成的(Google公司成立於1998年),仔細一想,確實讓人驚訝世界變化之快。

  Google仍在翻動中,這個世界也是。不管喜不喜歡,我們都必須密切注意這個動來動去的Google。不只是因為它不時提供很多很炫的新服務,還因為它「不作邪惡之事」的承諾應該要有人盯著,更因為它關係到太多人的未來。

「國家文化資料庫」之介紹

星期二, 五月 27th, 2008

內容發展分項計畫 / 蔡欣芸

 

  國家文化資料庫是「挑戰2008─六年國家發展重點計畫」之數位台灣計畫「網路文化建設發展計畫」之下的一項基礎建設子計畫,與目前「數位典藏國家型科技計畫」的目標稍有相同之處。國家文化資料庫主要是針對全國藝文資源進行數位典藏的工作,除了一般大型機構參與之外,也推動全民參與。其所整合之藝文資源多達15項之多,包括老照片、美術、音樂、舞蹈、戲劇、漫畫、文學、建築、電影、古地圖、器物、報紙、漢詩、古文書、新聞電視影像等,並透過網路及各種檢索機制,開放讓全國人民查詢利用。

 

  …詳全文

你聽過「金石拓片」嗎?

星期二, 五月 27th, 2008

內容發展分項計畫/溫敏宇

 

  是否曾注意過現今一家聞名遐爾的書局「 金石堂」?「金石」是什麼意思?所謂「精誠所至,金石為開」、「鍥而不捨,金石可鏤」,比喻只要有持之以恆的心,就算金石般堅固的東西,也會被分開;那麼,妳聽過「金石拓片」嗎?很多人會問拓片是什麼?什麼叫做「金石拓片」?為什麼是「金石」拓片?有沒有別的稱呼?

 

  古代祭祀稱為吉禮,祭祀所用的鼎彝等古器物為「吉金」,故稱鑄於祭器上的文字為「吉金文」;中國商周時代的青銅古也稱「金」或者「吉金」; 查詢教育部國語辭典「金石」的結果:金,鐘鼎彝器。石,碑碣石刻。金石指用以頌揚功德的箴銘。《史記‧卷六‧秦始皇本紀》記載:「群臣相與誦皇帝功德,刻于金石,以為表經。」,《呂氏春秋‧慎行論‧求人》:「故功德銘於金石,著於盤盂。」;宋朝趙明誠收錄了三代彝器及漢唐以來石刻二千種目錄及拔尾,並做辨證題釋,稱「 金石錄」;《佛教知識網》記載了有關「金石」的敘述,中國古代習慣日用的金屬器皿上刻鑄文字,或是記事,或是銘功,或是警戒,這叫做「金」。 後來名刻在碑碣上,或是墓志上,這叫做「石」 。佛教的金石文物,不僅關係到佛教史實,也關係到一般社會的史實。在此解釋了「金石」即是青銅與石刻之合稱,這兩樣東西以堅固著稱,古人重視到用以祭祀的重要物品,中國文化的發源可以從這些器皿上的變化考據而來,其上所刻的文字稱為「金石文」,金石文字是古代歷史和藝術的重要資料,現已成為中國的一個專門學問。

  …詳全文

Television News Archive資料庫查詢介面

星期二, 五月 27th, 2008

內容發展分項計畫/程婉如

 

  Television News Archive成立於1968年,座落於美國田納西州的范德堡大學內校園一角,其彙集國內外電視晚間新聞及廣告時段,主要包含ABC、CBS、NBC、CNN、FBC等廣播及有線電視新聞頻道等,不僅完整側錄及典藏新聞時段資料,並且建立良好的檢索系統提供查詢。本文以此機構網站http://tvnews.Vanderbilt.edu/之資料庫操作檢索介面為主,初步介紹如下:

 

  (圖一)為此網站首頁,其提供搜索引擎(TV News Search)以查詢電視新聞資料,點選進去之後連結至(圖二),得以免費註冊為會員之後進行檢索。

 

…詳全文

盤據中文線上國學搜尋的大宗-百度搜尋引擎(Baidu.com)

星期二, 五月 27th, 2008

內容發展分項計畫/ 高芷彤

 

  百度搜尋引擎公司Baidu.com由超鏈分析專利發明人李彥宏及其好友徐勇在美國矽谷成立公司,並於2000年回到中國,以專門搜索和收錄中文網頁之搜尋引擎為主。Baidu創辦人李彥宏以辛棄疾的《青玉案》中的「萬里尋他千百度」來象徵對於追求中文資訊檢索技術的執著。他主要產品及服務是針對不同企業及各機構網路化的基本需求而設計的,分為對於全球互聯網的中文網頁檢索,以及對於解決企業級的資訊檢索等兩方面,此外Baidu還利用遍佈在全國龐大的CDN網路提供的資訊傳遞技術(即網站加速及網路緩存技術),它的使用者包括深圳商報,四川新聞網,中國基礎教育網等。2001年正式發佈Baidu搜尋引擎,專注於中文搜索的層面,提出競價排名的服務。此服務是以用戶(通常為企業)為自己的網頁出資購買關鍵字排名,按點擊計費的一種服務。不同於Google以PageRank排名,Baidu通過競價排名,搜索結果的順序將根據競價的多少由高到低排列,同時奉行不點擊不收費的原則。也就是說,Baidu將自己的搜索引擎變成廣告平台,提供用戶(通常為企業)在虛擬平台上廣告行銷。由於以Baidu提出的統計報表為主,因此要特別注意是否有與用戶提出統計量相異的矛盾產生,樂臣數碼公司則是在這遊戲規則下提出質疑以及訴訟的用戶。

 

圖表 1、http://www.baigoodugle.com/

  …詳全文

  • Loading...


    Loading...

    Login






    註冊 | 忘記密碼

    Register





    A password will be mailed to you.
    登入 | 忘記密碼

    Retrieve password





    A confirmation mail will be sent to your e-mail address.
    登入 | Register