Google引擎的演算法(論文版) |
|
superlevin
高階會員 發表:181 回覆:313 積分:180 註冊:2003-01-12 發送簡訊給我 |
Google 的系統是 Stanford 的資料庫實驗室中誕生的,結合了幾組不同的人馬(data server、information retrieval, etc)。 當年他們的 paper 有放在線上,不過後來 Google 有名後該公司就將 paper 拿掉了(怕別人抄襲? :p)。千辛萬苦找到當年的 paper 內容,不過聽說現在已列為商業機密了。
其演算法的重心在於一個 recursive 的評估函式:
被 link的次數越多,則該頁越重要。而越重要的 link 在連到別頁時,比重就較大。(因此要跑個好幾次,以使得評估值收斂。)
數學上來看則是一個相當漂亮的總合為 1 的式子。 至於其專利申請書號稱有幾百個判斷式,則大概較屬灌水的成份,因為最重要的其實就是一個式子 :)
不過很好奇的一點就是,它的營利來源為何咧?後來才知道,他做的是幫入口網站代理搜尋,還有賣搜尋引擎給需要內部搜尋的機構, google 本身就是最好的技術展示了。
<iframe src="http://www7.scu.edu.au/programme/fullpapers/1921/com1921.htm" width=640 height=480></iframe>
Levin誕生篇...
==============
程式不是寫來玩的
而是要有價值 發表人 - superlevin 於 2003/04/29 05:44:25 發表人 - superlevin 於 2003/04/29 06:58:43
------
林壽山 網站: http://superlevin.ifengyuan.tw mail: superlevin@gmail.com |
c905165
中階會員 發表:50 回覆:120 積分:54 註冊:2002-09-29 發送簡訊給我 |
引言: 數學上來看則是一個相當漂亮的總合為 1 的式子。 至於其專利申請書號稱有幾百個判斷式,則大概較屬灌水的成份,因為最重要的其實就是一個式子 :)事實上,屬於實作性質的論文投稿,它的論文格式在投稿的時候,「表面上」看起來會「很精簡」。有可能他們有其它的「機密」沒有「放」在論文上面。 這是我在猜啦,因為這一點很有可能我們平常投稿論文的時候,有類似的作法。 有困難就是能力不足,有麻煩就是方法不對... 劣者總是遇到困難,也時常出現麻煩
------
有困難就是能力不足,有麻煩就是方法不對... 劣者總是遇到困難,也時常出現麻煩 |
pgdennis
資深會員 發表:41 回覆:526 積分:443 註冊:2002-05-23 發送簡訊給我 |
引言:其實完整的paper別人應該是可以依據內容來重現實驗結果,不過,限於篇幅,大部分的細節paper都不惠提及,頂多只能看他的架構來猜想他的細部做法, 永遠追不上技術更新的速度~~< src="http://140.134.4.20/~g8905202/pucca.gif">引言: 數學上來看則是一個相當漂亮的總合為 1 的式子。 至於其專利申請書號稱有幾百個判斷式,則大概較屬灌水的成份,因為最重要的其實就是一個式子 :)事實上,屬於實作性質的論文投稿,它的論文格式在投稿的時候,「表面上」看起來會「很精簡」。有可能他們有其它的「機密」沒有「放」在論文上面。 這是我在猜啦,因為這一點很有可能我們平常投稿論文的時候,有類似的作法。 有困難就是能力不足,有麻煩就是方法不對... 劣者總是遇到困難,也時常出現麻煩
------
星期一,二...無窮迴圈@@ |
本站聲明 |
1. 本論壇為無營利行為之開放平台,所有文章都是由網友自行張貼,如牽涉到法律糾紛一切與本站無關。 2. 假如網友發表之內容涉及侵權,而損及您的利益,請立即通知版主刪除。 3. 請勿批評中華民國元首及政府或批評各政黨,是藍是綠本站無權干涉,但這裡不是政治性論壇! |