您现在的位置是:首页 > 领风资讯 > >> 返回

Google的PageRank算法无所不能(néng)?

 1998年,兩(liǎng)个名不见經(jīng)传的研究生,Larry Page和Sergey Brin,第一次在學(xué)术论文上介绍了Google這(zhè)个搜索引擎,而关键创新点就(jiù)在于他们發(fā)明的名叫(jiào)PageRank的算法(PageRank是Larry Page的Page,而不是网页的意思)。Google正是依据PageRank算法將(jiāng)搜索到的网站進(jìn)行排序,正如他们二人所說(shuō)的:PageRank“带来了网页新秩序。”


 PageRank將(jiāng)网站的链接和超链接作为指标,衡量其重要性和权威性。然後(hòu)Google根据此信息来排列搜索结果。Page和Brin發(fā)表的分析结果,并不只是当時(shí)现有数學(xué)的一个新的应用,學(xué)者们认为,他们找到的是一个全新的方法,虽然可能(néng)有借鉴一些前人的成(chéng)果。


 虽然Google對(duì)PageRank提供搜索结果的依赖程度到底有多少,只有公司内部的人才知道(dào),但是,可以肯定的是,该算法對(duì)Google现在数千亿的市值起(qǐ)到了不可磨灭的作用。


 而PageRank在网页之外,也具有惊人的大范围的实用性,几乎涵盖所有领域兴化做网站,从体育团队的排名到大脑内部交互联结的分析。


 普渡大學(xué)的计算机學(xué)家David Gleich這(zhè)麼(me)评价道(dào):“它有点像是Google發(fā)明的镜头。如果你有各種(zhǒng)不同的镜头随机组合,你就(jiù)可以观察到各種(zhǒng)不同的系统——就(jiù)像是你同時(shí)有了显微镜,望远镜,数码相机等等。但你還(hái)是需要有自己独特的视角。”


 自动论文發(fā)表以後(hòu),十六年来,Gleich一直在研究PageRank算法在其他领域的应用。他已經(jīng)發(fā)现了数十種(zhǒng)可以使用该算法的具体案例。他的做法并不是深入研究每一个实例的具体实现,而是为了证明PageRank确实拥有广大的适用范围。


他說(shuō),只要有图谱,就(jiù)有PageRank的用武之地。它是一種(zhǒng)数學(xué)的思维方式,代表了一组事(shì)物的关系或流程,研究對(duì)象可以是Web页面(miàn),办公室工作人员,Facebook的用户,基因,蛋白质或者交通情况。“PageRank就(jiù)像各種(zhǒng)图谱一样,无处不在。”


 以下是一些有趣的使用案例。目前,這(zhè)些對(duì)Google的商业或社會(huì)影响并沒(méi)有产生什麼(me)作用,但也不排除會(huì)有這(zhè)麼(me)一天。


 文學(xué)作品


 最重要的文學(xué)作品是什麼(me)?PageRank算法可以帮助回答這(zhè)个看似很主观的问题。Nebraska大學(xué)的一位文學(xué)教授開(kāi)發(fā)了一款软件,使用了PageRank和其他的算法。他的研究對(duì)象是十九世纪的文學(xué)作家。經(jīng)過(guò)分析了近3600部長(cháng)篇小說(shuō),软件得出了结论:简•奥斯丁和沃尔特•司各特是那个年代最有影响力的作家。


 体育运动


 在特定的运动项目中,谁是历史上最好(hǎo)的球队或球员?這(zhè)个问题如果交给球迷,那必將(jiāng)吵得不可開(kāi)交,因为评判标准同样是主观的。有一则论文利用PageRank分析了1968年之後(hòu)的所有职业网球比赛,它將(jiāng)相同的兩(liǎng)个對(duì)手之间的比赛结果進(jìn)行匹配,以“声望得分”为基础构建了一个网络。得出的结论是,在网球界,Jimmy Connors是史上最好(hǎo)的球员。就(jiù)像Gleich說(shuō)的,這(zhè)些排名背後(hòu)的基本思想是:假设一个粉丝會(huì)追随著(zhe)一只球队或球员,直到他被(bèi)打败,而後(hòu)他會(huì)继续追随胜利的一方,直到结果出现。這(zhè)类似于网上冲浪者在网站链接中做出选择。


 神經(jīng)科學(xué)


 Gleich 在他的论文中写道(dào):“人类的大脑是一个重要的网络,可我们對(duì)它的了解少的可怜”。PageRank当然也适用于此。最近,它被(bèi)用来评估不同大脑区域之间的联结和重要性,以及随著(zhe)年龄的变化结果會(huì)如何改变。


 癌症研究


 在一篇名为“Google Goes Cancer”的论文裡(lǐ),研究人员開(kāi)發(fā)了一種(zhǒng)基于Google算法的“新型计算方法”,该算法帮助他们确定了七个与遗传有关的肿瘤基因,這(zhè)將(jiāng)帮助医生更好(hǎo)的指导癌症治疗的過(guò)程。


 交通网络


 PageRank的另一应用是用来预测城市裡(lǐ)的交通流量和人流动向(xiàng)。有一项研究依赖于该算法的一个关键因素:一个叫(jiào)做teleporting(传送)的概念,它模拟了人类的决定:開(kāi)始或中止行程,或者在既定的街道(dào)停车。這(zhè)有助于交通运输研究人员更好(hǎo)的创建测量模型,模拟道(dào)路的车流量和人流量。