关灯
护眼
字体:

第0040章 搜索引擎算法

首页书架加入书签返回目录

请安装我们的客户端

更新超快的免费小说APP

下载APP
终身免费阅读

添加到主屏幕

请点击,然后点击“添加到主屏幕”

    所以使用HITS的搜索结果会比其他两者都更权威,但这个算法会大大增加计算负担,对吧?”

    ……

    张树新点头表示肯定,“现在南方最有发展潜力的地方,毫无疑问就是深圳和沪上浦东,而张江高科技园区,则是科技的孵化宝地啊。”

    然后不断的重复计算每个页面的PR。假设给每个页面一个随机PR值,那么经过不断的重复计算,这些页面的PR值会趋向于稳定,也就是收敛的状态。

    影响精度分的因子包括自己评分,链接的垂直网站评分,用户反馈分,人工制定分以及外链影响等。”

    之后,孟谦浅尝辄止的展示了各个分支的算法逻辑和算法推演公式。

    第四,规律算法,在用户的所有行为中寻找大概率行为,并将这些大概率反馈到人工,比如说60%搜索了汽车的用户下一个搜索词都是保险。

    当然如果能直接理解用户的需求然后帮他搜索他最想要的内容,这是最理想的搜索引擎状态,但谁都知道这是不可能的。

    2000年的张江,领军产业是电路、软件以及生物医药。

    那么白度输在哪呢?关键就在于白度现在过于简单的基于在某次搜索的所有结果中被其他网页用超链接指向的越多的网页就价值越高这种基础排序方式。

    还是用汽车举例,有100个用户搜索汽车后,80个点击了A网页,A网页的评级就会上升,如果有更多的用户在A网页的停留时间较长,A网页的评级也会上升,如果有更多的用户在A网页上直接进行链接等操作,A网页的评级也会上升。

    这个时候大家说到南方城市的发展潜力,尤其是科技发展,还没人会想到杭城。

    有一些声音说谷歌其实是剽窃了白度的超链算法,毕竟李彦宏这个专利确实在谷歌之前,我们现在不去猜测真假,但这种说法体现了一个很重要的信号,其实不管是哪一家的算法,算法基础其实都是一样的。

    简单的打了个招呼,大家就到会议室坐着,接下去是孟谦的表演时间,他今天,要展示他的搜索引擎核心技术。

    10个用户用谷歌,5个人找到了自己想要的东西,如果用我们的搜索引擎,6个人找到了自己想要的东西,在这里领域目前的技术环境下,我们就是更优秀的。

    另外三名华夏人,一人是瀛海威自家的技术总监,另外两人都是从硅谷回来的,一个毕业于斯坦福大学,曾任职于英特尔,一人毕业于哈佛,曾任职于甲骨文,都是人才。

    那么在这个理解基础上,我接下来要给大家介绍的,就是我的搜索引擎算法,动态规则超链分析算法。

    此时的浦东,已经开始耸立起高楼大厦,同时又存在大片的厂房和棚户区,车子一路开过去,可以看到很多地方正在拆迁改造。

    也就是每一个页面都有PR值,同时你的PR值会成为其他页面PR值的参考。

    所以在我的算法中,对于指向某一个网站的链接,我首先会做垂直率评分,比如有现在有10个网站链接到了A,这10个网站都是汽车类网站和这10个网站都不是汽车类网站的结果,想必是肯定不一样的。

    这样的一些规律我们是无法预测的,但我们可以利用算法进行大数据挖掘,回馈的这些结果可以供人工分析部对一定的网页进行评分,这个就是人工分。

    而随着杰尔夫的打断,原本都沉浸在孟谦分享中的其他四名技术人员,眼神也都出现了明显的变化……

    “在我展示我的核心技术之前,我们先来看看当下的三大主流算法,白度的超链分析,谷歌的PageRank算法以及IBM的HITS算法。

    但说的简单一点,其实核心就是一个东西,算法。

    杰尔夫顿了顿,以为孟谦是没听懂,用奇怪的发音道,“卧槽!!!”

    结合以上四点,在我的算法下,任何一个网页同样会有一个分数,我称其为精度分。

    动态规则超链分析算法有以下几个变化。

    就比如今天搜索汽车的用户最多,那么汽车的评分可能就是10分,这个时候,算法会分配更多的资源到汽车相关... -->>
本章未完,点击下一页继续阅读
上一章目录下一页

请安装我们的客户端

更新超快的免费小说APP

下载APP
终身免费阅读

添加到主屏幕

请点击,然后点击“添加到主屏幕”