在线观看无遮挡 I 麻豆视频在线观看免费 I 免费在线播放毛片 I 57pao国产精品一区 I 欧美亚洲综合久久 I 雪臀抽搐求饶娇喘呻吟 I 麻豆香蕉 I 成人黄色免费网址 I 天堂av社区 I 欧美亚洲三级 I 日韩高清网站 I 蜜桃麻豆视频 I 午夜成人免费视频 I 玖玖爱av I 男男gay纯打屁股网站 I www.久久av I 国产av无码专区亚洲av I 日韩久久网 I 一级性生活毛片 I 91看片黄 I 四川一级毛毛片 I 精品国产人成亚洲区 I 天堂久久伊人 I 色青青草 I 黄色av男人的天堂 I 中文字幕在线播放2 I 欧美日aaa I 女生裸体视频网站免费观看 I 欧美一区二区三区…… I 日本手机在线视频 I 中出人妻中文字幕无码 I 欧美成人xxxxx I aa视频在线免费观看 I 国产丰满 I 欧美人与动牲交大全免费 I 久久99亚洲精品久久 I 久久99er6热线精品首页 I 久久久少妇高潮久久久久 I 国产精品成人午夜电影

解析google和百度兩個關鍵詞的相關度

古柏廣告設計
助力企業品牌成長
圍觀:1458次

通常對于文本信息之間得相關性得計算都是采用向量的辦法,我在以前的PPT里曾經提到過。然而對于文本信息更深層次的分析不能單純從字面上分析一篇文章的關鍵詞,更重要的是它隱含的擴展的意義。

傳統的關于計算文本相關度和【網頁和查詢的相關性】的計算都是采用匹配的方式進行的,然而這只能是基于字面意義上的統計計算。這里介紹的做法是采用關鍵詞相關性擴展的做法從而得到更加精確的相關度計算。

例子:
文章 A: 談論的是大學教育,最高頻的關鍵詞是:學生[3],學習[2],大學[2]
文章 B: 談論的是普通教育,最高頻的關鍵詞是:教育[5],教師[1],進修[1]
[]里是相對的權重,可以理解成 TF*IDF

根據傳統的相關性計算,我們會得到如下的結果:

1. 文章A 與 文章B 不相關
2. 查詢 學生,學習,大學只能返回文章A,不能返回文章B
3. 查詢 教育,教師,進修只能返回文章B,不能返回文章A

分析:
這個顯然是有一定的問題的,問題的出現在于我們通常將“字面”的意思做為分析的來源而且依靠和僅僅依靠這些“字面”的關鍵詞做為文章相關性和查詢相關性判斷的唯一要素。

如何避免?
我在以前的文章中提到過【關鍵詞相關度】的概念,舉例說明:
當出現:{學習}這個詞匯的時候,真實的表達的意義往往是這樣的:
{W1*學習,W2*教育,W3*教師,W4*大學。。。。。。}
其中W1,W2...是學習和相關詞匯的相關權重。

基于這樣一個矩陣,我們就能夠將一個詞擴展成為一組詞匯,因而也同時可以將文章所對應的向量擴展成一個更多詞匯的集合。

這里的計算需廣州網站設計要一個完整的相關度矩陣:M

M(i,j) = {關鍵詞i,j的相關度}
而兩篇文章的相關度的計算,也由簡單的
R= Sigma Vi*Vi
變為
R= Sigma Vi*M(i,j)*Vj

查詢關鍵詞和文章的相關度也由簡單的
R(i)=TF(i)*IDF(i)
變為
R(i)=Sigma TF(j)*IDF(j)*M(i,j)


下面碰到一個核心問題就是:關鍵詞之間的相關度如何計算?
例如:學校和學生的相關度是多少?
計算方法:
假設一個文章集合 {C},總文章數目為N,其中含有單詞A的文章總數為Na,含有單詞B的文章總數是Nb,含有{A+B}的文章總數是 Nab,那么相關性這么計算

CorrAB= Nab/(Na+Nb-Nab)-(Na*Nb)/(N*N)

本計算中可能會得到負相關,如果考慮到Na,Nb都是小量,可以忽略,那么

CorrAB= Nab/(Na+Nb-Nab)

至此,要計算相關度之間的全部要素都獲得了。

思考,那么到底 學校 和學生 之間的相關度是多少呢?
我們利用google來回答這個問題吧:

約有91,700,000項符合學校的查詢結果
約有88,200,000項符合學生的查詢結果
約有48,900,000項符合學廣州網站設計生 學校的查詢結果

Corr{學校,學生}=48,900,000/(91,700,000+88,200,000-48,900,000)=0.37

這個原理我以前應用在了計算【網頁信噪比】上,和網頁信噪比一起成為衡量一個網頁的關鍵詞的核心算法。
這也就是為什么6e的網頁信噪比能夠不依靠網頁上現有的關鍵詞而準確的判斷網頁的分類和相關度,是因為除了TF和IDF之外,我們能夠從已有的文本集合里學到更多的“知識”。

那么百度和google的相關度應該不難計算了:

利用 google計算得到:2,950,000/(61,800,000+6,370,000-2,950,000)=0.03

利用 baidu計算得到:2,760,000/(21,700,000+12,200,000-2,760,000)=0.08

看來基本上相關度小于10%。

版權聲明:以上文章信息來源于網絡,等僅代表原作者本人的觀點。除了已經標注原創的文章外,其它文章版權和文責屬于原作者。文章中出現的商標、專利和其他版權所有的信息,其版權屬于其合法持有人。對可以提供充分證據的侵權信息, 我們將在確認后的1小時內刪除。


本網站之聲明以及其修改權、更新權和最終解釋權均屬廣州古柏廣告策劃有限公司所有。

(注:古柏廣告-版權所有-轉載請注明出處。)

關鍵詞: 返回上層
品牌全案策劃、設計、執行一站式服務,
助力企業品牌成長!

掃一掃關注古柏

GOOBAI AD.

Brand Whole Case Design


4000-882-993

www.wnsjj.cn

微信加好友咨詢


廣州古柏廣告策劃有限公司

地址:廣州市天河區東圃長盛商務大廈B213-215

Copyright?2004-2025 GOOBAI Inc.All rights reserved

粵公網安備: 44010602001481號

備案號:粵ICP備09222445號

GOOBAIAD

服務熱線:136-3149-2728

業務總監:136-3149-2728(Mr.羅)

Q Q/微信:212210324

與古柏對話

關注古柏


主站蜘蛛池模板: 亚洲国产精品成人久久蜜臀 | 久久亚洲色www成人图片 | 国产精品特黄aaaa片在线观看 | 极品大长腿啪啪高潮露脸 | 亚洲精品国产一二三无码av | 久草播放 | 亚洲啪 | 精品欧洲av无码一区二区男男 | 日韩天堂视频 | 欧美牲交a欧美牲交aⅴ免费下载 | 中国少妇内射xxxxⅹhd | 中文精品在线 | 成人123区 | 在线网址你懂得 | 色一情一伦一子一伦一区 | 春色校园综合人妻av | 欧日韩不卡在线视频 | 久久中文字幕高清 | 可以免费看的av毛片 | 久久伊人热热精品中文字幕 | 玩弄少妇人妻 | 日韩aⅴ影视 | 亚洲人成网线在线播放va蜜芽 | 亚洲啪av永久无码精品放毛片 | 免费1级做爰片在线观看爱 日本精品三级 | caoporn国产一区二区 | 一级特黄aa大片欧美 | 麻豆久久久9性大片 | 国产一级做a爱片在线看免 久久综合亚洲色hezyo国产 | 欧美成a人片在线观看久 | 国产精品国产三级国产密月 | 四虎国产精品永久在线国在线 | porn亚洲 | 波多野结衣电车痴汉 | 一区二区三区美女视频 | 精品一区二区三区免费观看 | 人综合久合合 | 免费国产午夜视频在线 | 国产精品久久久久久久久久小说 | 无码人妻一区二区三区一 | 亚洲丁香婷婷 | av在线手机观看 | 亚洲人成网站18禁止一区 | 色偷偷女人的天堂亚洲网 | 日韩人妻精品无码一区二区三区 | 伊人久久99 | 深夜福利在线免费观看 | av无码a在线观看 | 香蕉久久av一区二区三区app | 男女爱爱好爽视频免费看 | 日韩一级理论片 | 亚洲成av人片在线观看无码 | 亚洲宗人网| 最新中文av | 国产成人亚洲综合色就色 | 亚洲精品无码久久久久yw | 高潮的毛片激情久久精品 | 456成人网| 咪咪av | 伊人免费视频二 | 亚洲中文字幕久久精品无码va | 小12萝裸体自慰出白浆 | 嫩草影院国产精品 | 亚洲一二三四五 | 尹人香蕉久久99天天拍久女久 | 一二三四视频社区在线 | www.白浆| 国产激情欧美 | 天天躁日日躁狠狠躁伊人 | 成人欧美一区二区三区视频 | 中文字幕无码精品亚洲资源网 | 午夜精品成人一区二区 | 韩国一区二区av | 国产在线高清理伦片a | 亚洲午夜精品久久久久久人妖 | 老头边吃奶边弄进去呻吟 | 叶子楣三级大全 | 99久久国产成人免费网站 | 国产乱子乱人伦电影在线观看 | 性xxxxx泰国娇小 | 日韩在线视频观看 | 你懂的国产视频 | 成人羞羞视频播放网站 | 亚洲中文字幕久爱亚洲伊人 | 欧美在线播放一区二区 | 日本亚洲色图 | 久久天天躁夜夜躁狠狠85 | 亚洲国产欧美另类 | 三级在线看中文字幕完整版 | 大肉大捧一进一出好爽视频 | 女教师裸体淫交视频 | 国产精品无码一区二区桃花视频 | 久久久久夜夜夜精品国产 | www.色天使 | 天天躁狠狠躁狠狠躁性色牛牛影视 | 欧美 日本 国产 在线a∨观看 | 久久精品国产再热青青青 | 国产在线视频一区 | 干一干操一操 |