濟南SEO【做百度排名優化哪家強!】-找南翔SEO一站式SEO服務,幫助企業網站快速排名,快速上首頁!
首頁

主頁 > 百度SEO排名優化 > 搜索引擎原創識別與站內權重繼承算法解析(2)

搜索引擎原創識別與站內權重繼承算法解析(2)

首頁 2018-09-07 16:33 百度SEO排名優化 89 ℃


你們說,為什么當站文章中有大量相同時,會快速引起搜索引擎懲罰呢?這里我說的不是摘抄與原創的問題,而是你 站內 自己和自己的文章重復。之所以搜索引擎反應這么......

你們說,為什么當站文章中有大量相同時,會快速引起搜索引擎懲罰呢?這里我說的不是摘抄與原創的問題,而是你站內自己和自己的文章重復。之所以搜索引擎反應這么快,同時懲罰嚴厲,根本原因就是在你的文章中,他提取不到內容1。

那么假定我判定的兩個頁面分別是i與j。

好的,這里我們注意到了幾個問題。

2.設定一個特定值α

那么,我通過分析內容1,得到內容1中權重最高的關鍵詞k,那么按照權重大小進行排序,前N個權重最高的關鍵詞的集合我命名為K,則K={k1,k2,……,kn},則每一個關鍵詞都會對應一個其在頁面中獲取到的權重特征值,我將k1對應的權重特征值設定為t1,則前N個權重關鍵詞對應的特征值集合則為T={t1,t2,……,tn},那么我們有了這個特征項,就能計算出其相對應的特征向量W={w1,w2,……,wn}。接著我將K拼成字符串Z,同時MD5(Z)則表示字符串Z的MD5散列值。

當0≤α≤1的時候,我判定頁面相似為重復。

好的,現在開始。

1.α被判定為重復時的取值范圍是否可變?

在此,我要鄭重聲明,這個系列文章中所有涉及到的思想、算法與程序,均非本人所寫,全部是我從一些公開的資料里搜集而得的。同時,相信大家也能理解,如果這些免費公開的東西都能做到如此程度,那么那些商業機密就更不用提了。

為此,我開始寫這個“如果是我”系列的文章。在這一系列文章里,我假設如果是我絞盡腦汁的來為網民提供較好的搜索服務,我會怎么做,我會怎么對待文章內容、如何對待外鏈、如何對待網站結構等等諸如此類的站點元素。當然,本人技術有限,我只能寫一點我稍微理解的東西。而百度以及其它的商業搜索引擎,他們有大量比我優秀的人才,相信他們的算法以及處理問題的方式會比我完善很多,而我之所以寫這些,無外乎拋磚引玉,希望大家看后,心里有一個大概。畢竟在SEO的道路上走過一段時間后,沒有誰能夠當誰的老師,一些觀點僅供參考。

好,經過這一系列處理,我已經獲得了內容1與內容2了,下面該進行原創識別的算法了。

我相信很多SEO從業者剛接觸這行時,就聽說過一件事,就是內容頁面導出鏈接要具有相關性。還有一件事,就是頁面下面要有相關閱讀,來吸引用戶縱深點擊。同時應該還聽人講過,內鏈要適中,不可太多等。

1.當MD5(Zi)=MD5(Zj)時,頁面i與頁面j完全相同,判斷為轉載。

好了,識別內容2很簡單,對于內容比重闕值低于某個特定值的信息塊,我全部判斷為鏈接模塊。我將內容1通過某些方式(具體方式本文后半部分講解),提取出主題B。我將鏈接模塊中的所有a標簽的錨文本分別進行分詞,如果所有的錨文本均與主題B相符,則將此鏈接模塊判定為內容2。設定鏈接闕值C,鏈接闕值為內容2中標簽出現次數除以所有鏈接模塊所出現的a標簽次數所得的比重,若大于C,則此網站可能為聚合網站,針對內容排名計算時會引用聚合站點特定的算法。

當前位置:主頁 > 百度SEO排名優化 > 搜索引擎原創識別與站內權重繼承算法解析(2)

搜索
網站分類
標簽列表
?

18138295927

黄大仙三肖中特期期准新闻