關(guān)鍵字是SEO的核心概念之一,在SEO實踐中,很多工作以關(guān)鍵字為中心展開。牙齒文檔將搜索技術(shù)原理與網(wǎng)站最優(yōu)化實踐相結(jié)合,試圖總結(jié)SEO中內(nèi)容頁面關(guān)鍵字布局的具體著陸點方法。
一、搜索引擎技術(shù)原理
搜索引擎最重要的基本技術(shù)基礎(chǔ)是將用戶搜索詞分為自然語言中有意義的短語,然后在索引庫中查找包含所有或部分這些短語的內(nèi)容,并返回結(jié)果。
正常人的搜索想法是帶關(guān)鍵字,看看內(nèi)容是否包含關(guān)鍵字。假設(shè)在序列號1-10的10個網(wǎng)頁上,找到包含“關(guān)鍵字布局”牙齒的網(wǎng)頁,搜索10個網(wǎng)頁中的全文搜索是否包含“關(guān)鍵字布局”一詞,然后返回包含該詞的網(wǎng)頁的序列號。但是在100萬個,1000萬個網(wǎng)頁上瀏覽,速度慢了,發(fā)明了逆行索引的概念。(約翰f肯尼迪,Northern Exposure(美國電視電視劇),web)(下圖中的數(shù)據(jù)并非全部是實際數(shù)據(jù),僅用于顯示。)
如上圖所示,這是最簡單的反向索引模型之一(DocID是分配給搜索引擎捕獲的網(wǎng)頁的唯一編號)。每當搜索引擎爬行動物抓住網(wǎng)頁,就把網(wǎng)頁分成多個詞組,使牙齒單詞與顛倒的索引表匹配。也就是說,如果反向索引表的“關(guān)鍵字”列中列出了牙齒單詞,則將當前網(wǎng)頁的編號DocID添加到相應的反向索引表中。否則(對于新單詞識別,此處不展開),添加行,為牙齒關(guān)鍵字分配ID,然后記錄當前網(wǎng)頁的編號。這樣,查詢“關(guān)鍵字1”時,很快就會知道相關(guān)主頁有(1,2,3,5)。更復雜的搜索詞假說分為“關(guān)鍵字1”、“關(guān)鍵字3”、“關(guān)鍵字6”三個單詞,可以快速查詢相關(guān)主頁(1,2,3,5,6,7,9)。
這不足以對搜索結(jié)果進行排序。如果不是作弊,一頁上出現(xiàn)的某個關(guān)鍵字越多,該關(guān)鍵字就可能表示牙齒頁的特征。但是,停用語幾乎每一頁都有很多單詞,但不能表達任何具體的意思。例如,“的”、“是”、“是”等)。如果您可以在反向索引表中添加關(guān)鍵字在網(wǎng)頁上出現(xiàn)的頻率信息(即單詞頻率- TF),則可以對網(wǎng)頁進行排序。如下圖所示,如果祖懷單詞以“關(guān)鍵字1”、“關(guān)鍵字2”分詞,則可以按(3,5,1,2)對相關(guān)網(wǎng)頁進行排序。
假設(shè)現(xiàn)在有兩個web 1、web 2。反向索引中的信息如下圖所示。
我們搜索“關(guān)鍵字布局方法”。搜索詞用“關(guān)鍵字”、“方法”、“布局”噴射。在牙齒過程中,網(wǎng)頁1中出現(xiàn)“關(guān)鍵字”、“方法”、“布局”牙齒分別出現(xiàn)2次、2次、2次,共6次。網(wǎng)頁2中共出現(xiàn)了7次“方法”、“布局”牙齒,根據(jù)前面的邏輯,最終搜索結(jié)果按(2,1)排列,似乎不是理想的排序結(jié)果。網(wǎng)頁2的主題顯然是“圍棋的布局方法”。要解決牙齒問題,必須引入逆文檔頻率金志洙(IDF)。
web集合中包含關(guān)鍵字的web頁面越少,這些關(guān)鍵字的網(wǎng)頁分隔能力越強,因此IDF越大,權(quán)重越高。假設(shè)上圖中的“關(guān)鍵字”、“方法”、“布局”和“圍棋”的IDF分別為2.5、0.3、0.8和3,則通過將每個單詞的TF乘以IDF,然后計算總和,網(wǎng)頁1,2的相關(guān)性分別為7.2
關(guān)鍵詞的位置信息也是重點。一般認為,標題中出現(xiàn)關(guān)鍵字比正文部分出現(xiàn)相同的關(guān)鍵字,可以更好地表達一個網(wǎng)頁的專題特征。h標簽的重要性就在于此。搜索引擎還可以根據(jù)代碼布局和噪音比例(例如禁用單詞發(fā)生頻率)查看導航在哪里,正文在哪里,邊欄在哪里等。牙齒位置信息顯示在反向索引列表中,參與排序決策。
此外,兩個單詞索引/短語索引、“關(guān)鍵字布局方法”牙齒不一定分為三個短單詞,可以分為“關(guān)鍵字布局”、“單詞方法”、“布局方法”等。相關(guān)單詞合并搜索,“關(guān)鍵字”中的相關(guān)單詞“關(guān)鍵字”,“方法”中的相關(guān)單詞“方法”等。
當然,實際中現(xiàn)代大型搜索引擎的反向索引模型可能要復雜得多,參與了許多其他因素(一個茄子重點是超連結(jié)分析)牙齒排序算法,篇幅和作者水平有限,不再展開。(阿爾伯特愛因斯坦,美國電視電視劇)
二、關(guān)鍵字布局方法
1.標題必須有關(guān)鍵詞,但不一定是完整的疑問句
搜索引擎將搜索詞分成N個以上的單詞、雙詞、短語,查詢時添加相關(guān)單詞合并查詢,因此標題中的關(guān)鍵字不一定是完整的疑問句。一個茄子的典型是“最好創(chuàng)建XXXX哪個公司”。威廉莎士比亞,“美國電視電視劇”,“搜索詞”,“搜索詞”)標題不一定要有牙齒完整的詞語。即使標題包含牙齒完整的短語,也不能與其他完整的短語相匹配。優(yōu)質(zhì)的網(wǎng)頁往往能與數(shù)百個長尾關(guān)鍵字相匹配。一個題目不能全部包括。標題的另一大作用是吸引點擊,點擊數(shù)也是影響排名的因素,但其中“XXXX”、“好”、“公司”這個關(guān)鍵詞必須出現(xiàn)。
2.正文自然均勻地分布,截斷了一些核心詞和分詞
在搜索引擎開發(fā)的早期,許多技術(shù)人員利用TF*IDF算法的高度漏洞大量堆積關(guān)鍵字,從而獲得了快速搜索排名。此后,搜索引擎在算法層面修復漏洞,打擊舞弊行為,顯示出網(wǎng)絡上流行的“理想關(guān)鍵字密度3%~8%”的觀點。首先,牙齒密度不是計算整個搜索詞,而是計算分割后的所有單詞,實際上,有些關(guān)鍵詞密度比3%略低,關(guān)鍵字密度比8%以上的網(wǎng)頁也能得到好的排名。(大衛(wèi)亞設(shè),美國電視電視劇)
如果你是搜索引擎的工程師怎么辦?我將整個網(wǎng)絡的歷史訪問數(shù)據(jù)(例如百度統(tǒng)計、手機百度等都可以獲得比較全面的訪問數(shù)據(jù))和關(guān)鍵字密度信息相結(jié)合,以確定合理的范圍和邊界范圍,對超出邊界范圍的沉默進行處理,將邊界范圍內(nèi)該站點的歷史數(shù)據(jù)和對第一階段的小流量排名的訪問數(shù)據(jù)反饋相結(jié)合,以確定是抑制還是保持,還是給予更高的排名。
比起關(guān)鍵詞密度,更要集中于語言的流暢度(關(guān)鍵詞看起來無聊尷尬)和內(nèi)容的質(zhì)量深度。最終,搜索引擎的排序因素多達數(shù)百個,也無法平衡徐璐。
3.正文下面的相關(guān)內(nèi)容和邊欄推薦了相應的布局關(guān)鍵字
搜索引擎通過代碼和噪音的比例判斷不是正文部分,可以降低此處關(guān)鍵字的權(quán)重,但從百度快照緩存的角度來看,具有一定的效果。(大衛(wèi)亞設(shè),美國電視電視劇)
本文下面和側(cè)欄的相關(guān)內(nèi)容和推薦內(nèi)容大部分是從橫向和縱向兩個茄子角度選擇內(nèi)容。例如,牙齒文件的主題是關(guān)于“關(guān)鍵字布局”,是橫向推送“網(wǎng)站結(jié)構(gòu)布局”、“關(guān)鍵字挖掘技術(shù)”等區(qū)域內(nèi)最優(yōu)化方面的內(nèi)容,很多訪客很可能會感興趣??v向推一些“如何制作高質(zhì)量的外部鏈條”、“如何提高著陸頁面的轉(zhuǎn)化率”等,也是訪客可以暫時抑制的無形需求。添加關(guān)鍵字布局的同時,可以提高PV、減少跳躍、提高用戶體驗。
作者:構(gòu)建反向教練網(wǎng)絡
來源:lusong博客,歡迎訪問在線投稿