當前位置:首頁 > 養殖介紹 >衡量流行的關鍵詞研究工具的質量

衡量流行的關鍵詞研究工具的質量

2020-07-18 16:11:39 白石升金度假山莊
海外推廣公司

衡量流行的關鍵詞研究工具的質量

撰稿人JR Oakes通過Google搜索結果中的數據來衡量流行的關鍵字研究工具的質量,并從Google Search Console執行頁面數據。

您是否想知道某些流行的關鍵字研究工具的結果如何與Google Search Console提供的信息疊加?本文著眼于比較谷歌搜索控制臺(GSC)搜索分析的數據與著名的關鍵字研究工具以及您可以從谷歌提取的內容。

作為獎勵,您可以 使用本文末尾的代碼獲取相關搜索,并且人們還可以從Google搜索結果中搜索數據結果。

本文并不是要進行科學分析,因為它只包含七個網站的數據??梢钥隙ǖ氖?,我們正在收集一些綜合數據:我們選擇了來自美國和英國的網站以及不同的垂直網站。

程序

1.開始通過定義各個行業的垂直網站

我們使用SimilarWeb的頂級類別  來定義分組并選擇以下類別:

  • 藝術和娛樂。
  • 汽車和車輛。
  • 商業和工業。
  • 家和花園。
  • 娛樂和業余愛好。
  • 購物。
  • 參考。

我們從我們的網站樣本中提取匿名數據,并能夠從優化專家(優化)Aaron Dicks和Daniel Dzhenev獲得未見數據  。由于這個初步的探索性分析涉及到定量和定性的組成部分,我們希望花時間了解過程和細微差別,而不是放大分析所需的讓步。我們確實認為這種分析可以為內部營銷組織提供一個粗略的方法,以便更明智地決定哪種工具可以更好地適應各自的垂直方向。

2.從各個利基網站獲取GSC數據

數據是通過編程和使用Jupyter筆記本從Google Search Console獲取的。

Jupyter筆記本是一款開放源代碼的Web應用程序,允許您創建和共享包含實時代碼,公式,可視化和敘述文本的文檔,以便每天從Search Analytics API中提取網站級別的數據,從而提供比當前可用的更大的粒度Google的網絡界面。

3.為每個網站收集單個內部頁面的排名關鍵字

由于主頁傾向于收集許多可能或可能不會與頁面的實際內容相關的關鍵字,因此我們選擇了一個已建立且正在執行的內部頁面,以便排名更可能與頁面內容相關。這也更加現實,因為用戶傾向于在特定內容觀點的背景下進行關鍵詞研究。

上面的圖片是與業務相關的各種查詢的主頁排名示例,但與頁面的內容和意圖沒有直接關系。

我們刪除了品牌字詞,并將Google Search Console查詢限制為首頁結果。

最后,我們為每個頁面選擇一個詞首。短語“首字詞”通常用于表示具有高搜索量的熱門關鍵詞。我們選擇搜索量相對較高的詞匯,但不是絕對最高的搜索量。在展示次數最多的查詢中,我們選擇了最能代表該網頁的查詢。

4.在各種關鍵詞工具中進行了關鍵詞研究,并查找了關鍵詞

然后,我們使用上一步中選擇的詞項來執行三個主要工具的關鍵詞研究:Ahrefs,Moz和SEMrush。

使用“搜索建議”或“相關搜索”選項,并且保留所有返回的查詢,而不管該工具是否指定了建議與首字之間的相關程度。

下面我們列出了每個工具的結果數量。此外,我們從Google搜索中為每個首字詞(各個國家/地區)提取了“人們還搜索”和“相關搜索”,并添加了結果數量以給出Google免費贈送的基準。

這個結果返回了超過5000個結果!它被截斷為1,001,這是最大可行的,并按降序排列。

我們編譯了每個工具返回的關鍵字的平均數量:

5.處理數據

然后,我們通過使用一些語言處理技術將單詞轉換為它們的根形式(例如,“運行”到“運行”),去除了諸如“a”,“the”和“和“擴大收縮,然后排序的話。

例如,這個過程會將“Raleigh中的優化代理機構”轉變為“代理機構Raleigh優化”。這通常會保留重要的單詞并將它們排列整齊,以便我們可以比較和刪除類似的查詢。

然后,我們通過將唯一字詞的數量除以工具返回的字詞總數創建一個百分比。這應該告訴我們這些工具有多少冗余。

不幸的是,它沒有考慮拼寫錯誤,這在關鍵詞研究工具中也可能存在問題,因為它們會在結果中添加額外的粗俗(不必要的,不想要的查詢)。多年前,有可能針對網站頁面上的術語拼寫錯誤。今天,即使拼寫錯誤,搜索引擎也能很好地理解您輸入的內容。

在下表中,SEMrush的搜索建議中唯一查詢的比例最高。

這很重要,因為如果1,000個關鍵字只有70%是唯一的,這意味著300個關鍵字對于您正在執行的任務基本上沒有唯一的值。

接下來,我們想看看各種工具如何發現用于查找這些執行頁面的查詢。我們采用了以前獨特的標準化查詢短語,并查看了工具在其結果中查詢的GSC查詢的百分比。

在下面的圖表中,請注意每個工具的平均GSC覆蓋率,Moz在這里較高,很可能是因為它為大多數頭條件返回了1,000個結果。所有工具的執行效果都比Google抓取的相關查詢要好(使用文章最后的代碼也可以做到這一點)。

進入矢量空間

在執行之前的分析之后,我們決定將標準化的查詢短語轉換為矢量空間,以便直觀地探索各種工具的變化。

分配給矢量空間使用稱為預先訓練的單詞向量的東西,使用稱為t分布式隨機鄰居嵌入(TSNE)的Python庫在維度(x和y坐標)中減少。如果您對此不熟悉,請不要擔心; 通常,單詞向量是將單詞轉換為數字,以便數字表示關鍵字的固有語義。

將單詞轉換為數字有助于我們處理,分析和繪制單詞。當語義值繪制在坐標平面上時,我們清楚地了解各個關鍵字之間的關系。分組在一起的點將在語義上更相關,而距離彼此較遠的點將更不相關。

購物

這是Moz返回1,000條結果的一個例子,但搜索量和搜索者關鍵詞的變化非常低。這可能是由Moz在語義上匹配特定單詞而不是試圖與短語的含義匹配得更多造成的。我們要求Moz的Russ Jones更好地理解Moz如何找到相關的短語:

“Moz使用許多不同的方法來查找相關術語。我們使用一種算法來查找具有相似頁面的關鍵詞,并使用另一種ML算法將該短語分解為構成詞并找出相關詞的組合,從而生成相關短語等。這些算法中的每一個都可以用于不同的目的,具體取決于在你是否想要非常接近或切向主題。您是否希望提高關鍵字的排名或找到足夠明確的關鍵字來撰寫關于該關鍵字的相關信息?Moz Explorer返回的結果是我們試圖達到這種平衡?!?/p>

Moz確實包含了一個很好的相關性度量,以及一個用于微調關鍵字匹配的過濾器。對于這種分析,我們只使用了默認設置:

在下面的圖片中,查詢圖顯示了每個關鍵字供應商將坐標平面轉換成的返回值。位置和分組可以讓您對關鍵字的相關性有所了解。

在這個例子中,Moz(橙色)產生了大量的各種關鍵字,而其他工具選擇的卻少得多(綠色的Ahrefs),但與最初的主題更相關:

汽車和車輛

這是一個有趣的。你可以看到Moz和Ahrefs對這個高額期限的報道很好。Moz通過匹配Google Search Console實際條款的34%獲勝。Moz的結果數量(幾乎默認)是Ahrefs的兩倍。

SEMrush在這里落后于35個針對具有廣泛有用品種的主題的查詢。

較大的灰點代表來自Google Search Console的更多“ 基本事實 ”查詢。其他顏色是使用的各種工具。沒有重疊顏色的灰色點是各種工具不匹配的查詢。

互聯網和電信

這個圖很有意思,因為SEMrush從其他結果中的50-200個范圍跳到近5000

5544444