安徽互聯網基礎服務商
合肥市互聯網優秀企業單位
服務熱線:0551-68995337
Toggle navigation
合肥網絡推廣,合肥網站制作,合肥網絡公司,合肥網站推廣,合肥網站制作公司,合肥網站建設,合肥做網站,合肥網站優化,合肥seo優化,合肥網頁制作,合肥網頁設計,安徽網站建設
網站首頁
服務項目
客戶案例
小程序開發
抖音運營
網站制作
SEO優化
關于我們
聯系我們
適合自己的 ● 才是最好的
新聞動態,洞悉互聯網前沿資訊,探尋網站營銷規律
小程序開發
抖音運營
網站制作
SEO優化
網絡推廣
公司動態
商業資訊
關于我們
公眾號運營
干貨分享
站長新聞
科技資訊
解決方案
網站建設
網站優化
聯系我們
當前位置:
網站首頁
>>
干貨分享
SEO收錄異常診斷:負載均衡架構導致的SEO問題及解決方案
日期:2020-08-24 22:48:26 來源:合肥良馬網絡科技有限公司 官網:http://www.qxciw.com/ 閱讀:34次
最近,本人負責的其中一個站點收錄出現了異常,趁著周末有空講述一下整個診斷過程。核心問題有兩點,服務器架構和網站程序架構導致的;本篇僅分享服務器架構導致的收錄異常。
首先,介紹一下自己。本人就職于深圳某企業,長期混跡于乙方外包公司,眾所周知seo外包公司接的是絕大部分是小企業網站,這些網站做的關鍵詞往往也僅是改個TDK就完成排名的工作。
再加上,目前絕大部分中小站點的架構很簡單,開源CMS+單一云服務器(虛擬主機)+CDN(這還是有點運維能力公司)。鑒于以上經驗,導致本人完全沒有意識到服務器架構方面也能出現問題。
一、收錄異常的發現
從(圖1)可以和明顯的看出,在3月中下旬收錄是偏向正常的,問題出現在3.31日-4.25日之間出現了浮動,也就是說,這個區間一定是站點出現了問題導致收錄異常。
SEO收錄異常診斷:負載均衡架構導致的SEO問題及解決方案 SEO優化 SEO推廣 第1張
本人開始按常規方法排查,特別是服務器日志有些參數沒有排除注意,以至于導致了問題發現,具體如下:
1.1、站長平臺模擬爬蟲抓取,正常。
1.2、搜索引擎爬蟲抓取數量在提升,偏向正常。這里有異常,排查偽蜘蛛爬蟲在抓數據,真實百度爬蟲確實也在增長。
1.3、核心關鍵詞排名浮動,但偏向且上升趨勢靠前,目前核心大詞處于前5名,正常。
1.4、服務器日志分析,爬蟲對應的request_uri值(相對地址),暫屬正常,請看下文。
1.5、服務器日志是阿里云的日志,http請求,7.18日、7.19日、7.20日以及7.26日出現小面積服務器500訪問錯誤;但最多只出現有限的時間收錄異常,不至于大范圍不收錄。
在服務器訪問日志分析中,一般需要注意的項是:爬蟲抓取時間值,爬蟲頁面URL值,爬蟲在頁面抓取順序,時間內爬蟲抓取數量,另一說蜘蛛IP值有權重高低之分(本人不確定,故不參考)
頁面URL值:一般服務器日志是相對地址,本人診斷出現的問題在于忽略host值,真實抓取URL應該是,host+request_uri值組合。
頁面抓取順序:可檢驗網站架構的爬行情況,大概可以知道爬蟲在網站頁面中的爬行順序,可以輔助使用爬蟲軟件或者開發經典爬蟲(PY,PHP等)的爬行情況作為參考
時間內爬蟲抓取數量:檢驗網站頁面總量和時間段內抓取量的占比,判斷網站的受歡迎程度。
說到這里,交代一下站點的服務器架構:
用的是負載均衡,文件服務器+數據服務器+前端服務器,數據服務器全部數據是由API接口、GET方式前端和app使用,網站URL是相對地址。服務器之間自然用的也是內網通訊。
綜上,可能大家也看出有忽略的參數,是1.4中提到的日志host值,因為是相對地址,host+request_uri才是抓取的完整地址。一直忽略的Host值,原來是API的二級域名(圖2)
SEO收錄異常診斷:負載均衡架構導致的SEO問題及解決方案 SEO優化 SEO推廣 第2張
說到這里,大家可能已經基本上可以確定知道原因了。
就是百度根本沒有抓取到真實的頁面URL,實際上抓取的是API域名+request_uri,
即假設數據庫服務器API給前端渲染的數據路徑是api.name.com,走內網IP,
抓取到的頁面URL為:https://api.name.com/post/1.html
真實應該是外網IP的URL:https://www.name.com/post/1.html
既然核心問題已把握30%,下一步自然是數據證明,主要從幾個點。
1、翻開發日志記錄
2、4月前后的服務器日志整理對比
從1中發覺,4.13號負載均衡的數據服務器api取消代理,這樣造成的后果是前端直接抓取了host主機值為api域名下的數據在前端渲染,因為是直接使用內網IP沒經過代理,同時api二級域名為host主機值。
從2中發覺,4月前后日志的host主機值出現了改變,由www.name.com變成了api.name.com。
最終,問題就出現在host主機為api的站點,沒有使用代理,也就是說只要api站點通過代理變成www的二級站點渲染即可。如果沒有使用代理,百度GET返回的頁面是內網IP,抓取到的也就是https://api.name.com/post/1.html 這個URL。
解決方案:
1、負載均衡的數據服務器api接口使用代理
2、Head區增加標簽
3、前端渲染的HTML使用絕對路徑
4、開發個API接口推送數據
本文完。鑒于本人僅是SEO,運維能力有限,單機服務器配置下站可以,負載均衡只是略微聽過,如有運維方面錯誤之處請見諒。
作者:深圳傳說
本文標題:
SEO收錄異常診斷:負載均衡架構導致的SEO問題及解決方案
本文網址:
http://www.qxciw.com/news/1351.html
原創作者:
合肥良馬網絡科技有限公司
版權所有,轉載請注明出處,并以鏈接形式注明。
聲明:本頁內容由合肥良馬網絡科技有限公司通過網絡收集編輯和原創所得,所有資料僅供用戶參考;本站不擁有所有權,也不承認相關法律責任。如您認為本網頁中有涉嫌抄寫的內容,請及時與我們聯系進行舉報,并提供相關證據,工作人員會在5個工作日內聯系您,一經查實,本站將立刻刪除涉嫌侵權內容。如果您對
SEO優化
核心技術文章感興趣,請點擊查看
網絡推廣
和
網站制作
的相關文章,請關注良馬科技官網(www.qxciw.com)
上一篇:
憑什么你玩抖音不賺錢,他們卻賺的盆滿缽滿
下一篇:
視頻號作品達9千萬播放 你看到機會了嗎?
返回列表
熱門文章
證件電子信息核驗不合格,電子信息不通過,直接拒絕
搜索引擎百度到底怎么了?為什么都是廣告內容呢
公司客服部運營中心對整個公司業務的巨大作用
阿里騰訊之后,誰是中國的第三朵云?
合肥微信公眾號(訂閱號和服務號)代運營托管多少錢
全國互聯網安全管理服務平臺備案需要提供哪些資料
阿里云網站備案審核不通過駁回原因及處理辦法詳細介紹
備案負責人會收到工信部發出的短信通知,這個到底是誰號碼呢?
ICP備案成功后,您需要在網站底部添加備案號和跳轉至工信部的鏈接
小米有品有魚官網
關于建立萬站群哪些事兒可以了解一下
G3云推廣和258商務衛士/商友宣傳易哪個效果好?
深入挖掘同行,厲害的人是怎么做的?
域名驗證未通過,域名為www.qxciw.com(該域名不存在注冊商驗證庫中)
分析一下幾種常見的浪費用戶時間的一些網站形式
最新文章
自己的微信朋友圈如何充分利用起來
老板:一定要學會做離“錢”近的事
屌絲男相親趣事
視頻號作品達9千萬播放 你看到機會了嗎?
SEO收錄異常診斷:負載均衡架構導致的SEO問題及解決方案
揭秘新推廣渠道:利用騰訊文檔做QQ消息彈窗推廣
歷數馬化騰早年的賺錢經歷
創業5年,我穩賺不賠的秘密
憑什么你玩抖音不賺錢,他們卻賺的盆滿缽滿
百度上線API主動推送功能
你應該知道的15個職場真相
草根創業是不是真的不行了
能力大于人品
月薪3萬 1萬和3千的競價員 最大的區別在這里
寶塔面板出現嚴重漏洞
版權所有 ? 2014-2020 合肥良馬網絡科技有限公司 官網:http://www.qxciw.com/
百度地圖
網站地圖
站內地圖
RSS
樹狀地圖
圖片地圖
皖公網安備 34010402701667號
安徽省工信部ICP備案號:
皖ICP備14011786號
安徽公安廳安全聯網單位
34010402701667
安徽網絡警察
網上報警平臺
日本无码专区无码二区,成年美女黄网站色奶头大全,国产免费啪视频在线观看,一日本道不卡高清a无码