: 夢龍筆記; 上層分類: 網路經營; SEO 搜尋引擎優化

Meta Robots 跟 Robots.txt差別 WA101 4th Meetup 心得筆記

這是篇心得筆記，來源是Web Analytics 101社團的第四次實體聚會：Meta Robots 跟 Robots.txt差別 / 孟令強。

有哪些情形會不希望搜尋引擎爬取這些網頁？

未完成、施工中的網站。
不重要的頁面。
保護資料、不想被搜尋引擎檢索的網頁。

未完成、施工中的網站

有些網站公司在架設編輯的過程是在開放性的網路環境、或者網路主機上作業，這樣子好處是可以遠端共同協作，而且有網址也方便客戶檢視；但是通常會發生一個問題，網站被搜尋引擎先收錄了… 因為重複內容的問題，當網站移交給客戶之後，很長一段時間搜尋引擎的檢索結果都是錯誤的內容、或者是網站公司的臨時網址，影響到客戶網站的搜尋結果和流量；甚至搜尋出一些很詭異、有問題的頁面。

有經驗的公司會在編輯階段鎖住搜尋引擎索引網站，移交之後再開放，避免搜尋結果出現"施工中XXXX"。

不重要的頁面

對於搜尋結果不是很重要的頁面，或者一些集合性質的頁面，通常會鎖住避免搜尋引擎檢索，如About me關於我、或者公司簡介這種不是很重要的頁面如果沒有鎖住搜尋引擎爬取，會消耗搜尋引擎的爬率，每個網站能分配的檢索資源是有限的，當爬率消耗在這些不重要的頁面，就會影響重要、想要有SEO成績的網頁被索引的量，以及出現的時間點。而集合性質的網頁如站內搜尋的結果頁、或者Tag標籤的頁面，是集合站內類似性質的網頁而成，有可能會製造站內重複內容的問題，所以也需要阻擋搜尋引擎索引。

保護性質，不想被索引的頁面

也許有些頁面資訊雖然開放在網站上，但是不想讓人在SERP (搜尋引擎結果頁)，上就直接看到內容，希望使用者一定要進站看資訊；或者是一些比賽的成績、施政報告等不得不公開、卻又不想讓人看到的資料，同樣也不想輕易讓人搜尋引擎找到、翻閱。而之前也發生過某個雲端PDF轉檔工具網站被Google爬進去，一堆公司的報價單、合約書、契約書等都被搜尋引擎蜘蛛索引，強制曝光在網路上。

過去阻止搜尋引擎爬取網頁的方式：robots.txt限制、封鎖蜘蛛的行動

以往要阻擋搜尋引擎爬取網站，多半會在robots.txt裡面下Disallow來告訴搜尋引擎禁止索引哪些內容，但現在Google有公告說robots.txt不能作為隱藏網頁，不讓頁面出現在Google SERP的方式，因為即使robots.txt有設定，但是頁面如果有外部連結，無法阻止googlebot順著外部網頁的連結爬... 爬過來…，所以robots.txt沒用，還是會被Google爬取、索引進伺服器之中。

網站因為robots.txt而無法提供索引 — 據說這個就是設了robots.txt禁止搜尋引擎的結果

現在有哪些方法可以阻擋搜尋引擎的索引？

Google說明如果要防止Googlebot存取網站的網址，需要使用"noindex"封鎖搜尋索引服務，或者將這個網址從伺服器目錄直接加密封鎖；其他的方法還有CMS系統直接設定，將網站離線，以及孟令強提供從GSC的移除網址暫時將網址從搜尋結果之中移除。

使用「noindex」封鎖搜尋索引服務

Google說明，如果要避免特定網頁出現在 Google 搜尋結果中，必須在該網頁的 HTML 程式碼中加入 noindex 中繼標記，或是在 HTTP 要求中傳回「noindex」標頭。這樣一來，當 Googlebot 下次檢索該網頁時，就會發現「noindex」標記或標頭，進而將其完全排除在 Google 搜尋結果之外，不論是否有其他網站連結到該網頁皆是如此。

重要事項：該網頁不能遭到 robots.txt 檔案封鎖，否則 noindex 中繼標記就無法生效。如果網頁遭到 robots.txt 檔案封鎖，檢索器便無從發現 noindex 標記；舉例來說，如果有其他網頁連結到該網頁，該網頁將繼續顯示在搜尋結果中。

透過受密碼保護的伺服器目錄來封鎖網址

如果從伺服器直接封鎖、將網頁目錄加密鎖定(如Apache的.htaccess)，任何搜尋引擎包括Google都不可能索引得了這個網頁，別說搜尋引擎拉，連到就要先敲密碼才能進入，看都不能看了。只有知道這個目錄密碼的人才能瀏覽這個頁面。

使用GSC的移除網址功能

孟令強老師說可以使用GSC(Google Search Console 網站管理員)的移除網址功能，可以暫時禁止Googlebot爬取這個網址，最長有效時間為90天，相信這個時間對一般網站架設公司來說應該很夠用了。

Google Search Console GSC的網址移除設定 — GSC 網址移除設定畫面

使用CMS系統設定暫時關閉網站

如果使用CMS系統架設網站，部份系統就有提供暫時關閉網站的功能，如Joomla!就可以在後台設定將網站離線，前台就必需要輸入具備相對映等級權限的帳號以及密碼才能登入網站前台、瀏覽網站。

Joomla!設定網站離線，前台就無法直接瀏覽 — Joomla!系統後台設定網站離線，前台就必需要登入帳號密碼才能瀏覽網站

如果我的網站都不建立外部連結、也不提交XML Sitemap給GSC，可以避免網頁被Google索引嗎？

也許有人會想，如果我不在GSC提交XML Sitemap給Google，Google搜尋引擎就不會知道有這個網站的存在，而我也不建立外部連結，沒有其它網頁將連結指向這個網站，沒有連結，Googlebot沒有管道爬過來，這樣子應該就不會被搜尋引擎知道、索引了吧？

依據孟令強老師演講的內容所說，國外有人做過實驗，大約在第23天左右Google搜尋引擎仍然爬到了這個網站…

番外：香港公司販售的佈景主題(Theme、Template)很多預設會封鎖中國的搜尋引擎

另外孟令強老師特別提醒，如果網站對口中國，想被中國的搜尋引擎如百度、搜狐等收錄、想做中國區的SEO，要特別注意香港的Theme佈景主題。依處理經驗發現來自香港的佈景主題會特別封鎖中國的搜尋引擎，禁止這些搜尋引擎爬取網站，所以如果使用香港的佈景主題，又需要經營中國區的SEO，要特別檢查佈景主題檔案，移除這些禁止索引的設定。

Web Analytics 101社團封面 — Web Analytics 101社團

謝謝各位講者的分享，謝謝Web Analytics 101社團提供這麼好的分享聚會，我絕對不會承認我是哪一隻的；後面會陸續將我聽得懂得筆記分享出來。

Share

0

comments

建立: 27 十月 2017

29 十一月 2017

點擊數: 22972

參考資料：Google Search Console說明防止他人存取您的網站內容

網路經營

6個方法加快網頁下載速度，提昇UX體驗和SEO排序
你可能在想，網站速度有什麼大驚小怪？平均網頁加載速度有什麼重要？ 據Aberdeen Group介紹，頁面加載時間延遲1秒，結果如下：頁面瀏覽量減少11％客戶滿意度下降16％...
讓數字說話，但是數字不會說話
數據，是現在網路經營非常重要得特色；如果只是閱讀數據報告裡的數字，是沒有任何意義的。數字不會說話，數據也不會說話。

Mobile 行動世代

Google提供：行動網站10大優化秘訣
智慧型手機已經是現在人離不開得工具，行動網站的瀏覽量也已經遠高於桌機版網站，如何做好行動版網站，優化使用者體驗，才能獲得更多的使用者，網站也才能夠有更好效益。...

IA 資訊架構

設計中古車、二手車的網站，做好SEO可以節省大筆網路行銷預算
中古車、二手車以往都只有地方性的店家銷售，近幾年來出現了全國連鎖的大型商家，隨著行動世代到來，人們也開始在網路上交換中古車買賣的心得、經驗、以及注意事項。二手車市的經營有哪些模式？中古車行如果要建立網站，需要提供哪些訊息？面對不同且複雜的資訊，網站架構該如何調配？面對競爭激烈的市場，如果能網站能擁有好的SEO，是不是可以省下不少廣告成本？長文，慎入
職業訓練網站的IA資訊架構規劃與SEO搜尋引擎優化
...

EC電子商務

這 6 招商品拍攝方法，讓你產品銷售一空，狂追補貨！
...

Users Centered 使用者中心

從噴漆到噴漆槍，看不到的競爭者與使用者中心思考
前一陣子，我想要重新整理一個鐵櫃，想用噴漆的方式幫鐵櫃重新上漆，我是如何從買噴漆(x龍、鐵x士)，變成買了一把電動噴漆槍？中間碰到了哪些問題？有哪些思考的轉折？
從最近的墾丁、台灣旅遊事件，談UX與價值
墾丁很貴？墾丁很遠？其實價格、距離都只是表面的藉口，最重要的是，沒有被人認同的價值。價值是什麼？價值又與使用者經驗UX有什麼關聯？

最高人氣

隨機文章

https://farm5.staticflickr.com/4296/36310453915_023f4e79cb_b.jpg

UX是什麼？用幾個小故事說明UX是什麼。

https://lh3.googleusercontent.com/pVQEMj_yIUOo8UfDzKw1sRaKqTgKPV1umiQuYjZAt8eWG35YBTkIVVJelSqyWU9fJaKvswVwgpR1N87DpTJNLw=s0

Google 數位學程

https://mail.kingman.idv.tw/images/article/write-of-think/heart-lock-2057742-1024.jpg

心鎖

https://c1.staticflickr.com/5/4255/34368487934_1dc8aee5d9_o.jpg

沈榮欽專欄：為什麼台灣企業賺這麼少錢

https://farm5.staticflickr.com/4689/27526911899_bd156e87f6_b.jpg

2017年 SEO 元素週期表-中文版 The Periodic Table Of SEO Success Factors

夢龍筆記

SEO搜尋引擎優化

IA資訊架構

Joomla!筆記簿

學習筆記

夢龍筆記為個人Blog，網站內索引用、摘錄、轉貼之文章、圖片等智慧財產權相關所有權利皆屬於原作者所有，如有侵犯權利請聯絡夢龍筆記刪除。

“夢龍筆記 is not affiliated with or endorsed by the Joomla!® Project or Open Source Matters. The Joomla!® name and logo is used under a limited license granted by Open Source Matters, the trademark holder in the United States and other countries.”

我有一些網站頁面不想顯示在搜尋的結果頁面，要如何防止被搜尋引擎索引？ -- WA105心得筆記