「生死格鬥6」追加新角色!「DOAXVV」的性感大姊「Tamaki」參戰!   ZOTAC GAMING GEFORCE RTX(TM) 30系列隆重登場   FF7 remake電視廣告先行公開!   「集合啦!動物森友會」 下次更新將在9月30日!讓我們來準備萬聖節吧!   瘦身版新型Xbox「Xbox Series S」正式發表!   瑪利歐35週年《超級瑪利歐創作家2》競賽模式Hack’n time attack即將開跑!還有機會獲得瑪利歐獎牌!   「動物之鬪」追加新角色「搖曳長貓」!   眼鏡史萊姆出現了!《勇者鬥惡龍X Online》與日本眼鏡品牌《Zoff》合作!推出史萊姆造型眼鏡! 

robots.txt 的白名單設定方式

Google / Bing 等搜尋引擎要爬網站,都會參考 robots.txt 有什麼規定。

那想要設定指允許一個網址,剩下的全部擋掉(白名單),這種規則若 robots.txt 有順序性的話,設定起來就會方便許多。

robots.txt 的白名單設定方式

Google 的 Developer 文件有寫 Robots.txt 的 Spec,詳見:Robots.txt Specifications | Google Developers

現在只是想要設定「允許一個網址,剩下的全部擋掉」,可以怎麼做呢?

一般正面表列的情況,就是 Allow 一個 和 Disallow 一卡車,想要簡單的作法,就是想要 Disallow ,再來 Allow 要開放的那一個即可,那這樣子做就需要知道 robots.txt 有沒有順序性。

雖然有 robots.txt 的 Spec,不過直接看範例應該會比較快,所以直接來參考 Google 的 Robots.txt,詳見:Google robots.txt

由 Google 的 robots.txt 可以參考到下述幾個:

  1. Disallow: /m?
  2. Disallow: /m/
  3. Allow: /m/finance

就是我們想要做的事情,所以順序就由上往下設定即可。

範例規則

rotots.txt 的規則實做

這樣子就可以囉~

相關網頁

相關文章