ROBOTS.TXT DOSYASI DÜZENLEME REHBERİ

Robots.txt Nedir, Ne İşe Yarar?

Robots.txt dosyası, web sitenizin kök dizininde yer alan ve arama motoru botlarına (örümceklerine) sitenizin hangi bölümlerine erişip erişemeyeceklerini bildiren bir metin dosyasıdır. Bu dosya, özellikle arama motoru optimizasyonu (SEO), sunucu kaynaklarını yönetme ve özel/veri içeren alanları gizleme gibi kritik amaçlar için kullanılır.

Örneğin:

  • /admin/ klasörü arama motorları tarafından taranmasın istenebilir.

  • /search gibi dinamik içerikler SEO'ya olumsuz etki yapabilir, bu nedenle engellenebilir.


T-Soft Sisteminde Robots.txt Dosyası

T-Soft altyapısında barındırılan e-ticaret sitelerinde robots.txt dosyası sistem tarafından otomatik olarak oluşturulur. Ancak isteğe bağlı olarak belirli düzenlemeler yapılabilir.

📁 Örnek bir T-Soft robots.txt bağlantısı:
🔗 https://www.siteadi.com/robots.txt


Robots.txt Dosyasında Kullanılan Temel Komutlar

1. User-agent

Botları hedef almak için kullanılır.

- User-agent: *

Yukarıdaki örnek, tüm botlara hitap eder.

2. Disallow

Belirtilen dizin veya sayfanın taranmasını engeller.

- Disallow: /admin/
- Disallow: /search
- Disallow: /basket

3. Allow

Disallow komutuna rağmen belirli sayfaların taranmasına izin vermek için kullanılır.

- Allow: /uploads/
- Allow: /urun/

4. Sitemap

Sitenizin XML sitemap dosyasını tanımlar. Arama motorlarının daha verimli tarama yapmasını sağlar.

- Sitemap: https://umit.1isim.com/sitemap.xml

Birden fazla sitemap varsa:

- Sitemap: https://umit.1isim.com/sitemap-products.xml
- Sitemap: https://umit.1isim.com/sitemap-categories.xml

T-Soft için Önerilen Robots.txt Yapısı

Aşağıda T-Soft sistemine uygun, SEO açısından önerilen bir robots.txt yapısı yer almaktadır:

User-agent: *
Disallow: /admin/
Disallow: /basket
Disallow: /search
Disallow: /user
Disallow: /compare
Disallow: /*orderby=
Disallow: /*?campaigncode=

Allow: /urun/
Allow: /uploads/

Sitemap: https://umit.1isim.com/sitemap.xml


Dikkat Edilmesi Gereken Noktalar

  • Robots.txt dosyası, noindex işlemi yapmaz. Yani içeriğin arama motoru dizinine girmesini engellemez, sadece taranmasını sınırlar. Gizlenmesini istiyorsanız ek olarak meta noindex veya X-Robots-Tag HTTP header kullanmalısınız.

  • Dinamik URL parametreleri (örneğin orderby, campaigncode, sort vb.) SEO’ya zarar verebileceğinden bunlar engellenmelidir.

  • "Disallow: /?" gibi düzenlemeler yaparken joker karakterlerin etkisine dikkat edilmelidir.


Robots.txt Test Etme

Google Search Console üzerinden sitenizin robots.txt dosyasını test edebilir, hatalı satırları görebilirsiniz:

🔗 https://www.google.com/webmasters/tools/robots-testing-tool


SEO Uyumlu Robots.txt İçin Öneriler

  • Statik sayfalar ve kategori sayfaları indekslenmeli (engellenmemeli).

  • Sepet, kullanıcı hesabı, arama sonuçları gibi sayfalar mutlaka engellenmeli.

  • Görsellerin barındırıldığı "/uploads/" dizini taramaya açık bırakılmalı.

  • Sitemap dosyasını mutlaka tanımlayın ve Google Search Console’a da gönderin.


Sonuç

T-Soft altyapısında kullanılan robots.txt dosyası, SEO açısından sitenizin görünürlüğü ve performansı için önemli bir bileşendir. Yukarıdaki önerileri uygulayarak arama motoru botlarının sitenizi daha sağlıklı bir şekilde taramasını sağlayabilir, gereksiz kaynak tüketiminden kaçınabilirsiniz.


Robots.txt Dosya İçeriği Düzenleme makalemizi incelemek için tıklayınız.