Robots.txt hakkında

Robots.txt dosyası oluşturma

Sonraki: Robots.txt dosyanızı robots.txt Test Aracı ile test etme

Wix veya Blogger gibi bir site barındırma hizmeti kullanıyorsanız robots.txt dosyası oluşturmanız veya düzenlemeniz gerekmeyebilir.

Başlarken

Robots.txt dosyası, sitenizin kök dizininde bulunur. Dolayısıyla www.example.com sitesinde robots.txt dosyası www.example.com/robots.txt adresinde bulunur. Robots.txt, Robot Hariç Tutma Standardı’na uygun bir düz metin dosyasıdır. Robots.txt dosyası, bir veya daha fazla kuraldan oluşur. Her kural belirli bir tarayıcının söz konusu web sitesindeki belirli bir dosya yoluna erişimini engeller (veya erişimine izin verir).

Aşağıda, iki kural içeren basit bir robots.txt dosyasının içeriği gösterilmektedir:

# 1. Kural
User-agent: Googlebot
Disallow: /nogooglebot/

# 2. Kural
User-agent: *
Allow: /

Site haritası: https://www.mustafamutlu.name.tr/sitemap.xml

Açıklama:

“Googlebot” tarayıcısı adlı kullanıcı aracısı, https://www.mustafamutlu.name.tr/nogooglebot/ klasörünü veya herhangi bir alt dizinini taramamalıdır.
Diğer tüm kullanıcı aracıları sitenin tamamına erişebilir. (Tam erişim sağlandığı varsayımından hareketle bu durum belirtilmese dahi sonuç aynı olacaktır.)
Sitenin Site haritası dosyası, https://www.mustafamutlu.name.tr/sitemap.xml adresinde bulunmaktadır.

İlerleyen bölümlerde daha ayrıntılı bir örnek sağlayacağız.

Temel robots.txt yönergeleri

Robots.txt dosyaları ile ilgili bazı temel yönergeleri burada bulabilirsiniz. Robots.txt söz diziminin inceliklerini anlamak için robots.txt dosyalarının tam söz dizimini okumanızı öneririz.

Biçim ve konum

Bir robots.txt dosyası oluşturmak için neredeyse tüm metin düzenleyicilerini kullanabilirsiniz. Metin düzenleyicisi, standart ASCII veya UTF-8 metin dosyalarını oluşturabilmelidir. Kelime işlemci kullanmayın (kelime işlemciler, dosyaları genellikle özel bir biçimde kaydeder ve tarayıcılar için sorunlara neden olabilecek süslü tırnak gibi beklenmedik karakterler ekleyebilir).

Sitenizde kullanılacak robots.txt dosyaları yazmak veya düzenlemek için robots.txt Test aracını kullanın. Bu araç, sitenizdeki söz dizimini ve davranışı test etmenize olanak tanır.

Biçim ve konum kuralları:

Dosya, robots.txt olarak adlandırılmalıdır.
Sitenizde yalnızca bir robots.txt dosyası olabilir.
Robots.txt dosyası, geçerli olduğu web sitesi ana makinesinin kök dizininde bulunmalıdır. Örneğin, https://www.mustafamutlu.name.tr/sitemaps.xml altındaki tüm URL’lerde taramayı kontrol etmek için robots.txt dosyası http://www.mustafamutlu.name.tr/robots.txt konumuna yerleştirilmelidir. Bir alt dizine (örneğin, https://mustafamutlu.name.tr/pages/robots.txt) yerleştirilemez. Web sitenizin kök dizinine nasıl erişeceğinizden emin değilseniz veya bunun için izin almanız gerekiyorsa web barındırma hizmeti sağlayıcınıza başvurun. Web sitenizin kök dizinine erişemiyorsanız, meta etiketler gibi alternatif bir engelleme yöntemini kullanın.
Robots.txt dosyası alt alan adları (ör. http://demo.mustafamutlu.name.tr/robots.txt) veya standart olmayan bağlantı noktaları (ör. https://www.mustafamutlu.name.tr:8181/robots.txt) için geçerli olabilir.
Yorumlar herhangi bir satırda olabilir

Söz dizimi

Robots.txt bir ASCII veya UTF-8 metin dosyası olmalıdır. Başka hiçbir karaktere izin verilmez.
Robots.txt dosyası, bir veya daha fazla kuraldan oluşur.
Her kural çok sayıda yönergeden (talimattan) oluşur ve her satırda bir yönerge bulunur.
Bir kuralda şu bilgiler verilir:
- Kuralın kimin için geçerli olacağı (kullanıcı aracısı)
- Söz konusu aracının erişebileceği dizinler veya dosyalar ve/veya
- Söz konusu aracının erişemeyeceği dizinler veya dosyalar.
Kurallar yukarıdan aşağıya doğru işlenir ve kullanıcı aracısı, yalnızca bir kural grubuyla eşleşebilir. Bu, belirli bir kullanıcı aracısıyla eşleşen ilk ve en ayrıntılı kural olur.
Varsayılan olarak bir kullanıcı aracısının Disallow: kuralıyla engellenmeyen bir sayfayı veya dizini tarayabileceği kabul edilir.
Kurallar büyük/küçük harfe duyarlıdır. Örneğin, Disallow: /file.asp kuralı https://www.mustafamutlu.name.tr/file.asp için geçerli olur ancak https://mustafamutlu.name.tr/FILE.aspiçin geçerli değildir.

Robots.txt dosyalarında aşağıdaki yönergeler kullanılır:

User-agent: [Gerekli, her kural için bir veya daha fazla] Kuralın geçerli olduğu arama motoru robotunun (web tarayıcı yazılımı) adı. Bu, herhangi bir kuralın ilk satırıdır. Çoğu kullanıcı aracısı, Web Robotları Veritabanı‘nda veya Google kullanıcı aracısı listesinde listelenmektedir. Bir yol öneki, sonek veya dizenin tamamı için * joker karakterini destekler. Aşağıdaki örnekte olduğu gibi kullanılacak bir yıldız işareti (*) çeşitli AdsBot tarayıcıları dışındaki tüm tarayıcılarla eşleşir. Eşleşmeyen AdsBot tarayıcıların adlarının açık bir şekilde belirtilmesi gerekir. (Google tarayıcı adları listesine bakın.) Örnekler:
```
# 1. Örnek: Yalnızca Googlebot'u engelleme
User-agent: Googlebot
Disallow: /

# 2. Örnek: Googlebot'u ve Adsbot'u engelleme
User-agent: Googlebot
User-agent: AdsBot-Google
Disallow: /
 
# 3. Örnek: AdsBot tarayıcıları dışındaki her şeyi engelleme
User-agent: * 
Disallow: /
```
Disallow: [Kural başına en az bir veya daha fazla Disallow veya Allow] Kullanıcı aracısı tarafından taranmaması gereken bir dizin veya sayfa; kök alanla göreli olarak belirtilir. Bu bir sayfaysa, tarayıcıda gösterildiği şekliyle tam sayfa adı olmalıdır; bir dizinse, / işaretiyle sona ermelidir. Yol önekleri, sonek veya dizenin tamamı için * joker karakterini destekler.
Allow: [Kural başına en az bir veya daha fazla Disallow veya Allow] Az önce bahsedilen kullanıcı aracısı tarafından taranması gereken bir dizin veya sayfa; kök alanla göreli olarak belirtilir. Bu parametre, izin verilmeyen bir dizindeki bir alt dizinin veya sayfanın taranmasına izin vermek üzere Disallow parametresini geçersiz kılmak için kullanılır. Bu bir sayfaysa, tarayıcıda gösterildiği şekliyle tam sayfa adı olmalıdır; bir dizinse, / işaretiyle sona ermelidir. Yol önekleri, sonek veya dizenin tamamı için * joker karakterini destekler.
Sitemap: [İsteğe bağlı, dosya başına sıfır veya daha fazla] Bu web sitesinin site haritasının konumu. Tam bir URL olmalıdır; Google, http/https/www.www olmayan alternatifleri varsaymaz veya kontrol etmez. Site Haritaları, Google’a tarayabileceği veya tarayamayacağı içeriğe karşılık hangi içeriği taraması gerektiğinibildirmek için iyi bir yoldur. Site haritaları hakkında daha fazla bilgi edinin. Örnek:
```
Site haritası: https://mustafamutlu.name.tr/sitemap.xml
Site haritası: http://mustafamutlu.name.tr/sitemap.xml
```

Bilinmeyen anahtar kelimeler yoksayılır.

Bir başka örnek dosya

Robots.txt dosyası, her biri kuralların hedefini belirten bir User-agent satırıyla başlayan bir veya daha fazla kural blokundan oluşur. Burada, iki kurallı bir dosya gösterilmektedir. Her kural, satır içi yorumlarla açıklanmıştır:

# Googlebot'u example.com/directory1/... ve mustafamutlu.name.tr/directory2/... dizinlerinde
# engelleyin ancak directory2/subdirectory1/... dizinine erişimine izin verin
# Sitedeki diğer tüm dizinlere varsayılan olarak izin verilir.
User-agent: googlebot
Disallow: /directory1/
Disallow: /directory2/
Allow: /directory2/subdirectory1/

# Sitenin tamamını anothercrawler adlı başka bir tarayıcının erişimine karşı engelleyin.
User-agent: anothercrawler
Disallow: /

Tam robots.txt söz dizimi

Tam robots.txt söz dizimini burada bulabilirsiniz. Robots.txt söz diziminin öğrenilmesi önem taşıyan bazı karmaşık parçaları olduğundan lütfen tüm dokümanları okuyun.

Yararlı robots.txt kuralları

Yaygın olarak uygulanan bazı yararlı robots.txt kuralları aşağıda listelenmiştir:

Kural	Örnek
Web sitesinin taranmasını tümüyle reddetme. Bazı durumlarda web sitesindeki URL’lerin, taranmamış olsalar bile yine de dizine eklenebileceklerini unutmayın. Not: Bu kural, bazı AdsBot tarayıcılarıyla eşleşmez. Bu tarayıcıların adlarının açıkça belirtilmesi gerekir.	User-agent: * Disallow: /
Dizin adından sonra düz eğik çizgi ekleyerek bir dizin ve içeriğin taranmasına izin vermeme. Gizli içeriğe erişimi engellemek için robots.txt dosyasını kullanmamanız gerektiğini unutmayın. Bunun yerine uygun kimlik doğrulama yöntemini kullanın. Robots.txt dosyasıyla taranmasına izin verilmeyen URL’ler, taranmadan dizine eklenebilir ve robots.txt dosyası başkaları tarafından görüntülenerek gizli içeriğinizin yerinin ortaya çıkmasına neden olabilir.	User-agent: * Disallow: /calendar/ Disallow: /junk/
Tek bir tarayıcının erişimine izin verme	User-agent: Googlebot-news Allow: / User-agent: * Disallow: /
Bir tarayıcı dışında tüm tarayıcıların erişimine izin verme	User-agent: Unnecessarybot Disallow: / User-agent: * Allow: /
Eğik çizgiden sonra sayfayı listeleyerek tek bir web sayfasının taranmasına izin vermeme.	Disallow: /özel_dosya.html
Google Görseller’den belirli bir resmi engelleme:	User-agent: Googlebot-Image Disallow: /resimler/kopekler.jpg
Google Görseller’den sitenizdeki tüm resimleri engelleme	User-agent: Googlebot-Image Disallow: /
Belirli türdeki dosyaların taranmasına izin vermeme (örneğin, `.gif`):	User-agent: Googlebot Disallow: /*.gif$
Sitenizin tamamının taranmasına izin vermeme; ancak bu sayfalarda AdSense reklamları gösterme; Mediapartners-Google dışındaki hiçbir web tarayıcısına izin verilmez. Bu uygulama sayfalarınızı arama sonuçlarından gizler, ancak Mediapartners-Google web tarayıcısı sitenizin ziyaretçilerine hangi reklamların görüntüleneceğine karar vermek üzere sayfaları analiz etmeye devam eder.	User-agent: * Disallow: / User-agent: Mediapartners-Google Allow: /
Belirli bir dize ile biten URL’leri eşleştirme; `$`kullanın. Örneğin, bu örnek kod `.xls` ile biten tüm URL’leri engeller:

27 Comments

Ahmet Koca , Aralık 27, 2020 at 1:08 am

Robots txt hakkında detaylı bilgiye ihtiyacım vardı. Websitem için en faydalı olanı buldum ve uyguladım. Değerli bilgiler için teşekkür ederim

Sema Çatmaz , Aralık 27, 2020 at 1:24 am

Çok faydalı bir yazı olmuş. Bayadır böyle bilgi veren yazı arıyordum sonunda buldum.

Yaman kaya , Aralık 27, 2020 at 1:31 am

Yararlı güzel bir web site beğendim

Ayşegül demir , Aralık 27, 2020 at 1:38 am

Bilgi dolu bir yazı çok hoşuma gitti devamını bekliyorum emek verissiniz sagolun

Mustafa MUTLU , Aralık 27, 2020 at 1:57 am

Faydalı olması dileğiyle bol trafikli günler dilerim

Abdurrahman Damar , Aralık 27, 2020 at 2:16 am

Bilgilerine İnsanları Bilgilendiriyorsun Allah Razı olsun Her şey için Teşekkürler Herkese tavsiyem bilgilenmek istiyorsan Bu Siteyi takip et

Emre Yılmaz , Aralık 27, 2020 at 2:37 am

Teşekkür ederim. Bu kıymetli güzel bilgileriniz. İçin işime yaradı mutlu ettiniz. Beni süpersiniz.

Güllü sarıoğlu , Aralık 27, 2020 at 2:47 am

robots.txt ile ilgili aradım faydalı herşeyi buldum çok teşekkürler

Metehan kürekci , Aralık 27, 2020 at 4:24 am

Allah Razı olsun Her şey için Teşekkürler Herkese tavsiyem bilgilenmek istiyorsan Bu Siteyi takip et

Selin yakar , Aralık 27, 2020 at 8:29 am

Yazı ile tüm sorularim cevaplandı aradığım makale gercekten mükemmel teşekkür ederim cok 🙏

Mehmet yılmaz , Aralık 27, 2020 at 9:00 am

Robotx metinlerle ilgili harika bir çözüm sunuyor teşekkürler anlatımınız harika olmus ve ayrıntılı

AHMET ulu , Aralık 27, 2020 at 10:07 am

SONUNDA BULDUM YA HER YERDE YALAN YANLIŞ BILGI VERİYORLAR BÜZE BUNCA BILGIYI TOPLADIGINIZ IÇIN ÇOK TEŞEKKÜR EDDRIZ

AHMET ulu , Aralık 27, 2020 at 10:09 am

Bu bilgiler işime çok yaradı dosya erişimi kök erişimi artık ikisinide çok iyi biliyorum çok sagolun

Didem Özkan , Aralık 27, 2020 at 10:17 am

Çok güzel faydalı bir yazı olmuş beğendim

Talat , Aralık 27, 2020 at 10:53 am

Bilgiler yeterince iyi. Yardımcı olduğunuz için teşekkürler. İşime yaradı.

Fidan tutuk , Aralık 27, 2020 at 11:27 am

Robota.txt dosyası ile ilgili Bilgi almak için görüştüm ihtiyaçlarımı karşılayacağını öğrendim faydalı bir uygulama öneriyorum

Ali kılıç , Aralık 27, 2020 at 11:27 am

Bir çok sitede aradim ama en faydali bilgiyi burda buldum çok guzel aciklama tesekkur ederim size

Azat kolcelik , Aralık 27, 2020 at 11:50 am

Harika Yazı olmuş ellerinize sağlık Bayağı da böyle bir yazı göremiyorum yani bunun devamını gelmesini rica ediyorum

battal arpa , Aralık 27, 2020 at 11:50 am

robots.txt ile bana gerekli olan herşeyi buldum,emek verenlere teşekkür ederim..

Furkan han , Aralık 27, 2020 at 12:32 pm

Supersiniz hocam cok iyi harima bir yontem kullaniyorsunuz bu bilgile isime cok yaradi ellerinize saglik

Ozan Türk , Aralık 27, 2020 at 12:49 pm

Faydalı yararlı bilgiler içeren güzel yazılar barınıyor. Bizim ender bulamadığımız güzelliklerden bir tanesi.

Yasin , Aralık 27, 2020 at 1:24 pm

Verdiğiniz değerli bilgilerden dolayı teşekkürler benim açımdan yararlı ve faydalı oldu …

Mehmet erdem , Aralık 27, 2020 at 1:38 pm

Yazilim bilgileri icerigi harika olmuş oldukça faydalı buldum yazınızı takip ediyorum sitenizi.

seda yldz , Aralık 27, 2020 at 3:01 pm

bilgiler için teşekkürler açıklayıcı bir anlatım olmuş gerekli bilgiyi sayenizde aldım

Merve Akdeniz , Aralık 27, 2020 at 4:00 pm

Bilgi dolu bir yazı çok hoşuma gitti devamını bekliyorum emek vermişsiniz sagolun

İnrhaim korkut , Aralık 27, 2020 at 4:07 pm

Güzel ve açıklayıcı bilgileriniz için teşekkür ederim. Çok memnun kaldım.

halil akkaya , Aralık 27, 2020 at 5:00 pm

gerçekten çok detaylı anlatmışsınız çok sağ olun kafamdaki soruların hepsini sayenizde eksiksiz öğrenmiş oldum bütün soru işaretlerim çözüldü

Robots.txt hakkında

Robots.txt hakkında

Robots.txt dosyası oluşturma

Başlarken

Temel robots.txt yönergeleri

Biçim ve konum

Söz dizimi

Bir başka örnek dosya

Tam robots.txt söz dizimi

Yararlı robots.txt kuralları

27 Comments

Talat için bir yanıt yazın Yanıtı iptal et