Robots.txt etiketine sahip kayıtlar gösteriliyor. Tüm kayıtları göster
Robots.txt etiketine sahip kayıtlar gösteriliyor. Tüm kayıtları göster

1 Temmuz 2023 Cumartesi

Robots.txt Nedir?


robots.txt, bir web sitesinin arama motorlarına ve diğer otomatik tarama araçlarına neyin taranmasına izin verileceğini veya engelleneceğini belirten bir metin dosyasıdır. Bu dosya, web sitelerinin sahiplerinin, web sitelerinin tarama davranışını kontrol etmelerine ve arama motorlarına hangi sayfaların ve içeriklerin taranması gerektiğini söylemelerine olanak tanır.

Web sitesinin kök dizininde (genellikle "www.example.com/robots.txt" olarak adlandırılır) bulunan robots.txt dosyası, arama motoru botlarına, belirli kısımların veya tüm web sitesinin taranıp taranmayacağını belirtir. Dosya, web sitesinin sunucu tarafından yayınlanır ve arama motorları gibi tarama araçları tarafından erişilir. Web sitesi sahipleri, bu dosyayı düzenleyerek arama motorlarının sayfalarını, dizinlerini veya belirli içerikleri tarayıp tarayamayacaklarını belirleyebilirler.

robots.txt dosyası, basit bir metin dosyasıdır ve belirli bir sözdizimine sahiptir. Bu dosyada, "User-agent" ifadesiyle belirli bir tarayıcıya veya bot türüne yönelik kısıtlamalar belirtilebilir ve "Disallow" ifadesiyle taranmasına izin verilmeyen URL'ler belirtilebilir. Örneğin:

makefile
User-agent: * Disallow: /gizli/ Disallow: /veritabani.html

Yukarıdaki örnekte, "*" sembolü, tüm tarayıcılara veya botlara bu kısıtlamaların uygulanacağını belirtir. "/gizli/" dizini ve "veritabani.html" dosyası, taranması yasaklanmış URL'lerdir. Arama motorları, bu dosyayı okuyarak bu kısıtlamalara uygun şekilde web sitesini tararlar.

robots.txt dosyası, web sitelerinin gizli veya hassas bilgilerini engellemek için değil, yalnızca arama motorlarının tarama davranışını kontrol etmek için kullanılır. Bu nedenle, hassas verilerin güvenliği için başka yöntemlerin kullanılması önemlidir.