Hangi karakterler bir URL'yi geçersiz kılar?

Hangi karakterler bir URL'yi geçersiz kılar?

Bunlar geçerli URL'ler mi?

  • example.com/file[/].html
  • http://example.com/file[/].html

Genel olarak RFC 3986 tarafından tanımlanan URI'ler (bkz. Bölüm 2: Karakterler) aşağıdaki 84 karakterden herhangi birini içerebilir:

ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789-._~:/?#[]@!$&'()*+,;=

Bu listenin, bu karakterlerin URI'nin neresinde yer alabileceğini belirtmediğini unutmayın.

Diğer karakterlerin yüzde kodlamasıyla (%hh) kodlanması gerekir. URI'nin her bir parçası, hangi karakterlerin yüzde kodlu bir kelime ile temsil edilmesi gerektiği konusunda daha fazla kısıtlamaya sahiptir.

Yorumlar (25)

Bir URI'de kullanılabilecek tüm geçerli karakterler (bir URL bir URI türüdür) RFC 3986'de tanımlanmıştır.

Diğer tüm karakterler, önce "URL Encoded" olmaları koşuluyla bir URL'de kullanılabilir. Bu, belirli "kodlar" için geçersiz karakterin değiştirilmesini içerir (genellikle yüzde sembolü (%) ve ardından onaltılık bir sayı şeklinde).

Bu bağlantı, HTML URL Kodlama Referansı, geçersiz karakterler için kodlamaların bir listesini içerir.

Yorumlar (1)

Sorunuza gerçekten bir cevap değil, ancak url'leri doğrulamak gerçekten ciddi bir p.i.t.a Muhtemelen sadece alan adını doğrulamanız ve url'nin sorgu kısmını bırakmanız daha iyi olacaktır. Bu benim deneyimim. Ayrıca url'ye ping atıp geçerli bir yanıt verip vermediğine bakabilirsiniz, ancak bu kadar basit bir görev için bu çok fazla olabilir.

URL'leri tespit etmek için düzenli ifadeler bol miktarda bulunur, google'da arayın :)

Yorumlar (2)