Hvilke tegn gjør en URL ugyldig?

Hvilke tegn gjør en URL ugyldig?

Er dette gyldige nettadresser?

  • eksempel.com/file[/].html
  • http://example.com/file[/].html

Generelt kan URI-er som definert i RFC 3986 (se Section 2: Characters) inneholde ett av følgende 84 tegn:

ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789-._~:/?#[]@!$&'()*+,;=

Merk at denne listen ikke angir hvor i URI-en disse tegnene kan forekomme.

Alle andre tegn må kodes med prosentkoding (%hh). Hver del av URI-en har ytterligere begrensninger for hvilke tegn som må representeres av et prosentkodet ord.

Kommentarer (25)

Alle gyldige tegn som kan brukes i en URI (en URL er en type URI) er definert i RFC 3986.

Alle andre tegn kan brukes i en URL forutsatt at de først er "URL Encoded". Dette innebærer å endre det ugyldige tegnet for bestemte "koder" (vanligvis i form av prosentsymbolet (%) etterfulgt av et heksadesimalt tall).

Denne lenken, HTML URL Encoding Reference, inneholder en liste over kodingene for ugyldige tegn.

Kommentarer (1)

Ikke egentlig et svar på spørsmålet ditt, men validering av url' er virkelig en seriøs p.i.t.a. Du er sannsynligvis bare bedre å validere domenenavnet og la spørringsdelen av nettadressen være. Det er min erfaring. Du kan også ty til å pinge nettadressen og se om det resulterer i et gyldig svar, men det kan være for mye for en så enkel oppgave.

Vanlige uttrykk for å oppdage url&# 39 er rikelig, google det :)

Kommentarer (2)