查询字符串参数的Java URL编码

假设我有一个URL

http://example.com/query?q=

而我有一个由用户输入的查询,例如。

随机词 £500银行$

我希望结果是一个正确编码的URL。

http://example.com/query?q=random%20word%20%A3500%20bank%20%24

实现这一目标的最好方法是什么?我试过URLEncoder和创建URI/URL对象,但结果都不太理想。

对该问题的评论 (4)
解决办法

URLEncoder应该是个好办法。你只需要记住只对*个别的查询字符串参数名称和/或值进行编码,而不是整个URL,当然也不能对查询字符串参数分隔符&或参数名称-价值分隔符=进行编码。

String q = "random word £500 bank $";
String url = "http://example.com/query?q=" + URLEncoder.encode(q, "UTF-8");

注意,查询参数中的空格用+表示,而不是%20,后者是合法有效的。%20通常用于表示URI本身(URI-查询字符串分隔符?之前的部分)中的空格,而不是查询字符串(?之后的部分)。

还请注意,有两个encode()方法。一个没有charset参数,另一个有。没有charset参数的方法已被废弃。永远不要使用它,而是要指定charset参数。javadoc甚至明确建议使用UTF-8编码,这是由RFC3986W3C规定的。

所有其他的字符都是不安全的,首先使用某种编码方案转换成一个或多个字节。然后每个字节用3个字符的字符串"%xy"表示,其中xy是该字节的两位数十六进制表示。推荐使用的编码方案是UTF-8。然而,出于兼容性的考虑,如果没有指定编码,那么就使用平台的默认编码。

See also:

  • 关于URL编码,每个网络开发者都必须知道的内容]5
评论(11)

我不会使用 "URLEncoder"。除了名字不正确("URLEncoder "与URL无关),效率低下(它使用 "StringBuffer "而不是Builder,并做一些其他缓慢的事情),它也很容易被搞砸。

相反,我会使用URIBuilderSpring'的org.springframework.web.util.UriUtils.encodeQuery或Commons Apache HttpClient。 原因是你必须以不同于参数值的方式转义查询参数名称(即BalusC'的答案q)。

上述做法的唯一缺点(我痛苦地发现)是,URL's不是URI's的真正子集

示例代码。

import org.apache.http.client.utils.URIBuilder;

URIBuilder ub = new URIBuilder("http://example.com/query");
ub.addParameter("q", "random word £500 bank \$");
String url = ub.toString();

// Result: http://example.com/query?q=random+word+%C2%A3500+bank+%24

因为我只是链接到其他答案,所以我把这个标记为社区维基。请自由编辑

评论(9)

你需要先创建一个URI,比如。

    String urlStr = "http://www.example.com/CEREC® Materials & Accessories/IPS Empress® CAD.pdf"
    URL url= new URL(urlStr);
    URI uri = new URI(url.getProtocol(), url.getUserInfo(), url.getHost(), url.getPort(), url.getPath(), url.getQuery(), url.getRef());

然后将该Uri转换为ASCII字符串。

    urlStr=uri.toASCIIString();

现在你的url字符串已经完全编码了,首先我们做了简单的url编码,然后我们把它转换为ASCII码字符串,以确保字符串中没有US-ASCII以外的字符。 这正是浏览器的做法。

评论(10)

这里有一个方法,你可以在你的代码中使用,将一个url字符串和参数映射转换为一个包含查询参数的有效编码url字符串。

String addQueryStringToUrlString(String url, final Map parameters) throws UnsupportedEncodingException {
    if (parameters == null) {
        return url;
    }

    for (Map.Entry parameter : parameters.entrySet()) {

        final String encodedKey = URLEncoder.encode(parameter.getKey().toString(), "UTF-8");
        final String encodedValue = URLEncoder.encode(parameter.getValue().toString(), "UTF-8");

        if (!url.contains("?")) {
            url += "?" + encodedKey + "=" + encodedValue;
        } else {
            url += "&" + encodedKey + "=" + encodedValue;
        }
    }

    return url;
}
评论(0)

使用下面的标准Java解决方案(通过了Web Plattform Tests提供的约100个测试案例)。

0. 测试URL是否已经编码。 用'+' 编码的空格替换为'%20'。 编码的空格。

1.将URL分割成结构部分。 使用java.net.URL

2.各结构部分的编码要正确! 3.**使用java.net.URL

3. 使用IDN.toASCII(putDomainNameHere)Punycode的主机名进行编码!

4. 使用java.net.URI.toASCIIString()对NFC编码的unicode进行%-encode - (最好是NFKC!)。 更多信息请看。 https://stackoverflow.com/questions/49768599/how-to-encode-properly-this-url/49778055#49778055

URL url= new URL("http://example.com/query?q=random word £500 bank $");
URI uri = new URI(url.getProtocol(), url.getUserInfo(), IDN.toASCII(url.getHost()), url.getPort(), url.getPath(), url.getQuery(), url.getRef());
String correctEncodedURL=uri.toASCIIString(); 
System.out.println(correctEncodedURL);

印刷品

http://example.com/query?q=random%20word%20%C2%A3500%20bank%20$

以下是一些也能正常工作的例子

{
      "in" : "http://نامه‌ای.com/",
     "out" : "http://xn--mgba3gch31f.com/"
},{
     "in" : "http://www.example.com/‥/foo",
     "out" : "http://www.example.com/%E2%80%A5/foo"
},{
     "in" : "http://search.barnesandnoble.com/booksearch/first book.pdf", 
     "out" : "http://search.barnesandnoble.com/booksearch/first%20book.pdf"
}, {
     "in" : "http://example.com/query?q=random word £500 bank $", 
     "out" : "http://example.com/query?q=random%20word%20%C2%A3500%20bank%20$"
}
评论(0)

在我的例子中,我只需要传递整个url,并且只对每个参数的值进行编码。 我没有找到一个常用的代码来完成这个任务(!!)所以我创建了这个小方法来完成这个任务。

public static String encodeUrl(String url) throws Exception {
    if (url == null || !url.contains("?")) {
        return url;
    }

    List list = new ArrayList();
    String rootUrl = url.split("\\?")[0] + "?";
    String paramsUrl = url.replace(rootUrl, "");
    List paramsUrlList = Arrays.asList(paramsUrl.split("&"));
    for (String param : paramsUrlList) {
        if (param.contains("=")) {
            String key = param.split("=")[0];
            String value = param.replace(key + "=", "");
            list.add(key + "=" +  URLEncoder.encode(value, "UTF-8"));
        }
        else {
            list.add(param);
        }
    }

    return rootUrl + StringUtils.join(list, "&");
}

public static String decodeUrl(String url) throws Exception {
    return URLDecoder.decode(url, "UTF-8");
}

它使用org.apache.commons.lang3.StringUtils。

评论(0)

在安卓系统中,我会使用这个代码。

Uri myUI = Uri.parse ("http://example.com/query").buildUpon().appendQueryParameter("q","random word A3500 bank 24").build();

其中Uriandroid.net.Uri

评论(1)
  1. 使用this:URLEncoder.encode(query, StandardCharsets.UTF_8.displayName())。 或this:URLEncoder.encode(query, "UTF-8")。
  2. 你可以使用下面的代码。

String encodedUrl1 = UriUtils.encodeQuery(query, "UTF-8");//不改变 String encodedUrl2 = URLEncoder.encode(query,"UTF-8");//已更改。 String encodedUrl3 = URLEncoder.encode(query,StandardCharsets.UTF_8.displayName());//改变了。

System.out.println("url1 "

  • encodedUrl1 + "url1"
  • "url2="
  • encodedUrl2 + "urln&quot。
  • "url3="
  • encodedUrl3)。
评论(1)