统一资源定位符 URL

语义互链

统一资源定位符(或称统一资源定位器/定位地址、URL地址等,英语:Uniform Resource Locator,常缩写为URL),有时也被俗称为网页地址(网址)。如同在网路上的门牌,是因特网上标准的资源的地址()。它最初是由蒂姆·伯纳斯-李发明用来作为万维网的地址。现在它已经被万维网联盟编制为因特网标准RFC 1738。

在网际网路的历史上,统一资源定位符的发明是一个非常基础的步骤。统一资源定位符的语法是一般的,可扩展的,它使用ASCII代码的一部分来表示因特网的地址。统一资源定位符的开始,一般会标志着一个计算机网络所使用的网络协议。

统一资源定位符的标准格式如下

协议类型:[//服务器地址[:端口号]][/资源层级UNIX文件路径]文件名[?查询][#片段ID]

统一资源定位符的完整格式如下

协议类型:[//[访问资源需要的凭证信息@]服务器地址[:端口号]][/资源层级UNIX文件路径]文件名[?查询][#片段ID]

其中【访问凭证信息@ :端口号 ?查询 #片段ID】都属于选填项。

语法

超文本传输协议(HTTP)的统一资源定位符将从因特网获取信息的五个基本元素包括在一个简单的地址中:

  • 传送协议。Data URI scheme
  • 层级URL标记符号(为[//],固定不变)
  • 访问资源需要的凭证信息(可省略)
  • 服务器。(通常为域名,有时为IP地址)
  • 端口号。(以数字方式表示,若为HTTP的预设值「:80」可省略)
  • 路径。(以「/」字元区别路径中的每一个目录名称)
  • 查询。(GET模式的表单参数,以「?」字元为起点,每个参数以「&」隔开,再以「=」分开参数名称与资料,通常以UTF8的URL编码,避开字元衝突的问题)
  • 片段。以「#」字元为起点

以http://zh.wikipedia.org:80/w/index.php?title=Special:%E9%9A%8F%E6%9C%BA%E9%A1%B5%E9%9D%A2 爲例, 其中:

  • http,是协议;
  • zh.wikipedia.org,是服务器;
  • 80,是服务器上的网络端口号;
  • /w/index.php,是路径;
  • ?title=Special:%E9%9A%8F%E6%9C%BA%E9%A1%B5%E9%9D%A2,是询问。

大多数网页浏览器不要求用户输入网页中「http://」的部分,因为绝大多数网页内容是超文本传输协议文件。同样,「80」是超文本传输协议文件的常用端口号,因此一般也不必写明。一般来说用户只要键入统一资源定位符的一部分(zh.wikipedia.org/wiki/Special:%E9%9A%8F%E6%9C%BA%E9%A1%B5%E9%9D%A2)就可以了。

由于超文本传输协议允许服务器将浏览器重定向到另一个网页地址,因此许多服务器允许用户省略网页地址中的部分,比如 www。从技术上来说这样省略后的网页地址实际上是一个不同的网页地址,浏览器本身无法决定这个新地址是否通,服务器必须完成重定向的任务。

其它使用

统一资源定位符不但被用作网页地址,JDBC 客户端也使用统一资源定位符连接其数据库服务器。作为对比,ODBC 的连接字符串作用相同,但并不采用 URL 格式,而是分号和等号分隔的键值对。

以下是一个 Oracle 数据库的统一资源定位符:

jdbc:datadirect:oracle://myserver:1521;sid=testdb

参考资料

↑ http://shuyu.cnki.net/SearchResult.aspx?sItem=URL&ids= 【所属学科】计算机科学技术→网络与数据通信 【汉语推荐使用规范名词】统一资源定位地址 【简称】URL地址 【见 载】《计算机科学技术名词(第二版)》, 科学出版社, 2002
↑ jihite. . www.cnblogs.com. 博客园. [2017-05-24] (中文(中国大陆)‎).阮一峰. . www.ruanyifeng.com. ruanyifeng.com. [2017-05-24].

发表评论

电子邮件地址不会被公开。 必填项已用*标注