在URLWWW中,每个信息资源都是统一的,并且在网上有唯一的地址。 该地址称为统一资源定位符(URL ),是www统一资源的定位标志,指向网络地址。
语法URL由资源类型、存储资源的主机域名和资源文件名三部分组成。
可以认为由协议、主机、端口和路径四部分组成
URL的一般语法格式如下。
(带有方括号[]的是可选的) :
protocol : // hostname[:port] / path / [;parameters][?query]#fragment
格式说明protocol(协议)
指定要使用的传输协议。 下表列出了protocol属性的有效模式名称。 最常用的是HTTP协议,也是WWW中使用最广泛的协议。
文件资源是本地计算机上的文件。 请注意,以file:///的格式,后面有三个斜线。
ftp通过ftp访问资源。 FTP://
gopher通过gopher协议访问此资源。
http通过http访问资源。 HTTP://
https通过安全的https访问此资源。 HTTPS://
mailto资源是电子邮件地址,通过SMTP进行访问。 格式mailto:
ms通过支持流媒体(MMS )协议来播放这个资源。 (代表软件: Windows Media Player )格式MMS://
ed2k通过支持ed2k (专用下载链接)协议的P2P软件访问此资源。 (代表软件:电驴)格式ed2k://
Flashget通过支持Flashget:专用下载链接]协议的P2P软件访问此资源。 (代表软件:快车)格式Flashget://
thunder通过支持thunder[专用下载链接]协议的P2P软件访问此资源。 (代表软件:迅雷)格式thunder://
news通过NNTP访问此资源。
hostname(主机名)
存储资源的服务器的域名系统(DNS )主机名或IP地址。 在某些情况下,主机名前可以包含连接到服务器所需的用户名和密码。 格式: username:password@hostname )。
port(端口号)
整数、选项和省略时使用架构的默认端口。 每个传输协议都有默认端口号。 例如,http的默认端口是80。 如果在输入时省略,将使用默认端口号。 出于安全和其他原因,可能可以在服务器上重新定义端口。 也就是说,采用非标准端口号。 在这种情况下,不能在URL中省略端口号项。
path(路径)
由零或多个“/”符号分隔的字符串。 通常用于表示主机上的目录或文件地址。
parameters(参数)
这是用于指定特殊参数的选项。
query(查询)
(可选)用于将参数传递到动态网页,如使用CGI、ISAPI、PHP/JSP/ASP/ASP.NET等技术创建的网页。 包含多个参数,用“”符号分隔,每个参数的名称和值用“=”符号分隔。
fragment(信息片断)
指定网络资源中片段的字符串。 例如,一个页面上有多个名词解释,可以使用fragment直接定位于某个名词解释。