Что такое URL-адрес (унифицированный указатель ресурсов)?

Унифицированный указатель ресурсов, сокращенно URL, — это способ определения местоположения файла в Интернете. Это то, что мы используем не только для открытия веб-сайтов, но и для загрузки изображений, видео, программного обеспечения и других типов файлов, размещенных на сервере.

Открыть локальный файл на вашем компьютере так же просто, как дважды щелкнуть по нему, но для открытия файлов на удаленных компьютерах, таких как веб-серверы, мы должны использовать URL-адреса, чтобы наш веб-браузер знал, где искать. Например, открытие HTML-файла, представляющего веб-страницу, описанную ниже, осуществляется путем ввода его в панель навигации в верхней части браузера, который вы используете.

Henrik5000 / Getty Images

Другие названия

Унифицированные указатели ресурсов чаще всего называют URL-адресами, но их также называют адресами веб-сайтов, когда они ссылаются на URL-адреса, использующие протокол HTTP или HTTPS.

URL обычно произносится с каждой буквой, произносимой индивидуально (например, u — r — l, а не Earl). Раньше это было аббревиатурой от Universal Resource Locator до того, как в 1994 году было изменено на Uniform Resource Locator.

Примеры URL

Вероятно, вы привыкли вводить URL-адрес, например, этот для доступа к веб-сайту Google:

https://www.google.com

Весь адрес называется URL-адресом. Другой пример — этот веб-сайт (первый) и Microsoft (второй):

https://www.lifewire.com
https://www.microsoft.com

Вы даже можете сделать супер-конкретный и открыть прямой URL-адрес изображения, например, этот длинный, который указывает на логотип Google на веб-сайте Википедии. Если вы откроете эту ссылку, вы увидите, что она начинается с https:// и имеет обычный URL-адрес, как в приведенных выше примерах, но затем содержит много другого текста и косых черт, чтобы указать вам на точную папку и файл, где находится изображение на сервере веб-сайта.

Та же концепция применяется при доступе к странице входа в систему маршрутизатора; IP-адрес маршрутизатора используется в качестве URL-адреса для открытия страницы конфигурации.

Большинство из нас знакомы с этими типами URL-адресов, которые мы используем в веб-браузерах, таких как Firefox или Chrome, но это не единственные случаи, когда вам понадобится URL.

Во всех этих примерах вы используете протокол HTTP для открытия веб-сайта, который, вероятно, единственный, с которым сталкивается большинство людей, но есть и другие протоколы, которые вы также можете использовать, например FTP, TELNET, MAILTO и RDP. URL-адрес может даже указывать на локальные файлы на жестком диске. Каждый протокол может иметь уникальный набор синтаксических правил для достижения пункта назначения.

Структура URL

URL-адрес может быть разбит на несколько разделов, каждый из которых служит определенной цели при доступе к удаленному файлу.

URL-адреса HTTP и FTP имеют такую ​​же структуру, как протокол: // имя хоста / fileinfo. Например, доступ к файлу FTP по его URL-адресу может выглядеть примерно так:

FTP: //servername/folder/otherfolder/programdetails.docx

Который, помимо того, что Ftp вместо HTTP, выглядит как любой другой URL-адрес, который вы можете встретить в Интернете.

Давайте воспользуемся следующим URL-адресом, который является объявлением Google об ошибке ЦП, в качестве примера HTTP-адреса и определим каждую часть:

https://security.googleblog.com/2018/01/todays-cpu-vulnerability-what-you-need.html

  • протокол HTTPS — это протокол (например, FTP — это протокол), определяющий тип сервера, с которым вы общаетесь.
  • безопасность имя хоста, используемое для доступа к этому конкретному веб-сайту.
  • googleblog это доменное имя.
  • com это то, что называется доменом верхнего уровня (TLD), некоторые из которых включают .net, .org, .co.uk и т. д.
  • / 2018 / 01 / представляет каталоги, используемые для организации веб-страницы или файла. На веб-сервере, на котором хранятся файлы веб-сайта, это будут фактические папки, которые вы должны щелкнуть, чтобы найти файл, указанный в этом URL-адресе.
  • сегодня-cpu-уязвимость-что-вам-нужно.html — это фактический файл, на который указывает URL. Если вы пытались загрузить изображение, аудиофайл или файл другого типа вместо файла HTML, то URL-адрес будет заканчиваться этим расширением файла (например, PNG или MP3).
  • security.googleblog.com как группа называется полностью определенным доменным именем (FQDN).

Правила синтаксиса URL

В URL-адресе разрешены только цифры, буквы и следующие символы: ()! $ -'_ * +.

Другие символы должны быть закодированы (переведены в программный код), чтобы их можно было принять.

Некоторые URL-адреса имеют параметры, которые отделяют его от дополнительных переменных. Например, когда вы выполняете поиск в Google по запросу lifewire:

https://www.google.com/search?q=lifewire

Знак вопроса, который вы видите, сообщает определенному сценарию, размещенному на сервере Google, что вы хотите отправить ему определенную команду, чтобы получить настраиваемые результаты.

Конкретный сценарий, который Google использует для выполнения поиска, знает, что все, что следует за ? q = часть URL-адреса должна быть идентифицирована как поисковый запрос, поэтому все, что набирается в этой точке URL-адреса, используется для поиска в поисковой системе Google.

Вы можете увидеть аналогичное поведение в URL-адресе в этом поиске YouTube лучших видеороликов о кошках:

https://www.youtube.com/results?search_query=best+cat+videos

Хотя в URL нельзя использовать пробелы, на некоторых веб-сайтах используется + знак, который вы можете увидеть в примерах Google и YouTube. Другие используют закодированный эквивалент пробела% 20.

Некоторые URL-адреса могут переключаться между параметрами в зависимости от контекста. Хороший пример можно увидеть при добавлении метки времени к видео YouTube. Некоторые ссылки требуют амперсанда, а другие — вопросительного знака.

URL-адреса также могут использовать якоря. Они расположены в самом конце и описывают, где на этой странице переходить при выборе ссылки. Якоря создаются при добавлении ссылок на веб-страницу, и они используют знак числа (#). Вот пример записи в Википедии, где привязка переносит вас в другую часть страницы:

https://en.wikipedia.org/wiki/Lifewire#History

В URL-адресах, использующих несколько переменных, после вопросительного знака используется один или несколько амперсандов. Здесь вы можете увидеть пример поиска Amazon.com для Windows 10:

https://www.amazon.com/s/ref=nb_sb_noss_2?url=search-alias%3Daps&field-keywords=windows+10

Первая переменная, URL, предшествует вопросительный знак, но следующая переменная, ключевые слова поля, предшествует амперсанд. Перед дополнительными переменными также будет стоять амперсанд.

Части URL-адреса чувствительны к регистру, в частности, все после имени домена (каталоги и имя файла). Вы можете убедиться в этом сами, если напишите слово «потребность» в примере URL от Google, который мы разобрали выше, сделав конец URL читаемым сегодня-cpu-уязвимость-что-вам-NEED.html. Попробуйте открыть эту страницу, и вы увидите, что она не загружается, потому что этого конкретного файла нет на сервере.

Дополнительная информация об URL-адресах

Если URL-адрес указывает на файл, который может отображать ваш веб-браузер, например изображение в формате JPG, вам не нужно загружать его на свой компьютер, чтобы увидеть его. Однако для файлов, которые обычно не отображаются в браузере, таких как файлы PDF и DOCX, и особенно файлы EXE (и многие другие типы файлов), вам будет предложено загрузить их.

URL-адреса предоставляют нам простой способ получить доступ к IP-адресу сервера без необходимости знать фактический адрес. Они похожи на легко запоминающиеся названия наших любимых веб-сайтов. Этот перевод URL-адреса в IP-адрес и есть то, для чего используются DNS-серверы.

Некоторые URL-адреса действительно длинные и сложные, и их лучше всего использовать, если вы щелкнете их как ссылку или скопируете / вставите в адресную строку браузера. Ошибка в URL-адресе может привести к ошибке кода состояния HTTP серии 400, наиболее распространенным типом которой является ошибка 404.

Один из примеров можно увидеть на сайте gog.com. Если вы попытаетесь получить доступ к странице, которой нет на их сервере (например, этой), вы получите ошибку 404. Эти типы ошибок настолько распространены, что вы часто найдете их нестандартные, часто юмористические, версии на некоторых веб-сайтах. У нас есть список лучших.

Если у вас возникли проблемы с доступом к веб-сайту или онлайн-файлу, который, по вашему мнению, должен загружаться нормально, см. Наше руководство по устранению ошибки в URL-адресе, где есть полезные идеи о том, что делать дальше.

Большинство URL-адресов не требуют указания имени порта. Например, открыть google.com можно, указав номер порта в конце, например http://www.google.com:80, но это не обязательно. Если бы вместо этого веб-сайт работал на порту 8080, вы могли бы заменить порт и получить доступ к странице таким образом.

По умолчанию FTP-сайты используют порт 21, но другие могут быть настроены на порт 22 или что-то другое. Если FTP-сайт не использует порт 21, вы должны указать, какой из них он использует для правильного доступа к серверу. Та же концепция применяется к любому URL-адресу, который использует порт, отличный от того, который программа, используемая для доступа, по умолчанию предполагает, что он использует.