Что такое URL адрес и как с ним работать
Заблудиться можно не только в лесу, но и в онлайне. И тому виной может стать неверный путь или адрес, ведущий к ресурсу. Вы не знаете, что такое URL адрес? Тогда прежде, чем пускаться в дальнейшее путешествие по виртуальному пространству, давайте разберемся с системой электронных адресов.
Что такое URL
URL является общепринятым стандартом записи адреса и указания на расположение ресурса в интернете. С английского его название ( Uniform Resource Locator ) переводится как единый указатель ресурсов. Можно встретить более раннюю расшифровку аббревиатуры URL — Universal Resource Locator ( универсальный локатор ресурсов ). Но оба значения скорее дополняют понятие URL , чем перечат друг другу.
Основной формат записи структуры URL адреса выглядит так:
://:@:/?#
— чаще всего имеется в виду протокол.
логин – логин пользователя, используемый для авторизации на ресурсе.
пароль – пароль пользователя для авторизации.
хост – доменное имя хоста.
порт – порт хоста, используемый во время подключения.
URL – путь, по которому находится запрашиваемый ресурс на сервере.
параметры и якорь – значение переменных и идентификатор на определенном ресурсе.
Передача значения переменных в строке запроса возможна лишь с помощью метода GET .
Рассмотрим формат URL адреса страницы запрашиваемого ресурса на практических примерах. На клиентской стороне URL отображается в адресной строке браузера:
Чаще всего встречаются такие варианты:
- http:// ru.wikipedia.org/wiki/Заглавная_страница – для передачи запроса используется http ( протокол передачи гипертекста );
- https://ru.wikipedia.org/wiki/Заглавная_страница — в качестве способа передачи используется https . Является защищенной формой протокола http , использующего шифрование ( SSL или TLS );
- fttp://wikipedia.org/wiki/file.txt – протокол передачи файлов fttp ;
- http://mail.ru/script.php?num=10&type=new&v=text – передача значений переменных в строке запроса с помощью метода GET .
Любой формат URL адреса представляет собой, прежде всего, символьную строку. В ее состав могут входить:
2; Латинские буквы.
2; Арабские цифры (0-9).
2; Зарезервированные символы («+», «=», «!» и другие).
2; Специальные символы – на них остановимся более подробно.
Использование специальных символов в URL
Конечно, таких уж слишком «специальных» символов в URL не используют. Но несколько есть:
- ? – служит для отделения в строке запроса блока с передаваемыми параметрами;
- & — отделяет передаваемые параметры друг от друга;
- = — отделяет в параметре переменную от ее значения;
- : — служит для отделения протокола от остальной части URL;
- # — символ используется в локальной части адреса. Позволяет обратиться к определенной части запрашиваемой страницы;
- @ — указывается в регистрационных данных пользователя и при передаче данных с помощью протокола mailto.
Но все это лишь теория. Поэтому перед тем, как узнать остальное, рассмотрим небольшой практический пример.
Наглядный пример
Возьмем для наглядности вот такую простую форму регистрации:
Вот ее код:
Первой строкой в начале формы мы прописали для нее файл обработчика (php) и метод передачи данных через URL адрес сервера:
Теперь приведем код файла обработчика (1.php) :
Введем данные в форму и отправим их для обработки на сервер. Вот что мы получим в итоге:
Обратите внимание на формат URL в адресной строке на первом скриншоте. После введения данных и нажатия на кнопку « Отправка данных » значения всех полей отправляются для обработки на сервер. А нас перенаправляет на страницу 1.php , где размещен код обработчика.
Перед тем, как посмотреть на результат обработки, взгляните на адресную строку на втором рисунке. В ней отображаются значения полей, переданных на обработку с помощью метода GET.
Для того чтобы скрыть данные, отправляемые на сервер, используется метод POST. Тогда приведенный выше URL будет выглядеть следующим образом:
Формат URL адресов на сайтах
Чаще всего на сайтах используется древовидная система URL . То есть правильный URL адрес состоит из нескольких вложенных друг в друга элементов, последний из которых и является нужной веб-страницей.
Для наглядности возьмем конкретный URL , являющейся одним из разветвлений адреса нашего сайта:
https://www.internet-technologies.ru/templates//page_2.html
Разберем его по частям:
- www.internet-technologies.ru – эта часть является доменным именем сайта. Если набрать его в адресной строке браузера, то оно выведет на главную страницу сайта. В большинстве случаев это файл index. html ;
- templates – данная часть адреса указывает на определенный раздел сайта. В нашем случае это раздел с шаблонами;
- page_2.html – является конечным элементом URL , ведущего на веб-страницу тематического раздела ресурса.
Чаще всего URL адреса основных разделов полностью отображают карту сайта. Но не все так просто обстоит с переадресацией на сайтах, развернутых на основе популярных движков ( CMS ).
Особенности построения URL в WordPress
В WordPress , как и в любом движке, построенном на php , генерация всех страниц сайта происходит динамически. То есть одна часть берется из одного шаблона, другая генерируется « на лету » на основе нескольких.… Но такая летучесть имеет один существенный недостаток – наличие кусков передаваемых параметров в URL .
Причем это ущемляет не только эстетическую составляющую отображения адресов, но и неоднозначно воспринимается поисковиками. А это может негативно влиять на продвижение сайта:
Поэтому лучше использовать на своем сайте чистые URL адреса. Но где взять их, если CMS система не предусматривает возможности их редактирования.
Самый простой способ настройки отображения URL в WordPress – это использование специализированных плагинов:
- Cyr-To-Lat – преобразует русские символы в адресах в латиницу;
- Permalink Editor – добавляет дополнительные опции для настройки через админку (раздел «Постоянные ссылки»);
- .html on pages – убирает расширение html c конца URL .
Ну а если и это не помогает, то нужно лезть собственными руками в само сердце CMS . Но это уже тема другого и более обширного по объему материала.
Источник статьи: http://www.internet-technologies.ru/articles/chto-takoe-url-adres-i-kak-s-nim-rabotat.html
Что такое URL — как создать корректный адрес сайта
В SEO существует множество факторов, которые влияют на итоговый результат продвижения в поисковых системах. Один из них — оптимизация URL-адресов.
В справке Google для вебмастеров существует отдельный раздел по оптимизации урлов. В этом посте я расскажу о том, что такое веб-адреса страниц, об их видах и влиянии на SEO, как правильно оптимизировать URL- адреса страниц на сайте (в рамках рубрики «Азбука SEO»).
URL или URL-адрес (Uniform Resource Locator) — унифицированный указатель ресурса. Это уникальный набор символов, который дает возможность идентифицировать всевозможные ресурсы в интернете (страницы сайтов, файлы, изображения, видео и так далее). Он указывает местоположение конкретного сайта в сети и то, каким образом можно получить к нему доступ.
Из чего состоит веб-адрес
Чтобы унифицировать все веб-адреса создан специальный стандарт, благодаря которому у всех урлов существует простой и понятный путь к хранению файла.
Символы, которые мы видим в адресной строке и есть URL-адрес. Структура любого URL выглядит так:
В структуре обязательно используется и , остальные части необязательные.
Схема — протокол передачи данных. Существует огромное количество протоколов, но чаще всего это:
- FTP:// (File Transfer Protocol) предоставляет удаленный доступ к хостингу, передаче данных с сервера на устройство пользователя и наоборот;
- HTTP:// (Hyper Text Transfer Protocol) — протокол передачи гипертекста предназначен для транспортировки произвольных данных (изначально, в формате HTML).
- HTTPS:// (Hyper Text Transfer Protocol Secure) — HTTP протокол, для повышения безопасности работающий с помощью транспортных механизмов SSL и TLS.
- SMTP:// (Simple Mail Transfer Protocol) — протокол передачи почты в сетях TCP/IP.
Логин: пароль — имя и пароль для входа в учетную запись. Для HTTP/HTTPS-протоколов не используется. Обычно применяется для протокола FTP (ftp://name:password@qwerty.ua).
Хост — доменное имя сайта. Зачастую используется название бренда, например netpeak.ua. Также может использоваться IP-адрес (172.217.168.195), но сейчас его применяют очень редко, так как IP запомнить сложнее.
Порт — составная часть веб-адреса, числовой идентификатор программы или процесса, предоставляющий возможность доступа к ресурсам на указанном IP-адресе. Например, за http-сервером закреплен 80 порт, а за https — 443. То есть для соединения с веб-сервером нам необходимо знать IP-адрес компьютера и его порт. В свою очередь, чтобы веб-сервер мог передать данные на наш компьютер, ему необходимо предоставить IP и порт нашего компьютера, чтобы принять ответ от сервера, а после обработать данные.
URL-путь — это адрес, где расположен ресурс или файл на веб-сервере. К примеру, по адресу https://netpeak.ua/services/seo/ можно понять, что услуги категории «SEO» расположены в директории «Услуги».
Параметры — специальные данные, которые браузер сообщает веб-серверу. Как правило, параметры указываются после знака «?» и разделяются «&». Всё, что идет до вопросительного — основной URL, после — дополнительные параметры. https://site.com/cat332t1.html?sort_direction=desc&sort_by=price_desc
Якорь — вид закладки на странице, которая направляет пользователя на определенную часть страницы (помеченный фрагмент кода). Реализовывается с помощью символа «#»: https://en.wikipedia.org/wiki/URL#Syntax.
Влияние URL на SEO
На продвижение сайтов влияет множество факторов, которые помогают добиться необходимых результатов в ранжировании сайта.
При прочих равных, правильно оптимизированный URL-адрес страницы даёт преимущество над сайтами, у которых URL сформирован CMS системой.
Степень значимости оптимизированного URL в SEO зависит от частотности запросов и конкуренции. Как правило, главные разделы сайта продвигаются по высокочастотным запросам, на них оптимизация URL не сильно отражается. А вот для низкочастотных запросов правильно составленные веб-адреса важны и существенно помогают в ранжировании сайта.
Виды URLов
Существует два типа URL-адресов: статические и динамические.
Статический URL — постоянный адрес веб-страниц, который не содержит дополнительных параметров и не меняется со временем (или меняется, но крайне редко): https://serpstat.com/ru/blog/novie-vozmozhnosti-iyunskie-obnovleniya-serpstat/.
Динамический URL — веб-адрес страницы, который генерируется в ответ на определенный запрос пользователя.
В динамических веб-адресах присутствуют разделители в виде знаков «?», «=», «&». После этих разделителей отображаются дополнительные параметры страницы. Динамические URL обычно формируются после выбора фильтров, сортировки товаров, поиска по сайту и другого.
Как выглядят такие страницы:
У динамических URL есть свои недостатки:
- сложно запоминаются;
- CTR ниже, чем у статических;
- в них не учитываются ключевые слова;
- пользователи не понимают, какое содержимое будет на странице;
- возникают сложности при копировании — они могут обрезаться.
Транслитерация, латиница или кириллица: что лучше?
Поисковые системы одинаково хорошо распознают все форматы URL. Какой выбрать — решать вам.
Транслитерация
Транслитерация чаще всего используется для названия статей.
- Приятные для восприятия и легко читаются.
- Информативные. По URL-адресу пользователь сразу понимает, какой контент будет на странице.
- Положительно влияют на поисковые системы — в адресе легко распознаются ключевые слова.
- Благодаря таким URL удобно просматривается структура сайта. Также пользователь может удалить часть URL-адреса (с конца) и попасть в нужную категорию.
Из недостатков можно выделить то, что такие УРЛы увеличивают нагрузку на сайт за счет установки дополнительных плагинов для CMS-системы.
Латинские URL (перевод на английский)
Это универсальный вариант для URL. Латинские символы знает множество пользователей, к тому же они легко обрабатываются поисковыми роботами.
Данный тип URL обычно используется для страниц категорий, подкатегорий, рубрик (статических страниц). Вместо «/novosti/» используют «/news/», вместо «/o-nas/» — «/about-us/» и так далее.
Кириллические URL
Такой тип URL используется, если домен или его часть кириллические, а также, если часть адреса не слишком длинная:
- Удобные и простые для запоминания.
- Большое количество свободных доменов, так как кириллица ещё не столь популярна.
- Использование ключевых слов в URL-адресе.
Недостаток: если скопировать URL и отправить кому-то или вставить в текстовый редактор, то получится непонятный набор символов:
Дело в том, что в стандарте доменных имен используется 37 символов, которые входят в таблицу кодировки ASCII (American standard code for information interchange): 26 символов латинского алфавита, арабские цифры от 0 до 9 и дефис. Все остальные символы перекодируются с помощью Punycode (стандартизированный метод преобразования последовательностей Unicode-символов).
- Сложность восприятия для зарубежных пользователей — они привыкли, что URL состоит из латинских символов и такой вариант для них будет непонятен.
- Сложности чтения таких URL поисковыми роботами. Они возникают при настройке файлов robots.txt, sitemap.xml, а также с атрибутом link тега canonical и настройкой 301-редиректов. Такие URL сначала необходимо преобразовать в кодировку Punycode.
ЧПУ URL и правила их оформления
Поисковые системы рекомендуют использовать человекопонятные URL, их ещё называют дружественными URL-адресами. Это адреса страниц, которые дают понимание пользователю и поисковым ботам, какая информация может находиться по ссылке. Англоязычный термин ЧПУ (человекопонятный урл — SEF URL (search engine friendly url).
Для формирования дружественных URL-адресов необходимо придерживаться общепринятых правил:
- для русскоязычных страниц использовать правила транслитерации:
* исключение «ый» — транслитерируется как «iy».
- все знаки препинания и пробелы заменять на дефис. Если CMS система использует нижнее подчеркивание, тогда оставляйте такой вариант;
- два или более дефиса или нижних подчеркивания подряд необходимо заменить на один дефис;
- если в начале или в конце URL появляется символ «-», то его необходимо удалить.
- в URL не должно быть заглавных букв, а только строчные. URL-адреса чувствительны к регистру. Для поисковых систем страницы https://site.com/Novosti/ и https://site.com/novosti/ — две разные страницы;
- рекомендуются короткие URL.
Среди вебмастеров принято использовать в адресе не более 3-5 слов. Чем меньше, тем лучше. Длинные URL обрезаются в поисковой выдаче, при этом снижается вес ключевых слов. Также они неудобны для пользователей, так как тяжело запоминаются и усложняют навигацию по сайту. Исключение составляют новостные сайты, URL которых зачастую состоит из более чем трех слов.
- уровень вложенности страниц. Структура URL-адреса должна повторять структуру самого сайта, но это не всегда полезно, если страницы находятся в 4-5 и более кликах от главной. В таких случаях необходимо сокращать уровень вложенности, скрывая промежуточные разделы;
- использование символа «#» в URL;
- поисковые системы не учитывают части URL-адреса, которые идут после хэштега. Именно поэтому их можно использовать для улучшения навигации пользователя. Обычно символ решетки используют на страницах статей и сайтах-одностраничниках для создания якорного меню;
если же это будет последовательность из двух символов «#!», так называемых шебанг (shebang или hashbang), тогда URL проиндексируется. Детальнее об индексации страниц на AJAX и JavaScript можно прочитать в блоге.
Формирование оптимальной структуры URL для разных типов страниц
Один из часто задаваемых вопросов по внутренней SEO-оптимизации касается правильной структуры URL-адреса. Давайте на примере интернет-магазинов рассмотрим разные варианты логики построения структуры URL-адреса.
- Страница раздела/категории. Здесь всё просто, так как после домена сразу идет страница раздела/категории: https://site.ua/category1/.
- Страница подкатегории. Рассмотрим два часто используемых варианта:
- повторять структуру сайта: https://site.ua/category1/subcategory1/subcategory2/subcategory3/;
- убирать промежуточные папки в URL-адресе: https://site.ua/category1/subcategory3/;
- Страница карточки товара.
- всё также сохранять иерархию страниц, добавляя в URL карточку товара: https://site.ua/category1/subcategory1/subcategory2/product/
- можно показать поисковым роботам структуру сайта и его содержание, что положительно скажется на индексации;
- можно отслеживать трафик в аналитике, так как видно, с какого раздела/категории пришел пользователь;
- пользователи сразу понимают, в каком разделе сайта они находятся — им проще ориентироваться по сайту.
- длинный URL уменьшает вес ключевых слов в веб-адресе;
- в некоторых CMS-системах нет возможности создавать дополнительные разделы/подкатегории;
- велика вероятность появления дублей страниц. Например, один товар может находиться в двух категориях. Это приводит к появлению дублей страниц. Например iPhone XS может находиться сразу в нескольких разделах: https://site.com.ua/smarfony/iphonexs/;https://site.com.ua/smarfony/apple/iphonexs/.
Ещё вариант — не привязывать карточку товара к определенной категории и хранить всё в корне сайта: https://site.ua/product/.
- товары не закреплены за страницами определенных категорий, что исключает возможность появления дублей страниц;
- увеличение веса ключевых слов в URL на определённом разделе;
- оптимальная длина веб-адреса, за счет исключения промежуточных категорий/подкатегорий.
- не в каждой системе управления контентом есть возможность убирать ненужные для URL папки;
- нет возможности отслеживать трафик в аналитике: так товар не будет закреплен за конкретным разделом/категорией.
Когда же стоит использовать первый вариант, а когда второй? Всё зависит от тематики и возможности сайта. Если это небольшой интернет-магазин, в котором карточки товаров закреплены за определенным разделом/подкатегорией, тогда можно первый.
Второй рекомендую в том случае, когда товар может относиться к разным категориям. Товары не будут закреплены за категориями и таким образом можно решить проблему появления дублей страниц.
О том, как формировать структуру URL для страниц фильтров , можно прочитать в блоге.
Частые ошибки при работе с URL
Грубые ошибки при работе с URL:
- изменение URL-адреса без 301 редиректа. Если вы задумываете изменить или уже создали новые адреса страниц, вам необходимо настроить 301 редирект, чтобы не дублировать страницы. То же касается и других версий сайта (с www, http и https, маленький и большой регистр и так далее);
- разные URL, но одинаковое содержание контента. К примеру, два параметра фильтра, таких как цвет и размер. Посетитель может отфильтровать товары по цвету и потом по размеру или наоборот, по размеру и цвету. Здесь важно соблюдать одну логику формирования URL для страниц фильтров, чтобы избежать огромного количества дублированного контента.
Рекомендации по оптимизации адресов:
- максимально короткий URL;
- по возможности не используйте параметры. Параметры URL делают его длиннее, могут создать проблемы с дублированным контентом, ну и просто нечитабельны для пользователя;
- без спама. Использование ключевых слов в URL поможет сайту ранжироваться немного лучше. Но не стоит злоупотреблять с ними в URL, иначе поисковик может посчитать, что сайт использует спамные методы продвижения.
Выводы
- URL-адрес — это месторасположение определенного веб-сайта, страницы или файла в интернете.
- URL — фактор ранжирования, но не один из самых главных, не стоит слишком зацикливаться на них.
- В СНГ сегменте рекомендую использовать транслитерацию, а не кириллицу.
- Делайте URL для пользователей. С их помощью человек, не заходя на страницу, сразу увидит, какой на ней контент.
- Формируйте структуру URL в зависимости от типа вашего сайта, чтобы в дальнейшем избежать доработок.
- Прежде чем оптимизировать URL, обязательно ознакомьтесь с рекомендациями поисковых систем, на которых вы продвигаетесь.
Источник статьи: http://netpeak.net/ru/blog/chto-takoye-url-kak-sozdat-korrektnyy-adres-sayta/