Quando você digita um endereço no navegador, muitas coisas acontecem nos bastidores. E a maior parte disso é determinada pelas várias partes da URL que você digitou. Vamos olhar mais de perto.
Um URL pode consistir em várias partes diferentes. Há um nome de host que mapeia para um endereço IP de um recurso específico na Internet e um monte de informações adicionais que informam ao navegador e ao servidor como lidar com as coisas. Você pode pensar em um endereço IP como algo como um número de telefone. Um nome de host é como o nome de uma pessoa cujo número de telefone você deseja procurar. E um padrão chamado DNS (Domain Name System) funciona em segundo plano como uma lista telefônica, traduzindo os nomes de host mais amigáveis ao ser humano nos endereços IP que as redes usam para rotear o tráfego.
Mantendo essa analogia em mente, vamos dar uma olhada na estrutura de um URL e como ele funciona para chegar aonde você deseja ir.
Como um URL é estruturado
A estrutura de uma URL foi definida pela primeira vez por Sir Tim Berners-Lee – o cara que criou a Web e o primeiro navegador da Web – em 1994. As URLs combinam essencialmente a idéia de nomes de domínio com a idéia de usar um caminho de arquivo para identificar um local específico. estrutura de pastas e arquivos. Portanto, é semelhante ao uso de um caminho como C: Documents Personal myfile.txt no Windows, mas com algumas coisas extras no início para ajudar a encontrar o servidor certo na internet em que esse caminho existe e o protocolo usado para acessar o em formação.
Um URL consiste em várias partes diferentes. Pegue, por exemplo, um URL básico como o mostrado na imagem abaixo.
Esse URL simples é dividido em dois componentes principais: o esquema e a autoridade.
Esquema
Muitas pessoas pensam em um URL apenas como um endereço da web, mas não é tão simples assim. Um endereço da web é um URL, mas todos os URLs não são endereços da web. Outros serviços que você pode acessar na internet – como FTP – ou mesmo localmente – como MAILTO – também são URLs. A parte do esquema de uma URL (aquelas letras seguidas de dois pontos) denota o protocolo com o qual um aplicativo (como o navegador da web) e o servidor devem se comunicar.
Os endereços da Web são o URL mais comum, mas existem outros. Então, você pode ver esquemas como:
- Protocolo de transferência de hipertexto (HTTP): este é o protocolo subjacente da web e determina quais ações os servidores e navegadores da web devem executar em resposta a determinados comandos.
-
HTTP seguro (HTTPS): é uma forma de HTTP que funciona em uma camada segura e criptografada para transporte mais seguro de informações.
- Protocolo de transferência de arquivos (FTP): esse protocolo ainda é usado frequentemente para transferir arquivos pela Internet.
Nos navegadores modernos, o esquema não é tecnicamente necessário como parte do URL. Se você entrar em um site como “www.howtogeek.com”, seu navegador determinará automaticamente o protocolo correto a ser usado. Ainda assim, alguns outros aplicativos (e protocolos) exigem o uso de um esquema.
Autoridade
A parte de autoridade de uma URL (que é precedida por duas barras) é dividida em várias partes. Vamos começar com um URL muito simples, do tipo que levaria você à página inicial de um site.
Neste exemplo simples, toda a parte “www.example.com” é chamada de nome de host e é resolvida para um endereço IP. Você também pode digitar um endereço IP na barra de endereços do navegador, em vez do nome do host, se souber.
Mas, ao analisar o nome do host, é útil lê-lo para trás para entender o que está acontecendo, então aqui estão esses componentes:
- Domínio de nível superior: No exemplo aqui, “com” é o domínio de nível superior. Esse é o nível mais alto da hierarquia do DNS (sistema de nomes de domínio) usado para converter endereços IP em endereços de idioma simples, mais fáceis de lembrar para nós, humanos. Esses domínios de nível superior são criados e gerenciados pela Internet Corporation para nomes e números atribuídos (ICANN). Os três domínios de nível superior mais comuns são .com, .net e .gov. A maioria dos países também possui seu próprio domínio de primeiro nível com duas letras. Portanto, você verá domínios como .us (Estados Unidos), .uk (Reino Unido), .ca (Canadá) e muitos outros. Existem também alguns domínios de nível superior adicionais (como .museum) que são patrocinados e gerenciados por organizações privadas. Além desses, também existem alguns domínios genéricos de nível superior (como .club, .life e .news).
- Subdomínio: Como o DNS é um sistema hierárquico, as partes “www” e “exemplo” de nosso URL de exemplo são consideradas subdomínios. A parte “www” é um subdomínio do domínio de nível superior “com” e a parte “www” é um subdomínio do domínio “exemplo”. É por isso que você costuma ver uma empresa com um nome registrado como “google.com” dividida em subdomínios separados como “www.google.com”, “news.google.com”, “mail.google.com” e em breve.
Esse é o exemplo mais básico da seção de autoridade de um URL, mas as coisas podem ficar mais complicadas. Existem outros dois componentes que a seção de autoridade pode conter:
- Informação do usuário: A seção de autoridade também pode conter um nome de usuário e uma senha para o site que você está acessando. É incomum ver essa estrutura nos URLs hoje, mas isso pode acontecer. Se presente, a parte de informações do usuário vem antes do nome do host e é seguida por um sinal @. Portanto, você poderá ver algo como “// nome_de_usuário: senha@www.example.com” se incluir as informações do usuário.
- Número da porta: Os dispositivos de rede usam endereços IP para obter informações no computador certo em uma rede. Quando esse tráfego chega, um número de porta informa ao computador o aplicativo para o qual esse tráfego é destinado. O número da porta é outro elemento que você geralmente não vê ao navegar na Web, mas pode ser visto em aplicativos de rede (como jogos) que exigem a inserção de um URL. Se o URL incluir um número de porta, ele vem após o nome do host e é precedido por dois pontos. Seria algo assim: “//www.example.com:8080”.
Portanto, essas são as partes do esquema e da autoridade de um URL, mas, como você deve ter adivinhado, depois de analisar muitos URLs enquanto navega na Web, eles podem incluir ainda mais coisas.
Caminhos, consultas e fragmentos
Existem três partes adicionais de um URL que você pode ver após a parte da autoridade: caminhos, consultas e fragmentos. Aqui está como isso funciona.
Caminho
A seção de autoridade de um URL leva seu navegador (ou qualquer outro aplicativo) ao servidor certo em uma rede. O caminho a seguir – que funciona como um caminho no Windows, macOS ou Linux – leva você à pasta ou arquivo certo nesse servidor. O caminho é precedido por uma barra e existe uma barra entre todos os diretórios e subdiretórios, assim:
www.example.com/folder/subfolder/filename.html
A última parte é o nome do arquivo que é aberto quando você acessa o site. Embora você não possa vê-lo na barra de endereços, isso não significa que ele não esteja lá. Alguns idiomas usados para criar páginas da Web ocultam o nome do arquivo e a extensão que você está visualizando. Isso torna o URL mais fácil de lembrar e digitar, além de oferecer uma aparência mais limpa.
Inquerir
A parte da consulta de um URL é usada para identificar itens que não fazem parte de uma estrutura de caminho estrita. Na maioria das vezes, você as vê usadas quando você realiza uma pesquisa ou quando uma página da Web entrega dados por meio de um formulário. A parte da consulta é precedida por um ponto de interrogação e vem após o caminho (ou após o nome do host, se um caminho não estiver incluído).
Como exemplo, considere este URL apresentado quando pesquisamos na Amazon as palavras-chave “extensor de wi-fi”:
https://www.amazon.com/s/ref=nb_sb_noss_2?url=search-alias%3Daps&field-keywords=wi-fi+extender
O formulário de pesquisa transmitiu informações para o mecanismo de pesquisa da Amazon. Após o ponto de interrogação, você pode ver que existem duas partes na consulta: um URL para a pesquisa (a parte “url = alias de pesquisa% 3Daps e campo”) e as palavras-chave que digitamos (as palavras-chave = wi-fi + extensor ”).
Esse é um exemplo bastante simples, e você verá URLs com variáveis adicionais (e mais complicadas). Por exemplo, aqui está o URL quando pesquisamos no Google a palavra-chave “howtogeek”:
https://www.google.com/search?q=howtogeek&rlz=1C1GCEA_enUS751US751&oq=howtogeek&aqs=chrome..69i57j69i60l4j0.1839j1j4&sourceid=chrome&ie=UTF-8
Como você pode ver, há algumas informações diferentes. Nesse caso, você pode ver que há informações adicionais indicando o idioma da pesquisa, o navegador que usamos (Chrome) e até o número da versão do navegador.
Fragmento
O componente final de um URL que você pode ver é chamado de fragmento. O fragmento é precedido por uma marca de hash (#) e é usado para indicar um local específico em uma página da web. Ao codificar uma página da web, os designers podem criar âncoras para textos específicos, como títulos. Quando o fragmento apropriado é usado no final de uma URL, seu navegador carrega a página e depois pula para essa âncora. Âncoras e URLs com fragmentos são frequentemente usados para criar tabelas de conteúdo em páginas da Web para facilitar a navegação.
Aqui está um exemplo. A página da Wikipedia sobre o Renascimento é um documento bastante longo e está dividido em cerca de 11 seções, cada uma das quais com várias subseções. Mas cada cabeçalho da página possui uma âncora incluída e um sumário na parte superior do artigo inclui links que permitem acessar as diferentes seções. Esses links funcionam incluindo fragmentos.
Você também pode usar esses fragmentos diretamente na barra de endereços ou como links compartilháveis. Digamos, por exemplo, que você quis mostrar a alguém a seção dessa página que cobre a Rússia. Você pode simplesmente enviar a eles este link:
https://en.wikipedia.org/wiki/Renaissance#Russia
A parte “#Russia” no final do URL os leva diretamente para essa seção depois de carregar a página.
Então está aí – mais do que você provavelmente já quis saber sobre como os URLs funcionam.
Crédito de imagem: Pawel Horazy / Shutterstock
0 Comments