Por que os URLs são cheios de caracteres inúteis?

Por , em 9.08.2015

Você já deve ter percebido que alguns URLs parecem palavrões de histórias em quadrinhos. Não é apenas para complicar nossa vida; esses montes de caracteres são úteis.

URLs (do inglês “Uniform Resource Locator”, ou “Localizador Padrão de Recursos”) são basicamente “endereços” para websites.

Originalmente, eles eram fáceis de lembrar. No entanto, conforme uma tonelada deles foram surgindo, as formações foram ficando incrivelmente longas e indecifráveis. Por quê?

Anatomia de URLs

Usaremos “http://www.hypescience.com” como nosso exemplo para falar sobre URLs.

“http://” é o que é chamado de “protocolo”. Ele diz ao seu computador como interagir com o servidor do site que você deseja visitar. Neste caso, HTTP informa ao seu computador que ele deve receber dados que foram estruturados para websites.

“www.hypescience.com” indica o nome do servidor que você deseja interagir. Pense nessa parte como um endereço ou um número de telefone.

A partir daí, a coisa tende a ficar estranha. Nos primeiros dias da internet, esses componentes básicos de URL eram suficientes. Pouca informação era necessária para fazer referência a uma página.

No entanto, de acordo com Sean O’Connor, engenheiro do site Bit.ly, que encurta URLs, conforme as capacidades dos sites evoluíram, os URLs precisaram acompanhar. “As pessoas queriam que seus computadores fizessem coisas dinâmicas e interessantes além de buscar páginas estáticas. E foi quando os URLs começaram a ficar mais detalhados”, conta.

O que significa *&¨%$#$@?

Toda vez que você vê um “?” em URLs, por exemplo, os caracteres que se seguem são chamados de “parâmetros de consulta”. Com esses bits extras de informações, o servidor pode responder dinamicamente, oferecendo-lhe uma página da web com base no que você procura.

Há tantos símbolos diferentes que podem ser incluídos nos URLs que é difícil explicar todos. Alguns são:

“http://www.hypescience.com/sobre” – Essa barra (/) organiza o “caminho” do pedido, ou para onde ir dentro dos muitos arquivos hospedados no servidor (no caso, hypescience.com). As barras marcam a hierarquia dentro do caminho, se houver mais de uma.

“https://www.google.com.br/#newwindow=1&q=adoro+o+hypescience” – Esse URL é de uma pesquisa – “adoro o hypescience” – feita no Google. Este é o tipo de URL que aparece quando alguém inicia uma pesquisa, e os parâmetros que você define (como as palavras-chave que você pesquisa) aparecem separados com um sinal de mais.

“https://www.google.com.br/#newwindow=1&q=o+que+%C3%A9+isso%3F” – Se sua pesquisa inclui um caractere especial (no caso, pesquisei “O que é isso?” com um ponto de interrogação) usado para alguma função, outro caractere substitui o original – como um sinal de porcentagem. Precisamos do ponto de interrogação para sinalizar na URL que o que se segue são os parâmetros de pesquisa, por isso a mudança. Esse processo é chamado de “escape”. Outro exemplo é substituir espaços por sinais de adição.

“/#newwindow” – A hashtag é um fragmento de URL interessante. Segundo O’Connor, “tudo no final de uma URL após um sinal desses é especial na medida em que nunca foi enviado para o servidor e é usado exclusivamente pelo navegador da web”. Muitas vezes, é utilizado para se referir a secções dentro de um documento, mas, por vezes, pode ser utilizado para outros fins.

Em alguns casos, é impossível descobrir o que um pedaço de URL significa exatamente. “É muito comum que parâmetros sejam utilizados para manter o controle de informações que só tem significado para o site que as está usando”, diz O’Connor. “Assim, eles podem não ser documentados ou explicados publicamente”.

Estáticos e dinâmicos

URLs podem ser classificados em dois tipos, de acordo com quantos caracteres loucos eles possuem: estáticos e dinâmicos.

URLs estáticos são aqueles que contêm apenas pontos, barras, traços e subtraços. Eles tendem a trafegar melhor do que URLs dinâmicos e têm classificação mais elevada nas buscas do Google, já que são mais fáceis de ler e lembrar.

Os dinâmicos são mais bagunçados: pontos de interrogação, ampersands, sinais de igual, pontos de exclamação, asteriscos e outros símbolos do teclado que nem sabemos pronunciar. Estes são impossíveis de se lembrar, e quando precisamos compartilhá-los (por exemplo, um artigo de jornal específico), optamos normalmente por encolhê-los usando serviços como Bitly ou TinyURL. Os serviços não se livram da informação “extra”, apenas as armazenam em outro lugar.

De acordo com os especialistas, em um futuro próximo, URLs podem acabar como os números de telefone: estão em todos os lugares, nós os usamos todos os dias, mas só saberemos de cor os mais importantes. [Gizmodo]

Deixe seu comentário!