HTTP 404 - HTTP 404

O HTTP 404 , 404 não encontrado , 404 , erro 404 , página não encontrada ou arquivo não encontrado mensagem de erro é um protocolo de transferência de hipertexto (HTTP) código de resposta padrão , na rede de computadores comunicações, para indicar que o navegador foi capaz de se comunicar com um determinado servidor , mas o servidor não conseguiu encontrar o que foi solicitado. O erro também pode ser usado quando um servidor não deseja divulgar se possui as informações solicitadas.

O servidor de hospedagem do site geralmente gera uma página da web "404 não encontrado" quando um usuário tenta seguir um link quebrado ou inativo ; portanto, o erro 404 é um dos erros mais reconhecíveis encontrados na World Wide Web .

Visão geral

Ao se comunicar via HTTP, um servidor deve responder a uma solicitação, como uma solicitação de navegador da web para uma página da web , com um código de resposta numérico e uma mensagem opcional, obrigatória ou não permitida (com base no código de status). No código 404, o primeiro dígito indica um erro do cliente, como um Uniform Resource Locator (URL) digitado incorretamente . Os dois dígitos a seguir indicam o erro específico encontrado. O uso de códigos de três dígitos pelo HTTP é semelhante ao uso de tais códigos em protocolos anteriores, como FTP e NNTP . No nível HTTP, um código de resposta 404 é seguido por uma "frase de razão" legível. A especificação HTTP sugere a frase "Não encontrado" e muitos servidores da web, por padrão, emitem uma página HTML que inclui o código 404 e a frase "Não encontrado".

Um erro 404 geralmente é retornado quando as páginas são movidas ou excluídas. No primeiro caso, é melhor empregar mapeamento de URL ou redirecionamento de URL retornando uma resposta 301 Moved Permanently, que pode ser configurada na maioria dos arquivos de configuração do servidor ou por meio da reescrita de URL ; no segundo caso, um 410 Gone deve ser retornado. Como essas duas opções exigem configuração de servidor especial, a maioria dos sites não as utiliza.

Os erros 404 não devem ser confundidos com os erros de DNS , que aparecem quando o URL fornecido se refere a um nome de servidor que não existe. Um erro 404 indica que o próprio servidor foi encontrado, mas não conseguiu recuperar a página solicitada.

Erros Soft 404

Alguns sites relatam um erro "não encontrado" retornando uma página da Web padrão com um código de resposta "200 OK", informando falsamente que a página foi carregada corretamente; isso é conhecido como soft 404 . O termo "soft 404" foi introduzido em 2004 por Ziv Bar-Yossef et al .

Soft 404s são problemáticos para métodos automatizados de descobrir se um link está quebrado. Alguns mecanismos de pesquisa, como Yahoo e Google , usam processos automatizados para detectar soft 404s. Soft 404s podem ocorrer como resultado de erros de configuração ao usar determinado software de servidor HTTP, por exemplo, com o software Apache , quando um Documento de Erro 404 (especificado em um arquivo .htaccess ) é especificado como um caminho absoluto (por exemplo, http: // exemplo .com / error.html) em vez de um caminho relativo (/error.html). Isso também pode ser feito propositalmente para forçar alguns navegadores (como o Internet Explorer ) a exibir uma mensagem de erro 404 personalizada em vez de substituir o que é servido por uma mensagem de erro "amigável" específica do navegador (no Internet Explorer, esse comportamento é acionado quando um 404 é servido e o HTML recebido é menor do que um determinado comprimento e pode ser desativado manualmente pelo usuário).

Também existem erros "soft 3XX" em que o conteúdo é retornado com um status 200, mas vem de uma página redirecionada, como quando as páginas ausentes são redirecionadas para a raiz / página inicial do domínio.

Servidores proxy

Alguns servidores proxy geram um erro 404 quando um código de erro de intervalo 500 seria mais correto. Se o servidor proxy não puder atender a uma solicitação de página devido a um problema com o host remoto (como falhas de resolução de nome de host ou conexões TCP recusadas), isso deve ser descrito como um 5xx Erro Interno do Servidor, mas pode entregar um 404 em vez disso . Isso pode confundir programas que esperam e agem de acordo com respostas específicas, pois eles não podem mais distinguir facilmente entre um servidor da Web ausente e uma página da Web ausente em um servidor da Web que está presente.

404s intencionais

Em julho de 2004, o provedor de telecomunicações do Reino Unido BT Group implantou o sistema de bloqueio de conteúdo Cleanfeed , que retorna um erro 404 para qualquer solicitação de conteúdo identificado como potencialmente ilegal pela Internet Watch Foundation . Outros ISPs retornam um erro HTTP 403 "proibido" nas mesmas circunstâncias. A prática de empregar erros 404 falsos como forma de ocultar a censura também foi relatada na Tailândia e na Tunísia . Na Tunísia, onde a censura era severa antes da revolução de 2011 , as pessoas tomaram conhecimento da natureza dos falsos erros 404 e criaram um personagem imaginário chamado " Ammar 404 ", que representa "o censor invisível".

Códigos de erro de substatus do Microsoft Internet Server 404

O software de servidor web desenvolvido pela Microsoft, Internet Information Services (IIS) da Microsoft , retorna um conjunto de códigos de substatus com suas respostas 404. Os códigos de substatus assumem a forma de números decimais anexados ao código de status 404. Os códigos de substatus não são oficialmente reconhecidos pela IANA e não são retornados por servidores que não sejam da Microsoft.

Códigos de Substatus

Os servidores IIS 7.0, IIS 7.5 e IIS 8.0 da Microsoft definem os seguintes códigos de substatus HTTP para indicar uma causa mais específica de um erro 404:

  • 404.0 - Não encontrado.
  • 404.1 - Site não encontrado.
  • 404.2 - Restrição ISAPI ou CGI .
  • 404.3 - Restrição de tipo MIME .
  • 404.4 - Nenhum manipulador configurado.
  • 404.5 - Negado por solicitação de configuração de filtragem.
  • 404.6 - Verbo negado.
  • 404.7 - Extensão de arquivo negada.
  • 404.8 - Namespace oculto.
  • 404.9 - Atributo de arquivo oculto.
  • 404.10 - Cabeçalho da solicitação muito longo.
  • 404.11 - A solicitação contém sequência de escape dupla.
  • 404.12 - A solicitação contém caracteres de bit alto.
  • 404.13 - Comprimento do conteúdo muito grande.
  • 404.14 - Solicitar URL muito longo.
  • 404.15 - String de consulta muito longa.
  • 404.16 - Solicitação DAV enviada para o manipulador de arquivo estático.
  • 404.17 - Conteúdo dinâmico mapeado para o manipulador de arquivo estático por meio de um mapeamento MIME curinga.
  • 404.18 - Sequência de string de consulta negada.
  • 404.19 - Negado pela regra de filtragem.
  • 404.20 - Muitos segmentos de URL.

Páginas de erro personalizadas

A mensagem 404 da Wikimedia

Os servidores da Web geralmente podem ser configurados para exibir uma página de erro 404 personalizada, incluindo uma descrição mais natural, a marca do site pai e, às vezes, um mapa do site, um formulário de pesquisa ou widget de página 404. A frase de nível de protocolo, que fica oculta do usuário, raramente é personalizada. O Internet Explorer , no entanto, não exibirá páginas personalizadas, a menos que tenham mais de 512 bytes, optando por exibir uma página de erro "amigável". O Google Chrome incluiu uma funcionalidade semelhante, onde o 404 é substituído por sugestões alternativas geradas por algoritmos do Google, se a página tiver menos de 512 bytes. Outro problema é que, se a página não fornecer um favicon e existir uma página 404 personalizada separada, tráfego extra e tempos de carregamento mais longos serão gerados em cada visualização de página.

Muitas organizações usam páginas de erro 404 como uma oportunidade para injetar humor no que poderia ser um site sério. Por exemplo, Metro UK mostra um urso polar em um skate, e a agência de desenvolvimento da web Left Logic tem um programa de desenho simples. Durante a campanha das eleições gerais de 2015 no Reino Unido, todos os principais partidos políticos usaram suas páginas 404 para mirar nos oponentes políticos ou mostrar políticas relevantes a apoiadores em potencial. Na Europa, o projeto NotFound , criado por várias organizações europeias, incluindo Missing Children Europe e Child Focus , incentiva os operadores do site a adicionar um trecho de código para servir páginas de erro 404 personalizadas que fornecem dados sobre crianças desaparecidas .

Embora muitos sites enviem informações adicionais em uma mensagem de erro 404, como um link para a página inicial de um site ou uma caixa de pesquisa, alguns também se esforçam para encontrar a página correta que o usuário deseja. As extensões estão disponíveis para alguns sistemas de gerenciamento de conteúdo (CMSs) para fazer isso.

Rastreando erros 404

Existem várias ferramentas que rastreiam um site para encontrar páginas que retornam códigos de status 404. Essas ferramentas podem ser úteis para localizar links existentes em um site específico. A limitação dessas ferramentas é que elas só encontram links em um site específico e ignoram 404s resultantes de links em outros sites. Como resultado, essas ferramentas perdem 83% dos 404s em sites. Uma maneira de contornar isso é encontrar erros 404 analisando links externos.

Uma das maneiras mais eficazes de descobrir erros 404 é usando o Google Search Console , Google Analytics ou software de rastreamento.

Outro método comum é rastrear o tráfego para páginas 404 usando a análise do arquivo de log. Isso pode ser útil para entender mais sobre o que os usuários 404s alcançaram no site. Outro método de rastreamento de tráfego para páginas 404 é usar ferramentas de rastreamento de tráfego baseadas em JavaScript.

Veja também

Referências

links externos