Visão de máquina - Machine vision

O antigo sistema de visão de máquina Automatix (agora parte da Omron ) Autovision II de 1983 sendo demonstrado em uma feira comercial. A câmera no tripé está apontando para uma mesa de luz para produzir uma imagem retroiluminada mostrada na tela, que é então submetida à extração de blob .

Visão de máquina ( MV ) é a tecnologia e os métodos usados ​​para fornecer inspeção e análise automáticas baseadas em imagens para aplicações como inspeção automática, controle de processo e orientação de robô, geralmente na indústria. Visão de máquina refere-se a muitas tecnologias, produtos de software e hardware, sistemas integrados, ações, métodos e conhecimentos. A visão de máquina como uma disciplina da engenharia de sistemas pode ser considerada distinta da visão por computador , uma forma de ciência da computação . Ele tenta integrar tecnologias existentes de novas maneiras e aplicá-las para resolver problemas do mundo real. O termo é o predominante para essas funções em ambientes de automação industrial, mas também é usado para essas funções em outros ambientes, como segurança e orientação de veículos.

O processo geral de visão de máquina inclui o planejamento dos detalhes dos requisitos e do projeto e, em seguida, a criação de uma solução. Durante o tempo de execução, o processo começa com a geração de imagens, seguida pela análise automatizada da imagem e extração das informações necessárias.

Definição

As definições do termo "Visão de máquina" variam, mas todas incluem a tecnologia e os métodos usados ​​para extrair informações de uma imagem de forma automatizada, em oposição ao processamento de imagem , em que a saída é outra imagem. A informação extraída pode ser um sinal simples de parte boa / parte ruim, ou mais um conjunto complexo de dados, como a identidade, posição e orientação de cada objeto em uma imagem. As informações podem ser usadas para aplicações como inspeção automática e orientação de robôs e processos na indústria, para monitoramento de segurança e orientação de veículos. Este campo abrange um grande número de tecnologias, produtos de software e hardware, sistemas integrados, ações, métodos e conhecimentos. Visão de máquina é praticamente o único termo usado para essas funções em aplicações de automação industrial; o termo é menos universal para essas funções em outros ambientes, como segurança e orientação de veículos. A visão de máquina como uma disciplina da engenharia de sistemas pode ser considerada distinta da visão por computador , uma forma de ciência da computação básica ; a visão de máquina tenta integrar tecnologias existentes de novas maneiras e aplicá-las para resolver problemas do mundo real de uma forma que atenda aos requisitos de automação industrial e áreas de aplicação semelhantes. O termo também é usado em um sentido mais amplo por feiras e grupos comerciais, como a Automated Imaging Association e a European Machine Vision Association. Essa definição mais ampla também abrange produtos e aplicativos mais frequentemente associados ao processamento de imagens. Os principais usos da visão de máquina são inspeção automática e robô industrial / orientação de processo. Veja o glossário de visão de máquina .

Inspeção e classificação automática baseada em imagens

Os principais usos da visão de máquina são a inspeção e classificação automáticas com base em imagens e a orientação do robô .; nesta seção, o primeiro é abreviado como "inspeção automática". O processo geral inclui o planejamento dos detalhes dos requisitos e do projeto e, em seguida, a criação de uma solução. Esta seção descreve o processo técnico que ocorre durante a operação da solução.

Métodos e sequência de operação

A primeira etapa na sequência de operação de inspeção automática é a aquisição de uma imagem , normalmente usando câmeras, lentes e iluminação projetada para fornecer a diferenciação necessária para o processamento subsequente. Os pacotes de software MV e programas desenvolvidos neles, então, empregam várias técnicas de processamento de imagem digital para extrair as informações necessárias e frequentemente tomam decisões (como aprovação / reprovação) com base nas informações extraídas.

Equipamento

Os componentes de um sistema de inspeção automática geralmente incluem iluminação, uma câmera ou outro gerador de imagens, um processador, software e dispositivos de saída.

Imaging

O dispositivo de imagem (por exemplo, câmera) pode ser separado da unidade principal de processamento de imagem ou combinado com ela, caso em que a combinação é geralmente chamada de câmera inteligente ou sensor inteligente. A inclusão da função de processamento total no mesmo gabinete da câmera é freqüentemente chamada de processamento integrado. Quando separada, a conexão pode ser feita a um hardware intermediário especializado, um dispositivo de processamento personalizado ou um capturador de quadros em um computador usando uma interface analógica ou digital padronizada ( Camera Link , CoaXPress ). As implementações de MV também usam câmeras digitais capazes de conexões diretas (sem um framegrabber) a um computador por meio de interfaces FireWire , USB ou Gigabit Ethernet .

Embora a imagem convencional (luz visível 2D) seja mais comumente usada em MV, as alternativas incluem imagens multiespectrais , imagens hiperespectrais , imagens de várias bandas infravermelhas, imagens de varredura em linha, imagens 3D de superfícies e imagens de raios-X. As principais diferenciações dentro da imagem de luz visível 2D MV são monocromáticas versus coloridas, taxa de quadros , resolução e se o processo de imagem é simultâneo ou não em toda a imagem, tornando-a adequada para processos em movimento.

Embora a grande maioria das aplicações de visão de máquina sejam resolvidas usando imagens bidimensionais, as aplicações de visão de máquina que utilizam imagens 3D são um nicho em crescimento na indústria. O método mais comumente usado para imagens 3D é a triangulação baseada em varredura, que utiliza o movimento do produto ou imagem durante o processo de geração de imagens. Um laser é projetado nas superfícies de um objeto. Na visão mecânica, isso é realizado com um movimento de varredura, seja movendo a peça de trabalho ou movendo a câmera e o sistema de imagem a laser. A linha é vista por uma câmera de um ângulo diferente; o desvio da linha representa variações de forma. Linhas de múltiplas varreduras são montadas em um mapa de profundidade ou nuvem de pontos. A visão estereoscópica é usada em casos especiais envolvendo recursos exclusivos presentes em ambas as visualizações de um par de câmeras. Outros métodos 3D usados ​​para visão de máquina são o tempo de vôo e os baseados em grade. Um método são sistemas baseados em matriz de grade usando sistema de luz estruturada pseudo-aleatória, conforme empregado pelo sistema Microsoft Kinect por volta de 2012.

Processamento de imagem

Depois que uma imagem é adquirida, ela é processada. As funções de processamento central são geralmente feitas por uma CPU , uma GPU , um FPGA ou uma combinação destes. O treinamento de aprendizado profundo e a inferência impõem requisitos de desempenho de processamento mais elevados. Vários estágios de processamento são geralmente usados ​​em uma sequência que termina como um resultado desejado. Uma sequência típica pode começar com ferramentas como filtros que modificam a imagem, seguido pela extração de objetos, em seguida, extração (por exemplo, medições, leitura de códigos) de dados desses objetos, seguido pela comunicação desses dados, ou comparando-os com os valores alvo para criar e comunicar resultados de "aprovação / reprovação". Os métodos de processamento de imagem de visão de máquina incluem;

  • Costura / Registro : Combinação de imagens 2D ou 3D adjacentes.
  • Filtragem (por exemplo, filtragem morfológica )
  • Limiar: a limitação começa com a configuração ou determinação de um valor de cinza que será útil para as etapas a seguir. O valor é então usado para separar partes da imagem e, às vezes, para transformar cada parte da imagem em preto e branco simplesmente com base no fato de estar abaixo ou acima do valor da escala de cinza.
  • Contagem de pixels: conta o número de pixels claros ou escuros
  • Segmentação : particionar uma imagem digital em vários segmentos para simplificar e / ou alterar a representação de uma imagem em algo que seja mais significativo e fácil de analisar.
  • Detecção de bordas: encontrando bordas de objetos
  • Análise de cores: identifique peças, produtos e itens usando cores, avalie a qualidade da cor e isole recursos usando cores.
  • Detecção e extração de blob : inspecionando uma imagem para blobs discretos de pixels conectados (por exemplo, um buraco negro em um objeto cinza) como pontos de referência de imagem.
  • Rede neural / aprendizado profundo / processamento de aprendizado de máquina : tomada de decisão multivariada ponderada e de autotreinamento Por volta de 2019, há uma grande expansão disso, usando aprendizado profundo e aprendizado de máquina para expandir significativamente os recursos de visão de máquina.
  • Reconhecimento de padrões, incluindo correspondência de modelos . Encontrar, combinar e / ou contar padrões específicos. Isso pode incluir a localização de um objeto que pode ser girado, parcialmente oculto por outro objeto ou de tamanho variável.
  • Leitura de código de barras , matriz de dados e " código de barras 2D "
  • Reconhecimento óptico de caracteres : leitura automática de texto, como números de série
  • Medição / Metrologia : medição das dimensões do objeto (por exemplo, em pixels , polegadas ou milímetros )
  • Comparação com os valores de destino para determinar um resultado "passa ou falha" ou "passa / não passa". Por exemplo, com a verificação do código ou do código de barras, o valor lido é comparado ao valor alvo armazenado. Para aferição, uma medição é comparada com o valor e tolerâncias adequados. Para verificação de códigos alfanuméricos, o valor do OCR é comparado ao valor adequado ou de destino. Para inspeção de manchas, o tamanho medido das manchas pode ser comparado aos máximos permitidos pelos padrões de qualidade.

Saídas

Uma saída comum dos sistemas de inspeção automática são as decisões de aprovação / reprovação. Essas decisões podem, por sua vez, acionar mecanismos que rejeitam itens com falha ou soam um alarme. Outras saídas comuns incluem a posição do objeto e informações de orientação para sistemas de orientação de robôs. Além disso, os tipos de saída incluem dados de medição numérica, dados lidos de códigos e caracteres, contagens e classificação de objetos, exibições do processo ou resultados, imagens armazenadas, alarmes de sistemas automáticos de monitoramento de espaço MV e sinais de controle de processo . Isso também inclui interfaces de usuário, interfaces para a integração de sistemas multicomponentes e intercâmbio automatizado de dados.

Orientação do robô com base em imagens

A visão mecânica geralmente fornece informações de localização e orientação a um robô para permitir que ele segure o produto de maneira adequada. Esse recurso também é usado para guiar o movimento que é mais simples do que robôs, como um controlador de movimento de 1 ou 2 eixos. O processo geral inclui o planejamento dos detalhes dos requisitos e do projeto e, em seguida, a criação de uma solução. Esta seção descreve o processo técnico que ocorre durante a operação da solução. Muitas das etapas do processo são iguais às da inspeção automática, exceto com o foco em fornecer informações de posição e orientação como resultado.

Mercado

Recentemente, em 2006, um consultor do setor relatou que o MV representava um mercado de US $ 1,5 bilhão na América do Norte. No entanto, o editor-chefe de uma revista especializada MV afirmou que "a visão de máquina não é uma indústria per se", mas sim "a integração de tecnologias e produtos que fornecem serviços ou aplicações que beneficiam verdadeiras indústrias, como automotiva ou de fabricação de bens de consumo , agricultura e defesa. "

Veja também

Referências