Glossário de visão de máquina - Glossary of machine vision

A seguir estão as definições comuns relacionadas ao campo de visão de máquina .

Campos gerais relacionados

0-9

  • 1394 . FireWire é a marca da Apple Inc. para a interface IEEE 1394. Também é conhecido como i.Link ( nome da Sony ) ou IEEE 1394 (embora o padrão 1394 também defina uma interface de backplane). É um padrão de interface de barramento serial para computador pessoal (e áudio / vídeo digital), oferecendo comunicações de alta velocidade e serviços de dados em tempo real isócrono.
  • 1D . Unidimensional.
  • Gráficos de computador 2D . A geração de imagens digitais baseada em computador - principalmente a partir de modelos bidimensionais (como modelos geométricos 2D, texto e imagens digitais) e por técnicas específicas para eles.
Exemplo de renderização 3D
  • Gráficos de computador 3D . Os gráficos de computador 3D são diferentes dos gráficos de computador 2D em que uma representação tridimensional de dados geométricos é armazenada no computador para fins de cálculos e renderização de imagens 2D. Essas imagens podem ser para exibição posterior ou para visualização em tempo real. Apesar dessas diferenças, os gráficos de computador 3D contam com muitos dos mesmos algoritmos que os gráficos vetoriais de computador 2D no modelo de estrutura de arame e os gráficos raster de computador 2D na exibição final renderizada. No software de computação gráfica, a distinção entre 2D e 3D é ocasionalmente confusa; Os aplicativos 2D podem usar técnicas 3D para obter efeitos como iluminação e, principalmente, 3D podem usar técnicas de renderização 2D.
Scanner 3D a laser montado em um tripé
  • Scanner 3D . Este é um dispositivo que analisa um objeto ou ambiente do mundo real para coletar dados sobre sua forma e possivelmente cor. Os dados coletados podem então ser usados ​​para construir modelos digitais tridimensionais úteis para uma ampla variedade de aplicações.

UMA

  • Aberração . Opticamente, desfocar se refere a uma translação ao longo do eixo óptico para longe do plano ou superfície de melhor foco. Em geral, a desfocagem reduz a nitidez e o contraste da imagem. O que deveriam ser bordas nítidas e de alto contraste em uma cena tornam-se transições graduais.
  • Abertura . No contexto da fotografia ou visão mecânica, a abertura se refere ao diâmetro do batente de abertura de uma lente fotográfica. A parada da abertura pode ser ajustada para controlar a quantidade de luz que atinge o filme ou o sensor de imagem.
  • relação de aspecto (imagem) . A proporção da imagem é a largura exibida dividida pela altura (geralmente expressa como " x : y ").
  • Resolução angular . Descreve o poder de resolução de qualquer dispositivo de formação de imagem, como um ótico ou radiotelescópio, um microscópio, uma câmera ou um olho.
  • Inspeção óptica automatizada .

B

" Wikipedia " codificado no Código 128-B
  • Código de barras . Um código de barras (também código de barras) é uma representação legível por máquina de informações em um formato visual em uma superfície.
  • Descoberta de blob . Inspecionando uma imagem para manchas discretas de pixels conectados (por exemplo, um buraco negro em um objeto cinza) como pontos de referência da imagem. Esses blobs frequentemente representam alvos ópticos para usinagem, captura robótica ou falha de fabricação.
  • Bitmap . Uma imagem gráfica raster, imagem digital ou bitmap, é um arquivo de dados ou estrutura que representa uma grade geralmente retangular de pixels, ou pontos de cor, em um monitor de computador, papel ou outro dispositivo de exibição.

C

Relação entre a visão computacional e vários outros campos
  • Câmera . Uma câmera é um dispositivo usado para tirar fotos, individualmente ou em sequência. Uma câmera que tira fotos individualmente às vezes é chamada de câmera fotográfica para diferenciá-la de uma câmera de vídeo.
  • Link da câmera . Camera Link é um protocolo de comunicação serial projetado para aplicativos de visão computacional com base na interface Channel-link da National Semiconductor . Ele foi projetado com o objetivo de padronizar produtos de vídeo científicos e industriais, incluindo câmeras, cabos e captadores de quadros. O padrão é mantido e administrado pela Automated Imaging Association , ou AIA, o grupo comercial global da indústria de visão de máquina.
  • Dispositivo com carga acoplada . Um dispositivo de carga acoplada (CCD) é um sensor para gravar imagens, consistindo em um circuito integrado contendo uma matriz de capacitores vinculados ou acoplados. Os sensores e câmeras CCD tendem a ser mais sensíveis, menos barulhentos e mais caros do que os sensores e câmeras CMOS.
O diagrama de cromaticidade do espaço de cores CIE 1931. O limite externo curvo é o locus espectral (ou monocromático), com comprimentos de onda mostrados em nanômetros. Observe que as cores representadas dependem do espaço de cores do dispositivo no qual você está visualizando a imagem, e nenhum dispositivo possui uma gama grande o suficiente para apresentar uma representação precisa da cromaticidade em cada posição.
  • Espaço de cores CIE 1931 . No estudo da percepção da cor , um dos primeiros espaços de cor matematicamente definidos foi o espaço de cor CIE XYZ (também conhecido como espaço de cor CIE 1931 ), criado pela Comissão Internacional de Iluminação (CIE) em 1931.
  • CMOS . CMOS ("see-moss") significa semicondutor de óxido de metal complementar, é uma classe principal de circuitos integrados. Os sensores de imagem CMOS para visão de máquina são mais baratos do que os sensores CCD, mas são mais barulhentos.
  • CoaXPress . CoaXPress (CXP) é um padrão de comunicação serial assimétrica de alta velocidade por cabo coaxial . CoaXPress combina dados de imagem de alta velocidade, controle de câmera de baixa velocidade e alimentação por meio de um único cabo coaxial. O padrão é mantido pela JIIA, a Japan Industrial Imaging Association.
  • Color . A percepção da frequência (ou comprimento de onda) da luz, e pode ser comparada a como o tom (ou uma nota musical) é a percepção da frequência ou comprimento de onda do som.
  • Daltonismo . Também conhecida como deficiência de visão de cores, em humanos é a incapacidade de perceber diferenças entre algumas ou todas as cores que outras pessoas podem distinguir
  • Temperatura de cor . A "luz branca" é comumente descrita por sua temperatura de cor. A temperatura de cor de uma fonte de luz incandescente tradicional é determinada comparando seu matiz com um radiador de corpo negro aquecido teórico. A temperatura de cor da lâmpada é a temperatura em kelvins na qual o radiador de corpo negro aquecido corresponde ao matiz da lâmpada.
  • Visão de cores . CV é a capacidade de um organismo ou máquina de distinguir objetos com base nos comprimentos de onda (ou frequências ) da luz que eles refletem ou emitem.
  • visão computacional . O estudo e aplicação de métodos que permitem aos computadores "compreender" o conteúdo das imagens.
  • Contraste . Na percepção visual, contraste é a diferença nas propriedades visuais que torna um objeto (ou sua representação em uma imagem) distinguível de outros objetos e do fundo.
  • C-Mount . Adaptador padronizado para lentes ópticas em câmeras CCD. As lentes C-Mount têm uma distância focal posterior de 17,5 mm vs. 12,5 mm para lentes "CS-mount". Uma lente C-Mount pode ser usada em uma câmera CS-Mount através do uso de um adaptador de extensão de 5 mm. A montagem C é uma rosca de montagem de 1 "de diâmetro, 32 roscas por polegada (1" -32UN-2A.)
  • CS-Mount . Igual ao C-Mount, mas o ponto focal é 5 mm mais curto. Uma lente CS-Mount não funciona em uma câmera C-Mount. A montagem CS é uma rosca de montagem de 1 "de diâmetro, 32 roscas por polegada.

D

" Wikipedia, a enciclopédia livre " codificada no código de barras DataMatrix 2D
  • Matriz de dados . Um código de barras bidimensional .
  • Profundidade de campo . Em ótica, principalmente fotografia e visão de máquina, a profundidade de campo (DOF) é a distância na frente e atrás do assunto que parece estar em foco.
  • Percepção de profundidade . DP é a capacidade visual de perceber o mundo em três dimensões . É uma característica comum a muitos animais superiores . A percepção de profundidade permite que o observador avalie com precisão a distância até um objeto.
  • Diafragma . Em óptica, um diafragma é uma estrutura opaca fina com uma abertura (abertura) em seu centro. O papel do diafragma é interromper a passagem da luz, exceto para a luz que passa pela abertura.

E

  • Detecção de borda . ED marca os pontos em uma imagem digital em que a intensidade luminosa muda nitidamente. Ele também marca os pontos de mudança de intensidade luminosa de um objeto ou silhueta de um táxon espacial.
  • Interferência eletromagnética . A interferência de radiofrequência (RFI) é a radiação eletromagnética emitida por circuitos elétricos que transportam sinais que mudam rapidamente, como um subproduto de sua operação normal, e que faz com que sinais indesejados (interferência ou ruído) sejam induzidos em outros circuitos.

F

  • FireWire . FireWire (também conhecido como i. Link ou IEEE 1394) é um padrão de interface de barramento serial para computador pessoal (e áudio / vídeo digital), oferecendo comunicações de alta velocidade. Muitas vezes, é usado como uma interface para câmeras industriais.
  • Ruído de padrão fixo .
  • Correção de campo plano .
  • Capturador de quadros . Um dispositivo eletrônico que captura quadros estáticos digitais individuais de um sinal de vídeo analógico ou fluxo de vídeo digital.
  • Técnica de projeção de franja . Técnica de aquisição de dados 3D empregando projetor exibindo padrão de franja em uma superfície de peça medida e uma ou mais câmeras gravando imagem (ns).
  • Campo de visão . O campo de visão (FOV) é a parte que pode ser vista pelo sistema de visão de máquina em um momento. O campo de visão depende da lente do sistema e da distância de trabalho entre o objeto e a câmera.
  • Foco . Diz-se que uma imagem, ou ponto ou região de imagem, está em foco se a luz dos pontos do objeto convergir tão bem quanto possível na imagem; inversamente, está fora de foco se a luz não estiver bem convergida. A fronteira entre essas condições às vezes é definida por meio de um círculo de critério de confusão.

G

Uma gama típica de CRT .
A forma de ferradura acinzentada é toda a gama de cromaticidades possíveis . O triângulo colorido é a gama disponível para um monitor de computador típico; não cobre todo o espaço.
  • Gamut . Na reprodução de cores, incluindo computação gráfica e fotografia , a gama , ou gama de cores / ɡ æ m ə t / , é um certo subconjunto completa de cores .
  • Tons de cinza . Uma imagem digital em tons de cinza é uma imagem em que o valor de cada pixel é uma única amostra. As imagens exibidas desse tipo são normalmente compostas de tons de cinza, variando de preto na intensidade mais fraca a branco na mais forte, embora, em princípio, as amostras pudessem ser exibidas como tons de qualquer cor, ou mesmo codificados com várias cores para intensidades diferentes.
  • GUI . Uma interface gráfica de usuário (ou GUI, às vezes pronunciada "pegajosa") é um método de interação com um computador por meio de uma metáfora de manipulação direta de imagens gráficas e widgets além de texto.

H

Uma fotografia com seu histograma de luminosidade abaixo
Espaço de cores HSV como uma roda de cores
  • Espaço de cores HSV . O modelo HSV (matiz, saturação, valor), também chamado de HSB (matiz, saturação, brilho), define um espaço de cores em termos de três componentes constituintes:
    • Matiz, o tipo de cor (como vermelho, azul ou amarelo)
    • Saturação, a "vibração" da cor e pureza colorimétrica
    • Valor, o brilho da cor

eu

  • Formatos de arquivo de imagem . Os formatos de arquivo de imagem fornecem um método padronizado de organização e armazenamento de dados de imagem. Este artigo trata dos formatos de imagem digital usados ​​para armazenar informações fotográficas e outras informações de imagem. Os arquivos de imagem são compostos de dados de pixel ou vetor (geométrico), que são rasterizados em pixels no processo de exibição, com algumas exceções na exibição de gráfico vetorial. Os pixels que compõem uma imagem têm a forma de uma grade de colunas e linhas. Cada um dos pixels em uma imagem armazena números digitais que representam o brilho e a cor.
  • Segmentação de imagem .
Imagem de um cachorro tirada em luz infravermelha média ("térmica") (cor falsa)

J

K

  • Fator Kell . É um parâmetro usado para determinar a resolução efetiva de um dispositivo de exibição discreto.

eu

  • Laser . Na física, o laser é um dispositivo que emite luz por meio de um mecanismo específico para o qual o termo laser é uma sigla: amplificação de luz por emissão estimulada de radiação.
  • Lens . Uma lente é um dispositivo que faz com que a luz convirja e se concentre ou divirta, geralmente formada por um pedaço de vidro moldado. As lentes podem ser combinadas para formar sistemas óticos mais complexos, como lentes normais ou teleobjetivas .
  • Controlador de lente . Um controlador de lente é um dispositivo usado para controlar uma lente motorizada (ZFI). Os controladores de lente podem ser internos a uma câmera, um conjunto de interruptores usados ​​manualmente ou um dispositivo sofisticado que permite o controle de uma lente com um computador.
  • Iluminação . Iluminação refere-se a fontes de luz artificial, como lâmpadas, ou iluminação natural.

M

  • Metrologia . Metrologia é a ciência da medição. Existem muitas aplicações para visão de máquina em metrologia.
  • visão de máquina . MV é a aplicação da visão computacional à indústria e manufatura.
  • Percepção de movimento . MP é o processo de inferir a velocidade e a direção de objetos e superfícies que se movem em uma cena visual com alguma entrada visual.

N

Visão simplificada de uma rede neural artificial
  • Rede neural . Um NN é um grupo interconectado de neurônios artificiais que usa um modelo matemático ou computacional para processamento de informações baseado em uma abordagem conexionista para computação. Na maioria dos casos, uma RNA é um sistema adaptativo que muda sua estrutura com base em informações externas ou internas que fluem pela rede.
  • Lente normal . Na visão mecânica, uma lente normal ou entrocêntrica é uma lente que gera imagens que geralmente têm uma perspectiva "natural" em comparação com lentes com distâncias focais maiores ou menores. As lentes de comprimento focal mais curto são chamadas de lentes grande-angulares, enquanto as lentes de maior comprimento focal são chamadas de lentes telefoto.

O

  • Reconhecimento óptico de caracteres . Normalmente abreviado para OCR, envolve software de computador projetado para traduzir imagens de texto datilografado (geralmente capturado por um scanner) em texto editável por máquina ou para traduzir imagens de caracteres em um esquema de codificação padrão que os representa em (ASCII ou Unicode).
  • Resolução óptica . Descreve a capacidade de um sistema de distinguir, detectar e / ou registrar detalhes físicos por meios eletromagnéticos. O sistema pode ser de imagem (por exemplo, uma câmera) ou não de imagem (por exemplo, um detector de laser de célula quádrupla).
  • Função de transferência óptica .

P

Lente principal com abertura máxima de f / 2
  • Reconhecimento de padrões . Este é um campo dentro da área de aprendizado de máquina. Como alternativa, pode ser definido como o ato de obter dados brutos e realizar uma ação com base na categoria dos dados. É uma coleção de métodos de aprendizagem supervisionada.
  • Pixel . Um pixel é um dos muitos pontos minúsculos que constituem a representação de uma imagem na memória ou na tela de um computador.
  • Pixelation . Em computação gráfica, a pixelização é um efeito causado pela exibição de um bitmap ou de uma seção de um bitmap em um tamanho tão grande que pixels individuais, pequenos elementos de exibição quadrados de uma única cor que compõem o bitmap, ficam visíveis.
  • Lente primária . Montagem mecânica de lentes cujo comprimento focal é fixo, ao contrário de uma lente zoom, que tem um comprimento focal variável.

Q

,

onde está a frequência ressonante, é a energia armazenada na cavidade e é a potência dissipada. O Q óptico é igual à razão entre a frequência de ressonância e a largura de banda da ressonância da cavidade. O tempo de vida médio de um fóton ressonante na cavidade é proporcional ao Q da cavidade . Se o fator Q da cavidade de um laser for alterado abruptamente de um valor baixo para um alto, o laser emitirá um pulso de luz que é muito mais intenso do que a saída contínua normal do laser. Esta técnica é conhecida como Q-switching .

R

  • Região de interesse . Uma região de interesse, geralmente abreviada como ROI, é um subconjunto selecionado de amostras em um conjunto de dados identificado para uma finalidade específica.
Uma representação da mistura de cores aditivas RGB.
  • RGB . O modelo de cores RGB utiliza o modelo aditivo no qual as luzes vermelha, verde e azul são combinadas de várias maneiras para criar outras cores.
  • ROI . Consulte Região de interesse.
  • Primeiro plano, figura e objetos . Veja também táxon espacial.

S

  • S-video . Vídeo separado , abreviado S-Video e também conhecido como Y / C (ou erroneamente , S-VHS e "super vídeo") é um sinal de vídeo analógico que transporta os dados de vídeo como dois sinais separados (brilho e cor), ao contrário do vídeo composto que transporta todo o conjunto de sinais em uma linha de sinal. S-Video, como mais comumente implementado, transporta vídeo de alta largura de banda com resolução 480i ou 576i , ou seja, vídeo de definição padrão . Ele não transporta áudio no mesmo cabo.
  • Princípio de Scheimpflug .
  • Obturador . Um obturador é um dispositivo que permite a passagem de luz por um determinado período de tempo, com a finalidade de expor o sensor de imagem à quantidade certa de luz para criar uma imagem permanente de uma vista.
  • Velocidade do obturador . Na visão mecânica, a velocidade do obturador é o tempo durante o qual o obturador é mantido aberto durante a obtenção de uma imagem para permitir que a luz alcance o sensor de imagem. Em combinação com a variação da abertura da lente, isso regula a quantidade de luz que o sensor de imagem em uma câmera digital receberá.
  • Câmera inteligente . Uma câmera inteligente é um sistema de visão de máquina integrado que, além de um circuito de captura de imagens, inclui um processador, que pode extrair informações das imagens sem a necessidade de uma unidade de processamento externa, e dispositivos de interface usados ​​para disponibilizar os resultados para outros dispositivos.
  • Espacial-Taxon . Os táxons espaciais são grânulos de informação, compostos de regiões de pixel não mutuamente exclusivas, dentro da arquitetura da cena. Eles são semelhantes à designação psicológica Gestalt de figura-fundo, mas são estendidos para incluir o primeiro plano, grupos de objetos, objetos e partes salientes do objeto.
  • Scanner 3D de luz estruturada . O processo de projetar um padrão conhecido de iluminação (geralmente grades ou barras horizontais) em uma cena. A maneira como esses padrões parecem deformar-se ao atingir as superfícies permite que os sistemas de visão calculem a profundidade e as informações da superfície dos objetos na cena.
  • SVGA . Super Video Graphics Array, quase sempre abreviado para Super VGA ou apenas SVGA, é um termo amplo que cobre uma ampla gama de padrões de exibição de computador.

T

  • Lente telecêntrica . Lente composta com uma propriedade incomum no que diz respeito à geometria dos raios formadores de imagem. Em sistemas de visão de máquina, lentes telecêntricas são geralmente empregadas para obter invariância dimensional e geométrica de imagens dentro de uma faixa de distâncias diferentes da lente e em todo o campo de visão.
  • Lente telefoto . Lente cuja distância focal é significativamente maior do que a distância focal de uma lente normal.
  • Termografia . Imagem térmica, um tipo de imagem infravermelha .
  • TIFF . Tagged Image File Format (TIFF abreviado) é um formato de arquivo para principalmente armazenar imagens, incluindo fotografias e arte de linha.

você

  • USB . O Barramento Serial Universal (USB) fornece um padrão de barramento serial para conectar dispositivos, geralmente para computadores como PCs, mas também está se tornando comum em câmeras.

V

  • VESA . A Video Electronics Standards Association (VESA) é um organismo internacional fundado no final dos anos 1980 pela NEC Home Electronics e oito outros fabricantes de adaptadores de vídeo. O objetivo inicial era produzir um padrão para monitores de vídeo com resolução SVGA de 800 × 600 . Desde então VESA emitiu uma série de normas, a maioria relacionada com a função de vídeo periféricos na IBM PC compatíveis computadores .
  • VGA . Video Graphics Array (VGA) é um padrão de exibição de computador comercializado pela primeira vez em 1987 pela IBM .
  • Unidade de processamento de visão . Uma classe de microprocessadores que visa acelerar as tarefas de visão de máquina.

C

Lente grande angular - 17-40 f / 4 L
  • Lente grande angular . Em fotografia e cinematografia, uma lente grande angular é uma lente cujo comprimento focal é menor do que o comprimento focal de uma lente normal.

X

Uma foto de raio-X (radiografia), tirada por Wilhelm Röntgen , da mão de sua esposa.
  • Raios-x . Uma forma de radiação eletromagnética com comprimento de onda na faixa de 10 a 0,01 nanômetros, correspondendo a frequências na faixa de 30 a 3000 PHz (10 15 hertz). Os raios X são usados ​​principalmente para diagnóstico por imagem médica e industrial, bem como cristalografia. Os raios X são uma forma de radiação ionizante e, como tal, podem ser perigosos.

Y

  • Y-cabo . Um cabo Y ou cabo Y é um cabo elétrico contendo três extremidades, uma das quais é uma extremidade comum que, por sua vez, leva a uma divisão nas duas extremidades restantes, semelhante à letra " Y ". Os cabos Y são normalmente, mas não necessariamente, curtos (menos de 12 polegadas) e, muitas vezes, as extremidades se conectam a outros cabos. Os usos podem ser tão simples como dividir um canal de áudio ou vídeo em dois, até usos mais complexos, como a emenda de sinais de um conector de computador de alta densidade para seu periférico apropriado .

Z

Uma lente de zoom de 70-200 mm
  • Lente de zoom . Um conjunto mecânico de lentes cujo comprimento focal pode ser alterado, ao contrário de uma lente principal, que tem um comprimento focal fixo. Veja uma animação do princípio de zoom abaixo.
Princípio de zoom

Veja também