Codificação neural - Neural coding

A codificação neural (ou representação neural ) é um campo da neurociência preocupado em caracterizar a relação hipotética entre o estímulo e as respostas neuronais do indivíduo ou conjunto e a relação entre a atividade elétrica dos neurônios no conjunto. Com base na teoria de que as informações sensoriais e outras são representadas no cérebro por redes de neurônios , acredita-se que os neurônios podem codificar informações digitais e analógicas .

Visão geral

Os neurônios são notáveis ​​entre as células do corpo em sua capacidade de propagar sinais rapidamente por grandes distâncias. Eles fazem isso gerando pulsos elétricos característicos chamados potenciais de ação : picos de tensão que podem viajar pelos axônios. Os neurônios sensoriais alteram suas atividades disparando sequências de potenciais de ação em vários padrões temporais, com a presença de estímulos sensoriais externos, como luz , som , paladar , olfato e tato . Sabe-se que as informações sobre o estímulo são codificadas nesse padrão de potenciais de ação e transmitidas para dentro e ao redor do cérebro, mas esse não é o único método. Neurônios especializados, como os da retina, podem comunicar mais informações por meio de potenciais graduados . Isso difere dos potenciais de ação porque as informações sobre a força de um estímulo se correlacionam diretamente com a força da saída dos neurônios. O sinal decai muito mais rápido para potenciais graduados, necessitando de curtas distâncias entre neurônios e alta densidade neuronal. A vantagem dos potenciais graduados são as taxas de informação mais altas, capazes de codificar mais estados (ou seja, maior fidelidade) do que os neurônios de spiking.

Embora os potenciais de ação possam variar um pouco em duração, amplitude e forma, eles são tipicamente tratados como eventos estereotipados idênticos em estudos de codificação neural. Se a breve duração de um potencial de ação (cerca de 1 ms) for ignorada, uma sequência de potencial de ação, ou trem de pico, pode ser caracterizada simplesmente por uma série de eventos pontuais tudo ou nada no tempo. Os comprimentos dos intervalos entre picos ( ISIs ) entre dois picos sucessivos em um trem de picos variam, aparentemente de forma aleatória. O estudo da codificação neural envolve medir e caracterizar como os atributos do estímulo, como intensidade de luz ou som, ou ações motoras, como a direção de um movimento do braço, são representados por potenciais de ação neuronal ou picos. A fim de descrever e analisar o disparo neuronal, métodos estatísticos e métodos da teoria da probabilidade e processos de pontos estocásticos têm sido amplamente aplicados.

Com o desenvolvimento de tecnologias de gravação e decodificação neurais em grande escala, os pesquisadores começaram a decifrar o código neural e já forneceram o primeiro vislumbre do código neural em tempo real conforme a memória é formada e recuperada no hipocampo, uma região do cérebro conhecida por ser central para a formação da memória. Os neurocientistas iniciaram vários projetos de decodificação do cérebro em larga escala.

Codificação e decodificação

A ligação entre o estímulo e a resposta pode ser estudada de dois pontos de vista opostos. A codificação neural se refere ao mapa do estímulo à resposta. O foco principal é entender como os neurônios respondem a uma ampla variedade de estímulos e construir modelos que tentam prever respostas a outros estímulos. A decodificação neural se refere ao mapa reverso, da resposta ao estímulo, e o desafio é reconstruir um estímulo, ou certos aspectos desse estímulo, a partir das sequências de picos que ele evoca.

Esquemas de codificação hipotéticos

Uma sequência, ou 'trem', de picos pode conter informações com base em diferentes esquemas de codificação. Em neurônios motores, por exemplo, a força com que um músculo inervado é contraído depende unicamente da 'taxa de disparo', o número médio de picos por unidade de tempo (um 'código de taxa'). Na outra extremidade, um ' código temporal ' complexo é baseado no tempo preciso de picos únicos. Eles podem ser bloqueados por um estímulo externo, como no sistema visual e auditivo, ou ser gerados intrinsecamente pelo circuito neural.

Se os neurônios usam codificação de taxa ou codificação temporal é um tópico de intenso debate na comunidade neurocientífica, embora não haja uma definição clara do que esses termos significam.

Taxa de codificação

O modelo de codificação de taxa de comunicação de disparo neuronal afirma que, conforme a intensidade de um estímulo aumenta, a frequência ou taxa de potenciais de ação , ou "disparo de pico", aumenta. A codificação de taxa às vezes é chamada de codificação de frequência.

A codificação de taxa é um esquema de codificação tradicional, supondo que a maioria, senão todas, as informações sobre o estímulo estão contidas na taxa de disparo do neurônio. Como a sequência de potenciais de ação gerados por um determinado estímulo varia de tentativa para tentativa, as respostas neuronais são tipicamente tratadas estatisticamente ou probabilisticamente. Eles podem ser caracterizados por taxas de disparo, em vez de sequências de pico específicas. Na maioria dos sistemas sensoriais, a taxa de disparo aumenta, geralmente de forma não linear, com o aumento da intensidade do estímulo. Sob uma suposição de codificação de taxa, qualquer informação possivelmente codificada na estrutura temporal do trem de pico é ignorada. Consequentemente, a codificação de taxa é ineficiente, mas altamente robusta em relação ao ' ruído ' ISI .

Durante a codificação da taxa, o cálculo preciso da taxa de disparo é muito importante. Na verdade, o termo "taxa de disparo" tem algumas definições diferentes, que se referem a diferentes procedimentos de média, como uma média ao longo do tempo (taxa como uma contagem de pico de neurônio único) ou uma média ao longo de várias repetições (taxa de PSTH) de experimentar.

Na codificação de taxa, o aprendizado é baseado em modificações de peso sináptico dependentes da atividade.

A codificação de taxas foi originalmente mostrada por ED Adrian e Y Zotterman em 1926. Neste experimento simples, pesos diferentes foram pendurados em um músculo . À medida que o peso do estímulo aumentava, o número de picos registrados dos nervos sensoriais que inervavam o músculo também aumentava. A partir desses experimentos originais, Adrian e Zotterman concluíram que os potenciais de ação eram eventos unitários e que a frequência dos eventos, e não a magnitude do evento individual, era a base para a maior parte da comunicação entre neurônios.

Nas décadas seguintes, a medição das taxas de disparo tornou-se uma ferramenta padrão para descrever as propriedades de todos os tipos de neurônios sensoriais ou corticais , em parte devido à relativa facilidade de medir as taxas experimentalmente. No entanto, essa abordagem negligencia todas as informações possivelmente contidas no momento exato dos picos. Durante os últimos anos, mais e mais evidências experimentais sugeriram que um conceito direto de taxa de disparo com base na média temporal pode ser muito simplista para descrever a atividade cerebral.

Taxa de contagem de pico (média ao longo do tempo)

A taxa de contagem de spikes, também conhecida como média temporal, é obtida contando o número de spikes que aparecem durante uma tentativa e dividindo pela duração da tentativa. O comprimento T da janela de tempo é definido pelo experimentador e depende do tipo de neurônio registrado de e para o estímulo. Na prática, para obter médias razoáveis, vários picos devem ocorrer dentro da janela de tempo. Os valores típicos são T = 100 ms ou T = 500 ms, mas a duração também pode ser mais longa ou mais curta. ( Capítulo 1.5 no livro 'Modelos de neurônios de pico')

A taxa de contagem de pico pode ser determinada a partir de uma única tentativa, mas às custas de perder toda a resolução temporal sobre as variações na resposta neural durante o curso da tentativa. A média temporal pode funcionar bem nos casos em que o estímulo é constante ou varia lentamente e não requer uma reação rápida do organismo - e esta é a situação geralmente encontrada em protocolos experimentais. A entrada do mundo real, no entanto, dificilmente é estacionária, mas frequentemente muda em uma escala de tempo rápida. Por exemplo, mesmo ao ver uma imagem estática, os humanos executam sacadas , mudanças rápidas na direção do olhar. A imagem projetada nos fotorreceptores da retina muda, portanto, a cada poucas centenas de milissegundos ( Capítulo 1.5 )

Apesar de suas deficiências, o conceito de um código de taxa de contagem de pico é amplamente usado não apenas em experimentos, mas também em modelos de redes neurais . Isso levou à ideia de que um neurônio transforma informações sobre uma única variável de entrada (a força do estímulo) em uma única variável de saída contínua (a taxa de disparo).

Há um crescente corpo de evidências de que nos neurônios de Purkinje , pelo menos, a informação não é simplesmente codificada no disparo, mas também no tempo e na duração dos períodos de repouso, sem disparo. Também há evidências nas células da retina de que a informação é codificada não apenas na taxa de disparo, mas também no tempo de pico. De modo mais geral, sempre que uma resposta rápida de um organismo é necessária, uma taxa de disparo definida como uma contagem de pico de algumas centenas de milissegundos é simplesmente muito lenta.

Taxa de disparo dependente do tempo (média de várias tentativas)

A taxa de disparo dependente do tempo é definida como o número médio de picos (média durante as tentativas) que aparecem durante um curto intervalo entre os tempos t e t + Δt, dividido pela duração do intervalo. Ele funciona tanto para estímulos estacionários quanto para estímulos dependentes do tempo. Para medir experimentalmente a taxa de disparo dependente do tempo, o experimentador grava de um neurônio enquanto estimula com alguma sequência de entrada. A mesma sequência de estimulação é repetida várias vezes e a resposta neuronal é relatada em um Histograma Peri-Estímulo-Tempo (PSTH). O tempo t é medido em relação ao início da sequência de estimulação. O Δt deve ser grande o suficiente (normalmente na faixa de um ou alguns milissegundos) para que haja um número suficiente de picos dentro do intervalo para obter uma estimativa confiável da média. O número de ocorrências de picos n K (t; t + Δt) somado a todas as repetições do experimento dividido pelo número K de repetições é uma medida da atividade típica do neurônio entre o tempo t e t + Δt. Uma divisão adicional pelo comprimento do intervalo Δt produz a taxa de disparo dependente do tempo r (t) do neurônio, que é equivalente à densidade do pico de PSTH ( Capítulo 1.5 in).

Para Δt suficientemente pequeno, r (t) Δt é o número médio de picos que ocorrem entre os tempos t e t + Δt ao longo de várias tentativas. Se Δt for pequeno, nunca haverá mais de um pico dentro do intervalo entre t e t + Δt em qualquer tentativa. Isso significa que r (t) Δt também é a fração de tentativas nas quais ocorreu um pico entre esses momentos. De forma equivalente, r (t) Δt é a probabilidade de que ocorra um pico durante esse intervalo de tempo.

Como um procedimento experimental, a medida da taxa de disparo dependente do tempo é um método útil para avaliar a atividade neuronal, em particular no caso de estímulos dependentes do tempo. O problema óbvio com essa abordagem é que ela não pode ser o esquema de codificação usado pelos neurônios no cérebro. Os neurônios não podem esperar que os estímulos se apresentem repetidamente da mesma maneira antes de gerar uma resposta.

No entanto, a medida experimental da taxa de disparo dependente do tempo pode fazer sentido, se houver grandes populações de neurônios independentes que recebem o mesmo estímulo. Em vez de registrar a partir de uma população de N neurônios em uma única execução, é experimentalmente mais fácil registrar a partir de um único neurônio e fazer a média em N execuções repetidas. Assim, a codificação da taxa de disparo dependente do tempo baseia-se na suposição implícita de que sempre há populações de neurônios.

Codificação temporal

Quando o tempo preciso do pico ou as flutuações da taxa de disparo de alta frequência transportam informações, o código neural é frequentemente identificado como um código temporal. Vários estudos descobriram que a resolução temporal do código neural está em uma escala de tempo de milissegundos, indicando que o tempo de pico preciso é um elemento significativo na codificação neural. Esses códigos, que se comunicam por meio do tempo entre os picos, também são chamados de códigos de intervalo entre pulsos e foram corroborados por estudos recentes.

Os neurônios apresentam flutuações de alta frequência nas taxas de disparo, que podem ser ruído ou transportar informações. Os modelos de codificação de taxa sugerem que essas irregularidades são ruídos, enquanto os modelos de codificação temporal sugerem que codificam informações. Se o sistema nervoso usasse apenas códigos de taxa para transmitir informações, uma taxa de disparo regular mais consistente teria sido evolutivamente vantajosa, e os neurônios teriam utilizado esse código em vez de outras opções menos robustas. A codificação temporal fornece uma explicação alternativa para o "ruído", sugerindo que ele realmente codifica as informações e afeta o processamento neural. Para modelar essa ideia, símbolos binários podem ser usados ​​para marcar os picos: 1 para um pico, 0 para nenhum pico. Codificação temporal permite que a sequência 000111000111 signifique algo diferente de 001100110011, embora a taxa de disparo média seja a mesma para ambas as sequências, a 6 picos / 10 ms. Até recentemente, os cientistas davam mais ênfase à codificação da taxa como uma explicação para o pós-sináptico padrões potenciais . No entanto, as funções do cérebro são mais precisas temporalmente do que o uso de apenas codificação de taxa parece permitir. Em outras palavras, informações essenciais podem ser perdidas devido à incapacidade do código de taxa de capturar todas as informações disponíveis do pico Além disso, as respostas são diferentes o suficiente entre estímulos semelhantes (mas não idênticos) para sugerir que os padrões distintos de picos contêm um volume maior de informações do que é possível passível de inclusão em um código de taxa.

Os códigos temporais (também chamados de códigos de pico ), empregam os recursos da atividade de pico que não podem ser descritos pela taxa de disparo. Por exemplo, tempo para o primeiro pico após o início do estímulo, fase de disparo em relação às oscilações de fundo, características baseadas no segundo e mais altos momentos estatísticos da distribuição de probabilidade ISI , aleatoriedade do pico ou grupos precisamente cronometrados de picos ( padrões temporais ) são candidatos a códigos temporais. Como não há referência de tempo absoluto no sistema nervoso, a informação é transportada em termos do tempo relativo de picos em uma população de neurônios (padrões temporais) ou em relação a uma oscilação cerebral contínua . (fase de disparo) Uma maneira pela qual os códigos temporais são decodificados, na presença de oscilações neurais , é que os picos que ocorrem em fases específicas de um ciclo oscilatório são mais eficazes na despolarização do neurônio pós-sináptico .

A estrutura temporal de um trem de pico ou taxa de disparo evocada por um estímulo é determinada pela dinâmica do estímulo e pela natureza do processo de codificação neural. Os estímulos que mudam rapidamente tendem a gerar picos precisamente cronometrados (e taxas de disparo que mudam rapidamente em PSTHs), independentemente da estratégia de codificação neural que está sendo usada. A codificação temporal no sentido estrito refere-se à precisão temporal na resposta que não surge apenas da dinâmica do estímulo, mas que, no entanto, está relacionada às propriedades do estímulo. A interação entre estímulo e dinâmica de codificação torna difícil a identificação de um código temporal.

Na codificação temporal, o aprendizado pode ser explicado por modificações no atraso sináptico dependente da atividade. As modificações podem depender não apenas das taxas de pico (codificação de taxa), mas também dos padrões de tempo de pico (codificação temporal), ou seja, pode ser um caso especial de plasticidade dependente do tempo de pico .

A questão da codificação temporal é distinta e independente da questão da codificação de pico independente. Se cada pico for independente de todos os outros picos no trem, o caráter temporal do código neural é determinado pelo comportamento da taxa de disparo dependente do tempo r (t). Se r (t) varia lentamente com o tempo, o código é normalmente chamado de código de taxa e, se varia rapidamente, o código é chamado de temporal.

Codificação temporal em sistemas sensoriais

Para estímulos muito breves, a taxa máxima de disparo de um neurônio pode não ser rápida o suficiente para produzir mais do que um único pico. Devido à densidade de informações sobre o estímulo abreviado contido neste único pico, parece que o tempo do pico em si teria de transmitir mais informações do que simplesmente a frequência média dos potenciais de ação em um determinado período de tempo. Este modelo é especialmente importante para localização de som , que ocorre dentro do cérebro na ordem de milissegundos. O cérebro deve obter uma grande quantidade de informações com base em uma resposta neural relativamente curta. Além disso, se baixas taxas de disparo da ordem de dez picos por segundo devem ser distinguidas da codificação de taxa arbitrariamente próxima para diferentes estímulos, então um neurônio tentando discriminar esses dois estímulos pode precisar esperar por um segundo ou mais para acumular informações suficientes. Isso não é consistente com numerosos organismos que são capazes de discriminar estímulos no intervalo de tempo de milissegundos, sugerindo que um código de taxa não é o único modelo em funcionamento.

Para explicar a codificação rápida de estímulos visuais, foi sugerido que os neurônios da retina codificam informações visuais no tempo de latência entre o início do estímulo e o potencial de primeira ação, também chamado de latência para o primeiro pico ou tempo para o primeiro pico. Esse tipo de codificação temporal foi demonstrado também no sistema auditivo e somatossensorial. A principal desvantagem desse esquema de codificação é sua sensibilidade às flutuações neuronais intrínsecas. No córtex visual primário dos macacos, descobriu-se que o tempo do primeiro pico em relação ao início do estímulo fornece mais informações do que o intervalo entre os picos. No entanto, o intervalo entre picos pode ser usado para codificar informações adicionais, o que é especialmente importante quando a taxa de picos atinge seu limite, como em situações de alto contraste. Por esse motivo, a codificação temporal pode desempenhar um papel na codificação de bordas definidas, em vez de transições graduais.

O sistema gustativo dos mamíferos é útil para estudar a codificação temporal por causa de seus estímulos bastante distintos e das respostas facilmente discerníveis do organismo. A informação codificada temporalmente pode ajudar um organismo a discriminar entre diferentes saborizantes da mesma categoria (doce, amargo, azedo, salgado, umami) que provocam respostas muito semelhantes em termos de contagem de spikes. O componente temporal do padrão eliciado por cada saborizante pode ser usado para determinar sua identidade (por exemplo, a diferença entre dois saborizantes amargos, como quinino e denatônio). Desta forma, tanto a codificação de taxa quanto a codificação temporal podem ser usadas no sistema gustativo - taxa para o tipo básico de saborizante, temporal para uma diferenciação mais específica. Pesquisas sobre o sistema gustativo de mamíferos mostraram que há uma abundância de informações presentes em padrões temporais entre populações de neurônios, e essas informações são diferentes daquelas que são determinadas por esquemas de codificação de taxa. Grupos de neurônios podem se sincronizar em resposta a um estímulo. Em estudos que tratam da porção cortical frontal do cérebro em primatas, padrões precisos com escalas de tempo curtas de apenas alguns milissegundos de duração foram encontrados em pequenas populações de neurônios que se correlacionaram com certos comportamentos de processamento de informação. No entanto, pouca informação pode ser determinada a partir dos padrões; uma teoria possível é que eles representavam o processamento de ordem superior ocorrendo no cérebro.

Como acontece com o sistema visual, nas células mitrais / tufadas no bulbo olfatório de camundongos, a latência do primeiro pico relativa ao início de uma ação de cheirar parecia codificar muitas das informações sobre um odor. Essa estratégia de usar a latência de pico permite a rápida identificação e reação a um odorante. Além disso, algumas células mitrais / tufadas têm padrões de disparo específicos para determinados odorantes. Esse tipo de informação extra poderia ajudar no reconhecimento de um determinado odor, mas não é totalmente necessário, já que a contagem média de picos ao longo da farejada do animal também foi um bom identificador. Na mesma linha, experimentos feitos com o sistema olfatório de coelhos mostraram padrões distintos que se correlacionaram com diferentes subconjuntos de odorantes, e um resultado semelhante foi obtido em experimentos com o sistema olfativo de gafanhotos.

Aplicativos de codificação temporal

A especificidade da codificação temporal requer tecnologia altamente refinada para medir dados experimentais informativos e confiáveis. Os avanços feitos na optogenética permitem que os neurologistas controlem picos em neurônios individuais, oferecendo resolução elétrica e espacial de uma única célula. Por exemplo, luz azul faz com que o canal de iões dependentes da luz channelrodopsina para aberto, despolarização da célula e a produção de um pico. Quando a luz azul não é detectada pela célula, o canal se fecha e o neurônio para de disparar. O padrão dos picos corresponde ao padrão dos estímulos de luz azul. Ao inserir as sequências do gene da rodopsina no DNA do camundongo, os pesquisadores podem controlar picos e, portanto, certos comportamentos do camundongo (por exemplo, fazer o camundongo virar para a esquerda). Os pesquisadores, por meio da optogenética, têm as ferramentas para efetuar diferentes códigos temporais em um neurônio enquanto mantêm a mesma taxa média de disparo e, assim, podem testar se a codificação temporal ocorre ou não em circuitos neurais específicos.

A tecnologia optogenética também tem o potencial de permitir a correção de anormalidades de pico na raiz de vários distúrbios neurológicos e psicológicos. Se os neurônios codificarem informações em padrões de tempo de pico individuais, os sinais-chave podem ser perdidos ao tentar quebrar o código olhando apenas para as taxas médias de disparo. Compreender quaisquer aspectos codificados temporalmente do código neural e replicar essas sequências em neurônios pode permitir um maior controle e tratamento de distúrbios neurológicos, como depressão , esquizofrenia e doença de Parkinson . A regulação dos intervalos de pico em células individuais controla mais precisamente a atividade cerebral do que a adição de agentes farmacológicos por via intravenosa.

Código de fase de disparo

O código de fase de disparo é um esquema de codificação neural que combina o código de contagem de pico com uma referência de tempo baseada em oscilações . Este tipo de código leva em consideração uma etiqueta de tempo para cada pico de acordo com uma referência de tempo baseada na fase das oscilações locais contínuas em baixas ou altas frequências.

Foi demonstrado que os neurônios em algumas áreas sensoriais corticais codificam estímulos naturalísticos ricos em termos de seus tempos de pico em relação à fase de flutuações oscilatórias da rede em curso, e não apenas em termos de sua contagem de pico. Os sinais de potencial de campo local refletem as oscilações da população (rede). O código de fase de disparo é frequentemente categorizado como um código temporal, embora o rótulo de tempo usado para picos (ou seja, a fase de oscilação da rede) seja uma referência de baixa resolução (granulação grossa) para o tempo. Como resultado, muitas vezes apenas quatro valores discretos para a fase são suficientes para representar todo o conteúdo de informação neste tipo de código com respeito à fase de oscilações em baixas frequências. O código de fase de disparo é vagamente baseado nos fenômenos de precessão de fase observados nas células do hipocampo . Outra característica desse código é que os neurônios aderem a uma ordem preferencial de spiking entre um grupo de neurônios sensoriais, resultando em uma sequência de disparo.

Foi demonstrado que o código de fase no córtex visual envolve também oscilações de alta frequência . Dentro de um ciclo de oscilação gama, cada neurônio tem seu próprio tempo de disparo relativo preferido. Como resultado, uma população inteira de neurônios gera uma sequência de disparo que tem uma duração de até cerca de 15 ms.

Codificação populacional

A codificação populacional é um método para representar estímulos usando as atividades conjuntas de vários neurônios. Na codificação populacional, cada neurônio tem uma distribuição de respostas sobre algum conjunto de entradas, e as respostas de muitos neurônios podem ser combinadas para determinar algum valor sobre as entradas. Do ponto de vista teórico, a codificação populacional é um dos poucos problemas matematicamente bem formulados na neurociência. Ele apreende as características essenciais da codificação neural e, ainda assim, é simples o suficiente para a análise teórica. Estudos experimentais revelaram que este paradigma de codificação é amplamente utilizado nas áreas sensoriais e motoras do cérebro.

Por exemplo, na área visual medial temporal (TM), os neurônios são sintonizados na direção do movimento. Em resposta a um objeto se movendo em uma direção específica, muitos neurônios em MT disparam com um padrão de atividade em forma de sino corrompido por ruído em toda a população. A direção do movimento do objeto é recuperada da atividade da população, para ser imune à flutuação existente no sinal de um único neurônio. Quando os macacos são treinados para mover um joystick em direção a um alvo iluminado, um único neurônio dispara para várias direções de alvo. No entanto, ele dispara mais rápido em uma direção e mais lentamente, dependendo de quão próximo o alvo estava da direção "preferida" do neurônio. Se cada neurônio representa o movimento em sua direção preferida e a soma vetorial de todos os neurônios é calculada (cada neurônio tem uma taxa de disparo e uma direção preferencial), a soma aponta na direção do movimento. Desse modo, a população de neurônios codifica o sinal para o movimento. Este código de população específico é conhecido como codificação de vetor de população .

Os códigos de população de tempo local, chamados de código de resposta sincronizada localizada média (ALSR), foram derivados para a representação neural de estímulos acústicos auditivos. Isso explora o local ou a sintonia dentro do nervo auditivo, bem como o bloqueio de fase dentro de cada nervo auditivo da fibra nervosa. A primeira representação ALSR foi para vogais em estado estacionário; As representações ALSR de frequências de pitch e formante em estímulos complexos e não estáveis ​​foram posteriormente demonstradas para pitch sonoro e representações de formante em sílabas consoante-vogal. A vantagem de tais representações é que recursos globais, como perfis de transição de pitch ou formante, podem ser representados como recursos globais em todo o nervo simultaneamente por meio da codificação de taxa e local.

A codificação da população também tem uma série de outras vantagens, incluindo a redução da incerteza devido à variabilidade neuronal e a capacidade de representar vários atributos de estímulos diferentes simultaneamente. A codificação da população também é muito mais rápida do que a codificação da taxa e pode refletir mudanças nas condições de estímulo quase que instantaneamente. Neurônios individuais em tal população normalmente têm seletividades diferentes, mas sobrepostas, de modo que muitos neurônios, mas não necessariamente todos, respondem a um determinado estímulo.

Normalmente, uma função de codificação tem um valor de pico tal que a atividade do neurônio é maior se o valor perceptivo está próximo do valor de pico e torna-se reduzido em conformidade para valores menos próximos do valor de pico. Segue-se que o valor real percebido pode ser reconstruído a partir do padrão geral de atividade no conjunto de neurônios. A codificação vetorial é um exemplo de cálculo de média simples. Uma técnica matemática mais sofisticada para realizar tal reconstrução é o método de máxima verossimilhança com base em uma distribuição multivariada das respostas neuronais. Esses modelos podem assumir independência, correlações de segunda ordem ou dependências ainda mais detalhadas, como modelos de entropia máxima de ordem superior ou cópulas .

Codificação de correlação

O modelo de codificação de correlação de disparo neuronal afirma que as correlações entre potenciais de ação , ou "picos", dentro de um trem de picos podem transportar informações adicionais acima e além do simples tempo dos picos. Os primeiros trabalhos sugeriram que a correlação entre os trens de pico só pode reduzir, e nunca aumentar, o total de informações mútuas presentes nos dois trens de pico sobre um recurso de estímulo. No entanto, mais tarde isso foi demonstrado como incorreto. A estrutura de correlação pode aumentar o conteúdo da informação se o ruído e as correlações de sinal forem de sinal oposto. As correlações também podem carregar informações não presentes na taxa média de disparo de dois pares de neurônios. Um bom exemplo disso existe no córtex auditivo do sagui anestesiado com pentobarbital, no qual um tom puro causa um aumento no número de picos correlacionados, mas não um aumento na taxa média de disparo de pares de neurônios.

Codificação independente

O modelo de codificação de pico independente de disparo neuronal afirma que cada potencial de ação individual , ou "pico", é independente um do outro pico dentro do trem de pico .

Codificação de posição

Gráfico da codificação de posição típica

Um código populacional típico envolve neurônios com uma curva de ajuste gaussiana cujas médias variam linearmente com a intensidade do estímulo, o que significa que o neurônio responde mais fortemente (em termos de picos por segundo) a um estímulo próximo à média. A intensidade real pode ser recuperada como o nível de estímulo correspondente à média do neurônio com a maior resposta. No entanto, o ruído inerente às respostas neurais significa que uma função de estimativa de máxima verossimilhança é mais precisa.

As respostas neurais são ruidosas e não confiáveis.

Este tipo de código é usado para codificar variáveis ​​contínuas, como posição da articulação, posição dos olhos, cor ou frequência do som. Qualquer neurônio individual é muito barulhento para codificar fielmente a variável usando codificação de taxa, mas uma população inteira garante maior fidelidade e precisão. Para uma população de curvas de sintonia unimodal, ou seja, com um único pico, a precisão normalmente escala linearmente com o número de neurônios. Conseqüentemente, para metade da precisão, metade dos neurônios são necessários. Em contraste, quando as curvas de sintonia têm vários picos, como em células de grade que representam o espaço, a precisão da população pode escalar exponencialmente com o número de neurônios. Isso reduz muito o número de neurônios necessários para a mesma precisão.

Codificação esparsa

O código esparso ocorre quando cada item é codificado pela forte ativação de um conjunto relativamente pequeno de neurônios. Para cada item a ser codificado, este é um subconjunto diferente de todos os neurônios disponíveis. Em contraste com a codificação de sensor esparso, a codificação de sensor denso implica que todas as informações de possíveis localizações de sensor são conhecidas.

Como consequência, a dispersão pode ser focada na dispersão temporal ("um número relativamente pequeno de períodos de tempo estão ativos") ou na dispersão em uma população de neurônios ativada. Neste último caso, isso pode ser definido em um período de tempo como o número de neurônios ativados em relação ao número total de neurônios na população. Esta parece ser uma marca registrada das computações neurais, uma vez que, em comparação com os computadores tradicionais, as informações são amplamente distribuídas pelos neurônios. A codificação esparsa de imagens naturais produz filtros orientados como ondas que se assemelham aos campos receptivos de células simples no córtex visual. A capacidade dos códigos esparsos pode ser aumentada pelo uso simultâneo da codificação temporal, como encontrada no sistema olfatório da gafanhoto.

Dado um conjunto potencialmente grande de padrões de entrada, algoritmos de codificação esparsos (por exemplo, autencoder esparso ) tentam encontrar automaticamente um pequeno número de padrões representativos que, quando combinados nas proporções corretas, reproduzem os padrões de entrada originais. A codificação esparsa para a entrada consiste então nesses padrões representativos. Por exemplo, o conjunto muito grande de frases em inglês pode ser codificado por um pequeno número de símbolos (ou seja, letras, números, pontuação e espaços) combinados em uma ordem específica para uma frase específica e, portanto, uma codificação esparsa para o inglês seria aquela símbolos.

Modelo gerador linear

A maioria dos modelos de codificação esparsa é baseada no modelo linear generativo. Neste modelo, os símbolos são combinados de forma linear para aproximar a entrada.

Mais formalmente, dado um conjunto k-dimensional de vetores de entrada com números reais , o objetivo da codificação esparsa é determinar n vetores de base k-dimensionais junto com um vetor n-dimensional esparso de pesos ou coeficientes para cada vetor de entrada, de modo que um combinação linear dos vectores de base com proporções dadas pelos resultados coeficientes numa aproximação para o vector de entrada: .

As codificações geradas por algoritmos que implementam um modelo generativo linear podem ser classificadas em codificações com dispersão suave e aquelas com dispersão rígida . Eles se referem à distribuição dos coeficientes do vetor de base para entradas típicas. Uma codificação com dispersão suave tem uma distribuição semelhante a gaussiana suave , mas com mais pico do que gaussiana, com muitos valores zero, alguns valores absolutos pequenos, menos valores absolutos maiores e muito poucos valores absolutos muito grandes. Assim, muitos dos vetores básicos estão ativos. A grande dispersão, por outro lado, indica que existem muitos valores zero, nenhum ou quase nenhum valor absoluto pequeno, menos valores absolutos maiores e muito poucos valores absolutos muito grandes e, portanto, poucos dos vetores de base estão ativos. Isso é atraente de uma perspectiva metabólica: menos energia é usada quando menos neurônios estão disparando.

Outra medida de codificação é se ela está criticamente completa ou supercompleta . Se o número de vetores de base n for igual à dimensionalidade k do conjunto de entrada, a codificação é considerada criticamente completa. Nesse caso, mudanças suaves no vetor de entrada resultam em mudanças abruptas nos coeficientes, e a codificação não é capaz de lidar com pequenas escalas, pequenas traduções ou ruído nas entradas. Se, no entanto, o número de vetores de base for maior do que a dimensionalidade do conjunto de entrada, a codificação está supercompleta . Codificações supercompletas interpolam suavemente entre os vetores de entrada e são robustas sob ruído de entrada. Estima - se que o córtex visual primário humano seja supercompleto por um fator de 500, de modo que, por exemplo, um fragmento de entrada de 14 x 14 (um espaço de 196 dimensões) é codificado por cerca de 100.000 neurônios.

Outros modelos são baseados na busca de correspondência , um algoritmo de aproximação esparsa que encontra as projeções de "melhor correspondência" de dados multidimensionais e aprendizagem de dicionário , um método de aprendizagem de representação que visa encontrar uma representação de matriz esparsa dos dados de entrada na forma de uma combinação de elementos básicos, bem como os próprios elementos básicos.

Evidência biológica

A codificação esparsa pode ser uma estratégia geral dos sistemas neurais para aumentar a capacidade da memória. Para se adaptar a seus ambientes, os animais devem aprender quais estímulos estão associados a recompensas ou punições e distinguir esses estímulos reforçados de outros semelhantes, mas irrelevantes. Essas tarefas requerem a implementação de memórias associativas específicas de estímulos, nas quais apenas alguns neurônios de uma população respondem a qualquer estímulo dado e cada neurônio responde a apenas alguns estímulos de todos os estímulos possíveis.

O trabalho teórico sobre a memória distribuída esparsa sugeriu que a codificação esparsa aumenta a capacidade da memória associativa, reduzindo a sobreposição entre as representações. Experimentalmente, representações esparsas de informações sensoriais foram observadas em muitos sistemas, incluindo visão, audição, toque e olfato. No entanto, apesar do acúmulo de evidências de codificação esparsa generalizada e argumentos teóricos para sua importância, uma demonstração de que a codificação esparsa melhora a especificidade do estímulo da memória associativa tem sido difícil de obter.

No sistema olfativo da Drosophila , acredita-se que a codificação esparsa de odores pelas células de Kenyon do corpo do cogumelo gere um grande número de locais endereçáveis ​​com precisão para o armazenamento de memórias específicas de odores. A escassez é controlada por um circuito de feedback negativo entre as células de Kenyon e os neurônios GABAérgicos laterais anteriores emparelhados (APL). A ativação sistemática e o bloqueio de cada perna deste circuito de feedback mostram que as células de Kenyon ativam os neurônios APL e os neurônios APL inibem as células Kenyon. Interromper o ciclo de feedback célula-APL de Kenyon diminui a dispersão das respostas de odor das células de Kenyon, aumenta as correlações entre odores e evita que as moscas aprendam a discriminar odores semelhantes, mas não diferentes. Esses resultados sugerem que a inibição de feedback suprime a atividade das células de Kenyon para manter a codificação de odores esparsa e decorrelacionada e, portanto, a especificidade de odores das memórias.

Veja também

Referências

Leitura adicional