Traduzido por Julio Batista
Original de
Um minicérebro sintético feito de neurônios humanos e de camundongos aprendeu com sucesso a jogar o videogame “Pong” depois que pesquisadores o conectaram a um conjunto de eletrodos controlado por computador. É a primeira vez que células cerebrais isoladas de um organismo completam uma tarefa como essa, sugerindo que essa capacidade de aprendizado não se limita a cérebros totalmente intactos confinados dentro de crânios de animais. No novo estudo, os pesquisadores desenvolveram uma rede de neurônios sintéticos em cima de fileiras de eletrodos alojados dentro de um pequeno recipiente, que eles chamaram de DishBrain. Um programa de computador enviou sinais elétricos que ativaram regiões específicas dos neurônios. Esses sinais diziam aos neurônios para “jogar” o videogame retrô “Pong”, que envolve acertar um ponto em movimento, ou “bola”, com uma pequena linha, ou “raquete”, em 2D. O programa de computador do pesquisador canalizou os dados de desempenho de volta para os neurônios por meio de sinais elétricos, que informaram às células se elas acertaram ou erraram a bola. Os pesquisadores descobriram que, em apenas cinco minutos, os neurônios já haviam começado a alterar a maneira como moviam a raquete para aumentar a frequência com que acertavam a bola. Esta é a primeira vez que uma rede neural biológica artificial foi ensinada a completar independentemente uma tarefa orientada a objetivos, escreveram os pesquisadores em um novo paper publicado em 12 de outubro na revista Neuron.
O novo estudo é o primeiro a “explicitamente buscar, criar, testar e alavancar a inteligência biológica sintética”, disse o autor principal do estudo, Brett Kagan, diretor científico da Cortical Labs, uma empresa privada em Melbourne, Austrália, à Live Science. Os pesquisadores esperam que seu trabalho possa impulsionar uma nova área de pesquisa.
O hardware DishBrain, desenvolvido pela Cortical Labs, consiste em um pequeno recipiente circular, com cerca de 5 centímetros de largura, revestido com uma matriz contendo 1.024 eletrodos ativos que podem enviar e receber sinais elétricos. Os pesquisadores introduziram uma mistura de neurônios humanos e de camundongos em cima desses eletrodos. Os neurônios foram persuadidos pelos pesquisadores a desenvolver novas conexões e caminhos até se transformarem em uma complexa teia de células cerebrais que cobriam completamente os eletrodos.
As células de camundongo foram cultivadas em cultura a partir de minúsculos neurônios extraídos de embriões em desenvolvimento. Os neurônios humanos foram criados usando células-tronco pluripotentes – células-tronco capazes de se transformar em qualquer outro tipo de célula – derivadas de células do sangue e da pele doadas por voluntários.
No total, a rede neural continha cerca de 800.000 neurônios, disse Kagan. Para contextualizar, isso é aproximadamente o mesmo número de neurônios que existem no cérebro de uma abelha, acrescentou. Embora a rede neural sintética fosse semelhante em tamanho aos cérebros de pequenos invertebrados, sua estrutura 2D simples é muito mais básica do que os cérebros vivos e, portanto, tem um poder de computação ligeiramente reduzido em comparação com os cérebros vivos, disse Kagan.
Durante os experimentos, os pesquisadores usaram um novo programa de computador, conhecido como DishServer, combinado com os eletrodos dentro do DishBrain para criar um “mundo de jogo virtual” no qual os neurônios poderiam jogar “Pong”, disse Kagan. Isso pode parecer high-tech, mas, na realidade, não é muito diferente de jogar um videogame na TV.
Usando essa analogia, a matriz de eletrodos pode ser pensada como a tela da TV, com cada eletrodo individual representando um pixel na tela; o programa de computador pode ser pensado como o disco do jogo que fornece o código para jogar o jogo; a interface neurônio-eletrodo no DishBrain pode ser pensada como o console de jogos e os controladores que facilitam o jogo; e os neurônios podem ser pensados como a pessoa que está jogando o jogo.
Quando o programa de computador ativa um eletrodo específico, esse eletrodo gera um sinal elétrico que os neurônios podem interpretar, semelhante a como um pixel em uma tela se ilumina e se torna visível para uma pessoa jogando. Ao ativar vários eletrodos em um padrão, o programa pode criar uma forma, neste caso uma bola, que se move pela matriz ou “tela de TV”.
Uma seção separada da matriz monitora os sinais elétricos emitidos pelos neurônios em resposta aos sinais da “bola”. Esses sinais de neurônios podem então ser interpretados pelo programa de computador e usados para manobrar a raquete no mundo do jogo virtual. Essa região da interface neurônio-eletrodo pode ser pensada como o controlador do jogo.
Se os sinais neuronais espelharem aqueles que movem a bola, a raquete atingirá a bola. Mas se os sinais não corresponderem, ele falhará. O programa de computador emite um segundo sinal de feedback para os neurônios controladores para dizer se eles acertaram a bola ou não.
O sinal de feedback secundário pode ser pensado como um sistema de recompensa que o programa de computador usa para ensinar os neurônios a serem melhores em acertar a bola.
Sem o sistema de recompensa, seria muito difícil reforçar comportamentos desejáveis, como bater na bola, e desencorajar comportamentos desfavoráveis, como errar a bola. Deixados por conta própria, os neurônios no DishBrain moveriam a raquete aleatoriamente sem qualquer consideração de onde a bola está, porque não faz diferença para os neurônios se eles batem na bola ou não.
Para contornar esse problema, os pesquisadores recorreram a uma teoria conhecida como princípio da energia livre, “que propõe que as células nesse nível tentam minimizar a imprevisibilidade em seu ambiente”, disse o coautor do estudo Karl Friston, neurocientista teórico do Colégio Universitário de Londres, no Reino Unido, em um comunicado. Friston foi o primeiro pesquisador a apresentar a ideia do princípio da energia livre em um paper de 2009 publicado na revista Trends in Cognitive Science.
De certa forma, “os neurônios estão tentando criar um modelo previsível do mundo”, disse Kagan à Live Science. É aqui que o sinal de feedback secundário, que informa aos neurônios se eles acertaram ou erraram a bola, entra em ação. Quando os neurônios atingem a bola com sucesso, o sinal de feedback é entregue em uma voltagem e localização semelhantes aos sinais usados pelo computador para mover a bola. Mas quando os neurônios perdem a bola, o sinal de feedback atinge uma voltagem aleatória e vários locais. De acordo com o princípio da energia livre, os neurônios querem minimizar a quantidade de sinais aleatórios que estão recebendo, então eles começam a mudar a forma como movem a “raquete” em relação à “bola”.
Cinco minutos depois de receber esse feedback, os neurônios estavam aumentando a frequência com que acertavam a bola. Após 20 minutos, os neurônios foram capazes de encadear pequenos rallies onde eles continuamente rebatiam a bola enquanto ela ricocheteava nas “paredes” do jogo. Você pode ver a rapidez com que os neurônios progrediram nesta simulação online.