O ponto de inflexão dos robôs inteligentes? Microsoft quer usar ChatGPT para controlar robôs - Reeman news

As poderosas funções do ChatGPT fazem com que muitas empresas de tecnologia queiram explorar seus limites de aplicação, como dar a ele um corpo de robô, que tipo de surpresas isso pode nos trazer?

Há alguns dias, a Microsoft publicou um artigo técnico em seu site oficial, apresentando que a Microsoft está tentando deixar o ChatGPT romper as limitações dos computadores para controlar robôs, para que possa desempenhar um papel livremente no mundo real.

De acordo com o conteúdo do artigo, a Microsoft vai estender as capacidades do ChatGPT ao campo da robótica, e usar a linguagem para controlar intuitivamente múltiplas plataformas, como braços robóticos, drones e robôs assistentes domésticos.

Por exemplo, se você disser "por favor, aqueça meu almoço" para um robô doméstico, o robô doméstico encontrará o micro-ondas para aquecer a refeição sozinho. Este é obviamente o nosso robô ideal, que pode dizer ao robô o que fazer com nossas próprias palavras, assim como nós. É tão fácil quanto se comunicar com outras pessoas.

A linguagem é a forma mais simples e intuitiva de expressarmos nossas intenções, mas agora podemos contar apenas com a escrita de código para controlar o robô, o que sem dúvida torna a operação muito mais complicada, e a equipe da Microsoft está atualmente explorando como mudar essa realidade. Experimente o ChatGPT, o novo modelo de linguagem AI da OpenAI para permitir a interação natural humano-computador.

Aplicação do ChatGPT em robôs

ChatGPT é um modelo de linguagem treinado em um grande corpus de texto e interação humana para ser capaz de gerar respostas coerentes e gramaticalmente corretas para uma ampla gama de prompts e perguntas. Para usar o ChatGPT para controlar robôs para realizar tarefas, é necessário fazê-lo pensar além do texto, para deduzir o mundo físico.

Os pesquisadores da Microsoft disseram: “O objetivo da pesquisa é ver se o ChatGPT pode ir além do escopo de gerar texto e raciocinar sobre as condições do mundo real para ajudar os robôs a concluir tarefas”. A Microsoft espera ajudar as pessoas a interagir com os robôs mais facilmente sem ter que aprender uma linguagem de programação complexa ou informações detalhadas sobre o sistema do robô.

A base atual do uso do robô são engenheiros ou usuários técnicos que podem traduzir os requisitos da tarefa em código do sistema. Os engenheiros precisam frequentemente escrever novos códigos e especificações para corrigir o comportamento do robô. Esse processo é lento (os usuários precisam escrever código de baixo nível), caro (requer usuários altamente qualificados com profundo conhecimento de robótica) e ineficiente (múltiplas interações necessárias para fazer as coisas funcionarem).

O ChatGPT desbloqueia um novo paradigma de robô que pode converter rapidamente linguagem natural em código, para que uma pessoa não técnica também possa fornecer feedback avançado para um modelo de linguagem grande (LLM) enquanto monitora o desempenho do robô. Com base nisso, a Microsoft não tem nenhum caso de ajuste fino, o conhecimento do LLM é usado para controlar robôs de diferentes formas para realizar várias tarefas.

Entende-se que o experimento atual foi capaz de inserir comandos na caixa de diálogo ChatGPT para permitir que ele controle o robô para encontrar "bebidas saudáveis", "coisas com açúcar e sinais vermelhos" (neste caso, uma lata de Coca-Cola) em a sala. , e um espelho para selfies de drones.

Acontece que o ChatGPT pode realmente fazer muito por conta própria, mas algumas melhorias técnicas são necessárias, incluindo, entre outras, estruturas de prompt especiais, APIs avançadas e feedback humano via texto. A Microsoft acredita que seus esforços atuais são apenas uma mudança na maneira como desenvolvem sistemas de bots. começou, e espero que mais pesquisadores entrem neste campo excitante.