+8618665898745

Acelerando a evolução dos robôs humanóides: dois anos de evolução

Apr 08, 2025

O apito soprou, o placar parou às 9: 0, e a acelerada Evolution Humanoid Robot T1 venceu o troféu do campeonato da final do grupo de adultos do Aberto da Alemanha Robocup. Cheng Hao percebeu o sonho do campeonato que começou com o time de Tsinghua Vulcan.

Robocup é conhecido como a "Copa do Mundo de Robôs". A equipe de Tsinghua Vulcan foi fundada por Zhao Mingguo e participou da competição por muitos anos. Os membros vêm de seu laboratório de robótica. Cheng Hao, que se formou no Departamento de Automação da Universidade de Tsinghua, foi o terceiro capitão. Sua experiência de liderar a equipe a conquistar o terceiro lugar no tamanho adolescente do grupo humanóide durante o período de seu estudante foi o ponto de partida de seu sonho de robô e um arrependimento remanescente.

Sua trajetória de carreira após a formatura parecia se desviar de sua intenção original: Cheng Hao fundou o "Chao Xi Calendário" e se tornou vice -presidente de produtos Feishu depois de ser adquirido pela Bytedance. No entanto, o avanço tecnológico do chatgpt3. 0 em 2023 permitiu que ele capturasse profundamente o ponto de virada da chave. A combinação da capacidade de emergência de grandes modelos e controle de movimento do robô está reconstruindo a lógica subjacente da inteligência incorporada. Cheng Hao percebeu que as oportunidades criadas por grandes modelos para robôs humanóides são diferentes de qualquer momento anterior da história. "O general IA surgiu e se tornará multimodal, com percepção e influência no mundo físico, exigindo novas transportadoras de hardware".

Esse olfato fez Cheng Hao fundou a evolução acelerada em agosto de 2023, recrutando muitos ex -membros da equipe da Vulcan como pessoal de P&D e convidou seu professor Zhao Mingguo para se juntar como cientista -chefe. Cerca de um ano depois, o primeiro produto de robô humanóide acelerado da Evolution T1 foi "nascido", confirmando seu julgamento prospectivo.

Assim que T1 nasceu, "voltou" ao campo de futebol familiar para Cheng Hao quase imediatamente. Este jovem empreendedor, que nasceu e foi criado em Pequim, está determinado a começar no cenário do futebol e gradualmente perceber a generalização inteligente dos robôs humanóides.

"O aprendizado de reforço de robôs é semelhante ao das crianças que aprendem a andar, de rastejar a levantar e caminhar, de cambalear a caminhar de forma constante e depois subir encostas, degraus e até pular. É exatamente isso no mundo virtual, treinar vários robôs por algumas horas é equivalente a 10 anos para humanos". Cheng Hao disse a repórteres.

T1 venceu a Copa do Mundo Robocup pela segunda vez

Em março, na final adulta do Robocup German Open, o T1 acelerado enfrentou o alemão suado alemão como a equipe azul. No campo, um T1 na frente parecia "prever" a rota de bloqueio do oponente, ignorou a equipe vermelha que era uma cabeça mais alta que ela, tocou a bola primeiro e marcou um gol. A pontuação desse duelo foi finalmente trancada às 9: 0, e a equipe Tsinghua Vulcan venceu o campeonato com um selo zero. Cheng Hao atualizou seu próprio registro de participação.

Em julho de 2024, ele voltou ao campo de Robocup novamente em nome da equipe Tsinghua Vulcan. Comparado com seus dias de estudante, Cheng Hao não é mais apenas um desenvolvedor de robôs. Do laboratório para a arena, ele completou uma transição importante no paradigma cognitivo. Nesse momento, o T1 não poderia persistir em "jogar" o jogo inteiro. Muitos robôs "Lamed" e caíram por causa do calor das articulações. Ao colidir com outros robôs, houve até uma desconexão entre o controle principal e as articulações, e todo o robô foi desligado e desligado. "Se quebrar, você terá que substituí -lo imediatamente." Cheng Hao preparou 10 robôs para uma partida de 2v2, mas acabou perdendo para o time americano campeão.

Cheng Hao não foi desencorajado por não vencer o primeiro jogo. "Se você não é alto o suficiente, pode compensar isso com suas habilidades. Dominar o tribunal não é um sonho!" Após o jogo, essa frase foi escrita no artigo de resumo do relato público do WeChat da evolução acelerada como o lema de T1.

"A concha de tórax de plástico e a concha da cabeça do robô quebrarão depois de serem esbarrados." Isso deu a Cheng Hao uma dor de cabeça. Otimizando materiais, experimentos contínuos, não menos que dezenas de tentativa e erro, mesmo usando uma bola 10-20 kg, caindo de uma altura de dois metros, Cheng Hao finalmente encontrou materiais "resistentes" e resistentes a queda em uma ruína. Cheng Hao os misturou em motores, engrenagens redutoras, rolamentos, suportes e outros componentes, e o T1 tinha uma nova "pele".

O atrito e a colisão são inevitáveis ​​nas competições judiciais. Para permitir que o controle principal funcione de forma estável e não perca a energia sob o estado de alta vibração após a luta livre, Cheng Hao otimizou o design de hardware incorporado e equipamentos de teste de vibração e queda especialmente desenvolvidos. Este dispositivo pode atingir uma frequência de duas forças de pico por segundo por 20 horas. "Selecionaremos algumas juntas de cada lote para testes. Se eles puderem sobreviver a 20 horas de impacto sem danos, atenderão aos requisitos".

Como um robô pode se levantar rapidamente após ser atingido? Para esse fim, Cheng Hao itera continuamente o algoritmo para se levantar. Costumava levar t 1 10 segundos para se levantar, mas agora pode se levantar em um segundo, e a taxa de sucesso também se aproximou de 100% de 50%.

Em um experimento, 6 T1s jogaram 3v3 um contra o outro. Após 20 jogos consecutivos, a maioria das articulações não foi danificada e não foram necessários "substitutos" para salvar o jogo. Após o experimento, o T1 estava cheio de confiança e "retornou" à arena de Robocup novamente, tornando -se "resistente" e resistente a cair e "flexível" para se levantar, vencendo a Copa do Campeonato em um golpe.

Por outro lado, a maioria dos competidores (robôs) ainda não suportava a colisão. Por esse motivo, o evento ajustou temporariamente as regras de permitir certas colisões para proibir colisões.

A primeira etapa do fórum de Zhongguancun foi incrível

T1 was officially unveiled in August 2024. Cheng Hao said that with the support of the Beijing Municipal Government, this smart device carrying cutting-edge technology has quickly become a "city technology business card", frequently attending international events as a "facade" to show its prowess, and will also be stationed in iconic venues such as the Water Cube to achieve technical iteration and upgrades through high-standard robot competitions.

Em outubro de 2024, o T1 iniciou a produção e a remessa em massa e concluiu a entrega da 100ª unidade no início de março deste ano, marcando que o T1 entrou oficialmente na faixa rápida da industrialização.

O fórum de ZhongGugancun, em março deste ano, tornou -se um estágio para exibir sua força técnica. T1 "participou" no fórum de Zhongguancun pela primeira vez, acelerando sua evolução. Mais de uma dúzia de máquinas foram despachadas para aparecer juntas. Alguns deles apareceram no estágio de abertura, realizando flexões e levantando-se no local, enquanto outros estavam na entrada do fórum principal para receber os hóspedes, atuaram como anfitriões em sub-fumantes ou jogavam futebol na sala de exposições e apresentou perfeitamente a sabedoria coletiva de inteligência artificial por meio de operações colaborativas.

De uma perspectiva técnica, o T1 usa um algoritmo de controle de movimento de aprendizado de reforço nas "pernas" do robô. Dezenas de milhares de robôs são treinados em um ambiente de dados simulado ao mesmo tempo, "caminhando" por vários ambientes, como etapas, encostas, superfícies suaves e estradas difíceis. Cheng Hao disse aos repórteres: "O aprendizado de reforço de robôs é semelhante ao das crianças que aprendem a andar, de rastejar a levantar e caminhar, de cambalear a caminhar de forma constante e depois subir as encostas, degraus e até pular. É exatamente isso no mundo virtual, vários robôs treinando por algumas horas são equivalentes a 10 anos para 10 anos".

Cheng Hao apontou que o Robot Learning também tem um mecanismo de recompensa e punição ", mas o modelo é mais complicado". Somente o modelo de resultado com bom desempenho de treinamento tem a oportunidade de ser implantado na máquina real, e uma série de algoritmos é usada para reduzir a lacuna da simulação para o ambiente real. "Nosso algoritmo atual de controle de movimento não apenas controla as pernas, mas também espera controlar as articulações de todo o corpo para se mover juntos, como fazer um tiro poderoso. Isso requer a introdução de algoritmos de aprendizado de imitação, permitindo que os robôs imitem homens de aderência em um ambiente simulado e depois consolidar o aprendizado de reforço".

A inteligência incorporada grande modelo ainda tem deficiências, mas pertence ao "futuro" da indústria

Cheng Hao adora jogar futebol, e seu robô também joga futebol.

"Robôs jogando futebol é um cenário experimental altamente eficiente". Cheng Hao acredita que os robôs que jogam futebol exigem capacidade visual. Além de identificar sua própria posição de campo, eles também precisam identificar objetos como a bola e o objetivo. Ao mesmo tempo, eles também precisam de capacidade de tomada de decisão para julgar se são atacantes, médios ou defensores: "O que eles fazem será diferente". Além disso, eles devem ajustar constantemente suas decisões e cooperar uma com a outra à medida que os robôs do oponente se movem. Os robôs que jogam futebol também enfatizam o controle de movimento e exigem alta habilidade atlética, como caminhar, girar, atirar e se levantar. "Assim como os jogadores de futebol, suas qualidades são relativamente abrangentes".

Aos olhos de Cheng Hao, os cenários de futebol e vida têm requisitos semelhantes para alguns algoritmos subjacentes de percepção e tomada de decisão, como reconhecimento de objetos, rastreamento, posicionamento e prevenção de obstáculos na tomada de decisões. Ele acredita que "a partir dos cenários de futebol não requer muita preocupação com questões de segurança, e é relativamente econômico".

"Através de robôs jogando futebol, estamos constantemente pesquisando novos algoritmos de controle de movimento, percepção e tomada de decisão". Embora Cheng Hao acredite que a inteligência incorporada atual do modelo grande ainda tem deficiências, ele pertence à direção futura da indústria.

"Eu acho que é mais fácil iniciar um negócio em Pequim e expandi -lo. O custo de mão de obra e site pode ser mais caro, e a equipe precisa obter melhores renda e financiamento". Cheng Hao disse. Em 2024, a evolução acelerada recebeu uma rodada de financiamento pré-uma, financiada em conjunto pela cidade científica de Zhongguancun e outras instituições. O número de empresas de modelos básicas de Pequim, densidade de talentos e apoio à cena também lhe deu confiança no futuro.

Ele acredita que a afirmação de Musk de que os robôs humanóides atingirão 10 bilhões de unidades, e haverá vários modelos ao mesmo tempo ", fábricas, empresas e famílias as têm", mas isso pode levar 10 ou 20 anos. Cheng Hao lembra que o primeiro computador da comunidade quando era criança valia 10, 000 yuan, "naquela época, uma casa na comunidade também tinha 10, 000 yuan".

Mas os computadores, que antes eram equivalentes a edifícios, não estão mais fora de alcance. O som dos teclados pode ser ouvido um após o outro em edifícios de escritórios, e até a loja de conveniência no andar de baixo pode usar computadores para verificar. No futuro, os robôs humanóides também podem permanecer na janela da rua como "Clara e The Sun", esperando Qiao Xi para levá -los para casa.

Você pode gostar também

Enviar inquérito