A strartup chinesa DeepSeek abanou a economia dos EUA, ao lançar um novo modelo de Inteligência Artificial (IA) que compete com os melhores modelos norte-americanos. “E agora?”
Ao longo dos últimos dois anos, os modelos de IA de empresas como a OpenAI, a Google e a Meta tornaram-se capazes de realizar tarefas cada vez mais complexas. Para o conseguir, as empresas tecnológicas gastaram dezenas de milhares de milhões de dólares no desenvolvimento da IA.
Mas, sem que (aparentemente) nada fizesse prever, no dia 20 de janeiro, a startup chinesa DeepSeek disponibilizou gratuitamente o seu modelo R1, publicou um artigo que demonstra o impressionante desempenho da IA e tudo mudou.
O modelo da DeepSeek teve um desempenho comparável ao do modelo 01 da OpenAI em vários testes de matemática e de codificação. Isto não seria um choque, se não o tivesse conseguido sendo 20 a 50 vezes mais barato de treinar e utilizando significativamente menos recursos de computação.
Esta invenção poderia ajudar mais organizações e empresas a beneficiar dos serviços de IA. E o facto de ser de código aberto e disponível gratuitamente poderia forçar os concorrentes dos EUA a baixar os seus próprios preços.
A DeepSeek tem sido bastante transparente na publicação dos seus resultados, nos testes de referência. No entanto, ainda não se sabe exatamente até que ponto o modelo da DeepSeek se compara com os principais modelos dos EUA.
Afinal, este “bicho-papão” pode não ser tão revolucionário como parece.
Como notou a New Scientist, o modelo tem certos preconceitos incorporados na sua formação que se destinam a cumprir as restrições do governo chinês, como, por exemplo, evitar a discussão do tratamento da minoria étnica uigur e seguir a linha do Partido Comunista Chinês sobre o estatuto político de Taiwan.
A DeepSeek tem acesso a recursos de computação chineses e estrangeiros armazenados na nuvem – que não estão sujeitos aos controlos de exportação dos EUA que têm procurado limitar a utilização de chips americanos na China. Esses recursos provavelmente ajudaram a startup a descobrir técnicas mais eficientes, gerando primeiro dados de treino sintéticos e permitindo depois uma ampla experimentação de tentativa e erro.
Apesar destes controlos de exportação dos EUA, a empresa também teve acesso a uma geração recente de chips de IA. O DeepSeek treinou seus modelos de IA em chips NVIDIA H800 que foram projetados para contornar os controles de exportação dos EUA mais antigos e menos eficazes, eles apontaram.
No entanto…
“O verdadeiro teste vem quando esses centros de dados precisam de atualização ou expansão – um processo que será mais fácil para as empresas americanas, mas desafiador para as empresas chinesas sob os controlos de exportação dos EUA“, consideraramm Lennart Heim, da RAND Corporation, e Sihao Huang, da Universidade de Oxford, apontam, citados pela New Scientist.
“O momento Sputnik da IA”?
“Se o DeepSeek não vai perturbar completamente o mundo da IA com base nos EUA, porque é que o mercado de tecnologia dos EUA e os investidores estão em pânico? – questiona a New Scientist.
A mesma revista aponta que, nos últimos anos, criou-se uma bolha de propaganda da IA, que levou a avaliações elevadíssimas das empresas tecnológicas; e compara o cenário atual ao “momento Sputnik” em que a União Soviética surpreendeu os EUA ao lançar o primeiro satélite artificial para o espaço.
Nesse caso, os EUA estavam de facto a par da URSS em termos de tecnologia espacial e bem cientes dos progressos soviéticos. Só o público é que não tinha conhecimento, devido ao secretismo do governo americano.
Há uma forma de este momento refletir a era do Sputnik: pode ser uma situação em que uma história sensacionalista provoque uma reação exagerada do público e, “às escondidas”, estimule mais despesas dos EUA com a IA.