DeepSeek foi “1º choque de realidade” no mercado de IA, diz professor

O mercado global de tecnologia foi abalado por um terremoto desde que a startup chinesa DeepSeek lançou seu modelo de inteligência artificial (IA), um assistente gratuito que utiliza chips de baixo custo, com menos dados, e apresenta um desempenho muito próximo daquele oferecido pelas big techs dos Estados Unidos.

O DeepSeek-R1 mostrou suas credenciais no fim de janeiro, derrubando as ações de gigantes norte-americanas do setor, e rapidamente ultrapassou o ChatGPT, da OpenAI, em número de downloads na Apple Store. Em poucos dias, o assistente chinês de IA foi o mais baixado nas lojas virtuais de 140 países, de acordo com levantamento da Appfigures, que monitora dados do segmento.

A explosão do DeepSeek desafiou a lógica até então estabelecida nos mercados, de que a IA fomentaria a demanda por uma grande cadeia de suprimentos, de fabricantes de chips a data centers. “O fenômeno DeepSeek foi o primeiro grande choque de realidade no mercado de IA desde o lançamento do ChatGPT”, afirma Isac Costa, professor do Insper e especialista em tecnologia, em entrevista ao Metrópoles.

“É difícil cravar que é uma revolução, mas, definitivamente, é o primeiro grande terremoto nesse mercado, para fazer as pessoas começarem a entender, de fato, o que é necessário para que a IA se torne tão presente no nosso dia a dia quanto a eletricidade e a internet.”

Segundo Costa, para além do que pode representar em termos de avanço no desenvolvimento da IA, o DeepSeek tem uma importância estratégica para as principais potências econômicas do planeta, que vêm travando nos últimos anos uma disputa renhida pela supremacia desse mercado.

“Estamos vivendo uma espécie de nova Revolução Industrial”, diz Costa. “Considerando o potencial da inteligência artificial como uma tecnologia de propósito geral, assim como a eletricidade e a internet, sua relevância geopolítica reside no fato de que as maiores economias do mundo precisarão ter uma presença relevante no setor. Com algum exagero, podemos afirmar que é a diferença entre um país se industrializar ou não”, explica.

Na conversa com o Metrópoles, o professor do Insper projeta que empresas severamente impactadas pelo surgimento do DeepSeek – como OpenAI, Nvidia, Google e Meta – se veem agora obrigadas a reagir à altura, o que fatalmente impulsionará o mercado como um todo, acirrando ainda mais a concorrência global, mas a partir de uma nova premissa.

“As empresas norte-americanas precisam repensar a estratégia de monetizar seus produtos de IA caso surjam soluções mais baratas e fáceis de usar, com abrangência elevada de aplicações. Não estamos falando de ‘imitações baratas’, mas de produtos com qualidade igual ou superior, a custos muito menores”, afirma Costa.

“Se as empresas conseguirem reduzir os custos, ainda que em menor escala que o DeepSeek, e criarem ecossistemas virtuosos de utilização, o DeepSeek pode ficar relegado a um nicho mais especializado de usuários ou servir de base para outras soluções.”

Foto posada de Isac Costa, professor do Insper, que veste terno azul escuro e camisa branca - Metrópoles
Isac Costa, professor do Insper e especialista em tecnologia, vê uma “nova Revolução Industrial” com avanço da IA

Leia os principais trechos da entrevista concedida por Isac Costa ao Metrópoles:

Qual é a dimensão do impacto do DeepSeek para o mercado global da IA? É possível dizer que estamos vivendo uma revolução?

É importante destacar que muitos dos investimentos em IA estão sendo realizados por puro “efeito manada”. Sabemos que a disseminação da IA será grande, mas ainda há muitas perguntas em aberto e até mesmo perguntas cruciais que ainda não foram devidamente formuladas. Com isso, a volatilidade das cotações das empresas abertas e do “valuation” [processo de avaliação de ativos para determinar o seu valor de mercado] das empresas fechadas nesse setor se assemelha à de outras bolhas financeiras, criadas por euforia e alimentadas por narrativas exageradas. Por isso, qualquer notícia relevante pode ter um impacto amplificado pela mídia e pelo mercado. Mas isso não minimiza o impacto do DeepSeek, que, de fato, é fundamental para o desenvolvimento do setor.

Alcançar elevado nível de complexidade com custo reduzido de treinamento e de produção de respostas foi o que efetivamente chocou os especialistas. E isso ocorreu justamente quando a OpenAI começou a lançar modelos mais complexos e sinalizou a cobrança de preços maiores. A partir daí, a hipersensibilidade do mercado fez o restante.

Até aqui, os investimentos em IA vêm sendo realizados em uma escala muito elevada. Há dúvidas sobre alguns números que foram divulgados em relação ao treinamento de modelos do DeepSeek, mas, mesmo assim, a percepção do mercado é a de que pode ser possível obter excelentes resultados com um menor volume de investimentos.

Com isso, tanto as empresas de IA quanto as fornecedoras de hardware e energia tiveram um choque de realidade pelo questionamento da ideia de que investimentos maciços são necessários e suficientes para criar e expandir um novo setor, como ocorreu com a tese do metaverso.

O fenômeno DeepSeek foi o primeiro grande choque de realidade no mercado de IA desde o lançamento do ChatGPT, em dezembro de 2022. Sem dúvida, o DeepSeek é um marco relevante. É difícil cravar que é uma revolução, mas, definitivamente, é o primeiro grande terremoto nesse mercado, para fazer as pessoas começarem a entender, de fato, o que é necessário para que a IA se torne tão presente no nosso dia a dia quanto a eletricidade e a internet.

Afinal, o DeepSeek é melhor que o ChatGPT?

Há diferentes critérios para podermos comparar os modelos da DeepSeek e os da OpenAI e outros do setor. Apesar de terem sido divulgadas notícias com respostas supostamente melhores elaboradas pelos modelos da DeepSeek, a efetiva comparação não pode ser feita com base em testes avulsos, mas em rotinas bem definidas, abrangentes e replicáveis, de modo a atestar a qualidade em termos estatísticos e imune a adulterações. Nesse sentido, a principal vantagem da DeepSeek é ter aberto os seus modelos – algo parecido com o que a Meta fez – e divulgado os testes realizados de forma muito mais transparente que OpenAI, Google e Anthropic.

Embora a OpenAI esteja muito à frente no sentido de se tornar uma plataforma por meio da qual diversas empresas baseiam as suas soluções, além de ter um histórico recorrente de evolução dos seus modelos, a transparência e potencial adaptabilidade dos modelos da DeepSeek são seu principal diferencial.

Obviamente, a utilização de hardware mais barato e em menor quantidade para treinar os modelos e produzir as respostas é o diferencial econômico mais relevante no momento. Mas esta é uma vantagem pouco perceptível para o usuário final. De nada adianta você ter um motor muito mais potente e econômico se o chassi é pouco atraente. Isso não significa que a interface de usuário da DeepSeek seja pior, mas apenas que a eficiência pode balizar decisões de investimentos, mas não é condição suficiente para sua adoção em massa.

Para o usuário, ainda é cedo para dizermos que há uma grande vantagem perceptível do DeepSeek. Talvez ele tenha o mesmo chassi do carro, com um motor tão potente quanto os outros, mas que consome muito menos, em termos de poder computacional e hardware.

O DeepSeek causou um terremoto no mercado e derreteu as ações de gigantes de tecnologia. Por que isso aconteceu?

Os papers que documentam a evolução dos modelos do DeepSeek começaram a ser publicados no início de 2024. De fato, muitos que acompanham a evolução das tecnologias de IA de perto não foram surpreendidos com os resultados dos testes. Porém, sabemos que um produto bom não se vende sozinho e podemos afirmar que a divulgação do modelo R1, em janeiro, conseguiu alcançar um público maior, que passou a se debruçar sobre as informações fornecidas, replicou alguns testes e chegou à conclusão de que a solução encontrada foi criativa e inovadora o suficiente para colocar em xeque o paradigma dominante até então.

O mais impressionante foi o fato de que o R1 foi além do modelo V3, divulgado em novembro, ao oferecer a funcionalidade de raciocínio, característica marcante do modelo o1 da OpenAI, em contraste com os GPTs. Esse modelo tem vantagens na resolução de problemas matemáticos e científicos, assim como na geração automática de programas de computador. Não se trata simplesmente de “adivinhar a próxima palavra” – ou, mais precisamente, o próximo token –, mas de elaborar uma estratégia para resolver um problema complexo.

Além do aspecto econômico, qual é a importância geopolítica da IA? De que forma o DeepSeek é estratégico para a China na disputa com os EUA?

Estamos vivendo uma espécie de nova Revolução Industrial. Considerando o potencial da inteligência artificial como uma tecnologia de propósito geral, assim como a eletricidade e a internet, sua relevância geopolítica reside no fato de que as maiores economias do mundo precisarão ter uma presença relevante no setor. Com algum exagero, podemos afirmar que é a diferença entre um país se industrializar ou não.

Dito isso, o debate sobre a IA parece reproduzir a corrida armamentista da época da Guerra Fria – alguns comparam o DeepSeek ao Sputnik soviético. Ao contrário do desenvolvimento da internet, que começou nos EUA e acelerou com base em uma cooperação global, a evolução da IA parece ser marcada por competição em vez de auxílio mútuo. Nesse sentido, o DeepSeek tem uma vantagem estratégica enorme ao abrir o seu modelo e permitir um desenvolvimento colaborativo por programadores e estudantes de todo o mundo, ao contrário dos modelos fechados de OpenAI, Google e Anthropic. A disputa pela adoção em massa lembra, de certo modo, a tentativa de criação de uma moeda dos Brics em face do dólar.

Por isso, a fim de manter seu protagonismo, as empresas norte-americanas precisam repensar a estratégia de monetizar seus produtos de IA caso surjam soluções mais baratas e fáceis de usar, com abrangência elevada de aplicações. Não estamos falando de “imitações baratas”, mas de produtos com qualidade igual ou superior a custos muito menores.

Nesta semana, a Austrália proibiu o uso do DeepSeek em seus dispositivos governamentais alegando que a plataforma oferece riscos à segurança nacional. Essa preocupação tem fundamento?

Uma das maiores preocupações de Estados e empresas com relação a sistemas de inteligência artificial diz respeito à transparência sobre o tratamento conferido aos dados dos usuários. Este não é um problema exclusivo do DeepSeek, mas o fato de ter sido criado no contexto do regime chinês suscita preocupações de ordem geopolítica. Surgem dúvidas, não necessariamente fundadas, à semelhança dos riscos do uso do TikTok por cidadãos americanos. Essas ferramentas estariam compartilhando dados indevidamente com empresas chinesas ou com o governo chinês? Em caso positivo, que dados elas conseguiriam compartilhar?

Outras preocupações envolvem a origem dos dados utilizados para treinar os modelos, com potenciais violações de direitos de propriedade intelectual, e também no tocante à qualidade, de modo a fornecer respostas enviesadas. Nesse sentido, já foram divulgados alguns testes em que o DeepSeek deu respostas evasivas quando questionado sobre temas sensíveis ao governo da China.

A qualidade dos modelos de IA depende da qualidade dos dados utilizados e dos critérios utilizados no treinamento. A opacidade nesses quesitos pode levar à sensação de se estar diante de uma “caixa preta”, o que pode ser perigoso quando um aplicativo se torna o mais baixado em um país. Por isso, a preocupação com a segurança nacional tem fundamento, embora, em muitos casos, o debate seja pautado por enorme ignorância sobre a tecnologia, suas possibilidades e limitações e os efetivos riscos e controles que podem ser adotados para mitigá-los.

Após o “estrago” causado pela DeepSeek, a OpenAI lançou a IA o3-mini, plataforma gratuita e capaz de entregar respostas de qualidade similar à da concorrente chinesa, usando menos processamento de dados do que seus modelos anteriores. A tendência é que as empresas norte-americanas reajam a partir de agora?

A concorrência no setor de IA ficou mais acirrada após o lançamento e viralização do DeepSeek. Google, Anthropic e Meta vinham desenvolvendo soluções diversas, inclusive buscando maior eficiência no uso de hardware ou a adoção de um código aberto, no caso da Meta. Tendo em vista seus planos para obter um “valuation” recorde e abrir capital, a OpenAI se viu obrigada a reagir imediatamente e é possível que vejamos uma aceleração de lançamentos como se aumentássemos o número de postagens no feed de uma rede social para tentar ofuscar um post viral que ficou para trás – no caso, o DeepSeek.

Como a memória do mercado costuma ser curta, uma boa estratégia de comunicação e a oferta de soluções complementares e documentação farta podem fazer com que uma solução menos eficiente seja a mais adotada, em virtude das facilidades e do efeito de rede na sua utilização. Software que vende é o que torna a jornada do usuário a mais suave possível. Se as empresas conseguirem reduzir os custos, ainda que em menor escala que o DeepSeek, e criarem ecossistemas virtuosos de utilização, o DeepSeek pode ficar relegado a um nicho mais especializado de usuários ou servir de base para outras soluções, como o sistema operacional Linux em face do Windows e do MacOS.

Como o Brasil está posicionado no mercado de IA? Qual é o nosso grau de defasagem em relação às maiores potências?

Nosso grau de defasagem é enorme, em termos de hardware e software. Infelizmente, no Brasil, não temos uma indústria de hardware desenvolvida, seja para propósito geral ou equipamentos com finalidades específicas, como é o caso da Nvidia. Esse estado de coisas é reflexo de escolhas históricas ruins e investimentos mal direcionados em educação. Temos excelentes desenvolvedores de software, mas não em uma quantidade capaz de fazer frente aos EUA, à Índia e à China, por exemplo. Os primeiros programas de graduação e pós-graduação em computação com ênfase em IA começaram a aparecer mais recentemente.

Conseguir alcançar uma posição minimamente relevante requer não apenas investimento em dinheiro, mas repensar o papel das universidades, a dinâmica de atualização dos currículos dos cursos, o aperfeiçoamento continuado de docentes e, ainda, as políticas públicas voltadas para pós-graduação e pesquisa. Todas as áreas e temas lutam por recursos públicos sem uma priorização estratégica por parte do governo e há poucos recursos privados direcionados ao tema.

Hoje, no país, se discute muito mais como regular a IA que será importada do que realmente como fazer com que jovens possam ser motivados ou pessoas mais velhas possam redirecionar suas carreiras para temas de fronteira. O Brasil já perdeu tantos “trens” em termos de tecnologia da informação que tenho até dúvidas se realmente o país quer sair do lugar, pois insiste em ser um exportador de commodities. Talvez a solução não seja esperar uma atuação do governo, mas alavancar o empreendedorismo. Ainda assim, esbarramos nos riscos e dificuldades de se empreender no país.

Adicionar aos favoritos o Link permanente.