Breaking
15 Mar 2025, Sat

Alibaba lança IA Qwen 2.5-Max e declara superioridade sobre DeepSeek-V3, GPT-4o e Llama-3.1-405B

Manchester CIty ENG


A Alibaba, uma das maiores empresas de tecnologia da China, anunciou no dia 29 de janeiro de 2025 o lançamento de seu mais recente modelo de inteligência artificial, o Qwen 2.5-Max. Segundo a companhia, essa nova versão do seu modelo de IA supera concorrentes poderosos, incluindo o DeepSeek-V3, desenvolvido pela startup chinesa DeepSeek, além de modelos de referência como o GPT-4o, da OpenAI, e o Llama-3.1-405B, da Meta. A revelação foi feita pela unidade de computação em nuvem da Alibaba por meio da rede social chinesa WeChat, chamando a atenção da indústria global de IA.

O lançamento do Qwen 2.5-Max ocorre em um período de intensa disputa tecnológica, especialmente após o crescimento vertiginoso da DeepSeek, que surpreendeu o setor nas últimas semanas. Em 10 de janeiro de 2025, a startup lançou o DeepSeek-V3, um assistente de IA de código aberto altamente avançado. Apenas dez dias depois, em 20 de janeiro, apresentou ao mercado o modelo DeepSeek-R1, ampliando sua influência no cenário de IA. Esses lançamentos geraram forte impacto no Vale do Silício e fizeram com que ações de diversas empresas de tecnologia registrassem quedas expressivas.

A resposta rápida da Alibaba ao crescimento da DeepSeek demonstra como a competitividade na corrida pela inteligência artificial está se intensificando. A empresa chinesa não apenas aprimorou seu modelo, mas também garantiu que sua nova versão atendesse a uma ampla gama de necessidades, incluindo avanços em linguagem, raciocínio lógico, matemática e programação.

A escalada da DeepSeek e a reação do setor de IA

A DeepSeek surgiu como um fenômeno disruptivo no setor de IA. Fundada por Liang Wenfeng, a empresa se destacou ao desenvolver modelos de código aberto de alta performance e acessibilidade. O DeepSeek-V3, por exemplo, se consolidou rapidamente como uma das soluções mais avançadas do mercado, contando com 671 bilhões de parâmetros. A adoção massiva desse modelo por desenvolvedores e empresas aumentou a influência da DeepSeek e colocou grandes concorrentes, como Alibaba e ByteDance, sob pressão para atualizar seus próprios modelos de IA.

O impacto da DeepSeek foi tão significativo que, dois dias após o lançamento do DeepSeek-R1, a ByteDance, dona do TikTok, anunciou uma nova versão do seu modelo de IA. Segundo a ByteDance, a atualização superava o o1, modelo da OpenAI, em testes de compreensão e resposta a instruções complexas. Essa corrida por superioridade na IA demonstra como a DeepSeek redefiniu o ritmo de inovação no setor.

A DeepSeek também afetou o mercado de forma indireta ao iniciar uma guerra de preços entre as grandes empresas de tecnologia chinesas. Quando lançou o DeepSeek-V2, em maio de 2024, a empresa adotou uma estratégia agressiva, cobrando apenas 1 iuan (US$ 0,14) por milhão de tokens, um valor consideravelmente menor do que o praticado por concorrentes. Esse modelo barato forçou gigantes como Alibaba, Tencent e Baidu a reduzirem drasticamente os preços de seus próprios serviços de IA. A Alibaba, por exemplo, anunciou cortes de até 97% em alguns de seus modelos de IA logo após a estreia do DeepSeek-V2.

O que diferencia o Qwen 2.5-Max

Com o Qwen 2.5-Max, a Alibaba pretende retomar a liderança na corrida pela IA na China e no cenário global. A empresa afirma que o modelo é capaz de:

  • Melhorar a compreensão de linguagem: O Qwen 2.5-Max apresenta um avanço significativo na capacidade de interpretar e gerar textos complexos.
  • Aprimorar o raciocínio lógico e matemático: O modelo supera seus concorrentes em desafios matemáticos e de lógica, tornando-se uma ferramenta poderosa para aplicações técnicas.
  • Ter maior eficiência energética: A Alibaba destacou que seu novo modelo consome menos energia do que as versões anteriores, tornando-o mais acessível e sustentável.
  • Superar benchmarks globais: A empresa chinesa declarou que o Qwen 2.5-Max teve desempenho superior ao DeepSeek-V3, GPT-4o e Llama-3.1-405B em uma ampla gama de testes.

O impacto das restrições de exportação dos EUA

As restrições impostas pelos Estados Unidos à exportação de chips avançados para a China forçaram as empresas chinesas a investirem em soluções alternativas para a construção de modelos de IA. Embora não tenham acesso aos processadores mais avançados da NVIDIA, as empresas chinesas desenvolveram novas abordagens para treinar modelos poderosos, aproveitando arquiteturas otimizadas e infraestrutura de servidores aprimorada.

O caso da DeepSeek ilustra bem essa resiliência. Mesmo sem os chips mais modernos, a startup conseguiu lançar modelos competitivos que rivalizam com aqueles desenvolvidos nos Estados Unidos. Esse avanço motivou empresas como Alibaba e ByteDance a intensificarem seus investimentos na pesquisa e desenvolvimento de IA, reduzindo sua dependência de tecnologias estrangeiras.

O modelo de negócios enxuto da DeepSeek e a resistência das grandes corporações

A DeepSeek opera de maneira bastante diferente das grandes empresas de tecnologia chinesas. Enquanto gigantes como Alibaba e Tencent possuem centenas de milhares de funcionários, a DeepSeek adota um modelo enxuto, com uma equipe formada principalmente por jovens graduados e doutorandos de universidades de prestígio.

Liang Wenfeng afirmou em entrevistas que acredita que grandes empresas podem não estar preparadas para o futuro da IA, devido às suas estruturas hierárquicas rígidas e altos custos operacionais. A DeepSeek, em contrapartida, aposta em flexibilidade e eficiência, o que lhe permitiu crescer rapidamente e desafiar empresas muito maiores.

Apesar dessa abordagem inovadora, a DeepSeek ainda enfrenta desafios, especialmente no que diz respeito à censura governamental na China. O chatbot da empresa é programado para evitar responder perguntas sensíveis relacionadas à política chinesa. Essa restrição ocorre por meio de um sistema de censura de dois níveis, onde as respostas são geradas e, em seguida, revisadas por um filtro adicional antes de serem apresentadas ao usuário. No entanto, em alguns casos, pesquisadores descobriram formas de contornar essa barreira utilizando diferentes idiomas ou reformulando as perguntas.

A resposta do mercado global

O sucesso da DeepSeek teve um impacto direto no mercado financeiro global. A ascensão rápida da startup levou à maior perda de valor de mercado da NVIDIA em um único dia na história, evidenciando como a inovação no setor de IA pode influenciar fortemente as bolsas de valores.

Especialistas compararam esse momento ao “Sputnik da IA”, referindo-se ao evento histórico em que a União Soviética lançou o primeiro satélite artificial, forçando os Estados Unidos a acelerarem sua corrida espacial. Da mesma forma, a ascensão da DeepSeek pode estar forçando as empresas ocidentais a reavaliar suas estratégias para não perder terreno.

A Alibaba, por sua vez, responde a esse cenário com uma abordagem agressiva. O lançamento do Qwen 2.5-Max no primeiro dia do Ano Novo Lunar indica o nível de urgência da empresa para manter sua relevância no setor. Enquanto a maioria dos trabalhadores chineses estava de folga, a gigante da tecnologia fez questão de divulgar sua nova IA, destacando a pressão que sente para acompanhar as rápidas mudanças do mercado.

A corrida da IA está longe de terminar

Com o avanço constante de empresas chinesas no setor de IA, a competição entre Alibaba, DeepSeek, ByteDance e outras gigantes deve se intensificar ainda mais. A expectativa é que novos modelos de IA sejam lançados nos próximos meses, tornando a disputa ainda mais acirrada.

A batalha pelo domínio da inteligência artificial segue em ritmo acelerado, e a cada novo avanço, o impacto sobre os mercados globais e o setor de tecnologia se torna mais evidente.

A Alibaba, uma das maiores empresas de tecnologia da China, anunciou no dia 29 de janeiro de 2025 o lançamento de seu mais recente modelo de inteligência artificial, o Qwen 2.5-Max. Segundo a companhia, essa nova versão do seu modelo de IA supera concorrentes poderosos, incluindo o DeepSeek-V3, desenvolvido pela startup chinesa DeepSeek, além de modelos de referência como o GPT-4o, da OpenAI, e o Llama-3.1-405B, da Meta. A revelação foi feita pela unidade de computação em nuvem da Alibaba por meio da rede social chinesa WeChat, chamando a atenção da indústria global de IA.

O lançamento do Qwen 2.5-Max ocorre em um período de intensa disputa tecnológica, especialmente após o crescimento vertiginoso da DeepSeek, que surpreendeu o setor nas últimas semanas. Em 10 de janeiro de 2025, a startup lançou o DeepSeek-V3, um assistente de IA de código aberto altamente avançado. Apenas dez dias depois, em 20 de janeiro, apresentou ao mercado o modelo DeepSeek-R1, ampliando sua influência no cenário de IA. Esses lançamentos geraram forte impacto no Vale do Silício e fizeram com que ações de diversas empresas de tecnologia registrassem quedas expressivas.

A resposta rápida da Alibaba ao crescimento da DeepSeek demonstra como a competitividade na corrida pela inteligência artificial está se intensificando. A empresa chinesa não apenas aprimorou seu modelo, mas também garantiu que sua nova versão atendesse a uma ampla gama de necessidades, incluindo avanços em linguagem, raciocínio lógico, matemática e programação.

A escalada da DeepSeek e a reação do setor de IA

A DeepSeek surgiu como um fenômeno disruptivo no setor de IA. Fundada por Liang Wenfeng, a empresa se destacou ao desenvolver modelos de código aberto de alta performance e acessibilidade. O DeepSeek-V3, por exemplo, se consolidou rapidamente como uma das soluções mais avançadas do mercado, contando com 671 bilhões de parâmetros. A adoção massiva desse modelo por desenvolvedores e empresas aumentou a influência da DeepSeek e colocou grandes concorrentes, como Alibaba e ByteDance, sob pressão para atualizar seus próprios modelos de IA.

O impacto da DeepSeek foi tão significativo que, dois dias após o lançamento do DeepSeek-R1, a ByteDance, dona do TikTok, anunciou uma nova versão do seu modelo de IA. Segundo a ByteDance, a atualização superava o o1, modelo da OpenAI, em testes de compreensão e resposta a instruções complexas. Essa corrida por superioridade na IA demonstra como a DeepSeek redefiniu o ritmo de inovação no setor.

A DeepSeek também afetou o mercado de forma indireta ao iniciar uma guerra de preços entre as grandes empresas de tecnologia chinesas. Quando lançou o DeepSeek-V2, em maio de 2024, a empresa adotou uma estratégia agressiva, cobrando apenas 1 iuan (US$ 0,14) por milhão de tokens, um valor consideravelmente menor do que o praticado por concorrentes. Esse modelo barato forçou gigantes como Alibaba, Tencent e Baidu a reduzirem drasticamente os preços de seus próprios serviços de IA. A Alibaba, por exemplo, anunciou cortes de até 97% em alguns de seus modelos de IA logo após a estreia do DeepSeek-V2.

O que diferencia o Qwen 2.5-Max

Com o Qwen 2.5-Max, a Alibaba pretende retomar a liderança na corrida pela IA na China e no cenário global. A empresa afirma que o modelo é capaz de:

  • Melhorar a compreensão de linguagem: O Qwen 2.5-Max apresenta um avanço significativo na capacidade de interpretar e gerar textos complexos.
  • Aprimorar o raciocínio lógico e matemático: O modelo supera seus concorrentes em desafios matemáticos e de lógica, tornando-se uma ferramenta poderosa para aplicações técnicas.
  • Ter maior eficiência energética: A Alibaba destacou que seu novo modelo consome menos energia do que as versões anteriores, tornando-o mais acessível e sustentável.
  • Superar benchmarks globais: A empresa chinesa declarou que o Qwen 2.5-Max teve desempenho superior ao DeepSeek-V3, GPT-4o e Llama-3.1-405B em uma ampla gama de testes.

O impacto das restrições de exportação dos EUA

As restrições impostas pelos Estados Unidos à exportação de chips avançados para a China forçaram as empresas chinesas a investirem em soluções alternativas para a construção de modelos de IA. Embora não tenham acesso aos processadores mais avançados da NVIDIA, as empresas chinesas desenvolveram novas abordagens para treinar modelos poderosos, aproveitando arquiteturas otimizadas e infraestrutura de servidores aprimorada.

O caso da DeepSeek ilustra bem essa resiliência. Mesmo sem os chips mais modernos, a startup conseguiu lançar modelos competitivos que rivalizam com aqueles desenvolvidos nos Estados Unidos. Esse avanço motivou empresas como Alibaba e ByteDance a intensificarem seus investimentos na pesquisa e desenvolvimento de IA, reduzindo sua dependência de tecnologias estrangeiras.

O modelo de negócios enxuto da DeepSeek e a resistência das grandes corporações

A DeepSeek opera de maneira bastante diferente das grandes empresas de tecnologia chinesas. Enquanto gigantes como Alibaba e Tencent possuem centenas de milhares de funcionários, a DeepSeek adota um modelo enxuto, com uma equipe formada principalmente por jovens graduados e doutorandos de universidades de prestígio.

Liang Wenfeng afirmou em entrevistas que acredita que grandes empresas podem não estar preparadas para o futuro da IA, devido às suas estruturas hierárquicas rígidas e altos custos operacionais. A DeepSeek, em contrapartida, aposta em flexibilidade e eficiência, o que lhe permitiu crescer rapidamente e desafiar empresas muito maiores.

Apesar dessa abordagem inovadora, a DeepSeek ainda enfrenta desafios, especialmente no que diz respeito à censura governamental na China. O chatbot da empresa é programado para evitar responder perguntas sensíveis relacionadas à política chinesa. Essa restrição ocorre por meio de um sistema de censura de dois níveis, onde as respostas são geradas e, em seguida, revisadas por um filtro adicional antes de serem apresentadas ao usuário. No entanto, em alguns casos, pesquisadores descobriram formas de contornar essa barreira utilizando diferentes idiomas ou reformulando as perguntas.

A resposta do mercado global

O sucesso da DeepSeek teve um impacto direto no mercado financeiro global. A ascensão rápida da startup levou à maior perda de valor de mercado da NVIDIA em um único dia na história, evidenciando como a inovação no setor de IA pode influenciar fortemente as bolsas de valores.

Especialistas compararam esse momento ao “Sputnik da IA”, referindo-se ao evento histórico em que a União Soviética lançou o primeiro satélite artificial, forçando os Estados Unidos a acelerarem sua corrida espacial. Da mesma forma, a ascensão da DeepSeek pode estar forçando as empresas ocidentais a reavaliar suas estratégias para não perder terreno.

A Alibaba, por sua vez, responde a esse cenário com uma abordagem agressiva. O lançamento do Qwen 2.5-Max no primeiro dia do Ano Novo Lunar indica o nível de urgência da empresa para manter sua relevância no setor. Enquanto a maioria dos trabalhadores chineses estava de folga, a gigante da tecnologia fez questão de divulgar sua nova IA, destacando a pressão que sente para acompanhar as rápidas mudanças do mercado.

A corrida da IA está longe de terminar

Com o avanço constante de empresas chinesas no setor de IA, a competição entre Alibaba, DeepSeek, ByteDance e outras gigantes deve se intensificar ainda mais. A expectativa é que novos modelos de IA sejam lançados nos próximos meses, tornando a disputa ainda mais acirrada.

A batalha pelo domínio da inteligência artificial segue em ritmo acelerado, e a cada novo avanço, o impacto sobre os mercados globais e o setor de tecnologia se torna mais evidente.

Leave a Reply

Your email address will not be published. Required fields are marked *