Pular para o conteúdo principal
BlogComputaçãoPor que a inferência de IA está impulsionando a mudança da Cloud Computing centralizada para a distribuída

Por que a inferência de IA está impulsionando a mudança da Cloud Computing centralizada para a distribuída

Por que a inferência de IA está impulsionando a mudança da computação em nuvem centralizada para a distribuída

As plataformas de nuvem legadas têm se mostrado inestimáveis no treinamento de modelos de IA com grandes volumes de dados. Mas, como as organizações querem dimensionar e otimizar ainda mais os aplicativos de IA, as plataformas legadas estão rapidamente mostrando suas limitações. 

Em um estudo da Forrester encomendado pela Akamai, descobrimos os problemas que os líderes de TI e os desenvolvedores estão enfrentando com as plataformas de nuvem legadas. Muitos concordam que a transferência de recursos de computação para a computação de borda ajudará a reduzir a latência, o uso da largura de banda e o custo na era da inferência de IA.  

Como o treinamento em IA abre caminho para a inferência de IA, precisamos de soluções que possam lidar com o aumento das cargas de trabalho e das necessidades de computação sem prejudicar o desempenho e a experiência do usuário final. 

O que a mudança para a inferência de IA significa para o desenvolvimento de aplicativos 

Com as necessidades de computação da IA prestes a mudar para a inferência em vez de apenas treinamento, o que isso significa para os desenvolvedores no desenvolvimento de aplicativos de IA? 

De acordo com Jack Gold, presidente e analista principal da J.Gold Associates, o equilíbrio entre treinamento e inferência está atualmente em 80% de treinamento e 20% de inferência. Ele prevê que isso mudará nos próximos três anos, com os recursos de computação concentrados em 80% de inferência e apenas 20% de treinamento.  

A inferência de IA é o processo de usar modelos treinados para tirar conclusões e resultados de novos dados. À medida que mais modelos são treinados com conjuntos de dados enormes, o próximo estágio é usar esses modelos para lidar com novas informações para dimensionar os recursos das soluções de IA.  

Isso, aliado às expectativas dos usuários de maior personalização, alto desempenho e uso de dados em tempo real nos aplicativos, significa que as soluções de nuvem atuais devem se adaptar.  

Por que a arquitetura de nuvem principal não consegue acompanhar o ritmo 

O objetivo da inferência de IA é auxiliar nos resultados em tempo real e em uma experiência de usuário mais perfeita nos aplicativos de IA. No entanto, as soluções legadas de nuvem se deparam com um obstáculo ou, mais especificamente, com três desafios principais que dificultam o dimensionamento e a otimização com IA. 

No estudo, revelamos que os principais desafios enfrentados pelos desenvolvedores e líderes de TI são: 

  • Problemas de latência (56% enfrentam atrasos no processamento) 
  • Problemas de custo (60% têm dificuldades com os custos de armazenamento/processamento) 
  • Dificuldades de escalonamento (45% têm problemas de escalonamento) 

"A maioria dos participantes da pesquisa disse que suas estratégias atuais de nuvem prejudicam sua capacidade de criar tomadas de decisão orientadas por dados e em tempo real em seus aplicativos." 

As principais soluções de nuvem já estão lutando para acompanhar os requisitos de dimensionamento e otimização de IA. Então, existe uma solução mais eficaz? 

A computação de borda aproxima o processamento de dados do usuário final, reduzindo os problemas de latência e melhorando o desempenho, permitindo que os desenvolvedores dimensionem os aplicativos com mais eficiência.  

No entanto, até mesmo isso tem seus desafios, incluindo preocupações com conformidade e regulamentação, bloqueio de fornecedores e dificuldades para contratar e reter talentos técnicos com as habilidades relevantes. A computação de borda normalmente usa diferentes abordagens arquitetônicas, protocolos especializados e diferentes fornecedores, causando complexidades operacionais e maior risco comercial. 

Cloud Computing distribuída como o próximo estágio do desenvolvimento de aplicativos de IA  

Uma solução alternativa que está ganhando força rapidamente entre os líderes de TI é a computação em nuvem distribuída. Mais da metade dos entrevistados nesse estudo disse que atualmente estava autogerenciando alguma forma de arquitetura distribuída. 

A maioria disse que suas estratégias atuais de nuvem estão prejudicando sua capacidade de criar tomadas de decisão orientadas por dados e em tempo real em seus aplicativos devido aos custos de armazenamento e capacidade de processamento adicionais e aos atrasos de processamento causados pela alta latência.  

Assim como a computação de borda, a arquitetura de nuvem distribuída permite que os desenvolvedores forneçam dados de locais mais próximos dos usuários, melhorando a latência e o desempenho de aplicativos, bancos de dados em nuvem, mídia de streaming e outras cargas de trabalho.  

A diferença é que, embora faça parte de uma rede distribuída, essa forma de computação em nuvem pode incluir uma variedade de locais diferentes para os dados, incluindo data centers de terceiros, locais no local e locais de nuvem privada.  

À medida que avançamos em direção à inferência de IA, surgirão mais aplicativos e oportunidades de dimensionamento e, com isso, a necessidade de maneiras mais eficientes de lidar com dados.  

Os usuários de aplicativos esperam resultados rápidos e uma experiência perfeita. Ao investir em arquiteturas distribuídas, os desenvolvedores podem atender às demandas de processamento e inferência de dados em tempo real em aplicativos modernos e garantir a vantagem competitiva de sua empresa junto aos usuários. 

Como Cloud Computing distribuída reflete as metas de negócios  

Descobrimos que a flexibilidade de implementar recursos de computação mais próximos dos usuários finais e, ao mesmo tempo, manter o gerenciamento e o controle centralizados, abordou algumas das principais preocupações dos entrevistados da pesquisa, incluindo 

  • 55% disseram que isso resolveria os temores de aumento do risco comercial 
  • 54% disseram que isso ajudaria a proteger contra o aumento dos custos excessivos 
  • 49% disseram que isso melhoraria o tempo lento de obtenção de valor 

O ponto em que a arquitetura de nuvem distribuída supera a computação de borda é que ela facilita a implantação e o gerenciamento de aplicativos de IA com os mesmos conjuntos de habilidades, paradigma arquitetônico e primitivos de nuvem da computação em nuvem principal.  

Além disso, a nuvem distribuída oferece latência reduzida, melhor escalabilidade, confiabilidade aprimorada e maior controle geral sobre os dados ao criar aplicativos.  

É melhor mudar mais cedo do que mais tarde? 

A partir do estudo da Akamai com a Forrester, é importante observar que os líderes de TI e os desenvolvedores de aplicativos estão priorizando metas como inovar em torno da IA, modernizar experiências digitais, personalizar experiências e melhorar o gerenciamento de dados. As vantagens da nuvem distribuída, portanto, estão diretamente ligadas ao que a maioria dos desenvolvedores está buscando.  

Com base nas previsões relacionadas à inferência de IA e em uma tendência crescente de configurações de nuvem distribuída, a mudança para uma abordagem distribuída parece uma escolha óbvia. Fazer a mudança o quanto antes pode ajudá-lo a permanecer competitivo à medida que o mercado e a tecnologia de IA evoluem.  

Para saber mais sobre nosso relatório sobre o futuro da nuvem distribuída em comparação com a computação de borda e as principais arquiteturas de nuvem, faça o download do relatório completo hoje mesmo.

* Nesse estudo da Forrester Consulting encomendado pela Akamai, 163 tomadores de decisão de estratégia de nuvem baseados na América do Norte, dos setores de varejo, mídia e telecomunicações, foram questionados sobre suas opiniões a respeito do estado atual da computação em nuvem. 

Você também pode gostar...

Comentários

Deixe uma resposta

Seu endereço de e-mail não será publicado. Os campos obrigatórios estão marcados com *