AI Inferencing

Bénéficiez d'une IA efficace et réactive

Inférence de l'IA haute performance à faible coût

Le marché passe de l'entraînement de l'IA à l'inférence, et les entreprises ont besoin d'informations en temps réel à moindre coût et rapidement. Le cloud d'Akamai répond à ces exigences en mettant la puissance de l'IA à la portée de vos utilisateurs. Avec des dizaines d'années d'innovation en bordure de l'Internet et un réseau solide et mondial optimisé pour des performances à faible latence, le cloud d'Akamai est la plateforme idéale pour l'inférence de l'IA.

Simplifiez vos modèles d'IA d'entreprise pour les rendre réactifs et économiques

ai inference performance icon

Des performances inégalées

Exécutez les charges de travail d'inférence de l'IA au plus près des utilisateurs, ce qui réduit la latence jusqu'à 80 % par rapport aux solutions cloud centralisées.

Rentabilité

Utilisez des options économiques de calcul du processeur graphique (GPU) et du processeur (CPU) pour héberger des modèles d'IA et permettre une inférence rapide sur le réseau d'Akamai.

ai inference scale icon

Évolutivité

Déployez une large gamme de modèles d'IA sur notre réseau cloud décentralisé et mondial.

Fonctionnalités

  • Machines virtuelles (VM) — CPU, GPU, VPU pour le calcul
  • GPU spécialisé — GPU Nvidia RTX 4000 ADA, optimisés pour l'inférence
  • EdgeWorkers — Exécutez un code léger pour l'inférence en bordure de l'Internet
  • Conteneurs — Orchestration efficace des applications conteneurisées K8s avec le moteur Linode Kubernetes (LKE) pour une évolutivité hautes performances
  • Plateforme Akamai App — Lancez rapidement des applications d'IA sur un cadre Kubernetes
  • Stockage — Accès aux données via le stockage en mode bloc, le stockage en mode objet, EdgeKV à faible latence et les bases de données gérées
  • Mise en réseau — Gestion du trafic, équilibrage de la charge et contrôle sécurisés
Cas d'utilisation d'AI Inferencing

Systèmes de paiement intelligents

Transformer l'expérience de paiement dans le secteur du commerce de détail

Permettre une prise de décision en temps réel en magasin, à l'aide des flux vidéo des caméras de paiement. Utilisez des modèles avancés de détection et de reconnaissance d'objets, entraînés sur différents ensembles de données de produits de détail, et déployés en bordure de l'Internet pour une identification et une tarification instantanées des produits grâce à l'inférence de l'IA. Cela permet d'accélérer considérablement le processus de paiement et de réduire les erreurs liées à l'analyse manuelle.

Publicité dynamique

Hyper-personnalisation des publicités dynamiques dans des lunettes de réalité augmentée

Diffusez des publicités personnalisées grâce à des systèmes de recommandation sophistiqués qui prennent en compte des indicateurs (tels que le comportement de l'utilisateur en temps réel, les données démographiques et l'historique de l'utilisateur) afin de favoriser l'engagement de l'utilisateur et d'améliorer considérablement la pertinence des publicités et les taux de conversion. 

Tirez parti de modèles entraînés à partir de nombreuses données sur le comportement des utilisateurs, déployés sur des sites en bordure de l'Internet, à proximité d'environnements de commerce de détail, pour analyser les interactions des utilisateurs en temps réel et leur proposer des recommandations de produits instantanées et adaptées au contexte. Cela peut améliorer fortement l'expérience d'achat.

Contrôle automatique de la qualité

Flux vidéo contrôlé par l'IA pour détecter les défauts de fabrication

Permettez un contrôle automatique de la qualité en temps réel au sein des processus de fabrication, qui tire parti de l'IA dans les inspections de la qualité des produits, directement sur la chaîne d'assemblage via les flux des caméras. Grâce à des modèles de vision par ordinateur de pointe, pré-entraînés sur de vastes ensembles de données d'images de produits présentant ou non des défauts, ces modèles sont capables d'identifier rapidement les problèmes. Cette solution repose sur une inférence de l'IA hautes performances pour émettre des alertes en temps voulu aux opérateurs et réduire considérablement le délai entre l'apparition d'un défaut et la mise en place d'une mesure corrective.

Surveillance permanente

Sécurité renforcée grâce à des flux de vidéosurveillance contrôlés par l'IA

Renforcez la sécurité du public et du personnel en analysant les flux vidéo en temps réel pour détecter les activités suspectes, alerter instantanément les autorités ou les équipes de sécurité et lutter rapidement contre les menaces de sécurité.  

Utilisez des modèles avancés de vision par ordinateur ainsi que des modèles de détection d'objets et de réidentification de personnes entraînés et déployés en bordure de l'Internet, pour améliorer votre sécurité grâce à la détection et au suivi immédiats des activités suspectes ou des personnes concernées, ce qui réduit considérablement les temps de réponse du personnel de sécurité.

Ressources

Inférence distribuée : la prochaine frontière de l'IA

Point de vue sur l'évolution du paysage de l'IA et sur les raisons pour lesquelles l'inférence de l'IA est la prochaine frontière.

Cloud distribué : amener l'IA en bordure de l'Internet

Une étude de 2024, menée par Forrester Consulting au nom d'Akamai, explore l'intérêt du cloud distribué parmi les décideurs de stratégie cloud.

Efficacité de l'inférence de l'IA : faites-en plus en dépensant moins

Comme le démontre l'emploi du modèle Stable Diffusion sur le cloud d'Akamai, les coûts d'inférence de l'IA peuvent être réduits jusqu'à 86 %. Découvrez des stratégies pour optimiser les performances et réduire les dépenses.

Découvrez si vous avez droit à 5 000 $ de crédits cloud

Nous vous accompagnons dans les déploiements à grande échelle, les migrations, l'optimisation des applications, les évaluations d'architecture, les audits de sécurité et de fiabilité, et bien plus encore. Pour obtenir de l'aide ou signaler des problèmes liés au compte,  consultez notre page d'assistance.