L’inférence des modèles – phase d’exploitation d’un modèle d’IA déjà entraîné où ce dernier est utilisé pour produire une réponse à partir de nouvelles données – est largement dominée par un grand acteur : Nvidia. Ce dernier mise sur la polyvalence des GPU, capables de servir entraînement et production, avec des gains incrémentaux, plutôt que sur des puces spécialisées. En résultent des coûts et une consommation élevés, mais une simplicité de déploiement et une maturité logicielle que peu d’alternatives arrivent encore à égaler. Pourtant, celles-ci se multiplient dans le paysage. C’est le cas de Positron AI, start-up fondée en 2023 qui lève aujourd’hui 230 millions de dollars en série B pour poursuivre le développement de sa puce d’inférence IA.
Cet article est paru en premier sur usine-digitale.fr
Cet article est paru en premier sur le site https://www.usine-digitale.fr/intelligence-artificielle/ia-generative/comment-une-start-up-specialisee-dans-linference-tente-de-bousculer-le-marche-le-cas-de-positron-ai-qui-leve-230-millions-de-dollars.JIHMFWMI3ZBD5FD5YJMEHR6J4E.html
