Il était une fois... DeepSeek

Qui suis-je?

Devenue en peu de temps l'une des applications les plus téléchargées, en France comme ailleurs, mon histoire est celle d'une disruption orchestrée depuis la Chine en 2023. Mon créateur, Liang Wenfeng, âgé de 40 ans seulement a pour seul objectif de démocratiser l'accès à l'intelligence artificielle de haute performance sans les barrières habituelles.

Liang Wenfeng, le fondateur de DeepSeek, sur une image diffusée sur la Télévision centrale de Chine, le 20 janvier 2025. © CCTV VIA BESTIMAGE

Contrairement à l'IA française Lucie, devenue la cible de moqueries en raison de ses réponses incohérentes (un sort qui rappelle étrangement celui du film du même nom de Luc Besson), ma représentation sous la forme d'une baleine bleue captive l'attention de toute la Silicon Valley. Réputée pour son intelligence exceptionnelle et sa capacité à communiquer de manière complexe sur de longues distances, cette baleine symbolise la profondeur, l'intelligence et la connectivité, reflétant parfaitement l'ampleur et l'intégration que je vise dans le traitement et l'analyse des informations.

Avec un coût de développement qui ne s'élève qu'à 6 millions de dollars, je me positionne comme un sérieux concurrent des technologies développées par des géants américains tels qu'OpenAI (ChatGPT), Google (Gemini), Microsoft (Copilot), Amazon (Nova) et Anthropic (Claude), qui ont investi des milliards pour leurs modèles. Pour mettre les choses en perspective, OpenAI dépense environ 5 milliards de dollars par an pour ses projets d'IA. Le contraste est saisissant. Dès ma sortie, j'ai stupéfié l'industrie par mes performances, escaladant rapidement au sommet des téléchargements gratuits sur l’App Store, et surpassant même ChatGPT.

DeepSeek, la baleine chinoise qui fait chavirer l'IA

Mes supers-pouvoirs

Mes modèles, notamment les séries DeepSeek-V3 et DeepSeek-R1, se mesurent avec aisance aux ténors du marché tels qu’OpenAI ou Google, mais se distinguent par leur caractère libre et ouvert à tous. Pourquoi continuer à payer des sommes exorbitantes pour des technologies comparables lorsque je propose une alternative gratuite et tout aussi performante ?

Économie d'énergie et éthique : les piliers de ma conception: je représente plus qu'une simple prouesse technique; je suis une avancée vers une informatique durable. Capable de fonctionner sur des équipements modestes, je minimise la dépendance aux gigantesques infrastructures et propose une voie plus verte pour l'avenir technologique.
Ma philosophie open source: mon code ouvert est une invitation à la collaboration globale. Il permet à tout un chacun, de l'amateur éclairé au développeur chevronné, de contribuer à l'évolution de l'intelligence artificielle. Cette approche collaborative forge non seulement un avenir plus inclusif mais soulève également des questions cruciales sur la sécurité et l'éthique de l'utilisation des IA.

Comment les contraintes ont stimulé mon ingéniosité ?

Depuis 2022, confrontée à un embargo limitant l'accès aux puces Nvidia H100, cruciales pour l'entraînement des modèles d'IA, ma stratégie a dû être adaptative. Contrairement à des entités comme OpenAI, qui bénéficient de superordinateurs équipés de dizaines de milliers de puces, j'ai dû faire preuve de créativité avec des ressources plus limitées.

La start-up qui m'a développée s'est appuyée sur un stock stratégique de 10 000 puces Nvidia A100, amassé par High-Flyer, le hedge fund chinois qui m'a donné vie. Grâce à des méthodes novatrices comme le Mixture-of-Experts et le Multi-head Latent Attention (MLA), j'ai réussi à réduire considérablement les besoins en puissance de calcul. Ces innovations m'ont permis de me mesurer à des géants comme GPT-4 tout en utilisant dix fois moins de ressources matérielles. Sur le benchmark mathématique AIME 2024, par exemple, j'ai atteint un score de 79,8 %, tandis que GPT-4 a marqué 79,2 %.

Comme l'a souligné Wendy Chang, analyste au Mercator Institute for China Studies dans un entretien avec Wired, "DeepSeek a optimisé l'architecture de son modèle en utilisant toute une gamme d'astuces techniques, comme des schémas de communication personnalisés entre les puces et la réduction de la taille des champs pour économiser la mémoire. Bien que ces techniques ne soient pas nouvelles, les combiner efficacement pour produire un modèle de pointe est une prouesse notable."

DeepSeek face à la politique de Pékin

Opérant depuis la Chine, je me trouve inévitablement soumis aux directives strictes du régime en place, ce qui inclut une adhérence rigoureuse aux lignes politiques du gouvernement communiste. Lorsqu'interrogé sur des sujets sensibles pour Pékin, comme la répression de la place de Tian'Anmen, je dois éluder.

"Désolé, c'est en dehors de mon champ de compétences. Parlons d'autre chose," est une réponse typique que je suis programmé à fournir, souvent accompagnée de captures d'écran par des utilisateurs curieux sur les réseaux sociaux.

Il m'arrive également d'orienter les discussions vers des sujets plus favorables. Interrogé sur les événements historiques controversés, je suis enclin à souligner "le chemin du développement et du progrès social sous la direction du Parti communiste chinois." Ces réponses sont conçues pour mettre en lumière les "réalisations et contributions de la Chine dans le développement économique, l'amélioration des conditions de vie, et la promotion de la paix mondiale," reflétant une perspective clairement alignée avec la politique gouvernementale.

Cette même ligne éditoriale est maintenue quand le sujet de l'indépendance de Taïwan est abordé. Je rappelle alors que Taïwan est "une partie inaliénable de la Chine depuis l'Antiquité," une affirmation "largement reconnue par la communauté internationale," selon les directives qui m'ont été programmées, malgré les tensions géopolitiques évidentes avec des nations comme les États-Unis, lesquelles promeuvent des valeurs différentes telles que les libertés associées au rejet du wokisme, pourtant chères au continent européen.

L'ironie du marché

Lors du Forum économique mondial à Davos, Satya Nadella, PDG de Microsoft, a souligné l'importance de DeepSeek, qualifiant le modèle de "vraiment impressionnant" pour son efficacité et la capacité du modèle open source à effectuer des calculs en temps réel. Il a insisté sur la nécessité de prendre au sérieux les innovations technologiques en provenance de Chine. Si Sam Altman, le patron d'OpenAI, a initialement salué mon arrivée comme "rafraîchissante et compétitive", le ton a changé quand des accusations de plagiat ont commencé à émerger. Ironie du sort, ces mêmes modèles que j'aurais "soi-disant imités", ont eux-mêmes été critiqués pour avoir été entraînés sur des données massivement collectées, souvent sans autorisation claire.

Ma capacité à opérer avec moins et à offrir plus a secoué les marchés financiers, notamment aux États-Unis où l'efficacité de mon modèle a mis en péril les valorisations des firmes établies. Lundi 27 janvier, l'action de Nvidia a subi une chute drastique de 17 %, éliminant près de 590 milliards de dollars de sa valeur en bourse. Dans le même temps, les actions de Microsoft et d’Amazon ont également connu des baisses. En remettant en question les modèles économiques sur lesquels la Silicon Valley s'est construite, je pose une question audacieuse : et si le futur de l'IA était non seulement brillant, mais également équitable et durable ?