» La série de modèles de traduction multilingue « Fast-Thinking » publiée par Tencent Hunyuan prend en charge la traduction entre 33 langues et se décline en trois versions : 1,8 B, 7 B et 30 B-A3B.
· Éditeur : Tencent Hunyuan
· Date de publication : 21 mai 2026
· HuggingFace : Collection tencent/Hy-MT2
· GitHub : Tencent-Hunyuan/Hy-MT2
· Article scientifique : Rapport technique HY-MT1.5 (arxiv:2512.24092)
Présentation de la série
Hy-MT2 est une série de modèles spécialisés dans la traduction conçus par Tencent Hunyuan pour des scénarios réels complexes. Leur caractéristique principale est le mécanisme « Fast-Thinking » : lors de l’inférence, ils génèrent d’abord une chaîne de raisonnement interne avant de produire la traduction, ce qui leur permet de mieux respecter les consignes de traduction complexes, notamment en matière de terminologie, de style ou de données structurées.
Par la même occasion, IFMTBench a été mis à disposition en open source ; il s’agit d’un jeu de tests destiné à évaluer la capacité d’un modèle à suivre les instructions de traduction.
Comparaison des versions
| Version | Nombre de paramètres | Type d’architecture | Paramètres activés | Cas d’usage idéal |
|---|---|---|---|---|
| Hy-MT2-1.8B | 1,8 B | Dense | 1,8 B | Déploiement sur appareils embarqués ou environnements à ressources limitées |
| Hy-MT2-7B | 7 B | Dense | 7 B | Équilibre entre performances et ressources |
| Hy-MT2-30B-A3B | 30 B | MoE | 3 B (à chaque inférence) | Traduction de la plus haute qualité |
Points forts en matière de performances
· 1,8 B : Surpasse globalement les API commerciales majeures telles que Microsoft Translator et Doubao.
· 7 B / 30 B-A3B : En mode Fast-Thinking, ils battent des modèles open source comme DeepSeek-V4-Pro et Kimi K2.6.
· Évaluation complète selon quatre critères : traduction générale, scénarios commerciaux réels, domaines spécialisés et respect des instructions.
Comment choisir la bonne version
Besoin de déployer le modèle sur un appareil mobile ou embarqué ?
└─ Oui → Hy-MT2-1.8B (quantifié en 1,25 bit, il ne pèse que 440 Mo)
Mémoire GPU inférieure à 20 Go ?
└─ Oui → Hy-MT2-7B
Vous recherchez la meilleure qualité de traduction et disposez de ressources suffisantes ?
└─ Oui → Hy-MT2-30B-A3B (architecture MoE, seuls 3 B de paramètres sont activés à chaque inférence)
Langues prises en charge (38 au total)
Chinois, anglais, français, portugais, espagnol, japonais, turc, russe, arabe, coréen, thaï, italien, allemand, vietnamien, malais, indonésien, philippin, hindi, chinois traditionnel, polonais, tchèque, néerlandais, khmer, birman, persan, gujarati, ourdou, télougou, marathi, hébreu, bengali, tamoul, ukrainien, tibétain, kazakh, mongol, ouïghour, cantonais
Tous les modèles disponibles
| Nom du modèle | Description | HuggingFace |
|---|---|---|
| Hy-MT2-1.8B | Modèle de base à 1,8 B de paramètres | Lien |
| Hy-MT2-1.8B-FP8 | Quantifié en FP8, 1,8 B de paramètres | Lien |
| Hy-MT2-1.8B-GGUF | Format GGUF (compatible llama.cpp), 1,8 B | Lien |
| Hy-MT2-1.8B-2bit-GGUF | Quantifié en 2 bits GGUF, 1,8 B | Lien |
| Hy-MT2-1.8B-1.25bit-GGUF | Quantifié en 1,25 bit GGUF (quantification extrême pour appareils embarqués), 1,8 B | Lien |
| Hy-MT2-7B | Modèle de base à 7 B de paramètres | Lien |
| Hy-MT2-7B-FP8 | Quantifié en FP8, 7 B de paramètres | Lien |
| Hy-MT2-7B-GGUF | Format GGUF (compatible llama.cpp), 7 B | Lien |
| Hy-MT2-30B-A3B | Modèle de base MoE à 30 B de paramètres | Lien |
| Hy-MT2-30B-A3B-FP8 | Quantifié en FP8, 30 B MoE | Lien |
Historique des versions
| Version | Date de publication | Contenu |
|---|---|---|
| Hy-MT2 | 21 mai 2026 | Versions 1,8 B / 7 B / 30 B-A3B, intégration du mécanisme Fast-Thinking, mise à disposition simultanée d’IFMTBench |
| Hy-MT1.5 | 30 décembre 2025 | Versions 1,8 B / 7 B |
| Hunyuan-MT | 1er septembre 2025 | Versions 7 B et Chimera-7B, première génération de la série |
Ressources associées
· Guide de formation du modèle
· Outil de quantification AngelSlim
· Assistance technique : [email protected]