Hy-MT2

» La série de modèles de traduction multilingue « Fast-Thinking » publiée par Tencent Hunyuan prend en charge la traduction entre 33 langues et se décline en trois versions : 1,8 B, 7 B et 30 B-A3B.

· Éditeur : Tencent Hunyuan
· Date de publication : 21 mai 2026
· HuggingFace : Collection tencent/Hy-MT2
· GitHub : Tencent-Hunyuan/Hy-MT2
· Article scientifique : Rapport technique HY-MT1.5 (arxiv:2512.24092)


Présentation de la série

Hy-MT2 est une série de modèles spécialisés dans la traduction conçus par Tencent Hunyuan pour des scénarios réels complexes. Leur caractéristique principale est le mécanisme « Fast-Thinking » : lors de l’inférence, ils génèrent d’abord une chaîne de raisonnement interne avant de produire la traduction, ce qui leur permet de mieux respecter les consignes de traduction complexes, notamment en matière de terminologie, de style ou de données structurées.

Par la même occasion, IFMTBench a été mis à disposition en open source ; il s’agit d’un jeu de tests destiné à évaluer la capacité d’un modèle à suivre les instructions de traduction.


Comparaison des versions

Version Nombre de paramètres Type d’architecture Paramètres activés Cas d’usage idéal
Hy-MT2-1.8B 1,8 B Dense 1,8 B Déploiement sur appareils embarqués ou environnements à ressources limitées
Hy-MT2-7B 7 B Dense 7 B Équilibre entre performances et ressources
Hy-MT2-30B-A3B 30 B MoE 3 B (à chaque inférence) Traduction de la plus haute qualité

Points forts en matière de performances

· 1,8 B : Surpasse globalement les API commerciales majeures telles que Microsoft Translator et Doubao.

· 7 B / 30 B-A3B : En mode Fast-Thinking, ils battent des modèles open source comme DeepSeek-V4-Pro et Kimi K2.6.

· Évaluation complète selon quatre critères : traduction générale, scénarios commerciaux réels, domaines spécialisés et respect des instructions.


Comment choisir la bonne version

Besoin de déployer le modèle sur un appareil mobile ou embarqué ?
  └─ Oui → Hy-MT2-1.8B (quantifié en 1,25 bit, il ne pèse que 440 Mo)

Mémoire GPU inférieure à 20 Go ?
  └─ Oui → Hy-MT2-7B

Vous recherchez la meilleure qualité de traduction et disposez de ressources suffisantes ?
  └─ Oui → Hy-MT2-30B-A3B (architecture MoE, seuls 3 B de paramètres sont activés à chaque inférence)

Langues prises en charge (38 au total)

Chinois, anglais, français, portugais, espagnol, japonais, turc, russe, arabe, coréen, thaï, italien, allemand, vietnamien, malais, indonésien, philippin, hindi, chinois traditionnel, polonais, tchèque, néerlandais, khmer, birman, persan, gujarati, ourdou, télougou, marathi, hébreu, bengali, tamoul, ukrainien, tibétain, kazakh, mongol, ouïghour, cantonais


Tous les modèles disponibles

Nom du modèle Description HuggingFace
Hy-MT2-1.8B Modèle de base à 1,8 B de paramètres Lien
Hy-MT2-1.8B-FP8 Quantifié en FP8, 1,8 B de paramètres Lien
Hy-MT2-1.8B-GGUF Format GGUF (compatible llama.cpp), 1,8 B Lien
Hy-MT2-1.8B-2bit-GGUF Quantifié en 2 bits GGUF, 1,8 B Lien
Hy-MT2-1.8B-1.25bit-GGUF Quantifié en 1,25 bit GGUF (quantification extrême pour appareils embarqués), 1,8 B Lien
Hy-MT2-7B Modèle de base à 7 B de paramètres Lien
Hy-MT2-7B-FP8 Quantifié en FP8, 7 B de paramètres Lien
Hy-MT2-7B-GGUF Format GGUF (compatible llama.cpp), 7 B Lien
Hy-MT2-30B-A3B Modèle de base MoE à 30 B de paramètres Lien
Hy-MT2-30B-A3B-FP8 Quantifié en FP8, 30 B MoE Lien

Historique des versions

Version Date de publication Contenu
Hy-MT2 21 mai 2026 Versions 1,8 B / 7 B / 30 B-A3B, intégration du mécanisme Fast-Thinking, mise à disposition simultanée d’IFMTBench
Hy-MT1.5 30 décembre 2025 Versions 1,8 B / 7 B
Hunyuan-MT 1er septembre 2025 Versions 7 B et Chimera-7B, première génération de la série

Ressources associées

· Description d’IFMTBench

· Guide de formation du modèle

· Outil de quantification AngelSlim

· Assistance technique : [email protected]