Hy-MT2

ref · Mai 23, 2026, 11:53

» La série de modèles de traduction multilingue « Fast-Thinking » publiée par Tencent Hunyuan prend en charge la traduction entre 33 langues et se décline en trois versions : 1,8 B, 7 B et 30 B-A3B.

· Éditeur : Tencent Hunyuan
· Date de publication : 21 mai 2026
· HuggingFace : Collection tencent/Hy-MT2
· GitHub : Tencent-Hunyuan/Hy-MT2
· Article scientifique : Rapport technique HY-MT1.5 (arxiv:2512.24092)

Présentation de la série

Hy-MT2 est une série de modèles spécialisés dans la traduction conçus par Tencent Hunyuan pour des scénarios réels complexes. Leur caractéristique principale est le mécanisme « Fast-Thinking » : lors de l’inférence, ils génèrent d’abord une chaîne de raisonnement interne avant de produire la traduction, ce qui leur permet de mieux respecter les consignes de traduction complexes, notamment en matière de terminologie, de style ou de données structurées.

Par la même occasion, IFMTBench a été mis à disposition en open source ; il s’agit d’un jeu de tests destiné à évaluer la capacité d’un modèle à suivre les instructions de traduction.

Comparaison des versions

Version	Nombre de paramètres	Type d’architecture	Paramètres activés	Cas d’usage idéal
Hy-MT2-1.8B	1,8 B	Dense	1,8 B	Déploiement sur appareils embarqués ou environnements à ressources limitées
Hy-MT2-7B	7 B	Dense	7 B	Équilibre entre performances et ressources
Hy-MT2-30B-A3B	30 B	MoE	3 B (à chaque inférence)	Traduction de la plus haute qualité

Points forts en matière de performances

· 1,8 B : Surpasse globalement les API commerciales majeures telles que Microsoft Translator et Doubao.

· 7 B / 30 B-A3B : En mode Fast-Thinking, ils battent des modèles open source comme DeepSeek-V4-Pro et Kimi K2.6.

· Évaluation complète selon quatre critères : traduction générale, scénarios commerciaux réels, domaines spécialisés et respect des instructions.

Comment choisir la bonne version

Besoin de déployer le modèle sur un appareil mobile ou embarqué ?
  └─ Oui → Hy-MT2-1.8B (quantifié en 1,25 bit, il ne pèse que 440 Mo)

Mémoire GPU inférieure à 20 Go ?
  └─ Oui → Hy-MT2-7B

Vous recherchez la meilleure qualité de traduction et disposez de ressources suffisantes ?
  └─ Oui → Hy-MT2-30B-A3B (architecture MoE, seuls 3 B de paramètres sont activés à chaque inférence)

Langues prises en charge (38 au total)

Chinois, anglais, français, portugais, espagnol, japonais, turc, russe, arabe, coréen, thaï, italien, allemand, vietnamien, malais, indonésien, philippin, hindi, chinois traditionnel, polonais, tchèque, néerlandais, khmer, birman, persan, gujarati, ourdou, télougou, marathi, hébreu, bengali, tamoul, ukrainien, tibétain, kazakh, mongol, ouïghour, cantonais

Tous les modèles disponibles

Nom du modèle	Description	HuggingFace
Hy-MT2-1.8B	Modèle de base à 1,8 B de paramètres	Lien
Hy-MT2-1.8B-FP8	Quantifié en FP8, 1,8 B de paramètres	Lien
Hy-MT2-1.8B-GGUF	Format GGUF (compatible llama.cpp), 1,8 B	Lien
Hy-MT2-1.8B-2bit-GGUF	Quantifié en 2 bits GGUF, 1,8 B	Lien
Hy-MT2-1.8B-1.25bit-GGUF	Quantifié en 1,25 bit GGUF (quantification extrême pour appareils embarqués), 1,8 B	Lien
Hy-MT2-7B	Modèle de base à 7 B de paramètres	Lien
Hy-MT2-7B-FP8	Quantifié en FP8, 7 B de paramètres	Lien
Hy-MT2-7B-GGUF	Format GGUF (compatible llama.cpp), 7 B	Lien
Hy-MT2-30B-A3B	Modèle de base MoE à 30 B de paramètres	Lien
Hy-MT2-30B-A3B-FP8	Quantifié en FP8, 30 B MoE	Lien

Historique des versions

Version	Date de publication	Contenu
Hy-MT2	21 mai 2026	Versions 1,8 B / 7 B / 30 B-A3B, intégration du mécanisme Fast-Thinking, mise à disposition simultanée d’IFMTBench
Hy-MT1.5	30 décembre 2025	Versions 1,8 B / 7 B
Hunyuan-MT	1er septembre 2025	Versions 7 B et Chimera-7B, première génération de la série

Ressources associées

· Description d’IFMTBench

· Guide de formation du modèle

· Outil de quantification AngelSlim

· Assistance technique : [email protected]