Le projet THINK

Projet de R&T transverse IN2P3

Aller au contenu

Accueil
Les techniques neuronales
IA embarquée
Résultats

Archives mensuelles : octobre 2023

Articles plus récents →

Effective Weight-Only Quantization for Large Language Models with Intel® Neural Compressor

Publié le 2 octobre 2023 par

Weight-only quantization provides better performance and accuracy tradeoff for large language models

Publié dans Non classé | Commentaires fermés sur Effective Weight-Only Quantization for Large Language Models with Intel® Neural Compressor

Articles plus récents →

Rechercher
Articles récents
Neural networks news
Intel NN News

Archives
Catégories
- Non classé

Le projet THINK

Fièrement propulsé par WordPress

Generated by Feedzy