vincent-pro-ai/french-llm-from-scratch-GGUF

Name: vincent-pro-ai/french-llm-from-scratch-GGUF
Author: vincent-pro-ai

High-quality GGUF model

23.8K 📥 Downloads

1 ❤️ Likes

8 📁 GGUF Files

4.38 GB 💾 Total Size

5 days ago 🔄 Last Updated

📋 Model Description

french-llm-from-scratch (V3 mistral)

Modèle francophone (~260M paramètres) entraîné from scratch. Compatible Mistral architecture, tokenizer Mistral 117k. Entraînement 100k steps sur conversations FR + FineWeb.

Fichiers disponibles

GGUF (recommandé pour LM Studio) :

- french-llm-v3-mistral-Q4KM.gguf (168 MB, quantisé Q4KM) ⭐ - french-llm-v3-mistral-f16.gguf (520 MB, précision float16)

HuggingFace/PyTorch :

- config.json, pytorch_model.bin (519 MB) - tokenizer.json + config (vocabulaire Mistral 32k)

🚀 LM Studio (méthode recommandée)

Téléchargement direct GGUF

1) Ouvrir LM Studio → onglet Search 2) Chercher vincent-pro-ai/french-llm-from-scratch-GGUF 3) Sélectionner french-llm-v3-mistral-Q4KM.gguf (168 MB) 4) Cliquer Download puis Load model 5) Aller dans l'onglet Chat et commencer à discuter en français !

Paramètres recommandés LM Studio

Context length: 1024 tokens
Temperature: 0.7–0.9
Top P: 0.9–0.95
Repeat penalty: 1.1

🐍 Transformers (Python)

pip install "transformers>=4.41" torch accelerate

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

repo = "vincent-pro-ai/french-llm-from-scratch-GGUF"
tokenizer = AutoTokenizer.from_pretrained(repo)
model = AutoModelForCausalLM.frompretrained(repo, torchdtype=torch.float16, device_map="auto")

prompt = "Bonjour, comment ça va ?\n"
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
out = model.generate(inputs, maxnewtokens=100, temperature=0.8, top_p=0.9)
print(tokenizer.decode(out[0], skipspecialtokens=True))

📊 Détails d'entraînement

Architecture: Mistral-like (18 layers, 16 heads, 1024 embed, 4096 FF)
Paramètres: 260M (~292M avec embeddings)
Steps: 100 000
Loss finale: train=5.72, val=5.29
Dataset: Conversations FR (LMSYS, Dolly-FR) + FineWeb-FR
Tokenizer: Mistral 32k vocab

⚠️ Limitations

Modèle expérimental (qualité variable)
Pas de filtrage de contenu NSFW
Context window limité à 1024 tokens
Peut produire des hallucinations

📜 Licence

MIT (voir dépôt source)

📂 GGUF File List

📁 Filename	📦 Size	⚡ Download
french-llm-from-scratch-Q4_K_M-mixed.gguf Recommended LFS Q4	1.09 GB	Download
french-llm-from-scratch-Q4_K_M.gguf LFS Q4	186.75 MB	Download
french-llm-from-scratch-Q5_K_M.gguf LFS Q5	213.09 MB	Download
french-llm-from-scratch-Q8_0.gguf LFS Q8	301.91 MB	Download
french-llm-from-scratch-f32.gguf LFS	1.09 GB	Download
french-llm-v3-mistral-Q4_K_M.gguf LFS Q4	218.72 MB	Download
french-llm-v3-mistral-f16.gguf LFS FP16	702.9 MB	Download
french_gpt2_lm_studio.gguf LFS	622.14 MB	Download

📊 Model Information

🆔 Model ID: vincent-pro-ai/french-llm-from-scratch-GGUF

📅 Created: 3 weeks ago

🔄 Last Updated: 5 days ago

📥 Downloads: 23.8K

❤️ Likes: 1

🎯 Difficulty: Beginner

⚙️ Quantization: Q4, Q5, Q8, FP16

🏷️ Tags

pytorchsafetensorsggufgptregion:us

🔗 Related Links

🤗 Visit HuggingFace ⚡ Quick Download