@escbasexyz: 🎬 Cùng một prompt với Claude Opus 4.8 và GPT-5.5, đây là kết quả của 1-bit GLM-5.2 GGUF chạy hoàn toàn local trên một Mac Studio 256GB RAM. 🔎 1-bit nghe cực đoan vì model AI thường cần nhiều bit để lưu trọng số chính xác. Quantization là ép chúng xuống ít bit hơn để model nhẹ hơn, và 1-bit là mức nén rất gắt. 💡 Điểm hay của Unsloth là dynamic quantization: phần ít quan trọng bị nén mạnh, còn phần nhạy cảm được giữ ở độ chính xác cao hơn. Vì vậy bản 1-bit vẫn có output nhìn khá tử tế, thay vì vỡ thành chữ linh tinh. 📉 Với 2-bit, Unsloth nói GLM-5.2 gốc khoảng 1,51TB còn lại 238GB và giữ khoảng 82% top-1 accuracy. Bản dynamic 1-bit nhỏ hơn 86%, nhưng vẫn đạt khoảng 76,2% top-1 accuracy. ⚠️ Cũng phải nói rõ: top-1 accuracy không phải tỷ lệ đúng sai kiểu bài kiểm tra, và demo này chỉ là one-shot, không phải benchmark chính thức. Thêm nữa, 1-bit vẫn cần khoảng 223GB memory, 2-bit cần khoảng 245GB, nên đây là local kiểu workstation. ✅ Tín hiệu đáng chú ý là open model đang học cách co lại để chạy gần người dùng hơn. #Escbase #Unsloth #GLM52 #LocalAI #OpenSourceAI #GGUF

3401

There are no more comments for this video.

To see more videos from user @escbasexyz, please go to the Tikwm homepage.