Benchmark Archives » Epidemiology and Technology

Epidemiology & Technology

Search site

Blog Archive

Benchmarking MLX Models on Laptop using oMLX

Link: https://omlx.ai/my/92e9df628cd488f548c7885cb732afb0f7870d4d7f40ae6024f8d4f85724ca20 gemma-4-26B-A4B-it-QAT-MLX-4bit With TurboQuant Qwen3.6-35B-A3B-NSC-ACE-SABER-8bit-MTPLX-Optimized-Speed With Turboquant Failed for pp131072 - Prefill context too large for available memory (pre-chunk guard at 83968 tokens, kv_len=83968): predicted peak would exceed prefill safety cap 46.7GB (90% of effective ceiling 51.8GB) gemma-4-31b-it-8bit Note: Fans went wild after pp4096 LFM2-24B-A2B-MLX-4bit medgemma-27b-text-it-MLX-4bit Note: fans went