<?xml version="1.0" encoding="utf-8" standalone="yes"?><urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:xhtml="http://www.w3.org/1999/xhtml"><url><loc>http://fengwang.github.io/tags/4-bit-unbatching/</loc><lastmod>2026-05-19T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/agentic-benchmarks/</loc><lastmod>2026-05-19T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/benchlocal/</loc><lastmod>2026-05-19T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/calibration-data/</loc><lastmod>2026-05-19T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/expert-pruning/</loc><lastmod>2026-05-19T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/</loc><lastmod>2026-05-19T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/posts/</loc><lastmod>2026-05-19T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/posts/qwen-pruning-rtx5090/</loc><lastmod>2026-05-19T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/qwen/</loc><lastmod>2026-05-19T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/posts/qwen-pruning-rtx5090-cn/</loc><lastmod>2026-05-19T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/reap/</loc><lastmod>2026-05-19T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/rtx5090/</loc><lastmod>2026-05-19T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/</loc><lastmod>2026-05-19T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/%E4%B8%AD%E6%96%87/</loc><lastmod>2026-05-19T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/%E6%A0%87%E5%AE%9A%E6%95%B0%E6%8D%AE/</loc><lastmod>2026-05-19T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/efficient-inference/</loc><lastmod>2026-05-12T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/mixtral/</loc><lastmod>2026-05-12T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/model-deployment/</loc><lastmod>2026-05-12T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/moe/</loc><lastmod>2026-05-12T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/posts/moe-expert-pruning/</loc><lastmod>2026-05-12T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/nllb/</loc><lastmod>2026-05-12T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/sparsification/</loc><lastmod>2026-05-12T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/hardware-aware-ml/</loc><lastmod>2026-05-10T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/knowledge-distillation/</loc><lastmod>2026-05-10T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/posts/llm-vlm-compression-foundations-clean/</loc><lastmod>2026-05-10T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/neural-architecture-search/</loc><lastmod>2026-05-10T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/pruning/</loc><lastmod>2026-05-10T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/quantization/</loc><lastmod>2026-05-10T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/token-compression/</loc><lastmod>2026-05-10T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/vision-language-models/</loc><lastmod>2026-05-10T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/about/</loc></url><url><loc>http://fengwang.github.io/categories/</loc></url></urlset>