<?xml version="1.0" encoding="utf-8" standalone="yes"?><urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:xhtml="http://www.w3.org/1999/xhtml"><url><loc>http://fengwang.github.io/tags/efficient-inference/</loc><lastmod>2026-05-12T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/expert-pruning/</loc><lastmod>2026-05-12T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/</loc><lastmod>2026-05-12T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/mixtral/</loc><lastmod>2026-05-12T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/model-deployment/</loc><lastmod>2026-05-12T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/moe/</loc><lastmod>2026-05-12T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/posts/moe-expert-pruning/</loc><lastmod>2026-05-12T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/nllb/</loc><lastmod>2026-05-12T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/posts/</loc><lastmod>2026-05-12T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/sparsification/</loc><lastmod>2026-05-12T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/</loc><lastmod>2026-05-12T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/hardware-aware-ml/</loc><lastmod>2026-05-10T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/knowledge-distillation/</loc><lastmod>2026-05-10T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/posts/llm-vlm-compression-foundations-clean/</loc><lastmod>2026-05-10T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/neural-architecture-search/</loc><lastmod>2026-05-10T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/pruning/</loc><lastmod>2026-05-10T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/quantization/</loc><lastmod>2026-05-10T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/token-compression/</loc><lastmod>2026-05-10T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/tags/vision-language-models/</loc><lastmod>2026-05-10T00:00:00+00:00</lastmod></url><url><loc>http://fengwang.github.io/about/</loc></url><url><loc>http://fengwang.github.io/categories/</loc></url></urlset>