Files
maths-cs-ai-compendium-zh/images/multimodal_action_distribution.svg
flykhan 2536c937e3 feat: 完整中文翻译 maths-cs-ai-compendium(数学·计算机科学·AI 知识大全)
翻译自英文原版 maths-cs-ai-compendium,共 20 章全部完成。

第01章 向量 | 第02章 矩阵 | 第03章 微积分
第04章 统计学 | 第05章 概率论 | 第06章 机器学习
第07章 计算语言学 | 第08章 计算机视觉 | 第09章 音频与语音
第10章 多模态学习 | 第11章 自主系统 | 第12章 图神经网络
第13章 计算与操作系统 | 第14章 数据结构与算法
第15章 生产级软件工程 | 第16章 SIMD与GPU编程
第17章 AI推理 | 第18章 ML系统设计
第19章 应用人工智能 | 第20章 前沿人工智能

翻译说明:
- 所有数学公式 $...$ / $$...$$、代码块、图片引用完整保留
- mkdocs.yml 配置中文导航 + language: zh
- README.md 已翻译为中文(兼 docs/index.md)
- docs/ 目录包含指向各章文件的 symlink
- 约 29,000 行中文内容,排除 .cache/ 构建缓存
2026-05-03 10:23:20 +08:00

45 lines
3.1 KiB
XML

<svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 700 260" width="700" height="260">
<text x="350" y="22" text-anchor="middle" font-family="Arial, sans-serif" font-size="14" font-weight="bold" fill="#333">Multimodal Actions: Why Regression Averages Fail</text>
<!-- Left: true distribution -->
<text x="175" y="50" text-anchor="middle" font-family="Arial, sans-serif" font-size="12" font-weight="bold" fill="#27ae60">True Action Distribution</text>
<!-- Mode 1 (go left) -->
<ellipse cx="100" cy="140" rx="40" ry="30" fill="#3498db" fill-opacity="0.2" stroke="#3498db" stroke-width="1.5"/>
<text x="100" y="145" text-anchor="middle" font-family="Arial, sans-serif" font-size="10" font-weight="bold" fill="#3498db">Go left</text>
<!-- Mode 2 (go right) -->
<ellipse cx="250" cy="140" rx="40" ry="30" fill="#9b59b6" fill-opacity="0.2" stroke="#9b59b6" stroke-width="1.5"/>
<text x="250" y="145" text-anchor="middle" font-family="Arial, sans-serif" font-size="10" font-weight="bold" fill="#9b59b6">Go right</text>
<!-- Obstacle in middle -->
<rect x="155" y="115" width="40" height="50" rx="5" fill="#e74c3c" fill-opacity="0.3" stroke="#e74c3c" stroke-width="1.5"/>
<text x="175" y="143" text-anchor="middle" font-family="Arial, sans-serif" font-size="8" font-weight="bold" fill="#e74c3c">obstacle</text>
<text x="175" y="210" text-anchor="middle" font-family="Arial, sans-serif" font-size="9" fill="#666">Two valid paths around the obstacle</text>
<!-- Divider -->
<line x1="350" y1="45" x2="350" y2="245" stroke="#ccc" stroke-width="1" stroke-dasharray="4,3"/>
<!-- Right: regression vs diffusion -->
<text x="525" y="50" text-anchor="middle" font-family="Arial, sans-serif" font-size="12" font-weight="bold" fill="#e74c3c">Regression Prediction</text>
<!-- Obstacle in middle -->
<rect x="505" y="115" width="40" height="50" rx="5" fill="#e74c3c" fill-opacity="0.3" stroke="#e74c3c" stroke-width="1.5"/>
<text x="525" y="143" text-anchor="middle" font-family="Arial, sans-serif" font-size="8" font-weight="bold" fill="#e74c3c">obstacle</text>
<!-- Mean prediction - right in the obstacle! -->
<line x1="525" y1="90" x2="525" y2="108" stroke="#e74c3c" stroke-width="3"/>
<polygon points="525,115 518,105 532,105" fill="#e74c3c"/>
<text x="525" y="83" text-anchor="middle" font-family="Arial, sans-serif" font-size="10" font-weight="bold" fill="#e74c3c">mean = crash!</text>
<!-- Ghost of the two modes -->
<ellipse cx="450" cy="140" rx="25" ry="20" fill="none" stroke="#ccc" stroke-width="1" stroke-dasharray="3,2"/>
<ellipse cx="600" cy="140" rx="25" ry="20" fill="none" stroke="#ccc" stroke-width="1" stroke-dasharray="3,2"/>
<text x="525" y="195" text-anchor="middle" font-family="Arial, sans-serif" font-size="9" fill="#e74c3c">Regression averages the two modes</text>
<text x="525" y="210" text-anchor="middle" font-family="Arial, sans-serif" font-size="9" fill="#e74c3c">→ predicts straight into the obstacle</text>
<!-- Bottom note -->
<text x="350" y="248" text-anchor="middle" font-family="Arial, sans-serif" font-size="10" fill="#666">Diffusion / flow-matching action heads can represent both modes without averaging</text>
</svg>