{"config":{"lang":["en"],"separator":"[\\s\\u200b\\u3000\\-\u3001\u3002\uff0c\uff0e\uff1f\uff01\uff1b]+","pipeline":["stemmer"],"fields":{"title":{"boost":1000.0},"text":{"boost":1.0},"tags":{"boost":1000000.0}}},"docs":[{"location":"","title":"\u6570\u5b66\u3001\u8ba1\u7b97\u673a\u79d1\u5b66\u4e0e\u4eba\u5de5\u667a\u80fd\u7eb2\u8981","text":"<p>\u5728\u7ebf\u9605\u8bfb: henryndubuaku.github.io/maths-cs-ai-compendium</p>"},{"location":"#_2","title":"\u6982\u8ff0","text":"<p>\u5927\u591a\u6570\u6559\u79d1\u4e66\u5c06\u597d\u7684\u601d\u60f3\u57cb\u6ca1\u5728\u5bc6\u96c6\u7684\u7b26\u53f7\u4e4b\u4e0b\uff0c\u8df3\u8fc7\u76f4\u89c9\uff0c\u5047\u8bbe\u4f60\u5df2\u7ecf\u638c\u63e1\u4e86\u4e00\u534a\u7684\u5185\u5bb9\uff0c\u5e76\u4e14\u5728\u4eba\u5de5\u667a\u80fd\u7b49\u5feb\u901f\u53d1\u5c55\u7684\u9886\u57df\u5f88\u5feb\u8fc7\u65f6\u3002\u8fd9\u662f\u4e00\u672c\u5f00\u653e\u3001\u975e\u4f20\u7edf\u7684\u6559\u79d1\u4e66\uff0c\u4ece\u96f6\u5f00\u59cb\u6db5\u76d6\u6570\u5b66\u3001\u8ba1\u7b97\u673a\u79d1\u5b66\u548c\u4eba\u5de5\u667a\u80fd\u3002\u4e3a\u90a3\u4e9b\u5e0c\u671b\u6df1\u5165\u7406\u89e3\u77e5\u8bc6\u3001\u800c\u4e0d\u4ec5\u4ec5\u662f\u4e3a\u4e86\u901a\u8fc7\u8003\u8bd5\u6216\u9762\u8bd5\u7684\u597d\u5947\u5b9e\u8df5\u8005\u800c\u7f16\u5199\u3002</p>"},{"location":"#_3","title":"\u80cc\u666f","text":"<p>\u5728\u8fc7\u53bb\u51e0\u5e74\u4ece\u4e8bAI/ML\u5de5\u4f5c\u7684\u8fc7\u7a0b\u4e2d\uff0c\u6211\u7528\u7b14\u8bb0\u672c\u8bb0\u5f55\u4e86\u6570\u5b66\u3001\u8ba1\u7b97\u673a\u79d1\u5b66\u548c\u4eba\u5de5\u667a\u80fd\u6982\u5ff5\u7684\u76f4\u89c9\u4f18\u5148\u3001\u7ed3\u5408\u5b9e\u9645\u3001\u4e0d\u6253\u9a6c\u864e\u773c\u7684\u89e3\u91ca\u30022025\u5e74\uff0c\u51e0\u4f4d\u670b\u53cb\u7528\u8fd9\u4e9b\u7b14\u8bb0\u51c6\u5907DeepMind\u3001OpenAI\u3001Nvidia\u7b49\u516c\u53f8\u7684\u9762\u8bd5\u3002\u4ed6\u4eec\u5168\u90e8\u88ab\u5f55\u7528\uff0c\u76ee\u524d\u5728\u5de5\u4f5c\u4e2d\u8868\u73b0\u51fa\u8272\u3002\u800c\u6211\u53bb\u5e74\u4e5f\u8fdb\u5165\u4e86Y Combinator\u3002\u6240\u4ee5\u73b0\u5728\u6211\u628a\u8fd9\u4e9b\u5206\u4eab\u7ed9\u6240\u6709\u4eba\u3002</p>"},{"location":"#mcp","title":"MCP \u670d\u52a1\u5668","text":"<p>\u672c\u4ed3\u5e93\u5305\u542b\u4e00\u4e2aMCP\u670d\u52a1\u5668\uff0c\u5141\u8bb8\u4efb\u4f55AI\u52a9\u624b\uff08Claude Code\u3001Cursor\u3001VS Code\u7b49\uff09\u5c06\u8fd9\u672c\u7eb2\u8981\u4f5c\u4e3a\u77e5\u8bc6\u5e93\u4f7f\u7528\u3002\u5b83\u9700\u8981\u672c\u5730\u514b\u9686\u8be5\u4ed3\u5e93\u3002\u5185\u7f6e\u6559\u80b2\u7528\u9014\u7684\u5de5\u5177\u548c\u793a\u4f8b\u5b9e\u73b0\u3002</p>"},{"location":"#_4","title":"\u5185\u5bb9\u5927\u7eb2","text":"# \u7ae0\u8282 \u7b80\u4ecb \u72b6\u6001 01 \u5411\u91cf \u7a7a\u95f4\u3001\u6a21\u957f\u3001\u65b9\u5411\u3001\u8303\u6570\u3001\u5ea6\u91cf\u3001\u70b9\u79ef/\u53c9\u79ef/\u5916\u79ef\u3001\u57fa\u3001\u5bf9\u5076\u6027 \u5df2\u5b8c\u6210 02 \u77e9\u9635 \u6027\u8d28\u3001\u7279\u6b8a\u7c7b\u578b\u3001\u8fd0\u7b97\u3001\u7ebf\u6027\u53d8\u6362\u3001\u5206\u89e3\uff08LU\u3001QR\u3001SVD\uff09 \u5df2\u5b8c\u6210 03 \u5fae\u79ef\u5206 \u5bfc\u6570\u3001\u79ef\u5206\u3001\u591a\u5143\u5fae\u79ef\u5206\u3001\u6cf0\u52d2\u8fd1\u4f3c\u3001\u4f18\u5316\u4e0e\u68af\u5ea6\u4e0b\u964d \u5df2\u5b8c\u6210 04 \u7edf\u8ba1\u5b66 \u63cf\u8ff0\u6027\u5ea6\u91cf\u3001\u62bd\u6837\u3001\u4e2d\u5fc3\u6781\u9650\u5b9a\u7406\u3001\u5047\u8bbe\u68c0\u9a8c\u3001\u7f6e\u4fe1\u533a\u95f4 \u5df2\u5b8c\u6210 05 \u6982\u7387\u8bba \u8ba1\u6570\u3001\u6761\u4ef6\u6982\u7387\u3001\u5206\u5e03\u3001\u8d1d\u53f6\u65af\u65b9\u6cd5\u3001\u4fe1\u606f\u8bba \u5df2\u5b8c\u6210 06 \u673a\u5668\u5b66\u4e60 \u7ecf\u5178\u673a\u5668\u5b66\u4e60\u3001\u68af\u5ea6\u65b9\u6cd5\u3001\u6df1\u5ea6\u5b66\u4e60\u3001\u5f3a\u5316\u5b66\u4e60\u3001\u5206\u5e03\u5f0f\u8bad\u7ec3 \u5df2\u5b8c\u6210 07 \u8ba1\u7b97\u8bed\u8a00\u5b66 \u53e5\u6cd5\u5b66\u3001\u8bed\u4e49\u5b66\u3001\u8bed\u7528\u5b66\u3001\u81ea\u7136\u8bed\u8a00\u5904\u7406\u3001\u8bed\u8a00\u6a21\u578b\u3001RNN\u3001CNN\u3001\u6ce8\u610f\u529b\u673a\u5236\u3001Transformer\u3001\u6587\u672c\u6269\u6563\u3001\u6587\u672cOCR\u3001MoE\u3001SSM\u3001\u73b0\u4ee3LLM\u67b6\u6784\u3001\u81ea\u7136\u8bed\u8a00\u5904\u7406\u8bc4\u4f30 \u5df2\u5b8c\u6210 08 \u8ba1\u7b97\u673a\u89c6\u89c9 \u56fe\u50cf\u5904\u7406\u3001\u76ee\u6807\u68c0\u6d4b\u3001\u5206\u5272\u3001\u89c6\u9891\u5904\u7406\u3001SLAM\u3001CNN\u3001\u89c6\u89c9Transformer\u3001\u6269\u6563\u6a21\u578b\u3001\u6d41\u5339\u914d\u3001VR/AR \u5df2\u5b8c\u6210 09 \u97f3\u9891\u4e0e\u8bed\u97f3 \u6570\u5b57\u4fe1\u53f7\u5904\u7406\u3001\u81ea\u52a8\u8bed\u97f3\u8bc6\u522b\u3001\u6587\u672c\u8f6c\u8bed\u97f3\u3001\u8bed\u97f3\u4e0e\u58f0\u5b66\u6d3b\u52a8\u68c0\u6d4b\u3001\u8bf4\u8bdd\u4eba\u5206\u79bb\u3001\u6e90\u5206\u79bb\u3001\u4e3b\u52a8\u964d\u566a\u3001WaveNet\u3001Conformer \u5df2\u5b8c\u6210 10 \u591a\u6a21\u6001\u5b66\u4e60 \u878d\u5408\u7b56\u7565\u3001\u5bf9\u6bd4\u5b66\u4e60\u3001CLIP\u3001\u89c6\u89c9\u8bed\u8a00\u6a21\u578b\u3001\u56fe\u50cf/\u89c6\u9891\u5206\u8bcd\u3001\u8de8\u6a21\u6001\u751f\u6210\u3001\u7edf\u4e00\u67b6\u6784\u3001\u4e16\u754c\u6a21\u578b \u5df2\u5b8c\u6210 11 \u81ea\u4e3b\u7cfb\u7edf \u611f\u77e5\u3001\u673a\u5668\u4eba\u5b66\u4e60\u3001\u89c6\u89c9-\u8bed\u8a00-\u52a8\u4f5c\u6a21\u578b\u3001\u81ea\u52a8\u9a7e\u9a76\u3001\u592a\u7a7a\u673a\u5668\u4eba \u5df2\u5b8c\u6210 12 \u56fe\u795e\u7ecf\u7f51\u7edc \u51e0\u4f55\u6df1\u5ea6\u5b66\u4e60\u3001\u56fe\u8bba\u3001GNN\u3001\u56fe\u6ce8\u610f\u529b\u673a\u5236\u3001\u56feTransformer\u3001\u4e09\u7ef4\u7b49\u53d8\u7f51\u7edc \u5df2\u5b8c\u6210 13 \u8ba1\u7b97\u4e0e\u64cd\u4f5c\u7cfb\u7edf \u79bb\u6563\u6570\u5b66\u3001\u8ba1\u7b97\u673a\u4f53\u7cfb\u7ed3\u6784\u3001\u64cd\u4f5c\u7cfb\u7edf\u3001\u5e76\u53d1\u3001\u5e76\u884c\u3001\u7f16\u7a0b\u8bed\u8a00 \u5df2\u5b8c\u6210 14 \u6570\u636e\u7ed3\u6784\u4e0e\u7b97\u6cd5 \u5927O\u8868\u793a\u6cd5\u3001\u9012\u5f52\u3001\u56de\u6eaf\u3001\u52a8\u6001\u89c4\u5212\u3001\u6570\u7ec4\u3001\u54c8\u5e0c\u3001\u94fe\u8868\u3001\u6808\u3001\u6811\u3001\u56fe\u3001\u6392\u5e8f\u3001\u4e8c\u5206\u67e5\u627e \u5df2\u5b8c\u6210 15 \u751f\u4ea7\u7ea7\u8f6f\u4ef6\u5de5\u7a0b Linux\u3001Git\u3001\u4ee3\u7801\u5e93\u8bbe\u8ba1\u3001\u6d4b\u8bd5\u3001CI/CD\u3001Docker\u3001\u6a21\u578b\u670d\u52a1\u3001MLOps\u3001\u76d1\u63a7\u3001\u4f7f\u7528\u7f16\u7801\u4ee3\u7406\u7684\u6700\u4f73\u5b9e\u8df5 \u5df2\u5b8c\u6210 16 SIMD\u4e0eGPU\u7f16\u7a0b \u9762\u5411\u673a\u5668\u5b66\u4e60\u7684C++\u3001\u6846\u67b6\u5de5\u4f5c\u539f\u7406\u3001\u786c\u4ef6\u57fa\u7840\u3001ARM NEON/I8MM/SME2\u3001x86 AVX\u3001GPU/CUDA\u3001Triton\u3001TPU\u3001RISC-V\u3001Vulkan\u3001WebGPU \u5df2\u5b8c\u6210 17 AI\u63a8\u7406 \u91cf\u5316\u3001\u9ad8\u6548\u67b6\u6784\u3001\u670d\u52a1\u4e0e\u6279\u5904\u7406\u3001\u8fb9\u7f18\u63a8\u7406\u3001\u63a8\u6d4b\u89e3\u7801\u3001\u6210\u672c\u4f18\u5316 \u5df2\u5b8c\u6210 18 ML\u7cfb\u7edf\u8bbe\u8ba1 \u7cfb\u7edf\u57fa\u7840\u3001\u4e91\u8ba1\u7b97\u3001\u5206\u5e03\u5f0f\u7cfb\u7edf\u3001ML\u751f\u547d\u5468\u671f\u3001\u7279\u5f81\u5b58\u50a8\u3001A/B\u6d4b\u8bd5\u3001\u63a8\u8350/\u641c\u7d22/\u5e7f\u544a/\u6b3a\u8bc8\u8bbe\u8ba1\u5b9e\u4f8b \u5df2\u5b8c\u6210 19 \u5e94\u7528\u4eba\u5de5\u667a\u80fd \u91d1\u878d\u3001\u533b\u7597\u5065\u5eb7\u3001\u86cb\u767d\u8d28\u3001\u836f\u7269\u53d1\u73b0\u4e2d\u7684\u4eba\u5de5\u667a\u80fd \u5f85\u5b8c\u6210 20 \u524d\u6cbf\u4eba\u5de5\u667a\u80fd \u91cf\u5b50\u673a\u5668\u5b66\u4e60\u3001\u795e\u7ecf\u5f62\u6001\u673a\u5668\u5b66\u4e60\u3001\u53bb\u4e2d\u5fc3\u5316\u4eba\u5de5\u667a\u80fd\u3001\u592a\u7a7a\u6570\u636e\u4e2d\u5fc3\u3001\u8111\u673a\u63a5\u53e3 \u5f85\u5b8c\u6210"},{"location":"#_5","title":"\u524d\u8a00","text":"<p>\u65b0\u751f\u5a74\u513f\u7684\u5927\u8111\u662f\u4e00\u4e2a\u65b0\u521d\u59cb\u5316\u7684\u795e\u7ecf\u7f51\u7edc\uff0c\u901a\u8fc7\u73b0\u5b9e\u4e16\u754c\u7684\u6570\u636e\u548c\u7ecf\u9a8c\u8bad\u7ec3\u76f4\u81f3\u6210\u5e74\u2026\u2026\u76f4\u81f3\u6c38\u8fdc\u3002\u80fd\u591f\u7528\u6cd5\u8bed\u6d41\u5229\u4ea4\u6d41\u5e76\u62e5\u6709\u5b8c\u7f8e\u53e3\u97f3\uff0c\u610f\u5473\u7740\u63a5\u89e6\u5230\u4e86\u4f18\u79c0\u7684\u6cd5\u8bed\u548c\u5b8c\u7f8e\u53e3\u97f3\u3002\u540c\u6837\uff0c\u4f18\u79c0\u7684\u4eba\u5de5\u667a\u80fd\u7814\u7a76\u5458\u548c\u5de5\u7a0b\u5e08\u5177\u5907\u51fa\u8272\u7684\u95ee\u9898\u89e3\u51b3\u80fd\u529b\uff0c\u610f\u5473\u7740\u4ed6\u4eec\u5438\u6536\u4e86\u9ad8\u8d28\u91cf\u7684\u77e5\u8bc6\u5e76\u62e5\u6709\u4e30\u5bcc\u7684\u7ecf\u9a8c\u3002</p> <p>\u79d1\u74e6\u820d\u592b\u5b9e\u9a8c\u662f\u4e00\u9879\u957f\u671f\u7684\u585e\u5c14\u7ef4\u4e9a\u7814\u7a76\uff0c\u8868\u660e\u4e3a\u671f\u4e09\u5e74\u7684\u9ad8\u5f3a\u5ea6\u521b\u9020\u6027\u95ee\u9898\u89e3\u51b3\u8bad\u7ec3\u53ef\u4ee5\u663e\u8457\u63d0\u9ad8\u667a\u529b\uff0c\u5c24\u5176\u662f\u6d41\u4f53\u667a\u529b\uff0c\u63d0\u534710-15\u4e2aIQ\u70b9\u3002\u5f53\u7136\uff0c\u5929\u751f\u9ad8IQ\u662f\u771f\u5b9e\u5b58\u5728\u7684\uff0c\u5c31\u50cf\u4f18\u8d28\u7684\u6743\u91cd\u521d\u59cb\u5316\u80fd\u5e26\u6765\u66f4\u597d\u7684\u8bad\u7ec3\u6548\u679c\u4e00\u6837\u2014\u2014\u5148\u5929\u4e0e\u540e\u5929\u4e4b\u4e89\u7684\u5b9e\u9a8c\u7ed3\u679c\u4e5f\u8bc1\u660e\u4e86\u8fd9\u4e00\u70b9\u3002</p> <p>\u7136\u800c\uff0c\u9ad8IQ\u4e2a\u4f53\u7684\u771f\u6b63\u4f18\u52bf\u4ec5\u5728\u4e8e\u80fd\u66f4\u5feb\u5730\u5b66\u4e60\u548c\u8bc6\u522b\u6a21\u5f0f\u3002\u4f46\u91cd\u590d\u4f7f\u7528\u4e00\u79cd\u6a21\u5f0f\u53ef\u4ee5\u4f7f\u4efb\u4f55\u6982\u5ff5\u90fd\u53d8\u5f97\u7edd\u5bf9\u53ef\u5b66\u3002\u67e5\u5c14\u65af\u00b7\u8fbe\u5c14\u6587\u88ab\u4ed6\u7684\u8001\u5e08\u548c\u7236\u4eb2\u8ba4\u4e3a\u662f\u4e00\u4e2a\u975e\u5e38\u666e\u901a\u3001\u751a\u81f3\u4f4e\u4e8e\u5e73\u5747\u6c34\u5e73\u7684\u5b66\u751f\u3002\u4ed6\u81ea\u79f0\u5e76\u4e0d\u673a\u667a\uff0c\u611f\u89c9\u81ea\u5df1\u50cf\u4e00\u4e2a\"\u6162\u5904\u7406\u5668\"\uff0c\u9700\u8981\u65f6\u95f4\u6765\u5438\u6536\u6570\u636e\u3002</p> <p>\u57283\u523010\u5c81\u4e4b\u95f4\uff0c\u6211\u7684\u5b66\u4e60\u6210\u7ee9\u5f88\u597d\uff0c\u81ea\u7136\u800c\u7136\u5730\u7406\u89e3\u6982\u5ff5\uff0c\u4ece\u4e0d\u505a\u7b14\u8bb0\u6216\u590d\u4e60\u300211\u523013\u5c81\u4e4b\u95f4\u6211\u6709\u70b9\u81ea\u5927\uff0c\u7528\u8fd9\u79cd\u65b9\u5f0f\u5728\u4e00\u4e2a80\u4eba\u7684\u73ed\u7ea7\u4e2d\u8dcc\u5230\u4e86\u4e0b\u534a\u90e8\u5206\u300214\u523015\u5c81\u4e4b\u95f4\uff0c\u6211\u5f00\u59cb\u50cf\u666e\u901a\u5b66\u751f\u4e00\u6837\u8bfb\u4e66\uff0c\u5728\u4e2d\u5b66\u6700\u540e\u4e00\u4e2a\u5b66\u671f\u53d6\u5f97\u4e86\u7b2c\u4e00\u540d\u3002\u65e9\u671f\u5b66\u6821\u8bfe\u7a0b\u4e0e\u81ea\u7136IQ\u914d\u5408\u5f97\u5f88\u597d\uff0c\u4f46\u73b0\u5b9e\u4e16\u754c\u7684\u624d\u534e\u6e90\u4e8e\u9ad8\u8d28\u91cf\u7684\u77e5\u8bc6\u6444\u5165\u548c\u6267\u884c\u529b\u5ea6\u3002</p> <p>\u4e8b\u5b9e\u4e0a\uff0c\u5927\u591a\u6570\u5b66\u4e60\u6210\u7ee9\u597d\u7684\u5b66\u751f\u53ea\u662f\u66f4\u52e4\u594b\uff0c\u4f46\u5b66\u672f\u7cfb\u7edf\u662f\u4e3a\u5feb\u901f\u5b66\u4e60\u8005\u8bbe\u8ba1\u7684\u3002\u8fd9\u672c\u7eb2\u8981\u63d0\u4f9b\u4e86\u4e00\u4e2a\u5168\u9762\u4e14\u76f8\u4e92\u5173\u8054\u7684\u77e5\u8bc6\u6d41\uff0c\u4ee5\u5e2e\u52a9\u4e16\u754c\u4e0a\u90a3\u4e9b\"\u8fbe\u5c14\u6587\u4eec\"\u66f4\u597d\u5730\u5b66\u4e60\u3002\u4f60\u53ea\u9700\u8981\u521d\u7b49\u6570\u5b66\u57fa\u7840\u548c\u57fa\u672c\u7684Python\u7f16\u7a0b\u77e5\u8bc6\uff0c\u5176\u4ed6\u4e00\u5207\u90fd\u4f1a\u9010\u6b65\u638c\u63e1\u2014\u2014\u53ea\u9700\u9605\u8bfb\u5e76\u76f8\u4fe1\u8fd9\u4e2a\u8fc7\u7a0b\uff01</p>"},{"location":"#_6","title":"\u5982\u4f55\u66f4\u597d\u5730\u5b66\u4e60","text":"<p>\u5927\u5b66\u7b2c\u4e00\u5b66\u671f\uff0c\u6211\u540c\u65f6\u9009\u4e8617\u95e8\u8bfe\uff0c\u6210\u7ee9\u5e76\u4e0d\u7406\u60f3\uff0c\u4e8e\u662f\u6211\u91c7\u7528\u4e86\u4e00\u4e2a\u6280\u5de7\uff1a</p> <p>\u7b2c\u4e00\u9636\u6bb5\uff1a\u8bfe\u540e\u7d2f\u79ef\u9605\u8bfb \u53ea\u9605\u8bfb\u6bcf\u5f20\u5e7b\u706f\u7247/\u7b14\u8bb0\u7684\u6807\u9898/\u5927\u6807\u9898\uff0c\u5408\u4e0a\u4e66\uff0c\u7136\u540e\u5728\u8111\u6d77\u4e2d\u53ef\u89c6\u5316\u5e76\u5199\u51fa\u5bf9\u8be5\u6982\u5ff5\u7684\u89e3\u91ca\u3002\u53ea\u91cd\u8bfb\u4f60\u9057\u6f0f\u7684\u90e8\u5206\uff0c\u7c7b\u4f3c\u4e8e\u673a\u5668\u5b66\u4e60\u4e2d\u7684\u63a9\u7801\u8bed\u8a00\u5efa\u6a21\u3002\u91cd\u8bfb\u4e4b\u540e\uff0c\u6700\u7ec8\u5c06\u6982\u5ff5\u7528\u4ee3\u7801\u5b9e\u73b0\u3002\u8fd9\u6837\u4f60\u5c31\u80fd\u5bf9\u6bcf\u4e2a\u6982\u5ff5\u5f62\u6210\u808c\u8089\u8bb0\u5fc6\u3002</p> <p>\u7b2c\u4e8c\u9636\u6bb5\uff1a\u8003\u524d\u5f71\u5b50\u9605\u8bfb \u9605\u8bfb\u6bcf\u5f20\u5e7b\u706f\u7247/\u7b14\u8bb0\u7684\u526f\u6807\u9898\uff0c\u5408\u4e0a\u4e66\uff0c\u7136\u540e\u5728\u8111\u6d77\u4e2d\u53ef\u89c6\u5316\u5e76\u5199\u51fa\u5bf9\u8be5\u6982\u5ff5\u7684\u89e3\u91ca\u3002\u53ea\u91cd\u8bfb\u4f60\u9057\u6f0f\u7684\u90e8\u5206\uff0c\u7c7b\u4f3c\u4e8e\u673a\u5668\u5b66\u4e60\u4e2d\u7684\u63a9\u7801\u8bed\u8a00\u5efa\u6a21\u3002\u91cd\u8bfb\u4e4b\u540e\uff0c\u6700\u7ec8\u5c06\u6982\u5ff5\u7528\u4ee3\u7801\u5b9e\u73b0\u3002\u8fd9\u6837\u4f60\u5c31\u80fd\u5bf9\u6bcf\u4e2a\u6982\u5ff5\u5f62\u6210\u808c\u8089\u8bb0\u5fc6\u3002</p> <p>\u8fd9\u4e2a\u65b9\u6cd5\u5bf9\u6211\u4e0d\u592a\u81ea\u4fe1\u7684\u670b\u53cb\u4eec\u975e\u5e38\u6709\u6548\u3002\u4e8b\u5b9e\u4e0a\uff0c\u5176\u4e2d\u4e00\u4f4d\u670b\u53cb\u5728\u9ad8\u7b49\u5de5\u7a0b\u6570\u5b66\uff08\u6db5\u76d6\u6d77\u68ee\u77e9\u9635\u548c\u4f18\u5316\uff09\u8fd9\u95e8\u8bfe\u4e0a\u8d85\u8fc7\u4e86\u6211\u3002\u5979\u73b0\u5728\u5728\u4e00\u5bb6\u5927\u578b\u77f3\u6cb9\u5929\u7136\u6c14\u516c\u53f8\u5de5\u4f5c\u3002\u7075\u9b42\u7684\u610f\u613f\u6bd4\u6211\u4eec\u4e0e\u4e4b\u5de5\u4f5c\u7684\u8eab\u4f53\u66f4\u91cd\u8981\uff08\u7f57\u68ee\u5854\u5c14\u5b9e\u9a8c\uff09\u3002</p>"},{"location":"#_7","title":"\u5173\u4e8e\u4f5c\u8005","text":"<p>\u67e5\u770bGitHub\u4e2a\u4eba\u8d44\u6599\uff01</p>"},{"location":"#_8","title":"\u5f15\u7528","text":"<pre><code>@book{ndubuaku2025compendium,\n  title     = {Maths, CS &amp; AI Compendium},\n  author    = {Henry Ndubuaku},\n  year      = {2026},\n  publisher = {GitHub},\n  url       = {https://github.com/HenryNdubuaku/maths-cs-ai-compendium}\n}\n</code></pre>"},{"location":"chapter%2001%3A%20vectors/01.%20vector%20spaces/","title":"\u5411\u91cf\u7a7a\u95f4","text":"<p>\u5411\u91cf\u7a7a\u95f4\u6784\u6210\u4e86\u673a\u5668\u5b66\u4e60\u7684\u6570\u5b66\u821e\u53f0\u3002\u672c\u6587\u6db5\u76d6\u5411\u91cf\u52a0\u6cd5\u3001\u6807\u91cf\u4e58\u6cd5\u3001\u5c01\u95ed\u6027\u516c\u7406\u3001\u5b50\u7a7a\u95f4\uff0c\u4ee5\u53ca\u4e3a\u4ec0\u4e48AI\u4e2d\u51e0\u4e4e\u6240\u6709\u4e1c\u897f\u90fd\u8868\u793a\u4e3a\u5411\u91cf\u3002</p> <ul> <li> <p>\u5c06\u5411\u91cf\u7a7a\u95f4\u60f3\u8c61\u6210\u4e00\u79cd\u7279\u5b9a\u7c7b\u578b\u7684\u821e\u53f0\uff0c\u6570\u5b66\u5bf9\u8c61\u751f\u6d3b\u5728\u5176\u4e2d\uff0c\u6bcf\u4e2a\u5bf9\u8c61\u88ab\u79f0\u4e3a\u4e00\u4e2a\u5411\u91cf\u3002</p> </li> <li> <p>\u4e3a\u4e86\u673a\u5668\u5b66\u4e60\uff08ML\uff09\u4e2d\u7684\u51e0\u4f55\u76f4\u89c9\uff0c\u6211\u4eec\u59cb\u7ec8\u5c06\u5411\u91cf\u89c6\u4e3a\u6b27\u51e0\u91cc\u5f97\u7a7a\u95f4\u4e2d\u7684\u4e00\u4e2a\u70b9\uff0c\u7531\u5176\u5750\u6807\u8868\u793a\u3002</p> </li> <li> <p>\u5411\u91cf \\(\\mathbf{a}\\)\uff08\u6570\u5b66\u4e0a\u7528\u7c97\u4f53\u5c0f\u5199\u5b57\u6bcd\u8868\u793a\uff09\u6709 \\(n\\) \u4e2a\u5750\u6807\uff0c\u6bcf\u4e2a\u5750\u6807\u4ee3\u8868\u6cbf\u4e00\u4e2a\u8f74\u7684\u4f4d\u7f6e\u3002</p> </li> </ul> \\[\\mathbf{a} = [a_1, a_2, a_3]\\] <p></p> <ul> <li> <p>\u5411\u91cf\u7a7a\u95f4\u4e2d\u7684\u5411\u91cf\u9075\u5faa\u4e00\u5957\u975e\u5e38\u5177\u4f53\u3001\u4e0d\u53ef\u6253\u7834\u7684\u89c4\u5219\uff1a</p> <ul> <li> <p>\u5411\u91cf\u52a0\u6cd5\uff08\u7ec4\u5408\uff09\uff1a \u4f60\u53ef\u4ee5\u53d6\u4efb\u610f\u4e24\u4e2a\u5411\u91cf\u5e76\u5c06\u5b83\u4eec\u7ec4\u5408\u8d77\u6765\u521b\u5efa\u65b0\u5411\u91cf\u3002 \u628a\u5411\u91cf\u60f3\u8c61\u6210\u79fb\u52a8\u7684\u6307\u4ee4\u3002 \u5982\u679c\u5411\u91cf A \u8868\u793a\"\u5411\u524d\u8d70 3 \u6b65\"\uff0c\u5411\u91cf B \u8868\u793a\"\u5411\u53f3\u8d70 2 \u6b65\"\uff0c \u5c06\u5b83\u4eec\u76f8\u52a0\uff08A + B\uff09\u5c31\u521b\u5efa\u4e86\u4e00\u6761\u65b0\u7684\u5355\u4e00\u6307\u4ee4\uff1a\"\u5411\u524d\u8d70 3 \u6b65\u5e76\u5411\u53f3\u8d70 2 \u6b65\u3002\"</p> </li> <li> <p>\u6807\u91cf\u4e58\u6cd5\uff08\u7f29\u653e\uff09\uff1a \u4f60\u53ef\u4ee5\u4f7f\u7528\u4e00\u4e2a\u666e\u901a\u6570\u5b57\uff08\"\u6807\u91cf\"\uff09\u6765\u7f29\u653e\u4efb\u610f\u5411\u91cf\u3002 \u4f60\u53ef\u4ee5\u62c9\u4f38\u5b83\u3001\u7f29\u5c0f\u5b83\u6216\u53cd\u8f6c\u5b83\u3002 \u5982\u679c\u5411\u91cf A \u662f\"\u5411\u524d\u8d70 3 \u6b65\"\uff0c\u5c06\u5176\u4e58\u4ee5 2 \u5c31\u53d8\u6210\"\u5411\u524d\u8d70 6 \u6b65\u3002\" \u5c06\u5176\u4e58\u4ee5 -1 \u5219\u5b8c\u5168\u7ffb\u8f6c\u6210\"\u5411\u540e\u8d70 3 \u6b65\u3002\"</p> </li> </ul> </li> <li> <p>\u5411\u91cf\u7a7a\u95f4\u7684\u7ef4\u5ea6\u662f\u5176\u5305\u542b\u7684\u72ec\u7acb\u65b9\u5411\u7684\u6570\u91cf\u3002\\(\\mathbb{R}^2\\) \u662f\u4e8c\u7ef4\u7684\uff08\u9700\u8981 2 \u4e2a\u5750\u6807\uff09\uff0c\u800c\u4e0a\u9762\u7684 \\(\\mathbf{a}\\) \u5b58\u5728\u4e8e \\(\\mathbb{R}^3\\) \u4e2d\u3002</p> </li> <li> <p>\u4f8b\u5982\uff0c\u6211\u4eec\u53ef\u4ee5\u5c06\u4efb\u4f55\u5bf9\u8c61\uff08\u6bd4\u5982\u4e00\u4e2a\u4eba\uff09\u8868\u793a\u4e3a\u4e00\u4e2a\u5411\u91cf\uff0c\u5176\u4e2d \\(h_1\\) = \u8eab\u9ad8\uff08\u5398\u7c73\uff09\uff0c\\(h_2\\) = \u4f53\u91cd\uff08\u516c\u65a4\uff09\uff0c\\(h_3\\) = \u5e74\u9f84\u3002</p> </li> </ul> \\[\\mathbf{h} = [185, 75, 30]\\] <ul> <li> <p>\u6211\u4eec\u73b0\u5728\u5df2\u7ecf\u521b\u5efa\u4e86\u4e00\u4e2a\u5305\u542b\u8868\u793a\u4eba\u7684\u5411\u91cf\u7684\u5411\u91cf\u7a7a\u95f4\u3002</p> </li> <li> <p>\u6211\u4eec\u53ef\u4ee5\u8868\u793a\u591a\u4e2a\u4eba\uff0c\u5e76\u89c2\u5bdf\u4ed6\u4eec\u4e4b\u95f4\u7684\u8fdc\u8fd1\uff01</p> </li> </ul> <p></p> <ul> <li> <p>\u6211\u4eec\u53ef\u4ee5\u6dfb\u52a0\u66f4\u591a\u7279\u5f81\uff0c\u521b\u5efa\u4e30\u5bcc\u7684\u4eba\u4f53\u8868\u793a\uff0c\u5728 ML \u4e2d\u901a\u5e38\u79f0\u4e3a\u7279\u5f81\u5411\u91cf\u3002</p> </li> <li> <p>\u4f60\u62e5\u6709\u7684\u72ec\u7279\u4e14\u6709\u610f\u4e49\u7684\u7279\u5f81\u8d8a\u591a\uff0c\u7279\u5f81\u5411\u91cf\u7684\u63cf\u8ff0\u6027\u5c31\u8d8a\u5f3a\uff0c\u8fd9\u662f\u9700\u8981\u8bb0\u4f4f\u7684\u4e00\u4e2a\u91cd\u8981\u56e0\u7d20\u3002</p> </li> <li> <p>\u8d85\u8fc7 3 \u7ef4\u540e\uff0c\u5411\u91cf\u53d8\u5f97\u975e\u5e38\u96be\u4ee5\u76f4\u89c2\u68c0\u67e5\uff0c\u8fd9\u50ac\u751f\u4e86\u4e00\u4e2a\u540d\u4e3a\u7ebf\u6027\u4ee3\u6570\u7684\u6570\u5b66\u9886\u57df\u3002</p> </li> <li> <p>\u73b0\u5728\uff0c\u7ebf\u6027\u4ee3\u6570\u662f\u7814\u7a76\u5411\u91cf\u3001\u5411\u91cf\u7a7a\u95f4\u4ee5\u53ca\u5411\u91cf\u4e4b\u95f4\u6620\u5c04\u5173\u7cfb\u7684\u5b66\u79d1\u3002</p> </li> <li> <p>\u6211\u4eec\u5728 AI/ML \u4e2d\u5c06\u51e0\u4e4e\u6240\u6709\u4e1c\u897f\u90fd\u8868\u793a\u4e3a\u5411\u91cf\uff0c\u8fd9\u4f7f\u5f97\u7ebf\u6027\u4ee3\u6570\u6210\u4e3a\u8be5\u9886\u57df\u7684\u57fa\u77f3\u3002</p> </li> <li> <p>\u5411\u91cf\u52a0\u6cd5\u53ef\u4ee5\u901a\u8fc7\u5c06\u4e00\u4e2a\u5411\u91cf\u653e\u5728\u53e6\u4e00\u4e2a\u5411\u91cf\u7684\u5c3e\u90e8\uff0c\u7136\u540e\u4ece\u539f\u70b9\u753b\u5230\u7ec8\u70b9\u7684\u53ef\u89c6\u5316\u65b9\u5f0f\u6267\u884c\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u5bf9\u4e8e\u4e24\u4e2a\u5411\u91cf \\(\\mathbf{a} = (a_1, a_2)\\) \u548c \\(\\mathbf{b} = (b_1, b_2)\\)\uff1a\\(\\mathbf{a} + \\mathbf{b} = (a_1 + b_1, a_2 + b_2)\\)</p> </li> <li> <p>\u5411\u91cf\u4e5f\u53ef\u4ee5\u76f8\u51cf\uff0c\u6240\u6709\u52a0\u6cd5\u89c4\u5219\u540c\u6837\u9002\u7528\u3002</p> </li> <li> <p>\u5c06\u5411\u91cf\u4e58\u4ee5\u6807\u91cf\u4f1a\u5728\u76f8\u540c\u65b9\u5411\u4e0a\u6309\u8be5\u56e0\u5b50\u7f29\u653e\u5411\u91cf\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u5bf9\u4e8e\u6807\u91cf \\(c\\) \u548c\u5411\u91cf \\(\\mathbf{v} = (v_1, v_2)\\)\uff1a\\(c\\mathbf{v} = (cv_1, cv_2)\\)</p> </li> <li> <p>\u52a0\u6cd5\u5c01\u95ed\u6027\uff1a\u5982\u679c\u5c06\u5411\u91cf\u7a7a\u95f4\u4e2d\u7684\u4efb\u610f\u4e24\u4e2a\u5411\u91cf\u76f8\u52a0\uff0c\u7ed3\u679c\u4e5f\u5c5e\u4e8e\u540c\u4e00\u7a7a\u95f4\uff1a\u5982\u679c \\(\\mathbf{u} \\in V\\) \u4e14 \\(\\mathbf{v} \\in V\\)\uff0c\u5219 \\(\\mathbf{u} + \\mathbf{v} \\in V\\)</p> </li> <li> <p>\u6807\u91cf\u4e58\u6cd5\u5c01\u95ed\u6027\uff1a\u5982\u679c\u5c06\u5411\u91cf\u7a7a\u95f4\u4e2d\u7684\u4efb\u610f\u5411\u91cf\u4e58\u4ee5\u6807\u91cf\uff0c\u7ed3\u679c\u4e5f\u5c5e\u4e8e\u540c\u4e00\u7a7a\u95f4\uff1a\u5982\u679c \\(\\mathbf{v} \\in V\\) \u4e14 \\(c \\in F\\)\uff0c\u5219 \\(c\\mathbf{v} \\in V\\)</p> </li> <li> <p>\u52a0\u6cd5\u7ed3\u5408\u5f8b\uff1a\u5bf9\u4e8e\u4efb\u610f\u4e09\u4e2a\u5411\u91cf \\(\\mathbf{u}\\)\u3001\\(\\mathbf{v}\\) \u548c \\(\\mathbf{w}\\)\uff1a\\((\\mathbf{u} + \\mathbf{v}) + \\mathbf{w} = \\mathbf{u} + (\\mathbf{v} + \\mathbf{w})\\)</p> </li> <li> <p>\u52a0\u6cd5\u4ea4\u6362\u5f8b\uff1a\u5bf9\u4e8e\u4efb\u610f\u4e24\u4e2a\u5411\u91cf \\(\\mathbf{u}\\) \u548c \\(\\mathbf{v}\\)\uff1a\\(\\mathbf{u} + \\mathbf{v} = \\mathbf{v} + \\mathbf{u}\\)</p> </li> </ul> <p></p> <ul> <li> <p>\u901a\u8fc7\u5e73\u884c\u56db\u8fb9\u5f62\u7684\u4e24\u6761\u8def\u5f84\u90fd\u5230\u8fbe\u540c\u4e00\u70b9\u3002</p> </li> <li> <p>\uff08\u96f6\u5411\u91cf\uff09\uff1a\u5b58\u5728\u4e00\u4e2a\u5411\u91cf \\(\\mathbf{0}\\)\uff0c\u4f7f\u5f97\u5bf9\u4e8e\u4efb\u4f55\u5411\u91cf \\(\\mathbf{v}\\)\uff1a\\(\\mathbf{v} + \\mathbf{0} = \\mathbf{v}\\)</p> </li> </ul> <p></p> <ul> <li>\u52a0\u6cd5\u9006\u5143\uff1a\u5bf9\u4e8e\u6bcf\u4e2a\u5411\u91cf \\(\\mathbf{v}\\)\uff0c\u5b58\u5728\u4e00\u4e2a\u5411\u91cf \\(-\\mathbf{v}\\)\uff0c\u4f7f\u5f97\uff1a\\(\\mathbf{v} + (-\\mathbf{v}) = \\mathbf{0}\\)</li> </ul> <p></p> <ul> <li>\u5206\u914d\u5f8b 1\uff1a\u5bf9\u4e8e\u4efb\u610f\u6807\u91cf \\(c\\) \u548c\u5411\u91cf \\(\\mathbf{u}\\)\u3001\\(\\mathbf{v}\\)\uff1a\\(c(\\mathbf{u} + \\mathbf{v}) = c\\mathbf{u} + c\\mathbf{v}\\)</li> </ul> <p></p> <ul> <li> <p>\u7f29\u653e\u548c\uff08\u91d1\u8272\uff09\u4e0e\u5206\u522b\u7f29\u653e\u5411\u91cf\u518d\u6c42\u548c\u7684\u7ed3\u679c\u76f8\u540c\u3002</p> </li> <li> <p>\u5206\u914d\u5f8b 2\uff1a\u5bf9\u4e8e\u4efb\u610f\u6807\u91cf \\(c\\)\u3001\\(d\\) \u548c\u5411\u91cf \\(\\mathbf{v}\\)\uff1a\\((c + d)\\mathbf{v} = c\\mathbf{v} + d\\mathbf{v}\\)</p> </li> <li> <p>\u7ed3\u5408\u5f8b\uff1a\u5bf9\u4e8e\u4efb\u610f\u6807\u91cf \\(c\\)\u3001\\(d\\) \u548c\u5411\u91cf \\(\\mathbf{v}\\)\uff1a\\((cd)\\mathbf{v} = c(d\\mathbf{v})\\)</p> </li> <li> <p>\u5355\u4f4d\u5143\uff1a\u5bf9\u4e8e\u4efb\u4f55\u5411\u91cf \\(\\mathbf{v}\\)\uff1a\\(1\\mathbf{v} = \\mathbf{v}\\)\uff0c\u5176\u4e2d \\(1\\) \u662f\u6807\u91cf\u57df\u4e2d\u7684\u4e58\u6cd5\u5355\u4f4d\u5143\u3002</p> </li> <li> <p>\u5b50\u7a7a\u95f4\u5c31\u662f\u5927\u7a7a\u95f4\u5185\u90e8\u7684\u4e00\u4e2a\u8f83\u5c0f\u821e\u53f0\u3002\u628a\u4e09\u7ef4\u7a7a\u95f4\u60f3\u8c61\u6210\u4e00\u4e2a\u623f\u95f4\u3002\u4e00\u5f20\u7a7f\u8fc7\u623f\u95f4\u4e2d\u5fc3\u7684\u5e73\u5766\u7eb8\u7247\u5c31\u662f\u4e00\u4e2a\u5b50\u7a7a\u95f4\uff0c\u7a7f\u8fc7\u4e2d\u5fc3\u7684\u4e00\u6839\u76f4\u5bfc\u7ebf\u4e5f\u662f\u5b50\u7a7a\u95f4\u3002</p> </li> <li> <p>\u5173\u952e\u8981\u6c42\u662f\u5b50\u7a7a\u95f4\u5fc5\u987b\u7ecf\u8fc7\u539f\u70b9\u3002\u5982\u679c\u4f60\u628a\u90a3\u7247\u7eb8\u79fb\u5f00\u4e2d\u5fc3\uff0c\u5b83\u5c31\u4e0d\u518d\u662f\u5b50\u7a7a\u95f4\u4e86\uff0c\u56e0\u4e3a\u96f6\u5411\u91cf\u4e0d\u518d\u4f4d\u4e8e\u5176\u4e0a\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u5411\u91cf\u7a7a\u95f4\u7684\u6240\u6709\u89c4\u5219\uff08\u52a0\u6cd5\u3001\u7f29\u653e\u3001\u5c01\u95ed\u6027\uff09\u5728\u5b50\u7a7a\u95f4\u5185\u90e8\u4ecd\u7136\u6709\u6548\u3002\u4f60\u53ef\u4ee5\u5728\u5b50\u7a7a\u95f4\u5185\u6dfb\u52a0\u6216\u7f29\u653e\u5411\u91cf\uff0c\u6c38\u8fdc\u4e0d\u4f1a\"\u6389\u51fa\"\u5230\u66f4\u5927\u7684\u7a7a\u95f4\u3002</p> </li> <li> <p>\u7ecf\u8fc7\u539f\u70b9\u7684\u76f4\u7ebf\u662f\u4e00\u7ef4\u5b50\u7a7a\u95f4\uff0c\u7ecf\u8fc7\u539f\u70b9\u7684\u5e73\u9762\u662f\u4e8c\u7ef4\u5b50\u7a7a\u95f4\uff0c\u800c\u6574\u4e2a\u7a7a\u95f4\u662f\u81ea\u8eab\u7684\u5b50\u7a7a\u95f4\u3002</p> </li> <li> <p>\u5728 ML \u4e2d\uff0c\u5b50\u7a7a\u95f4\u81ea\u7136\u51fa\u73b0\u3002\u9ad8\u7ef4\u6570\u636e\u901a\u5e38\u5177\u6709\u5b58\u5728\u4e8e\u4f4e\u7ef4\u5b50\u7a7a\u95f4\u4e0a\u7684\u7ed3\u6784\u3002PCA \u7b49\u6280\u672f\u627e\u5230\u90a3\u4e2a\u5b50\u7a7a\u95f4\uff0c\u8fd9\u6837\u6211\u4eec\u53ef\u4ee5\u66f4\u9ad8\u6548\u5730\u5904\u7406\u6570\u636e\u3002</p> </li> </ul>"},{"location":"chapter%2001%3A%20vectors/01.%20vector%20spaces/#colab-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ol> <li> <p>\u8fd0\u884c\u4ee3\u7801\u9a8c\u8bc1\u5206\u914d\u5f8b\u6027\u8d28\uff0c\u7136\u540e\u4fee\u6539\u5e76\u5c1d\u8bd5\u6d4b\u8bd5\u5176\u4ed6\u89c4\u5219\uff01 <pre><code>import jax.numpy as jnp\n\nu = jnp.array([1, 2])\nv = jnp.array([3, 0])\nc = 2\n\nlhs = c * (u + v)\nrhs = c*u + c*v\n\nprint(f\"LHS: {lhs}\")\nprint(f\"RHS: {rhs}\")\n</code></pre></p> </li> <li> <p>\u8fd0\u884c\u4ee3\u7801\u53ef\u89c6\u5316\u4e0d\u540c\u7684\u5411\u91cf\uff0c\u7136\u540e\u4fee\u6539\u4e0d\u540c\u5750\u6807\u7684\u503c\u4ee5\u7406\u89e3\u6bcf\u4e2a\u8f74\u5982\u4f55\u5f71\u54cd\u4f4d\u7f6e\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u5c1d\u8bd5\u4fee\u6539\u8fd9\u4e9b\u5411\u91cf\uff01\na = jnp.array([3, 2, 4])\nb = jnp.array([1, 4, 2])\nc = jnp.array([4, 1, 3])\n\nfig = plt.figure()\nax = fig.add_subplot(111, projection=\"3d\")\n\nfor vec, name, color in [(a, \"a\", \"red\"), (b, \"b\", \"blue\"), (c, \"c\", \"green\")]:\n    ax.quiver(0, 0, 0, *vec, color=color, arrow_length_ratio=0.1, linewidth=2, label=name)\n\nlim = int(jnp.abs(jnp.stack([a, b, c])).max()) + 1\nax.set_xlim([0, lim]); ax.set_ylim([0, lim]); ax.set_zlim([0, lim])\nax.set_xlabel(\"X\"); ax.set_ylabel(\"Y\"); ax.set_zlabel(\"Z\")\nax.legend()\nplt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2001%3A%20vectors/02.%20vector%20properties/","title":"\u5411\u91cf\u6027\u8d28","text":"<p>\u5411\u91cf\u6027\u8d28\u63cf\u8ff0\u4e86\u5b9a\u4e49\u5411\u91cf\u884c\u4e3a\u7684\u51e0\u4f55\u548c\u4ee3\u6570\u7279\u5f81\u3002\u672c\u6587\u6db5\u76d6\u6a21\u957f\u3001\u65b9\u5411\u3001\u5355\u4f4d\u5411\u91cf\u3001\u76f8\u7b49\u6027\u3001\u5e73\u884c\u6027\u3001\u6b63\u4ea4\u6027\u548c\u7ebf\u6027\u65e0\u5173\u6027\uff0c\u5b83\u4eec\u662f\u6bcf\u4e2a ML \u7279\u5f81\u7a7a\u95f4\u7684\u57fa\u77f3\u3002</p> <ul> <li>\u5411\u91cf\u7684\u6a21\u957f\uff08\u6216\u957f\u5ea6\uff09\u544a\u8bc9\u4f60\u5b83\u5ef6\u4f38\u4e86\u591a\u8fdc\u3002\u628a\u5b83\u60f3\u8c61\u6210\u7bad\u5934\u7684\u957f\u5ea6\u3002\u5bf9\u4e8e\u5411\u91cf \\(\\mathbf{a} = (a_1, a_2, a_3)\\)\uff0c\u5176\u6a21\u957f\u4e3a\uff1a</li> </ul> \\[\\|\\mathbf{a}\\| = \\sqrt{a_1^2 + a_2^2 + a_3^2}\\] <ul> <li> <p>\u8fd9\u53ea\u662f\u52fe\u80a1\u5b9a\u7406\u63a8\u5e7f\u5230\u66f4\u9ad8\u7ef4\u5ea6\uff0c\u6d4b\u91cf\u4ece\u539f\u70b9\u5230\u8be5\u70b9\u7684\u76f4\u7ebf\u8ddd\u79bb\u3002</p> </li> <li> <p>\u5411\u91cf\u7684\u65b9\u5411\u544a\u8bc9\u4f60\u5b83\u6307\u5411\u54ea\u91cc\uff1b\u53ea\u9700\u60f3\u8c61\u4ece\u539f\u70b9\u5230\u5750\u6807\u70b9\u7684\u4e00\u6761\u76f4\u7ebf\u5373\u53ef\u3002</p> </li> <li> <p>\u5f53\u6ca1\u6709\u660e\u786e\u6307\u5b9a\u539f\u70b9\u65f6\uff0c\u6211\u4eec\u901a\u5e38\u9690\u542b\u5730\u4f7f\u7528 \\((0,0,\\ldots,0)\\) \u5373\u4e2d\u5fc3\u70b9\uff0c\u81f3\u5c11\u4e3a\u4e86\u53ef\u89c6\u5316\u76ee\u7684\u5982\u6b64\u3002</p> </li> <li> <p>\u4f4d\u7f6e\u5e76\u4e0d\u91cd\u8981\uff0c\u5b83\u603b\u662f\u5173\u4e8e\u4f4d\u79fb\uff1a\u4ece\u539f\u70b9\u753b\u51fa\u7684\u5411\u91cf \\((3, 2)\\) \u548c\u4ece\u53e6\u4e00\u4e2a\u70b9\u753b\u51fa\u7684\u540c\u6837\u7684 \\((3, 2)\\) \u4ecd\u7136\u662f\u76f8\u7b49\u7684\u3002</p> </li> </ul> <p></p> <ul> <li>\u4e24\u4e2a\u5411\u91cf\u53ef\u4ee5\u6709\u76f8\u540c\u7684\u957f\u5ea6\u4f46\u6307\u5411\u5b8c\u5168\u4e0d\u540c\u7684\u65b9\u5411\uff0c\u6216\u8005\u6307\u5411\u76f8\u540c\u65b9\u5411\u4f46\u957f\u5ea6\u4e0d\u540c\u3002</li> </ul> <p></p> <ul> <li>\u4e24\u4e2a\u5411\u91cf\u76f8\u7b49\u5f53\u4e14\u4ec5\u5f53\u5b83\u4eec\u6240\u6709\u5bf9\u5e94\u7684\u5206\u91cf\u90fd\u5339\u914d\uff1b\u76f8\u540c\u7684\u957f\u5ea6\uff0c\u76f8\u540c\u7684\u65b9\u5411\uff0c\u5b8c\u5168\u76f8\u540c\u7684\u7bad\u5934\u3002</li> </ul> \\[\\mathbf{a} = \\mathbf{b} \\iff a_i = b_i \\text{ \u5bf9\u6240\u6709 } i\\] <ul> <li>\u4e24\u4e2a\u5411\u91cf\u5e73\u884c\u5982\u679c\u4e00\u4e2a\u662f\u53e6\u4e00\u4e2a\u7684\u6807\u91cf\u500d\u6570\u3002\u5b83\u4eec\u6cbf\u7740\u540c\u4e00\u6761\u76f4\u7ebf\uff0c\u8981\u4e48\u540c\u5411\uff0c\u8981\u4e48\u5b8c\u5168\u53cd\u5411\u3002</li> </ul> \\[\\mathbf{a} \\parallel \\mathbf{b} \\iff \\mathbf{a} = k\\mathbf{b} \\text{ \u5bf9\u4e8e\u67d0\u4e2a\u6807\u91cf } k \\neq 0\\] <p></p> <ul> <li> <p>\u5982\u679c \\(k &gt; 0\\)\uff0c\u5b83\u4eec\u6307\u5411\u76f8\u540c\u65b9\u5411\u3002\u5982\u679c \\(k &lt; 0\\)\uff0c\u5b83\u4eec\u6307\u5411\u76f8\u53cd\u65b9\u5411\u3002\u65e0\u8bba\u54ea\u79cd\u60c5\u51b5\uff0c\u5b83\u4eec\u90fd\u4f4d\u4e8e\u7ecf\u8fc7\u539f\u70b9\u7684\u540c\u4e00\u6761\u76f4\u7ebf\u4e0a\u3002</p> </li> <li> <p>\u76f4\u89c2\u5730\u8bf4\uff0c\u5e73\u884c\u5411\u91cf\u4e0d\u643a\u5e26\u4efb\u4f55\"\u65b0\u7684\"\u65b9\u5411\u4fe1\u606f\u3002\u4e00\u4e2a\u53ea\u662f\u53e6\u4e00\u4e2a\u7684\u62c9\u4f38\u6216\u7ffb\u8f6c\u7248\u672c\u3002</p> </li> <li> <p>\u4e24\u4e2a\u5411\u91cf\u6b63\u4ea4\uff08\u5782\u76f4\uff09\u5982\u679c\u5b83\u4eec\u6307\u5411\u5b8c\u5168\u72ec\u7acb\u7684\u65b9\u5411\u3002\u6cbf\u4e00\u4e2a\u65b9\u5411\u79fb\u52a8\u4e0d\u4f1a\u8ba9\u4f60\u5728\u53e6\u4e00\u4e2a\u65b9\u5411\u4e0a\u6709\u4efb\u4f55\u8fdb\u5c55\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u60f3\u8c61\u5411\u5317\u8d70\u7136\u540e\u5411\u4e1c\u8d70\uff0c\u8fd9\u4e9b\u662f\u6b63\u4ea4\u65b9\u5411\uff0c\u65e0\u8bba\u5411\u5317\u8d70\u591a\u8fdc\u90fd\u4e0d\u4f1a\u4f7f\u4f60\u5411\u4e1c\u79fb\u52a8\u3002\u6211\u4eec\u7ecf\u5e38\u4f1a\u9047\u5230\u6b63\u4ea4\u6027\u3002</p> </li> <li> <p>\u6b63\u4ea4\u6027\u5bf9 ML \u81f3\u5173\u91cd\u8981\uff1a\u6b63\u4ea4\u7684\u7279\u5f81\u643a\u5e26\u5b8c\u5168\u72ec\u7acb\u7684\u4fe1\u606f\uff0c\u8fd9\u5bf9\u4e8e\u8868\u793a\u662f\u6700\u7406\u60f3\u7684\u3002</p> </li> <li> <p>\u66f4\u4e00\u822c\u5730\uff0c\u4efb\u610f\u4e24\u4e2a\u5411\u91cf\u4e4b\u95f4\u90fd\u6709\u4e00\u4e2a\u5939\u89d2 \\(\\theta\\)\uff0c\u8303\u56f4\u4ece \\(0\u00b0\\) \u5230 \\(180\u00b0\\)\u3002</p> </li> <li> <p>\u8fd9\u4e2a\u89d2\u5ea6\u6355\u6349\u4e86\u4e24\u4e2a\u65b9\u5411\u4e4b\u95f4\u7684\u5168\u90e8\u5173\u7cfb\uff1a\\(0\u00b0\\) \u8868\u793a\u5e73\u884c\uff08\u76f8\u540c\u65b9\u5411\uff09\uff0c\\(180\u00b0\\) \u8868\u793a\u5e73\u884c\uff08\u76f8\u53cd\u65b9\u5411\uff09\uff0c\\(90\u00b0\\) \u8868\u793a\u6b63\u4ea4\u3002\u4ecb\u4e8e\u4e4b\u95f4\u7684\u90fd\u662f\u6df7\u5408\u60c5\u51b5\u3002</p> </li> <li> <p>ML \u4e2d\u7684\u5927\u591a\u6570\u5411\u91cf\u5173\u7cfb\u90fd\u5904\u5728\u8fd9\u4e2a\u8303\u56f4\u7684\u67d0\u5904\u3002\u7a0d\u540e\uff0c\u6211\u4eec\u5c06\u770b\u5230\u7cbe\u786e\u7684\u5de5\u5177\uff08\u70b9\u79ef\u3001\u4f59\u5f26\u76f8\u4f3c\u5ea6\uff09\u6765\u8ba1\u7b97\u8fd9\u4e2a\u89d2\u5ea6\u3002</p> </li> <li> <p>\u4e00\u7ec4\u5411\u91cf\u662f\u7ebf\u6027\u76f8\u5173\u7684\uff0c\u5982\u679c\u5176\u4e2d\u81f3\u5c11\u4e00\u4e2a\u53ef\u4ee5\u901a\u8fc7\u7f29\u653e\u548c\u76f8\u52a0\u4ece\u5176\u4ed6\u5411\u91cf\u6784\u9020\u51fa\u6765\u3002\u5b83\u6ca1\u6709\u4e3a\u8be5\u96c6\u5408\u5e26\u6765\u65b0\u7684\u4fe1\u606f\u3002</p> </li> <li> <p>\u4f8b\u5982\uff0c\u5982\u679c \\(\\mathbf{c} = 2\\mathbf{a} + 3\\mathbf{b}\\)\uff0c\u90a3\u4e48 \\(\\mathbf{c}\\) \u662f\u5197\u4f59\u7684\uff0c\u4f60\u5df2\u7ecf\u901a\u8fc7 \\(\\mathbf{a}\\) \u548c \\(\\mathbf{b}\\) \u62e5\u6709\u4e86 \\(\\mathbf{c}\\) \u6240\u63d0\u4f9b\u7684\u5168\u90e8\u4fe1\u606f\u3002</p> </li> <li> <p>\u5e73\u884c\u5411\u91cf\u603b\u662f\u7ebf\u6027\u76f8\u5173\u7684\uff0c\u56e0\u4e3a\u4e00\u4e2a\u53ea\u662f\u53e6\u4e00\u4e2a\u7684\u7f29\u653e\u526f\u672c\u3002\u4efb\u4f55\u5305\u542b\u96f6\u5411\u91cf\u7684\u96c6\u5408\u4e5f\u662f\u7ebf\u6027\u76f8\u5173\u7684\u3002</p> </li> <li> <p>\u5411\u91cf\u662f\u7ebf\u6027\u65e0\u5173\u7684\uff0c\u5982\u679c\u5176\u4e2d\u6ca1\u6709\u4e00\u4e2a\u80fd\u4ece\u5176\u4ed6\u5411\u91cf\u6784\u9020\u51fa\u6765\u3002\u6bcf\u4e2a\u5411\u91cf\u90fd\u8d21\u732e\u4e86\u4e00\u4e2a\u771f\u6b63\u7684\u65b0\u65b9\u5411\u3002\u6b63\u4ea4\u5411\u91cf\u603b\u662f\u7ebf\u6027\u65e0\u5173\u7684\u3002</p> </li> <li> <p>\u5728\u4e8c\u7ef4\u4e2d\uff0c\u4e24\u4e2a\u7ebf\u6027\u65e0\u5173\u7684\u5411\u91cf\u53ef\u4ee5\u5230\u8fbe\u5e73\u9762\u4e0a\u7684\u4efb\u4f55\u70b9\u3002\u5728\u4e09\u7ef4\u4e2d\uff0c\u4f60\u9700\u8981\u4e09\u4e2a\u3002\"\u9700\u8981\u591a\u5c11\u4e2a\u72ec\u7acb\u7684\u5411\u91cf\"\u8fd9\u4e2a\u60f3\u6cd5\u76f4\u63a5\u4e0e\u7ef4\u5ea6\u76f8\u5173\u3002</p> </li> <li> <p>\u5f53\u5411\u91cf\u7684\u5927\u591a\u6570\u5206\u91cf\u4e3a\u96f6\u65f6\uff0c\u8be5\u5411\u91cf\u662f\u7a00\u758f\u7684\u3002\u76f8\u53cd\uff0c\u5927\u591a\u6570\u5206\u91cf\u975e\u96f6\u79f0\u4e3a\u7a20\u5bc6\u3002</p> </li> </ul> \\[\\mathbf{s} = [0, 0, 3, 0, 0, 0, 1, 0, 0, 0]\\] <ul> <li> <p>\u7a00\u758f\u6027\u5f88\u91cd\u8981\uff0c\u56e0\u4e3a\u5b83\u5f71\u54cd\u5b58\u50a8\u548c\u8ba1\u7b97\u3002\u7a00\u758f\u5411\u91cf\u53ef\u4ee5\u901a\u8fc7\u53ea\u8ddf\u8e2a\u975e\u96f6\u6761\u76ee\u6765\u66f4\u9ad8\u6548\u5730\u5b58\u50a8\u548c\u5904\u7406\u3002</p> </li> <li> <p>\u5355\u4f4d\u5411\u91cf\u662f\u6a21\u957f\u6b63\u597d\u4e3a 1 \u7684\u5411\u91cf\u3002\u5b83\u7eaf\u7cb9\u8868\u793a\u65b9\u5411\uff0c\u4e0d\u5305\u542b\u957f\u5ea6\u4fe1\u606f\u3002\u4f60\u53ef\u4ee5\u901a\u8fc7\u9664\u4ee5\u6a21\u957f\u5c06\u4efb\u4f55\u5411\u91cf\u53d8\u6210\u5355\u4f4d\u5411\u91cf\uff1a</p> </li> </ul> \\[\\hat{\\mathbf{a}} = \\frac{\\mathbf{a}}{\\|\\mathbf{a}\\|}\\] <ul> <li> <p>\u8fd9\u4e2a\u8fc7\u7a0b\u79f0\u4e3a\u5f52\u4e00\u5316\u3002\u5b83\u5265\u79bb\u4e86\"\u591a\u8fdc\"\uff0c\u53ea\u4fdd\u7559\"\u5f80\u54ea\u8d70\u3002\"</p> </li> <li> <p>\u6807\u51c6\u5355\u4f4d\u5411\u91cf\u6307\u5411\u6bcf\u4e2a\u8f74\uff1a\\(\\hat{\\mathbf{i}} = (1, 0, 0)\\)\uff0c\\(\\hat{\\mathbf{j}} = (0, 1, 0)\\)\uff0c\\(\\hat{\\mathbf{k}} = (0, 0, 1)\\)\u3002\u4efb\u4f55\u5411\u91cf\u90fd\u53ef\u4ee5\u5199\u6210\u8fd9\u4e9b\u5411\u91cf\u7684\u7ec4\u5408\uff0c\u4f8b\u5982 \\((3, 2, 4) = 3\\hat{\\mathbf{i}} + 2\\hat{\\mathbf{j}} + 4\\hat{\\mathbf{k}}\\)\u3002</p> </li> </ul>"},{"location":"chapter%2001%3A%20vectors/02.%20vector%20properties/#colab-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ol> <li> <p>\u8ba1\u7b97\u5411\u91cf\u7684\u6a21\u957f\u5e76\u9a8c\u8bc1\u5b83\u7b26\u5408\u52fe\u80a1\u5b9a\u7406\uff0c\u7136\u540e\u4fee\u6539\u4ee3\u7801\u8ba1\u7b97\u5355\u4f4d\u5411\u91cf\u3002 <pre><code>import jax.numpy as jnp\n\na = jnp.array([3.0, 4.0])\n\nmagnitude = jnp.sqrt(jnp.sum(a ** 2))\nprint(f\"Magnitude of a: {magnitude}\") \n</code></pre></p> </li> <li> <p>\u901a\u8fc7\u6d4b\u8bd5\u4e00\u4e2a\u5411\u91cf\u662f\u5426\u662f\u53e6\u4e00\u4e2a\u7684\u6807\u91cf\u500d\u6570\u6765\u68c0\u67e5\u4e24\u4e2a\u5411\u91cf\u662f\u5426\u5e73\u884c\u3002 <pre><code>import jax.numpy as jnp\n\na = jnp.array([2, 4, 6])\nb = jnp.array([1, 2, 3])\n\nratios = a / b\nprint(f\"Ratios: {ratios}\")\nprint(f\"Parallel: {jnp.allclose(ratios, ratios[0])}\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2001%3A%20vectors/03.%20norms%20and%20metrics/","title":"\u5ea6\u91cf\u4e0e\u8303\u6570","text":"<p>\u8303\u6570\u8861\u91cf\u5355\u4e2a\u5411\u91cf\u7684\u5927\u5c0f\uff1b\u5ea6\u91cf\u8861\u91cf\u4e24\u4e2a\u5411\u91cf\u4e4b\u95f4\u7684\u8ddd\u79bb\u3002\u672c\u6587\u6db5\u76d6 L1\u3001L2 \u548c L-\u65e0\u7a77\u8303\u6570\u3001\u6b27\u51e0\u91cc\u5f97\u8ddd\u79bb\u548c\u4f59\u5f26\u8ddd\u79bb\uff0c\u4ee5\u53ca\u4e3a\u4ec0\u4e48\u4e3a kNN\u3001\u805a\u7c7b\u548c ML \u4e2d\u7684\u68c0\u7d22\u9009\u62e9\u5408\u9002\u7684\u8ddd\u79bb\u51fd\u6570\u81f3\u5173\u91cd\u8981\u3002</p> <ul> <li> <p>\u6211\u4eec\u77e5\u9053\u5411\u91cf\u6709\u6a21\u957f\u548c\u65b9\u5411\u3002\u4f46\u6211\u4eec\u5982\u4f55\u5b9e\u9645\u8861\u91cf\u5355\u4e2a\u5411\u91cf\"\u6709\u591a\u5927\"\uff0c\u6216\u8005\u4e24\u4e2a\u5411\u91cf\"\u6709\u591a\u8fdc\"\uff1f\u8fd9\u5c31\u662f\u8303\u6570\u548c\u5ea6\u91cf\u53d1\u6325\u4f5c\u7528\u7684\u5730\u65b9\u3002</p> </li> <li> <p>\u5bf9\u6807\u91cf\u800c\u8a00\uff0c\u6211\u4eec\u77e5\u9053 10 &gt; 5\uff0c\u56e0\u4e3a\u5b83\u4eec\u7684\u503c\u5bf9\u5b83\u4eec\u8fdb\u884c\u4e86\u91cf\u5316\uff0c\u4f46\u662f\u6211\u4eec\u5982\u4f55\u91cf\u5316\u4e00\u4e2a\u5411\u91cf\uff1f\u5b83\u7684\u8303\u6570\u8861\u91cf\u5355\u4e2a\u5411\u91cf\u7684\u5927\u5c0f\u3002</p> </li> <li> <p>\u6700\u719f\u6089\u7684\u8303\u6570\u662f\u6b27\u51e0\u91cc\u5f97\u8303\u6570\uff08L2\uff09\uff0c\u5b83\u5c31\u662f\u6211\u4eec\u5df2\u77e5\u7684\u6a21\u957f\u516c\u5f0f\uff1a</p> </li> </ul> \\[\\|\\mathbf{v}\\|_2 = \\sqrt{v_1^2 + v_2^2 + \\cdots + v_n^2}\\] <ul> <li>\u4f46\u8fd8\u6709\u5176\u4ed6\u8861\u91cf\u5927\u5c0f\u7684\u65b9\u6cd5\u3002\u60f3\u8c61\u4f60\u5728\u4e00\u4e2a\u8857\u9053\u5448\u7f51\u683c\u72b6\u7684\u57ce\u5e02\u4e2d\u3002\u4f60\u4e0d\u80fd\u659c\u7a7f\u5efa\u7b51\u7269\uff0c\u6240\u4ee5\u4f60\u65c5\u7a0b\u7684\"\u957f\u5ea6\"\u662f\u6cbf\u7740\u6bcf\u6761\u8857\u9053\u884c\u8d70\u7684\u603b\u8857\u533a\u6570\u3002\u8fd9\u5c31\u662f\u66fc\u54c8\u987f\u8303\u6570\uff08L1\uff09\uff1a</li> </ul> \\[\\|\\mathbf{v}\\|_1 = |v_1| + |v_2| + \\cdots + |v_n|\\] <ul> <li>\u6216\u8005\u4f60\u53ef\u80fd\u53ea\u5173\u5fc3\u5355\u4e2a\u6700\u5927\u7684\u5206\u91cf\uff0c\u5ffd\u7565\u5176\u4f59\u90e8\u5206\u3002\u8fd9\u5c31\u662f\u6700\u5927\u8303\u6570\uff08L-\u65e0\u7a77\uff09\uff1a</li> </ul> \\[\\|\\mathbf{v}\\|_\\infty = \\max(|v_1|, |v_2|, \\ldots, |v_n|)\\] <ul> <li>\u8fd9\u4e09\u4e2a\u90fd\u662f\u4e00\u822c Lp \u8303\u6570\u7684\u7279\u4f8b\uff1a</li> </ul> \\[\\|\\mathbf{v}\\|_p = (|v_1|^p + |v_2|^p + \\cdots + |v_n|^p)^{1/p}\\] <ul> <li> <p>\u8bbe\u7f6e \\(p = 2\\) \u5f97\u5230\u6b27\u51e0\u91cc\u5f97\uff0c\\(p = 1\\) \u5f97\u5230\u66fc\u54c8\u987f\uff0c\u800c\u5f53 \\(p \\to \\infty\\) \u65f6\u5f97\u5230\u6700\u5927\u8303\u6570\u3002\u968f\u7740 \\(p\\) \u589e\u5927\uff0c\u6700\u5927\u5206\u91cf\u8d21\u732e\u8d8a\u6765\u8d8a\u5927\uff0c\u76f4\u5230\u6700\u7ec8\u53ea\u6709\u5b83\u91cd\u8981\u3002</p> </li> <li> <p>\u6bcf\u4e2a\u8303\u6570\u5fc5\u987b\u9075\u5b88\u4e09\u6761\u89c4\u5219\uff1a</p> <ul> <li> <p>\u975e\u8d1f\u6027\uff1a\\(\\|\\mathbf{v}\\| \\geq 0\\)\uff0c\u4e14 \\(\\|\\mathbf{v}\\| = 0\\) \u4ec5\u5f53 \\(\\mathbf{v} = \\mathbf{0}\\)\u3002\u5927\u5c0f\u4ece\u4e0d\u4e3a\u8d1f\uff0c\u53ea\u6709\u96f6\u5411\u91cf\u7684\u5927\u5c0f\u4e3a\u96f6\u3002</p> </li> <li> <p>\u7f29\u653e\u6027\uff1a\\(\\|c\\mathbf{v}\\| = |c| \\cdot \\|\\mathbf{v}\\|\\)\u3002\u5c06\u5411\u91cf\u52a0\u500d\uff0c\u5176\u5927\u5c0f\u4e5f\u52a0\u500d\u3002</p> </li> <li> <p>\u4e09\u89d2\u4e0d\u7b49\u5f0f\uff1a\\(\\|\\mathbf{u} + \\mathbf{v}\\| \\leq \\|\\mathbf{u}\\| + \\|\\mathbf{v}\\|\\)\u3002\u6377\u5f84\u6c38\u8fdc\u4e0d\u4f1a\u6bd4\u7ed5\u8fdc\u8def\u66f4\u957f\u3002</p> </li> </ul> </li> <li> <p>\u73b0\u5728\uff0c\u5ea6\u91cf\u8861\u91cf\u4e24\u4e2a\u5411\u91cf\u4e4b\u95f4\u7684\u8ddd\u79bb\u3002\u628a\u5b83\u60f3\u8c61\u6210\u95ee\uff1a\"\u8fd9\u4e24\u4e2a\u70b9\u76f8\u8ddd\u591a\u8fdc\uff1f\"</p> </li> <li> <p>\u83b7\u5f97\u5ea6\u91cf\u7684\u6700\u7b80\u5355\u65b9\u6cd5\u662f\u4f7f\u7528\u5dee\u503c\u7684\u8303\u6570\uff1a\\(d(\\mathbf{u}, \\mathbf{v}) = \\|\\mathbf{u} - \\mathbf{v}\\|\\)\u3002\u51cf\u53bb\u4e24\u4e2a\u5411\u91cf\uff0c\u7136\u540e\u6d4b\u91cf\u5269\u4f59\u90e8\u5206\u7684\u5927\u5c0f\u3002</p> </li> <li> <p>\u4f7f\u7528\u6b27\u51e0\u91cc\u5f97\u8303\u6570\uff0c\u6211\u4eec\u5f97\u5230\u719f\u6089\u7684\u6b27\u51e0\u91cc\u5f97\u8ddd\u79bb\uff1a</p> </li> </ul> \\[d(\\mathbf{u}, \\mathbf{v}) = \\sqrt{(u_1 - v_1)^2 + (u_2 - v_2)^2 + \\cdots + (u_n - v_n)^2}\\] <ul> <li> <p>\u4f7f\u7528\u66fc\u54c8\u987f\u8303\u6570\u5f97\u5230\u66fc\u54c8\u987f\u8ddd\u79bb\uff0c\u6cbf\u7740\u6bcf\u4e2a\u8f74\u7684\u603b\u5dee\u5f02\uff0c\u5c31\u50cf\u8ba1\u7b97\u4e24\u4e2a\u4f4d\u7f6e\u4e4b\u95f4\u7684\u57ce\u5e02\u8857\u533a\u6570\u3002</p> </li> <li> <p>\u6bcf\u4e2a\u5ea6\u91cf\u5fc5\u987b\u9075\u5b88\u56db\u6761\u89c4\u5219\uff1a</p> <ul> <li> <p>\u975e\u8d1f\u6027\uff1a\\(d(\\mathbf{u}, \\mathbf{v}) \\geq 0\\)\u3002\u8ddd\u79bb\u4ece\u4e0d\u4e3a\u8d1f\u3002</p> </li> <li> <p>\u540c\u4e00\u6027\uff1a\\(d(\\mathbf{u}, \\mathbf{v}) = 0\\) \u5f53\u4e14\u4ec5\u5f53 \\(\\mathbf{u} = \\mathbf{v}\\)\u3002\u96f6\u8ddd\u79bb\u610f\u5473\u7740\u540c\u4e00\u70b9\u3002</p> </li> <li> <p>\u5bf9\u79f0\u6027\uff1a\\(d(\\mathbf{u}, \\mathbf{v}) = d(\\mathbf{v}, \\mathbf{u})\\)\u3002\u4ece A \u5230 B \u7684\u8ddd\u79bb\u4e0e\u4ece B \u5230 A \u7684\u8ddd\u79bb\u76f8\u540c\u3002</p> </li> <li> <p>\u4e09\u89d2\u4e0d\u7b49\u5f0f\uff1a\\(d(\\mathbf{u}, \\mathbf{w}) \\leq d(\\mathbf{u}, \\mathbf{v}) + d(\\mathbf{v}, \\mathbf{w})\\)\u3002\u76f4\u63a5\u8d70\u6c38\u8fdc\u4e0d\u4f1a\u6bd4\u7ed5\u8def\u66f4\u957f\u3002</p> </li> </ul> </li> <li> <p>\u90a3\u4e48\u4e24\u8005\u4e4b\u95f4\u7684\u5173\u7cfb\u662f\u4ec0\u4e48\uff1f\u8303\u6570\u8861\u91cf\u4e00\u4e2a\u5411\u91cf\uff0c\u5ea6\u91cf\u8861\u91cf\u4e24\u4e2a\u5411\u91cf\u4e4b\u95f4\u7684\u5dee\u8ddd\u3002\u6bcf\u4e2a\u8303\u6570\u81ea\u7136\u5730\u521b\u5efa\u4e00\u4e2a\u5ea6\u91cf\uff08\u901a\u8fc7\u6d4b\u91cf\u5dee\u503c\uff09\uff0c\u4f46\u5e76\u975e\u6bcf\u4e2a\u5ea6\u91cf\u90fd\u6765\u81ea\u8303\u6570\u3002</p> </li> <li> <p>\u4f8b\u5982\uff0c\u6c49\u660e\u8ddd\u79bb\u8ba1\u7b97\u4e24\u4e2a\u5411\u91cf\u4e0d\u540c\u7684\u4f4d\u7f6e\u6570\u91cf\u3002\u5b83\u662f\u4e00\u4e2a\u6709\u6548\u7684\u5ea6\u91cf\uff0c\u4f46\u5e76\u975e\u6765\u81ea\u4efb\u4f55\u8303\u6570\u3002</p> </li> <li> <p>\u5728 ML \u4e2d\uff0c\u9009\u62e9\u5408\u9002\u7684\u8303\u6570\u6216\u5ea6\u91cf\u5f88\u91cd\u8981\u3002</p> </li> <li> <p>L2 \u8ddd\u79bb\u5728\u6c42\u548c\u524d\u5bf9\u6bcf\u4e2a\u5dee\u503c\u5e73\u65b9\uff0c\u56e0\u6b64\u5355\u4e2a\u5927\u7684\u5dee\u503c\u4f1a\u4e3b\u5bfc\u7ed3\u679c\u3002</p> </li> <li> <p>L1 \u8ddd\u79bb\u5bf9\u7edd\u5bf9\u5dee\u503c\u6c42\u548c\uff0c\u5e73\u7b49\u5bf9\u5f85\u6bcf\u4e2a\u5dee\u503c\u3002\u4e0e L2 \u76f8\u6bd4\uff0c\u5355\u4e2a\u5927\u7684\u5dee\u503c\u5f71\u54cd\u8f83\u5c0f\u3002</p> </li> </ul>"},{"location":"chapter%2001%3A%20vectors/03.%20norms%20and%20metrics/#colab-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ol> <li> <p>\u8ba1\u7b97\u540c\u4e00\u5411\u91cf\u7684 L1 \u548c L2 \u8303\u6570\u3002\u5c1d\u8bd5\u66f4\u6539\u503c\uff0c\u6ce8\u610f\u54ea\u4e2a\u8303\u6570\u5bf9\u5927\u7684\u5206\u91cf\u6700\u654f\u611f\uff0c\u54ea\u4e2a\u5bf9\u8bb8\u591a\u5c0f\u5206\u91cf\u6700\u654f\u611f\u3002\u7136\u540e\u5c1d\u8bd5\u8ba1\u7b97 p \u503c\u9012\u589e\uff08\u4f8b\u5982 1\u30012\u30015\u300110\u300150\u3001100\uff09\u65f6\u7684 Lp \u8303\u6570\uff0c\u89c2\u5bdf\u5b83\u5982\u4f55\u6536\u655b\u5230 L-\u65e0\u7a77\u503c\u3002 <pre><code>import jax.numpy as jnp\n\nv = jnp.array([3.0, -4.0, 1.0])\n\nl1 = jnp.sum(jnp.abs(v))\nl2 = jnp.sqrt(jnp.sum(v ** 2))\n\nprint(f\"L1: {l1}, L2: {l2:.2f}\")\n</code></pre></p> </li> <li> <p>\u8ba1\u7b97\u4e24\u4e2a\u5411\u91cf\u4e4b\u95f4\u7684\u6b27\u51e0\u91cc\u5f97\u8ddd\u79bb\u548c\u66fc\u54c8\u987f\u8ddd\u79bb\u3002\u5c1d\u8bd5\u8ba9\u5411\u91cf\u5f7c\u6b64\u9760\u8fd1\u6216\u8fdc\u79bb\uff0c\u89c2\u5bdf\u6bcf\u79cd\u8ddd\u79bb\u5982\u4f55\u4e0d\u540c\u5730\u54cd\u5e94\u3002 <pre><code>import jax.numpy as jnp\n\nu = jnp.array([1.0, 2.0, 3.0])\nv = jnp.array([4.0, 0.0, 1.0])\n\neuclidean = jnp.sqrt(jnp.sum((u - v) ** 2))\nmanhattan = jnp.sum(jnp.abs(u - v))\n\nprint(f\"Euclidean: {euclidean:.2f}, Manhattan: {manhattan}\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2001%3A%20vectors/04.%20products/","title":"\u5411\u91cf\u79ef","text":"<p>\u5411\u91cf\u79ef\u662f\u8861\u91cf\u76f8\u4f3c\u6027\u548c\u8ba1\u7b97\u6295\u5f71\u7684\u57fa\u672c\u8fd0\u7b97\u3002\u672c\u6587\u6db5\u76d6\u5185\u79ef\u3001\u70b9\u79ef\u3001\u4f59\u5f26\u76f8\u4f3c\u5ea6\u3001\u53c9\u79ef\u548c\u5916\u79ef\uff0c\u8fd9\u4e9b\u8fd0\u7b97\u652f\u6491\u4e86 AI \u4e2d\u7684\u6ce8\u610f\u529b\u673a\u5236\u3001\u5d4c\u5165\u548c\u51e0\u4f55\u63a8\u7406\u3002</p> <ul> <li> <p>\u6211\u4eec\u5df2\u7ecf\u770b\u5230\u5982\u4f55\u76f8\u52a0\u548c\u7f29\u653e\u5411\u91cf\u3002\u4f46\u662f\u6211\u4eec\u53ef\u4ee5\u76f8\u4e58\u4e24\u4e2a\u5411\u91cf\u5417\uff1f\u4e8b\u5b9e\u8bc1\u660e\u4e0d\u6b62\u4e00\u79cd\u65b9\u6cd5\uff0c\u6bcf\u79cd\u65b9\u6cd5\u56de\u7b54\u4e0d\u540c\u7684\u95ee\u9898\u3002</p> </li> <li> <p>\u5185\u79ef\u662f\u4e00\u4e2a\u5e7f\u4e49\u6982\u5ff5\uff1a\u4e00\u4e2a\u63a5\u53d7\u4e24\u4e2a\u5411\u91cf\u5e76\u4ea7\u751f\u4e00\u4e2a\u6807\u91cf\u7684\u51fd\u6570\u3002\u5b83\u662f\"\u76f8\u4e58\"\u5411\u91cf\u7684\u62bd\u8c61\u84dd\u56fe\u3002</p> </li> <li> <p>\u4efb\u4f55\u5185\u79ef\u5fc5\u987b\u6ee1\u8db3\u4e09\u6761\u89c4\u5219\uff1a</p> <ul> <li> <p>\u6b63\u5b9a\u6027\uff1a\\(\\langle \\mathbf{v}, \\mathbf{v} \\rangle \\geq 0\\)\uff0c\u4e14\u4ec5\u5bf9\u96f6\u5411\u91cf\u7b49\u4e8e\u96f6\u3002\u5411\u91cf\u4e0e\u81ea\u8eab\u76f8\u4e58\u603b\u662f\u7ed9\u51fa\u975e\u8d1f\u7ed3\u679c\u3002</p> </li> <li> <p>\u5bf9\u79f0\u6027\uff1a\\(\\langle \\mathbf{u}, \\mathbf{v} \\rangle = \\langle \\mathbf{v}, \\mathbf{u} \\rangle\\)\u3002\u987a\u5e8f\u65e0\u5173\u7d27\u8981\u3002</p> </li> <li> <p>\u7ebf\u6027\u6027\uff1a\\(\\langle a\\mathbf{u} + b\\mathbf{v}, \\mathbf{w} \\rangle = a\\langle \\mathbf{u}, \\mathbf{w} \\rangle + b\\langle \\mathbf{v}, \\mathbf{w} \\rangle\\)\u3002\u5b83\u5bf9\u52a0\u6cd5\u548c\u7f29\u653e\u5177\u6709\u5206\u914d\u6027\u3002</p> </li> </ul> </li> <li> <p>\u70b9\u79ef\u662f\u6700\u5e38\u89c1\u7684\u5185\u79ef\u3002\u5b83\u662f\u4f60\u51e0\u4e4e\u5230\u5904\u90fd\u4f1a\u7528\u5230\u7684\u5177\u4f53\u7248\u672c\u3002\u5bf9\u4e8e\u4e24\u4e2a\u5411\u91cf \\(\\mathbf{a} = (a_1, a_2, \\ldots, a_n)\\) \u548c \\(\\mathbf{b} = (b_1, b_2, \\ldots, b_n)\\)\uff1a</p> </li> </ul> \\[\\mathbf{a} \\cdot \\mathbf{b} = a_1 b_1 + a_2 b_2 + \\cdots + a_n b_n\\] <ul> <li> <p>\u5c06\u5339\u914d\u7684\u5206\u91cf\u76f8\u4e58\uff0c\u7136\u540e\u5168\u90e8\u52a0\u8d77\u6765\u3002\u8fd9\u5c31\u662f\u5168\u90e8\u3002</p> </li> <li> <p>\u4f46\u8fd9\u4e2a\u6570\u5b57\u610f\u5473\u7740\u4ec0\u4e48\uff1f\u70b9\u79ef\u6709\u4e00\u4e2a\u4f18\u7f8e\u7684\u51e0\u4f55\u89e3\u91ca\uff1a</p> </li> </ul> \\[\\mathbf{a} \\cdot \\mathbf{b} = \\|\\mathbf{a}\\| \\, \\|\\mathbf{b}\\| \\cos(\\theta)\\] <p></p> <ul> <li> <p>\u8fd9\u5c06\u70b9\u79ef\u76f4\u63a5\u4e0e\u4e24\u4e2a\u5411\u91cf\u4e4b\u95f4\u7684\u89d2\u5ea6 \\(\\theta\\) \u8054\u7cfb\u8d77\u6765\u3002\u7ed3\u679c\u544a\u8bc9\u4f60\u4e24\u4e2a\u5411\u91cf\u5728\u65b9\u5411\u4e0a\"\u4e00\u81f4\"\u7684\u7a0b\u5ea6\u3002</p> </li> <li> <p>\u5982\u679c\u5b83\u4eec\u6307\u5411\u76f8\u540c\u65b9\u5411\uff08\\(\\theta = 0\u00b0\\)\uff09\uff0c\\(\\cos(\\theta) = 1\\) \u4e14\u70b9\u79ef\u6700\u5927\u3002</p> </li> <li> <p>\u5982\u679c\u5b83\u4eec\u6b63\u4ea4\uff08\\(\\theta = 90\u00b0\\)\uff09\uff0c\\(\\cos(\\theta) = 0\\) \u4e14\u70b9\u79ef\u6070\u597d\u4e3a\u96f6\u3002\u8fd9\u7ed9\u51fa\u4e86\u6b63\u4ea4\u6027\u7684\u7cbe\u786e\u68c0\u9a8c\u3002</p> </li> <li> <p>\u5982\u679c\u5b83\u4eec\u6307\u5411\u76f8\u53cd\u65b9\u5411\uff08\\(\\theta = 180\u00b0\\)\uff09\uff0c\\(\\cos(\\theta) = -1\\) \u4e14\u70b9\u79ef\u4e3a\u8d1f\u3002</p> </li> <li> <p>\u5411\u91cf\u4e0e\u81ea\u8eab\u7684\u70b9\u79ef\u7ed9\u51fa\u5176\u6a21\u957f\u7684\u5e73\u65b9\uff1a\\(\\mathbf{a} \\cdot \\mathbf{a} = \\|\\mathbf{a}\\|^2\\)\u3002</p> </li> <li> <p>\u70b9\u79ef\u8fd8\u7ed9\u51fa\u4e86\u6295\u5f71\uff0c\u5373\u4e00\u4e2a\u5411\u91cf\u5728\u53e6\u4e00\u4e2a\u5411\u91cf\u4e0a\u6295\u4e0b\u7684\u5f71\u5b50\u3002\\(\\mathbf{a}\\) \u5728 \\(\\mathbf{b}\\) \u4e0a\u7684\u6295\u5f71\u4e3a\uff1a</p> </li> </ul> \\[\\text{proj}_{\\mathbf{b}}(\\mathbf{a}) = \\frac{\\mathbf{a} \\cdot \\mathbf{b}}{\\|\\mathbf{b}\\|^2} \\, \\mathbf{b}\\] <ul> <li> <p>\u60f3\u8c61\u4e00\u675f\u5149\u7ebf\u76f4\u5c04\u5230 \\(\\mathbf{b}\\) \u4e0a\u3002\\(\\mathbf{a}\\) \u5728\u90a3\u6761\u7ebf\u4e0a\u7684\u5f71\u5b50\u5c31\u662f\u6295\u5f71\u3002\u5b83\u544a\u8bc9\u4f60 \\(\\mathbf{a}\\) \u6709\u591a\u5c11\u4f4d\u4e8e \\(\\mathbf{b}\\) \u7684\u65b9\u5411\u4e0a\u3002</p> </li> <li> <p>\u4f59\u5f26\u76f8\u4f3c\u5ea6\u901a\u8fc7\u9664\u4ee5\u4e24\u4e2a\u6a21\u957f\u6765\u5f52\u4e00\u5316\u70b9\u79ef\uff1a</p> </li> </ul> \\[\\cos(\\theta) = \\frac{\\mathbf{a} \\cdot \\mathbf{b}}{\\|\\mathbf{a}\\| \\, \\|\\mathbf{b}\\|}\\] <ul> <li> <p>\u8fd9\u4f1a\u7ed9\u51fa\u4e00\u4e2a\u4ecb\u4e8e \\(-1\\) \u548c \\(1\\) \u4e4b\u95f4\u7684\u503c\uff0c\u8861\u91cf\u65b9\u5411\u5bf9\u9f50\u7a0b\u5ea6\uff0c\u5ffd\u7565\u5411\u91cf\u7684\u957f\u5ea6\u3002\u5b83\u5e7f\u6cdb\u5e94\u7528\u4e8e ML \u4e2d\u6765\u6bd4\u8f83\u6587\u6863\u3001\u5d4c\u5165\u548c\u7528\u6237\u504f\u597d\u7b49\u4e8b\u7269\u3002</p> </li> <li> <p>\u73b0\u5728\uff0c\u70b9\u79ef\u63a5\u53d7\u4e24\u4e2a\u5411\u91cf\u5e76\u8fd4\u56de\u6807\u91cf\u3002\u53c9\u79ef\u5219\u76f8\u53cd\uff0c\u5b83\u63a5\u53d7\u4e24\u4e2a\u5411\u91cf\u5e76\u8fd4\u56de\u4e00\u4e2a\u65b0\u5411\u91cf\u3002</p> </li> <li> <p>\u53c9\u79ef \\(\\mathbf{a} \\times \\mathbf{b}\\) \u4ea7\u751f\u4e00\u4e2a\u540c\u65f6\u5782\u76f4\u4e8e \\(\\mathbf{a}\\) \u548c \\(\\mathbf{b}\\) \u7684\u5411\u91cf\uff1a</p> </li> </ul> \\[\\mathbf{a} \\times \\mathbf{b} = (a_2 b_3 - a_3 b_2, \\; a_3 b_1 - a_1 b_3, \\; a_1 b_2 - a_2 b_1)\\] <ul> <li> <p>\u53c9\u79ef\u53ea\u9002\u7528\u4e8e\u4e09\u7ef4\u3002\u70b9\u79ef\u9002\u7528\u4e8e\u4efb\u610f\u7ef4\u5ea6\uff0c\u800c\u53c9\u79ef\u662f\u4e09\u7ef4\u7a7a\u95f4\u7279\u6709\u7684\u3002</p> </li> <li> <p>\u5176\u6a21\u957f\u7b49\u4e8e\u7531\u8fd9\u4e24\u4e2a\u5411\u91cf\u5f62\u6210\u7684\u5e73\u884c\u56db\u8fb9\u5f62\u7684\u9762\u79ef\uff1a</p> </li> </ul> \\[\\|\\mathbf{a} \\times \\mathbf{b}\\| = \\|\\mathbf{a}\\| \\, \\|\\mathbf{b}\\| \\sin(\\theta)\\] <ul> <li> <p>\u6ce8\u610f\u6a21\u5f0f\uff1a\u70b9\u79ef\u4f7f\u7528 \\(\\cos(\\theta)\\)\uff0c\u53c9\u79ef\u4f7f\u7528 \\(\\sin(\\theta)\\)\u3002\u70b9\u79ef\u8861\u91cf\u4e24\u4e2a\u5411\u91cf\u5bf9\u9f50\u7684\u7a0b\u5ea6\uff0c\u53c9\u79ef\u8861\u91cf\u5b83\u4eec\u5728\u65b9\u5411\u4e0a\u5dee\u5f02\u7684\u7a0b\u5ea6\u3002</p> </li> <li> <p>\u7ed3\u679c\u7684\u65b9\u5411\u9075\u5faa\u53f3\u624b\u5b9a\u5219\uff1a\u5c06\u53f3\u624b\u7684\u624b\u6307\u4ece \\(\\mathbf{a}\\) \u5f2f\u5411 \\(\\mathbf{b}\\)\uff0c\u62c7\u6307\u6307\u5411 \\(\\mathbf{a} \\times \\mathbf{b}\\) \u7684\u65b9\u5411\u3002</p> </li> <li> <p>\u4e0e\u70b9\u79ef\u4e0d\u540c\uff0c\u53c9\u79ef\u4e0d\u53ef\u4ea4\u6362\uff1a\\(\\mathbf{a} \\times \\mathbf{b} = -(\\mathbf{b} \\times \\mathbf{a})\\)\u3002\u4ea4\u6362\u987a\u5e8f\u4f1a\u7ffb\u8f6c\u65b9\u5411\u3002</p> </li> <li> <p>\u5982\u679c\u4e24\u4e2a\u5411\u91cf\u5e73\u884c\uff0c\u5b83\u4eec\u7684\u53c9\u79ef\u662f\u96f6\u5411\u91cf\uff08\u56e0\u4e3a \\(\\sin(0\u00b0) = 0\\)\uff09\u3002\u6ca1\u6709\u9762\u79ef\uff0c\u6ca1\u6709\u5782\u76f4\u65b9\u5411\u3002</p> </li> <li> <p>\u5f53\u4f60\u4f7f\u7528\u4e24\u4e2a\u4e58\u79ef\u7ed3\u5408\u4e09\u4e2a\u5411\u91cf\u4f1a\u53d1\u751f\u4ec0\u4e48\uff1f\u8fd9\u5c31\u5f97\u5230\u4e86\u4e09\u91cd\u79ef\u3002</p> </li> <li> <p>xxxxxxxxxx9\u00a01import jax.numpy as jnp2\u200b3u = jnp.array([1.0, 2.0, 3.0])4v = jnp.array([4.0, 0.0, 1.0])5\u200b6euclidean = jnp.sqrt(jnp.sum((u - v) ** 2))7manhattan = jnp.sum(jnp.abs(u - v))8\u200b9print(f\"Euclidean: {euclidean:.2f}, Manhattan: {manhattan}\")python</p> </li> <li> <p>\u5982\u679c\u6807\u91cf\u4e09\u91cd\u79ef\u4e3a\u96f6\uff0c\u5219\u8fd9\u4e09\u4e2a\u5411\u91cf\u5171\u9762\uff0c\u5b83\u4eec\u90fd\u4f4d\u4e8e\u540c\u4e00\u4e2a\u5e73\u5766\u5e73\u9762\u4e0a\uff0c\u4e0d\u5f62\u6210\u4f53\u79ef\u3002</p> </li> <li> <p>\u987a\u5e8f\u53ef\u4ee5\u5faa\u73af\u800c\u4e0d\u6539\u53d8\u7ed3\u679c\uff1a\\(\\mathbf{a} \\cdot (\\mathbf{b} \\times \\mathbf{c}) = \\mathbf{b} \\cdot (\\mathbf{c} \\times \\mathbf{a}) = \\mathbf{c} \\cdot (\\mathbf{a} \\times \\mathbf{b})\\)\u3002</p> </li> <li> <p>\u5411\u91cf\u4e09\u91cd\u79ef \\(\\mathbf{a} \\times (\\mathbf{b} \\times \\mathbf{c})\\) \u5e94\u7528\u4e24\u6b21\u53c9\u79ef\u5e76\u8fd4\u56de\u4e00\u4e2a\u5411\u91cf\u3002\u5b83\u53ef\u4ee5\u4f7f\u7528\u6052\u7b49\u5f0f\u7b80\u6d01\u5c55\u5f00\uff1a</p> </li> </ul> \\[\\mathbf{a} \\times (\\mathbf{b} \\times \\mathbf{c}) = (\\mathbf{a} \\cdot \\mathbf{c})\\mathbf{b} - (\\mathbf{a} \\cdot \\mathbf{b})\\mathbf{c}\\] <ul> <li>\u7ed3\u679c\u603b\u662f\u4f4d\u4e8e\u7531 \\(\\mathbf{b}\\) \u548c \\(\\mathbf{c}\\) \u5f20\u6210\u7684\u5e73\u9762\u5185\u3002\u6ce8\u610f\u53c9\u79ef\u4e0d\u6ee1\u8db3\u7ed3\u5408\u5f8b\uff1a\\(\\mathbf{a} \\times (\\mathbf{b} \\times \\mathbf{c}) \\neq (\\mathbf{a} \\times \\mathbf{b}) \\times \\mathbf{c}\\)\u3002</li> </ul>"},{"location":"chapter%2001%3A%20vectors/04.%20products/#colab-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ol> <li> <p>\u8ba1\u7b97\u4e24\u4e2a\u5411\u91cf\u7684\u70b9\u79ef\u5e76\u7528\u5b83\u6c42\u51fa\u5b83\u4eec\u4e4b\u95f4\u7684\u89d2\u5ea6\u3002\u5c1d\u8bd5\u8ba9\u5b83\u4eec\u6b63\u4ea4\u3001\u5e73\u884c\u6216\u53cd\u5411\uff0c\u89c2\u5bdf\u89d2\u5ea6\u5982\u4f55\u53d8\u5316\u3002 <pre><code>import jax.numpy as jnp\n\na = jnp.array([1.0, 2.0, 3.0])\nb = jnp.array([4.0, -1.0, 2.0])\n\ndot = jnp.dot(a, b)\nangle = jnp.arccos(dot / (jnp.linalg.norm(a) * jnp.linalg.norm(b)))\n\nprint(f\"Dot product: {dot}\")\nprint(f\"Angle: {jnp.degrees(angle):.1f}\u00b0\")\n</code></pre></p> </li> <li> <p>\u8ba1\u7b97\u4e24\u4e2a\u4e09\u7ef4\u5411\u91cf\u7684\u53c9\u79ef\uff0c\u5e76\u901a\u8fc7\u68c0\u67e5\u7ed3\u679c\u4e0e\u6bcf\u4e2a\u539f\u59cb\u5411\u91cf\u7684\u70b9\u79ef\u4e3a\u96f6\u6765\u9a8c\u8bc1\u7ed3\u679c\u5782\u76f4\u4e8e\u4e24\u8005\u3002 <pre><code>import jax.numpy as jnp\n\na = jnp.array([1.0, 0.0, 0.0])\nb = jnp.array([0.0, 1.0, 0.0])\n\ncross = jnp.cross(a, b)\n\nprint(f\"a x b = {cross}\")\nprint(f\"Perpendicular to a: {jnp.dot(cross, a) == 0}\")\nprint(f\"Perpendicular to b: {jnp.dot(cross, b) == 0}\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2001%3A%20vectors/05.%20basis%20and%20duality/","title":"\u57fa\u4e0e\u5bf9\u5076\u6027","text":"<p>\u57fa\u5b9a\u4e49\u4e86\u5411\u91cf\u7a7a\u95f4\u7684\u5750\u6807\u7cfb\uff0c\u800c\u5bf9\u5076\u6027\u63ed\u793a\u4e86\u7ebf\u6027\u51fd\u6570\u5982\u4f55\u4f5c\u7528\u4e8e\u5411\u91cf\u3002\u672c\u6587\u6db5\u76d6\u7ebf\u6027\u65e0\u5173\u6027\u3001\u751f\u6210\u96c6\u3001\u57fa\u53d8\u6362\u3001\u5bf9\u5076\u7a7a\u95f4\u548c\u4f59\u5411\u91cf\uff0c\u8fd9\u4e9b\u6982\u5ff5\u652f\u6491\u4e86 ML \u4e2d\u7684 PCA\u3001\u7279\u5f81\u53d8\u6362\u548c\u6ce8\u610f\u529b\u67e5\u8be2\u3002</p> <ul> <li> <p>\u6211\u4eec\u5df2\u7ecf\u770b\u5230\u5411\u91cf\u5b58\u5728\u4e8e\u5177\u6709\u4e00\u5b9a\u7ef4\u5ea6\u6570\u7684\u7a7a\u95f4\u4e2d\u3002\u4f46\u4ec0\u4e48\u5b9a\u4e49\u4e86\u8fd9\u4e9b\u7ef4\u5ea6\uff1f\u8fd9\u5c31\u662f\u57fa\u5411\u91cf\u53d1\u6325\u4f5c\u7528\u7684\u5730\u65b9\u3002</p> </li> <li> <p>\u57fa\u662f\u4e00\u7ec4\u5411\u91cf\uff0c\u53ef\u4ee5\u901a\u8fc7\u7f29\u653e\u548c\u76f8\u52a0\uff08\u7ebf\u6027\u7ec4\u5408\uff09\u6784\u5efa\u7a7a\u95f4\u4e2d\u7684\u6bcf\u4e2a\u5176\u4ed6\u5411\u91cf\uff0c\u4e14\u6ca1\u6709\u5197\u4f59\u3002\u5b83\u4eec\u662f\u7a7a\u95f4\u7684\u6784\u5efa\u5757\u3002</p> </li> <li> <p>\u57fa\u5fc5\u987b\u6ee1\u8db3\u4e24\u4e2a\u6761\u4ef6\uff1a</p> <ul> <li> <p>\u7ebf\u6027\u65e0\u5173\uff1a\u6ca1\u6709\u57fa\u5411\u91cf\u80fd\u4ece\u5176\u4ed6\u57fa\u5411\u91cf\u6784\u9020\u51fa\u6765\u3002\u6bcf\u4e2a\u90fd\u8d21\u732e\u4e86\u4e00\u4e2a\u771f\u6b63\u7684\u65b0\u65b9\u5411\u3002</p> </li> <li> <p>\u751f\u6210\u6027\uff1a\u7a7a\u95f4\u4e2d\u7684\u6bcf\u4e2a\u5411\u91cf\u90fd\u53ef\u4ee5\u8868\u793a\u4e3a\u57fa\u5411\u91cf\u7684\u7ec4\u5408\u3002\u6ca1\u6709\u4efb\u4f55\u9057\u6f0f\u3002</p> </li> </ul> </li> <li> <p>\u57fa\u4e2d\u7684\u5411\u91cf\u6570\u91cf\u7b49\u4e8e\u7a7a\u95f4\u7684\u7ef4\u5ea6\u3002\u5728 \\(\\mathbb{R}^2\\) \u4e2d\u4f60\u9700\u8981 2 \u4e2a\uff0c\u5728 \\(\\mathbb{R}^3\\) \u4e2d\u4f60\u9700\u8981 3 \u4e2a\uff0c\u4f9d\u6b64\u7c7b\u63a8\u3002</p> </li> <li> <p>\u6700\u81ea\u7136\u7684\u57fa\u662f\u6807\u51c6\u57fa\uff0c\u5373\u6cbf\u6bcf\u4e2a\u8f74\u7684\u5355\u4f4d\u5411\u91cf\uff1a</p> <ul> <li>\u5728 \\(\\mathbb{R}^2\\) \u4e2d\uff1a\\(\\hat{\\mathbf{i}} = (1, 0)\\) \u548c \\(\\hat{\\mathbf{j}} = (0, 1)\\)</li> <li>\u5728 \\(\\mathbb{R}^3\\) \u4e2d\uff1a\\(\\hat{\\mathbf{i}} = (1, 0, 0)\\)\uff0c\\(\\hat{\\mathbf{j}} = (0, 1, 0)\\)\uff0c\\(\\hat{\\mathbf{k}} = (0, 0, 1)\\)</li> </ul> </li> <li> <p>\u4efb\u4f55\u5411\u91cf\u90fd\u662f\u8fd9\u4e9b\u57fa\u5411\u91cf\u7684\u52a0\u6743\u548c\u3002\u5411\u91cf \\((3, 2)\\) \u5b9e\u9645\u4e0a\u662f \\(3\\hat{\\mathbf{i}} + 2\\hat{\\mathbf{j}}\\)\u3002\u6743\u91cd\uff083 \u548c 2\uff09\u662f\u8be5\u57fa\u4e0b\u5411\u91cf\u7684\u5750\u6807\u3002</p> </li> <li> <p>\u4f46\u6807\u51c6\u57fa\u5e76\u4e0d\u662f\u552f\u4e00\u6709\u6548\u7684\u57fa\u3002\u5728 \\(\\mathbb{R}^2\\) \u4e2d\uff0c\u5411\u91cf \\((1, 1)\\) \u548c \\((-1, 1)\\) \u4e5f\u6784\u6210\u57fa\u3002\u5b83\u4eec\u7ebf\u6027\u65e0\u5173\uff0c\u5e76\u4e14\u53ef\u4ee5\u5230\u8fbe\u5e73\u9762\u4e0a\u7684\u4efb\u4f55\u70b9\u3002\u540c\u4e00\u4e2a\u5411\u91cf\u5728\u8fd9\u4e2a\u65b0\u57fa\u4e0b\u53ea\u662f\u6709\u4e0d\u540c\u7684\u5750\u6807\u3002</p> </li> <li> <p>\u57fa\u53d8\u6362\u4f7f\u7528\u4e0d\u540c\u7684\u6784\u5efa\u5757\u91cd\u65b0\u8868\u8fbe\u540c\u4e00\u4e2a\u5411\u91cf\u3002\u5411\u91cf\u6ca1\u6709\u79fb\u52a8\uff0c\u6211\u4eec\u53ea\u662f\u4ece\u4e0d\u540c\u7684\u89d2\u5ea6\u63cf\u8ff0\u5b83\u3002</p> </li> <li> <p>\u8fd9\u662f\u901a\u8fc7\u4e58\u4ee5\u4e00\u4e2a\u57fa\u53d8\u6362\u77e9\u9635 \\(P\\) \u6765\u5b8c\u6210\u7684\uff0c\u5176\u5217\u662f\u7528\u65e7\u5750\u6807\u8868\u793a\u7684\u65b0\u57fa\u5411\u91cf\u3002\u8981\u53d8\u56de\u53bb\uff0c\u4e58\u4ee5 \\(P^{-1}\\)\u3002</p> </li> <li> <p>\u5728 ML \u4e2d\uff0c\u57fa\u53d8\u6362\u7ecf\u5e38\u51fa\u73b0\u3002\u4f8b\u5982\uff0cPCA \u627e\u5230\u4e00\u4e2a\u65b0\u57fa\uff08\u4e3b\u6210\u5206\uff09\uff0c\u5728\u8be5\u57fa\u4e0b\u6570\u636e\u66f4\u5bb9\u6613\u7406\u89e3\uff0c\u5750\u6807\u8f74\u4e0e\u6700\u5927\u53d8\u5316\u65b9\u5411\u5bf9\u9f50\u3002</p> </li> <li> <p>\u73b0\u5728\uff0c\u8fd9\u91cc\u9690\u85cf\u7740\u4e00\u4e2a\u66f4\u6df1\u5c42\u7684\u60f3\u6cd5\u3002\u5f53\u6211\u4eec\u5199 \\(\\mathbf{v} = (3, 2)\\) \u65f6\uff0c\u5750\u6807 3 \u548c 2 \u5b9e\u9645\u4e0a\u662f\u6cbf\u7740\u6bcf\u4e2a\u57fa\u65b9\u5411\"\u6d4b\u91cf\" \\(\\mathbf{v}\\) \u7684\u7ed3\u679c\u3002\u7b2c\u4e00\u4e2a\u5750\u6807\u95ee\"\\(\\hat{\\mathbf{i}}\\) \u5728 \\(\\mathbf{v}\\) \u4e2d\u6709\u591a\u5c11\uff1f\"\uff0c\u7b2c\u4e8c\u4e2a\u95ee\"\\(\\hat{\\mathbf{j}}\\) \u5462\uff1f\"</p> </li> <li> <p>\u8fd9\u4e9b\u6d4b\u91cf\u4e2d\u7684\u6bcf\u4e00\u4e2a\u90fd\u662f\u4e00\u4e2a\u7ebf\u6027\u6cdb\u51fd\uff0c\u4e00\u4e2a\u63a5\u53d7\u5411\u91cf\u5e76\u8fd4\u56de\u5355\u4e2a\u6807\u91cf\u7684\u51fd\u6570\u3002\u6240\u6709\u8fd9\u6837\u7684\u7ebf\u6027\u6cdb\u51fd\u7684\u96c6\u5408\u6784\u6210\u4e86\u5bf9\u5076\u7a7a\u95f4 \\(V^\\ast\\)\u3002</p> </li> <li> <p>\u8fd9\u6837\u60f3\uff1a\u5411\u91cf\u662f\u88ab\u6d4b\u5bf9\u8c61\uff0c\u7ebf\u6027\u6cdb\u51fd\u662f\u6d4b\u91cf\u5b83\u4eec\u7684\u6807\u5c3a\u3002\u5bf9\u5076\u7a7a\u95f4\u662f\u6240\u6709\u53ef\u80fd\u7684\u6807\u5c3a\u7684\u96c6\u5408\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u6bcf\u4e2a\u57fa \\(\\{\\mathbf{e}_1, \\mathbf{e}_2, \\ldots, \\mathbf{e}_n\\}\\)\uff0c\u5b58\u5728\u4e00\u4e2a\u5bf9\u5e94\u7684\u5bf9\u5076\u57fa \\(\\{\\mathbf{e}_1^\\ast, \\mathbf{e}_2^\\ast, \\ldots, \\mathbf{e}_n^\\ast\\}\\)\u3002\u6bcf\u4e2a\u5bf9\u5076\u57fa\u5411\u91cf\u6070\u597d\u63d0\u53d6\u4e00\u4e2a\u5750\u6807\uff1a</p> </li> </ul> \\[ \\mathbf{e}_i^\\ast(\\mathbf{e}_j) = \\delta_{ij} = \\begin{cases} 1 &amp; \\text{if } i = j \\\\ 0 &amp; \\text{if } i \\neq j \\end{cases} \\] <ul> <li> <p>\\(\\mathbf{e}_1^\\ast\\) \u4f5c\u7528\u4e8e \\(\\mathbf{e}_1\\) \u65f6\u8fd4\u56de 1\uff0c\u5bf9\u5176\u5b83\u6240\u6709\u5411\u91cf\u8fd4\u56de 0\u3002\u5b83\u5b8c\u7f8e\u5730\u9694\u79bb\u4e86\u7b2c\u4e00\u4e2a\u5750\u6807\u3002</p> </li> <li> <p>\u70b9\u79ef\u8fde\u63a5\u4e86\u8fd9\u4e24\u4e2a\u4e16\u754c\u3002\u5f53\u4f60\u8ba1\u7b97 \\(\\mathbf{u} \\cdot \\mathbf{v}\\) \u65f6\uff0c\u4f60\u53ef\u4ee5\u628a\u5176\u4e2d\u4e00\u4e2a\u5411\u91cf\u770b\u4f5c\"\u6807\u5c3a\"\u5728\u6d4b\u91cf\u53e6\u4e00\u4e2a\u5411\u91cf\u3002\u70b9\u79ef \\(\\mathbf{u} \\cdot \\mathbf{v}\\) \u7b49\u540c\u4e8e\u5c06\u7531 \\(\\mathbf{u}\\) \u5b9a\u4e49\u7684\u7ebf\u6027\u6cdb\u51fd\u5e94\u7528\u4e8e\u5411\u91cf \\(\\mathbf{v}\\)\u3002</p> </li> <li> <p>\u8fd9\u610f\u5473\u7740\u6bcf\u4e2a\u5411\u91cf\u90fd\u9690\u542b\u5730\u5b9a\u4e49\u4e86\u4e00\u4e2a\u7ebf\u6027\u6cdb\u51fd\uff0c\u5e76\u4e14\u6bcf\u4e2a\u7ebf\u6027\u6cdb\u51fd\u90fd\u53ef\u4ee5\u7528\u4e00\u4e2a\u5411\u91cf\u8868\u793a\u3002\u5728\u6709\u9650\u7ef4\u7a7a\u95f4\u4e2d\uff0c\u5bf9\u5076\u7a7a\u95f4\u672c\u8d28\u4e0a\u662f\u539f\u59cb\u7a7a\u95f4\u7684\u955c\u50cf\u3002</p> </li> <li> <p>\u5bf9\u5076\u6027\u73b0\u5728\u53ef\u80fd\u770b\u8d77\u6765\u5f88\u62bd\u8c61\uff0c\u4f46\u5b83\u652f\u6491\u7740\u8bb8\u591a\u5b9e\u9645\u7684\u6982\u5ff5\uff1a\u5750\u6807\u662f\u5bf9\u5076\u57fa\u7684\u8bc4\u4f30\uff0c\u70b9\u79ef\u662f\u5bf9\u5076\u914d\u5bf9\uff0c\u800c\u795e\u7ecf\u7f51\u7edc\u4e2d\u7684\u6ce8\u610f\u529b\u7b49\u53d8\u6362\u901a\u8fc7\u8ba9\u4e00\u7ec4\u5411\u91cf\"\u67e5\u8be2\"\u53e6\u4e00\u7ec4\u5411\u91cf\u6765\u8fd0\u4f5c\uff0c\u8fd9\u6b63\u662f\u5bf9\u5076\u6027\u5728\u8d77\u4f5c\u7528\u3002</p> </li> </ul>"},{"location":"chapter%2001%3A%20vectors/05.%20basis%20and%20duality/#colab-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ol> <li> <p>\u5728\u4e24\u4e2a\u4e0d\u540c\u7684\u57fa\u4e2d\u8868\u8fbe\u4e00\u4e2a\u5411\u91cf\uff0c\u5e76\u9a8c\u8bc1\u5b83\u4eec\u4ee3\u8868\u540c\u4e00\u4e2a\u70b9\u3002\u5c1d\u8bd5\u521b\u5efa\u4f60\u81ea\u5df1\u7684\u57fa\uff0c\u89c2\u5bdf\u5411\u91cf\u5f97\u5230\u4ec0\u4e48\u5750\u6807\u3002 <pre><code>import jax.numpy as jnp\n\nv = jnp.array([3.0, 2.0])\n\n# \u6807\u51c6\u57fa\uff1a\u5750\u6807\u5c31\u662f\u5206\u91cf\u672c\u8eab\nprint(f\"Standard basis coords: {v}\")\n\n# \u65b0\u57fa\uff1a(1,1) \u548c (-1,1)\nP = jnp.array([[1.0, -1.0],\n               [1.0,  1.0]])\nnew_coords = jnp.linalg.solve(P, v)\nprint(f\"New basis coords: {new_coords}\")\n\n# \u9a8c\u8bc1\uff1a\u4ece\u65b0\u5750\u6807\u91cd\u5efa\nreconstructed = new_coords[0] * P[:, 0] + new_coords[1] * P[:, 1]\nprint(f\"Reconstructed: {reconstructed}\")\n</code></pre></p> </li> <li> <p>\u9a8c\u8bc1\u5bf9\u5076\u57fa\u6027\u8d28\uff1a\u6bcf\u4e2a\u5bf9\u5076\u57fa\u5411\u91cf\u6070\u597d\u63d0\u53d6\u4e00\u4e2a\u5750\u6807\uff0c\u5bf9\u5176\u4ed6\u5411\u91cf\u8fd4\u56de\u96f6\u3002 <pre><code>import jax.numpy as jnp\n\n# R3 \u4e2d\u7684\u6807\u51c6\u57fa\ne1 = jnp.array([1.0, 0.0, 0.0])\ne2 = jnp.array([0.0, 1.0, 0.0])\ne3 = jnp.array([0.0, 0.0, 1.0])\n\nv = jnp.array([5.0, 3.0, 7.0])\n\n# \u6bcf\u4e2a\u70b9\u79ef\u63d0\u53d6\u4e00\u4e2a\u5750\u6807\nprint(f\"e1 \u00b7 v = {jnp.dot(e1, v)}\")\nprint(f\"e2 \u00b7 v = {jnp.dot(e2, v)}\")\nprint(f\"e3 \u00b7 v = {jnp.dot(e3, v)}\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2002%3A%20matrices/01.%20matrix%20properties/","title":"\u77e9\u9635\u6027\u8d28","text":"<p>\u77e9\u9635\u662f\u5b58\u50a8\u6570\u636e\u96c6\u3001\u7f16\u7801\u53d8\u6362\u548c\u5b9a\u4e49\u6bcf\u4e2a\u795e\u7ecf\u7f51\u7edc\u5c42\u7684\u6570\u636e\u7ed3\u6784\u3002\u672c\u6587\u6db5\u76d6\u77e9\u9635\u7ef4\u5ea6\u3001\u5143\u7d20\u3001\u8f6c\u7f6e\u3001\u8ff9\u3001\u884c\u5217\u5f0f\u3001\u9006\u3001\u79e9\u548c\u96f6\u7a7a\u95f4\uff0c\u8fd9\u4e9b\u662f\u8d2f\u7a7f\u7ebf\u6027\u4ee3\u6570\u548c ML \u7684\u57fa\u7840\u6027\u8d28\u3002</p> <ul> <li>\u6838\u5fc3\u800c\u8a00\uff0c\u77e9\u9635\u662f\u6309\u884c\u5217\u6392\u5217\u7684\u6570\u5b57\u77e9\u5f62\u7f51\u683c\u3002\u5982\u679c\u5411\u91cf\u662f\u6570\u5b57\u7684\u5355\u4e2a\u5217\u8868\uff0c\u90a3\u4e48\u77e9\u9635\u5c31\u662f\u6570\u5b57\u7684\u4e00\u5f20\u8868\u683c\u3002</li> </ul> \\[ A = \\begin{bmatrix} 1 &amp; 2 &amp; 3 \\\\ 4 &amp; 5 &amp; 6 \\end{bmatrix} \\] <ul> <li> <p>\u4f60\u4e5f\u53ef\u4ee5\u5c06\u77e9\u9635\u89c6\u4e3a\u5411\u91cf\u7684\u5806\u53e0\u3002</p> </li> <li> <p>\u5982\u679c\u4e00\u4e2a\u4eba\u7531\u5411\u91cf \\([\\text{age}, \\text{height}, \\text{weight}]\\) \u63cf\u8ff0\uff0c\u90a3\u4e48\u4e09\u4e2a\u4eba\u5c31\u5f62\u6210\u4e00\u4e2a\u77e9\u9635\uff0c\u5176\u4e2d\u6bcf\u884c\u662f\u4e00\u4e2a\u4eba\uff1a</p> </li> </ul> \\[ \\begin{bmatrix} 25 &amp; 170 &amp; 65 \\\\ 30 &amp; 180 &amp; 80 \\\\ 22 &amp; 160 &amp; 55 \\end{bmatrix} \\] <ul> <li> <p>\u8fd9\u4e2a\u77e9\u9635\u6709 3 \u884c\u548c 3 \u5217\uff0c\u6240\u4ee5\u6211\u4eec\u79f0\u5b83\u4e3a \\(3 \\times 3\\) \u77e9\u9635\u3002</p> </li> <li> <p>\u7f51\u683c\u4e2d\u7684\u6bcf\u4e2a\u6570\u5b57\u79f0\u4e3a\u4e00\u4e2a\u5143\u7d20\u6216\u6761\u76ee\uff0c\u7531\u5176\u884c\u5217\u6807\u8bc6\uff1a\\(A_{ij}\\) \u662f\u7b2c \\(i\\) \u884c\u7b2c \\(j\\) \u5217\u7684\u5143\u7d20\u3002</p> </li> <li> <p>\u77e9\u9635\u7684\u8f6c\u7f6e\u6cbf\u5176\u5bf9\u89d2\u7ebf\u7ffb\u8f6c\uff0c\u5c06\u884c\u53d8\u4e3a\u5217\uff0c\u5217\u53d8\u4e3a\u884c\u3002\u5982\u679c \\(A\\) \u662f \\(m \\times n\\)\uff0c\u90a3\u4e48 \\(A^T\\) \u662f \\(n \\times m\\)\u3002</p> </li> </ul> \\[ A = \\begin{bmatrix} 1 &amp; 2 &amp; 3 \\\\ 4 &amp; 5 &amp; 6 \\end{bmatrix} \\quad \\Rightarrow \\quad A^T = \\begin{bmatrix} 1 &amp; 4 \\\\ 2 &amp; 5 \\\\ 3 &amp; 6 \\end{bmatrix} \\] <ul> <li> <p>\u77e9\u9635\u4e58\u4ee5\u5176\u8f6c\u7f6e\u603b\u662f\u5f97\u5230\u4e00\u4e2a\u65b9\u9635\uff1a\\(AA^T\\) \u662f \\(m \\times m\\)\uff0c\\(A^TA\\) \u662f \\(n \\times n\\)\u3002</p> </li> <li> <p>\u65b9\u9635\u7684\u8ff9\u662f\u5176\u5bf9\u89d2\u7ebf\u5143\u7d20\u4e4b\u548c\uff1a\\(\\text{tr}(A) = A_{11} + A_{22} + \\cdots + A_{nn}\\)\u3002\u8ff9\u7b49\u4e8e\u7279\u5f81\u503c\u4e4b\u548c\uff08\u6211\u4eec\u7a0d\u540e\u4f1a\u770b\u5230\uff09\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u5bf9\u4e8e\u4e0a\u9762\u7684\u77e9\u9635\uff0c\\(\\text{tr}(A) = 1 + 4 + 9 = 14\\)\u3002\u53ea\u6709\u9ad8\u4eae\u7684\u5bf9\u89d2\u7ebf\u90e8\u5206\u91cd\u8981\u3002</p> </li> <li> <p>\u5982\u679c\u4e24\u4e2a\u77e9\u9635\u5728\u4e0d\u540c\u57fa\u4e0b\u8868\u793a\u76f8\u540c\u7684\u7ebf\u6027\u53d8\u6362\uff0c\u5b83\u4eec\u7684\u8ff9\u76f8\u540c\u3002\u8ff9\u662f\"\u4e0e\u57fa\u65e0\u5173\u7684\u3002\"</p> </li> <li> <p>\u77e9\u9635\u7684\u79e9\u662f\u7ebf\u6027\u65e0\u5173\u7684\u884c\uff08\u6216\u7b49\u4ef7\u5730\uff0c\u5217\uff09\u7684\u6570\u91cf\u3002\u5b83\u544a\u8bc9\u4f60\u77e9\u9635\u643a\u5e26\u4e86\u591a\u5c11\"\u6709\u7528\u4fe1\u606f\u3002\"</p> </li> <li> <p>\u4f8b\u5982\uff0c\u4ee5\u4e0b\u77e9\u9635\u7684\u79e9\u4e3a 2\uff0c\u56e0\u4e3a\u4e24\u884c\u4e4b\u95f4\u4e92\u4e0d\u4e3a\u500d\u6570\uff1a</p> </li> </ul> \\[ \\begin{bmatrix} 1 &amp; 2 \\\\ 3 &amp; 4 \\end{bmatrix} \\] <p>\u4f46\u4ee5\u4e0b\u77e9\u9635\u7684\u79e9\u4e3a 1\uff0c\u56e0\u4e3a\u7b2c\u4e8c\u884c\u53ea\u662f\u7b2c\u4e00\u884c\u7684\u4e24\u500d\uff0c\u6240\u4ee5\u5b83\u6ca1\u6709\u589e\u52a0\u65b0\u4fe1\u606f\uff1a</p> \\[ \\begin{bmatrix} 1 &amp; 2 \\\\ 2 &amp; 4 \\end{bmatrix} \\] <ul> <li>\u4e00\u4e2a \\(5 \\times 3\\) \u77e9\u9635\u7684\u79e9\u6700\u591a\u4e3a 3\u3002\u5982\u679c\u67d0\u4e9b\u884c\u53ea\u662f\u5176\u4ed6\u884c\u7684\u7f29\u653e\u6216\u7ec4\u5408\u7248\u672c\uff0c\u79e9\u5c31\u4f1a\u4e0b\u964d\u3002\u5177\u6709\u6700\u5927\u53ef\u80fd\u79e9\u7684\u77e9\u9635\u79f0\u4e3a\u6ee1\u79e9\u3002</li> </ul> <p></p> <ul> <li> <p>\u65b9\u9635\u53ef\u9006\uff08\u6709\u9006\u77e9\u9635\uff09\u5f53\u4e14\u4ec5\u5f53\u5b83\u662f\u6ee1\u79e9\u7684\u3002</p> </li> <li> <p>\u79e9\u901a\u8fc7\u79e9-\u96f6\u5316\u5ea6\u5b9a\u7406\u4e0e\u96f6\u7a7a\u95f4\uff08\u77e9\u9635\u6620\u5c04\u5230\u96f6\u7684\u5411\u91cf\u7684\u96c6\u5408\uff09\u76f8\u8fde\uff1a\\(\\text{rank}(A) + \\text{nullity}(A) = \\text{\u5217\u6570 of } A\\)\u3002\u77e9\u9635\u4fdd\u7559\u7684\uff08\u79e9\uff09\u52a0\u4e0a\u5b83\u7834\u574f\u7684\uff08\u96f6\u5316\u5ea6\uff09\u7b49\u4e8e\u603b\u7ef4\u5ea6\u3002</p> </li> <li> <p>\u77e9\u9635\u7684\u5217\u7a7a\u95f4\u662f\u5f53\u4f60\u5c06\u77e9\u9635\u4e58\u4ee5\u4efb\u610f\u5411\u91cf\u65f6\u6240\u6709\u53ef\u80fd\u8f93\u51fa\u7684\u96c6\u5408\u3002\u5b83\u7531\u77e9\u9635\u7684\u5217\u5f20\u6210\u3002\u5982\u679c\u77e9\u9635\u6709 3 \u5217\u4f46\u53ea\u6709 2 \u5217\u72ec\u7acb\uff0c\u5217\u7a7a\u95f4\u662f\u4e00\u4e2a\u4e8c\u7ef4\u5e73\u9762\uff0c\u800c\u4e0d\u662f\u6574\u4e2a\u4e09\u7ef4\u7a7a\u95f4\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u884c\u7a7a\u95f4\u662f\u540c\u6837\u7684\u6982\u5ff5\uff0c\u4f46\u4ece\u884c\u7684\u89d2\u5ea6\u6765\u770b\u3002\u79e9\u7b49\u4e8e\u5217\u7a7a\u95f4\u548c\u884c\u7a7a\u95f4\u7684\u7ef4\u5ea6\uff0c\u6240\u4ee5\u5b83\u4eec\u603b\u662f\u4e00\u81f4\u7684\u3002</p> </li> <li> <p>\u4e00\u8d77\u6765\u770b\uff0c\u5217\u7a7a\u95f4\u544a\u8bc9\u4f60\"\u8fd9\u4e2a\u77e9\u9635\u80fd\u4ea7\u751f\u4ec0\u4e48\u8f93\u51fa\uff1f\"\u96f6\u7a7a\u95f4\u544a\u8bc9\u4f60\"\u4ec0\u4e48\u8f93\u5165\u88ab\u6620\u5c04\u5230\u96f6\uff1f\"\u8fd9\u4e24\u4e2a\u7a7a\u95f4\u5b8c\u6574\u63cf\u8ff0\u4e86\u77e9\u9635\u7684\u529f\u80fd\u3002</p> </li> <li> <p>\u65b9\u9635\u7684\u884c\u5217\u5f0f\u662f\u4e00\u4e2a\u6807\u91cf\uff0c\u6355\u6349\u77e9\u9635\u5982\u4f55\u7f29\u653e\u7a7a\u95f4\u3002\u60f3\u8c61\u4e00\u4e2a \\(2 \\times 2\\) \u77e9\u9635\u5c06\u4e00\u4e2a\u5355\u4f4d\u6b63\u65b9\u5f62\u53d8\u6362\u6210\u4e00\u4e2a\u5e73\u884c\u56db\u8fb9\u5f62\u3002\u884c\u5217\u5f0f\u5c31\u662f\u90a3\u4e2a\u5e73\u884c\u56db\u8fb9\u5f62\u7684\u9762\u79ef\uff08\u5e26\u6709\u7b26\u53f7\uff09\u3002</p> </li> </ul> \\[ \\det\\begin{bmatrix} a &amp; b \\\\ c &amp; d \\end{bmatrix} = ad - bc \\] <p></p> <ul> <li>\u4f8b\u5982\uff1a</li> </ul> \\[ \\det\\begin{bmatrix} 2 &amp; 1 \\\\ 0 &amp; 3 \\end{bmatrix} = 2 \\cdot 3 - 1 \\cdot 0 = 6 \\] <p>\u8fd9\u4e2a\u53d8\u6362\u5c06\u5355\u4f4d\u6b63\u65b9\u5f62\u62c9\u4f38\u6210\u4e00\u4e2a\u9762\u79ef\u4e3a 6 \u7684\u5e73\u884c\u56db\u8fb9\u5f62\u3002</p> <ul> <li> <p>\u5982\u679c\u884c\u5217\u5f0f\u4e3a\u6b63\uff0c\u53d8\u6362\u4fdd\u6301\u5b9a\u5411\uff08\u4e8b\u7269\u4e0d\u4f1a\u88ab\"\u7ffb\u8f6c\"\uff09\u3002\u5982\u679c\u4e3a\u8d1f\uff0c\u5b83\u7ffb\u8f6c\u5b9a\u5411\uff08\u50cf\u955c\u9762\u53cd\u5c04\uff09\u3002\u5982\u679c\u4e3a\u96f6\uff0c\u77e9\u9635\u5c06\u7a7a\u95f4\u538b\u7f29\u5230\u66f4\u4f4e\u7ef4\u5ea6\uff0c\u5c06\u5e73\u884c\u56db\u8fb9\u5f62\u574d\u7f29\u6210\u4e00\u6761\u7ebf\u6216\u4e00\u4e2a\u70b9\u3002</p> </li> <li> <p>\u884c\u5217\u5f0f\u4e3a\u96f6\u7684\u77e9\u9635\u79f0\u4e3a\u5947\u5f02\u77e9\u9635\u3002\u5b83\u6ca1\u6709\u9006\u77e9\u9635\u4e14\u5df2\u6c38\u4e45\u4e22\u5931\u4fe1\u606f\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u5927\u4e8e \\(2 \\times 2\\) \u7684\u77e9\u9635\uff0c\u884c\u5217\u5f0f\u4f7f\u7528\u4f59\u5b50\u5f0f\u548c\u4ee3\u6570\u4f59\u5b50\u5f0f\u8ba1\u7b97\u3002\u4f59\u5b50\u5f0f \\(M_{ij}\\) \u662f\u901a\u8fc7\u5220\u9664\u7b2c \\(i\\) \u884c\u548c\u7b2c \\(j\\) \u5217\u5f97\u5230\u7684\u8f83\u5c0f\u77e9\u9635\u7684\u884c\u5217\u5f0f\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u4ee3\u6570\u4f59\u5b50\u5f0f \\(C_{ij} = (-1)^{i+j} M_{ij}\\) \u4e3a\u6bcf\u4e2a\u4f59\u5b50\u5f0f\u9644\u52a0\u4e00\u4e2a\u7b26\u53f7\uff08\u50cf\u68cb\u76d8\u4e00\u6837\u4ea4\u66ff\uff1a\\(+, -, +, \\ldots\\)\uff09\u3002\u6574\u4e2a\u77e9\u9635\u7684\u884c\u5217\u5f0f\u7136\u540e\u6cbf\u7740\u4efb\u610f\u884c\u6216\u5217\u6c42\u548c\uff1a\\(\\det(A) = \\sum_j A_{1j} \\cdot C_{1j}\\)\u3002\u8fd9\u79f0\u4e3a\u4ee3\u6570\u4f59\u5b50\u5f0f\u5c55\u5f00\u3002</p> </li> <li> <p>\u65b9\u9635 \\(A\\) \u7684\u9006\uff0c\u8bb0\u4f5c \\(A^{-1}\\)\uff0c\u662f\u64a4\u9500 \\(A\\) \u7684\u77e9\u9635\uff1a\\(AA^{-1} = A^{-1}A = I\\)\uff08\u5355\u4f4d\u77e9\u9635\uff09\u3002\u53ea\u6709\u975e\u5947\u5f02\u77e9\u9635\u624d\u6709\u9006\u3002</p> </li> <li> <p>\u5bf9\u4e8e \\(2 \\times 2\\) \u77e9\u9635\uff0c\u9006\u6709\u4e00\u4e2a\u76f4\u63a5\u516c\u5f0f\uff1a</p> </li> </ul> \\[ \\begin{bmatrix} a &amp; b \\\\ c &amp; d \\end{bmatrix}^{-1} = \\frac{1}{ad - bc}\\begin{bmatrix} d &amp; -b \\\\ -c &amp; a \\end{bmatrix} \\] <p>\u6ce8\u610f\u5206\u6bcd\u4e2d\u7684\u884c\u5217\u5f0f\uff0c\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48\u5947\u5f02\u77e9\u9635\uff08\u884c\u5217\u5f0f\u4e3a\u96f6\uff09\u6ca1\u6709\u9006\u3002</p> <ul> <li> <p>\u6761\u4ef6\u6570\u8861\u91cf\u77e9\u9635\u5bf9\u5176\u8f93\u5165\u5fae\u5c0f\u53d8\u5316\u7684\u654f\u611f\u7a0b\u5ea6\u3002\u5b83\u5b9a\u4e49\u4e3a \\(\\kappa(A) = \\|A\\| \\cdot \\|A^{-1}\\|\\)\u3002</p> </li> <li> <p>\u63a5\u8fd1 1 \u7684\u6761\u4ef6\u6570\u610f\u5473\u7740\u77e9\u9635\u662f\u826f\u6001\u7684\uff1a\u5fae\u5c0f\u7684\u8f93\u5165\u53d8\u5316\u4ea7\u751f\u5fae\u5c0f\u7684\u8f93\u51fa\u53d8\u5316\u3002\u5927\u7684\u6761\u4ef6\u6570\u610f\u5473\u7740\u5b83\u662f\u75c5\u6001\u7684\uff1a\u5fae\u5c0f\u7684\u8bef\u5dee\u88ab\u6781\u5927\u653e\u5927\u3002\u6b63\u4ea4\u77e9\u9635\u548c\u5355\u4f4d\u77e9\u9635\u7684\u6761\u4ef6\u6570\u4e3a 1\uff0c\u800c\u5947\u5f02\u77e9\u9635\u7684\u6761\u4ef6\u6570\u4e3a\u65e0\u7a77\u5927\u3002</p> </li> <li> <p>\u4f8b\u5982\uff0c\u4ee5\u4e0b\u77e9\u9635\u7684\u6761\u4ef6\u6570\u4e3a \\(10^8\\)\u3002\u4e00\u4e2a\u65b9\u5411\u88ab\u6b63\u5e38\u7f29\u653e\uff0c\u800c\u53e6\u4e00\u4e2a\u51e0\u4e4e\u88ab\u538b\u7f29\u4e3a\u96f6\uff0c\u6240\u4ee5\u6cbf\u8be5\u65b9\u5411\u7684\u5c0f\u6270\u52a8\u4f1a\u88ab\u4e25\u91cd\u626d\u66f2\uff1a</p> </li> </ul> \\[ \\begin{bmatrix} 1 &amp; 0 \\\\ 0 &amp; 10^{-8} \\end{bmatrix} \\] <ul> <li>\u5c31\u50cf\u5411\u91cf\u6709\u8303\u6570\uff08\u957f\u5ea6\uff09\u4e00\u6837\uff0c\u77e9\u9635\u4e5f\u6709\u8861\u91cf\u5176\"\u5927\u5c0f\"\u7684\u8303\u6570\u3002\u6700\u5e38\u89c1\u7684\u662f\u5f17\u7f57\u8d1d\u5c3c\u4e4c\u65af\u8303\u6570\uff0c\u5b83\u5c06\u77e9\u9635\u89c6\u4e3a\u4e00\u4e2a\u957f\u5411\u91cf\u5e76\u8ba1\u7b97\u5176\u957f\u5ea6\uff1a</li> </ul> \\[ \\|A\\|_F = \\sqrt{\\sum_{i}\\sum_{j} A_{ij}^2} \\] <ul> <li>\u4f8b\u5982\uff1a</li> </ul> \\[ \\left\\|\\begin{bmatrix} 1 &amp; 2 \\\\ 3 &amp; 4 \\end{bmatrix}\\right\\|_F = \\sqrt{1 + 4 + 9 + 16} = \\sqrt{30} \\approx 5.48 \\] <ul> <li> <p>\u8c31\u8303\u6570 \\(\\|A\\|_2\\) \u662f \\(A\\) \u7684\u6700\u5927\u5947\u5f02\u503c\u3002\u5b83\u8861\u91cf\u77e9\u9635\u53ef\u4ee5\u62c9\u4f38\u4efb\u4f55\u5355\u4f4d\u5411\u91cf\u7684\u6700\u5927\u7a0b\u5ea6\u3002\u5728 ML \u4e2d\uff0c\u77e9\u9635\u8303\u6570\u7528\u4e8e\u6743\u91cd\u6b63\u5219\u5316\uff08\u60e9\u7f5a\u5927\u6743\u91cd\uff09\u548c\u76d1\u63a7\u8bad\u7ec3\u7a33\u5b9a\u6027\u3002</p> </li> <li> <p>\u5bf9\u79f0\u77e9\u9635 \\(A\\) \u662f\u6b63\u5b9a\u7684\uff0c\u5982\u679c\u5bf9\u6bcf\u4e2a\u975e\u96f6\u5411\u91cf \\(\\mathbf{x}\\)\uff1a\\(\\mathbf{x}^T A \\mathbf{x} &gt; 0\\)\u3002\u8fd9\u4e2a\u4e8c\u6b21\u578b\u603b\u662f\u4ea7\u751f\u6b63\u6570\u3002</p> </li> <li> <p>\u4f8b\u5982\uff0c\u4ee5\u4e0b\u77e9\u9635\u662f\u6b63\u5b9a\u7684\uff1a</p> </li> </ul> \\[ A = \\begin{bmatrix} 2 &amp; 1 \\\\ 1 &amp; 3 \\end{bmatrix} \\] <p>\u53d6\u4efb\u610f\u5411\u91cf\uff0c\u6bd4\u5982 \\(\\mathbf{x} = [1, -1]^T\\)\uff1a\\(\\mathbf{x}^T A \\mathbf{x} = 2 - 1 - 1 + 3 = 3 &gt; 0\\)\u3002\u65e0\u8bba\u4f60\u5c1d\u8bd5\u54ea\u4e2a\u975e\u96f6 \\(\\mathbf{x}\\)\uff0c\u4f60\u603b\u662f\u5f97\u5230\u6b63\u7684\u7ed3\u679c\u3002</p> <ul> <li> <p>\u6b63\u5b9a\u77e9\u9635\u5f88\u91cd\u8981\uff0c\u56e0\u4e3a\u5b83\u4eec\u4fdd\u8bc1\u4f18\u5316\u95ee\u9898\u6709\u552f\u4e00\u7684\u6700\u5c0f\u503c\u3002</p> </li> <li> <p>\u5982\u679c\u6761\u4ef6\u653e\u5bbd\u5230 \\(\\mathbf{x}^T A \\mathbf{x} \\geq 0\\)\uff08\u5141\u8bb8\u4e3a\u96f6\uff09\uff0c\u77e9\u9635\u662f\u534a\u6b63\u5b9a\uff08PSD\uff09\u3002PSD \u77e9\u9635\u7ecf\u5e38\u51fa\u73b0\uff1a\u534f\u65b9\u5dee\u77e9\u9635\u3001SVM \u4e2d\u7684\u6838\u77e9\u9635\u4ee5\u53ca\u5c40\u90e8\u6700\u5c0f\u503c\u5904\u7684 Hessian \u77e9\u9635\u90fd\u662f PSD\u3002\u533a\u522b\u5728\u4e8e PSD \u5141\u8bb8\u67d0\u4e9b\u65b9\u5411\u662f\"\u5e73\u5766\u7684\"\uff08\u96f6\u66f2\u7387\uff09\uff0c\u800c\u4e0d\u662f\u4e25\u683c\u5411\u4e0a\u5f2f\u66f2\u3002</p> </li> </ul>"},{"location":"chapter%2002%3A%20matrices/01.%20matrix%20properties/#colab-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ol> <li> <p>\u8ba1\u7b97\u77e9\u9635\u7684\u8ff9\u3001\u79e9\u548c\u884c\u5217\u5f0f\u3002\u5c1d\u8bd5\u4f7f\u4e00\u884c\u6210\u4e3a\u53e6\u4e00\u884c\u7684\u500d\u6570\uff0c\u89c2\u5bdf\u79e9\u548c\u884c\u5217\u5f0f\u5982\u4f55\u53d8\u5316\u3002 <pre><code>import jax.numpy as jnp\n\nA = jnp.array([[1.0, 2.0],\n               [3.0, 4.0]])\n\nprint(f\"Trace: {jnp.trace(A)}\")\nprint(f\"Rank: {jnp.linalg.matrix_rank(A)}\")\nprint(f\"Determinant: {jnp.linalg.det(A):.2f}\")\n</code></pre></p> </li> <li> <p>\u8ba1\u7b97\u77e9\u9635\u7684\u9006\uff0c\u5c06\u5176\u4e58\u4ee5\u539f\u77e9\u9635\uff0c\u9a8c\u8bc1\u5f97\u5230\u5355\u4f4d\u77e9\u9635\u3002\u7136\u540e\u5c1d\u8bd5\u5947\u5f02\u77e9\u9635\u5e76\u89c2\u5bdf\u4f1a\u53d1\u751f\u4ec0\u4e48\u3002 <pre><code>import jax.numpy as jnp\n\nA = jnp.array([[1.0, 2.0],\n               [3.0, 4.0]])\n\nA_inv = jnp.linalg.inv(A)\nprint(f\"A * A_inv:\\n{A @ A_inv}\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2002%3A%20matrices/02.%20matrix%20types/","title":"\u77e9\u9635\u7c7b\u578b","text":"<p>\u7279\u6b8a\u7684\u77e9\u9635\u7ed3\u6784\u80fd\u591f\u89e3\u9501\u8ba1\u7b97\u6377\u5f84\u548c\u6570\u5b66\u4fdd\u8bc1\u3002\u672c\u6587\u6db5\u76d6\u5355\u4f4d\u77e9\u9635\u3001\u5bf9\u89d2\u77e9\u9635\u3001\u5bf9\u79f0\u77e9\u9635\u3001\u4e09\u89d2\u77e9\u9635\u3001\u6b63\u4ea4\u77e9\u9635\u3001\u6b63\u5b9a\u77e9\u9635\u3001\u7a00\u758f\u77e9\u9635\u548c\u968f\u673a\u77e9\u9635\uff0c\u8fd9\u4e9b\u7c7b\u578b\u51fa\u73b0\u5728\u534f\u65b9\u5dee\u4f30\u8ba1\u3001\u56fe\u7b97\u6cd5\u3001\u6b63\u5219\u5316\u548c\u9a6c\u5c14\u53ef\u592b\u94fe\u4e2d\u3002</p> <ul> <li> <p>\u5e76\u975e\u6240\u6709\u77e9\u9635\u90fd\u4e00\u6837\u3002\u4e0d\u540c\u7684\u7ed3\u6784\u8d4b\u4e88\u77e9\u9635\u7279\u6b8a\u7684\u6027\u8d28\uff0c\u4f7f\u5b83\u4eec\u8ba1\u7b97\u66f4\u5feb\u3001\u66f4\u6613\u4e8e\u63a8\u7406\uff0c\u6216\u4e24\u8005\u517c\u5f97\u3002\u4ee5\u4e0b\u662f\u4f60\u6700\u5e38\u9047\u5230\u7684\u7c7b\u578b\u3002</p> </li> <li> <p>\u65b9\u9635\u7684\u884c\u6570\u548c\u5217\u6570\u76f8\u540c\uff08\\(n \\times n\\)\uff09\u3002\u5927\u591a\u6570\u6709\u8da3\u7684\u6027\u8d28\uff08\u884c\u5217\u5f0f\u3001\u7279\u5f81\u503c\u3001\u9006\uff09\u53ea\u9002\u7528\u4e8e\u65b9\u9635\u3002</p> </li> <li> <p>\u5355\u4f4d\u77e9\u9635 \\(I\\) \u662f\u4e00\u4e2a\u5bf9\u89d2\u7ebf\u4e3a 1\u3001\u5176\u4f59\u4e3a 0 \u7684\u65b9\u9635\u3002\u5b83\u662f\"\u4ec0\u4e48\u90fd\u4e0d\u505a\"\u7684\u53d8\u6362\uff1a\\(AI = IA = A\\) \u5bf9\u4efb\u4f55\u517c\u5bb9\u7684\u77e9\u9635 \\(A\\)\u3002</p> </li> </ul> \\[ I = \\begin{bmatrix} 1 &amp; 0 &amp; 0 \\\\ 0 &amp; 1 &amp; 0 \\\\ 0 &amp; 0 &amp; 1 \\end{bmatrix} \\] <ul> <li> <p>\u96f6\u77e9\u9635 \\(O\\) \u7684\u6240\u6709\u5143\u7d20\u90fd\u4e3a\u96f6\u3002\u5b83\u5c06\u6bcf\u4e2a\u5411\u91cf\u6620\u5c04\u5230\u96f6\u5411\u91cf\uff0c\u7834\u574f\u6240\u6709\u4fe1\u606f\u3002</p> </li> <li> <p>\u5bf9\u89d2\u77e9\u9635\u9664\u4e3b\u5bf9\u89d2\u7ebf\u5916\u5168\u4e3a\u96f6\u3002\u5c06\u5411\u91cf\u4e58\u4ee5\u5bf9\u89d2\u77e9\u9635\u53ea\u662f\u72ec\u7acb\u5730\u7f29\u653e\u6bcf\u4e2a\u5206\u91cf\uff0c\u975e\u5e38\u9ad8\u6548\u3002</p> </li> </ul> \\[ D = \\begin{bmatrix} 3 &amp; 0 \\\\ 0 &amp; 7 \\end{bmatrix} \\] <ul> <li>\u5bf9\u79f0\u77e9\u9635\u7b49\u4e8e\u5176\u8f6c\u7f6e\uff1a\\(A = A^T\\)\uff0c\u610f\u5473\u7740 \\(A_{ij} = A_{ji}\\)\u3002\u5bf9\u79f0\u77e9\u9635\u6709\u4e00\u4e2a\u7279\u6b8a\u6027\u8d28\uff1a\u5b83\u4eec\u7684\u7279\u5f81\u5411\u91cf\u603b\u662f\u76f8\u4e92\u5782\u76f4\u3002\u534f\u65b9\u5dee\u77e9\u9635\u603b\u662f\u5bf9\u79f0\u7684\u3002</li> </ul> \\[ S = \\begin{bmatrix} 3 &amp; -1 \\\\ -1 &amp; 6 \\end{bmatrix} \\] <ul> <li>\u4e09\u89d2\u77e9\u9635\u5728\u5bf9\u89d2\u7ebf\u7684\u4e00\u4fa7\u5168\u4e3a\u96f6\u3002\u4e0b\u4e09\u89d2\u5728\u4e0a\u65b9\u5168\u4e3a\u96f6\uff0c\u4e0a\u4e09\u89d2\u5728\u4e0b\u65b9\u5168\u4e3a\u96f6\u3002\u5b83\u4eec\u5bf9\u4e8e\u901a\u8fc7\u524d\u5411\u6216\u56de\u4ee3\u9ad8\u6548\u6c42\u89e3\u65b9\u7a0b\u7ec4\u81f3\u5173\u91cd\u8981\u3002</li> </ul> \\[ L = \\begin{bmatrix} 2 &amp; 0 &amp; 0 \\\\ 1 &amp; 3 &amp; 0 \\\\ -1 &amp; 2 &amp; 4 \\end{bmatrix} \\qquad U = \\begin{bmatrix} 5 &amp; -1 &amp; 2 \\\\ 0 &amp; 1 &amp; 3 \\\\ 0 &amp; 0 &amp; -2 \\end{bmatrix} \\] <ul> <li> <p>\u4e09\u89d2\u77e9\u9635\u7684\u884c\u5217\u5f0f\u5c31\u662f\u5176\u5bf9\u89d2\u7ebf\u5143\u7d20\u7684\u4e58\u79ef\u3002</p> </li> <li> <p>\u6b63\u4ea4\u77e9\u9635\u5177\u6709\u8f6c\u7f6e\u7b49\u4e8e\u9006\u7684\u6027\u8d28\uff1a\\(Q^TQ = QQ^T = I\\)\u3002</p> </li> <li> <p>\u8fd9\u610f\u5473\u7740\u4f60\u53ea\u9700\u8f6c\u7f6e\u5c31\u80fd\"\u64a4\u9500\"\u53d8\u6362\uff0c\u8ba1\u7b97\u6210\u672c\u5f88\u4f4e\u3002\u5176\u5217\u662f\u6807\u51c6\u6b63\u4ea4\u7684\uff08\u5355\u4f4d\u957f\u5ea6\u4e14\u76f8\u4e92\u5782\u76f4\uff09\u3002</p> </li> <li> <p>\u7a00\u758f\u77e9\u9635\u7684\u5927\u591a\u6570\u5143\u7d20\u4e3a\u96f6\uff0c\u800c\u7a20\u5bc6\u77e9\u9635\u7684\u5927\u591a\u6570\u5143\u7d20\u975e\u96f6\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u5728\u5b9e\u8df5\u4e2d\uff0c\u8bb8\u591a\u73b0\u5b9e\u4e16\u754c\u7684\u77e9\u9635\u662f\u6781\u5176\u7a00\u758f\u7684\u3002</p> </li> <li> <p>\u4e00\u4e2a\u62e5\u6709\u767e\u4e07\u7528\u6237\u7684\u793e\u4ea4\u7f51\u7edc\u53ef\u4ee5\u8868\u793a\u4e3a\u4e00\u4e2a \\(10^6 \\times 10^6\\) \u7684\u77e9\u9635\uff0c\u4f46\u6bcf\u4e2a\u4eba\u53ea\u8fde\u63a5\u5230\u5c11\u6570\u5176\u4ed6\u4eba\uff0c\u6240\u4ee5\u51e0\u4e4e\u6240\u6709\u5143\u7d20\u90fd\u662f\u96f6\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u7f6e\u6362\u77e9\u9635\u662f\u901a\u8fc7\u91cd\u6392\u5355\u4f4d\u77e9\u9635\u7684\u884c\u5f97\u5230\u7684\u3002\u4e58\u4ee5\u5b83\u4f1a\u6253\u4e71\u5411\u91cf\u7684\u5143\u7d20\u3002\u6bcf\u884c\u6bcf\u5217\u6070\u597d\u6709\u4e00\u4e2a 1\uff0c\u5176\u4f59\u4e3a 0\u3002</p> </li> <li> <p>\u4f8b\u5982\uff0c\u4e0b\u9762\u7684\u77e9\u9635\u5c06\u5143\u7d20 3 \u79fb\u5230\u4f4d\u7f6e 1\uff0c\u5143\u7d20 1 \u79fb\u5230\u4f4d\u7f6e 2\uff0c\u5143\u7d20 2 \u79fb\u5230\u4f4d\u7f6e 3\uff1a</p> </li> </ul> \\[ P = \\begin{bmatrix} 0 &amp; 0 &amp; 1 \\\\ 1 &amp; 0 &amp; 0 \\\\ 0 &amp; 1 &amp; 0 \\end{bmatrix} \\] <ul> <li>\u6258\u666e\u5229\u8328\u77e9\u9635\u6cbf\u6bcf\u6761\u5bf9\u89d2\u7ebf\uff08\u5de6\u4e0a\u5230\u53f3\u4e0b\uff09\u5177\u6709\u76f8\u540c\u7684\u503c\u3002\u6ce8\u610f\u6bcf\u6761\u5bf9\u89d2\u7ebf\u662f\u5982\u4f55\u6052\u5b9a\u7684\uff1a</li> </ul> \\[ T = \\begin{bmatrix} a &amp; b &amp; c \\\\ d &amp; a &amp; b \\\\ e &amp; d &amp; a \\end{bmatrix} \\] <ul> <li> <p>\u8fd9\u79cd\u7ed3\u6784\u51fa\u73b0\u5728\u4fe1\u53f7\u5904\u7406\u548c\u5377\u79ef\u4e2d\uff0c\u56e0\u4e3a\u5c06\u56fa\u5b9a\u6ee4\u6ce2\u5668\u6ed1\u8fc7\u4fe1\u53f7\u7b49\u4ef7\u4e8e\u4e58\u4ee5\u6258\u666e\u5229\u8328\u77e9\u9635\u3002</p> </li> <li> <p>\u5faa\u73af\u77e9\u9635\u662f\u4e00\u79cd\u7279\u6b8a\u7684\u6258\u666e\u5229\u8328\u77e9\u9635\uff0c\u5176\u4e2d\u6bcf\u4e00\u884c\u662f\u4e0a\u4e00\u884c\u7684\u5faa\u73af\u79fb\u4f4d\u3002\u5f53\u4e00\u884c\u5230\u8fbe\u672b\u5c3e\u65f6\uff0c\u5b83\u4f1a\u7ed5\u56de\uff1a</p> </li> </ul> \\[ C = \\begin{bmatrix} 1 &amp; 3 &amp; 2 \\\\ 2 &amp; 1 &amp; 3 \\\\ 3 &amp; 2 &amp; 1 \\end{bmatrix} \\] <ul> <li> <p>\u5faa\u73af\u77e9\u9635\u4e0e\u79bb\u6563\u5085\u91cc\u53f6\u53d8\u6362\uff08DFT\uff09\u5bc6\u5207\u76f8\u5173\uff0c\u5e76\u4e14\u662f\u5faa\u73af\u5377\u79ef\u5982\u4f55\u5de5\u4f5c\u7684\u6838\u5fc3\u3002</p> </li> <li> <p>\u57c3\u5c14\u7c73\u7279\u77e9\u9635\u662f\u5bf9\u79f0\u77e9\u9635\u5728\u590d\u6570\u57df\u4e2d\u7684\u7b49\u4ef7\u5f62\u5f0f\uff1a\\(A = A^\\ast\\)\uff08\u5176\u4e2d \\(A^\\ast\\) \u662f\u5171\u8f6d\u8f6c\u7f6e\uff09\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u5b9e\u503c\u77e9\u9635\uff0c\u57c3\u5c14\u7c73\u7279\u77e9\u9635\u548c\u5bf9\u79f0\u77e9\u9635\u662f\u4e00\u56de\u4e8b\u3002\u4f60\u4f1a\u5728\u91cf\u5b50\u8ba1\u7b97\u548c\u4fe1\u53f7\u5904\u7406\u4e2d\u9047\u5230\u5b83\u4eec\u3002</p> </li> <li> <p>\u9149\u77e9\u9635\u662f\u6b63\u4ea4\u77e9\u9635\u5728\u590d\u6570\u57df\u4e2d\u7684\u7b49\u4ef7\u5f62\u5f0f\uff1a\\(U^\\ast U = UU^\\ast = I\\)\u3002\u6b63\u5982\u6b63\u4ea4\u77e9\u9635\u5728\u5b9e\u7a7a\u95f4\u4e2d\u4fdd\u6301\u957f\u5ea6\uff0c\u9149\u77e9\u9635\u5728\u590d\u7a7a\u95f4\u4e2d\u4fdd\u6301\u957f\u5ea6\u3002</p> </li> <li> <p>\u5e42\u7b49\u77e9\u9635\u6ee1\u8db3 \\(A^2 = A\\)\u3002\u5e94\u7528\u53d8\u6362\u4e24\u6b21\u7b49\u540c\u4e8e\u5e94\u7528\u4e00\u6b21\uff0c\u8fd9\u4f7f\u5f97\u5b83\u6210\u4e3a\u4e00\u4e2a\u6295\u5f71\u3002\u4e00\u65e6\u4f60\u6295\u5f71\u4e86\uff0c\u518d\u6b21\u6295\u5f71\u4e0d\u4f1a\u6539\u53d8\u4efb\u4f55\u4e1c\u897f\u3002</p> </li> <li> <p>\u5e42\u96f6\u77e9\u9635\u6ee1\u8db3\u5bf9\u67d0\u4e2a\u5e42\u6b21 \\(k\\) \u6709 \\(A^k = O\\)\uff08\u96f6\u77e9\u9635\uff09\u3002\u5e94\u7528\u53d8\u6362\u8db3\u591f\u591a\u6b21\u540e\uff0c\u6240\u6709\u4e1c\u897f\u90fd\u574d\u7f29\u4e3a\u96f6\u3002\u4f8b\u5982\uff1a</p> </li> </ul> \\[ \\begin{bmatrix} 0 &amp; 1 \\\\ 0 &amp; 0 \\end{bmatrix}^2 = \\begin{bmatrix} 0 &amp; 0 \\\\ 0 &amp; 0 \\end{bmatrix} \\] <ul> <li>\u5e03\u5c14\u77e9\u9635\uff08\u6216\u4e8c\u5143\u77e9\u9635\uff09\u53ea\u5305\u542b 0 \u548c 1\u3002\u5b83\u8868\u793a\u662f/\u5426\u5173\u7cfb\u3002\u4f8b\u5982\uff0c\u5728\u4e00\u4e2a\u6709 3 \u4e2a\u8282\u70b9\u7684\u56fe\u4e2d\uff0c\u90bb\u63a5\u77e9\u9635\u8bb0\u5f55\u54ea\u4e9b\u8282\u70b9\u76f8\u8fde\uff1a</li> </ul> \\[ B = \\begin{bmatrix} 0 &amp; 1 &amp; 1 \\\\ 1 &amp; 0 &amp; 0 \\\\ 1 &amp; 0 &amp; 0 \\end{bmatrix} \\] <ul> <li> <p>\u8fd9\u91cc\uff0c\u8282\u70b9 1 \u8fde\u63a5\u5230\u8282\u70b9 2 \u548c 3\uff0c\u4f46\u8282\u70b9 2 \u548c 3 \u4e4b\u95f4\u6ca1\u6709\u8fde\u63a5\u3002</p> </li> <li> <p>\u8303\u5fb7\u8499\u77e9\u9635\u7531\u4e00\u7ec4\u503c\u7684\u8fde\u7eed\u5e42\u6b21\u6784\u6210\u3002\u7ed9\u5b9a\u503c \\(x_1, x_2, x_3\\)\uff1a</p> </li> </ul> \\[ V = \\begin{bmatrix} 1 &amp; x_1 &amp; x_1^2 \\\\ 1 &amp; x_2 &amp; x_2^2 \\\\ 1 &amp; x_3 &amp; x_3^2 \\end{bmatrix} \\] <ul> <li> <p>\u8fd9\u79cd\u7ed3\u6784\u51fa\u73b0\u5728\u591a\u9879\u5f0f\u63d2\u503c\u4e2d\uff1a\u627e\u5230\u901a\u8fc7\u7ed9\u5b9a\u70b9\u96c6\u7684\u552f\u4e00\u591a\u9879\u5f0f\u3002</p> </li> <li> <p>\u6d77\u68ee\u5821\u77e9\u9635\u662f\"\u51e0\u4e4e\"\u4e09\u89d2\u7684\uff0c\u5728\u7b2c\u4e00\u6b21\u6b21\u5bf9\u89d2\u7ebf\u4ee5\u4e0b\u5168\u4e3a\u96f6\uff1a</p> </li> </ul> \\[ H = \\begin{bmatrix} 4 &amp; 2 &amp; 1 \\\\ 3 &amp; 5 &amp; -1 \\\\ 0 &amp; 1 &amp; 6 \\end{bmatrix} \\] <ul> <li>\u5b83\u662f\u6709\u6548\u8ba1\u7b97\u7279\u5f81\u503c\u7684\u6709\u7528\u4e2d\u95f4\u5f62\u5f0f\u3002\u5148\u5c06\u77e9\u9635\u5316\u4e3a\u6d77\u68ee\u5821\u5f62\u5f0f\u53ef\u4ee5\u4f7f\u8fed\u4ee3\u7b97\u6cd5\u6536\u655b\u66f4\u5feb\u3002</li> </ul>"},{"location":"chapter%2002%3A%20matrices/02.%20matrix%20types/#colab-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ol> <li> <p>\u521b\u5efa\u4e00\u4e2a\u6b63\u4ea4\u77e9\u9635\uff08\u65cb\u8f6c\u77e9\u9635\uff09\uff0c\u4e58\u4ee5\u5176\u8f6c\u7f6e\uff0c\u9a8c\u8bc1\u5f97\u5230\u5355\u4f4d\u77e9\u9635\u3002\u5c1d\u8bd5\u4e0d\u540c\u7684\u89d2\u5ea6\u3002 <pre><code>import jax.numpy as jnp\n\ntheta = jnp.pi / 4\nQ = jnp.array([[jnp.cos(theta), -jnp.sin(theta)],\n               [jnp.sin(theta),  jnp.cos(theta)]])\n\nprint(f\"Q @ Q.T:\\n{Q @ Q.T}\")\nprint(f\"Determinant: {jnp.linalg.det(Q):.2f}\")\n</code></pre></p> </li> <li> <p>\u521b\u5efa\u4e00\u4e2a\u5bf9\u79f0\u77e9\u9635\u5e76\u9a8c\u8bc1\u5b83\u7b49\u4e8e\u5176\u8f6c\u7f6e\u3002\u7136\u540e\u8ba1\u7b97\u5176\u7279\u5f81\u503c\u5e76\u68c0\u67e5\u7279\u5f81\u5411\u91cf\u662f\u5426\u5782\u76f4\u3002 <pre><code>import jax.numpy as jnp\n\nS = jnp.array([[4.0, 2.0],\n               [2.0, 3.0]])\n\nprint(f\"Symmetric: {jnp.allclose(S, S.T)}\")\n\neigenvalues, eigenvectors = jnp.linalg.eigh(S)\nprint(f\"Eigenvalues: {eigenvalues}\")\nprint(f\"Dot product of eigenvectors: {jnp.dot(eigenvectors[:, 0], eigenvectors[:, 1]):.6f}\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2002%3A%20matrices/03.%20operations/","title":"\u77e9\u9635\u8fd0\u7b97","text":"<p>\u77e9\u9635\u8fd0\u7b97\u662f\u6df1\u5ea6\u5b66\u4e60\u7684\u8ba1\u7b97\u5f15\u64ce\u3002\u672c\u6587\u6db5\u76d6\u77e9\u9635\u52a0\u6cd5\u3001\u6807\u91cf\u4e58\u6cd5\u3001\u77e9\u9635-\u5411\u91cf\u79ef\u3001\u77e9\u9635\u4e58\u6cd5\u3001\u9010\u5143\u7d20\u8fd0\u7b97\u3001Kronecker\u79ef\u548c\u5e7f\u64ad\u2014\u2014\u652f\u6491\u6bcf\u4e00\u6b21\u524d\u5411\u4f20\u64ad\u548c\u68af\u5ea6\u66f4\u65b0\u7684\u8fd0\u7b97\u3002</p> <ul> <li> <p>\u77e9\u9635\u53ef\u4ee5\u50cf\u5411\u91cf\u4e00\u6837\u8fdb\u884c\u52a0\u6cd5\u548c\u7f29\u653e\u3002</p> </li> <li> <p>\u52a0\u6cd5\u8981\u6c42\u4e24\u4e2a\u77e9\u9635\u7ef4\u5ea6\u76f8\u540c\uff0c\u7136\u540e\u9010\u5143\u7d20\u76f8\u52a0\uff1a</p> </li> </ul> \\[ \\begin{bmatrix} 1 &amp; 2 \\\\ 3 &amp; 4 \\end{bmatrix} + \\begin{bmatrix} 5 &amp; 6 \\\\ 7 &amp; 8 \\end{bmatrix} = \\begin{bmatrix} 6 &amp; 8 \\\\ 10 &amp; 12 \\end{bmatrix} \\] <ul> <li>\u6807\u91cf\u4e58\u6cd5\u5c06\u6bcf\u4e2a\u5143\u7d20\u4e58\u4ee5\u6807\u91cf\uff1a</li> </ul> \\[ 3 \\times \\begin{bmatrix} 1 &amp; 2 \\\\ 3 &amp; 4 \\end{bmatrix} = \\begin{bmatrix} 3 &amp; 6 \\\\ 9 &amp; 12 \\end{bmatrix} \\] <ul> <li>\u77e9\u9635\u80fd\u505a\u7684\u6700\u7b80\u5355\u7684\u4e8b\u60c5\u662f\u4e58\u4ee5\u4e00\u4e2a\u5411\u91cf\u3002\u77e9\u9635-\u5411\u91cf\u4e58\u6cd5 \\(A\\mathbf{x}\\) \u4f7f\u7528 \\(\\mathbf{x}\\) \u7684\u5206\u91cf\u4f5c\u4e3a\u6743\u91cd\u6765\u7ec4\u5408 \\(A\\) \u7684\u5217\uff1a</li> </ul> \\[ \\begin{bmatrix} 1 &amp; 2 \\\\ 3 &amp; 4 \\end{bmatrix} \\begin{bmatrix} 5 \\\\ 6 \\end{bmatrix} = 5 \\begin{bmatrix} 1 \\\\ 3 \\end{bmatrix} + 6 \\begin{bmatrix} 2 \\\\ 4 \\end{bmatrix} = \\begin{bmatrix} 17 \\\\ 39 \\end{bmatrix} \\] <ul> <li> <p>\u8fd9\u662f\u673a\u5668\u5b66\u4e60\u4e2d\u7684\u6838\u5fc3\u8fd0\u7b97\u3002\u6bcf\u4e2a\u795e\u7ecf\u7f51\u7edc\u5c42\u90fd\u8ba1\u7b97 \\(A\\mathbf{x} + \\mathbf{b}\\)\uff1a\u77e9\u9635\u4e58\u4ee5\u8f93\u5165\u5411\u91cf\uff0c\u518d\u52a0\u4e0a\u504f\u7f6e\u3002</p> </li> <li> <p>\u4e00\u822c\u60c5\u51b5\u662f\u77e9\u9635\u4e58\u6cd5\u3002\u7ed9\u5b9a \\(A\\)\uff08\\(m \\times n\\)\uff09\u548c \\(B\\)\uff08\\(n \\times p\\)\uff09\uff0c\u4e58\u79ef \\(C = AB\\) \u662f\u4e00\u4e2a \\(m \\times p\\) \u77e9\u9635\uff0c\u6bcf\u4e2a\u5143\u7d20\u90fd\u662f\u4e00\u4e2a\u70b9\u79ef\uff1a</p> </li> </ul> \\[C_{ij} = \\sum_{k=1}^{n} A_{ik} B_{kj}\\] <ul> <li> <p>\u7ed3\u679c\u4e2d\u7684\u6bcf\u4e2a\u6761\u76ee\u90fd\u662f \\(A\\) \u7684\u4e00\u884c\u4e0e \\(B\\) \u7684\u4e00\u5217\u7684\u70b9\u79ef\u3002\u5185\u90e8\u7ef4\u5ea6\u5fc5\u987b\u5339\u914d\uff08\\(n\\)\uff09\uff0c\u7ed3\u679c\u53d6\u5916\u90e8\u7ef4\u5ea6\uff08\\(m \\times p\\)\uff09\u3002</p> </li> <li> <p>\u53e6\u4e00\u79cd\u7406\u89e3\u65b9\u5f0f\uff1a\u7ed3\u679c\u7684\u6bcf\u4e00\u5217\u90fd\u662f \\(A\\) \u7684\u5217\u7684\u52a0\u6743\u548c\uff0c\u5176\u4e2d\u6743\u91cd\u6765\u81ea \\(B\\) \u7684\u5bf9\u5e94\u5217\u3002</p> </li> <li> <p>\u5982\u679c \\(B\\) \u7684\u67d0\u4e00\u5217\u4e3a \\([2, 3]^T\\)\uff0c\u5219\u7ed3\u679c\u5217\u5c31\u662f \\(2 \\times (\\text{A\u7684\u7b2c1\u5217}) + 3 \\times (\\text{A\u7684\u7b2c2\u5217})\\)\u3002</p> </li> <li> <p>\u4e00\u4e2a\u6709\u7528\u7684\u7279\u4f8b\uff1a\u77e9\u9635\u4e0e\u5176\u8f6c\u7f6e\u76f8\u4e58\u603b\u662f\u5f97\u5230\u4e00\u4e2a\u65b9\u9635\u3002\\(AA^T\\) \u662f \\(m \\times m\\)\uff0c\\(A^TA\\) \u662f \\(n \\times n\\)\uff1a</p> </li> </ul> \\[ \\begin{bmatrix} 1 &amp; 2 &amp; 3 \\\\ 4 &amp; 5 &amp; 6 \\end{bmatrix} \\begin{bmatrix} 1 &amp; 4 \\\\ 2 &amp; 5 \\\\ 3 &amp; 6 \\end{bmatrix} = \\begin{bmatrix} 14 &amp; 32 \\\\ 32 &amp; 77 \\end{bmatrix} \\] <ul> <li> <p>\u77e9\u9635\u4e58\u6cd5\u6709\u91cd\u8981\u7684\u8fd0\u7b97\u89c4\u5219\uff1a</p> <ul> <li> <p>\u4e0d\u6ee1\u8db3\u4ea4\u6362\u5f8b\uff1a\u901a\u5e38 \\(AB \\neq BA\\)\u3002\u987a\u5e8f\u5f88\u91cd\u8981\u3002</p> </li> <li> <p>\u6ee1\u8db3\u7ed3\u5408\u5f8b\uff1a\\((AB)C = A(BC)\\)\u3002\u4f60\u53ef\u4ee5\u4efb\u610f\u5206\u7ec4\u4e58\u6cd5\u3002</p> </li> <li> <p>\u6ee1\u8db3\u5206\u914d\u5f8b\uff1a\\(A(B + C) = AB + AC\\)\u3002</p> </li> <li> <p>\u5355\u4f4d\u77e9\u9635\uff1a\\(AI = IA = A\\)\u3002</p> </li> </ul> </li> <li> <p>Hadamard\u79ef\uff08\u9010\u5143\u7d20\u4e58\u79ef\uff09\u5c06\u4e24\u4e2a\u76f8\u540c\u5927\u5c0f\u7684\u77e9\u9635\u9010\u9879\u76f8\u4e58\uff0c\u8bb0\u4f5c \\(A \\odot B\\)\uff1a</p> </li> </ul> \\[ \\begin{bmatrix} 1 &amp; 2 \\\\ 3 &amp; 4 \\end{bmatrix} \\odot \\begin{bmatrix} 5 &amp; 6 \\\\ 7 &amp; 8 \\end{bmatrix} = \\begin{bmatrix} 5 &amp; 12 \\\\ 21 &amp; 32 \\end{bmatrix} \\] <ul> <li> <p>\u4e0e\u6807\u51c6\u77e9\u9635\u4e58\u6cd5\u4e0d\u540c\uff0cHadamard\u79ef\u6ee1\u8db3\u4ea4\u6362\u5f8b\uff08\\(A \\odot B = B \\odot A\\)\uff09\uff0c\u4e14\u8981\u6c42\u4e24\u4e2a\u77e9\u9635\u7ef4\u5ea6\u76f8\u540c\u3002\u5b83\u5728\u673a\u5668\u5b66\u4e60\u4e2d\u5e7f\u6cdb\u7528\u4e8e\u95e8\u63a7\u673a\u5236\uff1a\u901a\u8fc7\u4e0e\u4e00\u4e2a\u53d6\u503c\u57280\u52301\u4e4b\u95f4\u7684\u63a9\u7801\u9010\u5143\u7d20\u76f8\u4e58\uff0c\u63a7\u5236\u6bcf\u4e2a\u6761\u76ee\"\u901a\u8fc7\"\u591a\u5c11\u3002</p> </li> <li> <p>\u4e24\u4e2a\u5411\u91cf \\(\\mathbf{u}\\) \u548c \\(\\mathbf{v}\\) \u7684\u5916\u79ef\u4ea7\u751f\u4e00\u4e2a\u77e9\u9635\uff1a\\(\\mathbf{u}\\mathbf{v}^T\\)\u3002\u6bcf\u4e2a\u6761\u76ee\u662f \\(\\mathbf{u}\\) \u7684\u4e00\u4e2a\u5143\u7d20\u4e0e \\(\\mathbf{v}\\) \u7684\u4e00\u4e2a\u5143\u7d20\u7684\u4e58\u79ef\uff1a</p> </li> </ul> \\[ \\begin{bmatrix} 1 \\\\ 2 \\\\ 3 \\end{bmatrix} \\begin{bmatrix} 4 &amp; 5 \\end{bmatrix} = \\begin{bmatrix} 4 &amp; 5 \\\\ 8 &amp; 10 \\\\ 12 &amp; 15 \\end{bmatrix} \\] <ul> <li> <p>\u7ed3\u679c\u603b\u662f\u79e9\u4e3a1\uff0c\u56e0\u4e3a\u6bcf\u4e00\u884c\u90fd\u662f \\(\\mathbf{v}^T\\) \u7684\u7f29\u653e\u7248\u672c\u3002\u4efb\u4f55\u77e9\u9635\u90fd\u53ef\u4ee5\u5199\u6210\u79e9-1\u5916\u79ef\u4e4b\u548c\uff0c\u8fd9\u6b63\u662fSVD\u6240\u505a\u7684\u4e8b\u60c5\uff08\u89c1\u5206\u89e3\u7ae0\u8282\uff09\u3002</p> </li> <li> <p>\u77e9\u9635\u4e58\u6cd5\u7684\u8ba1\u7b97\u5f00\u9500\u5f88\u5927\u3002\u4e24\u4e2a \\(n \\times n\\) \u77e9\u9635\u76f8\u4e58\u9700\u8981 \\(O(n^3)\\) \u6b21\u8fd0\u7b97\u3002\u5bf9\u4e8e\u4e00\u4e2a \\(1000 \\times 1000\\) \u7684\u77e9\u9635\uff0c\u90a3\u5c31\u662f\u5341\u4ebf\u6b21\u4e58\u6cd5\u3002</p> </li> <li> <p>\u5f53\u77e9\u9635\u662f\u7a00\u758f\u7684\uff08\u5927\u90e8\u5206\u4e3a\u96f6\uff09\u65f6\uff0c\u6734\u7d20\u7684\u4e58\u6cd5\u4f1a\u6d6a\u8d39\u65f6\u95f4\u4e58\u4ee5\u96f6\u3002\u538b\u7f29\u7a00\u758f\u884c\uff08CSR\uff09\u683c\u5f0f\u53ea\u5b58\u50a8\u975e\u96f6\u5143\u7d20\u53ca\u5176\u4f4d\u7f6e\uff1a</p> <ul> <li>\u503c\uff1a\u6309\u884c\u987a\u5e8f\u6392\u5217\u7684\u975e\u96f6\u6761\u76ee</li> <li>\u5217\u7d22\u5f15\uff1a\u6bcf\u4e2a\u503c\u5c5e\u4e8e\u54ea\u4e00\u5217</li> <li>\u884c\u504f\u79fb\uff1a\u6bcf\u4e00\u884c\u5728\u503c\u5217\u8868\u4e2d\u7684\u8d77\u59cb\u4f4d\u7f6e</li> </ul> </li> <li> <p>\u4f8b\u5982\uff0c\u77e9\u9635\uff1a</p> </li> </ul> \\[ A = \\begin{bmatrix} 5 &amp; 0 &amp; 0 &amp; 2 \\\\ 0 &amp; 0 &amp; 3 &amp; 0 \\\\ 0 &amp; 0 &amp; 0 &amp; -1 \\end{bmatrix} \\] <ul> <li> <p>\u5b58\u50a8\u4e3a\uff1avalues = [5, 2, 3, -1], columns = [0, 3, 2, 3], row offsets = [0, 2, 3, 4]\u3002\u8fd9\u8df3\u8fc7\u4e86\u6240\u6709\u96f6\uff0c\u4f7f\u7a00\u758f\u8fd0\u7b97\u5feb\u5f97\u591a\u3002</p> </li> <li> <p>\u77e9\u9635\u7684\u4e00\u4e2a\u6838\u5fc3\u7528\u9014\u662f\u6c42\u89e3\u7ebf\u6027\u65b9\u7a0b\u7ec4\u3002\u65b9\u7a0b\u7ec4 \\(A\\mathbf{x} = \\mathbf{b}\\) \u95ee\u7684\u662f\uff1a\"\u4ec0\u4e48\u5411\u91cf \\(\\mathbf{x}\\) \u88ab \\(A\\) \u53d8\u6362\u540e\uff0c\u4f1a\u5f97\u5230 \\(\\mathbf{b}\\)\uff1f\"</p> </li> <li> <p>\u4f8b\u5982\uff0c\u5047\u8bbe\u4f60\u5728\u4e70\u6c34\u679c\u3002\u82f9\u679c\u6bcf\u4e2a \\(x_1\\) \u5143\uff0c\u9999\u8549\u6bcf\u4e2a \\(x_2\\) \u5143\u3002\u5df2\u77e52\u4e2a\u82f9\u679c\u548c1\u4e2a\u9999\u8549\u51715\u5143\uff0c1\u4e2a\u82f9\u679c\u548c3\u4e2a\u9999\u8549\u517110\u5143\u3002\u7528\u77e9\u9635\u5f62\u5f0f\u8868\u793a\uff1a</p> </li> </ul> \\[ \\begin{bmatrix} 2 &amp; 1 \\\\ 1 &amp; 3 \\end{bmatrix} \\begin{bmatrix} x_1 \\\\ x_2 \\end{bmatrix} = \\begin{bmatrix} 5 \\\\ 10 \\end{bmatrix} \\] <ul> <li>\u77e9\u9635\u9010\u884c\u4e58\u4ee5\u5411\u91cf\uff08\u6bcf\u4e00\u884c\u4e0e \\([x_1, x_2]^T\\) \u70b9\u79ef\uff09\u5f97\u5230\u4e24\u4e2a\u65b9\u7a0b\uff1a</li> </ul> \\[2x_1 + 1x_2 = 5 \\qquad \\text{(\u7b2c1\u884c)} \\qquad \\qquad x_1 + 3x_2 = 10 \\qquad \\text{(\u7b2c2\u884c)}\\] <ul> <li> <p>\u4ece\u7b2c1\u884c\u5f97 \\(x_2 = 5 - 2x_1\\)\u3002\u4ee3\u5165\u7b2c2\u884c\uff1a\\(x_1 + 3(5 - 2x_1) = 10\\)\uff0c\u89e3\u5f97 \\(x_1 = 1\\)\uff0c\u5219 \\(x_2 = 3\\)\u3002\u82f9\u679c\u6bcf\u4e2a1\u5143\uff0c\u9999\u8549\u6bcf\u4e2a3\u5143\u3002</p> </li> <li> <p>\u9a8c\u8bc1\u2014\u2014\u7ed3\u679c\u6b63\u786e\uff1a</p> </li> </ul> \\[ \\begin{bmatrix} 2 &amp; 1 \\\\ 1 &amp; 3 \\end{bmatrix} \\begin{bmatrix} 1 \\\\ 3 \\end{bmatrix} = \\begin{bmatrix} 2 + 3 \\\\ 1 + 9 \\end{bmatrix} = \\begin{bmatrix} 5 \\\\ 10 \\end{bmatrix} \\] <ul> <li> <p>\u5982\u679c \\(A\\) \u6709\u9006\u77e9\u9635\uff0c\u89e3\u5c31\u662f\u7b80\u5355\u7684 \\(\\mathbf{x} = A^{-1}\\mathbf{b}\\)\u3002\u4f46\u76f4\u63a5\u8ba1\u7b97\u9006\u77e9\u9635\u4ee3\u4ef7\u9ad8\u6602\u4e14\u6570\u503c\u4e0d\u7a33\u5b9a\u3002\u5b9e\u8df5\u4e2d\u6211\u4eec\u4f7f\u7528\u5206\u89e3\u65b9\u6cd5\u3002</p> </li> <li> <p>\u5e76\u975e\u6240\u6709\u77e9\u9635\u90fd\u662f\u65b9\u9635\uff0c\u4e5f\u4e0d\u662f\u6240\u6709\u65b9\u9635\u90fd\u53ef\u9006\u3002\u4f2a\u9006 \\(A^+\\) \u5c06\u9006\u63a8\u5e7f\u5230\u4efb\u610f\u77e9\u9635\u3002\u5b83\u603b\u662f\u5b58\u5728\uff0c\u5e76\u63d0\u4f9b\"\u5c3d\u53ef\u80fd\u597d\u7684\"\u9006\uff1a</p> </li> </ul> \\[A^+ = (A^TA)^{-1}A^T\\] <ul> <li> <p>\u5f53 \\(A\\) \u662f\u4e0b\u4e09\u89d2\u77e9\u9635\u65f6\uff0c\u901a\u8fc7\u524d\u5411\u4ee3\u5165\u6c42\u89e3 \\(L\\mathbf{x} = \\mathbf{b}\\) \u5f88\u5bb9\u6613\uff1a\u5148\u89e3\u51fa \\(x_1\\)\uff0c\u7136\u540e\u7528\u5b83\u6c42\u51fa \\(x_2\\)\uff0c\u4f9d\u6b64\u7c7b\u63a8\u3002</p> </li> <li> <p>\u5f53 \\(A\\) \u662f\u4e0a\u4e09\u89d2\u77e9\u9635\u65f6\uff0c\u901a\u8fc7\u56de\u4ee3\u6c42\u89e3 \\(U\\mathbf{x} = \\mathbf{b}\\)\uff1a\u5148\u89e3\u51fa\u6700\u540e\u4e00\u4e2a\u53d8\u91cf\uff0c\u7136\u540e\u5411\u4e0a\u6c42\u89e3\u3002</p> </li> <li> <p>\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48\u5c06\u77e9\u9635\u5206\u89e3\u4e3a\u4e09\u89d2\u56e0\u5b50\uff08\u5982\u5206\u89e3\u7ae0\u8282\u6240\u8ff0\uff09\u5982\u6b64\u6709\u7528\u2014\u2014\u5b83\u5c06\u4e00\u4e2a\u96be\u9898\u8f6c\u5316\u4e3a\u4e24\u4e2a\u7b80\u5355\u95ee\u9898\u3002</p> </li> </ul>"},{"location":"chapter%2002%3A%20matrices/03.%20operations/#colabjupyter-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528CoLab\u6216Jupyter Notebook\uff09","text":"<ol> <li>\u5c06\u4e24\u4e2a\u77e9\u9635\u76f8\u4e58\u5e76\u9a8c\u8bc1\u7ef4\u5ea6\u3002\u7136\u540e\u4ea4\u6362\u987a\u5e8f\uff0c\u89c2\u5bdf\u7ed3\u679c\u5982\u4f55\u53d8\u5316\uff08\u6216\u8005\uff0c\u5982\u679c\u7ef4\u5ea6\u4e0d\u5339\u914d\uff0c\u8fd0\u7b97\u5931\u8d25\uff09\u3002</li> </ol> <pre><code>import jax.numpy as jnp\n\nA = jnp.array([[1.0, 2.0],\n               [3.0, 4.0]])\nB = jnp.array([[5.0, 6.0],\n               [7.0, 8.0]])\n\nprint(f\"A @ B:\\n{A @ B}\")\nprint(f\"B @ A:\\n{B @ A}\")\nprint(f\"Equal: {jnp.allclose(A @ B, B @ A)}\")\n</code></pre> <ol> <li>\u6c42\u89e3\u7ebf\u6027\u65b9\u7a0b\u7ec4 \\(A\\mathbf{x} = \\mathbf{b}\\)\uff0c\u5e76\u901a\u8fc7\u56de\u4ee3\u4e58\u6cd5\u9a8c\u8bc1\u89e3\u3002\u5c1d\u8bd5\u6539\u53d8 \\(\\mathbf{b}\\)\uff0c\u89c2\u5bdf\u89e3\u5982\u4f55\u53d8\u5316\u3002</li> </ol> <pre><code>import jax.numpy as jnp\n\nA = jnp.array([[2.0, 1.0],\n               [5.0, 3.0]])\nb = jnp.array([4.0, 7.0])\n\nx = jnp.linalg.solve(A, b)\nprint(f\"Solution x: {x}\")\nprint(f\"A @ x: {A @ x}\")\n</code></pre>"},{"location":"chapter%2002%3A%20matrices/04.%20linear%20transformations/","title":"\u7ebf\u6027\u53d8\u6362","text":"<p>\u6bcf\u4e2a\u77e9\u9635\u4e58\u6cd5\u90fd\u662f\u4e00\u4e2a\u7ebf\u6027\u53d8\u6362\u2014\u2014\u4e00\u4e2a\u5728\u4fdd\u6301\u7ebf\u6027\u6027\u8d28\u7684\u540c\u65f6\u91cd\u5851\u3001\u65cb\u8f6c\u6216\u6295\u5f71\u5411\u91cf\u7684\u51fd\u6570\u3002\u672c\u6587\u6db5\u76d6\u65cb\u8f6c\u3001\u53cd\u5c04\u3001\u7f29\u653e\u3001\u526a\u5207\u3001\u6295\u5f71\u3001\u6620\u5c04\u7684\u6838\u4e0e\u50cf\uff0c\u4ee5\u53ca\u795e\u7ecf\u7f51\u7edc\u5c42\u5982\u4f55\u4e32\u8054\u8fd9\u4e9b\u53d8\u6362\u3002</p> <ul> <li> <p>\u7ebf\u6027\u53d8\u6362\uff08\u6216\u7ebf\u6027\u6620\u5c04\uff09\u662f\u4e00\u4e2a\u63a5\u6536\u5411\u91cf\u5e76\u4ea7\u751f\u53e6\u4e00\u4e2a\u5411\u91cf\u7684\u51fd\u6570\uff0c\u540c\u65f6\u4fdd\u6301\u52a0\u6cd5\u548c\u7f29\u653e\u6027\u8d28\u3002\u5982\u679c \\(T\\) \u662f\u7ebf\u6027\u7684\uff0c\u5219\uff1a</p> <ul> <li>\\(T(\\mathbf{u} + \\mathbf{v}) = T(\\mathbf{u}) + T(\\mathbf{v})\\)</li> <li>\\(T(c\\mathbf{u}) = cT(\\mathbf{u})\\)</li> </ul> </li> <li> <p>\u6bcf\u4e2a\u7ebf\u6027\u53d8\u6362\u90fd\u53ef\u4ee5\u8868\u793a\u4e3a\u77e9\u9635\u4e58\u6cd5\u3002\u77e9\u9635\u5c31\u662f\u53d8\u6362\u672c\u8eab\u3002\u5f53\u4f60\u7528\u4e00\u4e2a\u77e9\u9635\u4e58\u4ee5\u4e00\u4e2a\u5411\u91cf\u65f6\uff0c\u5c31\u662f\u5728\u5bf9\u5b83\u65bd\u52a0\u4e00\u4e2a\u7ebf\u6027\u53d8\u6362\u3002</p> </li> <li> <p>\u53ef\u4ee5\u628a\u4e00\u4e2a \\(2 \\times 2\\) \u77e9\u9635\u60f3\u8c61\u6210\u4e00\u4e2a\u673a\u5668\uff1a\u5b83\u63a5\u6536\u4e8c\u7ef4\u5411\u91cf\uff0c\u8f93\u51fa\u65b0\u7684\u4e8c\u7ef4\u5411\u91cf\u3002\u77e9\u9635\u7684\u5217\u544a\u8bc9\u4f60\u6807\u51c6\u57fa\u5411\u91cf \\(\\hat{\\mathbf{i}}\\) \u548c \\(\\hat{\\mathbf{j}}\\) \u7ecf\u8fc7\u53d8\u6362\u540e\u5230\u4e86\u54ea\u91cc\u3002\u5176\u4f59\u4e00\u5207\u90fd\u7531\u7ebf\u6027\u6027\u8d28\u5bfc\u51fa\u3002</p> </li> </ul> <p></p> <ul> <li>\u4f8b\u5982\uff0c\u5982\u679c</li> </ul> \\[ A = \\begin{bmatrix} 2 &amp; 1 \\\\ 1 &amp; 2 \\end{bmatrix} \\] <p>\u90a3\u4e48 \\(\\hat{\\mathbf{i}} = [1, 0]^T\\) \u843d\u5728 \\([2, 1]^T\\)\uff08\u7b2c1\u5217\uff09\uff0c\\(\\hat{\\mathbf{j}} = [0, 1]^T\\) \u843d\u5728 \\([1, 2]^T\\)\uff08\u7b2c2\u5217\uff09\u3002\u5176\u4ed6\u6240\u6709\u5411\u91cf\u90fd\u662f\u8fd9\u4e24\u4e2a\u5411\u91cf\u7684\u7ec4\u5408\uff0c\u56e0\u6b64\u5176\u8f93\u51fa\u81ea\u52a8\u9075\u5faa\u3002</p> <ul> <li> <p>\u5c06\u4e24\u4e2a\u77e9\u9635\u76f8\u4e58\u53ef\u4ee5\u7406\u89e3\u4e3a\u4f9d\u6b21\u65bd\u52a0\u4e24\u4e2a\u53d8\u6362\u3002\u5982\u679c \\(B\\) \u5c06\u5411\u91cf\u4ece\u4e00\u4e2a\u7a7a\u95f4\u53d8\u6362\uff0c\u7136\u540e \\(A\\) \u53d8\u6362\u7ed3\u679c\uff0c\u90a3\u4e48 \\(AB\\) \u6309\u987a\u5e8f\u5b8c\u6210\u8fd9\u4e24\u4e2a\u64cd\u4f5c\u3002\u5728\u6e38\u620f\u5f15\u64ce\u4e2d\uff0c\u5148\u65cb\u8f6c\u89d2\u8272\u518d\u5411\u524d\u79fb\u52a8\uff0c\u4e0e\u5148\u79fb\u52a8\u518d\u65cb\u8f6c\uff0c\u7ed3\u679c\u5b8c\u5168\u4e0d\u540c\u2014\u2014\u8fd9\u5c31\u662f\u77e9\u9635\u4e58\u6cd5\u4e0d\u6ee1\u8db3\u4ea4\u6362\u5f8b\u7684\u539f\u56e0\u3002</p> </li> <li> <p>\u65cb\u8f6c\u5c06\u5411\u91cf\u7ed5\u4e00\u5b9a\u89d2\u5ea6 \\(\\theta\\) \u8f6c\u52a8\u800c\u4e0d\u6539\u53d8\u5176\u957f\u5ea6\u3002\u5411\u91cf\u5927\u5c0f\u4e0d\u53d8\uff0c\u53ea\u662f\u6307\u5411\u65b0\u7684\u65b9\u5411\u3002</p> </li> </ul> <p></p> <ul> <li>\u4e8c\u7ef4\u4e2d\u7684\u65cb\u8f6c\u77e9\u9635\u4e3a\uff1a</li> </ul> \\[ R(\\theta) = \\begin{bmatrix} \\cos\\theta &amp; -\\sin\\theta \\\\ \\sin\\theta &amp; \\cos\\theta \\end{bmatrix} \\] <ul> <li>\u5f53 \\(\\theta = 90\u00b0\\) \u65f6\uff1a</li> </ul> \\[ R = \\begin{bmatrix} 0 &amp; -1 \\\\ 1 &amp; 0 \\end{bmatrix} \\] <p>\u56e0\u6b64 \\([1, 0]^T\\) \u53d8\u6210 \\([0, 1]^T\\)\u3002\u539f\u6765\u6307\u5411\u53f3\u4fa7\u7684\u5411\u91cf\u73b0\u5728\u6307\u5411\u4e0a\u65b9\u3002\u65cb\u8f6c\u77e9\u9635\u662f\u6b63\u4ea4\u7684\uff0c\u4e14\u884c\u5217\u5f0f\u59cb\u7ec8\u4e3a1\u3002\u5f53\u4f60\u5728\u624b\u673a\u4e0a\u65cb\u8f6c\u7167\u7247\u65f6\uff0c\u5c31\u662f\u5bf9\u6bcf\u4e2a\u50cf\u7d20\u5750\u6807\u5e94\u7528\u8fd9\u4e2a\u77e9\u9635\u3002</p> <ul> <li>\u5728\u4e09\u7ef4\u4e2d\uff0c\u6bcf\u4e2a\u5750\u6807\u8f74\u90fd\u6709\u5bf9\u5e94\u7684\u65cb\u8f6c\u77e9\u9635\u3002\u673a\u68b0\u81c2\u7684\u6bcf\u4e2a\u5173\u8282\u7ed5\u7279\u5b9a\u8f74\u65cb\u8f6c\uff0c\u6bcf\u4e2a\u5173\u8282\u5c31\u662f\u4e00\u4e2a\u65cb\u8f6c\u77e9\u9635\u3002\u7ed5z\u8f74\u65cb\u8f6c\u770b\u8d77\u6765\u50cf\u662f\u5d4c\u5165\u4e09\u7ef4\u7684\u4e8c\u7ef4\u60c5\u51b5\uff1a</li> </ul> \\[ R_z(\\theta) = \\begin{bmatrix} \\cos\\theta &amp; -\\sin\\theta &amp; 0 \\\\ \\sin\\theta &amp; \\cos\\theta &amp; 0 \\\\ 0 &amp; 0 &amp; 1 \\end{bmatrix} \\] <ul> <li>\u7f29\u653e\u6cbf\u6bcf\u4e2a\u5750\u6807\u8f74\u72ec\u7acb\u5730\u62c9\u4f38\u6216\u538b\u7f29\u5411\u91cf\uff1a</li> </ul> \\[ S(s_x, s_y) = \\begin{bmatrix} s_x &amp; 0 \\\\ 0 &amp; s_y \\end{bmatrix} \\] <p></p> <ul> <li> <p>\\(S(2, 1.5)\\) \u5c06x\u5206\u91cf\u52a0\u500d\uff0cy\u5206\u91cf\u4e58\u4ee51.5\u3002\u6cbf\u67d0\u8f74\u7f29\u653e \\(-1\\) \u4f1a\u7ffb\u8f6c\u8be5\u5206\u91cf\u3002\u5bf9\u89d2\u77e9\u9635\u603b\u662f\u7f29\u653e\u53d8\u6362\u3002\u5f53\u4f60\u5c06\u56fe\u7247\u7f29\u5c0f\u523050%\u65f6\uff0c\u5c31\u662f\u5bf9\u6bcf\u4e2a\u50cf\u7d20\u5750\u6807\u5e94\u7528 \\(S(0.5, 0.5)\\)\u3002</p> </li> <li> <p>\u53cd\u5c04\u50cf\u955c\u5b50\u4e00\u6837\u5c06\u5411\u91cf\u7ffb\u8f6c\u5230\u67d0\u4e2a\u8f74\u6216\u76f4\u7ebf\u7684\u53e6\u4e00\u4fa7\u3002\u6cbfx\u8f74\u7684\u53cd\u5c04\u4fdd\u6301x\u5206\u91cf\u4e0d\u53d8\uff0c\u53d6\u53cdy\u5206\u91cf\uff1a</p> </li> </ul> \\[ \\text{Ref}_x = \\begin{bmatrix} 1 &amp; 0 \\\\ 0 &amp; -1 \\end{bmatrix} \\] <p></p> <ul> <li>\u4f8b\u5982\uff0c\\([3, 2]^T\\) \u53d8\u6210 \\([3, -2]^T\\)\u3002\u5f53\u4f60\u7684\u624b\u673a\u6c34\u5e73\u7ffb\u8f6c\u81ea\u62cd\u7167\u4f7f\u6587\u5b57\u6b63\u786e\u663e\u793a\u65f6\uff0c\u5c31\u662f\u5728\u5e94\u7528\u53cd\u5c04\u77e9\u9635\u3002\u6cbf\u76f4\u7ebf \\(y = x\\) \u7684\u53cd\u5c04\u4ea4\u6362\u4e24\u4e2a\u5206\u91cf\uff1a</li> </ul> \\[ \\text{Ref}_{y=x} = \\begin{bmatrix} 0 &amp; 1 \\\\ 1 &amp; 0 \\end{bmatrix} \\] <ul> <li> <p>\u53cd\u5c04\u77e9\u9635\u7684\u884c\u5217\u5f0f\u4e3a \\(-1\\)\uff0c\u8868\u660e\u5b83\u4eec\u7ffb\u8f6c\u4e86\u65b9\u5411\u3002</p> </li> <li> <p>\u65cb\u8f6c\u548c\u53cd\u5c04\u90fd\u662f\u521a\u6027\u53d8\u6362\uff1a\u5b83\u4eec\u4fdd\u6301\u8ddd\u79bb\u548c\u89d2\u5ea6\u4e0d\u53d8\u3002\u8868\u793a\u8fd9\u4e9b\u53d8\u6362\u7684\u77e9\u9635\u662f\u6b63\u4ea4\u77e9\u9635\uff0c\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48\u6b63\u4ea4\u77e9\u9635\u7684\u884c\u5217\u5f0f\u603b\u662f \\(+1\\)\uff08\u65cb\u8f6c\uff09\u6216 \\(-1\\)\uff08\u53cd\u5c04\uff09\u3002</p> </li> <li> <p>\u526a\u5207\u6cbf\u4e00\u4e2a\u5750\u6807\u8f74\u6309\u53e6\u4e00\u5750\u6807\u8f74\u7684\u6bd4\u4f8b\u503e\u659c\u5411\u91cf\u3002\u6c34\u5e73\u526a\u5207\u56e0\u5b50 \\(k\\)\uff1a</p> </li> </ul> \\[ \\text{Sh}_x(k) = \\begin{bmatrix} 1 &amp; k \\\\ 0 &amp; 1 \\end{bmatrix} \\] <p></p> <ul> <li> <p>\u6bcf\u4e2a\u70b9\u6c34\u5e73\u6ed1\u52a8 \\(k\\) \u500d\u4e8e\u5176\u9ad8\u5ea6\u7684\u8ddd\u79bb\u3002\u5f53 \\(k = 0.5\\) \u65f6\uff0c\u9ad8\u5ea6\u4e3a2\u7684\u70b9\u5411\u53f3\u79fb\u52a81\u3002\u6700\u4e0b\u9762\u4e00\u884c\u4fdd\u6301\u4e0d\u52a8\uff0c\u6700\u4e0a\u9762\u4e00\u884c\u6ed1\u52a8\u6700\u591a\u3002\u8fd9\u5c31\u662f\u659c\u4f53\u6587\u5b57\u7684\u5de5\u4f5c\u539f\u7406\uff1a\u6b63\u7acb\u7684\u5b57\u6bcd\u88ab\u526a\u5207\uff0c\u4ece\u800c\u5411\u53f3\u503e\u659c\u3002</p> </li> <li> <p>\u4ee5\u4e0a\u6240\u6709\u53d8\u6362\uff08\u65cb\u8f6c\u3001\u7f29\u653e\u3001\u53cd\u5c04\u3001\u526a\u5207\uff09\u90fd\u662f\u7ebf\u6027\u53d8\u6362\u3002\u5b83\u4eec\u4fdd\u6301\u539f\u70b9\u56fa\u5b9a\uff0c\u5e76\u4fdd\u6301\u76f4\u7ebf\u4e3a\u76f4\u7ebf\u3002\u4f46\u5e73\u79fb\uff08\u5c06\u6240\u6709\u70b9\u6309\u56fa\u5b9a\u91cf\u79fb\u52a8\uff09\u5462\uff1f</p> </li> <li> <p>\u5e73\u79fb\u4e0d\u662f\u7ebf\u6027\u53d8\u6362\uff0c\u56e0\u4e3a\u5b83\u79fb\u52a8\u4e86\u539f\u70b9\u3002\u5982\u679c\u5c06\u6bcf\u4e2a\u70b9\u5411\u53f3\u79fb\u52a83\uff0c\u96f6\u5411\u91cf\u4f1a\u79fb\u52a8\u5230 \\([3, 0]^T\\)\uff0c\u4ece\u800c\u7834\u574f\u4e86\u7ebf\u6027\u6027\u8d28\u3002\u4e3a\u4e86\u5904\u7406\u5e73\u79fb\uff0c\u6211\u4eec\u4f7f\u7528\u4eff\u5c04\u53d8\u6362\uff0c\u5b83\u5c06\u7ebf\u6027\u53d8\u6362\u4e0e\u5e73\u79fb\u7ed3\u5408\u8d77\u6765\uff1a</p> </li> </ul> \\[\\mathbf{y} = A\\mathbf{x} + \\mathbf{t}\\] <ul> <li>\u4e3a\u4e86\u5c06\u5176\u8868\u793a\u4e3a\u5355\u4e2a\u77e9\u9635\u4e58\u6cd5\uff0c\u6211\u4eec\u4f7f\u7528\u9f50\u6b21\u5750\u6807\uff1a\u4e3a\u6bcf\u4e2a\u5411\u91cf\u6dfb\u52a0\u4e00\u4e2a\u989d\u5916\u76841\uff0c\u5e76\u4f7f\u7528\u4e00\u4e2a \\((n+1) \\times (n+1)\\) \u7684\u77e9\u9635\uff1a</li> </ul> \\[ \\begin{bmatrix} A &amp; \\mathbf{t} \\\\ \\mathbf{0}^T &amp; 1 \\end{bmatrix} \\begin{bmatrix} \\mathbf{x} \\\\ 1 \\end{bmatrix} = \\begin{bmatrix} A\\mathbf{x} + \\mathbf{t} \\\\ 1 \\end{bmatrix} \\] <ul> <li> <p>\u4eff\u5c04\u53d8\u6362\u4fdd\u6301\u76f4\u7ebf\u548c\u5e73\u884c\u6027\uff0c\u4f46\u4e0d\u4e00\u5b9a\u4fdd\u6301\u89d2\u5ea6\u6216\u957f\u5ea6\u3002\u7535\u5b50\u6e38\u620f\u4e2d\u7684\u6bcf\u4e2a\u7269\u4f53\u90fd\u4f7f\u7528\u4eff\u5c04\u53d8\u6362\u6765\u5b9a\u4f4d\uff1a\u65cb\u8f6c\u5b83\u3001\u7f29\u653e\u5b83\uff0c\u7136\u540e\u653e\u7f6e\u5230\u6b63\u786e\u7684\u4f4d\u7f6e\u2014\u2014\u6240\u6709\u8fd9\u4e9b\u90fd\u7f16\u7801\u5728\u4e00\u4e2a\u77e9\u9635\u4e2d\u3002</p> </li> <li> <p>\u9000\u5316\u53d8\u6362\uff08\u5947\u5f02\u77e9\u9635\uff09\u5c06\u7a7a\u95f4\u574d\u7f29\u5230\u66f4\u4f4e\u7ef4\u5ea6\u3002</p> </li> <li> <p>\u4f8b\u5982\uff0c\u77e9\u9635</p> </li> </ul> \\[ \\begin{bmatrix} 1 &amp; 2 \\\\ 2 &amp; 4 \\end{bmatrix} \\] <p>\u5c06\u6bcf\u4e2a\u4e8c\u7ef4\u5411\u91cf\u6620\u5c04\u5230\u4e00\u6761\u76f4\u7ebf\u4e0a\uff0c\u56e0\u4e3a\u4e24\u5217\u6307\u5411\u540c\u4e00\u65b9\u5411\u3002\u884c\u5217\u5f0f\u4e3a\u96f6\uff0c\u4fe1\u606f\u4e22\u5931\uff0c\u4e14\u8be5\u53d8\u6362\u4e0d\u53ef\u9006\u3002</p> <ul> <li> <p>\u5c06\u5f69\u8272\u56fe\u50cf\uff08\u6bcf\u4e2a\u50cf\u7d20\u67093\u4e2a\u503c\uff1a\u7ea2\u3001\u7eff\u3001\u84dd\uff09\u8f6c\u6362\u4e3a\u7070\u5ea6\u56fe\uff08\u6bcf\u4e2a\u50cf\u7d201\u4e2a\u503c\uff09\u5c31\u662f\u9000\u5316\u53d8\u6362\uff1a\u989c\u8272\u4fe1\u606f\u6c38\u4e45\u4e22\u5931\u3002</p> </li> <li> <p>\u5728\u673a\u5668\u5b66\u4e60\u4e2d\uff0c\u7ebf\u6027\u53d8\u6362\u662f\u795e\u7ecf\u7f51\u7edc\u7684\u6838\u5fc3\u3002\u6570\u636e\u88ab\u8868\u793a\u4e3a\u77e9\u9635\uff08\u5411\u91cf\u7684\u5806\u53e0\uff0c\u8fd9\u4e9b\u5411\u91cf\u4ee3\u8868\u5bf9\u8c61\u7684\u7279\u5f81\u2014\u2014\u4eba\u3001\u98de\u673a\u3001\u6587\u672c\u3001\u56fe\u50cf\u2026\u2026\u4efb\u4f55\u4e1c\u897f\uff01\uff09</p> </li> <li> <p>\u6bcf\u4e00\u5c42\u5e94\u7528\u4e00\u4e2a\u77e9\u9635\u4e58\u6cd5\uff08\u7ebf\u6027\u53d8\u6362\uff09\uff0c\u8be6\u7ec6\u5185\u5bb9\u5728\u5176\u4ed6\u7ae0\u8282\u4e2d\u63d0\u4f9b\uff0c\u6211\u4eec\u9700\u8981\u89e3\u91ca\u5982\u4f55\u7ec4\u7ec7\u8fd9\u4e9b\u6570\u636e\u5e76\u6070\u5f53\u5730\u5f15\u51fa\u795e\u7ecf\u7f51\u7edc\u3002</p> </li> <li> <p>\u7136\u800c\uff0c\u5f53\u4eca\u6700\u5e38\u7528\u7684\u6280\u672f\u51e0\u4e4e\u5b8c\u5168\u662f\u5c06\u6570\u636e\u901a\u8fc7\u4e00\u7cfb\u5217\u7ebf\u6027\u53d8\u6362\u4f20\u9012\uff0c\u6211\u4eec\u79f0\u4e4b\u4e3aTransformer\u3002</p> </li> <li> <p>Gemini\u3001ChatGPT\u3001Claude\u3001Qwen\u3001DeepSeek\u4ee5\u53ca\u5f53\u4eca\u4e16\u754c\u4e0a\u6027\u80fd\u6700\u597d\u7684AI\uff0c\u90fd\u662fTransformer\uff01</p> </li> </ul>"},{"location":"chapter%2002%3A%20matrices/04.%20linear%20transformations/#colabjupyter-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528CoLab\u6216Jupyter Notebook\uff09","text":"<ol> <li>\u5bf9\u5411\u91cf\u5e94\u7528\u65cb\u8f6c\u77e9\u9635\uff0c\u5e76\u7ed8\u5236\u539f\u59cb\u5411\u91cf\u548c\u65cb\u8f6c\u540e\u7684\u5411\u91cf\u3002\u5c1d\u8bd5\u4e0d\u540c\u7684\u89d2\u5ea6\u3002</li> </ol> <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ntheta = jnp.pi / 3\nR = jnp.array([[jnp.cos(theta), -jnp.sin(theta)],\n               [jnp.sin(theta),  jnp.cos(theta)]])\n\nv = jnp.array([1.0, 0.0])\nv_rot = R @ v\n\nplt.figure(figsize=(5, 5))\nplt.quiver(0, 0, v[0], v[1], angles='xy', scale_units='xy', scale=1, color='red', label='original')\nplt.quiver(0, 0, v_rot[0], v_rot[1], angles='xy', scale_units='xy', scale=1, color='blue', label='rotated')\nplt.xlim(-1.5, 1.5); plt.ylim(-1.5, 1.5)\nplt.grid(True); plt.legend(); plt.gca().set_aspect('equal')\nplt.show()\n</code></pre> <ol> <li>\u5bf9\u6784\u6210\u6b63\u65b9\u5f62\u7684\u4e00\u7ec4\u70b9\u5e94\u7528\u526a\u5207\u53d8\u6362\uff0c\u5e76\u53ef\u89c6\u5316\u53d8\u5f62\u540e\u7684\u5f62\u72b6\u3002</li> </ol> <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\nsquare = jnp.array([[0,0],[1,0],[1,1],[0,1],[0,0]]).T\n\nk = 0.5\nshear = jnp.array([[1, k],\n                    [0, 1]])\nsheared = shear @ square\n\nplt.figure(figsize=(6, 4))\nplt.plot(square[0], square[1], 'r-o', label='original')\nplt.plot(sheared[0], sheared[1], 'b-o', label='sheared')\nplt.grid(True); plt.legend(); plt.gca().set_aspect('equal')\nplt.show()\n</code></pre>"},{"location":"chapter%2002%3A%20matrices/05.%20decompositions/","title":"\u77e9\u9635\u5206\u89e3","text":"<p>\u77e9\u9635\u5206\u89e3\u5c06\u590d\u6742\u77e9\u9635\u62c6\u5206\u4e3a\u66f4\u7b80\u5355\u7684\u56e0\u5b50\uff0c\u7528\u4e8e\u6c42\u89e3\u65b9\u7a0b\u7ec4\u3001\u8ba1\u7b97\u9006\u77e9\u9635\u548c\u6570\u636e\u538b\u7f29\u3002\u672c\u6587\u6db5\u76d6\u9ad8\u65af\u6d88\u5143\u3001LU\u3001QR\u3001Cholesky\u3001\u7279\u5f81\u5206\u89e3\u548cSVD\u2014\u2014\u8fd9\u4e9b\u7b97\u6cd5\u662fPCA\u3001\u63a8\u8350\u7cfb\u7edf\u548c\u673a\u5668\u5b66\u4e60\u6570\u503c\u7a33\u5b9a\u6027\u7684\u57fa\u77f3\u3002</p> <ul> <li> <p>\u77e9\u9635\u5206\u89e3\uff08\u6216\u56e0\u5b50\u5206\u89e3\uff09\u5c06\u4e00\u4e2a\u77e9\u9635\u62c6\u5206\u6210\u66f4\u5bb9\u6613\u5904\u7406\u7684\u66f4\u7b80\u5355\u7684\u90e8\u5206\u3002\u53ef\u4ee5\u628a\u5b83\u7c7b\u6bd4\u4e3a\u56e0\u6570\u5206\u89e3\uff1a\\(12 = 3 \\times 4\\) \u6bd4\u5355\u72ec\u768412\u66f4\u5bb9\u6613\u7406\u89e3\u3002</p> </li> <li> <p>\u6211\u4eec\u5206\u89e3\u77e9\u9635\u662f\u4e3a\u4e86\u66f4\u5feb\u5730\u6c42\u89e3\u65b9\u7a0b\u7ec4\u3001\u7a33\u5b9a\u5730\u8ba1\u7b97\u9006\u77e9\u9635\u3001\u5bfb\u627e\u7279\u5f81\u503c\u3001\u538b\u7f29\u6570\u636e\u4ee5\u53ca\u7406\u89e3\u53d8\u6362\u7684\u51e0\u4f55\u7ed3\u6784\u3002</p> </li> <li> <p>\u6700\u57fa\u672c\u7684\u6280\u672f\u662f\u9ad8\u65af\u6d88\u5143\uff08\u884c\u5316\u7b80\uff09\u3002\u601d\u8def\u5f88\u7b80\u5355\uff1a\u7ed9\u5b9a\u65b9\u7a0b\u7ec4 \\(A\\mathbf{x} = \\mathbf{b}\\)\uff0c\u4f7f\u7528\u4e09\u79cd\u5141\u8bb8\u7684\u64cd\u4f5c\u7b80\u5316 \\(A\\)\uff0c\u76f4\u5230\u7b54\u6848\u663e\u800c\u6613\u89c1\u3002</p> </li> <li> <p>\u8fd9\u4e9b\u64cd\u4f5c\u662f\uff1a\u4ea4\u6362\u4e24\u884c\u3001\u5c06\u4e00\u884c\u4e58\u4ee5\u975e\u96f6\u6807\u91cf\u3001\u6216\u5c06\u4e00\u884c\u7684\u500d\u6570\u52a0\u5230\u53e6\u4e00\u884c\u4e0a\u3002</p> </li> <li> <p>\u4f8b\u5982\uff0c\u8981\u6d88\u9664\u4e3b\u5143\u4e0b\u65b9\u7684\u7b2c\u4e00\u5217\uff0c\u4ece\u4e0b\u9762\u7684\u884c\u4e2d\u51cf\u53bb\u7b2c1\u884c\u7684\u500d\u6570\uff1a</p> </li> </ul> \\[ \\begin{bmatrix} 2 &amp; 1 &amp; 5 \\\\ 4 &amp; 3 &amp; 7 \\\\ 6 &amp; 5 &amp; 9 \\end{bmatrix} \\xrightarrow{R_2 - 2R_1} \\begin{bmatrix} 2 &amp; 1 &amp; 5 \\\\ 0 &amp; 1 &amp; -3 \\\\ 6 &amp; 5 &amp; 9 \\end{bmatrix} \\xrightarrow{R_3 - 3R_1} \\begin{bmatrix} 2 &amp; 1 &amp; 5 \\\\ 0 &amp; 1 &amp; -3 \\\\ 0 &amp; 2 &amp; -6 \\end{bmatrix} \\] <ul> <li>\u76ee\u6807\u662f\u884c\u9636\u68af\u5f62\uff08REF\uff09\uff1a\u6bcf\u4e2a\u4e3b\u5143\uff08\u6bcf\u884c\u7b2c\u4e00\u4e2a\u975e\u96f6\u6761\u76ee\uff09\u4e0b\u65b9\u5168\u4e3a\u96f6\uff0c\u4e14\u6bcf\u4e2a\u4e3b\u5143\u5728\u5176\u4e0a\u65b9\u4e3b\u5143\u7684\u53f3\u4fa7\u3002\u77e9\u9635\u5448\u73b0\u9636\u68af\u5f62\u72b6\u3002</li> </ul> <p></p> <ul> <li> <p>\u8fdb\u4e00\u6b65\u5f97\u5230\u7b80\u5316\u884c\u9636\u68af\u5f62\uff08RREF\uff09\uff0c\u4f7f\u6bcf\u4e2a\u4e3b\u5143\u4e3a1\u4e14\u662f\u8be5\u5217\u4e2d\u552f\u4e00\u7684\u975e\u96f6\u6761\u76ee\u3002\u6bcf\u4e2a\u77e9\u9635\u6709\u552f\u4e00\u7684RREF\u3002</p> </li> <li> <p>\u4e00\u65e6\u8f6c\u6362\u4e3a\u4e09\u89d2\u5f62\u5f62\u5f0f\uff0c\u6211\u4eec\u901a\u8fc7\u56de\u4ee3\u6c42\u89e3\uff1a\u6700\u4e0b\u9762\u4e00\u884c\u76f4\u63a5\u7ed9\u51fa\u6700\u540e\u4e00\u4e2a\u53d8\u91cf\uff0c\u7136\u540e\u5411\u4e0a\u6c42\u89e3\u3002</p> </li> <li> <p>\u8fd9\u662f\u6240\u6709\u5176\u4ed6\u5206\u89e3\u65b9\u6cd5\u6240\u5efa\u7acb\u7684\u57fa\u7840\uff0c\u5206\u89e3\u7684\u76ee\u6807\u5c31\u662f\u5c06\u77e9\u9635\u7b80\u5316\u4e3a\u4e09\u89d2\u5f62\u5f62\u5f0f\uff0c\u4ece\u800c\u53ef\u4ee5\u901a\u8fc7\u56de\u4ee3\u6c42\u89e3\u53d8\u91cf\u3002</p> </li> <li> <p>LU\u5206\u89e3\u5c06\u9ad8\u65af\u6d88\u5143\u5f62\u5f0f\u5316\uff0c\u5c06\u65b9\u9635\u5206\u89e3\u4e3a \\(A = LU\\)\uff08\u6216\u901a\u8fc7\u884c\u4ea4\u6362\u5f97\u5230 \\(A = PLU\\)\uff09\uff0c\u5176\u4e2d \\(L\\) \u662f\u4e0b\u4e09\u89d2\u77e9\u9635\uff0c\\(U\\) \u662f\u4e0a\u4e09\u89d2\u77e9\u9635\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u6c42\u89e3 \\(A\\mathbf{x} = \\mathbf{b}\\)\uff1a\u5148\u901a\u8fc7\u524d\u5411\u4ee3\u5165\uff08\u4ece\u4e0a\u5230\u4e0b\uff09\u6c42\u89e3 \\(L\\mathbf{y} = \\mathbf{b}\\)\uff0c\u7136\u540e\u901a\u8fc7\u56de\u4ee3\uff08\u4ece\u4e0b\u5230\u4e0a\uff09\u6c42\u89e3 \\(U\\mathbf{x} = \\mathbf{y}\\)\u3002\u4e24\u6b21\u7b80\u5355\u7684\u4e09\u89d2\u6c42\u89e3\u4ee3\u66ff\u4e86\u4e00\u6b21\u56f0\u96be\u7684\u4e00\u822c\u6c42\u89e3\u3002</p> </li> <li> <p>\u76f8\u6bd4\u539f\u59cb\u9ad8\u65af\u6d88\u5143\u7684\u4f18\u52bf\u5728\u4e8e\u53ef\u590d\u7528\u3002\u4e00\u65e6\u5f97\u5230 \\(L\\) \u548c \\(U\\)\uff0c\u5c31\u53ef\u4ee5\u5bf9\u8bb8\u591a\u4e0d\u540c\u7684 \\(\\mathbf{b}\\) \u5411\u91cf\u6c42\u89e3\uff0c\u800c\u65e0\u9700\u91cd\u65b0\u8fdb\u884c\u5206\u89e3\u3002</p> </li> <li> <p>\u5982\u679c\u4f60\u9700\u8981\u75281000\u4e2a\u4e0d\u540c\u7684\u53f3\u7aef\u9879\u6c42\u89e3\u540c\u4e00\u4e2a\u65b9\u7a0b\u7ec4\uff08\u8fd9\u5728\u6a21\u62df\u4e2d\u5f88\u5e38\u89c1\uff09\uff0c\u53ea\u9700\u5206\u89e3\u4e00\u6b21\u7136\u540e\u91cd\u590d\u4f7f\u7528\u3002</p> </li> <li> <p>\u5f53\u77e9\u9635\u662f\u5bf9\u79f0\u6b63\u5b9a\u77e9\u9635\u65f6\uff08\u5982\u534f\u65b9\u5dee\u77e9\u9635\uff09\uff0c\u6211\u4eec\u53ef\u4ee5\u505a\u5f97\u66f4\u597d\u3002</p> </li> <li> <p>Cholesky\u5206\u89e3\u5c06\u5176\u5206\u89e3\u4e3a \\(A = LL^T\\)\uff0c\u5176\u4e2d \\(L\\) \u662f\u4e0b\u4e09\u89d2\u77e9\u9635\u3002\u4f8b\u5982\uff1a</p> </li> </ul> \\[ \\begin{bmatrix} 4 &amp; 2 \\\\ 2 &amp; 5 \\end{bmatrix} = \\begin{bmatrix} 2 &amp; 0 \\\\ 1 &amp; 2 \\end{bmatrix} \\begin{bmatrix} 2 &amp; 1 \\\\ 0 &amp; 2 \\end{bmatrix} \\] <ul> <li> <p>\u8fd9\u5927\u7ea6\u6bd4LU\u5feb\u4e24\u500d\uff0c\u5e76\u4e14\u4fdd\u8bc1\u6570\u503c\u7a33\u5b9a\u3002\u53ef\u4ee5\u5c06\u5176\u89c6\u4e3a\u77e9\u9635\u7684\"\u5e73\u65b9\u6839\"\u3002</p> </li> <li> <p>\u5982\u679c\u5206\u89e3\u5931\u8d25\uff08\u5e73\u65b9\u6839\u4e0b\u51fa\u73b0\u8d1f\u503c\uff09\uff0c\u5219\u8be5\u77e9\u9635\u4e0d\u662f\u6b63\u5b9a\u7684\u3002\u56e0\u6b64Cholesky\u5206\u89e3\u4e5f\u53ef\u4ee5\u4f5c\u4e3a\u6b63\u5b9a\u6027\u7684\u68c0\u9a8c\u65b9\u6cd5\u3002</p> </li> <li> <p>\u65b9\u9635 \\(A\\) \u7684\u7279\u5f81\u5411\u91cf\u662f\u7279\u6b8a\u65b9\u5411\uff0c\u8be5\u53d8\u6362\u5728\u8fd9\u4e9b\u65b9\u5411\u4e0a\u53ea\u8fdb\u884c\u62c9\u4f38\u6216\u538b\u7f29\uff0c\u800c\u4e0d\u65cb\u8f6c\u3002\u7279\u5f81\u503c\u662f\u7f29\u653e\u56e0\u5b50\uff1a</p> </li> </ul> \\[A\\mathbf{x} = \\lambda\\mathbf{x}\\] <p></p> <ul> <li> <p>\u5927\u591a\u6570\u5411\u91cf\u5728\u4e58\u4ee5\u77e9\u9635\u65f6\u65b9\u5411\u4f1a\u6539\u53d8\u3002\u4f46\u7279\u5f81\u5411\u91cf\u662f\u7279\u6b8a\u7684\uff1a\u8f93\u51fa\u65b9\u5411\u4e0e\u8f93\u5165\u65b9\u5411\u76f8\u540c\uff0c\u4ec5\u88ab \\(\\lambda\\) \u7f29\u653e\u3002\u5982\u679c \\(\\lambda = 2\\)\uff0c\u7279\u5f81\u5411\u91cf\u957f\u5ea6\u52a0\u500d\u3002\u5982\u679c \\(\\lambda = -1\\)\uff0c\u5b83\u7ffb\u8f6c\u65b9\u5411\u3002\u5982\u679c \\(\\lambda = 0\\)\uff0c\u5b83\u88ab\u538b\u7f29\u4e3a\u96f6\u3002</p> </li> <li> <p>\u4f8b\u5982\uff0c\u5bf9\u4e8e\uff1a</p> </li> </ul> \\[ A = \\begin{bmatrix} 3 &amp; 1 \\\\ 0 &amp; 2 \\end{bmatrix} \\] <p>\u5411\u91cf \\([1, 0]^T\\) \u662f\u7279\u5f81\u5411\u91cf\uff0c\\(\\lambda = 3\\)\uff0c\u56e0\u4e3a \\(A[1, 0]^T = [3, 0]^T = 3[1, 0]^T\\)\u3002</p> <ul> <li> <p>\u6c42\u7279\u5f81\u503c\u9700\u8981\u89e3\u7279\u5f81\u591a\u9879\u5f0f \\(\\det(A - \\lambda I) = 0\\)\u3002\u6839\u5373\u4e3a\u7279\u5f81\u503c\u3002\u7136\u540e\u5c06\u6bcf\u4e2a \\(\\lambda\\) \u4ee3\u56de \\((A - \\lambda I)\\mathbf{x} = \\mathbf{0}\\) \u4e2d\uff0c\u6c42\u51fa\u5bf9\u5e94\u7684\u7279\u5f81\u5411\u91cf\u3002</p> </li> <li> <p>\u5173\u952e\u6027\u8d28\uff1a</p> <ul> <li>\\(A\\) \u7684\u8ff9\u7b49\u4e8e\u5176\u7279\u5f81\u503c\u4e4b\u548c\u3002</li> <li>\\(A\\) \u7684\u884c\u5217\u5f0f\u7b49\u4e8e\u5176\u7279\u5f81\u503c\u4e4b\u79ef\u3002</li> <li>\u5bf9\u79f0\u77e9\u9635\u7684\u7279\u5f81\u5411\u91cf\u4e92\u76f8\u5782\u76f4\uff0c\u7279\u5f81\u503c\u4e3a\u5b9e\u6570\u3002</li> <li>\u6b63\u5b9a\u77e9\u9635\u7684\u6240\u6709\u7279\u5f81\u503c\u4e3a\u6b63\u3002</li> <li>\u534f\u65b9\u5dee\u77e9\u9635\uff08\u6211\u4eec\u5c06\u5728\u7edf\u8ba1\u5b66\u4e2d\u9047\u5230\uff09\u603b\u662f\u534a\u6b63\u5b9a\u7684\u3002</li> </ul> </li> <li> <p>\u901a\u8fc7\u7279\u5f81\u591a\u9879\u5f0f\u8ba1\u7b97\u7279\u5f81\u503c\u5bf9\u4e8e\u5927\u578b\u77e9\u9635\u6765\u8bf4\u662f\u4e0d\u5207\u5b9e\u9645\u7684\u3002\u76f8\u53cd\uff0c\u4f7f\u7528\u8fed\u4ee3\u65b9\u6cd5\uff1a</p> <ul> <li> <p>\u5e42\u8fed\u4ee3\uff1a\u53cd\u590d\u4e58\u4ee5 \\(A\\) \u5e76\u5f52\u4e00\u5316\u3002\u6536\u655b\u5230\u4e3b\u7279\u5f81\u5411\u91cf\uff08\u6700\u5927\u7279\u5f81\u503c\uff09\u3002\u7b80\u5355\u4f46\u53ea\u80fd\u627e\u5230\u4e00\u4e2a\u7279\u5f81\u5bf9\u3002</p> </li> <li> <p>QR\u7b97\u6cd5\uff1a\u6700\u5e38\u7528\u7684\u65b9\u6cd5\u3002\u4f7f\u7528QR\u5206\u89e3\u53cd\u590d\u5206\u89e3\u548c\u91cd\u7ec4\u77e9\u9635\uff0c\u76f4\u5230\u77e9\u9635\u6536\u655b\u5230\u4e09\u89d2\u5f62\u5f62\u5f0f\uff0c\u5bf9\u89d2\u7ebf\u4e0a\u7684\u5143\u7d20\u5373\u4e3a\u6240\u6709\u7279\u5f81\u503c\u3002</p> </li> <li> <p>\u53cd\u8fed\u4ee3\uff1a\u5bfb\u627e\u6700\u63a5\u8fd1\u7ed9\u5b9a\u76ee\u6807\u503c\u7684\u7279\u5f81\u5411\u91cf\u3002\u5f53\u4f60\u5927\u81f4\u77e5\u9053\u60f3\u8981\u54ea\u4e2a\u7279\u5f81\u503c\u65f6\u5f88\u6709\u7528\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u5927\u578b\u7a00\u758f\u77e9\u9635\uff0cArnoldi\u548cLanczos\u8fed\u4ee3\u5229\u7528\u7a00\u758f\u6027\u63d0\u9ad8\u6548\u7387\u3002</p> </li> </ul> </li> <li> <p>\u5982\u679c\u65b9\u9635\u6709\u4e00\u7ec4\u5b8c\u6574\u7684\u7ebf\u6027\u65e0\u5173\u7684\u7279\u5f81\u5411\u91cf\uff0c\u5b83\u53ef\u4ee5\u88ab\u5bf9\u89d2\u5316\uff1a\\(A = PDP^{-1}\\)\uff0c\u5176\u4e2d \\(D\\) \u662f\u4ee5\u7279\u5f81\u503c\u4e3a\u5bf9\u89d2\u5143\u7684\u5bf9\u89d2\u77e9\u9635\uff0c\\(P\\) \u7684\u5217\u662f\u7279\u5f81\u5411\u91cf\u3002</p> </li> <li> <p>\u8fd9\u6709\u4ec0\u4e48\u7528\uff1f\u5bf9\u89d2\u77e9\u9635\u975e\u5e38\u5bb9\u6613\u5904\u7406\u3002\u9700\u8981\u8ba1\u7b97 \\(A^{100}\\)\uff1f\u4e0d\u7528\u5c06 \\(A\\) \u81ea\u4e58100\u6b21\uff0c\u8ba1\u7b97 \\(PD^{100}P^{-1}\\) \u5373\u53ef\u2014\u2014\u800c\u5bf9\u89d2\u77e9\u9635\u7684\u5e42\u53ea\u9700\u72ec\u7acb\u5730\u5bf9\u6bcf\u4e2a\u5bf9\u89d2\u5143\u6c42\u5e42\u3002\u8fd9\u5c06\u4e00\u4e2a\u6602\u8d35\u7684\u8fd0\u7b97\u53d8\u6210\u4e86\u5ec9\u4ef7\u8fd0\u7b97\u3002</p> </li> <li> <p>\u7279\u5f81\u57fa\u662f\u5b8c\u5168\u7531\u7279\u5f81\u5411\u91cf\u6784\u6210\u7684\u57fa\u3002\u5728\u8fd9\u4e2a\u57fa\u4e0b\uff0c\u77e9\u9635\u53d8\u6210\u5bf9\u89d2\u77e9\u9635\uff0c\u53d8\u6362\u4ec5\u4ec5\u662f\u6cbf\u6bcf\u4e2a\u7279\u5f81\u5411\u91cf\u65b9\u5411\u7684\u72ec\u7acb\u7f29\u653e\u3002\u8fd9\u5c31\u50cf\u662f\u627e\u5230\u4e86\u53d8\u6362\u7684\u81ea\u7136\u5750\u6807\u7cfb\u3002</p> </li> <li> <p>QR\u5206\u89e3\u5c06\u4efb\u610f\u77e9\u9635 \\(A\\) \u5206\u89e3\u4e3a \\(A = QR\\)\uff0c\u5176\u4e2d \\(Q\\) \u662f\u6b63\u4ea4\u77e9\u9635\uff08\u5176\u5217\u662f\u6807\u51c6\u6b63\u4ea4\u7684\uff09\uff0c\\(R\\) \u662f\u4e0a\u4e09\u89d2\u77e9\u9635\u3002\u53ef\u4ee5\u7406\u89e3\u4e3a\u5c06\"\u65b9\u5411\"\u4fe1\u606f\uff08\\(Q\\)\uff09\u4e0e\"\u7f29\u653e\u548c\u6df7\u5408\"\u4fe1\u606f\uff08\\(R\\)\uff09\u5206\u5f00\u3002</p> </li> <li> <p>Gram-Schmidt\u8fc7\u7a0b\u9010\u5217\u6784\u5efa \\(Q\\)\u3002\u53d6 \\(A\\) \u7684\u7b2c\u4e00\u5217\u5e76\u5f52\u4e00\u5316\u3002\u53d6\u7b2c\u4e8c\u5217\uff0c\u51cf\u53bb\u5176\u5728\u7b2c\u4e00\u5217\u4e0a\u7684\u6295\u5f71\uff08\u4f7f\u5176\u5782\u76f4\uff09\uff0c\u518d\u5f52\u4e00\u5316\u3002\u5bf9\u6bcf\u4e00\u5217\u91cd\u590d\u6b64\u8fc7\u7a0b\u3002\u7ed3\u679c\u662f\u4e00\u7ec4\u6807\u51c6\u6b63\u4ea4\u5411\u91cf\u3002</p> </li> <li> <p>QR\u5206\u89e3\u662fQR\u7b97\u6cd5\u6c42\u7279\u5f81\u503c\u80cc\u540e\u7684\u5f15\u64ce\u3002\u5b83\u4e5f\u76f4\u63a5\u7528\u4e8e\u6c42\u89e3\u6700\u5c0f\u4e8c\u4e58\u95ee\u9898\uff1a\u5f53 \\(A\\mathbf{x} = \\mathbf{b}\\) \u6ca1\u6709\u7cbe\u786e\u89e3\uff08\u65b9\u7a0b\u591a\u4e8e\u672a\u77e5\u6570\uff09\u65f6\uff0cQR\u627e\u5230\u6700\u4f73\u8fd1\u4f3c\u89e3\u3002</p> </li> <li> <p>SVD\uff08\u5947\u5f02\u503c\u5206\u89e3\uff09\u662f\u6700\u901a\u7528\u3001\u4e5f\u53ef\u4ee5\u8bf4\u662f\u6700\u91cd\u8981\u7684\u5206\u89e3\u3002\u6bcf\u4e2a\u77e9\u9635\uff08\u4efb\u610f\u5f62\u72b6\u3001\u4efb\u610f\u79e9\uff09\u90fd\u6709SVD\uff1a\\(A = U\\Sigma V^T\\)</p> <ul> <li>\\(V^T\\)\uff08\\(n \\times n\\)\uff0c\u6b63\u4ea4\uff09\uff1a\u65cb\u8f6c\u8f93\u5165</li> <li>\\(\\Sigma\\)\uff08\\(m \\times n\\)\uff0c\u5bf9\u89d2\uff09\uff1a\u6cbf\u6b63\u4ea4\u5750\u6807\u8f74\u7f29\u653e\uff08\u5947\u5f02\u503c\uff0c\u975e\u8d1f\uff0c\u9012\u51cf\u6392\u5217\uff09</li> <li>\\(U\\)\uff08\\(m \\times m\\)\uff0c\u6b63\u4ea4\uff09\uff1a\u65cb\u8f6c\u8f93\u51fa</li> </ul> </li> </ul> <p></p> <ul> <li> <p>\u51e0\u4f55\u4e0a\uff0cSVD\u8868\u660e\u6bcf\u4e2a\u7ebf\u6027\u53d8\u6362\uff0c\u65e0\u8bba\u591a\u4e48\u590d\u6742\uff0c\u90fd\u53ea\u662f\u4e00\u4e2a\u65cb\u8f6c\u3001\u4e00\u4e2a\u6cbf\u5750\u6807\u8f74\u7684\u62c9\u4f38\u3001\u518d\u4e00\u4e2a\u65cb\u8f6c\u7684\u7ec4\u5408\u3002\u4e00\u4e2a\u5706\u53d8\u6210\u4e86\u4e00\u4e2a\u692d\u5706\u3002</p> </li> <li> <p>\u5947\u5f02\u503c\uff08\\(\\sigma_1 \\geq \\sigma_2 \\geq \\ldots\\)\uff09\u63ed\u793a\u4e86\u6bcf\u4e2a\u65b9\u5411\u7684\"\u91cd\u8981\u6027\"\u3002\u5927\u7684\u5947\u5f02\u503c\u5bf9\u5e94\u6700\u91cd\u8981\u7684\u65b9\u5411\u3002\\(A\\) \u7684\u79e9\u7b49\u4e8e\u975e\u96f6\u5947\u5f02\u503c\u7684\u4e2a\u6570\u3002</p> </li> <li> <p>\u4f4e\u79e9\u8fd1\u4f3c\uff1a\u53ea\u4fdd\u7559\u6700\u5927\u7684 \\(k\\) \u4e2a\u5947\u5f02\u503c\uff0c\u5c06\u5176\u4ed6\u7f6e\u96f6\uff0c\u5c31\u5f97\u5230\u4e86 \\(A\\) \u7684\u6700\u4f73\u79e9-\\(k\\) \u8fd1\u4f3c\u3002\u8fd9\u5c31\u662f\u56fe\u50cf\u538b\u7f29\u7684\u539f\u7406\uff1a\u4e00\u5f20 \\(1000 \\times 1000\\) \u7684\u56fe\u50cf\u53ef\u80fd\u53ea\u9700\u8981 \\(k = 50\\) \u4e2a\u5947\u5f02\u503c\u5c31\u80fd\u770b\u8d77\u6765\u51e0\u4e4e\u4e00\u6a21\u4e00\u6837\uff0c\u538b\u7f29\u4e8620\u500d\u3002</p> </li> <li> <p>SVD\u4e5f\u63d0\u4f9b\u4e86\u4f2a\u9006\uff1a\\(A^+ = V\\Sigma^+U^T\\)\uff0c\u5176\u4e2d \\(\\Sigma^+\\) \u662f\u5bf9\u975e\u96f6\u5947\u5f02\u503c\u53d6\u5012\u6570\u3002</p> </li> <li> <p>\u7279\u5f81\u5206\u89e3\u53ea\u5bf9\u65b9\u9635\u6709\u6548\uff0c\u800cSVD\u5bf9\u4efb\u610f\u77e9\u9635\u90fd\u6709\u6548\u3002\u8fd9\u662f\u5b83\u7684\u5173\u952e\u4f18\u52bf\u3002</p> </li> <li> <p>PCA\uff08\u4e3b\u6210\u5206\u5206\u6790\uff09\u4f7f\u7528\u7279\u5f81\u5206\u89e3\uff08\u6216SVD\uff09\u8fdb\u884c\u964d\u7ef4\u3002</p> </li> <li> <p>\u60f3\u8c61\u4e00\u4e2a\u6570\u636e\u96c6\uff0c\u6bcf\u4e2a\u6837\u672c\u6709100\u4e2a\u7279\u5f81\uff08\u5806\u53e0\u6210\u77e9\u9635\u7684100\u7ef4\u5411\u91cf\uff09\u3002\u5176\u4e2d\u8bb8\u591a\u7279\u5f81\u662f\u76f8\u5173\u7684\u3001\u5197\u4f59\u7684\u3002</p> </li> <li> <p>PCA\u627e\u5230\u6570\u636e\u5b9e\u9645\u53d8\u5316\u7684\u90a3\u4e9b\u65b9\u5411\uff0c\u8ba9\u4f60\u53ea\u4fdd\u7559\u91cd\u8981\u7684\u90e8\u5206\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u7b2c\u4e00\u4e3b\u6210\u5206\uff08PC1\uff09\u662f\u65b9\u5dee\u6700\u5927\u7684\u65b9\u5411\u3002</p> </li> <li> <p>\u7b2c\u4e8c\u4e3b\u6210\u5206\uff08PC2\uff09\u6355\u83b7\u5269\u4f59\u90e8\u5206\u7684\u6700\u5927\u65b9\u5dee\uff0c\u4e14\u4e0e\u7b2c\u4e00\u4e3b\u6210\u5206\u5782\u76f4\u3002</p> </li> <li> <p>\u5982\u679c\u5927\u90e8\u5206\u65b9\u5dee\u53ea\u96c6\u4e2d\u5728\u5c11\u6570\u51e0\u4e2a\u65b9\u5411\u4e0a\uff0c\u4f60\u53ef\u4ee5\u5c06\u6570\u636e\u6295\u5f71\u5230\u8fd9\u4e9b\u7ef4\u5ea6\u4e0a\uff0c\u4e22\u5f03\u5176\u4f59\u90e8\u5206\uff0c\u635f\u5931\u6781\u5c0f\u3002</p> </li> <li> <p>\u6b65\u9aa4\uff1a</p> <ul> <li>\u6807\u51c6\u5316\u6570\u636e\uff08\u51cf\u53bb\u5747\u503c\uff0c\u9664\u4ee5\u6807\u51c6\u5dee\uff09\uff0c\u4f7f\u6240\u6709\u7279\u5f81\u8d21\u732e\u5e73\u7b49</li> <li>\u8ba1\u7b97\u534f\u65b9\u5dee\u77e9\u9635</li> <li>\u6c42\u5176\u7279\u5f81\u503c\u548c\u7279\u5f81\u5411\u91cf</li> <li>\u9009\u62e9 \\(k\\) \u4e2a\u6700\u5927\u7279\u5f81\u503c\u5bf9\u5e94\u7684\u7279\u5f81\u5411\u91cf\uff08\u5373\u4e3b\u6210\u5206\uff09</li> <li>\u5c06\u6570\u636e\u6295\u5f71\u5230\u8fd9\u4e9b\u4e3b\u6210\u5206\u4e0a</li> </ul> </li> <li> <p>\u6807\u51c6\u5316\u81f3\u5173\u91cd\u8981\uff1a\u5982\u679c\u4e0d\u505a\u6807\u51c6\u5316\uff0c\u7528\u516c\u91cc\u6d4b\u91cf\u7684\u7279\u5f81\u4f1a\u4e3b\u5bfc\u7528\u5398\u7c73\u6d4b\u91cf\u7684\u7279\u5f81\uff0c\u800c\u4e0d\u8bba\u5176\u5b9e\u9645\u91cd\u8981\u6027\u5982\u4f55\u3002</p> </li> <li> <p>\u5728\u5b9e\u8df5\u4e2d\uff0cPCA\u7528\u4e8e\u53ef\u89c6\u5316\uff08\u5c06\u9ad8\u7ef4\u6570\u636e\u6295\u5f71\u52302D\u62163D\uff09\u3001\u964d\u566a\uff08\u4e22\u5f03\u4e3b\u8981\u662f\u566a\u58f0\u7684\u4f4e\u65b9\u5dee\u65b9\u5411\uff09\uff0c\u4ee5\u53ca\u901a\u8fc7\u51cf\u5c11\u8f93\u5165\u7279\u5f81\u6570\u91cf\u6765\u52a0\u901f\u673a\u5668\u5b66\u4e60\u6a21\u578b\u3002</p> </li> <li> <p>\u6838PCA\u5c06PCA\u6269\u5c55\u5230\u975e\u7ebf\u6027\u5173\u7cfb\u3002\u5b83\u901a\u8fc7\u6838\u51fd\u6570\u5c06\u6570\u636e\u6620\u5c04\u5230\u66f4\u9ad8\u7ef4\u7a7a\u95f4\uff0c\u5728\u90a3\u91cc\u7ed3\u6784\u53d8\u5f97\u7ebf\u6027\uff0c\u7136\u540e\u5e94\u7528\u6807\u51c6PCA\u5e76\u6295\u5f71\u56de\u6765\u3002</p> </li> <li> <p>Schur\u5206\u89e3\u5c06\u65b9\u9635\u5206\u89e3\u4e3a \\(A = QTQ^\\ast\\)\uff0c\u5176\u4e2d \\(Q\\) \u662f\u9149\u77e9\u9635\uff0c\\(T\\) \u662f\u4e0a\u4e09\u89d2\u77e9\u9635\u3002\u6bcf\u4e2a\u65b9\u9635\u90fd\u6709Schur\u5206\u89e3\uff0c\u5373\u4f7f\u5b83\u4e0d\u80fd\u88ab\u5bf9\u89d2\u5316\u3002</p> </li> <li> <p>\u975e\u8d1f\u77e9\u9635\u5206\u89e3\uff08NMF\uff09 \u5c06\u4e00\u4e2a\u77e9\u9635\u5206\u89e3\u4e3a\u4e24\u4e2a\u975e\u8d1f\u77e9\u9635\uff1a\\(A \\approx WH\\)\uff0c\u5176\u4e2d \\(W\\) \u548c \\(H\\) \u7684\u6240\u6709\u6761\u76ee\u90fd \\(\\geq 0\\)\u3002\u4e0e\u53ef\u80fd\u4ea7\u751f\u8d1f\u6761\u76ee\u7684SVD\u4e0d\u540c\uff0cNMF\u53ea\u505a\u52a0\u6cd5\uff0c\u4ece\u4e0d\u505a\u51cf\u6cd5\u3002\u8fd9\u4f7f\u5f97\u5404\u90e8\u5206\u53ef\u89e3\u91ca\uff1a\u5728\u4e3b\u9898\u5efa\u6a21\u4e2d\uff0c\\(W\\) \u7ed9\u51fa\u6bcf\u4e2a\u6587\u6863\u7684\u4e3b\u9898\u6743\u91cd\uff0c\\(H\\) \u7ed9\u51fa\u6bcf\u4e2a\u4e3b\u9898\u7684\u8bcd\u6743\u91cd\uff0c\u5168\u90e8\u975e\u8d1f\uff0c\u8fd9\u4e0e\u6211\u4eec\u5bf9\u6587\u6863\"\u5305\u542b\u591a\u5c11\u67d0\u4e2a\u4e3b\u9898\"\u7684\u601d\u8003\u65b9\u5f0f\u76f8\u7b26\u3002</p> </li> <li> <p>\u8c31\u5b9a\u7406\u6307\u51fa\uff0c\u5bf9\u79f0\uff08\u6216Hermitian\uff09\u77e9\u9635\u603b\u53ef\u4ee5\u7528\u6b63\u4ea4\uff08\u6216\u9149\uff09\u77e9\u9635\u5bf9\u89d2\u5316\u3002\u5b83\u4eec\u7684\u7279\u5f81\u503c\u603b\u662f\u5b9e\u6570\uff0c\u7279\u5f81\u5411\u91cf\u603b\u662f\u6b63\u4ea4\u7684\u3002\u8fd9\u662fPCA\u7684\u7406\u8bba\u57fa\u7840\u3002</p> </li> </ul>"},{"location":"chapter%2002%3A%20matrices/05.%20decompositions/#colabjupyter-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528CoLab\u6216Jupyter Notebook\uff09","text":"<ol> <li>\u8ba1\u7b97\u5bf9\u79f0\u77e9\u9635\u7684\u7279\u5f81\u503c\u548c\u7279\u5f81\u5411\u91cf\u3002\u9a8c\u8bc1\u7279\u5f81\u5411\u91cf\u4e92\u76f8\u5782\u76f4\uff0c\u5e76\u4ece\u7279\u5f81\u5206\u89e3\u91cd\u5efa\u77e9\u9635\u3002</li> </ol> <pre><code>import jax.numpy as jnp\n\nA = jnp.array([[4.0, 2.0],\n               [2.0, 3.0]])\n\neigenvalues, eigenvectors = jnp.linalg.eigh(A)\nprint(f\"Eigenvalues: {eigenvalues}\")\nprint(f\"Eigenvectors orthogonal: {jnp.dot(eigenvectors[:,0], eigenvectors[:,1]):.6f}\")\n\n# Reconstruct: A = P D P^T\nD = jnp.diag(eigenvalues)\nA_reconstructed = eigenvectors @ D @ eigenvectors.T\nprint(f\"Reconstruction matches: {jnp.allclose(A, A_reconstructed)}\")\n</code></pre> <ol> <li>\u5b9e\u73b0\u5e42\u8fed\u4ee3\u6c42\u6700\u5927\u7279\u5f81\u503c\uff0c\u4ee5\u53ca\u53cd\u8fed\u4ee3\u6c42\u6700\u5c0f\u7279\u5f81\u503c\u3002\u4e0e <code>jnp.linalg.eigh</code> \u6bd4\u8f83\u3002\u7136\u540e\u5c1d\u8bd5\u81ea\u5df1\u5b9e\u73b0QR\u7b97\u6cd5\u3002</li> </ol> <pre><code>import jax.numpy as jnp\n\nA = jnp.array([[4.0, 2.0],\n               [2.0, 3.0]])\n\n# Power iteration: finds the LARGEST eigenvalue\nv = jnp.array([1.0, 0.0])\nfor _ in range(20):\n    v = A @ v\n    v = v / jnp.linalg.norm(v)\nprint(f\"Largest eigenvalue:  {v @ A @ v:.4f}\")\n\n# Inverse iteration: multiply by A^{-1} instead of A, finds the SMALLEST eigenvalue\nv = jnp.array([1.0, 0.0])\nfor _ in range(20):\n    v = jnp.linalg.solve(A, v)\n    v = v / jnp.linalg.norm(v)\nprint(f\"Smallest eigenvalue: {1.0 / (v @ jnp.linalg.solve(A, v)):.4f}\")\n\nprint(f\"jnp.linalg.eigh:    {jnp.linalg.eigh(A)[0]}\")\n</code></pre> <ol> <li>\u8ba1\u7b97\u77e9\u9635\u7684SVD\uff0c\u7136\u540e\u4ec5\u4f7f\u7528\u524dk\u4e2a\u5947\u5f02\u503c\u91cd\u5efa\u77e9\u9635\uff0c\u89c2\u5bdf\u8fd1\u4f3c\u8d28\u91cf\u968fk\u7684\u53d8\u5316\u3002</li> </ol> <pre><code>import jax.numpy as jnp\n\nA = jnp.array([[1.0, 2.0, 3.0],\n               [4.0, 5.0, 6.0],\n               [7.0, 8.0, 9.0]])\n\nU, S, Vt = jnp.linalg.svd(A)\n\nfor k in [1, 2, 3]:\n    approx = U[:, :k] @ jnp.diag(S[:k]) @ Vt[:k, :]\n    error = jnp.linalg.norm(A - approx)\n    print(f\"k={k}, reconstruction error: {error:.4f}\")\n</code></pre>"},{"location":"chapter%2003%3A%20calculus/01.%20differential%20calculus/","title":"\u5fae\u5206","text":"<p>\u5fae\u5206\u5b66\u7814\u7a76\u77ac\u65f6\u53d8\u5316\u7387\u3002\u672c\u8282\u6db5\u76d6\u6781\u9650\u3001\u5bfc\u6570\u3001\u5fae\u5206\u6cd5\u5219\u3001\u94fe\u5f0f\u6cd5\u5219\uff08\u53cd\u5411\u4f20\u64ad\u7684\u57fa\u7840\uff09\uff0c\u4ee5\u53ca\u673a\u5668\u5b66\u4e60\u4e2d\u5e38\u7528\u7684\u5bfc\u6570\u3002</p> <ul> <li> <p>\u5728\u524d\u9762\u7684\u7ae0\u8282\u4e2d\uff0c\u6211\u4eec\u5b66\u4f1a\u4e86\u5982\u4f55\u5c06\u6570\u636e\u8868\u793a\u4e3a\u5411\u91cf\uff0c\u5e76\u7528\u77e9\u9635\u5bf9\u5176\u8fdb\u884c\u53d8\u6362\u3002\u4f46\u73b0\u5b9e\u4e16\u754c\u4e2d\u7684\u8bb8\u591a\u73b0\u8c61\u5e76\u975e\u9759\u6b62\u4e0d\u53d8\u7684\u3002\u6c7d\u8f66\u5728\u52a0\u901f\uff0c\u80a1\u4ef7\u5728\u6ce2\u52a8\uff0c\u795e\u7ecf\u7f51\u7edc\u7684\u635f\u5931\u968f\u7740\u6743\u91cd\u7684\u66f4\u65b0\u800c\u53d8\u5316\u3002\u5fae\u79ef\u5206\u662f\u7814\u7a76\u53d8\u5316\u7684\u6570\u5b66\u3002</p> </li> <li> <p>\u5fae\u79ef\u5206\u56de\u7b54\u4e24\u4e2a\u95ee\u9898\uff1a\u67d0\u4e2a\u91cf\u5728\u5f53\u524d\u65f6\u523b\u53d8\u5316\u5f97\u6709\u591a\u5feb\uff1f\uff08\u5fae\u5206\u5b66\uff09\u4ee5\u53ca\u5b83\u5728\u4e00\u6bb5\u65f6\u95f4\u5185\u7d2f\u79ef\u4e86\u591a\u5c11\uff1f\uff08\u79ef\u5206\u5b66\uff09\u3002\u672c\u8282\u8ba8\u8bba\u7684\u662f\"\u591a\u5feb\"\u7684\u95ee\u9898\u3002</p> </li> <li> <p>\u60f3\u8c61\u4e00\u4e0b\u4f60\u6b63\u5728\u5f00\u8f66\uff0c\u77a5\u4e86\u4e00\u773c\u8f66\u901f\u8868\u3002\u4e0a\u9762\u663e\u793a 60 km/h\u3002\u8fd9\u4e2a\u6570\u5b57\u4e0d\u662f\u4f60\u6574\u4e2a\u884c\u7a0b\u7684\u5e73\u5747\u901f\u5ea6\uff0c\u800c\u662f\u4f60\u5728\u8fd9\u4e00\u77ac\u95f4\u7684\u77ac\u65f6\u901f\u5ea6\u3002\u5fae\u5206\u5b66\u4e3a\u6211\u4eec\u63d0\u4f9b\u4e86\u8ba1\u7b97\u8fd9\u79cd\u77ac\u65f6\u53d8\u5316\u7387\u7684\u5de5\u5177\u3002</p> </li> <li> <p>\u4f46\u9996\u5148\uff0c\u8ba9\u6211\u4eec\u56de\u987e\u4e00\u4e0b\u76f4\u7ebf\u65b9\u7a0b\uff1a\\(y = mx + b\\)\u3002</p> </li> <li> <p>\u8fd9\u662f\u4e24\u4e2a\u91cf\u4e4b\u95f4\u6700\u7b80\u5355\u7684\u5173\u7cfb\u3002</p> <ul> <li>\\(b\\) \u662f y \u622a\u8ddd\uff0c\u5373\u76f4\u7ebf\u4e0e y \u8f74\u7684\u4ea4\u70b9\uff08\u5f53 \\(x = 0\\) \u65f6\u7684\u8d77\u59cb\u503c\uff09\u3002</li> <li>\\(m\\) \u662f\u659c\u7387\uff0c\u5373\u53d8\u5316\u7387\uff1a\\(x\\) \u6bcf\u589e\u52a0 1 \u4e2a\u5355\u4f4d\uff0c\\(y\\) \u5c31\u53d8\u5316 \\(m\\) \u4e2a\u5355\u4f4d\u3002</li> <li>\u5982\u679c \\(m = 3\\)\uff0c\u76f4\u7ebf\u9661\u5ced\u4e0a\u5347\uff1b\u5982\u679c \\(m = 0\\)\uff0c\u76f4\u7ebf\u6c34\u5e73\uff1b\u5982\u679c \\(m = -2\\)\uff0c\u76f4\u7ebf\u4e0b\u964d\u3002</li> </ul> </li> <li> <p>\u659c\u7387\u8ba1\u7b97\u516c\u5f0f\u4e3a \\(m = \\frac{\\Delta y}{\\Delta x} = \\frac{y_2 - y_1}{x_2 - x_1}\\)\uff0c\u5373\"\\(y\\) \u53d8\u5316\u4e86\u591a\u5c11\"\u4e0e\"\\(x\\) \u53d8\u5316\u4e86\u591a\u5c11\"\u7684\u6bd4\u503c\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u4e00\u65e6\u77e5\u9053\u4e86 \\(m\\) \u548c \\(b\\)\uff0c\u5c31\u53ef\u4ee5\u8ba1\u7b97\u4efb\u610f \\(x\\) \u5bf9\u5e94\u7684 \\(y\\) \u503c\u3002</p> </li> <li> <p>\u4f8b\u5982\uff0c\u82e5 \\(m = 2\\) \u4e14 \\(b = 3\\)\uff0c\u5219\u5728 \\(x = 5\\) \u5904\uff1a\\(y = 2(5) + 3 = 13\\)\u3002</p> </li> <li> <p>\u8fd9\u4e24\u4e2a\u53c2\u6570\u5b8c\u5168\u51b3\u5b9a\u4e86\u8fd9\u6761\u76f4\u7ebf\uff0c\u9884\u6d4b\u4efb\u4f55\u8f93\u51fa\u53ea\u9700\u4ee3\u5165\u516c\u5f0f\u5373\u53ef\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u76f4\u7ebf\uff0c\u659c\u7387\u5904\u5904\u76f8\u540c\u3002</p> </li> <li> <p>\u8fd9\u4e00\u601d\u60f3\u53ef\u4ee5\u63a8\u5e7f\u5230\u76f4\u7ebf\u4e4b\u5916\u3002\u4efb\u4f55\u51fd\u6570\u90fd\u662f\u4e00\u4e2a\u5c06\u8f93\u5165\u6620\u5c04\u5230\u8f93\u51fa\u7684\u89c4\u5219\uff0c\u4e00\u65e6\u77e5\u9053\u4e86\u5b83\u7684\u516c\u5f0f\uff08\u53c2\u6570\u548c\u5f62\u72b6\uff09\uff0c\u5c31\u53ef\u4ee5\u8ba1\u7b97\u4efb\u610f\u8f93\u5165\u5bf9\u5e94\u7684\u8f93\u51fa\uff0c\u5e76\u5c06\u7ed3\u679c\u7ed8\u5236\u6210\u56fe\u3002</p> </li> <li> <p>\\(y = x^2\\) \u7ed9\u51fa\u629b\u7269\u7ebf\uff0c\\(y = \\sin(x)\\) \u7ed9\u51fa\u6ce2\u5f62\uff0c\\(y = e^x\\) \u7ed9\u51fa\u6307\u6570\u589e\u957f\u3002\u6bcf\u4e2a\u516c\u5f0f\u90fd\u5b9a\u4e49\u4e86\u4e00\u6761\u7279\u5b9a\u7684\u66f2\u7ebf\uff0c\u80fd\u591f\u719f\u7ec3\u5730\u5c06\u51fd\u6570\u7406\u89e3\u4e3a\u4e00\u79cd\u5f62\u72b6\uff0c\u5bf9\u4e8e\u540e\u7eed\u5185\u5bb9\u81f3\u5173\u91cd\u8981\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u76f4\u7ebf\uff0c\u659c\u7387\u5904\u5904\u76f8\u540c\u3002\u4f46\u5927\u591a\u6570\u6709\u8da3\u7684\u51fd\u6570\u90fd\u662f\u5f2f\u66f2\u7684\uff0c\u56e0\u6b64\u659c\u7387\u5728\u4e0d\u540c\u70b9\u5904\u5404\u4e0d\u76f8\u540c\u3002\u5fae\u79ef\u5206\u7ed9\u4e86\u6211\u4eec\u4e00\u79cd\u65b9\u6cd5\u6765\u6c42\u66f2\u7ebf\u4e0a\u4efb\u610f\u4e00\u70b9\u7684\u659c\u7387\u3002</p> </li> <li> <p>\u6211\u4eec\u8fd8\u9700\u8981\u6781\u9650\u7684\u6982\u5ff5\u3002\u6781\u9650\u63cf\u8ff0\u7684\u662f\u5f53\u8f93\u5165\u8d8a\u6765\u8d8a\u63a5\u8fd1\u67d0\u4e2a\u76ee\u6807\u503c\u65f6\uff0c\u51fd\u6570\u8d8b\u8fd1\u4e8e\u4ec0\u4e48\u503c\uff0c\u800c\u4e0d\u4e00\u5b9a\u975e\u8981\u8fbe\u5230\u8be5\u503c\u3002</p> </li> </ul> \\[\\lim_{x \\to a} f(x) = L\\] <ul> <li> <p>\u8fd9\u8bfb\u4f5c\uff1a\"\u5f53 \\(x\\) \u8d8b\u8fd1\u4e8e \\(a\\) \u65f6\uff0c\\(f(x)\\) \u8d8b\u8fd1\u4e8e \\(L\\)\u3002\"\u51fd\u6570\u5728 \\(x = a\\) \u5904\u4e0d\u4e00\u5b9a\u7b49\u4e8e \\(L\\)\uff0c\u53ea\u9700\u65e0\u9650\u63a5\u8fd1\u5373\u53ef\u3002</p> </li> <li> <p>\u4f8b\u5982\uff0c\u8003\u8651 \\(f(x) = \\frac{x^2 - 1}{x - 1}\\)\u3002\u5982\u679c\u76f4\u63a5\u4ee3\u5165 \\(x = 1\\)\uff0c\u4f1a\u5f97\u5230 \\(\\frac{0}{0}\\)\uff0c\u8fd9\u662f\u672a\u5b9a\u4e49\u7684\u3002</p> </li> <li> <p>\u4f46\u5c1d\u8bd5\u63a5\u8fd1 1 \u7684\u503c\uff1a\\(f(0.9) = 1.9\\)\uff0c\\(f(0.99) = 1.99\\)\uff0c\\(f(1.01) = 2.01\\)\u3002\u8f93\u51fa\u663e\u7136\u671d\u7740 2 \u9760\u8fd1\u3002</p> </li> <li> <p>\u4ece\u4ee3\u6570\u89d2\u5ea6\u770b\uff0c\u6211\u4eec\u53ef\u4ee5\u7406\u89e3\u539f\u56e0\uff1a\u5c06\u5206\u5b50\u56e0\u5f0f\u5206\u89e3\u4e3a \\((x-1)(x+1)\\)\uff0c\u7ea6\u53bb \\((x-1)\\) \u9879\uff0c\u5bf9\u4e8e\u6240\u6709 \\(x \\neq 1\\) \u5f97\u5230 \\(f(x) = x + 1\\)\u3002\u56e0\u6b64\u5f53 \\(x \\to 1\\) \u65f6\uff0c\\(f(x) \\to 2\\)\u3002</p> </li> <li> <p>\u8be5\u51fd\u6570\u5728 \\(x = 1\\) \u5904\u6709\u4e00\u4e2a\u7a7a\u6d1e\uff0c\u4f46\u6781\u9650\u4ecd\u7136\u5b58\u5728\u3002</p> </li> <li> <p>\u6781\u9650\u662f\u5fae\u79ef\u5206\u4e2d\u5176\u4ed6\u4e00\u5207\u5185\u5bb9\u7684\u57fa\u7840\u3002</p> </li> <li> <p>\u51fd\u6570 \\(f(x)\\) \u5728\u70b9 \\(x = a\\) \u5904\u7684\u5bfc\u6570\u8861\u91cf\u7684\u662f\u77ac\u65f6\u53d8\u5316\u7387\u3002\u4ece\u51e0\u4f55\u89d2\u5ea6\u770b\uff0c\u5b83\u662f\u8be5\u70b9\u5904\u66f2\u7ebf\u5207\u7ebf\u7684\u659c\u7387\u3002</p> </li> </ul> <p></p> <ul> <li>\u8981\u8ba1\u7b97\u8fd9\u4e2a\u659c\u7387\uff0c\u6211\u4eec\u9996\u5148\u5728\u66f2\u7ebf\u4e0a\u53d6\u4e24\u4e2a\u70b9\uff0c\u8ba1\u7b97\u901a\u8fc7\u8fd9\u4e24\u4e2a\u70b9\u7684\u76f4\u7ebf\uff08\u5272\u7ebf\uff09\u7684\u659c\u7387\u3002\u7136\u540e\u8ba9\u7b2c\u4e8c\u4e2a\u70b9\u9010\u6e10\u9760\u8fd1\u7b2c\u4e00\u4e2a\u70b9\uff0c\u89c2\u5bdf\u5272\u7ebf\u7684\u659c\u7387\u8d8b\u8fd1\u4e8e\u4ec0\u4e48\u503c\u3002\u8fd9\u5c31\u662f\u5dee\u5546\uff1a</li> </ul> \\[f'(a) = \\lim_{h \\to 0} \\frac{f(a + h) - f(a)}{h}\\] <p></p> <ul> <li> <p>\u5206\u5b50 \\(f(a+h) - f(a)\\) \u662f\u8f93\u51fa\u7684\u53d8\u5316\u91cf\u3002\u5206\u6bcd \\(h\\) \u662f\u8f93\u5165\u7684\u53d8\u5316\u91cf\u3002\u5b83\u4eec\u7684\u6bd4\u503c\u662f\u5728\u4e00\u4e2a\u6781\u5c0f\u533a\u95f4\u4e0a\u7684\u5e73\u5747\u53d8\u5316\u7387\u3002\u5f53 \\(h \\to 0\\) \u65f6\uff0c\u8fd9\u4e2a\u5e73\u5747\u503c\u5c31\u53d8\u6210\u4e86\u77ac\u65f6\u53d8\u5316\u7387\u3002</p> </li> <li> <p>\u4f8b\u5982\uff0c\u8bbe \\(f(x) = x^2\\)\u3002\u5728 \\(x = 3\\) \u5904\uff1a</p> </li> </ul> \\[f'(3) = \\lim_{h \\to 0} \\frac{(3+h)^2 - 9}{h} = \\lim_{h \\to 0} \\frac{9 + 6h + h^2 - 9}{h} = \\lim_{h \\to 0} (6 + h) = 6\\] <ul> <li> <p>\u56e0\u6b64\u5728 \\(x = 3\\) \u5904\uff0c\u51fd\u6570 \\(x^2\\) \u4ee5\u6bcf\u5355\u4f4d\u8f93\u5165\u53d8\u5316 6 \u5355\u4f4d\u8f93\u51fa\u7684\u901f\u7387\u589e\u52a0\u3002</p> </li> <li> <p>\u5982\u679c\u8fd9\u4e2a\u6781\u9650\u5b58\u5728\uff0c\u5219\u79f0\u51fd\u6570\u5728\u8be5\u70b9\u662f\u53ef\u5fae\u7684\u3002\u8981\u505a\u5230\u8fd9\u4e00\u70b9\uff0c\u51fd\u6570\u5fc5\u987b\u8fde\u7eed\uff08\u6ca1\u6709\u8df3\u8dc3\uff09\u3001\u5149\u6ed1\uff08\u6ca1\u6709\u5c16\u89d2\uff09\uff0c\u5e76\u4e14\u5728\u70b9\u9644\u8fd1\u6709\u5b9a\u4e49\u3002</p> </li> <li> <p>\u5982\u679c\u4f60\u80fd\u7b14\u4e0d\u79bb\u7eb8\u5730\u753b\u51fa\u66f2\u7ebf\uff0c\u4e14\u6ca1\u6709\u4efb\u4f55\u6298\u70b9\uff0c\u90a3\u4e48\u5b83\u5728\u8be5\u70b9\u5f88\u53ef\u80fd\u662f\u53ef\u5fae\u7684\u3002</p> </li> <li> <p>\u6bcf\u6b21\u90fd\u4ece\u6781\u9650\u5b9a\u4e49\u51fa\u53d1\u8ba1\u7b97\u5bfc\u6570\u4f1a\u5f88\u7e41\u7410\u3002\u5e78\u8fd0\u7684\u662f\uff0c\u5c11\u6570\u51e0\u6761\u6cd5\u5219\u5c31\u80fd\u8ba9\u6211\u4eec\u5feb\u901f\u5fae\u5206\u51e0\u4e4e\u4efb\u4f55\u51fd\u6570\u3002</p> </li> <li> <p>\u5e38\u6570\u6cd5\u5219\uff1a\u5e38\u6570\u7684\u5bfc\u6570\u4e3a\u96f6\u3002\u82e5 \\(f(x) = 5\\)\uff0c\u5219 \\(f'(x) = 0\\)\u3002\u6c34\u5e73\u7ebf\u7684\u659c\u7387\u4e3a\u96f6\u3002</p> </li> <li> <p>\u5e42\u6cd5\u5219\uff1a\u5fae\u5206\u7684\u4e3b\u529b\u6cd5\u5219\u3002\u5c06\u6307\u6570\u63d0\u5230\u524d\u9762\uff0c\u7136\u540e\u5c06\u6307\u6570\u51cf\u4e00\uff1a</p> </li> </ul> \\[\\frac{d}{dx} x^n = n x^{n-1}\\] <ul> <li> <p>\u4f8b\u5982\uff1a\\(\\frac{d}{dx} x^3 = 3x^2\\)\u3002\u4e09\u6b21\u51fd\u6570\u53d8\u6210\u4e86\u4e8c\u6b21\u51fd\u6570\u3002\u8be5\u6cd5\u5219\u9002\u7528\u4e8e\u4efb\u4f55\u5b9e\u6570\u6307\u6570\uff0c\u5305\u62ec\u8d1f\u6570\u548c\u5206\u6570\uff1a\\(\\frac{d}{dx} x^{-1} = -x^{-2}\\) \u4ee5\u53ca \\(\\frac{d}{dx} \\sqrt{x} = \\frac{d}{dx} x^{1/2} = \\frac{1}{2}x^{-1/2}\\)\u3002</p> </li> <li> <p>\u548c/\u5dee\u6cd5\u5219\uff1a\u9010\u9879\u6c42\u5bfc\u3002</p> </li> </ul> \\[\\frac{d}{dx}[f(x) \\pm g(x)] = f'(x) \\pm g'(x)\\] <ul> <li>\u4e58\u79ef\u6cd5\u5219\uff1a\u5f53\u4e24\u4e2a\u51fd\u6570\u76f8\u4e58\u65f6\uff0c\u5bfc\u6570\u5e76\u975e\u7b80\u5355\u5730\u5c06\u5404\u81ea\u7684\u5bfc\u6570\u76f8\u4e58\u3002\u800c\u662f\uff1a</li> </ul> \\[\\frac{d}{dx}[f(x) \\cdot g(x)] = f'(x)g(x) + f(x)g'(x)\\] <ul> <li> <p>\u53ef\u4ee5\u8fd9\u6837\u7406\u89e3\uff1a\"\u7b2c\u4e00\u4e2a\u7684\u53d8\u5316\u7387\u4e58\u4ee5\u7b2c\u4e8c\u4e2a\uff0c\u52a0\u4e0a\u7b2c\u4e00\u4e2a\u4e58\u4ee5\u7b2c\u4e8c\u4e2a\u7684\u53d8\u5316\u7387\u3002\"\u4f8b\u5982\uff0c\\(\\frac{d}{dx}[x^2 \\sin x] = 2x \\sin x + x^2 \\cos x\\)\u3002</p> </li> <li> <p>\u5546\u6cd5\u5219\uff1a\u5bf9\u4e8e\u51fd\u6570\u7684\u6bd4\u503c\uff1a</p> </li> </ul> \\[\\frac{d}{dx}\\left[\\frac{f(x)}{g(x)}\\right] = \\frac{f'(x)g(x) - f(x)g'(x)}{[g(x)]^2}\\] <ul> <li> <p>\u4e00\u4e2a\u6709\u7528\u7684\u8bb0\u5fc6\u53e3\u8bc0\uff1a\"\u4e0a\u5bfc\u4e0b\u4e0d\u5bfc\u51cf\u53bb\u4e0a\u4e0d\u5bfc\u4e0b\u5bfc\uff0c\u9664\u4ee5\u5206\u6bcd\u7684\u5e73\u65b9\u3002\"</p> </li> <li> <p>\u94fe\u5f0f\u6cd5\u5219\uff1a\u5bf9\u673a\u5668\u5b66\u4e60\u6700\u91cd\u8981\u7684\u6cd5\u5219\u3002\u5f53\u51fd\u6570\u590d\u5408\uff08\u4e00\u4e2a\u51fd\u6570\u5d4c\u5957\u5728\u53e6\u4e00\u4e2a\u51fd\u6570\u5185\u90e8\uff09\u65f6\uff0c\u5bfc\u6570\u7b49\u4e8e\u6cbf\u94fe\u5404\u5bfc\u6570\u7684\u4e58\u79ef\uff1a</p> </li> </ul> \\[\\frac{d}{dx} f(g(x)) = f'(g(x)) \\cdot g'(x)\\] <ul> <li>\u53ef\u4ee5\u628a\u5b83\u60f3\u8c61\u6210\u5265\u6d0b\u8471\u3002\u5148\u5bf9\u5916\u5c42\u51fd\u6570\u6c42\u5bfc\uff08\u5185\u5c42\u51fd\u6570\u4fdd\u6301\u4e0d\u53d8\uff09\uff0c\u7136\u540e\u4e58\u4ee5\u5185\u5c42\u51fd\u6570\u7684\u5bfc\u6570\u3002</li> </ul> <p></p> <ul> <li> <p>\u4f8b\u5982\uff0c\\(\\frac{d}{dx} (3x + 1)^5 = 5(3x+1)^4 \\cdot 3 = 15(3x+1)^4\\)\u3002\u5916\u5c42\u51fd\u6570\u662f \\((\\cdot)^5\\)\uff0c\u5185\u5c42\u662f \\(3x+1\\)\u3002</p> </li> <li> <p>\u94fe\u5f0f\u6cd5\u5219\u662f\u795e\u7ecf\u7f51\u7edc\u4e2d\u53cd\u5411\u4f20\u64ad\u7684\u6570\u5b66\u57fa\u7840\u3002\u4e00\u4e2a\u6df1\u5c42\u7f51\u7edc\u5c31\u662f\u4e00\u4e2a\u7531\u591a\u4e2a\u590d\u5408\u51fd\u6570\u7ec4\u6210\u7684\u957f\u94fe\u3002\u8981\u8ba1\u7b97\u635f\u5931\u76f8\u5bf9\u4e8e\u6bcf\u4e2a\u6743\u91cd\u7684\u53d8\u5316\u7387\uff0c\u6211\u4eec\u4ece\u8f93\u51fa\u5c42\u5f00\u59cb\u9010\u5c42\u5411\u8f93\u5165\u5c42\u53cd\u590d\u5e94\u7528\u94fe\u5f0f\u6cd5\u5219\uff0c\u5c06\u6bcf\u4e00\u6b65\u7684\u5c40\u90e8\u5bfc\u6570\u76f8\u4e58\u3002</p> </li> <li> <p>\u4ee5\u4e0b\u662f\u4f60\u4f1a\u9047\u5230\u7684\u6700\u5e38\u89c1\u5bfc\u6570\u3002\u6bcf\u4e00\u4e2a\u90fd\u53ef\u4ee5\u4ece\u6781\u9650\u5b9a\u4e49\u63a8\u5bfc\u51fa\u6765\uff0c\u4f46\u719f\u8bb0\u5b83\u4eec\u53ef\u4ee5\u8282\u7701\u65f6\u95f4\uff1a</p> </li> </ul> \u51fd\u6570 \u5bfc\u6570 \u5907\u6ce8 \\(e^x\\) \\(e^x\\) \u552f\u4e00\u4e00\u4e2a\u5bfc\u6570\u7b49\u4e8e\u81ea\u8eab\u7684\u51fd\u6570 \\(a^x\\) \\(a^x \\ln a\\) \u6307\u6570\u51fd\u6570\u7684\u4e00\u822c\u5f62\u5f0f \\(\\ln x\\) \\(\\frac{1}{x}\\) \u81ea\u7136\u5bf9\u6570 \\(\\log_a x\\) \\(\\frac{1}{x \\ln a}\\) \u4e00\u822c\u5bf9\u6570 \\(\\sin x\\) \\(\\cos x\\) \\(\\cos x\\) \\(-\\sin x\\) \u6ce8\u610f\u8d1f\u53f7 \\(\\tan x\\) \\(\\sec^2 x\\) <ul> <li> <p>\u6307\u6570\u51fd\u6570 \\(e^x\\) \u975e\u5e38\u7279\u522b\uff1a\u5b83\u662f\u552f\u4e00\u4e00\u4e2a\u5bfc\u6570\u7b49\u4e8e\u81ea\u8eab\u7684\u51fd\u6570\u3002\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48 \\(e\\) \u5728\u673a\u5668\u5b66\u4e60\u4e2d\u65e0\u5904\u4e0d\u5728\uff0c\u4ece softmax \u6fc0\u6d3b\u51fd\u6570\u5230\u6982\u7387\u5206\u5e03\u90fd\u80fd\u89c1\u5230\u5b83\u7684\u8eab\u5f71\u3002</p> </li> <li> <p>\u6d1b\u5fc5\u8fbe\u6cd5\u5219\u7528\u4e8e\u5904\u7406\u5f62\u5982 \\(\\frac{0}{0}\\) \u6216 \\(\\frac{\\infty}{\\infty}\\) \u7684\u4e0d\u5b9a\u5f0f\u6781\u9650\u3002\u5f53\u76f4\u63a5\u4ee3\u5165\u5f97\u5230\u8fd9\u7c7b\u5f62\u5f0f\u65f6\uff0c\u53ef\u4ee5\u5206\u522b\u5bf9\u5206\u5b50\u548c\u5206\u6bcd\u6c42\u5bfc\uff0c\u7136\u540e\u518d\u6b21\u5c1d\u8bd5\u6c42\u6781\u9650\uff1a</p> </li> </ul> \\[\\lim_{x \\to a} \\frac{f(x)}{g(x)} = \\lim_{x \\to a} \\frac{f'(x)}{g'(x)}\\] <ul> <li> <p>\u6761\u4ef6\uff1a\\(f\\) \u548c \\(g\\) \u90fd\u5fc5\u987b\u5728 \\(a\\) \u9644\u8fd1\u53ef\u5fae\uff0c\u5e76\u4e14 \\(g'(x)\\) \u5728 \\(a\\) \u9644\u8fd1\uff08\u53ef\u80fd\u9664\u53bb \\(a\\) \u672c\u8eab\uff09\u4e0d\u4e3a\u96f6\u3002\u539f\u6781\u9650\u5fc5\u987b\u662f\u4e0d\u5b9a\u5f0f\u3002</p> </li> <li> <p>\u4f8b\u5982\uff1a\\(\\lim_{x \\to 0} \\frac{\\sin x}{x}\\)\u3002\u76f4\u63a5\u4ee3\u5165\u5f97\u5230 \\(\\frac{0}{0}\\)\u3002\u5e94\u7528\u6d1b\u5fc5\u8fbe\u6cd5\u5219\uff1a\\(\\lim_{x \\to 0} \\frac{\\cos x}{1} = 1\\)\u3002\u8fd9\u4e2a\u6781\u9650\u662f\u57fa\u7840\u7684\uff0c\u5728\u4fe1\u53f7\u5904\u7406\u548c\u5085\u91cc\u53f6\u5206\u6790\u4e2d\u90fd\u4f1a\u51fa\u73b0\u3002</p> </li> <li> <p>\u5982\u679c\u7ed3\u679c\u4ecd\u7136\u662f\u4e0d\u5b9a\u5f0f\uff0c\u53ef\u4ee5\u53cd\u590d\u5e94\u7528\u8be5\u6cd5\u5219\u3002\u4f8b\u5982\uff0c\\(\\lim_{x \\to 0} \\frac{1 - \\cos x}{x^2}\\) \u5f97\u5230 \\(\\frac{0}{0}\\)\u3002\u7b2c\u4e00\u6b21\u5e94\u7528\uff1a\\(\\lim_{x \\to 0} \\frac{\\sin x}{2x}\\)\uff0c\u4ecd\u7136\u662f \\(\\frac{0}{0}\\)\u3002\u7b2c\u4e8c\u6b21\u5e94\u7528\uff1a\\(\\lim_{x \\to 0} \\frac{\\cos x}{2} = \\frac{1}{2}\\)\u3002</p> </li> <li> <p>\u5982\u679c\u4e24\u4e2a\u51fd\u6570\u662f\u53ef\u5fae\u7684\uff0c\u90a3\u4e48\u5b83\u4eec\u7684\u548c\u3001\u5dee\u3001\u79ef\u3001\u590d\u5408\u4ee5\u53ca\u5546\uff08\u5206\u6bcd\u4e0d\u4e3a\u96f6\u65f6\uff09\u4e5f\u662f\u53ef\u5fae\u7684\u3002\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48\u6211\u4eec\u53ef\u4ee5\u81ea\u4fe1\u5730\u5bf9\u7531\u7b80\u5355\u90e8\u5206\u7ec4\u6210\u7684\u590d\u6742\u8868\u8fbe\u5f0f\u8fdb\u884c\u5fae\u5206\u3002</p> </li> </ul>"},{"location":"chapter%2003%3A%20calculus/01.%20differential%20calculus/#colab-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ol> <li> <p>\u53ef\u89c6\u5316\u5e38\u89c1\u51fd\u6570\u3002\u5728\u540c\u4e00\u5f20\u56fe\u4e2d\u7ed8\u5236 \\(x^2\\)\u3001\\(\\sin(x)\\) \u548c \\(e^x\\)\uff0c\u5efa\u7acb\u5bf9\u4e0d\u540c\u516c\u5f0f\u4ea7\u751f\u4e0d\u540c\u5f62\u72b6\u7684\u76f4\u89c2\u611f\u53d7\u3002\u5c1d\u8bd5\u4fee\u6539\u53c2\u6570\uff08\u4f8b\u5982 \\(2x^2\\)\u3001\\(\\sin(2x)\\)\uff09\uff0c\u89c2\u5bdf\u66f2\u7ebf\u5982\u4f55\u53d8\u5316\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\nx = jnp.linspace(-3, 3, 300)\n\nfig, axes = plt.subplots(1, 3, figsize=(12, 3))\naxes[0].plot(x, x**2, color=\"#e74c3c\")\naxes[0].set_title(\"x\u00b2  (\u629b\u7269\u7ebf)\")\naxes[1].plot(x, jnp.sin(x), color=\"#3498db\")\naxes[1].set_title(\"sin(x)  (\u6ce2\u5f62)\")\naxes[2].plot(x, jnp.exp(x), color=\"#27ae60\")\naxes[2].set_title(\"e\u02e3  (\u6307\u6570\u51fd\u6570)\")\nfor ax in axes:\n    ax.axhline(0, color=\"gray\", linewidth=0.5)\n    ax.axvline(0, color=\"gray\", linewidth=0.5)\nplt.tight_layout()\nplt.show()\n</code></pre></p> </li> <li> <p>\u4f7f\u7528 JAX \u7684\u81ea\u52a8\u5fae\u5206\u8ba1\u7b97 \\(f(x) = x^3 - 2x + 1\\) \u5728\u82e5\u5e72\u70b9\u5904\u7684\u5bfc\u6570\uff0c\u5e76\u4e0e\u89e3\u6790\u5bfc\u6570 \\(f'(x) = 3x^2 - 2\\) \u8fdb\u884c\u6bd4\u8f83\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\nf = lambda x: x**3 - 2*x + 1\ndf = jax.grad(f)\n\nfor x in [0.0, 1.0, 2.0, -1.0]:\n    print(f\"x={x:5.1f}  \u81ea\u52a8\u5fae\u5206: {df(x):.4f}  \u89e3\u6790\u89e3: {3*x**2 - 2:.4f}\")\n</code></pre></p> </li> <li> <p>\u6570\u503c\u9a8c\u8bc1\u94fe\u5f0f\u6cd5\u5219\u3002\u5b9a\u4e49 \\(f(x) = \\sin(x^2)\\)\uff0c\u901a\u8fc7 <code>jax.grad</code> \u8ba1\u7b97\u5176\u5bfc\u6570\uff0c\u5e76\u4e0e\u89e3\u6790\u7ed3\u679c \\(2x\\cos(x^2)\\) \u8fdb\u884c\u6bd4\u8f83\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\nf = lambda x: jnp.sin(x**2)\ndf = jax.grad(f)\n\nfor x in [0.5, 1.0, 2.0]:\n    auto = df(x)\n    analytical = 2*x * jnp.cos(x**2)\n    print(f\"x={x:.1f}  \u81ea\u52a8\u5fae\u5206: {auto:.6f}  \u89e3\u6790\u89e3: {analytical:.6f}\")\n</code></pre></p> </li> <li> <p>\u53ef\u89c6\u5316\u5bfc\u6570\u3002\u5c06 \\(f(x) = x^3 - 3x\\) \u4e0e\u5176\u5bfc\u6570 \\(f'(x) = 3x^2 - 3\\) \u7ed8\u5236\u5728\u540c\u4e00\u5f20\u56fe\u4e0a\u3002\u89c2\u5bdf \\(f'(x) = 0\\) \u7684\u4f4d\u7f6e\u4e0e \\(f\\) \u7684\u5cf0\u8c37\u4e4b\u95f4\u7684\u5bf9\u5e94\u5173\u7cfb\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\nf = lambda x: x**3 - 3*x\n# jax.grad \u7528\u4e8e\u6807\u91cf\uff1bjax.vmap \u5c06\u5176\u5411\u91cf\u5316\uff0c\u53ef\u540c\u65f6\u5904\u7406\u4e00\u7ec4\u8f93\u5165\ndf = jax.vmap(jax.grad(f))\n\nx = jnp.linspace(-2.5, 2.5, 200)\nplt.plot(x, jax.vmap(f)(x), label=\"f(x)\")\nplt.plot(x, df(x), label=\"f'(x)\", linestyle=\"--\")\nplt.axhline(0, color=\"gray\", linewidth=0.5)\nplt.legend()\nplt.title(\"\u51fd\u6570\u53ca\u5176\u5bfc\u6570\")\nplt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2003%3A%20calculus/02.%20integral%20calculus/","title":"\u79ef\u5206\u5b66","text":"<p>\u79ef\u5206\u5b66\u5728\u533a\u95f4\u4e0a\u7d2f\u79ef\u91cf\uff0c\u5c06\u5c40\u90e8\u53d8\u5316\u7387\u8fd8\u539f\u4e3a\u603b\u91cf\u3002\u672c\u6587\u6db5\u76d6\u5b9a\u79ef\u5206\u4e0e\u4e0d\u5b9a\u79ef\u5206\u3001\u5fae\u79ef\u5206\u57fa\u672c\u5b9a\u7406\u3001\u79ef\u5206\u6280\u5de7\uff0c\u4ee5\u53ca\u5728\u673a\u5668\u5b66\u4e60\u4e2d\u4e0e\u6982\u7387\u5bc6\u5ea6\u548c\u671f\u671b\u503c\u7684\u5e94\u7528\u3002</p> <ul> <li> <p>\u5fae\u5206\u544a\u8bc9\u6211\u4eec\u5355\u4e2a\u70b9\u7684\u53d8\u5316\u7387\u3002\u79ef\u5206\u5219\u76f8\u53cd\uff1a\u5b83\u5c06\u8bb8\u591a\u5fae\u5c0f\u7247\u6bb5\u7d2f\u79ef\u8d77\u6765\uff0c\u8ba1\u7b97\u51fa\u4e00\u4e2a\u603b\u91cf\u3002</p> </li> <li> <p>\u5982\u679c\u5bfc\u6570\u56de\u7b54\u7684\u662f\"\u591a\u5feb\uff1f\"\uff0c\u90a3\u4e48\u79ef\u5206\u56de\u7b54\u7684\u662f\"\u591a\u5c11\uff1f\"</p> </li> <li> <p>\u7406\u89e3\u79ef\u5206\u6700\u7b80\u5355\u7684\u65b9\u5f0f\u662f\u5c06\u5176\u89c6\u4e3a\u66f2\u7ebf\u4e0b\u7684\u9762\u79ef\u3002\u5982\u679c\u7ed8\u5236\u51fa\u51fd\u6570 \\(f(x)\\) \u7684\u56fe\u50cf\uff0c\u5e76\u5c06\u4ece \\(x = a\\) \u5230 \\(x = b\\) \u4e4b\u95f4\u66f2\u7ebf\u4e0e x \u8f74\u4e4b\u95f4\u7684\u533a\u57df\u6d82\u4e0a\u9634\u5f71\uff0c\u79ef\u5206\u7ed9\u51fa\u7684\u5c31\u662f\u8be5\u533a\u57df\u7684\u6709\u7b26\u53f7\u9762\u79ef\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u4e3a\u4ec0\u4e48\u662f\"\u6709\u7b26\u53f7\"\u7684\uff1f\u5728 x \u8f74\u4e0a\u65b9\u7684\u533a\u57df\u8d21\u732e\u6b63\u9762\u79ef\uff0c\u5728\u4e0b\u65b9\u7684\u533a\u57df\u8d21\u732e\u8d1f\u9762\u79ef\u3002\u8fd9\u5728\u7269\u7406\u4e0a\u662f\u6709\u610f\u4e49\u7684\uff1a\u5982\u679c \\(f(x)\\) \u4ee3\u8868\u901f\u5ea6\uff0c\u79ef\u5206\u7ed9\u51fa\u7684\u662f\u51c0\u4f4d\u79fb\uff08\u6b63\u5411\u51cf\u53bb\u53cd\u5411\uff09\uff0c\u800c\u4e0d\u662f\u603b\u8def\u7a0b\u3002</p> </li> <li> <p>\u4e3a\u4e86\u8ba1\u7b97\u8fd9\u4e2a\u9762\u79ef\uff0c\u60f3\u8c61\u5c06\u533a\u57df\u5207\u6210 \\(n\\) \u4e2a\u7ec6\u957f\u7684\u7ad6\u76f4\u77e9\u5f62\uff0c\u6bcf\u4e2a\u77e9\u5f62\u7684\u5bbd\u5ea6\u4e3a \\(\\Delta x\\)\u3002\u6bcf\u4e2a\u77e9\u5f62\u7684\u9ad8\u5ea6\u662f\u8be5\u5207\u7247\u5185\u67d0\u4e00\u70b9\u7684\u51fd\u6570\u503c\u3002\u5c06\u5b83\u4eec\u6c42\u548c\uff1a</p> </li> </ul> \\[\\text{\u9762\u79ef} \\approx \\sum_{i=1}^{n} f(x_i^\\ast) \\, \\Delta x\\] <ul> <li>\u5f53\u6211\u4eec\u8ba9\u77e9\u5f62\u8d8a\u6765\u8d8a\u8584\u65f6\uff08\\(n \\to \\infty\\)\uff0c\\(\\Delta x \\to 0\\)\uff09\uff0c\u8fd9\u4e2a\u548c\u5c31\u53d8\u5f97\u7cbe\u786e\u3002\u8fd9\u4e2a\u6781\u9650\u8fc7\u7a0b\u5b9a\u4e49\u4e86\u5b9a\u79ef\u5206\uff1a</li> </ul> \\[\\int_a^b f(x)\\, dx = \\lim_{n \\to \\infty} \\sum_{i=1}^{n} f(x_i^\\ast) \\, \\Delta x\\] <ul> <li> <p>\\(\\int\\) \u7b26\u53f7\u662f\u62c9\u957f\u7684\"S\"\uff0c\u4ee3\u8868\"\u6c42\u548c\"\uff08Sum\uff09\u3002\\(dx\\) \u63d0\u9192\u6211\u4eec\uff0c\u6211\u4eec\u662f\u5728\u6cbf x \u8f74\u65b9\u5411\u5bf9\u65e0\u7a77\u8584\u7684\u5207\u7247\u6c42\u548c\u3002</p> </li> <li> <p>\u4e0d\u5b9a\u79ef\u5206\uff08\u6216\u539f\u51fd\u6570\uff09\u662f\u4e00\u4e2a\u51fd\u6570 \\(F(x)\\)\uff0c\u5176\u5bfc\u6570\u4e3a \\(f(x)\\)\u3002\u6211\u4eec\u5199\u4f5c\uff1a</p> </li> </ul> \\[\\int f(x)\\, dx = F(x) + C\\] <ul> <li> <p>\\(+ C\\) \u662f\u79ef\u5206\u5e38\u6570\u3002\u56e0\u4e3a\u4efb\u4f55\u5e38\u6570\u7684\u5bfc\u6570\u90fd\u662f\u96f6\uff0c\u6240\u4ee5\u5b58\u5728\u65e0\u7a77\u591a\u4e2a\u4ec5\u76f8\u5dee\u4e00\u4e2a\u5e38\u6570\u7684\u539f\u51fd\u6570\u3002\u4f8b\u5982\uff0c\\(\\int 2x\\, dx = x^2 + C\\)\uff0c\u56e0\u4e3a \\(x^2 + 7\\) \u6216 \\(x^2 - 3\\) \u7684\u5bfc\u6570\u4ecd\u7136\u662f \\(2x\\)\u3002</p> </li> <li> <p>\u5fae\u79ef\u5206\u57fa\u672c\u5b9a\u7406\u662f\u8fde\u63a5\u5fae\u5206\u4e0e\u79ef\u5206\u7684\u6865\u6881\u3002\u5b83\u5305\u542b\u4e24\u90e8\u5206\uff1a</p> </li> <li> <p>\u7b2c\u4e00\u90e8\u5206\uff1a\u5982\u679c \\(F(x)\\) \u662f \\(f(x)\\) \u7684\u4e00\u4e2a\u539f\u51fd\u6570\uff0c\u90a3\u4e48\u5b9a\u79ef\u5206\u7b49\u4e8e \\(F\\) \u5728\u7aef\u70b9\u5904\u7684\u503c\u4e4b\u5dee\uff1a</p> </li> </ul> \\[\\int_a^b f(x)\\, dx = F(b) - F(a)\\] <ul> <li> <p>\u8fd9\u975e\u5e38\u5b9e\u7528\u3002\u6211\u4eec\u4e0d\u518d\u9700\u8981\u8ba1\u7b97\u4e00\u4e2a\u548c\u7684\u6781\u9650\uff08\u8fd9\u5f88\u56f0\u96be\uff09\uff0c\u800c\u662f\u627e\u5230\u4e00\u4e2a\u539f\u51fd\u6570\u5e76\u5728\u4e24\u70b9\u5904\u6c42\u503c\uff08\u8fd9\u901a\u5e38\u5f88\u7b80\u5355\uff09\u3002</p> </li> <li> <p>\u7b2c\u4e8c\u90e8\u5206\uff1a\u5982\u679c\u6211\u4eec\u5b9a\u4e49 \\(F(x) = \\int_a^x f(t)\\, dt\\)\uff0c\u90a3\u4e48 \\(F'(x) = f(x)\\)\u3002\u5fae\u5206\u4e0e\u79ef\u5206\u662f\u4e92\u9006\u8fd0\u7b97\uff0c\u5b83\u4eec\u76f8\u4e92\u62b5\u6d88\u3002</p> </li> <li> <p>\u4f8b\u5982\uff0c\u8ba1\u7b97 \\(\\int_1^3 x^2\\, dx\\)\uff1a\\(x^2\\) \u7684\u539f\u51fd\u6570\u662f \\(\\frac{x^3}{3}\\)\u3002\u6240\u4ee5 \\(\\int_1^3 x^2\\, dx = \\frac{27}{3} - \\frac{1}{3} = \\frac{26}{3} \\approx 8.67\\)\u3002</p> </li> <li> <p>\u6b63\u5982\u5fae\u5206\u6709\u8fd0\u7b97\u6cd5\u5219\u4e00\u6837\uff0c\u79ef\u5206\u4e5f\u6709\u76f8\u5e94\u7684\u9006\u5411\u8fd0\u7b97\u6cd5\u5219\uff1a</p> </li> </ul> \u51fd\u6570 \u79ef\u5206 \u6761\u4ef6 \\(x^n\\) \\(\\frac{x^{n+1}}{n+1} + C\\) \\(n \\neq -1\\) \\(\\frac{1}{x}\\) \\(\\ln\\|x\\| + C\\) \\(e^x\\) \\(e^x + C\\) \\(a^x\\) \\(\\frac{a^x}{\\ln a} + C\\) \\(\\sin x\\) \\(-\\cos x + C\\) \\(\\cos x\\) \\(\\sin x + C\\) \\(k\\)\uff08\u5e38\u6570\uff09 \\(kx + C\\) <ul> <li> <p>\u548c/\u5dee\u6cd5\u5219\u540c\u6837\u9002\u7528\uff1a\\(\\int [f(x) \\pm g(x)]\\, dx = \\int f(x)\\, dx \\pm \\int g(x)\\, dx\\)\u3002\u5e38\u6570\u53ef\u4ee5\u63d0\u51fa\u6765\uff1a\\(\\int k\\, f(x)\\, dx = k \\int f(x)\\, dx\\)\u3002</p> </li> <li> <p>\u5f53\u4e00\u4e2a\u51fd\u6570\u592a\u590d\u6742\u800c\u65e0\u6cd5\u76f4\u63a5\u79ef\u5206\u65f6\uff0c\u6211\u4eec\u6709\u7b80\u5316\u5b83\u7684\u6280\u5de7\u3002</p> </li> <li> <p>\u6362\u5143\u79ef\u5206\u6cd5\uff08u \u4ee3\u6362\uff09\u662f\u94fe\u5f0f\u6cd5\u5219\u7684\u9006\u8fc7\u7a0b\u3002\u5982\u679c\u53d1\u73b0\u4e00\u4e2a\u590d\u5408\u51fd\u6570 \\(f(g(x))\\) \u4e58\u4ee5 \\(g'(x)\\)\uff0c\u5219\u4ee4 \\(u = g(x)\\)\uff0c\u4e8e\u662f \\(du = g'(x)\\, dx\\)\uff0c\u79ef\u5206\u5f97\u4ee5\u7b80\u5316\u3002</p> </li> <li> <p>\u4f8b\u5982\uff1a\\(\\int 2x \\cos(x^2)\\, dx\\)\u3002\u4ee4 \\(u = x^2\\)\uff0c\u5219 \\(du = 2x\\, dx\\)\u3002\u79ef\u5206\u53d8\u4e3a \\(\\int \\cos(u)\\, du = \\sin(u) + C = \\sin(x^2) + C\\)\u3002</p> </li> <li> <p>\u5206\u90e8\u79ef\u5206\u6cd5\u662f\u4e58\u79ef\u6cd5\u5219\u7684\u9006\u8fc7\u7a0b\u3002\u5982\u679c\u88ab\u79ef\u51fd\u6570\u662f\u4e24\u4e2a\u51fd\u6570\u7684\u4e58\u79ef\uff1a</p> </li> </ul> \\[\\int u\\, dv = uv - \\int v\\, du\\] <ul> <li> <p>\u7b56\u7565\u6027\u5730\u9009\u62e9 \\(u\\) \u548c \\(dv\\)\uff0c\u4f7f\u5f97\u5269\u4e0b\u7684\u79ef\u5206 \\(\\int v\\, du\\) \u6bd4\u539f\u6765\u7684\u66f4\u7b80\u5355\u3002\u9009\u62e9 \\(u\\) \u7684\u5e38\u7528\u52a9\u8bb0\u6cd5\u662f LIATE\uff1a\u5bf9\u6570\u51fd\u6570\uff08Logarithmic\uff09\u3001\u53cd\u4e09\u89d2\u51fd\u6570\uff08Inverse trig\uff09\u3001\u4ee3\u6570\u51fd\u6570\uff08Algebraic\uff09\u3001\u4e09\u89d2\u51fd\u6570\uff08Trigonometric\uff09\u3001\u6307\u6570\u51fd\u6570\uff08Exponential\uff09\uff08\u4f18\u5148\u4ece\u9760\u524d\u7684\u7c7b\u522b\u4e2d\u9009\u62e9 \\(u\\)\uff09\u3002</p> </li> <li> <p>\u4f8b\u5982\uff1a\\(\\int x\\, e^x\\, dx\\)\u3002\u4ee4 \\(u = x\\)\uff08\u4ee3\u6570\u51fd\u6570\uff09\u548c \\(dv = e^x\\, dx\\)\u3002\u5219 \\(du = dx\\)\uff0c\\(v = e^x\\)\u3002\u56e0\u6b64\uff1a\\(\\int x\\, e^x\\, dx = x\\, e^x - \\int e^x\\, dx = x\\, e^x - e^x + C = e^x(x - 1) + C\\)\u3002</p> </li> <li> <p>\u5728\u673a\u5668\u5b66\u4e60\u4e2d\uff0c\u79ef\u5206\u51fa\u73b0\u5728\u6982\u7387\u8bba\u4e2d\uff08\u901a\u8fc7\u5bf9\u5bc6\u5ea6\u51fd\u6570\u79ef\u5206\u6765\u8ba1\u7b97\u6982\u7387\uff09\u3001\u671f\u671b\u503c\u4e2d\uff08\u8fde\u7eed\u5206\u5e03\u4e0a\u7684\u52a0\u6743\u5e73\u5747\uff09\uff0c\u4ee5\u53ca\u8ba1\u7b97 ROC \u66f2\u7ebf\u4e0b\u7684\u9762\u79ef\u3002\u867d\u7136\u5728\u5b9e\u9645\u4e2d\u6211\u4eec\u5f88\u5c11\u624b\u52a8\u79ef\u5206\uff0c\u4f46\u7406\u89e3\u79ef\u5206\u7684\u542b\u4e49\u6709\u52a9\u4e8e\u89e3\u91ca\u8fd9\u4e9b\u91cf\u3002</p> </li> </ul>"},{"location":"chapter%2003%3A%20calculus/02.%20integral%20calculus/#colab-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ol> <li> <p>\u4f7f\u7528\u9ece\u66fc\u548c\uff0c\u7528\u4e0d\u65ad\u589e\u52a0\u6570\u91cf\u7684\u77e9\u5f62\u6765\u6570\u503c\u903c\u8fd1 \\(\\int_0^1 x^2\\, dx\\)\u3002\u4e0e\u7cbe\u786e\u7b54\u6848 \\(\\frac{1}{3}\\) \u8fdb\u884c\u6bd4\u8f83\u3002 <pre><code>import jax.numpy as jnp\n\nfor n in [10, 100, 1000, 10000]:\n    x = jnp.linspace(0, 1, n, endpoint=False)\n    dx = 1.0 / n\n    area = jnp.sum(x**2 * dx)\n    print(f\"n={n:5d}  approx: {area:.6f}  exact: {1/3:.6f}\")\n</code></pre></p> </li> <li> <p>\u6570\u503c\u9a8c\u8bc1\u5fae\u79ef\u5206\u57fa\u672c\u5b9a\u7406\u3002\u5b9a\u4e49 \\(F(x) = \\int_0^x t^2\\, dt = \\frac{x^3}{3}\\)\uff0c\u5e76\u9a8c\u8bc1\u5176\u5bfc\u6570\uff08\u901a\u8fc7 <code>jax.grad</code> \u8ba1\u7b97\uff09\u7b49\u4e8e \\(x^2\\)\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\nF = lambda x: x**3 / 3\ndF = jax.grad(F)\n\nfor x in [0.5, 1.0, 2.0, 3.0]:\n    print(f\"x={x:.1f}  F'(x)={dF(x):.4f}  x^2={x**2:.4f}\")\n</code></pre></p> </li> <li> <p>\u53ef\u89c6\u5316 \\(f(x) = \\sin(x)\\) \u4ece \\(0\\) \u5230 \\(\\pi\\) \u7684\u66f2\u7ebf\u4e0b\u9762\u79ef\u3002\u4f7f\u7528 <code>plt.fill_between</code> \u586b\u5145\u8be5\u533a\u57df\uff0c\u5e76\u7528\u9ece\u66fc\u548c\u6570\u503c\u8ba1\u7b97\u9762\u79ef\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\nx = jnp.linspace(0, jnp.pi, 500)\ny = jnp.sin(x)\n\nplt.plot(x, y, color=\"purple\", linewidth=2)\nplt.fill_between(x, y, alpha=0.2, color=\"purple\")\nplt.title(f\"Area = {jnp.sum(jnp.sin(x) * (jnp.pi / 500)):.4f}  (exact: 2.0)\")\nplt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2003%3A%20calculus/03.%20multivariate%20calculus/","title":"\u591a\u5143\u5fae\u79ef\u5206","text":"<p>\u591a\u5143\u5fae\u79ef\u5206\u5c06\u5bfc\u6570\u548c\u79ef\u5206\u6269\u5c55\u5230\u591a\u53d8\u91cf\u51fd\u6570\uff0c\u8fd9\u5bf9\u4e8e\u673a\u5668\u5b66\u4e60\u6a21\u578b\u62e5\u6709\u6570\u767e\u4e07\u53c2\u6570\u7684\u60c5\u5f62\u81f3\u5173\u91cd\u8981\u3002\u672c\u7ae0\u6db5\u76d6\u504f\u5bfc\u6570\u3001\u68af\u5ea6\u3001\u96c5\u53ef\u6bd4\u77e9\u9635\u3001\u6d77\u68ee\u77e9\u9635\u4ee5\u53ca\u4f7f\u53cd\u5411\u4f20\u64ad\u6210\u4e3a\u53ef\u80fd\u7684\u591a\u53d8\u91cf\u94fe\u5f0f\u6cd5\u5219\u3002</p> <ul> <li> <p>\u5230\u76ee\u524d\u4e3a\u6b62\uff0c\u6211\u4eec\u7684\u51fd\u6570\u90fd\u53ea\u63a5\u53d7\u5355\u4e2a\u8f93\u5165 \\(x\\) \u5e76\u4ea7\u751f\u5355\u4e2a\u8f93\u51fa \\(f(x)\\)\u3002\u4f46\u5728\u673a\u5668\u5b66\u4e60\u4e2d\uff0c\u6211\u4eec\u51e0\u4e4e\u4ece\u4e0d\u53ea\u5904\u7406\u4e00\u4e2a\u53d8\u91cf\u3002</p> </li> <li> <p>\u8003\u8651\u4e00\u4e2a\u53cc\u53d8\u91cf\u51fd\u6570\uff0c\u4f8b\u5982 \\(f(x, y) = x^2 + y^2\\)\u3002\u5b83\u5728\u4e09\u7ef4\u7a7a\u95f4\u4e2d\u5b9a\u4e49\u4e86\u4e00\u4e2a\u66f2\u9762\uff0c\u5f62\u72b6\u50cf\u4e00\u4e2a\u7897\u3002\u6211\u4eec\u60f3\u77e5\u9053\uff1a\u5982\u679c\u6211\u4eec\u5728\u4fdd\u6301 \\(y\\) \u56fa\u5b9a\u7684\u540c\u65f6\u7a0d\u5fae\u8c03\u6574 \\(x\\)\uff0c\\(f\\) \u4f1a\u5982\u4f55\u53d8\u5316\uff1f\u8fd9\u5c31\u662f\u504f\u5bfc\u6570\u3002</p> </li> <li> <p>\\(f\\) \u5bf9 \\(x\\) \u7684\u504f\u5bfc\u6570\uff0c\u8bb0\u4f5c \\(\\frac{\\partial f}{\\partial x}\\)\uff0c\u5c06\u5176\u4ed6\u6240\u6709\u53d8\u91cf\u89c6\u4e3a\u5e38\u6570\uff0c\u7136\u540e\u5bf9 \\(x\\) \u6b63\u5e38\u6c42\u5bfc\u3002</p> </li> <li> <p>\u5bf9\u4e8e \\(f(x, y) = x^2y + 3x - 2y\\)\uff1a</p> </li> </ul> \\[\\frac{\\partial f}{\\partial x} = 2xy + 3 \\qquad \\frac{\\partial f}{\\partial y} = x^2 - 2\\] <ul> <li> <p>\u8ba1\u7b97 \\(\\frac{\\partial f}{\\partial x}\\) \u65f6\uff0c\u6211\u4eec\u5c06 \\(y\\) \u89c6\u4e3a\u5e38\u6570\uff0c\u56e0\u6b64 \\(x^2y\\) \u6c42\u5bfc\u5f97 \\(2xy\\)\uff0c\\(3x\\) \u6c42\u5bfc\u5f97 \\(3\\)\uff0c\\(-2y\\) \u6c42\u5bfc\u5f97 \\(0\\)\u3002</p> </li> <li> <p>\u8ba1\u7b97 \\(\\frac{\\partial f}{\\partial y}\\) \u65f6\uff0c\u6211\u4eec\u5c06 \\(x\\) \u89c6\u4e3a\u5e38\u6570\uff0c\u56e0\u6b64 \\(x^2y\\) \u6c42\u5bfc\u5f97 \\(x^2\\)\uff0c\\(3x\\) \u6c42\u5bfc\u5f97 \\(0\\)\uff0c\\(-2y\\) \u6c42\u5bfc\u5f97 \\(-2\\)\u3002</p> </li> <li> <p>\u4ece\u51e0\u4f55\u4e0a\u770b\uff0c\u5bf9 \\(x\\) \u6c42\u504f\u5bfc\u6570\u5c31\u50cf\u7528\u4e00\u4e2a\u5e73\u884c\u4e8e \\(xz\\) \u5e73\u9762\u7684\u5e73\u9762\uff08\u5728\u56fa\u5b9a\u7684 \\(y\\) \u503c\u5904\uff09\u5207\u5272\u4e09\u7ef4\u66f2\u9762\uff0c\u7136\u540e\u6c42\u6240\u5f97\u66f2\u7ebf\u7684\u659c\u7387\u3002</p> </li> </ul> <p></p> <ul> <li>\u68af\u5ea6\u5c06\u6240\u6709\u504f\u5bfc\u6570\u6536\u96c6\u5230\u4e00\u4e2a\u5411\u91cf\u4e2d\uff1a</li> </ul> \\[\\nabla f = \\left(\\frac{\\partial f}{\\partial x_1}, \\frac{\\partial f}{\\partial x_2}, \\ldots, \\frac{\\partial f}{\\partial x_n}\\right)\\] <ul> <li> <p>\u5bf9\u4e8e \\(f(x, y) = x^2 + y^2\\)\uff1a\\(\\nabla f(x, y) = (2x, 2y)\\)\u3002\u5728\u70b9 \\((1, 2)\\) \u5904\uff1a\\(\\nabla f(1, 2) = (2, 4)\\)\u3002</p> </li> <li> <p>\u68af\u5ea6\u6709\u4e24\u4e2a\u5173\u952e\u6027\u8d28\uff1a</p> <ul> <li> <p>\u65b9\u5411\uff1a\u5b83\u6307\u5411\u4e0a\u5347\u6700\u9661\u7684\u65b9\u5411\u3002\u60f3\u8c61\u4e00\u4f4d\u767b\u5c71\u8005\u5728\u5c71\u4e0a\u3002\u4ed6\u4eec\u6240\u5728\u4f4d\u7f6e\u7684\u68af\u5ea6\u6307\u5411\u6b63\u4e0a\u65b9\uff0c\u6cbf\u7740\u6700\u9661\u7684\u8def\u5f84\u3002</p> </li> <li> <p>\u5927\u5c0f\uff1a\\(\\|\\nabla f\\|\\) \u7ed9\u51fa\u4e86\u6700\u9661\u65b9\u5411\u4e0a\u7684\u53d8\u5316\u7387\u3002\u68af\u5ea6\u5927\u610f\u5473\u7740\u5730\u5f62\u9661\u5ced\uff1b\u68af\u5ea6\u5c0f\u610f\u5473\u7740\u5730\u5f62\u8fd1\u4e4e\u5e73\u5766\u3002</p> </li> </ul> </li> </ul> <p></p> <ul> <li> <p>\u7531\u4e8e\u68af\u5ea6\u6307\u5411\u4e0a\u5761\uff0c\u6cbf\u76f8\u53cd\u65b9\u5411\uff08\\(-\\nabla f\\)\uff09\u79fb\u52a8\u5c31\u662f\u4e0b\u5761\uff0c\u8d70\u5411\u66f4\u4f4e\u7684\u503c\u3002\u8fd9\u4e2a\u7b80\u5355\u7684\u60f3\u6cd5\u662f\u68af\u5ea6\u4e0b\u964d\u7684\u57fa\u7840\uff0c\u6211\u4eec\u5c06\u5728\u540e\u7eed\u7ae0\u8282\u4e2d\u8be6\u7ec6\u63a2\u8ba8\u8fd9\u79cd\u4f18\u5316\u6280\u672f\u3002\u73b0\u5728\uff0c\u5173\u952e\u8981\u70b9\u662f\uff1a\u68af\u5ea6\u544a\u8bc9\u4f60\u54ea\u4e2a\u65b9\u5411\u662f\"\u4e0a\u5761\"\uff0c\u4ee5\u53ca\u6500\u767b\u7684\u9661\u5ced\u7a0b\u5ea6\u3002</p> </li> <li> <p>\u65b9\u5411\u5bfc\u6570\u63a8\u5e7f\u4e86\u504f\u5bfc\u6570\u3002\u5b83\u4e0d\u95ee\"\\(f\\) \u6cbf \\(x\\) \u8f74\u5982\u4f55\u53d8\u5316\uff1f\"\uff0c\u800c\u662f\u95ee\"\\(f\\) \u6cbf\u4efb\u610f\u65b9\u5411 \\(\\mathbf{u}\\) \u5982\u4f55\u53d8\u5316\uff1f\"\u5b83\u901a\u8fc7\u68af\u5ea6\u4e0e\u5355\u4f4d\u5411\u91cf\u7684\u70b9\u79ef\u6765\u8ba1\u7b97\uff1a</p> </li> </ul> \\[D_{\\mathbf{u}} f = \\nabla f \\cdot \\mathbf{u}\\] <ul> <li> <p>\u5bf9\u4e8e \\(f(x, y) = x^2 + y^2\\) \u5728\u70b9 \\((1, 2)\\) \u5904\uff0c\u6cbf\u65b9\u5411 \\(\\mathbf{v} = (3, 4)\\)\uff1a\u9996\u5148\u5f52\u4e00\u5316\u5f97\u5230 \\(\\mathbf{u} = (3/5, 4/5)\\)\uff0c\u7136\u540e \\(D_{\\mathbf{u}} f = (2, 4) \\cdot (3/5, 4/5) = 6/5 + 16/5 = 22/5\\)\u3002</p> </li> <li> <p>\u504f\u5bfc\u6570\u662f\u65b9\u5411\u5bfc\u6570\u7684\u7279\u4f8b\uff0c\u5176\u4e2d\u65b9\u5411\u6cbf\u7740\u5750\u6807\u8f74\u3002\u5982\u679c\u65b9\u5411\u5bfc\u6570\u5728\u67d0\u4e2a\u65b9\u5411\u4e0a\u4e3a\u96f6\uff0c\u5219\u51fd\u6570\u5728\u8be5\u70b9\u6cbf\u8be5\u65b9\u5411\u662f\u5e73\u5766\u7684\u3002</p> </li> <li> <p>\u7b49\u9ad8\u7ebf\uff08\u6216\u6c34\u5e73\u66f2\u7ebf\uff09\u8fde\u63a5\u51fd\u6570\u503c\u76f8\u7b49\u7684\u70b9\u3002\u5bf9\u4e8e \\(f(x, y) = x^2 + y^2\\)\uff0c\u7b49\u9ad8\u7ebf\u662f\u4ee5\u539f\u70b9\u4e3a\u4e2d\u5fc3\u7684\u5706\uff1a\u5bf9\u5e94\u4e0d\u540c \\(c\\) \u503c\u7684 \\(x^2 + y^2 = c\\)\u3002</p> </li> <li> <p>\u7b49\u9ad8\u7ebf\u6c38\u4e0d\u76f8\u4ea4\uff08\u4e00\u4e2a\u70b9\u4e0d\u53ef\u80fd\u6709\u4e24\u4e2a\u4e0d\u540c\u7684\u51fd\u6570\u503c\uff09\u3002</p> </li> <li> <p>\u68af\u5ea6\u59cb\u7ec8\u5782\u76f4\u4e8e\u7b49\u9ad8\u7ebf\uff0c\u4ece\u4f4e\u503c\u6307\u5411\u9ad8\u503c\u3002</p> </li> <li> <p>\u7b49\u9ad8\u7ebf\u5bc6\u96c6\u8868\u793a\u5730\u5f62\u9661\u5ced\uff1b\u7b49\u9ad8\u7ebf\u7a00\u758f\u8868\u793a\u5761\u5ea6\u5e73\u7f13\u3002</p> </li> <li> <p>\u5230\u76ee\u524d\u4e3a\u6b62\uff0c\u6211\u4eec\u7684\u51fd\u6570\u90fd\u53ea\u4ea7\u751f\u5355\u4e2a\u8f93\u51fa\u3002\u4f46\u8bb8\u591a\u51fd\u6570\u4f1a\u4ea7\u751f\u591a\u4e2a\u8f93\u51fa\u3002\u51fd\u6570 \\(\\mathbf{F}: \\mathbb{R}^n \\to \\mathbb{R}^m\\) \u63a5\u6536 \\(n\\) \u4e2a\u8f93\u5165\u5e76\u4ea7\u751f \\(m\\) \u4e2a\u8f93\u51fa\u3002\u96c5\u53ef\u6bd4\u77e9\u9635\u7ec4\u7ec7\u4e86\u8fd9\u6837\u4e00\u4e2a\u5411\u91cf\u503c\u51fd\u6570\u7684\u6240\u6709\u504f\u5bfc\u6570\uff1a</p> </li> </ul> \\[ J = \\begin{bmatrix} \\frac{\\partial f_1}{\\partial x_1} &amp; \\cdots &amp; \\frac{\\partial f_1}{\\partial x_n} \\\\ \\vdots &amp; \\ddots &amp; \\vdots \\\\ \\frac{\\partial f_m}{\\partial x_1} &amp; \\cdots &amp; \\frac{\\partial f_m}{\\partial x_n} \\end{bmatrix} \\] <ul> <li> <p>\u96c5\u53ef\u6bd4\u77e9\u9635\u7684\u6bcf\u4e00\u884c\u662f\u4e00\u4e2a\u8f93\u51fa\u5206\u91cf\u7684\u68af\u5ea6\u3002\u5bf9\u4e8e\u4e00\u4e2a\u6709 3 \u4e2a\u8f93\u5165\u548c 2 \u4e2a\u8f93\u51fa\u7684\u51fd\u6570\uff0c\u96c5\u53ef\u6bd4\u77e9\u9635\u662f\u4e00\u4e2a \\(2 \\times 3\\) \u77e9\u9635\u3002</p> </li> <li> <p>\u96c5\u53ef\u6bd4\u77e9\u9635\u5c06\u5bfc\u6570\u63a8\u5e7f\u5230\u5411\u91cf\u503c\u51fd\u6570\u3002</p> </li> <li> <p>\u5c31\u50cf\u6807\u91cf\u51fd\u6570\u7684\u5bfc\u6570\u544a\u8bc9\u4f60\u6bcf\u5355\u4f4d\u8f93\u5165\u53d8\u5316\u5bf9\u5e94\u7684\u8f93\u51fa\u53d8\u5316\u91cf\u4e00\u6837\uff0c\u96c5\u53ef\u6bd4\u77e9\u9635\u544a\u8bc9\u4f60\u6bcf\u4e2a\u8f93\u51fa\u76f8\u5bf9\u4e8e\u6bcf\u4e2a\u8f93\u5165\u7684\u53d8\u5316\u60c5\u51b5\u3002</p> </li> <li> <p>\u96c5\u53ef\u6bd4\u884c\u5217\u5f0f\u8861\u91cf\u4e00\u4e2a\u53d8\u6362\u5c40\u90e8\u62c9\u4f38\u6216\u538b\u7f29\u7a7a\u95f4\u7684\u7a0b\u5ea6\u3002</p> </li> <li> <p>\u5982\u679c\u884c\u5217\u5f0f\u4e3a 2\uff0c\u5c0f\u533a\u57df\u7684\u9762\u79ef\u52a0\u500d\u3002\u5982\u679c\u884c\u5217\u5f0f\u4e3a 0\uff0c\u8be5\u53d8\u6362\u5c06\u7a7a\u95f4\u538b\u7f29\u5230\u66f4\u4f4e\u7ef4\u5ea6\uff08\u56de\u60f3\u6211\u4eec\u5728\u77e9\u9635\u7ae0\u8282\u4e2d\u5b66\u5230\u7684\uff1a\u884c\u5217\u5f0f\u4e3a\u96f6\u610f\u5473\u7740\u5947\u5f02\u53d8\u6362\uff0c\u4e0d\u53ef\u9006\uff09\u3002</p> </li> <li> <p>\u5f53\u591a\u4e2a\u53d8\u6362\u7ec4\u5408\u5728\u4e00\u8d77\uff08\u4e00\u4e2a\u53d8\u6362\u7684\u8f93\u51fa\u4f5c\u4e3a\u4e0b\u4e00\u4e2a\u53d8\u6362\u7684\u8f93\u5165\uff09\u65f6\uff0c\u6574\u4f53\u6620\u5c04\u7684\u96c5\u53ef\u6bd4\u77e9\u9635\u662f\u5404\u4e2a\u96c5\u53ef\u6bd4\u77e9\u9635\u7684\u4e58\u79ef\u3002\u6211\u4eec\u5c06\u5728\u540e\u7eed\u7ae0\u8282\u4e2d\u770b\u5230\u8fd9\u4e2a\u601d\u60f3\u53d8\u5f97\u81f3\u5173\u91cd\u8981\u3002</p> </li> <li> <p>\u68af\u5ea6\u6355\u83b7\u4e00\u9636\u4fe1\u606f\uff08\u659c\u7387\uff09\uff0c\u800c\u6d77\u68ee\u77e9\u9635\u6355\u83b7\u4e8c\u9636\u4fe1\u606f\uff08\u66f2\u7387\uff09\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u6807\u91cf\u51fd\u6570 \\(f(x_1, \\ldots, x_n)\\)\uff0c\u6d77\u68ee\u77e9\u9635\u662f\u6240\u6709\u4e8c\u9636\u504f\u5bfc\u6570\u7684 \\(n \\times n\\) \u77e9\u9635\uff1a</p> </li> </ul> \\[ H = \\begin{bmatrix} \\frac{\\partial^2 f}{\\partial x_1^2} &amp; \\frac{\\partial^2 f}{\\partial x_1 \\partial x_2} &amp; \\cdots \\\\ \\frac{\\partial^2 f}{\\partial x_2 \\partial x_1} &amp; \\frac{\\partial^2 f}{\\partial x_2^2} &amp; \\cdots \\\\ \\vdots &amp; \\vdots &amp; \\ddots \\end{bmatrix} \\] <ul> <li>\u5bf9\u4e8e \\(f(x, y) = x^3 + 2xy^2 - y^3\\)\uff0c\u68af\u5ea6\u4e3a \\((3x^2 + 2y^2,\\; 4xy - 3y^2)\\)\uff0c\u6d77\u68ee\u77e9\u9635\u4e3a\uff1a</li> </ul> \\[ H = \\begin{bmatrix} 6x &amp; 4y \\\\ 4y &amp; 4x - 6y \\end{bmatrix} \\] <ul> <li> <p>\u5bf9\u89d2\u7ebf\u5143\u7d20\uff08\\(6x\\) \u548c \\(4x - 6y\\)\uff09\u544a\u8bc9\u4f60 \\(x\\) \u65b9\u5411\u7684\u659c\u7387\u968f \\(x\\) \u79fb\u52a8\u5982\u4f55\u53d8\u5316\uff0c\\(y\\) \u65b9\u5411\u540c\u7406\u3002</p> </li> <li> <p>\u975e\u5bf9\u89d2\u7ebf\u5143\u7d20\uff08\\(4y\\)\uff09\u544a\u8bc9\u4f60\u4e00\u4e2a\u65b9\u5411\u7684\u659c\u7387\u968f\u53e6\u4e00\u4e2a\u65b9\u5411\u7684\u79fb\u52a8\u5982\u4f55\u53d8\u5316\u3002</p> </li> <li> <p>\u514b\u83b1\u7f57\u5b9a\u7406\u4fdd\u8bc1\uff1a\u5bf9\u4e8e\u5177\u6709\u8fde\u7eed\u4e8c\u9636\u5bfc\u6570\u7684\u51fd\u6570\uff0c\u6df7\u5408\u504f\u5bfc\u6570\u76f8\u7b49\uff1a\\(\\frac{\\partial^2 f}{\\partial x \\partial y} = \\frac{\\partial^2 f}{\\partial y \\partial x}\\)\u3002</p> </li> <li> <p>\u8fd9\u610f\u5473\u7740\u6d77\u68ee\u77e9\u9635\u662f\u5bf9\u79f0\u7684\uff0c\u8fd9\uff08\u6b63\u5982\u6211\u4eec\u5728\u77e9\u9635\u7ae0\u8282\u4e2d\u770b\u5230\u7684\uff09\u4fdd\u8bc1\u4e86\u5b9e\u7279\u5f81\u503c\u548c\u6b63\u4ea4\u7279\u5f81\u5411\u91cf\u3002</p> </li> <li> <p>\u6d77\u68ee\u77e9\u9635\u544a\u8bc9\u6211\u4eec\u4e34\u754c\u70b9\uff08\u68af\u5ea6\u4e3a\u96f6\u7684\u70b9\uff09\u9644\u8fd1\u51fd\u6570\u7684\u5f62\u72b6\uff1a</p> <ul> <li>\u5982\u679c \\(H\\) \u662f\u6b63\u5b9a\u7684\uff08\u6240\u6709\u7279\u5f81\u503c\u4e3a\u6b63\uff09\uff0c\u5219\u8be5\u70b9\u662f\u5c40\u90e8\u6781\u5c0f\u503c\u70b9\uff0c\u66f2\u9762\u50cf\u7897\u4e00\u6837\u5411\u5404\u4e2a\u65b9\u5411\u5411\u4e0a\u5f2f\u66f2\u3002</li> <li>\u5982\u679c \\(H\\) \u662f\u8d1f\u5b9a\u7684\uff08\u6240\u6709\u7279\u5f81\u503c\u4e3a\u8d1f\uff09\uff0c\u5219\u8be5\u70b9\u662f\u5c40\u90e8\u6781\u5927\u503c\u70b9\uff0c\u66f2\u9762\u50cf\u5012\u6263\u7684\u7897\u4e00\u6837\u5411\u5404\u4e2a\u65b9\u5411\u5411\u4e0b\u5f2f\u66f2\u3002</li> <li>\u5982\u679c \\(H\\) \u540c\u65f6\u5177\u6709\u6b63\u8d1f\u7279\u5f81\u503c\uff0c\u5219\u8be5\u70b9\u662f\u978d\u70b9\uff0c\u66f2\u9762\u5728\u67d0\u4e9b\u65b9\u5411\u4e0a\u5411\u4e0a\u5f2f\u66f2\uff0c\u5728\u53e6\u4e00\u4e9b\u65b9\u5411\u4e0a\u5411\u4e0b\u5f2f\u66f2\uff0c\u5c31\u50cf\u5c71\u5773\u4e00\u6837\u3002</li> </ul> </li> <li> <p>\u591a\u53d8\u91cf\u94fe\u5f0f\u6cd5\u5219\u5c06\u94fe\u5f0f\u6cd5\u5219\u6269\u5c55\u5230\u591a\u53d8\u91cf\u51fd\u6570\u3002\u5982\u679c \\(z = f(x, y)\\)\uff0c\u5176\u4e2d \\(x = g(t)\\) \u4e14 \\(y = h(t)\\)\uff0c\u5219\uff1a</p> </li> </ul> \\[\\frac{dz}{dt} = \\frac{\\partial f}{\\partial x}\\frac{dx}{dt} + \\frac{\\partial f}{\\partial y}\\frac{dy}{dt}\\] <ul> <li> <p>\u4ece \\(t\\) \u5230 \\(z\\) \u7684\u6bcf\u6761\u8def\u5f84\u90fd\u8d21\u732e\u4e00\u9879\uff1a\u6cbf\u8be5\u8def\u5f84\u7684\u504f\u5bfc\u6570\u4e58\u4ee5\u4e2d\u95f4\u53d8\u91cf\u5bf9 \\(t\\) \u7684\u5bfc\u6570\u3002</p> </li> <li> <p>\u4f8b\u5982\uff0c\u5982\u679c \\(z = x^2 y + 3x - y^2\\)\uff0c\\(x = \\cos(t)\\)\uff0c\\(y = \\sin(t)\\)\uff1a</p> </li> </ul> \\[\\frac{dz}{dt} = (2xy + 3)(-\\sin t) + (x^2 - 2y)(\\cos t)\\] <ul> <li> <p>\u9664\u4e86\u624b\u52a8\u8ba1\u7b97\u5bfc\u6570\uff0c\u8fd8\u6709\u4e09\u79cd\u65b9\u6cd5\uff1a</p> <ul> <li>\u6570\u503c\u5fae\u5206\uff1a\u7528 \\(f'(x) \\approx \\frac{f(x+h) - f(x-h)}{2h}\\)\uff08\u53d6\u5f88\u5c0f\u7684 \\(h\\)\uff09\u6765\u8fd1\u4f3c\u3002\u7b80\u5355\u4f46\u6709\u566a\u58f0\u4e14\u4e0d\u7cbe\u786e\u3002</li> <li>\u7b26\u53f7\u5fae\u5206\uff1a\u901a\u8fc7\u4ee3\u6570\u5730\u5e94\u7528\u6c42\u5bfc\u6cd5\u5219\u4ea7\u751f\u7cbe\u786e\u8868\u8fbe\u5f0f\u3002\u53ef\u80fd\u5bfc\u81f4\u8868\u8fbe\u5f0f\u5448\u6307\u6570\u7ea7\u81a8\u80c0\u3002</li> <li>\u81ea\u52a8\u5fae\u5206\uff08autodiff\uff09\uff1a\u8ddf\u8e2a\u8fd0\u7b97\u94fe\u5e76\u9ad8\u6548\u5730\u8ba1\u7b97\u7cbe\u786e\u5bfc\u6570\u3002JAX\u3001PyTorch \u548c TensorFlow \u90fd\u4f7f\u7528\u8fd9\u79cd\u65b9\u6cd5\u3002\u5b83\u80fd\u7ed9\u51fa\u7cbe\u786e\u7684\u6570\u503c\uff08\u800c\u975e\u8fd1\u4f3c\u503c\uff09\uff0c\u4e14\u4e0d\u4f1a\u4ea7\u751f\u81c3\u80bf\u7684\u7b26\u53f7\u8868\u8fbe\u5f0f\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2003%3A%20calculus/03.%20multivariate%20calculus/#colab-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ol> <li> <p>\u4f7f\u7528 <code>jax.grad</code> \u8ba1\u7b97\u51fd\u6570 \\(f(x, y) = x^2 y + 3x - 2y\\) \u5728\u70b9 \\((1, 2)\\) \u5904\u7684\u68af\u5ea6\u3002\u7531\u4e8e \\(f\\) \u63a5\u6536\u5411\u91cf\u8f93\u5165\uff0c\u8bf7\u4f7f\u7528\u5e26 <code>argnums</code> \u53c2\u6570\u7684 <code>jax.grad</code>\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\ndef f(x, y):\n    return x**2 * y + 3*x - 2*y\n\ndf_dx = jax.grad(f, argnums=0)\ndf_dy = jax.grad(f, argnums=1)\n\nx, y = 1.0, 2.0\nprint(f\"\u2202f/\u2202x = {df_dx(x, y):.4f}  (\u671f\u671b: {2*x*y + 3:.4f})\")\nprint(f\"\u2202f/\u2202y = {df_dy(x, y):.4f}  (\u671f\u671b: {x**2 - 2:.4f})\")\n</code></pre></p> </li> <li> <p>\u4f7f\u7528 <code>jax.jacobian</code> \u8ba1\u7b97\u5411\u91cf\u503c\u51fd\u6570\u7684\u96c5\u53ef\u6bd4\u77e9\u9635\uff0c\u5e76\u4e0e\u624b\u52a8\u8ba1\u7b97\u7ed3\u679c\u8fdb\u884c\u6bd4\u8f83\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\ndef F(x):\n    return jnp.array([x[0]**2 + x[1], x[0] * x[1]**2])\n\nJ = jax.jacobian(F)\nx = jnp.array([1.0, 2.0])\nprint(f\"\u5728 (1,2) \u5904\u7684\u96c5\u53ef\u6bd4\u77e9\u9635:\\n{J(x)}\")\n# \u671f\u671b: [[2*x[0], 1], [x[1]**2, 2*x[0]*x[1]]] = [[2, 1], [4, 4]]\n</code></pre></p> </li> <li> <p>\u4f7f\u7528 <code>jax.hessian</code> \u8ba1\u7b97 \\(f(x, y) = x^3 + 2xy^2 - y^3\\) \u7684\u6d77\u68ee\u77e9\u9635\uff0c\u5e76\u9a8c\u8bc1\u5176\u5bf9\u79f0\u6027\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\ndef f(xy):\n    x, y = xy[0], xy[1]\n    return x**3 + 2*x*y**2 - y**3\n\nH = jax.hessian(f)\npoint = jnp.array([1.0, 2.0])\nhess = H(point)\nprint(f\"\u6d77\u68ee\u77e9\u9635:\\n{hess}\")\nprint(f\"\u662f\u5426\u5bf9\u79f0: {jnp.allclose(hess, hess.T)}\")\n# \u671f\u671b: [[6x, 4y], [4y, 4x-6y]] = [[6, 8], [8, -8]]\n</code></pre></p> </li> <li> <p>\u4ece\u5934\u6784\u5efa\u4e00\u4e2a\u6781\u7b80\u7684\u81ea\u52a8\u5fae\u5206\u5f15\u64ce\u3002</p> <ul> <li>\u6bcf\u4e2a <code>Var</code> \u8ffd\u8e2a\u5176\u503c\u4ee5\u53ca\u5982\u4f55\u901a\u8fc7\u94fe\u5f0f\u6cd5\u5219\u53cd\u5411\u4f20\u64ad\u68af\u5ea6\u3002</li> <li>\u5c1d\u8bd5\u6269\u5c55\u66f4\u591a\u8fd0\u7b97\uff08\u9664\u6cd5\u3001\u5e42\u8fd0\u7b97\u7b49\uff09\u3002</li> <li>\u8fd9\u662f JAX\u3001PyTorch \u548c Numpy \u7684\u8bbe\u8ba1\u57fa\u7840\u3002 <pre><code>class Var:\n    def __init__(self, val, children=(), backward_fn=None):\n        self.val = val\n        self.grad = 0.0\n        self.children = children\n        self.backward_fn = backward_fn\n\n    def __add__(self, other):\n        out = Var(self.val + other.val, children=(self, other))\n        def _backward():\n            self.grad += out.grad    # d(a+b)/da = 1\n            other.grad += out.grad   # d(a+b)/db = 1\n        out.backward_fn = _backward\n        return out\n\n    def __mul__(self, other):\n        out = Var(self.val * other.val, children=(self, other))\n        def _backward():\n            self.grad += other.val * out.grad  # d(a*b)/da = b\n            other.grad += self.val * out.grad  # d(a*b)/db = a\n        out.backward_fn = _backward\n        return out\n\n    def backward(self):\n        # \u62d3\u6251\u6392\u5e8f\uff0c\u7136\u540e\u4f20\u64ad\u68af\u5ea6\n        # \u6211\u4eec\u5c06\u5728\u6570\u636e\u7ed3\u6784\u4e0e\u7b97\u6cd5\u7ae0\u8282\u4e2d\u8be6\u7ec6\u4ecb\u7ecd\n        order, visited = [], set()\n        def topo(v):\n            if v not in visited:\n                visited.add(v)\n                for c in v.children:\n                    topo(c)\n                order.append(v)\n        topo(self)\n        self.grad = 1.0\n        for v in reversed(order):\n            if v.backward_fn:\n                v.backward_fn()\n\n# f(x, y) = x*x*y + x  \u5728 (3, 2) \u5904\nx = Var(3.0)\ny = Var(2.0)\nf = x * x * y + x       # = 3*3*2 + 3 = 21\n\nf.backward()\nprint(f\"f = {f.val}\")           # 21.0\nprint(f\"df/dx = {x.grad}\")     # 2*x*y + 1 = 13.0\nprint(f\"df/dy = {y.grad}\")     # x*x = 9.0\n</code></pre></li> </ul> </li> </ol>"},{"location":"chapter%2003%3A%20calculus/04.%20function%20approximation/","title":"\u51fd\u6570\u903c\u8fd1","text":"<p>\u51fd\u6570\u903c\u8fd1\u7528\u8db3\u591f\u63a5\u8fd1\u539f\u51fd\u6570\u7684\u7b80\u5355\u51fd\u6570\u6765\u66ff\u4ee3\u590d\u6742\u51fd\u6570\u3002\u672c\u6587\u6db5\u76d6\u7ebf\u6027\u5316\u3001\u6cf0\u52d2\u7ea7\u6570\u3001\u591a\u9879\u5f0f\u903c\u8fd1\u3001\u5085\u91cc\u53f6\u7ea7\u6570\u4ee5\u53ca\u901a\u7528\u903c\u8fd1\u5b9a\u7406\u2014\u2014\u8fd9\u4e9b\u662f\u795e\u7ecf\u7f51\u7edc\u80fd\u591f\u5b66\u4e60\u4efb\u610f\u6620\u5c04\u7684\u7406\u8bba\u57fa\u7840\u3002</p> <ul> <li> <p>\u6211\u4eec\u9047\u5230\u7684\u8bb8\u591a\u51fd\u6570\u90fd\u8fc7\u4e8e\u590d\u6742\uff0c\u65e0\u6cd5\u76f4\u63a5\u5904\u7406\u3002\u4f8b\u5982\uff0c\u5728\u7eb8\u4e0a\u8ba1\u7b97 \\(e^{0.1}\\)\u3001\u9884\u6d4b\u536b\u661f\u8f68\u8ff9\u7b49\uff0c\u90fd\u6d89\u53ca\u6ca1\u6709\u7b80\u5355\u5c01\u95ed\u5f62\u5f0f\u7b54\u6848\u7684\u51fd\u6570\u3002</p> </li> <li> <p>\u51fd\u6570\u903c\u8fd1\u7528\u66f4\u7b80\u5355\u7684\u51fd\u6570\u6765\u66ff\u4ee3\u590d\u6742\u51fd\u6570\uff0c\u4f7f\u5176\u5728\u5173\u5fc3\u533a\u57df\u5185\"\u8db3\u591f\u63a5\u8fd1\"\u539f\u51fd\u6570\u3002</p> </li> <li> <p>\u6700\u81ea\u7136\u7684\u903c\u8fd1\u662f\u591a\u9879\u5f0f\u3002\u591a\u9879\u5f0f\u53ea\u662f \\(x\\) \u7684\u5e42\u6b21\u4e0e\u7cfb\u6570\u7684\u548c\uff0c\u6613\u4e8e\u6c42\u503c\u3001\u5fae\u5206\u548c\u79ef\u5206\u3002</p> </li> <li> <p>\u4f46\u4e3a\u4ec0\u4e48\u591a\u9879\u5f0f\u4f5c\u4e3a\u903c\u8fd1\u5668\u5982\u6b64\u6709\u6548\uff1f\u770b\u770b \\(x\\) \u7684\u6bcf\u4e2a\u5e42\u6b21\u8d21\u732e\u4e86\u4ec0\u4e48\u3002</p> <ul> <li>\u5e38\u6570\u9879 \\(a_0\\) \u8bbe\u5b9a\u57fa\u51c6\u503c\u3002</li> <li>\\(a_1 x\\) \u9879\u589e\u52a0\u659c\u7387\u3002</li> <li>\\(a_2 x^2\\) \u9879\u589e\u52a0\u66f2\u7387\u3002</li> <li>\u66f4\u9ad8\u7684\u5e42\u6b21\u5219\u6355\u6349\u51fd\u6570\u5f62\u72b6\u7684\u66f4\u591a\u7ec6\u8282\u3002</li> </ul> </li> </ul> <p></p> <ul> <li> <p>\u901a\u8fc7\u9009\u62e9\u5408\u9002\u7684\u7cfb\u6570\uff0c\u6211\u4eec\u53ef\u4ee5\u9010\u6b21\u5339\u914d\u51fd\u6570\u5728\u67d0\u4e00\u70b9\u7684\u503c\u3001\u659c\u7387\u3001\u66f2\u7387\u4ee5\u53ca\u9ad8\u9636\u884c\u4e3a\u3002</p> </li> <li> <p>\u5f53\u9879\u6570\u8db3\u591f\u65f6\uff0c\u591a\u9879\u5f0f\u51e0\u4e4e\u53ef\u4ee5\u6a21\u4eff\u4efb\u4f55\u5149\u6ed1\u51fd\u6570\u3002</p> </li> <li> <p>\u95ee\u9898\u5728\u4e8e\uff1a\u5982\u4f55\u627e\u5230\u6b63\u786e\u7684\u7cfb\u6570\uff1f</p> </li> <li> <p>\u7ebf\u6027\u5316\u662f\u6700\u7b80\u5355\u7684\u903c\u8fd1\u3002\u5728\u70b9 \\(x = a\\) \u9644\u8fd1\uff0c\u6211\u4eec\u7528\u51fd\u6570\u7684\u5207\u7ebf\u6765\u4ee3\u66ff\u5b83\uff1a</p> </li> </ul> \\[L(x) = f(a) + f'(a)(x - a)\\] <ul> <li> <p>\u8fd9\u662f\u4e00\u9636\u6cf0\u52d2\u903c\u8fd1\u3002\u5b83\u7684\u601d\u8def\u662f\uff1a\u4ece\u5df2\u77e5\u503c \\(f(a)\\) \u51fa\u53d1\uff0c\u7136\u540e\u52a0\u4e0a\u659c\u7387\u4e58\u4ee5\u8ddd\u79bb \\(a\\) \u7684\u504f\u79fb\u91cf\u3002</p> </li> <li> <p>\u4f8b\u5982\uff0c\u5728 \\(x = 0\\) \u5904\u5bf9 \\(\\sin(x)\\) \u7ebf\u6027\u5316\uff1a\\(f(0) = 0\\)\uff0c\\(f'(0) = \\cos(0) = 1\\)\uff0c\u6240\u4ee5 \\(L(x) = x\\)\u3002\u5728\u96f6\u9644\u8fd1\uff0c\\(\\sin(x) \\approx x\\)\u3002\u8bd5\u8bd5\u770b\uff1a\\(\\sin(0.1) = 0.0998\\ldots \\approx 0.1\\)\u3002</p> </li> <li> <p>\u4f46\u7ebf\u6027\u5316\u4ec5\u5728\u975e\u5e38\u63a5\u8fd1 \\(a\\) \u7684\u5730\u65b9\u6709\u6548\u3002\u79bb\u5f97\u7a0d\u8fdc\uff0c\u903c\u8fd1\u5c31\u5931\u6548\u4e86\u3002\u4e3a\u4e86\u505a\u5f97\u66f4\u597d\uff0c\u6211\u4eec\u9700\u8981\u5f15\u5165\u9ad8\u9636\u9879\u3002</p> </li> <li> <p>\u6cf0\u52d2\u7ea7\u6570\u5c06\u51fd\u6570\u8868\u793a\u4e3a\u65e0\u7a77\u591a\u4e2a\u591a\u9879\u5f0f\u9879\u7684\u548c\uff0c\u6bcf\u4e00\u9879\u90fd\u6355\u6349\u5230\u51fd\u6570\u5728\u70b9 \\(a\\) \u9644\u8fd1\u884c\u4e3a\u7684\u66f4\u7cbe\u7ec6\u7ec6\u8282\uff1a</p> </li> </ul> \\[f(x) = \\sum_{n=0}^{\\infty} \\frac{f^{(n)}(a)}{n!}(x - a)^n = f(a) + f'(a)(x-a) + \\frac{f''(a)}{2!}(x-a)^2 + \\frac{f'''(a)}{3!}(x-a)^3 + \\cdots\\] <p></p> <ul> <li> <p>\u6bcf\u4e00\u9879\u4f9d\u6b21\u589e\u52a0\u4e00\u4e2a\u4fee\u6b63\u9879\u3002\u7b2c\u4e00\u9879\u5339\u914d\u51fd\u6570\u503c\uff0c\u7b2c\u4e8c\u9879\u5339\u914d\u659c\u7387\uff0c\u7b2c\u4e09\u9879\u5339\u914d\u66f2\u7387\uff0c\u4f9d\u6b64\u7c7b\u63a8\u3002\u5305\u542b\u7684\u9879\u8d8a\u591a\uff0c\u903c\u8fd1\u7cbe\u786e\u7684\u533a\u57df\u5c31\u8d8a\u5927\u3002</p> </li> <li> <p>\u5206\u6bcd\u4e2d\u7684 \\(n!\\) \u5e76\u975e\u968f\u610f\u9009\u62e9\u3002\u5f53\u4f60\u5bf9 \\((x - a)^n\\) \u6070\u597d\u5fae\u5206 \\(n\\) \u6b21\u65f6\uff0c\u4f1a\u5f97\u5230 \\(n!\\)\u3002\u9636\u4e58\u62b5\u6d88\u4e86\u8fd9\u4e2a\u7ed3\u679c\uff0c\u4ece\u800c\u786e\u4fdd\u6cf0\u52d2\u591a\u9879\u5f0f\u7684 \\(n\\) \u9636\u5bfc\u6570\u5728 \\(x = a\\) \u5904\u4e0e\u539f\u51fd\u6570\u7684 \\(n\\) \u9636\u5bfc\u6570\u76f8\u7b49\u3002</p> </li> <li> <p>\u9ea6\u514b\u52b3\u6797\u7ea7\u6570\u5c31\u662f\u4e2d\u5fc3\u5728 \\(a = 0\\) \u7684\u6cf0\u52d2\u7ea7\u6570\uff1a</p> </li> </ul> \\[f(x) = \\sum_{n=0}^{\\infty} \\frac{f^{(n)}(0)}{n!} x^n\\] <ul> <li>\u4e00\u4e9b\u8457\u540d\u7684\u9ea6\u514b\u52b3\u6797\u7ea7\u6570\uff1a</li> </ul> \\[e^x = 1 + x + \\frac{x^2}{2!} + \\frac{x^3}{3!} + \\cdots\\] \\[\\sin x = x - \\frac{x^3}{3!} + \\frac{x^5}{5!} - \\frac{x^7}{7!} + \\cdots\\] \\[\\cos x = 1 - \\frac{x^2}{2!} + \\frac{x^4}{4!} - \\frac{x^6}{6!} + \\cdots\\] <ul> <li> <p>\u6ce8\u610f \\(\\sin x\\) \u53ea\u6709\u5947\u6b21\u5e42\uff08\u5b83\u662f\u5947\u51fd\u6570\uff09\uff0c\u800c \\(\\cos x\\) \u53ea\u6709\u5076\u6b21\u5e42\uff08\u5b83\u662f\u5076\u51fd\u6570\uff09\u3002\u4ea4\u66ff\u7684\u7b26\u53f7\u4f7f\u5f97\u903c\u8fd1\u5728\u771f\u5b9e\u503c\u5468\u56f4\u632f\u8361\uff0c\u4ece\u4e24\u4fa7\u540c\u65f6\u6536\u655b\u3002</p> </li> <li> <p>\u8ba9\u6211\u4eec\u7528\u56db\u9879\u6765\u903c\u8fd1 \\(e^{0.5}\\)\uff1a\\(1 + 0.5 + \\frac{0.25}{2} + \\frac{0.125}{6} = 1 + 0.5 + 0.125 + 0.02083 \\approx 1.6458\\)\u3002\u771f\u5b9e\u503c\u4e3a \\(1.6487\\ldots\\)\uff0c\u56e0\u6b64\u56db\u9879\u5df2\u7ecf\u7ed9\u51fa\u4e86\u4e09\u4e2a\u6b63\u786e\u7684\u5c0f\u6570\u4f4d\u3002</p> </li> <li> <p>\u5e76\u975e\u6240\u6709\u6cf0\u52d2\u7ea7\u6570\u90fd\u5904\u5904\u6536\u655b\u3002\u6536\u655b\u534a\u5f84\u544a\u8bc9\u6211\u4eec\uff0c\u5728\u8ddd\u79bb\u4e2d\u5fc3 \\(a\\) \u591a\u8fdc\u7684\u8303\u56f4\u5185\uff0c\u7ea7\u6570\u7ed9\u51fa\u6709\u6548\u7684\u7ed3\u679c\u3002\u5728\u6b64\u534a\u5f84\u5185\uff0c\u901a\u8fc7\u589e\u52a0\u9879\u6570\uff0c\u591a\u9879\u5f0f\u903c\u8fd1\u53ef\u4ee5\u8fbe\u5230\u4efb\u610f\u6240\u9700\u7684\u7cbe\u5ea6\u3002\u8d85\u51fa\u6b64\u534a\u5f84\uff0c\u7ea7\u6570\u53d1\u6563\u3002</p> </li> <li> <p>\u5e42\u7ea7\u6570\u7684\u4e00\u822c\u5f62\u5f0f\u662f\uff1a\\(\\sum_{n=0}^{\\infty} a_n (x - c)^n\\)\u3002\u6cf0\u52d2\u7ea7\u6570\u662f\u7cfb\u6570\u7531\u5bfc\u6570\u786e\u5b9a\u7684\u5e42\u7ea7\u6570\u3002\u5176\u4ed6\u5e42\u7ea7\u6570\u53ef\u80fd\u7531\u5176\u4ed6\u89c4\u5219\u5b9a\u4e49\u3002\u6bd4\u503c\u5224\u522b\u6cd5\u7528\u4e8e\u5224\u5b9a\u6536\u655b\u6027\uff1a\u8ba1\u7b97 \\(\\lim_{n \\to \\infty} \\left|\\frac{a_{n+1}}{a_n}\\right|\\)\u3002\u5982\u679c\u8be5\u6781\u9650\u4e3a \\(L\\)\uff0c\u5219\u6536\u655b\u534a\u5f84\u4e3a \\(R = 1/L\\)\u3002</p> </li> <li> <p>\u5c06\u6cf0\u52d2\u7ea7\u6570\u622a\u65ad\u5230 \\(n\\) \u9879\u65f6\uff0c\u4f1a\u4ea7\u751f\u8bef\u5dee\u3002\u62c9\u683c\u6717\u65e5\u4f59\u9879\u7ed9\u51fa\u4e86\u8fd9\u4e2a\u8bef\u5dee\u7684\u754c\u9650\uff1a</p> </li> </ul> \\[R_n(x) = \\frac{f^{(n+1)}(c)}{(n+1)!}(x-a)^{n+1}\\] <ul> <li> <p>\u8fd9\u91cc \\(c\\) \u662f \\(a\\) \u548c \\(x\\) \u4e4b\u95f4\u7684\u67d0\u4e2a\u672a\u77e5\u70b9\u3002\u6211\u4eec\u65e0\u6cd5\u786e\u5207\u77e5\u9053 \\(c\\)\uff0c\u4f46\u901a\u5e38\u53ef\u4ee5\u9650\u5b9a \\(|f^{(n+1)}(c)|\\) \u6765\u5f97\u5230\u6700\u574f\u60c5\u51b5\u4e0b\u7684\u8bef\u5dee\u4f30\u8ba1\u3002\u5206\u6bcd\u4e2d\u7684 \\((n+1)!\\) \u589e\u957f\u6781\u5feb\uff0c\u56e0\u6b64\u968f\u7740\u9879\u6570\u589e\u52a0\uff0c\u8bef\u5dee\u8fc5\u901f\u51cf\u5c0f\uff08\u5bf9\u4e8e\u6536\u655b\u534a\u5f84\u5185\u7684\u51fd\u6570\u800c\u8a00\uff09\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u591a\u53d8\u91cf\u51fd\u6570\uff0c\u6cf0\u52d2\u5c55\u5f00\u5305\u542b\u6df7\u5408\u504f\u5bfc\u6570\u3002\\(f(\\mathbf{x})\\) \u5728\u70b9 \\(\\mathbf{a}\\) \u9644\u8fd1\u7684\u4e8c\u9636\u903c\u8fd1\u4e3a\uff1a</p> </li> </ul> \\[f(\\mathbf{x}) \\approx f(\\mathbf{a}) + \\nabla f(\\mathbf{a})^T (\\mathbf{x} - \\mathbf{a}) + \\frac{1}{2} (\\mathbf{x} - \\mathbf{a})^T H(\\mathbf{a}) (\\mathbf{x} - \\mathbf{a})\\] <ul> <li> <p>\u7b2c\u4e00\u9879\u662f\u51fd\u6570\u503c\uff0c\u7b2c\u4e8c\u9879\u4f7f\u7528\u68af\u5ea6\uff08\u5411\u91cf\uff0c\u5982\u6211\u4eec\u5728\u591a\u5143\u5fae\u79ef\u5206\u4e2d\u770b\u5230\u7684\uff09\uff0c\u7b2c\u4e09\u9879\u4f7f\u7528\u6d77\u68ee\u77e9\u9635\uff08\u6355\u6349\u66f2\u7387\uff09\u3002\u8fd9\u76f4\u63a5\u5c06\u6211\u4eec\u7684\u77e9\u9635\u7ae0\u8282\u4e0e\u5fae\u79ef\u5206\u8054\u7cfb\u8d77\u6765\uff1a\u6d77\u68ee\u77e9\u9635\u662f\u4e00\u4e2a\u7531\u4e8c\u9636\u5bfc\u6570\u7ec4\u6210\u7684\u77e9\u9635\uff0c\u63cf\u8ff0\u4e86\u51fd\u6570\u8868\u9762\u7684\u5f62\u72b6\u3002</p> </li> <li> <p>\u8fd9\u79cd\u591a\u53d8\u91cf\u4e8c\u9636\u903c\u8fd1\u662f\u725b\u987f\u6cd5\u548c\u5176\u4ed6\u4e8c\u9636\u4f18\u5316\u6280\u672f\u7684\u57fa\u7840\uff0c\u6211\u4eec\u5c06\u5728\u4e0b\u4e00\u4e2a\u6587\u4ef6\u4e2d\u770b\u5230\u3002</p> </li> <li> <p>\u9664\u4e86\u591a\u9879\u5f0f\uff0c\u8fd8\u6709\u5176\u4ed6\u503c\u5f97\u4e86\u89e3\u7684\u903c\u8fd1\u65b9\u6cd5\uff1a</p> <ul> <li>\u6837\u6761\u63d2\u503c\uff1a\u4e0d\u7528\u5355\u4e2a\u9ad8\u6b21\u591a\u9879\u5f0f\uff0c\u800c\u662f\u5c06\u591a\u4e2a\u4f4e\u6b21\u591a\u9879\u5f0f\u5149\u6ed1\u62fc\u63a5\u5728\u4e00\u8d77\u3002\u8fd9\u907f\u514d\u4e86\u9ad8\u6b21\u591a\u9879\u5f0f\u53ef\u80fd\u4ea7\u751f\u7684\u5267\u70c8\u632f\u8361\u3002</li> <li>\u5085\u91cc\u53f6\u7ea7\u6570\uff1a\u5c06\u5468\u671f\u51fd\u6570\u903c\u8fd1\u4e3a\u6b63\u5f26\u548c\u4f59\u5f26\u7684\u548c\u3002\u5728\u4fe1\u53f7\u5904\u7406\u548c\u97f3\u9891\u4e2d\u81f3\u5173\u91cd\u8981\u3002</li> <li>\u795e\u7ecf\u7f51\u7edc\uff1a\u901a\u7528\u51fd\u6570\u903c\u8fd1\u5668\u3002\u53ea\u8981\u6709\u8db3\u591f\u7684\u795e\u7ecf\u5143\uff0c\u5b83\u4eec\u53ef\u4ee5\u4efb\u610f\u7cbe\u5ea6\u903c\u8fd1\u4efb\u4f55\u8fde\u7eed\u51fd\u6570\u3002\u8fd9\u5c31\u662f\u6df1\u5ea6\u5b66\u4e60\u7684\u7406\u8bba\u57fa\u7840\u3002</li> </ul> </li> <li> <p>\u5982\u679c\u4e00\u4e2a\u51fd\u6570\u5177\u6709\u4f7f\u903c\u8fd1\u53ef\u9760\u7684\u6027\u8d28\u2014\u2014\u8fde\u7eed\u6027\uff08\u65e0\u8df3\u8dc3\uff09\u3001\u53ef\u5fae\u6027\uff08\u65e0\u5c16\u89d2\uff09\u3001\u5149\u6ed1\u6027\uff08\u6240\u6709\u9636\u5bfc\u6570\u90fd\u5b58\u5728\uff09\u548c\u6709\u754c\u6027\uff08\u8f93\u51fa\u4fdd\u6301\u6709\u9650\uff09\uff0c\u6211\u4eec\u5c31\u79f0\u5176\u4e3a\"\u884c\u4e3a\u826f\u597d\"\u7684\u51fd\u6570\u3002</p> </li> <li> <p>\u591a\u9879\u5f0f\u3001\u6307\u6570\u51fd\u6570\u548c\u4e09\u89d2\u51fd\u6570\u90fd\u5c5e\u4e8e\u884c\u4e3a\u826f\u597d\u7684\u51fd\u6570\u3002\u51fd\u6570\u884c\u4e3a\u8d8a\u597d\uff0c\u83b7\u5f97\u826f\u597d\u903c\u8fd1\u6240\u9700\u7684\u6cf0\u52d2\u9879\u6570\u5c31\u8d8a\u5c11\u3002</p> </li> </ul>"},{"location":"chapter%2003%3A%20calculus/04.%20function%20approximation/#colab-jupyter-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528 CoLab \u6216 Jupyter Notebook\uff09","text":"<ol> <li> <p>\u7528\u9012\u589e\u6570\u91cf\u7684\u6cf0\u52d2\u9879\u903c\u8fd1 \\(e^x\\)\uff0c\u5e76\u53ef\u89c6\u5316\u903c\u8fd1\u6548\u679c\u5982\u4f55\u6539\u5584\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\nx = jnp.linspace(-2, 3, 300)\nplt.plot(x, jnp.exp(x), \"k-\", linewidth=2, label=\"e\u02e3 (\u7cbe\u786e\u503c)\")\n\ncolors = [\"#e74c3c\", \"#3498db\", \"#27ae60\", \"#9b59b6\"]\nfor n, color in zip([1, 2, 4, 8], colors):\n    approx = sum(x**k / jnp.array(float(jnp.prod(jnp.arange(1, k+1)) if k &gt; 0 else 1))\n                 for k in range(n+1))\n    plt.plot(x, approx, color=color, linestyle=\"--\", label=f\"{n} \u9879\")\n\nplt.ylim(-2, 15)\nplt.legend()\nplt.title(\"e\u02e3 \u7684\u6cf0\u52d2\u903c\u8fd1\")\nplt.show()\n</code></pre></p> </li> <li> <p>\u8ba1\u7b97\u62c9\u683c\u6717\u65e5\u4f59\u9879\uff0c\u4ee5\u9650\u5b9a\u7528\u4e0d\u540c\u6570\u91cf\u7684\u6cf0\u52d2\u9879\u903c\u8fd1 \\(\\sin(1)\\) \u65f6\u7684\u8bef\u5dee\u3002 <pre><code>import jax.numpy as jnp\n\nx = 1.0\nexact = jnp.sin(x)\n\ntaylor = 0.0\nfor n in range(8):\n    sign = (-1)**n\n    factorial = float(jnp.prod(jnp.arange(1, 2*n+2)))\n    taylor += sign * x**(2*n+1) / factorial\n    error = abs(exact - taylor)\n    bound = x**(2*n+3) / float(jnp.prod(jnp.arange(1, 2*n+4)))\n    print(f\"\u9879\u6570={n+1}  \u8fd1\u4f3c\u503c={taylor:.10f}  \u8bef\u5dee={error:.2e}  \u754c\u9650={bound:.2e}\")\n</code></pre></p> </li> <li> <p>\u6bd4\u8f83\u5728 \\(x=0\\) \u9644\u8fd1 \\(\\cos(x)\\) \u7684\u7ebf\u6027\u5316\u903c\u8fd1\u4e0e\u4e8c\u6b21\u6cf0\u52d2\u903c\u8fd1\u3002\u5728\u540c\u4e00\u5f20\u56fe\u4e0a\u7ed8\u5236\u4e24\u4e2a\u903c\u8fd1\u548c\u771f\u5b9e\u51fd\u6570\uff0c\u89c2\u5bdf\u5404\u81ea\u7cbe\u786e\u7684\u8303\u56f4\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\nx = jnp.linspace(-3, 3, 300)\nplt.plot(x, jnp.cos(x), \"k-\", linewidth=2, label=\"cos(x)\")\nplt.plot(x, jnp.ones_like(x), \"--\", color=\"#e74c3c\", label=\"\u7ebf\u6027: 1\")\nplt.plot(x, 1 - x**2/2, \"--\", color=\"#3498db\", label=\"\u4e8c\u6b21: 1 - x\u00b2/2\")\nplt.plot(x, 1 - x**2/2 + x**4/24, \"--\", color=\"#27ae60\", label=\"\u56db\u9636\")\nplt.ylim(-2, 2)\nplt.legend()\nplt.title(\"cos(x) \u7684\u6cf0\u52d2\u903c\u8fd1\")\nplt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2003%3A%20calculus/05.%20optimisation/","title":"\u4f18\u5316","text":"<p>\u4f18\u5316\u662f\u6a21\u578b\u8bad\u7ec3\u7684\u6570\u5b66\u6838\u5fc3\u2014\u2014\u5bfb\u627e\u4f7f\u635f\u5931\u51fd\u6570\u6700\u5c0f\u7684\u53c2\u6570\u3002\u672c\u6587\u6db5\u76d6\u9a7b\u70b9\u3001\u51f8\u6027\u3001\u68af\u5ea6\u4e0b\u964d\u3001\u725b\u987f\u6cd5\u3001\u5e26\u62c9\u683c\u6717\u65e5\u4e58\u6570\u7684\u7ea6\u675f\u4f18\u5316\uff0c\u4ee5\u53ca\u9a71\u52a8\u73b0\u4ee3\u6df1\u5ea6\u5b66\u4e60\u7684\u4e3b\u6d41\u4f18\u5316\u5668\uff08SGD\u3001Adam\uff09\u3002</p> <ul> <li> <p>\u8bad\u7ec3\u795e\u7ecf\u7f51\u7edc\u3001\u62df\u5408\u56de\u5f52\u7ebf\u3001\u8c03\u4f18\u8d85\u53c2\u6570\uff1a\u51e0\u4e4e\u6240\u6709\u673a\u5668\u5b66\u4e60\u7b97\u6cd5\u7684\u6838\u5fc3\u90fd\u662f\u4e00\u4e2a\u4f18\u5316\u95ee\u9898\u3002</p> </li> <li> <p>\u6211\u4eec\u6709\u4e00\u4e2a\u51fd\u6570\uff08\u635f\u5931\u51fd\u6570\u3001\u4ee3\u4ef7\u51fd\u6570\u3001\u76ee\u6807\u51fd\u6570\uff09\uff0c\u5e0c\u671b\u627e\u5230\u4f7f\u5176\u5c3d\u53ef\u80fd\u5c0f\uff08\u6216\u5927\uff09\u7684\u8f93\u5165\u3002</p> </li> <li> <p>\u5728\u4f18\u5316\u4e4b\u524d\uff0c\u6211\u4eec\u9700\u8981\u7406\u89e3\u51fd\u6570\u7684\u96f6\u70b9\uff08\u6216\u6839\uff09\u3002\\(f(x)\\) \u7684\u96f6\u70b9\u662f\u6307\u6ee1\u8db3 \\(f(x) = 0\\) \u7684 \\(x\\) \u503c\u3002\u4ece\u56fe\u5f62\u4e0a\u770b\uff0c\u8fd9\u4e9b\u70b9\u5c31\u662f\u4e0e x \u8f74\u7684\u4ea4\u70b9\u3002</p> </li> <li> <p>\u4f8b\u5982\uff0c\\(f(x) = x^2 - 3x + 2 = (x-1)(x-2)\\) \u7684\u96f6\u70b9\u5728 \\(x = 1\\) \u548c \\(x = 2\\) \u5904\u3002\u5728\u4e24\u4e2a\u96f6\u70b9\u4e4b\u95f4\uff0c\u51fd\u6570\u4e3a\u8d1f\uff08\\(f(1.5) = -0.25\\)\uff09\uff1b\u5728\u96f6\u70b9\u4e4b\u5916\uff0c\u51fd\u6570\u4e3a\u6b63\u3002\u96f6\u70b9\u5c06\u6570\u8f74\u5206\u5272\u6210\u82e5\u5e72\u4e2a\u533a\u57df\uff0c\u5728\u6bcf\u4e2a\u533a\u57df\u4e2d\u51fd\u6570\u4fdd\u6301\u76f8\u540c\u7b26\u53f7\u3002</p> </li> <li> <p>\u96f6\u70b9\u7684\u91cd\u6570\u662f\u6307\u5bf9\u5e94\u56e0\u5f0f\u51fa\u73b0\u7684\u6b21\u6570\u3002</p> </li> <li> <p>\u5728\u5355\u96f6\u70b9\uff08\u91cd\u6570\u4e3a 1\uff09\u5904\uff0c\u56fe\u50cf\u7a7f\u8fc7 x \u8f74\u3002\u5728\u4e8c\u91cd\u96f6\u70b9\uff08\u91cd\u6570\u4e3a 2\uff09\u5904\uff0c\u56fe\u50cf\u63a5\u89e6 x \u8f74\u4f46\u53cd\u5f39\u56de\u53bb\u800c\u4e0d\u7a7f\u8fc7\uff0c\u5728\u8be5\u70b9\u5904\u770b\u8d77\u6765\u662f\"\u5e73\u5766\"\u7684\u3002</p> </li> <li> <p>\u5bfb\u627e\u96f6\u70b9\u4e4b\u6240\u4ee5\u91cd\u8981\uff0c\u662f\u56e0\u4e3a\u5bfc\u6570 \\(f'(x)\\) \u7684\u96f6\u70b9\u6b63\u662f \\(f(x)\\) \u7684\u9a7b\u70b9\u2014\u2014\u5373\u6781\u5927\u503c\u6216\u6781\u5c0f\u503c\u7684\u5019\u9009\u70b9\u3002</p> </li> <li> <p>\u5728\u6781\u5927\u503c\u6216\u6781\u5c0f\u503c\u5904\uff0c\u5207\u7ebf\u662f\u6c34\u5e73\u7684\uff08\u659c\u7387\u4e3a 0\uff09\uff0c\u56e0\u6b64 \\(f'(x) = 0\\)\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u4f46\u5e76\u975e\u6bcf\u4e2a\u9a7b\u70b9\u90fd\u662f\u6781\u5927\u503c\u6216\u6781\u5c0f\u503c\u3002\\(f'(x) = 0\\) \u7684\u70b9\u4e5f\u53ef\u80fd\u662f\u62d0\u70b9\uff08\u5982 \\(f(x) = x^3\\) \u5728 \\(x = 0\\) \u5904\uff09\uff0c\u51fd\u6570\u5728\u8be5\u70b9\u6682\u65f6\u53d8\u5e73\u4f46\u5e76\u672a\u6539\u53d8\u65b9\u5411\u3002</p> </li> <li> <p>\u4e8c\u9636\u5bfc\u6570\u68c0\u9a8c\u53ef\u4ee5\u89e3\u51b3\u8fd9\u4e2a\u95ee\u9898\u3002\u5728\u9a7b\u70b9 \\(x = c\\)\uff08\u5373 \\(f'(c) = 0\\)\uff09\u5904\uff1a</p> <ul> <li>\u82e5 \\(f''(c) &gt; 0\\)\uff1a\u66f2\u7ebf\u5411\u4e0b\u51f8\uff08\u7897\u72b6\uff09\uff0c\u56e0\u6b64 \\(c\\) \u662f\u5c40\u90e8\u6781\u5c0f\u503c\u3002</li> <li>\u82e5 \\(f''(c) &lt; 0\\)\uff1a\u66f2\u7ebf\u5411\u4e0a\u51f8\uff08\u5c71\u4e18\u72b6\uff09\uff0c\u56e0\u6b64 \\(c\\) \u662f\u5c40\u90e8\u6781\u5927\u503c\u3002</li> <li>\u82e5 \\(f''(c) = 0\\)\uff1a\u68c0\u9a8c\u65e0\u6548\uff0c\u9700\u8981\u4f7f\u7528\u66f4\u9ad8\u9636\u5bfc\u6570\u6216\u5176\u4ed6\u65b9\u6cd5\u3002</li> </ul> </li> <li> <p>\u4f8b\u5982\uff0c\\(f(x) = x^3 - 3x\\)\u3002\u5bfc\u6570\u4e3a \\(f'(x) = 3x^2 - 3 = 3(x-1)(x+1)\\)\uff0c\u56e0\u6b64\u9a7b\u70b9\u5728 \\(x = -1\\) \u548c \\(x = 1\\) \u5904\u3002\u4e8c\u9636\u5bfc\u6570\u4e3a \\(f''(x) = 6x\\)\u3002\u5728 \\(x = -1\\) \u5904\uff1a\\(f''(-1) = -6 &lt; 0\\)\uff08\u5c40\u90e8\u6781\u5927\u503c\uff09\u3002\u5728 \\(x = 1\\) \u5904\uff1a\\(f''(1) = 6 &gt; 0\\)\uff08\u5c40\u90e8\u6781\u5c0f\u503c\uff09\u3002</p> </li> <li> <p>\u5982\u679c\u8fde\u63a5\u51fd\u6570\u56fe\u50cf\u4e0a\u4efb\u610f\u4e24\u70b9\u7684\u7ebf\u6bb5\u4f4d\u4e8e\u56fe\u50cf\u4e4b\u4e0a\uff08\u6216\u4e0e\u4e4b\u91cd\u5408\uff09\uff0c\u5219\u8be5\u51fd\u6570\u662f\u51f8\u7684\u3002\u53ef\u4ee5\u60f3\u8c61\u6210\u4e00\u4e2a\u7897\u5f62\uff0c\u5904\u5904\u5411\u4e0a\u5f2f\u66f2\u3002\u6570\u5b66\u4e0a\uff0c\u82e5\u5bf9\u6240\u6709 \\(x\\) \u6709 \\(f''(x) \\geq 0\\)\uff0c\u5219 \\(f\\) \u662f\u51f8\u51fd\u6570\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u51f8\u6027\u7684\u5f3a\u5927\u4e4b\u5904\u5728\u4e8e\u51f8\u51fd\u6570\u6709\u4e00\u4e2a\u5353\u8d8a\u7684\u6027\u8d28\uff1a\u6bcf\u4e2a\u5c40\u90e8\u6781\u5c0f\u503c\u540c\u65f6\u4e5f\u662f\u5168\u5c40\u6700\u5c0f\u503c\u3002\u4e0d\u5b58\u5728\u4f1a\u8ba9\u4eba\u9677\u5165\u7684\u6b3a\u9a97\u6027\u5c40\u90e8\u4f4e\u8c37\u3002\u5982\u679c\u4f60\u628a\u4e00\u4e2a\u7403\u6eda\u5165\u51f8\u7897\u4e2d\uff0c\u5b83\u603b\u662f\u4f1a\u5230\u8fbe\u5e95\u90e8\u3002</p> </li> <li> <p>\u82e5 \\(-f\\) \u662f\u51f8\u7684\uff0c\u5219\u51fd\u6570\u662f\u51f9\u7684\uff08\u5411\u4e0b\u5f2f\u66f2\uff09\u3002\u51fd\u6570\u4ece\u51f9\u6027\u8fc7\u6e21\u5230\u51f8\u6027\u7684\u70b9\u79f0\u4e3a\u62d0\u70b9\uff0c\u51fa\u73b0\u5728 \\(f''(x) = 0\\) \u5904\u3002</p> </li> <li> <p>\u725b\u987f\u6cd5\u5229\u7528\u5207\u7ebf\u5bfb\u627e\u51fd\u6570\u7684\u96f6\u70b9\uff08\u8fdb\u800c\u4e5f\u53ef\u7528\u4e8e\u5bfb\u627e\u5176\u5bfc\u6570\u7684\u9a7b\u70b9\uff09\u3002\u4ece\u521d\u59cb\u731c\u6d4b \\(x_0\\) \u51fa\u53d1\uff0c\u8fed\u4ee3\u66f4\u65b0\uff1a</p> </li> </ul> \\[x_{n+1} = x_n - \\frac{f(x_n)}{f'(x_n)}\\] <p></p> <ul> <li> <p>\u5176\u601d\u60f3\u662f\uff1a\u5728 \\(x_n\\) \u5904\u753b\u51fa\u5207\u7ebf\uff0c\u627e\u5230\u5b83\u4e0e x \u8f74\u7684\u4ea4\u70b9\uff0c\u8be5\u4ea4\u70b9\u5373\u4e3a \\(x_{n+1}\\)\u3002\u5bf9\u4e8e\u6027\u8d28\u826f\u597d\u4e14\u521d\u59cb\u70b9\u9009\u53d6\u6070\u5f53\u7684\u51fd\u6570\uff0c\u725b\u987f\u6cd5\u6536\u655b\u975e\u5e38\u5feb\uff08\u4e8c\u6b21\u6536\u655b\uff0c\u5373\u6bcf\u6b65\u6b63\u786e\u4f4d\u6570\u5927\u81f4\u7ffb\u500d\uff09\u3002</p> </li> <li> <p>\u4f8b\u5982\uff0c\u6c42 \\(\\sqrt{5}\\)\uff08\u5373 \\(f(x) = x^2 - 5\\) \u7684\u96f6\u70b9\uff09\uff1a\\(f'(x) = 2x\\)\uff0c\u56e0\u6b64 \\(x_{n+1} = x_n - \\frac{x_n^2 - 5}{2x_n}\\)\u3002\u4ece \\(x_0 = 2\\) \u5f00\u59cb\uff1a\\(x_1 = 2.25\\)\uff0c\\(x_2 = 2.2361\\ldots\\)\uff0c\u5df2\u7cbe\u786e\u5230\u5c0f\u6570\u70b9\u540e\u56db\u4f4d\u3002</p> </li> <li> <p>\u5982\u679c\u521d\u59cb\u731c\u6d4b\u79bb\u6839\u592a\u8fdc\u3001\u6839\u9644\u8fd1 \\(f'(x) = 0\\)\uff0c\u6216\u51fd\u6570\u5728\u9644\u8fd1\u6709\u62d0\u70b9\uff0c\u725b\u987f\u6cd5\u53ef\u80fd\u4f1a\u5931\u8d25\u3002\u6b64\u5916\uff0c\u5b83\u8fd8\u9700\u8981\u8ba1\u7b97\u5bfc\u6570\uff0c\u8fd9\u53ef\u80fd\u4ee3\u4ef7\u9ad8\u6602\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u4f18\u5316\uff08\u5bfb\u627e\u6781\u5c0f\u503c\u800c\u975e\u96f6\u70b9\uff09\uff0c\u6211\u4eec\u5c06\u725b\u987f\u6cd5\u5e94\u7528\u4e8e \\(f'(x) = 0\\)\uff0c\u5f97\u5230\u66f4\u65b0\u516c\u5f0f\uff1a</p> </li> </ul> \\[x_{n+1} = x_n - \\frac{f'(x_n)}{f''(x_n)}\\] <ul> <li> <p>\u5728\u591a\u7ef4\u60c5\u5f62\u4e0b\uff0c\u8fd9\u53d8\u4e3a \\(\\mathbf{x}_{n+1} = \\mathbf{x}_n - H^{-1} \\nabla f(\\mathbf{x}_n)\\)\uff0c\u5176\u4e2d \\(H\\) \u662f Hessian \u77e9\u9635\u3002\u8fd9\u6b63\u662f\u4e0a\u4e00\u8282\u4e2d\u4e8c\u9636\u6cf0\u52d2\u8fd1\u4f3c\u7684\u5b9e\u9645\u5e94\u7528\uff1a\u5c06\u51fd\u6570\u8fd1\u4f3c\u4e3a\u4e8c\u6b21\u578b\uff0c\u8df3\u5230\u8be5\u4e8c\u6b21\u578b\u7684\u6781\u5c0f\u503c\u70b9\uff0c\u7136\u540e\u91cd\u590d\u3002</p> </li> <li> <p>\u62c9\u683c\u6717\u65e5\u4e58\u6570\u7528\u4e8e\u6c42\u89e3\u7ea6\u675f\u4f18\u5316\uff1a\u5728\u7ea6\u675f\u6761\u4ef6 \\(g(x, y) = c\\) \u4e0b\u6c42 \\(f(x, y)\\) \u7684\u6700\u4f18\u503c\u3002\u6211\u4eec\u4e0d\u662f\u5728 \\(\\mathbb{R}^n\\) \u4e2d\u5168\u57df\u641c\u7d22\uff0c\u800c\u662f\u9650\u5236\u5728\u7ea6\u675f\u6761\u4ef6\u6210\u7acb\u7684\u96c6\u5408\uff08\u4e00\u6761\u66f2\u7ebf\u6216\u66f2\u9762\uff09\u4e0a\u3002</p> </li> <li> <p>\u5173\u952e\u89c1\u89e3\u662f\u51e0\u4f55\u5c42\u9762\u7684\uff1a\u5728\u7ea6\u675f\u6700\u4f18\u89e3\u5904\uff0c\\(f\\) \u7684\u68af\u5ea6\u5fc5\u987b\u4e0e \\(g\\) \u7684\u68af\u5ea6\u5e73\u884c\u3002\u5982\u679c\u5b83\u4eec\u4e0d\u5e73\u884c\uff0c\u6211\u4eec\u53ef\u4ee5\u6cbf\u7740\u7ea6\u675f\u6761\u4ef6\u671d\u67d0\u4e2a\u65b9\u5411\u79fb\u52a8\uff0c\u4ece\u800c\u7ee7\u7eed\u6539\u8fdb \\(f\\) \u7684\u503c\uff0c\u8fd9\u610f\u5473\u7740\u8fd8\u6ca1\u6709\u8fbe\u5230\u6700\u4f18\u3002</p> </li> <li> <p>\u6211\u4eec\u5f15\u5165\u4e00\u4e2a\u65b0\u53d8\u91cf \\(\\lambda\\)\uff08\u62c9\u683c\u6717\u65e5\u4e58\u6570\uff09\uff0c\u5b9a\u4e49\u62c9\u683c\u6717\u65e5\u51fd\u6570\uff1a</p> </li> </ul> \\[\\mathcal{L}(x, y, \\lambda) = f(x, y) - \\lambda(g(x, y) - c)\\] <ul> <li>\u4ee4\u6240\u6709\u504f\u5bfc\u6570\u4e3a\u96f6\uff0c\u5f97\u5230\u4e00\u4e2a\u65b9\u7a0b\u7ec4\uff0c\u5176\u89e3\u5373\u4e3a\u7ea6\u675f\u6700\u4f18\u89e3\uff1a</li> </ul> \\[\\frac{\\partial \\mathcal{L}}{\\partial x} = 0, \\quad \\frac{\\partial \\mathcal{L}}{\\partial y} = 0, \\quad \\frac{\\partial \\mathcal{L}}{\\partial \\lambda} = 0\\] <p></p> <ul> <li>\u4f8b\u5982\uff0c\u5728 \\(x^2 + y^2 = 1\\) \u7684\u7ea6\u675f\u4e0b\u6700\u5927\u5316 \\(f(x,y) = x^2 y\\)\u3002\u62c9\u683c\u6717\u65e5\u51fd\u6570\u4e3a \\(\\mathcal{L} = x^2 y - \\lambda(x^2 + y^2 - 1)\\)\u3002\u6c42\u504f\u5bfc\uff1a</li> </ul> \\[2xy - 2\\lambda x = 0, \\quad x^2 - 2\\lambda y = 0, \\quad x^2 + y^2 = 1\\] <ul> <li> <p>\u7531\u7b2c\u4e00\u4e2a\u65b9\u7a0b\uff08\u5047\u8bbe \\(x \\neq 0\\)\uff09\uff1a\\(\\lambda = y\\)\u3002\u4ee3\u5165\u7b2c\u4e8c\u4e2a\u65b9\u7a0b\uff1a\\(x^2 = 2y^2\\)\u3002\u7ed3\u5408\u7ea6\u675f\u6761\u4ef6\uff1a\\(2y^2 + y^2 = 1\\)\uff0c\u5f97 \\(y = \\frac{1}{\\sqrt{3}}\\)\u3002\u6700\u5927\u503c\u4e3a \\(f = \\frac{2}{3\\sqrt{3}}\\)\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u4e0d\u7b49\u5f0f\u7ea6\u675f\uff08\\(g(x,y) \\leq c\\) \u800c\u975e \\(= c\\)\uff09\uff0cKarush-Kuhn-Tucker\uff08KKT\uff09\u6761\u4ef6\u63a8\u5e7f\u4e86\u62c9\u683c\u6717\u65e5\u4e58\u6570\u6cd5\u3002\u7ea6\u675f\u8981\u4e48\u662f\u6fc0\u6d3b\u7684\uff08\u6709\u6548\u7ea6\u675f\uff0c\u6309\u7b49\u5f0f\u5904\u7406\uff09\uff0c\u8981\u4e48\u662f\u975e\u6fc0\u6d3b\u7684\uff08\u89e3\u5728\u5185\u90e8\uff0c\u7ea6\u675f\u65e0\u5173\u7d27\u8981\uff09\u3002</p> </li> <li> <p>\u5728\u5b9e\u8df5\u4e2d\uff0c\u6211\u4eec\u5f88\u5c11\u624b\u5de5\u8fdb\u884c\u4f18\u5316\u3002\u4ee5\u4e0b\u662f\u4e3b\u8981\u7684\u7b97\u6cd5\u5bb6\u65cf\uff1a</p> <ul> <li> <p>\u4e00\u9636\u65b9\u6cd5\uff08\u4ec5\u4f7f\u7528\u68af\u5ea6\uff09\uff1a\u68af\u5ea6\u4e0b\u964d\u3001\u968f\u673a\u68af\u5ea6\u4e0b\u964d\uff08SGD\uff09\u3001Adam\u3002\u8fd9\u4e9b\u65b9\u6cd5\u6bcf\u6b65\u8ba1\u7b97\u6210\u672c\u4f4e\uff0c\u4f46\u6536\u655b\u53ef\u80fd\u8f83\u6162\uff0c\u5c24\u5176\u662f\u5728\u75c5\u6001\u95ee\u9898\u4e0a\u3002</p> </li> <li> <p>\u4e8c\u9636\u65b9\u6cd5\uff08\u4f7f\u7528\u68af\u5ea6\u548c Hessian \u77e9\u9635\uff09\uff1a\u725b\u987f\u6cd5\u6536\u655b\u5feb\uff0c\u4f46\u8ba1\u7b97\u548c\u6c42\u9006 Hessian \u77e9\u9635\u4ee3\u4ef7\u9ad8\u6602\uff08\u5bf9\u4e8e \\(n\\) \u4e2a\u53c2\u6570\u4e3a \\(O(n^3)\\)\uff09\u3002\u62df\u725b\u987f\u6cd5\uff08\u5982 BFGS \u548c L-BFGS\uff09\u4ec5\u5229\u7528\u68af\u5ea6\u4fe1\u606f\u8fd1\u4f3c Hessian \u77e9\u9635\uff0c\u6bd4\u4e00\u9636\u65b9\u6cd5\u6536\u655b\u66f4\u5feb\uff0c\u53c8\u65e0\u9700\u627f\u62c5\u5b8c\u5168\u7684\u4e8c\u9636\u65b9\u6cd5\u8ba1\u7b97\u6210\u672c\u3002</p> </li> <li> <p>\u5171\u8f6d\u68af\u5ea6\u6cd5\uff1a\u9002\u7528\u4e8e\u5927\u578b\u7a00\u758f\u7cfb\u7edf\uff0c\u4ec5\u9700\u77e9\u9635-\u5411\u91cf\u4e58\u79ef\uff0c\u65e0\u9700\u5b58\u50a8\u5b8c\u6574\u7684 Hessian \u77e9\u9635\u3002</p> </li> <li> <p>\u9ad8\u65af-\u725b\u987f\u6cd5\u548c\u83b1\u6587\u8d1d\u683c-\u9a6c\u5938\u5c14\u7279\u6cd5\uff1a\u4e13\u95e8\u7528\u4e8e\u6700\u5c0f\u4e8c\u4e58\u95ee\u9898\uff08\u5728\u56de\u5f52\u4e2d\u5e38\u89c1\uff09\uff0c\u901a\u8fc7 Jacobian \u77e9\u9635\u8fd1\u4f3c Hessian \u77e9\u9635\u3002</p> </li> <li> <p>\u81ea\u7136\u68af\u5ea6\u4e0b\u964d\uff1a\u5229\u7528 Fisher \u4fe1\u606f\u77e9\u9635\u8003\u8651\u53c2\u6570\u7a7a\u95f4\u7684\u51e0\u4f55\u7ed3\u6784\uff0c\u5bf9\u6982\u7387\u6a21\u578b\u53ef\u80fd\u66f4\u6709\u6548\u3002</p> </li> </ul> </li> <li> <p>\u4f18\u5316\u5668\u7684\u9009\u62e9\u53d6\u51b3\u4e8e\u5177\u4f53\u95ee\u9898\u3002\u5bf9\u4e8e\u6df1\u5ea6\u5b66\u4e60\uff0c\u4e00\u9636\u65b9\u6cd5\uff08\u5c24\u5176\u662f Adam\uff09\u5360\u4e3b\u5bfc\u5730\u4f4d\uff0c\u56e0\u4e3a\u53c2\u6570\u91cf\u5de8\u5927\uff08\u6570\u767e\u4e07\u5230\u6570\u5341\u4ebf\uff09\uff0c\u8ba1\u7b97 Hessian \u77e9\u9635\u4e0d\u5207\u5b9e\u9645\u3002\u5bf9\u4e8e\u76ee\u6807\u51fd\u6570\u5149\u6ed1\u7684\u5c0f\u89c4\u6a21\u95ee\u9898\uff0c\u4e8c\u9636\u65b9\u6cd5\u53ef\u80fd\u5feb\u5f97\u591a\u3002</p> </li> </ul>"},{"location":"chapter%2003%3A%20calculus/05.%20optimisation/#colab-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u5728 CoLab \u6216 notebook \u4e2d\u5b8c\u6210\uff09","text":"<ol> <li> <p>\u5b9e\u73b0\u725b\u987f\u6cd5\u6c42 \\(\\sqrt{7}\\)\uff08\u5373 \\(f(x) = x^2 - 7\\) \u7684\u96f6\u70b9\uff09\u3002\u89c2\u5bdf\u5176\u5feb\u901f\u6536\u655b\u3002 <pre><code>import jax.numpy as jnp\n\nf = lambda x: x**2 - 7\ndf = lambda x: 2*x\n\nx = 3.0  # \u521d\u59cb\u731c\u6d4b\nfor i in range(6):\n    x = x - f(x) / df(x)\n    print(f\"step {i+1}: x = {x:.10f}  (error: {abs(x - jnp.sqrt(7.0)):.2e})\")\n</code></pre></p> </li> <li> <p>\u4f7f\u7528\u68af\u5ea6\u4e0b\u964d\u6700\u5c0f\u5316 \\(f(x, y) = (x - 3)^2 + (y + 1)^2\\)\u3002\u6700\u5c0f\u503c\u5728 \\((3, -1)\\) \u5904\u3002\u5c1d\u8bd5\u4e0d\u540c\u7684\u5b66\u4e60\u7387\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\ndef f(params):\n    x, y = params\n    return (x - 3)**2 + (y + 1)**2\n\ngrad_f = jax.grad(f)\nparams = jnp.array([0.0, 0.0])\nlr = 0.1\n\nfor i in range(20):\n    g = grad_f(params)\n    params = params - lr * g\n    if i % 5 == 0 or i == 19:\n        print(f\"step {i:2d}: ({params[0]:.4f}, {params[1]:.4f})  loss={f(params):.6f}\")\n</code></pre></p> </li> <li> <p>\u6570\u503c\u6c42\u89e3\u7ea6\u675f\u4f18\u5316\u95ee\u9898\u3002\u5728 \\(x + y = 10\\) \u7684\u7ea6\u675f\u4e0b\u6700\u5927\u5316 \\(f(x,y) = xy\\)\uff0c\u901a\u8fc7\u53c2\u6570\u5316 \\(y = 10 - x\\) \u5e76\u6c42\u5355\u53d8\u91cf\u51fd\u6570\u7684\u6700\u4f18\u503c\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\n# \u4ee3\u5165\u7ea6\u675f\u6761\u4ef6\uff1ay = 10 - x\uff0c\u6240\u4ee5 f = x(10 - x) = 10x - x\u00b2\nf = lambda x: x * (10 - x)\ndf = jax.grad(f)\n\n# \u68af\u5ea6\u4e0a\u5347\uff08\u6211\u4eec\u8981\u6c42\u6700\u5927\u503c\uff0c\u6240\u4ee5\u52a0\u4e0a\u68af\u5ea6\uff09\nx = 1.0\nlr = 0.1\nfor i in range(20):\n    x = x + lr * df(x)\nprint(f\"x={x:.4f}, y={10-x:.4f}, f={f(x):.4f}\")  # \u5e94\u4e3a x=5, y=5, f=25\n</code></pre></p> </li> </ol>"},{"location":"chapter%2004%3A%20statistics/01.%20fundamentals/","title":"\u7edf\u8ba1\u5b66\u57fa\u7840","text":"<p>\u7edf\u8ba1\u5b66\u63d0\u4f9b\u4e86\u63cf\u8ff0\u6570\u636e\u548c\u91cf\u5316\u4e0d\u786e\u5b9a\u6027\u7684\u8bed\u8a00\u3002\u672c\u8282\u6db5\u76d6\u5206\u5e03\u3001\u968f\u673a\u53d8\u91cf\u3001PMF\u3001PDF\u3001CDF\u3001\u671f\u671b\u3001\u65b9\u5dee\u3001\u77e9\u4ee5\u53ca\u4e2d\u5fc3\u6781\u9650\u5b9a\u7406\u2014\u2014\u8fd9\u4e9b\u6982\u5ff5\u652f\u6491\u7740\u6bcf\u4e00\u4e2a\u673a\u5668\u5b66\u4e60\u8bc4\u4f30\u6307\u6807\u548c\u635f\u5931\u51fd\u6570\u3002</p> <ul> <li> <p>\u7edf\u8ba1\u5b66\u662f\u4ece\u6570\u636e\u4e2d\u5b66\u4e60\u7684\u79d1\u5b66\u3002\u4f60\u6536\u96c6\u89c2\u6d4b\u503c\uff0c\u5bf9\u5176\u8fdb\u884c\u6c47\u603b\uff0c\u5e76\u5f97\u51fa\u7ed3\u8bba\u2014\u2014\u901a\u5e38\u9488\u5bf9\u90a3\u4e9b\u65e0\u6cd5\u76f4\u63a5\u6d4b\u91cf\u7684\u4e8b\u7269\u3002</p> </li> <li> <p>\u5047\u8bbe\u4f60\u60f3\u77e5\u9053\u67d0\u4e2a\u56fd\u5bb6\u6240\u6709\u6210\u5e74\u4eba\u7684\u5e73\u5747\u8eab\u9ad8\u3002\u4f60\u4e0d\u53ef\u80fd\u6d4b\u91cf\u6bcf\u4e00\u4e2a\u4eba\uff0c\u56e0\u6b64\u4f60\u6d4b\u91cf\u4e00\u4e2a\u6837\u672c\uff0c\u5e76\u5229\u7528\u7edf\u8ba1\u5b66\u5bf9\u6574\u4e2a\u603b\u4f53\u505a\u51fa\u6709\u6839\u636e\u7684\u63a8\u6d4b\u3002</p> </li> <li> <p>\u7edf\u8ba1\u5b66\u6709\u4e24\u4e2a\u4e3b\u8981\u5206\u652f\uff1a</p> <ul> <li>\u63cf\u8ff0\u6027\u7edf\u8ba1\uff1a\u5bf9\u5df2\u6709\u6570\u636e\u8fdb\u884c\u6c47\u603b\uff08\u5e73\u5747\u503c\u3001\u56fe\u8868\u3001\u8868\u683c\uff09</li> <li>\u63a8\u65ad\u6027\u7edf\u8ba1\uff1a\u5229\u7528\u6837\u672c\u5bf9\u66f4\u5927\u7fa4\u4f53\u505a\u51fa\u63a8\u65ad</li> </ul> </li> <li> <p>\u7edf\u8ba1\u5b66\u7684\u57fa\u672c\u6784\u4ef6\u662f\u5206\u5e03\u2014\u2014\u4e00\u79cd\u63cf\u8ff0\u6570\u503c\u5982\u4f55\u5206\u5e03\u7684\u65b9\u5f0f\u3002\u5176\u4ed6\u4e00\u5207\u2014\u2014\u5e73\u5747\u503c\u3001\u68c0\u9a8c\u3001\u9884\u6d4b\u2014\u2014\u90fd\u6e90\u4e8e\u5bf9\u5206\u5e03\u7684\u7406\u89e3\u3002</p> </li> <li> <p>\u9891\u7387\u5206\u5e03\u7edf\u8ba1\u6570\u636e\u4e2d\u6bcf\u4e2a\u503c\uff08\u6216\u503c\u533a\u95f4\uff09\u51fa\u73b0\u7684\u6b21\u6570\u3002\u60f3\u8c61\u4e00\u4e0b\u628a\u8003\u8bd5\u6210\u7ee9\u5206\u5230\u4e0d\u540c\u7684\u533a\u95f4\uff0c\u7136\u540e\u7edf\u8ba1\u6bcf\u4e2a\u533a\u95f4\u4e2d\u6709\u591a\u5c11\u5b66\u751f\u3002\u7ed3\u679c\u5c31\u662f\u76f4\u65b9\u56fe\u3002</p> </li> <li> <p>\u6982\u7387\u5206\u5e03\u7528\u6982\u7387\u4ee3\u66ff\u539f\u59cb\u8ba1\u6570\u3002\u5b83\u4e0d\u8bf4\"12 \u540d\u5b66\u751f\u7684\u5206\u6570\u5728 70 \u5230 80 \u4e4b\u95f4\"\uff0c\u800c\u662f\u8bf4\"\u5206\u6570\u5728 70 \u5230 80 \u4e4b\u95f4\u7684\u6982\u7387\u4e3a 0.24\"\u3002\u5f53\u6570\u636e\u8fde\u7eed\u65f6\uff0c\u76f4\u65b9\u56fe\u7684\u67f1\u72b6\u4f1a\u53d8\u6210\u4e00\u6761\u5e73\u6ed1\u66f2\u7ebf\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u5de6\u4fa7\u7684\u76f4\u65b9\u56fe\u57fa\u4e8e\u4f60\u5b9e\u9645\u6536\u96c6\u7684\u6570\u636e\u6784\u5efa\u3002\u53f3\u4fa7\u7684\u5e73\u6ed1\u66f2\u7ebf\u662f\u4e00\u4e2a\u6570\u5b66\u6a21\u578b\uff0c\u63cf\u8ff0\u4e86\u6570\u636e\u80cc\u540e\u7684\u6a21\u5f0f\u3002\u4e00\u4e2a\u662f\u7ecf\u9a8c\u6027\u7684\uff0c\u53e6\u4e00\u4e2a\u662f\u7406\u8bba\u6027\u7684\u3002</p> </li> <li> <p>\u4e3a\u4e86\u4ece\u6570\u5b66\u4e0a\u5904\u7406\u5206\u5e03\uff0c\u6211\u4eec\u9700\u8981\u4e00\u79cd\u5c06\u7ed3\u679c\u8d4b\u4e88\u6570\u503c\u7684\u65b9\u6cd5\u3002\u8fd9\u6b63\u662f\u968f\u673a\u53d8\u91cf\u6240\u505a\u7684\u3002</p> </li> <li> <p>\u968f\u673a\u53d8\u91cf\u662f\u4e00\u4e2a\u5c06\u6bcf\u6b21\u8bd5\u9a8c\u7684\u7ed3\u679c\u6620\u5c04\u5230\u5b9e\u6570\u7684\u51fd\u6570\u3002\u629b\u4e00\u679a\u786c\u5e01\uff1a\u7ed3\u679c\u662f\"\u6b63\u9762\"\u6216\"\u53cd\u9762\"\uff0c\u4f46\u968f\u673a\u53d8\u91cf \\(X\\) \u5c06\u5176\u8f6c\u6362\u4e3a \\(X(\u6b63\u9762) = 1\\) \u548c \\(X(\u53cd\u9762) = 0\\)\u3002\u73b0\u5728\u6211\u4eec\u5c31\u53ef\u4ee5\u8fdb\u884c\u7b97\u672f\u8fd0\u7b97\u4e86\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u79bb\u6563\u968f\u673a\u53d8\u91cf\u53d6\u503c\u4e3a\u53ef\u6570\u96c6\uff1a10 \u6b21\u629b\u63b7\u4e2d\u7684\u6b63\u9762\u6b21\u6570\u3001\u9ab0\u5b50\u7684\u70b9\u6570\u3001\u4e00\u5c0f\u65f6\u5185\u6536\u5230\u7684\u7535\u5b50\u90ae\u4ef6\u6570\u91cf\u3002</p> </li> <li> <p>\u8fde\u7eed\u968f\u673a\u53d8\u91cf\u53ef\u4ee5\u5728\u4e00\u4e2a\u533a\u95f4\u5185\u53d6\u4efb\u610f\u503c\uff1a\u4f60\u7684\u7cbe\u786e\u8eab\u9ad8\u3001\u4e0b\u4e00\u73ed\u516c\u4ea4\u8f66\u5230\u8fbe\u7684\u65f6\u95f4\u3001\u4e2d\u5348\u7684\u6e29\u5ea6\u3002</p> </li> <li> <p>\u8fd9\u79cd\u533a\u522b\u5f88\u91cd\u8981\uff0c\u56e0\u4e3a\u5b83\u6539\u53d8\u4e86\u6211\u4eec\u8ba1\u7b97\u6982\u7387\u7684\u65b9\u5f0f\u3002\u5bf9\u4e8e\u79bb\u6563\u53d8\u91cf\uff0c\u6211\u4eec\u6c42\u548c\u3002\u5bf9\u4e8e\u8fde\u7eed\u53d8\u91cf\uff0c\u6211\u4eec\u79ef\u5206\uff08\u56de\u987e\u7b2c 3 \u7ae0\u7684\u79ef\u5206\u5185\u5bb9\uff09\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u79bb\u6563\u968f\u673a\u53d8\u91cf\uff0c\u6982\u7387\u8d28\u91cf\u51fd\u6570\uff08PMF\uff09\u7ed9\u51fa\u6bcf\u4e2a\u5177\u4f53\u503c\u7684\u6982\u7387\uff1a</p> </li> </ul> \\[P(X = x) = p(x), \\quad \\text{\u5176\u4e2d } \\sum_{x} p(x) = 1\\] <ul> <li>\u5bf9\u4e8e\u8fde\u7eed\u968f\u673a\u53d8\u91cf\uff0c\u6982\u7387\u5bc6\u5ea6\u51fd\u6570\uff08PDF\uff09\u7ed9\u51fa\u843d\u5728\u67d0\u4e2a\u533a\u95f4\u5185\u7684\u6982\u7387\u3002\u4efb\u4f55\u5355\u4e2a\u7cbe\u786e\u503c\u7684\u6982\u7387\u4e3a\u96f6\uff1b\u53ea\u6709\u533a\u95f4\u624d\u5177\u6709\u6b63\u6982\u7387\uff1a</li> </ul> \\[P(a \\le X \\le b) = \\int_a^b f(x)\\, dx, \\quad \\text{\u5176\u4e2d } \\int_{-\\infty}^{\\infty} f(x)\\, dx = 1\\] <ul> <li> <p>\u65e2\u7136\u6211\u4eec\u53ef\u4ee5\u5c06\u7ed3\u679c\u8d4b\u4e88\u6570\u503c\uff0c\u6700\u81ea\u7136\u7684\u95ee\u9898\u5c31\u662f\uff1a\u5e73\u5747\u800c\u8a00\u6211\u4eec\u671f\u671b\u5f97\u5230\u4ec0\u4e48\u503c\uff1f</p> </li> <li> <p>\u671f\u671b\uff08\u6216\u671f\u671b\u503c\uff09\u662f\u6240\u6709\u53ef\u80fd\u503c\u7684\u52a0\u6743\u5e73\u5747\u503c\uff0c\u6743\u91cd\u5373\u4e3a\u6982\u7387\u3002\u53ef\u4ee5\u5c06\u5176\u89c6\u4e3a\u5206\u5e03\u7684\"\u91cd\u5fc3\"\u3002</p> </li> <li> <p>\u5982\u679c\u4f60\u591a\u6b21\u63b7\u4e00\u4e2a\u516c\u5e73\u7684\u9ab0\u5b50\uff0c\u4f60\u7684\u5e73\u5747\u63b7\u70b9\u6570\u4f1a\u6536\u655b\u5230 3.5\u3002\u8fd9\u5c31\u662f\u671f\u671b\u503c\uff0c\u5c3d\u7ba1\u4f60\u5b9e\u9645\u4e0a\u6c38\u8fdc\u63b7\u4e0d\u51fa 3.5\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u79bb\u6563\u968f\u673a\u53d8\u91cf\uff1a</p> </li> </ul> \\[E[X] = \\sum_{x} x \\cdot p(x)\\] <ul> <li>\u5bf9\u4e8e\u8fde\u7eed\u968f\u673a\u53d8\u91cf\uff08\u4f7f\u7528\u7b2c 3 \u7ae0\u7684\u79ef\u5206\uff09\uff1a</li> </ul> \\[E[X] = \\int_{-\\infty}^{\\infty} x \\cdot f(x)\\, dx\\] <ul> <li>\u793a\u4f8b\uff1a\u4e00\u4e2a\u516c\u5e73\u7684\u516d\u9762\u9ab0\u5b50\uff0c\u5bf9\u4e8e \\(x = 1, 2, 3, 4, 5, 6\\)\uff0c\u6709 \\(p(x) = 1/6\\)\u3002</li> </ul> \\[E[X] = 1 \\cdot \\tfrac{1}{6} + 2 \\cdot \\tfrac{1}{6} + 3 \\cdot \\tfrac{1}{6} + 4 \\cdot \\tfrac{1}{6} + 5 \\cdot \\tfrac{1}{6} + 6 \\cdot \\tfrac{1}{6} = \\frac{21}{6} = 3.5\\] <ul> <li> <p>\u671f\u671b\u5177\u6709\u7ebf\u6027\u6027\u8d28\uff0c\u5373 \\(E[aX + b] = aE[X] + b\\)\u3002\u8fd9\u4e00\u6027\u8d28\u6781\u5176\u6709\u7528\uff0c\u5728\u673a\u5668\u5b66\u4e60\u635f\u5931\u51fd\u6570\u4e2d\u9891\u7e41\u51fa\u73b0\u3002</p> </li> <li> <p>\u671f\u671b\u544a\u8bc9\u6211\u4eec\u4e2d\u5fc3\u4f4d\u7f6e\uff0c\u4f46\u5b8c\u5168\u6ca1\u6709\u8bf4\u660e\u6570\u503c\u7684\u5206\u6563\u7a0b\u5ea6\u3002\u4e3a\u4e86\u63cf\u8ff0\u5206\u5e03\u7684\u5b8c\u6574\u5f62\u72b6\uff0c\u6211\u4eec\u9700\u8981\u77e9\u3002</p> </li> <li> <p>\u77e9\u662f \\(X\\) \u7684\u67d0\u6b21\u5e42\u7684\u671f\u671b\u3002\u7b2c \\(k\\) \u9636\u539f\u70b9\u77e9\u4e3a\uff1a</p> </li> </ul> \\[\\mu_k' = E[X^k]\\] <ul> <li> <p>\u4e00\u9636\u539f\u70b9\u77e9\uff08\\(k = 1\\)\uff09\u5c31\u662f\u5747\u503c\uff1a\\(\\mu_1' = E[X] = \\mu\\)\u3002</p> </li> <li> <p>\u539f\u70b9\u77e9\u662f\u4ece\u96f6\u70b9\u5f00\u59cb\u5ea6\u91cf\u7684\u3002\u901a\u5e38\u6211\u4eec\u66f4\u5173\u5fc3\u76f8\u5bf9\u4e8e\u5747\u503c\u7684\u504f\u5dee\u3002\u7b2c \\(k\\) \u9636\u4e2d\u5fc3\u77e9\u5c06\u6d4b\u91cf\u4e2d\u5fc3\u5316\uff1a</p> </li> </ul> \\[\\mu_k = E[(X - \\mu)^k]\\] <ul> <li> <p>\u4e00\u9636\u4e2d\u5fc3\u77e9\u59cb\u7ec8\u4e3a\u96f6\uff08\u5747\u503c\u4e0a\u4e0b\u65b9\u7684\u504f\u5dee\u76f8\u4e92\u62b5\u6d88\uff09\u3002\u4e8c\u9636\u4e2d\u5fc3\u77e9\u5c31\u662f\u65b9\u5dee\u3002</p> </li> <li> <p>\u4e3a\u4e86\u6bd4\u8f83\u4e0d\u540c\u5c3a\u5ea6\u4e0a\u7684\u5206\u5e03\uff0c\u6211\u4eec\u901a\u8fc7\u9664\u4ee5\u6807\u51c6\u5dee \\(\\sigma\\) \u7684\u9002\u5f53\u5e42\u6b21\u6765\u8fdb\u884c\u6807\u51c6\u5316\uff1a</p> </li> </ul> \\[\\tilde{\\mu}_k = \\frac{\\mu_k}{\\sigma^k}\\] <ul> <li>\u6bcf\u4e2a\u77e9\u6355\u6349\u5206\u5e03\u5f62\u72b6\u7684\u4e0d\u540c\u65b9\u9762\uff1a</li> </ul> <p></p> <ul> <li>1 \u9636\u77e9\uff08\u5747\u503c\uff09\uff1a\u5206\u5e03\u7684\u4e2d\u5fc3\u4f4d\u7f6e\u3002\u5e73\u8861\u70b9\u3002</li> <li>2 \u9636\u77e9\uff08\u65b9\u5dee\uff09\uff1a\u6570\u503c\u56f4\u7ed5\u5747\u503c\u7684\u5206\u6563\u7a0b\u5ea6\u3002\u65b9\u5dee\u8d8a\u5927\uff0c\u5206\u5e03\u8d8a\u5bbd\u3002</li> <li>3 \u9636\u77e9\uff08\u504f\u5ea6\uff09\uff1a\u5206\u5e03\u5411\u5de6\u8fd8\u662f\u5411\u53f3\u503e\u659c\u3002\u504f\u5ea6\u4e3a\u96f6\u8868\u793a\u5bf9\u79f0\u3002</li> <li> <p>4 \u9636\u77e9\uff08\u5cf0\u5ea6\uff09\uff1a\u5c3e\u90e8\u7684\u91cd\u91cf\u3002\u5cf0\u5ea6\u8d8a\u9ad8\uff0c\u6781\u7aef\u5f02\u5e38\u503c\u8d8a\u591a\u3002</p> </li> <li> <p>\u8ba9\u6211\u4eec\u5bf9\u5177\u4f53\u6570\u636e\u96c6 \\(X = \\{2, 4, 4, 4, 5, 5, 7, 9\\}\\) \u8ba1\u7b97\u5168\u90e8\u56db\u4e2a\u77e9\u3002</p> </li> <li> <p>\u6b65\u9aa4 1\uff1a\u5747\u503c\uff08\u4e00\u9636\u539f\u70b9\u77e9\uff09</p> </li> </ul> \\[\\mu = \\frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = \\frac{40}{8} = 5\\] <ul> <li>\u6b65\u9aa4 2\uff1a\u65b9\u5dee\uff08\u4e8c\u9636\u4e2d\u5fc3\u77e9\uff09\u3002\u4ece\u6bcf\u4e2a\u503c\u4e2d\u51cf\u53bb\u5747\u503c\uff0c\u5e73\u65b9\uff0c\u7136\u540e\u53d6\u5e73\u5747\uff1a</li> </ul> \\[\\sigma^2 = \\frac{(2{-}5)^2 + (4{-}5)^2 + (4{-}5)^2 + (4{-}5)^2 + (5{-}5)^2 + (5{-}5)^2 + (7{-}5)^2 + (9{-}5)^2}{8}\\] \\[= \\frac{9 + 1 + 1 + 1 + 0 + 0 + 4 + 16}{8} = \\frac{32}{8} = 4\\] <ul> <li> <p>\u6807\u51c6\u5dee\u4e3a \\(\\sigma = \\sqrt{4} = 2\\)\u3002</p> </li> <li> <p>\u6b65\u9aa4 3\uff1a\u504f\u5ea6\uff08\u6807\u51c6\u5316\u4e09\u9636\u4e2d\u5fc3\u77e9\uff09\u3002\u504f\u5dee\u53d6\u4e09\u6b21\u65b9\uff0c\u6c42\u5e73\u5747\uff0c\u518d\u9664\u4ee5 \\(\\sigma^3\\)\uff1a</p> </li> </ul> \\[\\tilde{\\mu}_3 = \\frac{1}{8} \\cdot \\frac{(-3)^3 + (-1)^3 + (-1)^3 + (-1)^3 + 0^3 + 0^3 + 2^3 + 4^3}{2^3}\\] \\[= \\frac{1}{8} \\cdot \\frac{-27 -1 -1 -1 + 0 + 0 + 8 + 64}{8} = \\frac{42}{64} = 0.656\\] <ul> <li> <p>\u6b63\u504f\u5ea6\u8868\u793a\u53f3\u5c3e\u66f4\u957f\uff0c\u8fd9\u5f88\u5408\u7406\uff0c\u56e0\u4e3a 9 \u8fdc\u9ad8\u4e8e\u5747\u503c\u3002</p> </li> <li> <p>\u6b65\u9aa4 4\uff1a\u5cf0\u5ea6\uff08\u6807\u51c6\u5316\u56db\u9636\u4e2d\u5fc3\u77e9\uff09\u3002\u504f\u5dee\u53d6\u56db\u6b21\u65b9\uff1a</p> </li> </ul> \\[\\tilde{\\mu}_4 = \\frac{1}{8} \\cdot \\frac{(-3)^4 + (-1)^4 + (-1)^4 + (-1)^4 + 0^4 + 0^4 + 2^4 + 4^4}{2^4}\\] \\[= \\frac{1}{8} \\cdot \\frac{81 + 1 + 1 + 1 + 0 + 0 + 16 + 256}{16} = \\frac{356}{128} = 2.781\\] <ul> <li>\u6b63\u6001\u5206\u5e03\u7684\u5cf0\u5ea6\u4e3a 3\uff08\u79f0\u4e3a\"\u5e38\u5cf0\u6001\"\uff09\u3002\u6211\u4eec\u7684 2.781 \u5f88\u63a5\u8fd1\uff0c\u8868\u660e\u5c3e\u90e8\u5927\u81f4\u5448\u6b63\u6001\u3002\u5927\u4e8e 3 \u7684\u503c\uff08\"\u5c16\u5cf0\u6001\"\uff09\u8868\u793a\u5c3e\u90e8\u66f4\u91cd\uff1b\u5c0f\u4e8e 3\uff08\"\u4f4e\u5cf0\u6001\"\uff09\u8868\u793a\u5c3e\u90e8\u66f4\u8f7b\u3002\u67d0\u4e9b\u516c\u5f0f\u4f1a\u62a5\u544a\u8d85\u503c\u5cf0\u5ea6\uff08\u51cf\u53bb 3\uff09\uff0c\u56e0\u6b64\u6211\u4eec\u7684\u8d85\u503c\u5cf0\u5ea6\u4e3a \\(-0.219\\)\u3002</li> </ul>"},{"location":"chapter%2004%3A%20statistics/01.%20fundamentals/#colab-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ol> <li> <p>\u8ba1\u7b97\u4e00\u4e2a\u52a0\u8f7d\u9ab0\u5b50\u7684\u671f\u671b\u503c\uff0c\u5176\u4e2d\u9762 6 \u7684\u6982\u7387\u4e3a 0.3\uff0c\u5176\u4f59\u9762\u5747\u5206\u5269\u4f59\u6982\u7387\u3002\u901a\u8fc7\u6a21\u62df 100,000 \u6b21\u6295\u63b7\u8fdb\u884c\u9a8c\u8bc1\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\n# \u52a0\u8f7d\u9ab0\u5b50\uff1a\u9762 6 \u7684 p=0.3\uff0c\u5176\u4f59\u9762\u5747\u5206 0.7\nprobs = jnp.array([0.14, 0.14, 0.14, 0.14, 0.14, 0.30])\nfaces = jnp.array([1, 2, 3, 4, 5, 6])\n\n# \u89e3\u6790\u6cd5\u8ba1\u7b97\u671f\u671b\u503c\nev = jnp.sum(faces * probs)\nprint(f\"\u671f\u671b\u503c\uff08\u516c\u5f0f\u6cd5\uff09: {ev:.4f}\")\n\n# \u6a21\u62df\nkey = jax.random.PRNGKey(42)\nrolls = jax.random.choice(key, faces, shape=(100_000,), p=probs)\nprint(f\"\u671f\u671b\u503c\uff08\u6a21\u62df\u6cd5\uff09: {rolls.mean():.4f}\")\n</code></pre></p> </li> <li> <p>\u8ba1\u7b97\u793a\u4f8b\u6570\u636e\u96c6\u7684\u6240\u6709\u56db\u4e2a\u77e9\uff08\u5747\u503c\u3001\u65b9\u5dee\u3001\u504f\u5ea6\u3001\u5cf0\u5ea6\uff09\uff0c\u7136\u540e\u4fee\u6539\u6570\u636e\u5e76\u89c2\u5bdf\u6bcf\u4e2a\u77e9\u5982\u4f55\u53d8\u5316\u3002 <pre><code>import jax.numpy as jnp\n\nx = jnp.array([2, 4, 4, 4, 5, 5, 7, 9], dtype=jnp.float32)\n\nmean = jnp.mean(x)\nvariance = jnp.mean((x - mean) ** 2)\nstd = jnp.sqrt(variance)\nskewness = jnp.mean(((x - mean) / std) ** 3)\nkurtosis = jnp.mean(((x - mean) / std) ** 4)\n\nprint(f\"\u5747\u503c:     {mean:.3f}\")\nprint(f\"\u65b9\u5dee:     {variance:.3f}\")\nprint(f\"\u6807\u51c6\u5dee:   {std:.3f}\")\nprint(f\"\u504f\u5ea6:     {skewness:.3f}\")\nprint(f\"\u5cf0\u5ea6:     {kurtosis:.3f}\")\nprint(f\"\u8d85\u503c\u5cf0\u5ea6: {kurtosis - 3:.3f}\")\n</code></pre></p> </li> <li> <p>\u5e76\u6392\u53ef\u89c6\u5316\u516c\u5e73\u9ab0\u5b50\u7684 PMF \u548c CDF\u3002\u5c1d\u8bd5\u4fee\u6539\u6982\u7387\u4ee5\u89c2\u5bdf\u5f62\u72b6\u5982\u4f55\u53d8\u5316\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\nfaces = jnp.array([1, 2, 3, 4, 5, 6])\npmf = jnp.ones(6) / 6  # \u516c\u5e73\u9ab0\u5b50\uff1b\u8bd5\u8bd5\u4fee\u6539\u8fd9\u4e9b\u503c\uff01\ncdf = jnp.cumsum(pmf)\n\nfig, (ax1, ax2) = plt.subplots(1, 2, figsize=(10, 4))\n\nax1.bar(faces, pmf, color=\"#3498db\", alpha=0.8)\nax1.set_title(\"PMF\")\nax1.set_xlabel(\"\u9762\u503c\")\nax1.set_ylabel(\"P(X = x)\")\nax1.set_ylim(0, 0.5)\n\nax2.step(faces, cdf, where=\"mid\", color=\"#e74c3c\", linewidth=2)\nax2.set_title(\"CDF\")\nax2.set_xlabel(\"\u9762\u503c\")\nax2.set_ylabel(\"P(X \u2264 x)\")\nax2.set_ylim(0, 1.1)\n\nplt.tight_layout()\nplt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2004%3A%20statistics/02.%20measures/","title":"\u7edf\u8ba1\u91cf","text":"<p>\u7edf\u8ba1\u91cf\u7528\u5355\u4e2a\u6570\u503c\u6982\u62ec\u6570\u636e\uff0c\u6355\u6349\u5176\u79bb\u6563\u7a0b\u5ea6\u3001\u4f4d\u7f6e\u3001\u5f62\u72b6\u548c\u5173\u8054\u3002\u672c\u8282\u6db5\u76d6\u65b9\u5dee\u3001\u6807\u51c6\u5dee\u3001\u56db\u5206\u4f4d\u6570\u3001\u504f\u5ea6\u3001\u5cf0\u5ea6\u3001\u534f\u65b9\u5dee\u3001\u76f8\u5173\u548c z \u5206\u6570\u2014\u2014\u8fd9\u662f\u63a2\u7d22\u6027\u6570\u636e\u5206\u6790\u548c\u673a\u5668\u5b66\u4e60\u7279\u5f81\u5de5\u7a0b\u7684\u57fa\u7840\u5de5\u5177\u96c6\u3002</p> <ul> <li> <p>\u5728\u4e0a\u4e00\u8282\u4e2d\uff0c\u6211\u4eec\u4ecb\u7ecd\u4e86\u77e9\u4f5c\u4e3a\u4e00\u7ec4\u6982\u62ec\u6027\u7edf\u8ba1\u91cf\u5bb6\u65cf\u3002\u5728\u6b64\uff0c\u6211\u4eec\u5c55\u5f00\u8ba8\u8bba\u4ece\u77e9\u4e2d\u884d\u751f\u51fa\u7684\u5b9e\u7528\u5de5\u5177\uff1a\u5ea6\u91cf\u79bb\u6563\u7a0b\u5ea6\u3001\u4f4d\u7f6e\u3001\u5f62\u72b6\u548c\u5173\u8054\u7684\u7edf\u8ba1\u91cf\u3002</p> </li> <li> <p>\u79bb\u6563\u7a0b\u5ea6\u56de\u7b54\u4e86\u8fd9\u6837\u4e00\u4e2a\u95ee\u9898\uff1a\u6570\u636e\u7684\u5206\u5e03\u6709\u591a\u5206\u6563\uff1f\u4e24\u4e2a\u73ed\u7ea7\u7684\u5e73\u5747\u8003\u8bd5\u6210\u7ee9\u53ef\u80fd\u76f8\u540c\uff0c\u4f46\u5176\u5206\u6563\u7a0b\u5ea6\u5374\u53ef\u80fd\u5927\u76f8\u5f84\u5ead\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u7a84\uff08\u84dd\u8272\uff09\u5206\u5e03\u7684\u65b9\u5dee\u8f83\u5c0f\uff1a\u5927\u90e8\u5206\u6570\u503c\u7d27\u5bc6\u805a\u96c6\u5728\u5747\u503c\u5468\u56f4\u3002\u5bbd\uff08\u7ea2\u8272\uff09\u5206\u5e03\u7684\u65b9\u5dee\u8f83\u5927\uff1a\u6570\u503c\u6563\u5e03\u5f97\u66f4\u8fdc\u3002</p> </li> <li> <p>\u65b9\u5dee\u662f\u8ddd\u5747\u503c\u8ddd\u79bb\u7684\u5e73\u65b9\u7684\u5e73\u5747\u503c\u3002\u53d6\u5e73\u65b9\u662f\u4e3a\u4e86\u907f\u514d\u6b63\u8d1f\u504f\u5dee\u76f8\u4e92\u62b5\u6d88\u3002</p> </li> </ul> \\[\\sigma^2 = \\frac{1}{N} \\sum_{i=1}^{N} (x_i - \\mu)^2\\] <ul> <li>\u5f53\u5904\u7406\u6837\u672c\uff08\u800c\u975e\u6574\u4e2a\u603b\u4f53\uff09\u65f6\uff0c\u6211\u4eec\u7528 \\(N - 1\\) \u800c\u4e0d\u662f \\(N\\) \u6765\u9664\u3002\u8fd9\u79cd\u4fee\u6b63\uff08\u79f0\u4e3a\u8d1d\u585e\u5c14\u6821\u6b63\uff09\u662f\u56e0\u4e3a\u6837\u672c\u5f80\u5f80\u4f1a\u4f4e\u4f30\u771f\u5b9e\u7684\u53d8\u5f02\u6027\uff1a</li> </ul> \\[s^2 = \\frac{1}{N-1} \\sum_{i=1}^{N} (x_i - \\bar{x})^2\\] <ul> <li> <p>\u6807\u51c6\u5dee\u662f\u65b9\u5dee\u7684\u5e73\u65b9\u6839\uff1a\\(\\sigma = \\sqrt{\\sigma^2}\\)\u3002\u5b83\u5c06\u5ea6\u91cf\u5355\u4f4d\u6062\u590d\u4e3a\u539f\u59cb\u5355\u4f4d\u3002\u5982\u679c\u6570\u636e\u7684\u5355\u4f4d\u662f\u5398\u7c73\uff0c\u65b9\u5dee\u7684\u5355\u4f4d\u662f cm\\(^2\\)\uff0c\u800c\u6807\u51c6\u5dee\u7684\u5355\u4f4d\u53c8\u56de\u5230\u4e86 cm\u3002</p> </li> <li> <p>\u5e73\u5747\u7edd\u5bf9\u504f\u5dee\uff08MAD\uff09\u662f\u4e00\u4e2a\u66f4\u7b80\u5355\u7684\u66ff\u4ee3\u65b9\u6848\u3002\u5b83\u4e0d\u53d6\u5e73\u65b9\uff0c\u800c\u662f\u53d6\u6bcf\u4e2a\u504f\u5dee\u7684\u7edd\u5bf9\u503c\uff1a</p> </li> </ul> \\[\\text{MAD} = \\frac{1}{N} \\sum_{i=1}^{N} |x_i - \\mu|\\] <ul> <li> <p>MAD \u5bf9\u65b9\u5dee\u800c\u8a00\u5bf9\u5f02\u5e38\u503c\u66f4\u7a33\u5065\uff0c\u56e0\u4e3a\u5b83\u4e0d\u4f1a\u901a\u8fc7\u5e73\u65b9\u6765\u653e\u5927\u5927\u7684\u504f\u5dee\u3002\u7136\u800c\uff0c\u65b9\u5dee\u5728\u6570\u5b66\u4e0a\u66f4\u4fbf\u5229\uff08\u5728\u8bc1\u660e\u548c\u673a\u5668\u5b66\u4e60\u4f18\u5316\u4e2d\u66f4\u5bb9\u6613\u5206\u89e3\uff09\u3002</p> </li> <li> <p>\u4f4d\u7f6e\u56de\u7b54\u4e86\u4e00\u4e2a\u4e0d\u540c\u7684\u95ee\u9898\uff1a\u7279\u5b9a\u6570\u503c\u76f8\u5bf9\u4e8e\u5176\u4f59\u6570\u636e\u7684\u4f4d\u7f6e\u5728\u54ea\u91cc\uff1f</p> </li> <li> <p>\u56db\u5206\u4f4d\u6570\u5c06\u6392\u5e8f\u540e\u7684\u6570\u636e\u5206\u6210\u56db\u4e2a\u76f8\u7b49\u7684\u90e8\u5206\u3002Q1\uff08\u7b2c 25 \u767e\u5206\u4f4d\u6570\uff09\u662f\u4f4e\u4e8e\u8be5\u503c\u7684\u6570\u636e\u5360 25% \u7684\u503c\u3002Q2 \u662f\u4e2d\u4f4d\u6570\uff08\u7b2c 50 \u767e\u5206\u4f4d\u6570\uff09\u3002Q3 \u662f\u7b2c 75 \u767e\u5206\u4f4d\u6570\u3002</p> </li> <li> <p>\u56db\u5206\u4f4d\u8ddd\uff08IQR\uff09\u662f \\(Q3 - Q1\\)\u3002\u5b83\u6355\u6349\u4e86\u4e2d\u95f4 50% \u6570\u636e\u7684\u79bb\u6563\u7a0b\u5ea6\uff0c\u6392\u9664\u4e86\u6781\u7aef\u503c\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u7bb1\u7ebf\u56fe\u662f\u7edf\u8ba1\u5b66\u4e2d\u6700\u6709\u7528\u7684\u53ef\u89c6\u5316\u5de5\u5177\u4e4b\u4e00\u3002\u7bb1\u4f53\u4ece Q1 \u5ef6\u4f38\u5230 Q3\uff0c\u4e2d\u95f4\u7684\u7ebf\u4e3a\u4e2d\u4f4d\u6570\uff0c\u987b\u7ebf\u5ef6\u4f38\u5230\u6700\u8fdc\u7684\u975e\u5f02\u5e38\u503c\uff0c\u800c\u987b\u7ebf\u4e4b\u5916\u7684\u70b9\u5219\u4e3a\u5f02\u5e38\u503c\u3002</p> </li> <li> <p>\u767e\u5206\u4f4d\u6570\u662f\u56db\u5206\u4f4d\u6570\u7684\u63a8\u5e7f\u3002\u7b2c \\(p\\) \u767e\u5206\u4f4d\u6570\u662f\u4f4e\u4e8e\u8be5\u503c\u7684\u89c2\u6d4b\u503c\u5360 \\(p\\%\\) \u7684\u503c\u3002Q1 \u662f\u7b2c 25 \u767e\u5206\u4f4d\u6570\uff0c\u4e2d\u4f4d\u6570\u662f\u7b2c 50 \u767e\u5206\u4f4d\u6570\uff0cQ3 \u662f\u7b2c 75 \u767e\u5206\u4f4d\u6570\u3002</p> </li> <li> <p>z \u5206\u6570\u544a\u8bc9\u4f60\u4e00\u4e2a\u503c\u8ddd\u5747\u503c\u6709\u591a\u5c11\u4e2a\u6807\u51c6\u5dee\uff1a</p> </li> </ul> \\[z = \\frac{x - \\mu}{\\sigma}\\] <ul> <li> <p>z \u5206\u6570\u4e3a 2 \u8868\u793a\u8be5\u503c\u9ad8\u4e8e\u5747\u503c 2 \u4e2a\u6807\u51c6\u5dee\u3002z \u5206\u6570\u4e3a \\(-1.5\\) \u8868\u793a\u4f4e\u4e8e\u5747\u503c 1.5 \u4e2a\u6807\u51c6\u5dee\u3002\u8fd9\u4e5f\u79f0\u4e3a\u6807\u51c6\u5316\uff0c\u5728\u673a\u5668\u5b66\u4e60\u4e2d\u5e7f\u6cdb\u7528\u4e8e\u7279\u5f81\u7f29\u653e\uff0c\u56e0\u4e3a\u5b83\u5c06\u4efb\u4f55\u5206\u5e03\u53d8\u6362\u4e3a\u5747\u503c\u4e3a 0\u3001\u6807\u51c6\u5dee\u4e3a 1\u3002</p> </li> <li> <p>\u5f62\u72b6\u63cf\u8ff0\u4e86\u5206\u5e03\u8d85\u51fa\u5176\u4e2d\u5fc3\u548c\u79bb\u6563\u7a0b\u5ea6\u4e4b\u5916\u7684\u51e0\u4f55\u7279\u5f81\u3002</p> </li> <li> <p>\u504f\u5ea6\uff08\u4e0a\u4e00\u8282\u4e2d\u7684\u6807\u51c6\u5316\u4e09\u9636\u77e9\uff09\u8861\u91cf\u4e0d\u5bf9\u79f0\u6027\u3002\u50cf\u6b63\u6001\u66f2\u7ebf\u8fd9\u6837\u5b8c\u5168\u5bf9\u79f0\u7684\u5206\u5e03\uff0c\u5176\u504f\u5ea6\u4e3a\u96f6\u3002\u6b63\u504f\u5ea6\u8868\u793a\u53f3\u5c3e\u8f83\u957f\uff08\u5982\u6536\u5165\u5206\u5e03\uff09\u3002\u8d1f\u504f\u5ea6\u8868\u793a\u5de6\u5c3e\u8f83\u957f\uff08\u5982\u9000\u4f11\u5e74\u9f84\u5206\u5e03\uff09\u3002</p> </li> </ul> \\[\\text{\u504f\u5ea6} = \\frac{1}{N} \\sum_{i=1}^{N} \\left(\\frac{x_i - \\mu}{\\sigma}\\right)^3\\] <ul> <li>\u5cf0\u5ea6\uff08\u6807\u51c6\u5316\u56db\u9636\u77e9\uff09\u8861\u91cf\u5c3e\u90e8\u539a\u5ea6\u3002\u6b63\u6001\u5206\u5e03\u7684\u5cf0\u5ea6\u4e3a 3\u3002\u5c3e\u90e8\u66f4\u539a\uff08\u66f4\u5bb9\u6613\u51fa\u73b0\u5f02\u5e38\u503c\uff09\u7684\u5206\u5e03\u7684\u5cf0\u5ea6\u5927\u4e8e 3\u3002</li> </ul> \\[\\text{\u5cf0\u5ea6} = \\frac{1}{N} \\sum_{i=1}^{N} \\left(\\frac{x_i - \\mu}{\\sigma}\\right)^4\\] <ul> <li>\u76f8\u5173\u8861\u91cf\u4e24\u4e2a\u53d8\u91cf\u4e4b\u95f4\u5173\u7cfb\u7684\u5f3a\u5ea6\u548c\u65b9\u5411\u3002\u5b83\u56de\u7b54\u4e86\uff1a\u5f53\u4e00\u4e2a\u53d8\u91cf\u4e0a\u5347\u65f6\uff0c\u53e6\u4e00\u4e2a\u53d8\u91cf\u503e\u5411\u4e8e\u4e0a\u5347\u3001\u4e0b\u964d\uff0c\u8fd8\u662f\u57fa\u672c\u4e0d\u53d8\uff1f</li> </ul> <p></p> <ul> <li>\u76ae\u5c14\u68ee\u76f8\u5173\uff08\\(r\\)\uff09\u8861\u91cf\u7ebf\u6027\u5173\u8054\u3002\u5176\u53d6\u503c\u8303\u56f4\u4ece \\(-1\\)\uff08\u5b8c\u5168\u8d1f\u76f8\u5173\uff09\u5230 \\(0\\)\uff08\u65e0\u76f8\u5173\uff09\u518d\u5230 \\(+1\\)\uff08\u5b8c\u5168\u6b63\u76f8\u5173\uff09\u3002</li> </ul> \\[r = \\frac{\\sum_{i=1}^{N} (x_i - \\bar{x})(y_i - \\bar{y})}{\\sqrt{\\sum (x_i - \\bar{x})^2} \\cdot \\sqrt{\\sum (y_i - \\bar{y})^2}}\\] <ul> <li> <p>\u5982\u679c\u4f60\u8fd8\u8bb0\u5f97\u7b2c 1 \u7ae0\u4e2d\u7684\u70b9\u79ef\uff0c\u76ae\u5c14\u68ee\u76f8\u5173\u672c\u8d28\u4e0a\u5c31\u662f \\(\\mathbf{x}\\) \u548c \\(\\mathbf{y}\\) \u5747\u503c\u4e2d\u5fc3\u5316\u4e4b\u540e\u7684\u4f59\u5f26\u76f8\u4f3c\u5ea6\u3002</p> </li> <li> <p>\u65af\u76ae\u5c14\u66fc\u76f8\u5173\uff08\\(\\rho\\)\uff09\u8861\u91cf\u5355\u8c03\u5173\u8054\u3002\u5b83\u4e0d\u4f7f\u7528\u539f\u59cb\u503c\uff0c\u800c\u662f\u5148\u5bf9\u5b83\u4eec\u8fdb\u884c\u6392\u5e8f\uff0c\u7136\u540e\u5728\u6392\u5e8f\u4e0a\u8ba1\u7b97\u76ae\u5c14\u68ee\u76f8\u5173\u3002\u8fd9\u4f7f\u5f97\u5b83\u5bf9\u5f02\u5e38\u503c\u7a33\u5065\uff0c\u5e76\u4e14\u5373\u4f7f\u5173\u7cfb\u662f\u975e\u7ebf\u6027\u7684\uff0c\u53ea\u8981\u662f\u4e00\u81f4\u9012\u589e\u6216\u9012\u51cf\u7684\uff0c\u4e5f\u80fd\u6b63\u5e38\u5de5\u4f5c\u3002</p> </li> <li> <p>\u51e0\u4f55\u5e73\u5747\u6570\u662f\u5f53\u6570\u503c\u76f8\u4e92\u4e58\u9664\u65f6\uff08\u5982\u589e\u957f\u7387\uff09\u5408\u9002\u7684\u5e73\u5747\u503c\u3002\u5982\u679c\u4f60\u7684\u6295\u8d44\u5206\u522b\u589e\u957f\u4e86 10%\u300120% \u548c 30%\uff0c\u90a3\u4e48\u5e73\u5747\u589e\u957f\u56e0\u5b50\u5e76\u4e0d\u662f\u8fd9\u4e9b\u589e\u957f\u7387\u7684\u7b97\u672f\u5e73\u5747\u6570\u3002\u800c\u662f\uff1a</p> </li> </ul> \\[\\bar{x}_{\\text{geo}} = \\left(\\prod_{i=1}^{N} x_i\\right)^{1/N}\\] <ul> <li> <p>\u5177\u4f53\u5230\u589e\u957f\u7387\uff0c\u5148\u5c06\u767e\u5206\u6bd4\u8f6c\u6362\u4e3a\u56e0\u5b50\uff081.10\u30011.20\u30011.30\uff09\uff0c\u8ba1\u7b97\u51e0\u4f55\u5e73\u5747\u6570\uff0c\u518d\u51cf\u53bb 1\u3002</p> </li> <li> <p>\u6307\u6570\u79fb\u52a8\u5e73\u5747\uff08EMA\uff09\u8d4b\u4e88\u6700\u8fd1\u89c2\u6d4b\u503c\u66f4\u9ad8\u7684\u6743\u91cd\u3002\u4e0e\u7b80\u5355\u79fb\u52a8\u5e73\u5747\u4e2d\u7a97\u53e3\u5185\u6240\u6709\u70b9\u6743\u91cd\u76f8\u7b49\u4e0d\u540c\uff0cEMA \u5448\u6307\u6570\u8870\u51cf\uff1a</p> </li> </ul> \\[\\text{EMA}_t = \\alpha \\cdot x_t + (1 - \\alpha) \\cdot \\text{EMA}_{t-1}\\] <ul> <li> <p>\u5e73\u6ed1\u56e0\u5b50 \\(\\alpha\\)\uff08\u4ecb\u4e8e 0 \u548c 1 \u4e4b\u95f4\uff09\u63a7\u5236\u65e7\u89c2\u6d4b\u503c\u5931\u53bb\u5f71\u54cd\u7684\u901f\u5ea6\u3002\\(\\alpha\\) \u8d8a\u5927\uff0c\u5bf9\u8fd1\u671f\u53d8\u5316\u7684\u54cd\u5e94\u8d8a\u7075\u654f\uff1b\\(\\alpha\\) \u8d8a\u5c0f\uff0c\u66f2\u7ebf\u8d8a\u5e73\u6ed1\u3002\u5728\u673a\u5668\u5b66\u4e60\u4e2d\uff0cEMA \u88ab\u7528\u4e8e Adam \u7b49\u4f18\u5316\u5668\u4ee5\u53ca\u6279\u5f52\u4e00\u5316\u7684\u8fd0\u884c\u7edf\u8ba1\u4e2d\u3002</p> </li> <li> <p>\u5f02\u5e38\u503c\u68c0\u6d4b\u8bc6\u522b\u51fa\u4e0e\u5176\u4f59\u6570\u636e\u5f02\u5e38\u9065\u8fdc\u7684\u6570\u70b9\u3002\u4e24\u79cd\u5e38\u7528\u65b9\u6cd5\uff1a</p> <ul> <li>IQR \u6cd5\uff1a\u5982\u679c\u4e00\u4e2a\u70b9\u4f4e\u4e8e \\(Q1 - 1.5 \\times \\text{IQR}\\) \u6216\u9ad8\u4e8e \\(Q3 + 1.5 \\times \\text{IQR}\\)\uff0c\u5219\u4e3a\u5f02\u5e38\u503c</li> <li>Z \u5206\u6570\u6cd5\uff1a\u5982\u679c \\(|z| &gt; 3\\)\uff08\u8ddd\u5747\u503c\u8d85\u8fc7 3 \u4e2a\u6807\u51c6\u5dee\uff09\uff0c\u5219\u4e3a\u5f02\u5e38\u503c</li> </ul> </li> <li> <p>IQR \u6cd5\u66f4\u7a33\u5065\uff0c\u56e0\u4e3a\u5b83\u4e0d\u5047\u8bbe\u6b63\u6001\u5206\u5e03\u3002Z \u5206\u6570\u6cd5\u5728\u6570\u636e\u8fd1\u4f3c\u6b63\u6001\u65f6\u6548\u679c\u826f\u597d\uff0c\u4f46\u5f53\u5206\u5e03\u9ad8\u5ea6\u504f\u659c\u65f6\u53ef\u80fd\u5931\u6548\u3002</p> </li> </ul>"},{"location":"chapter%2004%3A%20statistics/02.%20measures/#colab-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ol> <li> <p>\u8ba1\u7b97\u6570\u636e\u96c6\u7684\u65b9\u5dee\u3001\u6807\u51c6\u5dee\u548c MAD\uff0c\u5e76\u8fdb\u884c\u6bd4\u8f83\u3002\u89c2\u5bdf\u6dfb\u52a0\u6781\u7aef\u5f02\u5e38\u503c\u65f6\u53d1\u751f\u7684\u53d8\u5316\u3002 <pre><code>import jax.numpy as jnp\n\ndata = jnp.array([4, 8, 6, 5, 3, 7, 9, 5, 6, 7], dtype=jnp.float32)\n\nmean = jnp.mean(data)\nvariance = jnp.var(data)\nstd = jnp.std(data)\nmad = jnp.mean(jnp.abs(data - mean))\n\nprint(\"\u539f\u59cb\u6570\u636e\uff1a\")\nprint(f\"  \u65b9\u5dee\uff1a{variance:.3f}\uff0c\u6807\u51c6\u5dee\uff1a{std:.3f}\uff0cMAD\uff1a{mad:.3f}\")\n\n# \u6dfb\u52a0\u4e00\u4e2a\u5f02\u5e38\u503c\u5e76\u91cd\u65b0\u8ba1\u7b97\ndata_outlier = jnp.append(data, 100.0)\nmean2 = jnp.mean(data_outlier)\nprint(f\"\\n\u6dfb\u52a0\u5f02\u5e38\u503c\uff08100\uff09\u540e\uff1a\")\nprint(f\"  \u65b9\u5dee\uff1a{jnp.var(data_outlier):.3f}\uff0c\u6807\u51c6\u5dee\uff1a{jnp.std(data_outlier):.3f}\uff0cMAD\uff1a{jnp.mean(jnp.abs(data_outlier - mean2)):.3f}\")\n</code></pre></p> </li> <li> <p>\u8ba1\u7b97\u4e24\u4e2a\u53d8\u91cf\u4e4b\u95f4\u7684\u76ae\u5c14\u68ee\u76f8\u5173\u548c\u65af\u76ae\u5c14\u66fc\u76f8\u5173\u3002\u5c1d\u8bd5\u4e0d\u540c\u7684\u5173\u7cfb\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\n# \u5b8c\u5168\u7ebf\u6027\u5173\u7cfb\nx = jnp.array([1, 2, 3, 4, 5, 6, 7, 8], dtype=jnp.float32)\ny = 2 * x + 1  # \u8bd5\u8bd5\u4fee\u6539\u8fd9\u4e2a\uff01\n\ndef pearson(a, b):\n    a_c = a - jnp.mean(a)\n    b_c = b - jnp.mean(b)\n    return jnp.sum(a_c * b_c) / (jnp.sqrt(jnp.sum(a_c**2)) * jnp.sqrt(jnp.sum(b_c**2)))\n\ndef spearman(a, b):\n    rank_a = jnp.argsort(jnp.argsort(a)).astype(jnp.float32)\n    rank_b = jnp.argsort(jnp.argsort(b)).astype(jnp.float32)\n    return pearson(rank_a, rank_b)\n\nprint(f\"\u76ae\u5c14\u68ee r\uff1a  {pearson(x, y):.4f}\")\nprint(f\"\u65af\u76ae\u5c14\u66fc \u03c1\uff1a{spearman(x, y):.4f}\")\n</code></pre></p> </li> <li> <p>\u5206\u522b\u4f7f\u7528 IQR \u548c Z \u5206\u6570\u65b9\u6cd5\u5b9e\u73b0\u5f02\u5e38\u503c\u68c0\u6d4b\uff0c\u7136\u540e\u6bd4\u8f83\u5b83\u4eec\u5728\u504f\u659c\u6570\u636e\u4e0a\u7684\u7ed3\u679c\u3002 <pre><code>import jax.numpy as jnp\n\ndata = jnp.array([2, 3, 3, 4, 5, 5, 5, 6, 6, 7, 50], dtype=jnp.float32)\n\n# IQR \u65b9\u6cd5\nq1, q3 = jnp.percentile(data, 25), jnp.percentile(data, 75)\niqr = q3 - q1\nlower, upper = q1 - 1.5 * iqr, q3 + 1.5 * iqr\niqr_outliers = data[(data &lt; lower) | (data &gt; upper)]\nprint(f\"IQR \u8fb9\u754c\uff1a[{lower:.1f}, {upper:.1f}]\")\nprint(f\"IQR \u5f02\u5e38\u503c\uff1a{iqr_outliers}\")\n\n# Z \u5206\u6570\u65b9\u6cd5\nz_scores = (data - jnp.mean(data)) / jnp.std(data)\nz_outliers = data[jnp.abs(z_scores) &gt; 3]\nprint(f\"\\nZ \u5206\u6570\uff1a{z_scores}\")\nprint(f\"Z \u5206\u6570\u5f02\u5e38\u503c\uff08|z| &gt; 3\uff09\uff1a{z_outliers}\")\n</code></pre></p> </li> <li> <p>\u5728\u4e0d\u540c\u5e73\u6ed1\u56e0\u5b50\u4e0b\u8ba1\u7b97\u5e76\u7ed8\u5236\u5e26\u566a\u58f0\u6570\u636e\u7684\u6307\u6570\u79fb\u52a8\u5e73\u5747\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u751f\u6210\u5e26\u566a\u58f0\u7684\u6570\u636e\nkey = __import__(\"jax\").random.PRNGKey(0)\nnoise = __import__(\"jax\").random.normal(key, shape=(50,))\nsignal = jnp.linspace(0, 5, 50) + noise\n\ndef ema(data, alpha):\n    result = jnp.zeros_like(data)\n    result = result.at[0].set(data[0])\n    for t in range(1, len(data)):\n        result = result.at[t].set(alpha * data[t] + (1 - alpha) * result[t - 1])\n    return result\n\nplt.figure(figsize=(10, 4))\nplt.plot(signal, \"o\", alpha=0.3, label=\"\u539f\u59cb\u6570\u636e\", color=\"#999\")\nfor alpha, color in [(0.1, \"#e74c3c\"), (0.3, \"#3498db\"), (0.7, \"#27ae60\")]:\n    plt.plot(ema(signal, alpha), label=f\"\u03b1={alpha}\", color=color, linewidth=2)\nplt.legend()\nplt.title(\"\u4e0d\u540c\u5e73\u6ed1\u56e0\u5b50\u4e0b\u7684 EMA\")\nplt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2004%3A%20statistics/03.%20sampling/","title":"\u62bd\u6837","text":"<p>\u62bd\u6837\u51b3\u5b9a\u4e86\u6211\u4eec\u5982\u4f55\u6536\u96c6\u6570\u636e\uff0c\u5e76\u76f4\u63a5\u63a7\u5236\u7740\u6211\u4eec\u6240\u505a\u6bcf\u9879\u7ed3\u8bba\u7684\u8d28\u91cf\u3002\u672c\u6587\u6db5\u76d6\u968f\u673a\u62bd\u6837\u3001\u5206\u5c42\u62bd\u6837\u3001\u6574\u7fa4\u62bd\u6837\u4e0e\u7cfb\u7edf\u62bd\u6837\u3001\u62bd\u6837\u5206\u5e03\u3001\u5927\u6570\u5b9a\u5f8b\u4ee5\u53ca\u81ea\u52a9\u6cd5\u2014\u2014\u8fd9\u4e9b\u65b9\u6cd5\u5bf9\u4e8e\u673a\u5668\u5b66\u4e60\u4e2d\u7684\u8bad\u7ec3/\u6d4b\u8bd5\u5212\u5206\u548c\u6570\u636e\u96c6\u6574\u7406\u81f3\u5173\u91cd\u8981\u3002</p> <ul> <li> <p>\u5728\u7406\u60f3\u4e16\u754c\u4e2d\uff0c\u4f60\u4f1a\u6d4b\u91cf\u6240\u5173\u5fc3\u7fa4\u4f53\u4e2d\u7684\u6bcf\u4e00\u4e2a\u6210\u5458\u3002\u4f46\u5728\u5b9e\u8df5\u4e2d\uff0c\u8fd9\u51e0\u4e4e\u6c38\u8fdc\u4e0d\u53ef\u80fd\u505a\u5230\u3002\u4f60\u65e0\u6cd5\u8c03\u67e5\u6bcf\u4e00\u4f4d\u9009\u6c11\uff0c\u65e0\u6cd5\u6d4b\u8bd5\u6bcf\u4e00\u53ea\u706f\u6ce1\uff0c\u4e5f\u65e0\u6cd5\u626b\u63cf\u6bcf\u4e00\u4f4d\u60a3\u8005\u3002\u6240\u4ee5\u4f60\u53ea\u80fd\u62bd\u53d6\u4e00\u4e2a\u6837\u672c\uff0c\u5e76\u7528\u5b83\u6765\u4e86\u89e3\u6574\u4f53\u3002</p> </li> <li> <p>\u603b\u4f53\u662f\u4f60\u60f3\u7814\u7a76\u7684\u4e2a\u4f53\u6216\u9879\u76ee\u7684\u5b8c\u6574\u96c6\u5408\u3002\u6837\u672c\u662f\u4f60\u5b9e\u9645\u89c2\u6d4b\u5230\u7684\u5b50\u96c6\u3002</p> </li> <li> <p>\u53c2\u6570\u662f\u63cf\u8ff0\u603b\u4f53\u7684\u6570\u503c\uff08\u4f8b\u5982\uff0c\u67d0\u4e2a\u56fd\u5bb6\u6240\u6709\u6210\u5e74\u4eba\u7684\u771f\u5b9e\u5e73\u5747\u8eab\u9ad8\uff09\u3002</p> </li> <li> <p>\u7edf\u8ba1\u91cf\u662f\u4ece\u6837\u672c\u4e2d\u8ba1\u7b97\u51fa\u7684\u6570\u503c\uff08\u4f8b\u5982\uff0c\u4f60\u6d4b\u91cf\u7684 500 \u4eba\u7684\u5e73\u5747\u8eab\u9ad8\uff09\u3002\u7edf\u8ba1\u91cf\u7528\u4e8e\u4f30\u8ba1\u53c2\u6570\u3002</p> </li> <li> <p>\u7ed3\u8bba\u7684\u8d28\u91cf\u5b8c\u5168\u53d6\u51b3\u4e8e\u4f60\u5982\u4f55\u9009\u62e9\u6837\u672c\u3002\u4e00\u4e2a\u6709\u504f\u7684\u6837\u672c\u4f1a\u5bfc\u81f4\u6709\u504f\u7684\u7ed3\u8bba\uff0c\u65e0\u8bba\u4f60\u7684\u5206\u6790\u591a\u4e48\u590d\u6742\u3002</p> </li> <li> <p>\u62bd\u6837\u6846\u662f\u4f60\u5b9e\u9645\u4ece\u4e2d\u62bd\u53d6\u6837\u672c\u7684\u6240\u6709\u4e2a\u4f53\u7684\u5217\u8868\u3002\u7406\u60f3\u60c5\u51b5\u4e0b\uff0c\u62bd\u6837\u6846\u4e0e\u603b\u4f53\u5b8c\u5168\u543b\u5408\uff0c\u4f46\u5728\u5b9e\u8df5\u4e2d\u603b\u4f1a\u5b58\u5728\u5dee\u8ddd\u3002</p> </li> <li> <p>\u4f8b\u5982\uff0c\u5982\u679c\u4f60\u901a\u8fc7\u7535\u8bdd\u8c03\u67e5\u4eba\u7fa4\uff0c\u5c31\u4f1a\u6f0f\u6389\u6240\u6709\u6ca1\u6709\u7535\u8bdd\u7684\u4eba\u3002\u62bd\u6837\u6846\u4e0e\u603b\u4f53\u4e4b\u95f4\u7684\u5dee\u5f02\u79f0\u4e3a\u8986\u76d6\u8bef\u5dee\u3002</p> </li> <li> <p>\u62bd\u6837\u8bef\u5dee\u662f\u6837\u672c\u7edf\u8ba1\u91cf\u4e0e\u603b\u4f53\u53c2\u6570\u4e4b\u95f4\u7684\u81ea\u7136\u5dee\u5f02\u3002</p> </li> <li> <p>\u5373\u4f7f\u662f\u5b8c\u5168\u968f\u673a\u7684\u6837\u672c\u4e5f\u4e0d\u4f1a\u4e0e\u603b\u4f53\u5b8c\u5168\u4e00\u81f4\u3002\u66f4\u5927\u7684\u6837\u672c\u53ef\u4ee5\u51cf\u5c11\u62bd\u6837\u8bef\u5dee\u3002</p> </li> <li> <p>\u62bd\u6837\u6709\u4e24\u5927\u7c7b\uff1a\u6982\u7387\u62bd\u6837\u548c\u975e\u6982\u7387\u62bd\u6837\u3002</p> </li> <li> <p>\u6982\u7387\u62bd\u6837\u610f\u5473\u7740\u603b\u4f53\u4e2d\u7684\u6bcf\u4e00\u4e2a\u6210\u5458\u90fd\u6709\u5df2\u77e5\u7684\u3001\u975e\u96f6\u7684\u6982\u7387\u88ab\u9009\u4e2d\u3002\u8fd9\u8ba9\u4f60\u80fd\u591f\u91cf\u5316\u4e0d\u786e\u5b9a\u6027\u5e76\u63a8\u5e7f\u7ed3\u679c\u3002</p> </li> <li> <p>\u7b80\u5355\u968f\u673a\u62bd\u6837\uff1a\u6bcf\u4e2a\u4e2a\u4f53\u88ab\u9009\u4e2d\u7684\u6982\u7387\u76f8\u7b49\uff0c\u4e14\u6bcf\u4e2a\u5927\u5c0f\u4e3a \\(n\\) \u7684\u53ef\u80fd\u6837\u672c\u51fa\u73b0\u7684\u6982\u7387\u76f8\u540c\u3002\u5c31\u50cf\u628a\u6bcf\u4e2a\u540d\u5b57\u653e\u8fdb\u4e00\u9876\u5e3d\u5b50\u91cc\uff0c\u7136\u540e\u8499\u773c\u62bd\u53d6\u3002</p> </li> <li> <p>\u5206\u5c42\u62bd\u6837\uff1a\u6839\u636e\u67d0\u4e2a\u5171\u540c\u7279\u5f81\uff08\u5982\u5e74\u9f84\u7ec4\u3001\u5730\u533a\uff09\u5c06\u603b\u4f53\u5212\u5206\u4e3a\u4e92\u4e0d\u91cd\u53e0\u7684\u7ec4\uff08\u5c42\uff09\uff0c\u7136\u540e\u4ece\u6bcf\u4e00\u5c42\u4e2d\u968f\u673a\u62bd\u6837\u3002\u8fd9\u4fdd\u8bc1\u4e86\u6bcf\u4e2a\u7fa4\u4f53\u7684\u4ee3\u8868\u6027\uff0c\u5e76\u4e14\u5f53\u5c42\u4e0e\u5c42\u4e4b\u95f4\u5b58\u5728\u5dee\u5f02\u65f6\uff0c\u53ef\u4ee5\u964d\u4f4e\u65b9\u5dee\u3002</p> </li> <li> <p>\u6574\u7fa4\u62bd\u6837\uff1a\u5c06\u603b\u4f53\u5212\u5206\u4e3a\u82e5\u5e72\u7ec4\uff08\u7fa4\uff09\uff0c\u968f\u673a\u9009\u62e9\u4e00\u4e9b\u7fa4\uff0c\u7136\u540e\u5c06\u6240\u9009\u7fa4\u4e2d\u7684\u5168\u90e8\u4e2a\u4f53\u90fd\u7eb3\u5165\u6837\u672c\u3002\u5f53\u603b\u4f53\u5728\u5730\u7406\u4e0a\u5206\u6563\u65f6\u8fd9\u79cd\u65b9\u6cd5\u5f88\u5b9e\u7528\uff0c\u6bd4\u5982\u5728\u6574\u4e2a\u5b66\u533a\u4e2d\u62bd\u53d6\u6574\u6240\u5b66\u6821\u800c\u975e\u5355\u4e2a\u5b66\u751f\u3002</p> </li> <li> <p>\u7cfb\u7edf\u62bd\u6837\uff1a\u968f\u673a\u9009\u62e9\u4e00\u4e2a\u8d77\u70b9\uff0c\u7136\u540e\u4ece\u5217\u8868\u4e2d\u6bcf\u9694 \\(k\\) \u4e2a\u4e2a\u4f53\u9009\u53d6\u4e00\u4e2a\u3002\u4f8b\u5982\uff0c\u4ece\u7b2c 7 \u4e2a\u4eba\u5f00\u59cb\uff0c\u7136\u540e\u6bcf\u9694 10 \u4e2a\u4eba\u53d6\u4e00\u4e2a\uff087, 17, 27, ...\uff09\u3002\u8fd9\u79cd\u65b9\u6cd5\u6613\u4e8e\u5b9e\u65bd\uff0c\u4f46\u5982\u679c\u5217\u8868\u4e2d\u5b58\u5728\u9690\u85cf\u6a21\u5f0f\uff0c\u5219\u53ef\u80fd\u5f15\u5165\u504f\u5dee\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u975e\u6982\u7387\u62bd\u6837\u5e76\u4e0d\u7ed9\u6bcf\u4e2a\u6210\u5458\u5df2\u77e5\u7684\u5165\u9009\u673a\u4f1a\u3002\u5176\u7ed3\u679c\u65e0\u6cd5\u88ab\u4e25\u683c\u63a8\u5e7f\uff0c\u4f46\u8fd9\u4e9b\u65b9\u6cd5\u901a\u5e38\u66f4\u5feb\u3001\u66f4\u4fbf\u5b9c\u3002</p> </li> <li> <p>\u4fbf\u5229\u62bd\u6837\uff1a\u9009\u62e9\u6700\u5bb9\u6613\u63a5\u89e6\u5230\u7684\u4eba\u3002\u5728\u8d2d\u7269\u4e2d\u5fc3\u8c03\u67e5\u4eba\u7fa4\u5f88\u65b9\u4fbf\uff0c\u4f46\u4f1a\u9057\u6f0f\u90a3\u4e9b\u4e0d\u53bb\u8d2d\u7269\u4e2d\u5fc3\u7684\u4eba\u3002</p> </li> <li> <p>\u914d\u989d\u62bd\u6837\uff1a\u4e0e\u5206\u5c42\u62bd\u6837\u7c7b\u4f3c\uff0c\u4f46\u6ca1\u6709\u968f\u673a\u6027\u3002\u7814\u7a76\u8005\u901a\u8fc7\u4ece\u6bcf\u4e2a\u7fa4\u4f53\u4e2d\u9009\u53d6\u65b9\u4fbf\u63a5\u89e6\u7684\u4e2a\u4f53\u6765\u586b\u8865\u914d\u989d\uff08\u4f8b\u5982 50 \u540d\u7537\u6027\u548c 50 \u540d\u5973\u6027\uff09\u3002</p> </li> <li> <p>\u96ea\u7403\u62bd\u6837\uff1a\u4ece\u5c11\u6570\u53c2\u4e0e\u8005\u5f00\u59cb\uff0c\u7136\u540e\u8bf7\u4ed6\u4eec\u62db\u52df\u5176\u4ed6\u4eba\u3002\u9002\u7528\u4e8e\u96be\u4ee5\u63a5\u89e6\u5230\u7684\u4eba\u7fa4\uff08\u4f8b\u5982\u7814\u7a76\u7f55\u89c1\u75be\u75c5\uff09\uff0c\u4f46\u4f1a\u4e25\u91cd\u504f\u5411\u4e8e\u6709\u793e\u4ea4\u8054\u7cfb\u7684\u4e2a\u4f53\u3002</p> </li> <li> <p>\u4e00\u65e6\u4f60\u6709\u4e86\u62bd\u6837\u65b9\u6cd5\uff0c\u4e00\u4e2a\u81ea\u7136\u7684\u95ee\u9898\u5c31\u51fa\u73b0\u4e86\uff1a\u5982\u679c\u62bd\u53d6\u4e00\u4e2a\u4e0d\u540c\u7684\u6837\u672c\uff0c\u4f1a\u5f97\u5230\u4e0d\u540c\u7684\u7edf\u8ba1\u91cf\u5417\uff1f\u51e0\u4e4e\u80af\u5b9a\u4f1a\u3002\u62bd\u6837\u5206\u5e03\u662f\u4e00\u4e2a\u7edf\u8ba1\u91cf\uff08\u5982\u6837\u672c\u5747\u503c\uff09\u5728\u6240\u6709\u76f8\u540c\u5927\u5c0f\u7684\u53ef\u80fd\u6837\u672c\u4e0a\u7684\u5206\u5e03\u3002</p> </li> <li> <p>\u60f3\u8c61\u4e00\u4e0b\u62bd\u53d6 1000 \u4e2a\u4e0d\u540c\u7684 30 \u4eba\u6837\u672c\uff0c\u5e76\u8ba1\u7b97\u6bcf\u4e2a\u6837\u672c\u7684\u5e73\u5747\u8eab\u9ad8\u3002\u8fd9 1000 \u4e2a\u5747\u503c\u5f62\u6210\u4e86\u4e00\u4e2a\u5206\u5e03\u3002\u6709\u4e9b\u4f1a\u7565\u9ad8\u4e8e\u771f\u5b9e\u7684\u603b\u4f53\u5747\u503c\uff0c\u6709\u4e9b\u4f1a\u7565\u4f4e\u4e8e\uff0c\u800c\u5927\u591a\u6570\u4f1a\u805a\u96c6\u5728\u771f\u5b9e\u503c\u5468\u56f4\u3002</p> </li> <li> <p>\u8fd9\u4e2a\u62bd\u6837\u5206\u5e03\u7684\u6807\u51c6\u5dee\u79f0\u4e3a\u6807\u51c6\u8bef\uff1a</p> </li> </ul> \\[SE = \\frac{\\sigma}{\\sqrt{n}}\\] <ul> <li> <p>\u6ce8\u610f\u6807\u51c6\u8bef\u968f\u7740 \\(n\\) \u7684\u589e\u5927\u800c\u7f29\u5c0f\u3002\u66f4\u5927\u7684\u6837\u672c\u80fd\u7ed9\u51fa\u66f4\u7cbe\u786e\u7684\u4f30\u8ba1\u3002\u6837\u672c\u91cf\u6269\u5927\u5230\u56db\u500d\uff0c\u6807\u51c6\u8bef\u51cf\u534a\u3002</p> </li> <li> <p>\u7edf\u8ba1\u5b66\u4e2d\u6700\u91cd\u8981\u7684\u7ed3\u679c\u662f\u4e2d\u5fc3\u6781\u9650\u5b9a\u7406\uff08CLT\uff09\u3002\u5b83\u6307\u51fa\uff1a\u65e0\u8bba\u539f\u59cb\u603b\u4f53\u7684\u5206\u5e03\u5f62\u6001\u5982\u4f55\uff0c\u968f\u7740\u6837\u672c\u91cf\u7684\u589e\u5927\uff0c\u6837\u672c\u5747\u503c\u7684\u5206\u5e03\u90fd\u8d8b\u8fd1\u4e8e\u6b63\u6001\u5206\u5e03\u3002</p> </li> </ul> <p></p> <ul> <li>\u66f4\u7cbe\u786e\u5730\u8bf4\uff0c\u5982\u679c \\(X_1, X_2, \\ldots, X_n\\) \u662f\u6765\u81ea\u4efb\u610f\u5206\u5e03\u7684\u72ec\u7acb\u89c2\u6d4b\u503c\uff0c\u8be5\u5206\u5e03\u5177\u6709\u5747\u503c \\(\\mu\\) \u548c\u6709\u9650\u65b9\u5dee \\(\\sigma^2\\)\uff0c\u90a3\u4e48\u968f\u7740 \\(n\\) \u589e\u5927\uff1a</li> </ul> \\[\\bar{X} \\approx \\text{Normal}\\!\\left(\\mu, \\frac{\\sigma^2}{n}\\right)\\] <ul> <li> <p>CLT \u662f\u5927\u90e8\u5206\u63a8\u65ad\u7edf\u8ba1\u5f97\u4ee5\u8fdb\u884c\u7684\u57fa\u7840\u3002\u5b83\u8ba9\u6211\u4eec\u80fd\u591f\u4f7f\u7528\u6b63\u6001\u5206\u5e03\u4f5c\u4e3a\u8fd1\u4f3c\uff0c\u5373\u4f7f\u5e95\u5c42\u6570\u636e\u4e0d\u662f\u6b63\u6001\u5206\u5e03\uff0c\u53ea\u8981\u6837\u672c\u91cf\u8db3\u591f\u5927\u5373\u53ef\u3002</p> </li> <li> <p>\"\u8db3\u591f\u5927\"\u662f\u591a\u5927\uff1f\u4e00\u4e2a\u5e38\u89c1\u7684\u7ecf\u9a8c\u6cd5\u5219\u662f \\(n \\ge 30\\)\uff0c\u4f46\u8fd9\u53d6\u51b3\u4e8e\u603b\u4f53\u7684\u975e\u6b63\u6001\u7a0b\u5ea6\u3002\u5bf9\u4e8e\u9ad8\u5ea6\u504f\u6001\u7684\u5206\u5e03\uff0c\u4f60\u53ef\u80fd\u9700\u8981\u66f4\u5927\u7684\u6837\u672c\u91cf\u3002\u5bf9\u4e8e\u5927\u81f4\u5bf9\u79f0\u7684\u603b\u4f53\uff0c\u5373\u4f7f \\(n = 10\\) \u4e5f\u53ef\u80fd\u8db3\u591f\u4e86\u3002</p> </li> <li> <p>CLT \u6709\u4e09\u4e2a\u5173\u952e\u6761\u4ef6\uff1a</p> <ul> <li>\u72ec\u7acb\u6027\uff1a\u6bcf\u4e2a\u89c2\u6d4b\u503c\u4e0d\u80fd\u5f71\u54cd\u5176\u4ed6\u89c2\u6d4b\u503c</li> <li>\u6709\u9650\u65b9\u5dee\uff1a\u603b\u4f53\u65b9\u5dee\u5fc5\u987b\u5b58\u5728\uff08\u6392\u9664\u4e86\u67d0\u4e9b\u7279\u6b8a\u5206\u5e03\uff09</li> <li>\u540c\u5206\u5e03\uff1a\u6240\u6709\u89c2\u6d4b\u503c\u6765\u81ea\u540c\u4e00\u5206\u5e03</li> </ul> </li> </ul>"},{"location":"chapter%2004%3A%20statistics/03.%20sampling/#colab-notebook","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ol> <li> <p>\u53ef\u89c6\u5316\u6f14\u793a CLT\uff1a\u4ece\u9ad8\u5ea6\u504f\u6001\u7684\u5206\u5e03\u4e2d\u62bd\u53d6\u6837\u672c\uff0c\u8ba1\u7b97\u6837\u672c\u5747\u503c\uff0c\u89c2\u5bdf\u5747\u503c\u76f4\u65b9\u56fe\u5982\u4f55\u53d8\u6210\u949f\u5f62\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\nkey = jax.random.PRNGKey(0)\n\n# \u6307\u6570\u5206\u5e03\uff08\u9ad8\u5ea6\u504f\u6001\uff09\npopulation = jax.random.exponential(key, shape=(100_000,))\n\nfig, axes = plt.subplots(1, 4, figsize=(14, 3))\nsample_sizes = [1, 5, 30, 100]\n\nfor ax, n in zip(axes, sample_sizes):\n    keys = jax.random.split(key, 2000)\n    means = jnp.array([jax.random.choice(k, population, shape=(n,)).mean() for k in keys])\n    ax.hist(means, bins=40, color=\"#3498db\", alpha=0.7, density=True)\n    ax.set_title(f\"n = {n}\")\n    ax.set_xlim(0, 4)\n\nfig.suptitle(\"CLT\uff1a\u968f\u7740 n \u589e\u5927\uff0c\u6837\u672c\u5747\u503c\u8d8b\u8fd1\u6b63\u6001\u5206\u5e03\", fontsize=13)\nplt.tight_layout()\nplt.show()\n</code></pre></p> </li> <li> <p>\u6bd4\u8f83\u7b80\u5355\u968f\u673a\u62bd\u6837\u4e0e\u5206\u5c42\u62bd\u6837\u3002\u521b\u5efa\u4e00\u4e2a\u5177\u6709\u4e0d\u540c\u5206\u7ec4\u7684\u603b\u4f53\uff0c\u5c55\u793a\u5206\u5c42\u62bd\u6837\u80fd\u7ed9\u51fa\u66f4\u4f4e\u7684\u4f30\u8ba1\u65b9\u5dee\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\nkey = jax.random.PRNGKey(42)\n\n# \u603b\u4f53\uff1a\u4e24\u4e2a\u4e0d\u540c\u7684\u7ec4\ngroup_a = jax.random.normal(key, shape=(500,)) + 10   # \u5747\u503c ~10\nkey, subkey = jax.random.split(key)\ngroup_b = jax.random.normal(subkey, shape=(500,)) + 20  # \u5747\u503c ~20\npopulation = jnp.concatenate([group_a, group_b])\n\n# \u7b80\u5355\u968f\u673a\u62bd\u6837\uff1a1000 \u6b21\u8bd5\u9a8c\uff0c\u6837\u672c\u91cf 20\nsrs_means = []\nfor i in range(1000):\n    key, subkey = jax.random.split(key)\n    sample = jax.random.choice(subkey, population, shape=(20,), replace=False)\n    srs_means.append(sample.mean())\nsrs_means = jnp.array(srs_means)\n\n# \u5206\u5c42\u62bd\u6837\uff1a\u6bcf\u7ec4\u5404\u53d6 10 \u4e2a\nstrat_means = []\nfor i in range(1000):\n    key, k1, k2 = jax.random.split(key, 3)\n    s_a = jax.random.choice(k1, group_a, shape=(10,), replace=False)\n    s_b = jax.random.choice(k2, group_b, shape=(10,), replace=False)\n    strat_means.append(jnp.concatenate([s_a, s_b]).mean())\nstrat_means = jnp.array(strat_means)\n\nprint(f\"\u7b80\u5355\u968f\u673a - \u5747\u503c: {srs_means.mean():.3f}, \u6807\u51c6\u5dee: {srs_means.std():.3f}\")\nprint(f\"\u5206\u5c42\u62bd\u6837 - \u5747\u503c: {strat_means.mean():.3f}, \u6807\u51c6\u5dee: {strat_means.std():.3f}\")\nprint(f\"\u5206\u5c42\u62bd\u6837\u964d\u4f4e\u4e86\u65b9\u5dee {(1 - strat_means.var()/srs_means.var())*100:.1f}%\")\n</code></pre></p> </li> <li> <p>\u63a2\u7d22\u6837\u672c\u91cf\u5982\u4f55\u5f71\u54cd\u6807\u51c6\u8bef\u3002\u7ed8\u5236\u6807\u51c6\u8bef\u968f\u6837\u672c\u91cf\u53d8\u5316\u7684\u66f2\u7ebf\uff0c\u9a8c\u8bc1 \\(1/\\sqrt{n}\\) \u7684\u5173\u7cfb\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\nkey = jax.random.PRNGKey(7)\npopulation = jax.random.normal(key, shape=(50_000,)) * 10 + 50\n\nsample_sizes = [5, 10, 20, 50, 100, 200, 500, 1000]\nstd_errors = []\n\nfor n in sample_sizes:\n    means = []\n    for _ in range(500):\n        key, subkey = jax.random.split(key)\n        sample = jax.random.choice(subkey, population, shape=(n,))\n        means.append(sample.mean())\n    std_errors.append(jnp.array(means).std())\n\nplt.figure(figsize=(8, 4))\nplt.plot(sample_sizes, std_errors, \"o-\", color=\"#e74c3c\", label=\"\u89c2\u6d4b\u5230\u7684 SE\")\ntheoretical = population.std() / jnp.sqrt(jnp.array(sample_sizes, dtype=jnp.float32))\nplt.plot(sample_sizes, theoretical, \"--\", color=\"#3498db\", label=\"\u03c3/\u221an\uff08\u7406\u8bba\u503c\uff09\")\nplt.xlabel(\"\u6837\u672c\u91cf (n)\")\nplt.ylabel(\"\u6807\u51c6\u8bef\")\nplt.legend()\nplt.title(\"\u6807\u51c6\u8bef\u968f\u6837\u672c\u91cf\u589e\u5927\u800c\u7f29\u5c0f\")\nplt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2004%3A%20statistics/04.%20hypothesis%20testing/","title":"\u5047\u8bbe\u68c0\u9a8c","text":"<p>\u5047\u8bbe\u68c0\u9a8c\u63d0\u4f9b\u4e86\u4e00\u4e2a\u4e25\u8c28\u7684\u6846\u67b6\uff0c\u7528\u4e8e\u5224\u65ad\u89c2\u6d4b\u5230\u7684\u6548\u5e94\u662f\u771f\u5b9e\u5b58\u5728\u7684\u8fd8\u662f\u7531\u968f\u673a\u56e0\u7d20\u9020\u6210\u7684\u3002\u672c\u6587\u6db5\u76d6\u539f\u5047\u8bbe\u4e0e\u5907\u62e9\u5047\u8bbe\u3001p\u503c\u3001\u663e\u8457\u6027\u6c34\u5e73\u3001t\u68c0\u9a8c\u3001\u5361\u65b9\u68c0\u9a8c\u3001\u65b9\u5dee\u5206\u6790\u4ee5\u53ca\u7b2c\u4e00\u7c7b/\u7b2c\u4e8c\u7c7b\u9519\u8bef\u2014\u2014\u8fd9\u4e9b\u903b\u8f91\u540c\u6837\u5e94\u7528\u4e8eA/B\u6d4b\u8bd5\u3001\u6a21\u578b\u6bd4\u8f83\u548c\u7814\u7a76\u4e2d\u3002</p> <ul> <li> <p>\u7edf\u8ba1\u5b66\u4e0d\u4ec5\u4ec5\u662f\u5bf9\u6570\u636e\u8fdb\u884c\u63cf\u8ff0\u3002\u4f60\u7ecf\u5e38\u9700\u8981\u505a\u51fa\u51b3\u7b56\uff1a\u65b0\u836f\u662f\u5426\u6709\u6548\uff1f\u67d0\u4e2a\u7b97\u6cd5\u662f\u5426\u6bd4\u53e6\u4e00\u4e2a\u66f4\u5feb\uff1f\u5e73\u5747\u503c\u662f\u5426\u53d1\u751f\u4e86\u53d8\u5316\uff1f\u5047\u8bbe\u68c0\u9a8c\u4e3a\u4f60\u63d0\u4f9b\u4e86\u4e00\u4e2a\u57fa\u4e8e\u6570\u636e\u56de\u7b54\u8fd9\u4e9b\u95ee\u9898\u7684\u7ed3\u6784\u5316\u6846\u67b6\u3002</p> </li> <li> <p>\u5176\u601d\u8def\u5f88\u7b80\u5355\uff1a\u5047\u8bbe\u6ca1\u6709\u4efb\u4f55\u53d8\u5316\uff08\"\u539f\u5047\u8bbe\"\uff09\uff0c\u7136\u540e\u68c0\u9a8c\u6570\u636e\u662f\u5426\u6781\u7aef\u5230\u8ba9\u8fd9\u4e2a\u5047\u8bbe\u96be\u4ee5\u4ee4\u4eba\u7f6e\u4fe1\u3002</p> </li> <li> <p>\u539f\u5047\u8bbe\uff08\\(H_0\\)\uff09\u662f\u9ed8\u8ba4\u7684\u4e3b\u5f20\uff0c\u901a\u5e38\u8868\u8ff0\u4e3a\"\u65e0\u6548\u5e94\"\u6216\"\u65e0\u5dee\u5f02\"\u3002\u4f8b\u5982\uff1a\"\u5e73\u5747\u914d\u9001\u65f6\u95f4\u4ecd\u4e3a30\u5206\u949f\"\u6216\"\u65b0\u6a21\u578b\u5e76\u4e0d\u6bd4\u65e7\u6a21\u578b\u66f4\u597d\"\u3002</p> </li> <li> <p>\u5907\u62e9\u5047\u8bbe\uff08\\(H_1\\) \u6216 \\(H_a\\)\uff09\u662f\u4f60\u8ba4\u4e3a\u53ef\u80fd\u6210\u7acb\u7684\u66ff\u4ee3\u60c5\u51b5\uff1a\"\u5e73\u5747\u914d\u9001\u65f6\u95f4\u53d1\u751f\u4e86\u53d8\u5316\"\u6216\"\u65b0\u6a21\u578b\u66f4\u597d\"\u3002</p> </li> <li> <p>\u4f60\u6c38\u8fdc\u65e0\u6cd5\u76f4\u63a5\u8bc1\u660e \\(H_1\\)\u3002\u76f8\u53cd\uff0c\u4f60\u63d0\u51fa\u8fd9\u6837\u4e00\u4e2a\u95ee\u9898\uff1a\u5982\u679c \\(H_0\\) \u6210\u7acb\uff0c\u89c2\u5bdf\u5230\u5982\u6b64\u6781\u7aef\u7684\u6570\u636e\u7684\u53ef\u80fd\u6027\u6709\u591a\u5927\uff1f\u5982\u679c\u8fd9\u79cd\u53ef\u80fd\u6027\u975e\u5e38\u5c0f\uff0c\u4f60\u5c31\u62d2\u7edd \\(H_0\\)\uff0c\u8f6c\u800c\u63a5\u53d7 \\(H_1\\)\u3002</p> </li> <li> <p>\u68c0\u9a8c\u7edf\u8ba1\u91cf\u662f\u4e00\u4e2a\u5355\u4e00\u6570\u503c\uff0c\u5b83\u6982\u62ec\u4e86\u4f60\u7684\u6837\u672c\u7ed3\u679c\u4e0e \\(H_0\\) \u9884\u6d4b\u503c\u4e4b\u95f4\u7684\u504f\u5dee\u7a0b\u5ea6\u3002\u4e0d\u540c\u7684\u68c0\u9a8c\u4f7f\u7528\u4e0d\u540c\u7684\u516c\u5f0f\uff0c\u4f46\u903b\u8f91\u59cb\u7ec8\u4e00\u81f4\uff1a\u5ea6\u91cf\u89c2\u6d4b\u503c\u4e0e\u671f\u671b\u503c\u4e4b\u95f4\u7684\u8ddd\u79bb\u3002</p> </li> <li> <p>p\u503c\u662f\u5728\u5047\u8bbe \\(H_0\\) \u6210\u7acb\u7684\u524d\u63d0\u4e0b\uff0c\u89c2\u5bdf\u5230\u81f3\u5c11\u4e0e\u5f53\u524d\u68c0\u9a8c\u7edf\u8ba1\u91cf\u4e00\u6837\u6781\u7aef\u7684\u7ed3\u679c\u7684\u6982\u7387\u3002p\u503c\u8d8a\u5c0f\uff0c\u610f\u5473\u7740\u5728 \\(H_0\\) \u4e0b\u6570\u636e\u8d8a\u4ee4\u4eba\u610f\u5916\u3002</p> </li> <li> <p>\u663e\u8457\u6027\u6c34\u5e73\uff08\\(\\alpha\\)\uff09\u662f\u4f60\u5728\u770b\u5230\u6570\u636e\u4e4b\u524d\u8bbe\u5b9a\u7684\u9608\u503c\u3002\u5982\u679c \\(p \\le \\alpha\\)\uff0c\u5219\u62d2\u7edd \\(H_0\\)\u3002\u5e38\u7528\u7684\u9009\u62e9\u6709 \\(\\alpha = 0.05\\)\uff085%\uff09\u548c \\(\\alpha = 0.01\\)\uff081%\uff09\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u9634\u5f71\u5c3e\u90e8\u5373\u62d2\u7edd\u57df\u3002\u5982\u679c\u4f60\u7684\u68c0\u9a8c\u7edf\u8ba1\u91cf\u843d\u5728\u6b64\u533a\u57df\uff0c\u8bf4\u660e\u5728 \\(H_0\\) \u4e0b\u6570\u636e\u8db3\u591f\u6781\u7aef\uff0c\u4f60\u62d2\u7edd \\(H_0\\)\u3002\u7eff\u8272\u533a\u57df\u663e\u793a\u4e86\u67d0\u4e2a\u7279\u5b9a\u68c0\u9a8c\u7edf\u8ba1\u91cf\u5bf9\u5e94\u7684p\u503c\u3002</p> </li> <li> <p>\u4ee5\u4e0b\u662f\u9010\u6b65\u6d41\u7a0b\uff1a</p> <ul> <li>\u7b2c1\u6b65\uff1a\u63d0\u51fa \\(H_0\\) \u548c \\(H_1\\)</li> <li>\u7b2c2\u6b65\uff1a\u9009\u62e9\u663e\u8457\u6027\u6c34\u5e73 \\(\\alpha\\)</li> <li>\u7b2c3\u6b65\uff1a\u6536\u96c6\u6570\u636e\u5e76\u8ba1\u7b97\u68c0\u9a8c\u7edf\u8ba1\u91cf</li> <li>\u7b2c4\u6b65\uff1a\u8ba1\u7b97p\u503c\uff08\u6216\u5c06\u68c0\u9a8c\u7edf\u8ba1\u91cf\u4e0e\u4e34\u754c\u503c\u6bd4\u8f83\uff09</li> <li>\u7b2c5\u6b65\uff1a\u5982\u679c \\(p \\le \\alpha\\)\uff0c\u62d2\u7edd \\(H_0\\)\uff1b\u5426\u5219\uff0c\u65e0\u6cd5\u62d2\u7edd \\(H_0\\)</li> </ul> </li> <li> <p>\u5b9e\u4f8b\u6f14\u7ec3\uff1a\u67d0\u5de5\u5382\u58f0\u79f0\u5176\u87ba\u6813\u7684\u5e73\u5747\u957f\u5ea6\u4e3a10 cm\u3002\u4f60\u6d4b\u91cf\u4e8636\u4e2a\u87ba\u6813\uff0c\u5f97\u5230\u6837\u672c\u5747\u503c\u4e3a10.3 cm\u3002\u5df2\u77e5\u603b\u4f53\u6807\u51c6\u5dee\u4e3a0.9 cm\u3002\u662f\u5426\u6709\u8bc1\u636e\u8868\u660e\u5747\u503c\u53d1\u751f\u4e86\u53d8\u5316\uff1f</p> </li> <li> <p>\\(H_0\\)\uff1a\\(\\mu = 10\\)\uff0c\\(H_1\\)\uff1a\\(\\mu \\neq 10\\)\uff0c\\(\\alpha = 0.05\\)</p> </li> <li> <p>\u68c0\u9a8c\u7edf\u8ba1\u91cf\uff08z\u68c0\u9a8c\uff0c\u56e0\u4e3a \\(\\sigma\\) \u5df2\u77e5\u4e14 \\(n\\) \u8f83\u5927\uff09\uff1a</p> </li> </ul> \\[z = \\frac{\\bar{x} - \\mu_0}{\\sigma / \\sqrt{n}} = \\frac{10.3 - 10}{0.9 / \\sqrt{36}} = \\frac{0.3}{0.15} = 2.0\\] <ul> <li> <p>\u5bf9\u4e8e \\(\\alpha = 0.05\\) \u7684\u53cc\u4fa7\u68c0\u9a8c\uff0c\u4e34\u754c\u503c\u4e3a \\(\\pm 1.96\\)\u3002\u6211\u4eec\u7684 \\(z = 2.0 &gt; 1.96\\)\uff0c\u56e0\u6b64\u62d2\u7edd \\(H_0\\)\u3002p\u503c\u7ea6\u4e3a0.046\uff0c\u5c0f\u4e8e0.05\u3002</p> </li> <li> <p>\u7ed3\u8bba\uff1a\u6709\u7edf\u8ba1\u5b66\u4e0a\u7684\u663e\u8457\u8bc1\u636e\u8868\u660e\uff0c\u87ba\u6813\u7684\u5e73\u5747\u957f\u5ea6\u4e0e10 cm\u4e0d\u540c\u3002</p> </li> <li> <p>\u5355\u4fa7\u68c0\u9a8c\u68c0\u67e5\u6548\u5e94\u662f\u5426\u671d\u7740\u67d0\u4e2a\u7279\u5b9a\u65b9\u5411\u53d1\u751f\uff08\\(H_1\\)\uff1a\\(\\mu &gt; 10\\) \u6216 \\(\\mu &lt; 10\\)\uff09\u3002\u6574\u4e2a \\(\\alpha\\) \u96c6\u4e2d\u4e8e\u4e00\u4e2a\u5c3e\u90e8\uff0c\u4f7f\u5f97\u5728\u8be5\u65b9\u5411\u4e0a\u66f4\u5bb9\u6613\u62d2\u7edd \\(H_0\\)\uff0c\u4f46\u65e0\u6cd5\u68c0\u6d4b\u5230\u76f8\u53cd\u65b9\u5411\u7684\u6548\u5e94\u3002</p> </li> <li> <p>\u53cc\u4fa7\u68c0\u9a8c\u68c0\u67e5\u662f\u5426\u5b58\u5728\u4efb\u4f55\u5dee\u5f02\uff08\\(H_1\\)\uff1a\\(\\mu \\neq 10\\)\uff09\u3002\\(\\alpha\\) \u88ab\u5206\u914d\u5230\u4e24\u4e2a\u5c3e\u90e8\uff08\u5404 \\(\\alpha/2\\)\uff09\u3002\u8fd9\u79cd\u65b9\u6cd5\u66f4\u4fdd\u5b88\uff0c\u4f46\u80fd\u6355\u6349\u5230\u4e24\u4e2a\u65b9\u5411\u4e0a\u7684\u6548\u5e94\u3002</p> </li> <li> <p>\u5373\u4f7f\u6709\u4e86\u826f\u597d\u7684\u6d41\u7a0b\uff0c\u9519\u8bef\u4ecd\u7136\u53ef\u80fd\u53d1\u751f\u3002\u5171\u6709\u4e24\u79cd\u7c7b\u578b\u7684\u9519\u8bef\uff1a</p> </li> </ul> <p></p> <ul> <li> <p>\u7b2c\u4e00\u7c7b\u9519\u8bef\uff08\u5047\u9633\u6027\uff09\uff1a\u5f53 \\(H_0\\) \u5b9e\u9645\u4e3a\u771f\u65f6\uff0c\u4f60\u9519\u8bef\u5730\u62d2\u7edd\u4e86\u5b83\u3002\u5176\u6982\u7387\u4e3a \\(\\alpha\\)\uff0c\u4f60\u53ef\u4ee5\u901a\u8fc7\u9009\u62e9\u663e\u8457\u6027\u6c34\u5e73\u6765\u63a7\u5236\u3002\u5c31\u50cf\u6ca1\u6709\u706b\u707e\u65f6\u706b\u707e\u62a5\u8b66\u5668\u5374\u54cd\u4e86\u3002</p> </li> <li> <p>\u7b2c\u4e8c\u7c7b\u9519\u8bef\uff08\u5047\u9634\u6027\uff09\uff1a\u5f53 \\(H_0\\) \u5b9e\u9645\u4e3a\u5047\u65f6\uff0c\u4f60\u672a\u80fd\u62d2\u7edd\u5b83\u3002\u5176\u6982\u7387\u4e3a \\(\\beta\\)\u3002\u5c31\u50cf\u53d1\u751f\u771f\u5b9e\u706b\u707e\u65f6\u706b\u707e\u62a5\u8b66\u5668\u4fdd\u6301\u6c89\u9ed8\u3002</p> </li> <li> <p>\u68c0\u9a8c\u529f\u6548\u4e3a \\(1 - \\beta\\)\uff0c\u5373\u6b63\u786e\u62d2\u7edd\u9519\u8bef \\(H_0\\) \u7684\u6982\u7387\u3002\u529f\u6548\u8d8a\u9ad8\uff0c\u610f\u5473\u7740\u4f60\u68c0\u6d4b\u771f\u5b9e\u6548\u5e94\u7684\u80fd\u529b\u8d8a\u5f3a\u3002\u529f\u6548\u968f\u4ee5\u4e0b\u56e0\u7d20\u589e\u52a0\uff1a</p> <ul> <li>\u771f\u5b9e\u6548\u5e94\u91cf\u66f4\u5927\uff08\u5dee\u5f02\u8d8a\u5927\u8d8a\u5bb9\u6613\u68c0\u6d4b\uff09</li> <li>\u6837\u672c\u91cf\u66f4\u5927\uff08\u66f4\u591a\u6570\u636e = \u66f4\u9ad8\u7cbe\u5ea6\uff09</li> <li>\u663e\u8457\u6027\u6c34\u5e73 \\(\\alpha\\) \u66f4\u5927\uff08\u4f46\u8fd9\u4f1a\u589e\u52a0\u7b2c\u4e00\u7c7b\u9519\u8bef\u7684\u98ce\u9669\uff09</li> <li>\u53d8\u5f02\u6027\u66f4\u4f4e\uff08\u566a\u58f0\u66f4\u5c0f\uff09</li> </ul> </li> <li> <p>\u7b2c\u4e00\u7c7b\u9519\u8bef\u4e0e\u7b2c\u4e8c\u7c7b\u9519\u8bef\u4e4b\u95f4\u5b58\u5728\u6743\u8861\u5173\u7cfb\u3002\u964d\u4f4e \\(\\alpha\\)\uff08\u5bf9\u5047\u9633\u6027\u66f4\u52a0\u8c28\u614e\uff09\u4f1a\u589e\u52a0 \\(\\beta\\)\uff08\u66f4\u591a\u5047\u9634\u6027\uff09\u3002\u5728\u56fa\u5b9a\u6837\u672c\u91cf\u4e0b\uff0c\u4f60\u65e0\u6cd5\u540c\u65f6\u6700\u5c0f\u5316\u8fd9\u4e24\u7c7b\u9519\u8bef\u3002</p> </li> <li> <p>\u53c2\u6570\u68c0\u9a8c\u5047\u8bbe\u6570\u636e\u670d\u4ece\u7279\u5b9a\u7684\u5206\u5e03\uff08\u901a\u5e38\u662f\u6b63\u6001\u5206\u5e03\uff09\u3002\u5f53\u5047\u8bbe\u6761\u4ef6\u6210\u7acb\u65f6\uff0c\u53c2\u6570\u68c0\u9a8c\u7684\u529f\u6548\u66f4\u9ad8\u3002</p> </li> <li> <p>Z\u68c0\u9a8c\uff1a\u5728 \\(\\sigma\\) \u5df2\u77e5\u4e14 \\(n\\) \u8f83\u5927\uff08\\(n \\ge 30\\)\uff09\u65f6\uff0c\u5c06\u6837\u672c\u5747\u503c\u4e0e\u5df2\u77e5\u503c\u8fdb\u884c\u6bd4\u8f83\u3002\u68c0\u9a8c\u7edf\u8ba1\u91cf\uff1a</p> </li> </ul> \\[z = \\frac{\\bar{x} - \\mu_0}{\\sigma / \\sqrt{n}}\\] <ul> <li>T\u68c0\u9a8c\uff1a\u7c7b\u4f3c\u4e8ez\u68c0\u9a8c\uff0c\u4f46\u9002\u7528\u4e8e \\(\\sigma\\) \u672a\u77e5\uff08\u7531\u6837\u672c\u4f30\u8ba1\uff09\u6216 \\(n\\) \u8f83\u5c0f\u7684\u60c5\u51b5\u3002\u4f7f\u7528t\u5206\u5e03\uff0c\u5176\u5c3e\u90e8\u6bd4\u6b63\u6001\u5206\u5e03\u66f4\u539a\u3002\u66f4\u539a\u7684\u5c3e\u90e8\u53cd\u6620\u4e86\u4f30\u8ba1 \\(\\sigma\\) \u6240\u5f15\u5165\u7684\u989d\u5916\u4e0d\u786e\u5b9a\u6027\u3002</li> </ul> \\[t = \\frac{\\bar{x} - \\mu_0}{s / \\sqrt{n}}\\] <ul> <li> <p>t\u5206\u5e03\u6709\u4e00\u4e2a\u79f0\u4e3a\u81ea\u7531\u5ea6\uff08\\(df = n - 1\\)\uff09\u7684\u53c2\u6570\u3002\u968f\u7740 \\(df\\) \u589e\u5927\uff0ct\u5206\u5e03\u8d8b\u8fd1\u4e8e\u6b63\u6001\u5206\u5e03\u3002</p> </li> <li> <p>t\u68c0\u9a8c\u6709\u51e0\u79cd\u53d8\u4f53\uff1a</p> <ul> <li>\u5355\u6837\u672ct\u68c0\u9a8c\uff1a\u6837\u672c\u5747\u503c\u662f\u5426\u4e0e\u67d0\u4e2a\u7279\u5b9a\u503c\u4e0d\u540c\uff1f</li> <li>\u72ec\u7acb\u53cc\u6837\u672ct\u68c0\u9a8c\uff1a\u4e24\u4e2a\u72ec\u7acb\u7ec4\u7684\u5747\u503c\u662f\u5426\u4e0d\u540c\uff1f</li> <li>\u914d\u5bf9t\u68c0\u9a8c\uff1a\u4e24\u4e2a\u76f8\u5173\u6d4b\u91cf\u503c\u7684\u5747\u503c\u662f\u5426\u4e0d\u540c\uff08\u4f8b\u5982\u540c\u4e00\u6279\u53d7\u8bd5\u8005\u6cbb\u7597\u524d\u540e\u7684\u6d4b\u91cf\u503c\uff09\uff1f</li> </ul> </li> <li> <p>\u65b9\u5dee\u5206\u6790\uff1a\u68c0\u9a8c\u4e09\u4e2a\u6216\u66f4\u591a\u7ec4\u7684\u5747\u503c\u662f\u5426\u76f8\u7b49\u3002\u4e0e\u8fd0\u884c\u591a\u6b21t\u68c0\u9a8c\uff08\u8fd9\u4f1a\u81a8\u80c0\u7b2c\u4e00\u7c7b\u9519\u8bef\u7387\uff09\u4e0d\u540c\uff0c\u65b9\u5dee\u5206\u6790\u901a\u8fc7\u6bd4\u8f83\u7ec4\u95f4\u65b9\u5dee\u4e0e\u7ec4\u5185\u65b9\u5dee\u8fdb\u884c\u4e00\u6b21\u7edf\u4e00\u68c0\u9a8c\u3002</p> </li> </ul> \\[F = \\frac{\\text{\u7ec4\u95f4\u65b9\u5dee}}{\\text{\u7ec4\u5185\u65b9\u5dee}}\\] <ul> <li> <p>\u8f83\u5927\u7684 \\(F\\) \u6bd4\u503c\u610f\u5473\u7740\u5404\u7ec4\u4e4b\u95f4\u7684\u5dee\u5f02\u8d85\u51fa\u4e86\u968f\u673a\u53d8\u5f02\u6240\u80fd\u89e3\u91ca\u7684\u8303\u56f4\u3002</p> </li> <li> <p>\u975e\u53c2\u6570\u68c0\u9a8c\u5bf9\u6570\u636e\u5206\u5e03\u7684\u5047\u8bbe\u8f83\u5c11\u3002\u5b83\u4eec\u57fa\u4e8e\u79e9\u6b21\u800c\u975e\u539f\u59cb\u503c\u8fdb\u884c\u8fd0\u7b97\uff0c\u56e0\u6b64\u5bf9\u5f02\u5e38\u503c\u548c\u975e\u6b63\u6001\u6027\u5177\u6709\u7a33\u5065\u6027\u3002</p> </li> <li> <p>\u5361\u65b9\u68c0\u9a8c\uff08\\(\\chi^2\\)\uff09\uff1a\u68c0\u9a8c\u89c2\u6d4b\u9891\u6570\u4e0e\u671f\u671b\u9891\u6570\u662f\u5426\u4e00\u81f4\u3002\u7528\u4e8e\u5206\u7c7b\u6570\u636e\u3002\u4f8b\u5982\uff1a\u7ea2\u3001\u84dd\u3001\u7eff\u4e09\u79cd\u989c\u8272\u6c7d\u8f66\u7684\u6bd4\u4f8b\u662f\u5426\u4e0e\u5236\u9020\u5546\u58f0\u79f0\u7684\u6bd4\u4f8b\u4e00\u81f4\uff1f</p> </li> </ul> \\[\\chi^2 = \\sum \\frac{(O_i - E_i)^2}{E_i}\\] <ul> <li> <p>Mann-Whitney U\u68c0\u9a8c\uff1a\u72ec\u7acb\u53cc\u6837\u672ct\u68c0\u9a8c\u7684\u975e\u53c2\u6570\u66ff\u4ee3\u65b9\u6cd5\u3002\u901a\u8fc7\u6bd4\u8f83\u79e9\u6b21\u6765\u68c0\u9a8c\u4e00\u7ec4\u662f\u5426\u503e\u5411\u4e8e\u6bd4\u53e6\u4e00\u7ec4\u6709\u66f4\u5927\u7684\u503c\u3002</p> </li> <li> <p>Wilcoxon\u7b26\u53f7\u79e9\u68c0\u9a8c\uff1a\u914d\u5bf9t\u68c0\u9a8c\u7684\u975e\u53c2\u6570\u66ff\u4ee3\u65b9\u6cd5\u3002\u901a\u8fc7\u8003\u5bdf\u5dee\u5f02\u7684\u5927\u5c0f\u548c\u65b9\u5411\u6765\u6bd4\u8f83\u914d\u5bf9\u89c2\u6d4b\u503c\u3002</p> </li> <li> <p>Kruskal-Wallis\u68c0\u9a8c\uff1a\u5355\u56e0\u7d20\u65b9\u5dee\u5206\u6790\u7684\u975e\u53c2\u6570\u66ff\u4ee3\u65b9\u6cd5\u3002\u901a\u8fc7\u6bd4\u8f83\u6240\u6709\u7ec4\u7684\u79e9\u6b21\u6765\u68c0\u9a8c\u591a\u4e2a\u7ec4\u662f\u5426\u6765\u81ea\u540c\u4e00\u5206\u5e03\u3002</p> </li> <li> <p>\u62df\u5408\u4f18\u5ea6\u68c0\u9a8c\u68c0\u67e5\u6570\u636e\u662f\u5426\u670d\u4ece\u67d0\u4e2a\u7279\u5b9a\u7684\u7406\u8bba\u5206\u5e03\u3002\u5361\u65b9\u62df\u5408\u4f18\u5ea6\u68c0\u9a8c\u5c06\u89c2\u6d4b\u5230\u7684\u533a\u95f4\u8ba1\u6570\u4e0e\u5047\u8bbe\u5206\u5e03\u4e0b\u7684\u671f\u671b\u8ba1\u6570\u8fdb\u884c\u6bd4\u8f83\u3002</p> </li> <li> <p>\u6b63\u6001\u6027\u68c0\u9a8c\u4e13\u95e8\u68c0\u9a8c\u6570\u636e\u662f\u5426\u670d\u4ece\u6b63\u6001\u5206\u5e03\u3002\u5e38\u7528\u7684\u68c0\u9a8c\u5305\u62ecShapiro-Wilk\u68c0\u9a8c\uff08\u5bf9\u5c0f\u6837\u672c\u68c0\u9a8c\u529b\u5f3a\uff09\u548cKolmogorov-Smirnov\u68c0\u9a8c\uff08\u5c06\u6837\u672c\u7ecf\u9a8c\u5206\u5e03\u51fd\u6570\u4e0e\u7406\u8bba\u5206\u5e03\u51fd\u6570\u8fdb\u884c\u6bd4\u8f83\uff09\u3002</p> </li> <li> <p>\u5728\u673a\u5668\u5b66\u4e60\u4e2d\uff0c\u5047\u8bbe\u68c0\u9a8c\u51fa\u73b0\u5728\u6bd4\u8f83\u6a21\u578b\u6027\u80fd\u65f6\u3002\u5982\u679c\u6a21\u578bA\u8fbe\u523092%\u7684\u51c6\u786e\u7387\uff0c\u6a21\u578bB\u8fbe\u523091%\u7684\u51c6\u786e\u7387\uff0c\u8fd9\u79cd\u5dee\u5f02\u662f\u771f\u5b9e\u7684\u8fd8\u662f\u4ec5\u4ec5\u662f\u566a\u58f0\uff1f\u5bf9\u4ea4\u53c9\u9a8c\u8bc1\u5f97\u5206\u8fdb\u884c\u914d\u5bf9t\u68c0\u9a8c\u53ef\u4ee5\u56de\u7b54\u8fd9\u4e2a\u95ee\u9898\u3002</p> </li> </ul>"},{"location":"chapter%2004%3A%20statistics/04.%20hypothesis%20testing/#colabnotebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528CoLab\u6216notebook\uff09","text":"<ol> <li> <p>\u5bf9\u6587\u4e2d\u7684\u87ba\u6813\u5de5\u5382\u793a\u4f8b\u6267\u884cz\u68c0\u9a8c\u3002\u8ba1\u7b97\u68c0\u9a8c\u7edf\u8ba1\u91cf\u3001p\u503c\u5e76\u505a\u51fa\u51b3\u7b56\u3002 <pre><code>import jax.numpy as jnp\n\nx_bar = 10.3    # \u6837\u672c\u5747\u503c\nmu_0 = 10.0     # \u539f\u5047\u8bbe\u503c\nsigma = 0.9     # \u5df2\u77e5\u603b\u4f53\u6807\u51c6\u5dee\nn = 36           # \u6837\u672c\u91cf\nalpha = 0.05\n\n# \u68c0\u9a8c\u7edf\u8ba1\u91cf\nz = (x_bar - mu_0) / (sigma / jnp.sqrt(n))\nprint(f\"z = {z:.4f}\")\n\n# p\u503c\uff08\u53cc\u4fa7\u68c0\u9a8c\uff09\u4f7f\u7528\u6b63\u6001CDF\u8fd1\u4f3c\n# \u5bf9\u4e8e |z| = 2.0\uff0cp \u2248 0.0456\nfrom jax.scipy.stats import norm\np_value = 2 * (1 - norm.cdf(jnp.abs(z)))\nprint(f\"p\u503c = {p_value:.4f}\")\nprint(f\"\u62d2\u7eddH\u2080\uff1f{p_value &lt;= alpha}\")\n</code></pre></p> </li> <li> <p>\u6a21\u62df\u7b2c\u4e00\u7c7b\u9519\u8bef\uff1a\u5f53 \\(H_0\\) \u4e3a\u771f\u65f6\uff0c\u6211\u4eec\u72af\u9519\u8bef\u7684\u9891\u7387\u6709\u591a\u9ad8\uff1f\u8fd0\u884c10,000\u6b21\u5b9e\u9a8c\uff0c\u68c0\u9a8c\u62d2\u7edd\u7387\u662f\u5426\u4e0e \\(\\alpha\\) \u4e00\u81f4\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\nkey = jax.random.PRNGKey(0)\nmu_0 = 50.0\nsigma = 10.0\nn = 30\nalpha = 0.05\nn_experiments = 10_000\n\nrejections = 0\nfor i in range(n_experiments):\n    key, subkey = jax.random.split(key)\n    sample = mu_0 + sigma * jax.random.normal(subkey, shape=(n,))\n    z = (sample.mean() - mu_0) / (sigma / jnp.sqrt(n))\n    p_value = 2 * (1 - __import__(\"jax\").scipy.stats.norm.cdf(jnp.abs(z)))\n    if p_value &lt;= alpha:\n        rejections += 1\n\nprint(f\"\u62d2\u7edd\u7387\uff1a{rejections/n_experiments:.4f}\")\nprint(f\"\u671f\u671b\u503c\uff08\u03b1\uff09\uff1a  {alpha}\")\n</code></pre></p> </li> <li> <p>\u5bf9\u4e24\u7ec4\u6570\u636e\u5206\u522b\u8fd0\u884ct\u68c0\u9a8c\u548cMann-Whitney U\u68c0\u9a8c\u3002\u751f\u6210\u4e00\u7ec4\u5747\u503c\u7565\u9ad8\u4e8e\u53e6\u4e00\u7ec4\u7684\u6570\u636e\uff0c\u89c2\u5bdf\u54ea\u79cd\u68c0\u9a8c\u80fd\u68c0\u6d4b\u51fa\u5dee\u5f02\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\nkey = jax.random.PRNGKey(99)\nk1, k2 = jax.random.split(key)\n\ngroup_a = jax.random.normal(k1, shape=(25,)) * 5 + 100\ngroup_b = jax.random.normal(k2, shape=(25,)) * 5 + 103  # \u5747\u503c\u7565\u9ad8\n\n# \u53cc\u6837\u672ct\u68c0\u9a8c\uff08\u5047\u8bbe\u65b9\u5dee\u76f8\u7b49\uff09\nn_a, n_b = len(group_a), len(group_b)\nmean_a, mean_b = group_a.mean(), group_b.mean()\npooled_var = ((n_a - 1) * group_a.var() + (n_b - 1) * group_b.var()) / (n_a + n_b - 2)\nse = jnp.sqrt(pooled_var * (1/n_a + 1/n_b))\nt_stat = (mean_a - mean_b) / se\nprint(f\"t\u68c0\u9a8c\u7edf\u8ba1\u91cf\uff1a{t_stat:.4f}\")\n\n# Mann-Whitney\uff1a\u7edf\u8ba1group_a\u7684\u503c\u5c0f\u4e8egroup_b\u503c\u7684\u6b21\u6570\nu_stat = jnp.sum(group_a[:, None] &lt; group_b[None, :])\nprint(f\"Mann-Whitney U\uff1a  {u_stat}\")\nprint(f\"\\nA\u7ec4\u5747\u503c\uff1a{mean_a:.2f}\uff0cB\u7ec4\u5747\u503c\uff1a{mean_b:.2f}\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2004%3A%20statistics/05.%20inference/","title":"\u7edf\u8ba1\u63a8\u65ad","text":"<p>\u7edf\u8ba1\u63a8\u65ad\u8d85\u8d8a\u4e86\u7b80\u5355\u7684\"\u662f/\u5426\"\u51b3\u7b56\uff0c\u4ee5\u91cf\u5316\u7684\u4e0d\u786e\u5b9a\u6027\u6765\u4f30\u8ba1\u603b\u4f53\u53c2\u6570\u3002\u672c\u8282\u6db5\u76d6\u7f6e\u4fe1\u533a\u95f4\u3001\u70b9\u4f30\u8ba1\u4e0e\u533a\u95f4\u4f30\u8ba1\u3001\u6781\u5927\u4f3c\u7136\u4f30\u8ba1\u3001\u77e9\u6cd5\u4ee5\u53ca\u56de\u5f52\u5206\u6790\u2014\u2014\u8fd9\u662f\u8fde\u63a5\u539f\u59cb\u6570\u636e\u4e0e\u673a\u5668\u5b66\u4e60\u9884\u6d4b\u6a21\u578b\u7684\u6865\u6881\u3002</p> <ul> <li> <p>\u5047\u8bbe\u68c0\u9a8c\u7ed9\u51fa\u4e00\u4e2a\"\u662f/\u5426\"\u7684\u7ed3\u8bba\uff1a\u62d2\u7edd\u6216\u4e0d\u62d2\u7edd\u539f\u5047\u8bbe\u3002\u4f46\u901a\u5e38\u4f60\u5e0c\u671b\u5f97\u5230\u66f4\u6709\u4fe1\u606f\u91cf\u7684\u7ed3\u679c\u2014\u2014\u4f60\u6b63\u5728\u4f30\u8ba1\u7684\u53c2\u6570\u7684\u4e00\u4e2a\u5408\u7406\u53d6\u503c\u533a\u95f4\u3002\u8fd9\u6b63\u662f\u7f6e\u4fe1\u533a\u95f4\u6240\u63d0\u4f9b\u7684\u3002</p> </li> <li> <p>\u70b9\u4f30\u8ba1\u662f\u4ece\u6837\u672c\u4e2d\u8ba1\u7b97\u51fa\u7684\u5355\u4e00\u6570\u503c\uff0c\u6bd4\u5982\u6837\u672c\u5747\u503c \\(\\bar{x}\\)\u3002\u5b83\u662f\u4f60\u5bf9\u603b\u4f53\u53c2\u6570\u7684\u6700\u4f73\u731c\u6d4b\uff0c\u4f46\u4ec5\u51ed\u5b83\u672c\u8eab\u65e0\u6cd5\u53cd\u6620\u4f30\u8ba1\u7684\u7cbe\u786e\u7a0b\u5ea6\u3002</p> </li> <li> <p>\u7f6e\u4fe1\u533a\u95f4\u5728\u70b9\u4f30\u8ba1\u5468\u56f4\u5305\u88f9\u4e00\u4e2a\u53cd\u6620\u4e0d\u786e\u5b9a\u6027\u7684\u8303\u56f4\u3002\u5176\u5f62\u5f0f\u4e3a\uff1a</p> </li> </ul> \\[\\text{CI} = \\bar{x} \\pm \\text{ME}\\] <ul> <li>\u8bef\u5dee\u8303\u56f4\u53d6\u51b3\u4e8e\u4e09\u4e2a\u56e0\u7d20\uff1a\u4f60\u5e0c\u671b\u591a\u9ad8\u7684\u7f6e\u4fe1\u5ea6\u3001\u6570\u636e\u7684\u53d8\u5f02\u7a0b\u5ea6\u6709\u591a\u5927\u3001\u4ee5\u53ca\u6837\u672c\u91cf\u6709\u591a\u5927\uff1a</li> </ul> \\[\\text{ME} = z^\\ast \\cdot \\frac{\\sigma}{\\sqrt{n}}\\] <ul> <li>\u5176\u4e2d \\(z^\\ast\\) \u662f\u4ece\u6b63\u6001\u5206\u5e03\u4e2d\u67e5\u5f97\u7684\u4e34\u754c\u503c\uff0c\u4e0e\u4f60\u671f\u671b\u7684\u7f6e\u4fe1\u6c34\u5e73\u5bf9\u5e94\u3002\u5bf9\u4e8e 95% \u7f6e\u4fe1\u5ea6\uff0c\\(z^\\ast = 1.96\\)\uff1b\u5bf9\u4e8e 99% \u7f6e\u4fe1\u5ea6\uff0c\\(z^\\ast = 2.576\\)\u3002</li> </ul> <p></p> <ul> <li> <p>95% \u7f6e\u4fe1\u533a\u95f4\u7684\u542b\u4e49\u662f\uff1a\u5982\u679c\u4f60\u91cd\u590d\u8fdb\u884c\u591a\u6b21\u5b9e\u9a8c\uff0c\u6bcf\u6b21\u6784\u5efa\u4e00\u4e2a\u533a\u95f4\uff0c\u90a3\u4e48\u5927\u7ea6 95% \u7684\u533a\u95f4\u4f1a\u5305\u542b\u771f\u5b9e\u7684\u603b\u4f53\u53c2\u6570\u3002\u8fd9\u5e76\u4e0d\u610f\u5473\u7740\u8be5\u53c2\u6570\u6709 95% \u7684\u6982\u7387\u843d\u5728\u8fd9\u4e2a\u7279\u5b9a\u7684\u533a\u95f4\u5185\u3002\u53c2\u6570\u662f\u4e00\u4e2a\u56fa\u5b9a\u503c\uff1b\u53d8\u5316\u7684\u662f\u533a\u95f4\u672c\u8eab\u3002</p> </li> <li> <p>\u793a\u4f8b\uff1a\u4f60\u6d4b\u91cf\u4e86 50 \u4eba\u7684\u8eab\u9ad8\uff0c\u5f97\u5230 \\(\\bar{x} = 170\\) cm\uff0c\\(\\sigma = 8\\) cm\u3002\u6784\u5efa\u4e00\u4e2a 95% \u7f6e\u4fe1\u533a\u95f4\u3002</p> </li> </ul> \\[\\text{ME} = 1.96 \\cdot \\frac{8}{\\sqrt{50}} = 1.96 \\cdot 1.131 = 2.22 \\text{ cm}\\] \\[\\text{CI} = [170 - 2.22, \\; 170 + 2.22] = [167.78, \\; 172.22]\\] <ul> <li> <p>\u4f60\u53ef\u4ee5\u8bf4\uff0c\u6709 95% \u7684\u628a\u63e1\u8ba4\u4e3a\u771f\u6b63\u7684\u5e73\u5747\u8eab\u9ad8\u4ecb\u4e8e 167.78 cm \u548c 172.22 cm \u4e4b\u95f4\u3002</p> </li> <li> <p>\u5f53 \\(\\sigma\\) \u672a\u77e5\u65f6\uff08\u8fd9\u662f\u5e38\u89c1\u60c5\u51b5\uff09\uff0c\u6539\u7528\u6837\u672c\u6807\u51c6\u5dee \\(s\\) \u548c t \u5206\u5e03\uff1a</p> </li> </ul> \\[\\text{CI} = \\bar{x} \\pm t^\\ast_{n-1} \\cdot \\frac{s}{\\sqrt{n}}\\] <ul> <li> <p>\u8d8a\u5bbd\u7684\u533a\u95f4\u7f6e\u4fe1\u5ea6\u8d8a\u9ad8\uff0c\u4f46\u7cbe\u5ea6\u8d8a\u4f4e\uff1b\u8d8a\u7a84\u7684\u533a\u95f4\u7cbe\u5ea6\u8d8a\u9ad8\uff0c\u4f46\u7f6e\u4fe1\u5ea6\u8d8a\u4f4e\u3002\u5728\u4e0d\u964d\u4f4e\u7f6e\u4fe1\u5ea6\u7684\u524d\u63d0\u4e0b\uff0c\u589e\u5927\u6837\u672c\u91cf\u53ef\u4ee5\u7f29\u5c0f\u533a\u95f4\u3002</p> </li> <li> <p>\u529f\u6548\u5206\u6790\u5e2e\u52a9\u4f60\u5728\u5b9e\u9a8c\u5f00\u59cb\u524d\u8fdb\u884c\u89c4\u5212\u3002\u8981\u56de\u7b54\u7684\u95ee\u9898\u662f\uff1a\u4e3a\u4e86\u68c0\u6d4b\u5230\u67d0\u4e2a\u7ed9\u5b9a\u5927\u5c0f\u7684\u6548\u5e94\u5e76\u8fbe\u5230\u6307\u5b9a\u7684\u68c0\u9a8c\u529f\u6548\uff0c\u6211\u9700\u8981\u591a\u5927\u7684\u6837\u672c\u91cf\uff1f</p> </li> <li> <p>\u56de\u987e\u4e0a\u4e00\u8282\u7684\u5185\u5bb9\uff0c\u529f\u6548 = \\(1 - \\beta\\)\uff0c\u5373\u6b63\u786e\u62d2\u7edd\u9519\u8bef\u539f\u5047\u8bbe \\(H_0\\) \u7684\u6982\u7387\u3002\u5e38\u89c1\u7684\u529f\u6548\u76ee\u6807\u662f 80%\u3002</p> </li> <li> <p>\u5bf9\u4e8e z \u68c0\u9a8c\uff0c\u68c0\u6d4b\u5dee\u5f02 \\(\\delta\\) \u6240\u9700\u6837\u672c\u91cf\uff08\u7ed9\u5b9a\u663e\u8457\u6027\u6c34\u5e73 \\(\\alpha\\) \u548c\u529f\u6548 \\(1-\\beta\\)\uff09\u4e3a\uff1a</p> </li> </ul> \\[n = \\left(\\frac{(z_{\\alpha/2} + z_{\\beta}) \\cdot \\sigma}{\\delta}\\right)^2\\] <ul> <li>\u4f8b\u5982\uff0c\u8981\u68c0\u6d4b\u5e73\u5747\u8eab\u9ad8 2 cm \u7684\u5dee\u5f02\uff08\\(\\sigma = 8\\)\uff09\uff0c\u53d6 \\(\\alpha = 0.05\\)\u3001\u529f\u6548 80%\uff08\\(z_{0.025} = 1.96\\)\uff0c\\(z_{0.20} = 0.84\\)\uff09\uff1a</li> </ul> \\[n = \\left(\\frac{(1.96 + 0.84) \\cdot 8}{2}\\right)^2 = \\left(\\frac{22.4}{2}\\right)^2 = 11.2^2 \\approx 126\\] <ul> <li> <p>\u4f60\u5927\u7ea6\u9700\u8981\u6bcf\u7ec4 126 \u4eba\u3002</p> </li> <li> <p>\u529f\u6548\u5206\u6790\u53ef\u4ee5\u9632\u6b62\u4e24\u79cd\u5e38\u89c1\u9519\u8bef\uff1a\u5b9e\u9a8c\u89c4\u6a21\u592a\u5c0f\uff0c\u65e0\u6cd5\u68c0\u6d4b\u5230\u771f\u5b9e\u7684\u6548\u5e94\uff08\u529f\u6548\u4e0d\u8db3\uff09\uff1b\u6216\u8005\u6d6a\u8d39\u8d44\u6e90\u505a\u8fdc\u8d85\u5fc5\u8981\u89c4\u6a21\u7684\u5b9e\u9a8c\uff08\u529f\u6548\u8fc7\u5269\uff09\u3002</p> </li> <li> <p>\u8499\u7279\u5361\u6d1b\u65b9\u6cd5\u5229\u7528\u968f\u673a\u62bd\u6837\u6765\u6c42\u89e3\u96be\u4ee5\u6216\u65e0\u6cd5\u89e3\u6790\u6c42\u89e3\u7684\u95ee\u9898\u3002\u5176\u6838\u5fc3\u601d\u60f3\u662f\uff1a\u5982\u679c\u4f60\u65e0\u6cd5\u7cbe\u786e\u8ba1\u7b97\u67d0\u4e2a\u91cf\uff0c\u90a3\u5c31\u591a\u6b21\u6a21\u62df\u5e76\u7528\u7ed3\u679c\u4f5c\u4e3a\u8fd1\u4f3c\u503c\u3002</p> </li> <li> <p>\u540d\u79f0\u6765\u6e90\u4e8e\u8499\u7279\u5361\u6d1b\u8d4c\u573a\uff0c\u5bd3\u610f\u968f\u673a\u6027\u7684\u89d2\u8272\u3002\u8fd9\u4e9b\u65b9\u6cd5\u662f\u673a\u5668\u5b66\u4e60\u4e2d\u7684\u91cd\u8981\u5de5\u5177\uff0c\u7528\u4e8e\u4f30\u8ba1\u79ef\u5206\u3001\u8bc4\u4f30\u6a21\u578b\u4e0d\u786e\u5b9a\u6027\u4ee5\u53ca\u8fd1\u4f3c\u590d\u6742\u5206\u5e03\u7b49\u4efb\u52a1\u3002</p> </li> <li> <p>\u8499\u7279\u5361\u6d1b\u7684\u4e00\u822c\u6b65\u9aa4\uff1a</p> <ul> <li>\u5b9a\u4e49\u53ef\u80fd\u8f93\u5165\u7684\u53d6\u503c\u8303\u56f4</li> <li>\u4ece\u8be5\u8303\u56f4\u4e2d\u968f\u673a\u751f\u6210\u8f93\u5165</li> <li>\u5bf9\u6bcf\u4e2a\u8f93\u5165\u8bc4\u4f30\u67d0\u4e2a\u51fd\u6570</li> <li>\u6c47\u603b\u7ed3\u679c\uff08\u5e73\u5747\u503c\u3001\u8ba1\u6570\u7b49\uff09</li> </ul> </li> <li> <p>\u4e00\u4e2a\u7ecf\u5178\u4f8b\u5b50\u662f\u4f30\u7b97 \\(\\pi\\)\u3002\u60f3\u8c61\u4e00\u4e2a\u8fb9\u957f\u4e3a 2 \u7684\u6b63\u65b9\u5f62\uff0c\u4e2d\u5fc3\u5728\u539f\u70b9\uff0c\u5185\u5207\u4e00\u4e2a\u534a\u5f84\u4e3a 1 \u7684\u5706\u3002\u6b63\u65b9\u5f62\u7684\u9762\u79ef\u4e3a 4\uff0c\u5706\u7684\u9762\u79ef\u4e3a \\(\\pi\\)\u3002</p> </li> </ul> <p></p> <ul> <li>\u5728\u6b63\u65b9\u5f62\u5185\u5747\u5300\u5730\u968f\u673a\u6295\u70b9\u3002\u843d\u5728\u5706\u5185\u7684\u70b9\u7684\u6bd4\u4f8b\u8fd1\u4f3c \\(\\pi/4\\)\uff1a</li> </ul> \\[\\pi \\approx 4 \\times \\frac{\\text{\u5706\u5185\u70b9\u6570}}{\\text{\u603b\u70b9\u6570}}\\] <ul> <li> <p>\u70b9 \\((x, y)\\) \u5728\u5706\u5185\u7684\u6761\u4ef6\u662f \\(x^2 + y^2 \\le 1\\)\u3002\u6295\u7684\u70b9\u8d8a\u591a\uff0c\u4f30\u7b97\u503c\u5c31\u8d8a\u63a5\u8fd1 \\(\\pi\\) \u7684\u771f\u5b9e\u503c\u3002</p> </li> <li> <p>\u5728\u673a\u5668\u5b66\u4e60\u4e2d\uff0c\u8499\u7279\u5361\u6d1b\u65b9\u6cd5\u51fa\u73b0\u5728\uff1a</p> <ul> <li>\u8499\u7279\u5361\u6d1b Dropout\uff1a\u591a\u6b21\u6267\u884c\u63a8\u7406\uff08\u542f\u7528 dropout\uff09\u6765\u4f30\u8ba1\u9884\u6d4b\u4e0d\u786e\u5b9a\u6027</li> <li>MCMC\uff08\u9a6c\u5c14\u53ef\u592b\u94fe\u8499\u7279\u5361\u6d1b\uff09\uff1a\u5728\u8d1d\u53f6\u65af\u6a21\u578b\u4e2d\u4ece\u590d\u6742\u7684\u540e\u9a8c\u5206\u5e03\u4e2d\u62bd\u6837</li> <li>\u7b56\u7565\u68af\u5ea6\u65b9\u6cd5\uff1a\u901a\u8fc7\u91c7\u6837\u8f68\u8ff9\u6765\u4f30\u8ba1\u5f3a\u5316\u5b66\u4e60\u4e2d\u7684\u68af\u5ea6</li> </ul> </li> <li> <p>\u56e0\u5b50\u5206\u6790\u662f\u4e00\u79cd\u53d1\u73b0\u9690\u85cf\uff08\u6f5c\u5728\uff09\u53d8\u91cf\u7684\u6280\u672f\uff0c\u8fd9\u4e9b\u53d8\u91cf\u89e3\u91ca\u4e86\u89c2\u6d4b\u53d8\u91cf\u4e4b\u95f4\u7684\u76f8\u5173\u6027\u3002\u5982\u679c 10 \u4e2a\u4e2a\u6027\u8c03\u67e5\u95ee\u9898\u53ef\u4ee5\u7531 3 \u4e2a\u6f5c\u5728\u7279\u8d28\uff08\u5916\u5411\u6027\u3001\u5b9c\u4eba\u6027\u3001\u8d23\u4efb\u5fc3\uff09\u89e3\u91ca\uff0c\u56e0\u5b50\u5206\u6790\u5c31\u80fd\u627e\u51fa\u8fd9\u4e9b\u7279\u8d28\u3002</p> </li> <li> <p>\u8be5\u6a21\u578b\u5047\u8bbe\u6bcf\u4e2a\u89c2\u6d4b\u53d8\u91cf \\(x_i\\) \u662f\u5c11\u6570\u6f5c\u5728\u56e0\u5b50 \\(f_j\\) \u7684\u7ebf\u6027\u7ec4\u5408\u52a0\u4e0a\u566a\u58f0\uff1a</p> </li> </ul> \\[x_i = \\lambda_{i1} f_1 + \\lambda_{i2} f_2 + \\ldots + \\lambda_{ik} f_k + \\epsilon_i\\] <ul> <li> <p>\\(\\lambda\\) \u503c\u79f0\u4e3a\u56e0\u5b50\u8f7d\u8377\uff0c\u8868\u793a\u6bcf\u4e2a\u89c2\u6d4b\u53d8\u91cf\u4e0e\u5404\u56e0\u5b50\u7684\u5173\u8054\u5f3a\u5ea6\u3002\u8fd9\u4e0e\u7b2c 2 \u7ae0\u7684\u77e9\u9635\u5206\u89e3\u76f4\u63a5\u76f8\u5173\uff1b\u56e0\u5b50\u5206\u6790\u4e0e\u7279\u5f81\u503c\u5206\u89e3\u548c SVD \u5bc6\u5207\u76f8\u5173\u3002</p> </li> <li> <p>\u5b9e\u9a8c\u8bbe\u8ba1\u662f\u5b89\u6392\u5b9e\u9a8c\u7ed3\u6784\u7684\u827a\u672f\uff0c\u4f7f\u4f60\u80fd\u591f\u5f97\u51fa\u6709\u6548\u7684\u7ed3\u8bba\u3002\u7cdf\u7cd5\u7684\u8bbe\u8ba1\u751a\u81f3\u4f1a\u4f7f\u5927\u91cf\u6570\u636e\u53d8\u5f97\u6beb\u65e0\u4ef7\u503c\u3002</p> </li> <li> <p>\u826f\u597d\u5b9e\u9a8c\u8bbe\u8ba1\u7684\u5173\u952e\u8981\u7d20\uff1a</p> <ul> <li>\u81ea\u53d8\u91cf\uff1a\u4f60\u64cd\u63a7\u7684\u53d8\u91cf\uff08\u4f8b\u5982\u836f\u7269\u5242\u91cf\u3001\u6a21\u578b\u67b6\u6784\uff09</li> <li>\u56e0\u53d8\u91cf\uff1a\u4f60\u6d4b\u91cf\u7684\u53d8\u91cf\uff08\u4f8b\u5982\u6062\u590d\u65f6\u95f4\u3001\u51c6\u786e\u7387\uff09</li> <li>\u5bf9\u7167\u7ec4\uff1a\u4e0d\u63a5\u53d7\u5904\u7406\uff08\u6216\u63a5\u53d7\u5b89\u6170\u5242\uff09\uff0c\u63d0\u4f9b\u6bd4\u8f83\u7684\u57fa\u7ebf</li> <li>\u968f\u673a\u5206\u914d\uff1a\u53c2\u4e0e\u8005\u88ab\u968f\u673a\u5206\u914d\u5230\u5404\u7ec4\uff0c\u4ece\u800c\u5e73\u8861\u6389\u672a\u6d4b\u91cf\u7684\u6df7\u6742\u53d8\u91cf</li> </ul> </li> <li> <p>\u5e38\u89c1\u7684\u5b9e\u9a8c\u8bbe\u8ba1\uff1a</p> <ul> <li>\u5b8c\u5168\u968f\u673a\u8bbe\u8ba1\uff1a\u53d7\u8bd5\u8005\u88ab\u968f\u673a\u5206\u914d\u5230\u5904\u7406\u7ec4\u3002\u5728\u5404\u7ec4\u53ef\u6bd4\u7684\u60c5\u51b5\u4e0b\uff0c\u7b80\u5355\u6709\u6548\u3002</li> <li>\u968f\u673a\u533a\u7ec4\u8bbe\u8ba1\uff1a\u53d7\u8bd5\u8005\u5148\u6309\u533a\u7ec4\u5206\u7ec4\uff08\u4f8b\u5982\u6309\u5e74\u9f84\uff09\uff0c\u7136\u540e\u5728\u6bcf\u4e2a\u533a\u7ec4\u5185\u968f\u673a\u5206\u914d\u5230\u5904\u7406\u7ec4\u3002\u8fd9\u964d\u4f4e\u4e86\u533a\u7ec4\u56e0\u7d20\u5e26\u6765\u7684\u53d8\u5f02\uff0c\u7c7b\u4f3c\u4e8e\u5206\u5c42\u62bd\u6837\u7684\u601d\u8def\u3002</li> <li>\u6790\u56e0\u8bbe\u8ba1\uff1a\u540c\u65f6\u6d4b\u8bd5\u591a\u4e2a\u81ea\u53d8\u91cf\u3002\u4e00\u4e2a \\(2 \\times 3\\) \u7684\u6790\u56e0\u8bbe\u8ba1\u5305\u542b\u4e00\u4e2a\u53d8\u91cf\u7684 2 \u4e2a\u6c34\u5e73\u548c\u53e6\u4e00\u4e2a\u53d8\u91cf\u7684 3 \u4e2a\u6c34\u5e73\uff0c\u5171 6 \u79cd\u5904\u7406\u7ec4\u5408\u3002\u8fd9\u4f7f\u4f60\u80fd\u591f\u68c0\u6d4b\u5230\u4ea4\u4e92\u4f5c\u7528\u2014\u2014\u5373\u4e00\u4e2a\u53d8\u91cf\u7684\u6548\u5e94\u53d6\u51b3\u4e8e\u53e6\u4e00\u4e2a\u53d8\u91cf\u7684\u6c34\u5e73\u3002</li> <li>\u4ea4\u53c9\u8bbe\u8ba1\uff1a\u6bcf\u4e2a\u53d7\u8bd5\u8005\u6309\u987a\u5e8f\u63a5\u53d7\u6240\u6709\u5904\u7406\uff08\u5176\u95f4\u6709\u6d17\u8131\u671f\uff09\u3002\u6bcf\u4e2a\u53d7\u8bd5\u8005\u4f5c\u4e3a\u81ea\u8eab\u7684\u5bf9\u7167\uff0c\u51cf\u5c11\u4e86\u4e2a\u4f53\u5dee\u5f02\u7684\u5f71\u54cd\u3002</li> </ul> </li> <li> <p>\u5728\u673a\u5668\u5b66\u4e60\u5b9e\u9a8c\u4e2d\uff0c\u8fd9\u4e9b\u539f\u5219\u81f3\u5173\u91cd\u8981\u3002\u6bd4\u8f83\u6a21\u578b\u65f6\uff0c\u5e94\u63a7\u5236\u968f\u673a\u79cd\u5b50\u3001\u6570\u636e\u96c6\u5212\u5206\u548c\u786c\u4ef6\u73af\u5883\u3002\u4ea4\u53c9\u9a8c\u8bc1\u662f\u4e00\u79cd\u4ea4\u53c9\u8bbe\u8ba1\u5f62\u5f0f\u3002\u9010\u6b21\u79fb\u9664\u4e00\u4e2a\u7ec4\u4ef6\u7684\u6d88\u878d\u7814\u7a76\u5219\u9075\u5faa\u6790\u56e0\u8bbe\u8ba1\u7684\u903b\u8f91\u3002</p> </li> </ul>"},{"location":"chapter%2004%3A%20statistics/05.%20inference/#colab-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u5728 CoLab \u6216 notebook \u4e2d\u5b8c\u6210\uff09","text":"<ol> <li> <p>\u4e3a\u8eab\u9ad8\u793a\u4f8b\u6784\u5efa\u4e00\u4e2a 95% \u7f6e\u4fe1\u533a\u95f4\uff0c\u7136\u540e\u5c1d\u8bd5\u4e0d\u540c\u7684\u7f6e\u4fe1\u6c34\u5e73\u548c\u6837\u672c\u91cf\u3002 <pre><code>import jax.numpy as jnp\n\nx_bar = 170.0    # \u6837\u672c\u5747\u503c\nsigma = 8.0      # \u603b\u4f53\u6807\u51c6\u5dee\uff08\u5df2\u77e5\uff09\nn = 50           # \u6837\u672c\u91cf\n\n# \u5e38\u7528\u7f6e\u4fe1\u6c34\u5e73\u7684\u4e34\u754c\u503c\nz_stars = {0.90: 1.645, 0.95: 1.960, 0.99: 2.576}\n\nfor conf, z_star in z_stars.items():\n    me = z_star * (sigma / jnp.sqrt(n))\n    lower, upper = x_bar - me, x_bar + me\n    print(f\"{conf*100:.0f}% CI: [{lower:.2f}, {upper:.2f}]  (ME = {me:.2f})\")\n</code></pre></p> </li> <li> <p>\u4f7f\u7528\u8499\u7279\u5361\u6d1b\u6a21\u62df\u4f30\u7b97 \\(\\pi\\)\u3002\u7ed8\u5236\u968f\u7740\u70b9\u6570\u589e\u52a0\u4f30\u7b97\u503c\u6536\u655b\u7684\u66f2\u7ebf\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\nkey = jax.random.PRNGKey(42)\n\n# \u5728 [-1, 1] x [-1, 1] \u5185\u751f\u6210\u968f\u673a\u70b9\nn_points = 100_000\nk1, k2 = jax.random.split(key)\nx = jax.random.uniform(k1, shape=(n_points,), minval=-1, maxval=1)\ny = jax.random.uniform(k2, shape=(n_points,), minval=-1, maxval=1)\n\n# \u68c0\u67e5\u54ea\u4e9b\u70b9\u5728\u5355\u4f4d\u5706\u5185\ninside = (x**2 + y**2) &lt;= 1.0\ncumulative_inside = jnp.cumsum(inside)\ncounts = jnp.arange(1, n_points + 1)\npi_estimates = 4.0 * cumulative_inside / counts\n\nplt.figure(figsize=(10, 4))\nplt.plot(pi_estimates, color=\"#3498db\", alpha=0.7, linewidth=0.5)\nplt.axhline(y=jnp.pi, color=\"#e74c3c\", linestyle=\"--\", label=f\"\u03c0 = {jnp.pi:.6f}\")\nplt.xlabel(\"\u70b9\u6570\")\nplt.ylabel(\"\u03c0 \u7684\u4f30\u7b97\u503c\")\nplt.title(\"\u8499\u7279\u5361\u6d1b\u4f30\u7b97 \u03c0\")\nplt.legend()\nplt.ylim(2.8, 3.5)\nplt.show()\n\nprint(f\"\u6700\u7ec8\u4f30\u7b97\u503c: {pi_estimates[-1]:.6f}\")\nprint(f\"\u771f\u5b9e\u503c:     {jnp.pi:.6f}\")\nprint(f\"\u8bef\u5dee:       {abs(pi_estimates[-1] - jnp.pi):.6f}\")\n</code></pre></p> </li> <li> <p>\u6267\u884c\u4e00\u4e2a\u7b80\u5355\u7684\u529f\u6548\u5206\u6790\uff1a\u7ed9\u5b9a\u6548\u5e94\u5927\u5c0f\u548c\u6807\u51c6\u5dee\uff0c\u8ba1\u7b97\u6240\u9700\u6837\u672c\u91cf\u5e76\u901a\u8fc7\u6a21\u62df\u9a8c\u8bc1\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\n# \u53c2\u6570\ndelta = 2.0      # \u6548\u5e94\u5927\u5c0f\uff08\u5747\u503c\u5dee\uff09\nsigma = 8.0      # \u603b\u4f53\u6807\u51c6\u5dee\nalpha = 0.05\npower_target = 0.80\n\n# \u89e3\u6790\u8ba1\u7b97\u7684\u6837\u672c\u91cf\nz_alpha = 1.96   # \u53cc\u5c3e\uff0calpha=0.05\nz_beta = 0.84    # power=0.80\nn_required = ((z_alpha + z_beta) * sigma / delta) ** 2\nprint(f\"\u6bcf\u7ec4\u6240\u9700\u6837\u672c\u91cf: {n_required:.0f}\")\n\n# \u901a\u8fc7\u6a21\u62df\u9a8c\u8bc1\nkey = jax.random.PRNGKey(7)\nn = int(jnp.ceil(n_required))\nn_sims = 5000\nrejections = 0\n\nfor _ in range(n_sims):\n    key, k1, k2 = jax.random.split(key, 3)\n    group_a = jax.random.normal(k1, shape=(n,)) * sigma + 50\n    group_b = jax.random.normal(k2, shape=(n,)) * sigma + 50 + delta\n    pooled_se = jnp.sqrt(2 * sigma**2 / n)\n    z = (group_b.mean() - group_a.mean()) / pooled_se\n    p = 2 * (1 - __import__(\"jax\").scipy.stats.norm.cdf(jnp.abs(z)))\n    if p &lt;= alpha:\n        rejections += 1\n\nprint(f\"\u6a21\u62df\u529f\u6548: {rejections/n_sims:.3f}\")\nprint(f\"\u76ee\u6807\u529f\u6548: {power_target:.3f}\")\n</code></pre></p> </li> <li> <p>\u53ef\u89c6\u5316\u7f6e\u4fe1\u533a\u95f4\u5bbd\u5ea6\u968f\u6837\u672c\u91cf\u7684\u53d8\u5316\u3002\u8fd9\u5c55\u793a\u4e86\u4e3a\u4ec0\u4e48\u6536\u96c6\u66f4\u591a\u6570\u636e\u53ef\u4ee5\u5f97\u5230\u66f4\u7cbe\u786e\u7684\u4f30\u8ba1\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\nsigma = 8.0\nz_star = 1.96  # 95% \u7f6e\u4fe1\u5ea6\n\nsample_sizes = jnp.array([10, 20, 30, 50, 100, 200, 500, 1000], dtype=jnp.float32)\nmargins = z_star * sigma / jnp.sqrt(sample_sizes)\n\nplt.figure(figsize=(8, 4))\nplt.bar([str(int(n)) for n in sample_sizes], margins, color=\"#3498db\", alpha=0.7)\nplt.xlabel(\"\u6837\u672c\u91cf\")\nplt.ylabel(\"\u8bef\u5dee\u8303\u56f4 (cm)\")\nplt.title(\"95% CI \u8bef\u5dee\u8303\u56f4\u968f\u6837\u672c\u91cf\u589e\u5927\u800c\u7f29\u5c0f\")\nplt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2005%3A%20probability/01.%20counting/","title":"\u8ba1\u6570","text":"<p>\u8ba1\u6570\u662f\u8ba1\u7b97\u6982\u7387\u7684\u524d\u63d0\u2014\u2014\u5728\u5206\u914d\u53ef\u80fd\u6027\u4e4b\u524d\uff0c\u4f60\u5fc5\u987b\u5148\u77e5\u9053\u6709\u591a\u5c11\u79cd\u7ed3\u679c\u3002\u672c\u6587\u6db5\u76d6\u4e58\u6cd5\u4e0e\u52a0\u6cd5\u89c4\u5219\u3001\u9636\u4e58\u3001\u6392\u5217\u3001\u7ec4\u5408\u3001\u4e8c\u9879\u5f0f\u7cfb\u6570\uff0c\u4ee5\u53ca\u652f\u6491\u673a\u5668\u5b66\u4e60\u4e2d\u91c7\u6837\u3001\u54c8\u5e0c\u548c\u6982\u7387\u5206\u6790\u7684\u57fa\u672c\u7ec4\u5408\u5de5\u5177\u3002</p> <ul> <li> <p>\u5728\u8ba1\u7b97\u6982\u7387\u4e4b\u524d\uff0c\u6211\u4eec\u9700\u8981\u5148\u6570\u6e05\u7ed3\u679c\u7684\u6570\u91cf\u3002\u5982\u679c\u4f60\u60f3\u77e5\u9053\u5728\u6251\u514b\u4e2d\u62ff\u5230\u4e00\u624b\u8d62\u724c\u7684\u6982\u7387\uff0c\u4f60\u5fc5\u987b\u5148\u77e5\u9053\u4e00\u5171\u6709\u591a\u5c11\u79cd\u53ef\u80fd\u7684\u724c\u578b\uff0c\u4ee5\u53ca\u5176\u4e2d\u6709\u591a\u5c11\u79cd\u662f\u8d62\u724c\u3002\u8ba1\u6570\u6b63\u662f\u8ba9\u6982\u7387\u7cbe\u786e\u5316\u7684\u57fa\u7840\u5de5\u5177\u3002</p> </li> <li> <p>\u6700\u7b80\u5355\u7684\u8ba1\u6570\u539f\u5219\u662f\u4e58\u6cd5\u89c4\u5219\u3002\u5982\u679c\u4e00\u4e2a\u9009\u62e9\u6709 \\(m\\) \u79cd\u9009\u9879\uff0c\u53e6\u4e00\u4e2a\u72ec\u7acb\u7684\u9009\u62e9\u6709 \\(n\\) \u79cd\u9009\u9879\uff0c\u90a3\u4e48\u7ec4\u5408\u8d77\u6765\u7684\u603b\u7ed3\u679c\u6570\u4e3a \\(m \\times n\\)\u3002</p> </li> <li> <p>\u60f3\u8c61\u65e9\u4e0a\u7a7f\u8863\u670d\u7684\u573a\u666f\u3002\u4f60\u6709 3 \u4ef6\u886c\u886b\u548c 4 \u6761\u88e4\u5b50\u3002\u6bcf\u4ef6\u886c\u886b\u90fd\u80fd\u4e0e\u6bcf\u6761\u88e4\u5b50\u642d\u914d\uff0c\u5171\u6709 \\(3 \\times 4 = 12\\) \u79cd\u7a7f\u642d\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u4e58\u6cd5\u89c4\u5219\u53ef\u4ee5\u63a8\u5e7f\u5230\u4efb\u610f\u6570\u91cf\u7684\u9009\u62e9\u3002\u5982\u679c\u4f60\u8fd8\u6709 2 \u53cc\u978b\uff0c\u90a3\u4e48\u603b\u7a7f\u642d\u6570\u5c31\u53d8\u6210 \\(3 \\times 4 \\times 2 = 24\\)\u3002\u6bcf\u4e2a\u65b0\u7684\u72ec\u7acb\u9009\u62e9\u90fd\u4f1a\u4e58\u5230\u603b\u8ba1\u6570\u4e2d\u3002</p> </li> <li> <p>\u52a0\u6cd5\u89c4\u5219\u5904\u7406\"\u6216\"\u7684\u573a\u666f\u3002\u5982\u679c\u4e8b\u4ef6 A \u6709 \\(m\\) \u79cd\u53d1\u751f\u65b9\u5f0f\uff0c\u4e8b\u4ef6 B \u6709 \\(n\\) \u79cd\u53d1\u751f\u65b9\u5f0f\uff0c\u4e14\u5b83\u4eec\u4e0d\u80fd\u540c\u65f6\u53d1\u751f\uff08\u4e92\u65a5\uff09\uff0c\u90a3\u4e48\u603b\u7684\u65b9\u5f0f\u6570\u4e3a \\(m + n\\)\u3002</p> </li> <li> <p>\u5047\u8bbe\u4f60\u8981\u4ece\u57ce\u5e02 X \u524d\u5f80\u57ce\u5e02 Y\uff1a\u5f00\u8f66\u6709 3 \u6761\u8def\u7ebf\uff0c\u5750\u706b\u8f66\u6709 2 \u6761\u8def\u7ebf\u3002\u4f60\u65e0\u6cd5\u540c\u65f6\u9009\u62e9\u4e24\u8005\uff0c\u56e0\u6b64\u603b\u9009\u9879\u6570\u4e3a \\(3 + 2 = 5\\)\u3002</p> </li> <li> <p>\u5f53\u4e8b\u4ef6\u6709\u91cd\u53e0\u65f6\uff0c\u9700\u8981\u51cf\u53bb\u88ab\u91cd\u590d\u8ba1\u6570\u7684\u7ed3\u679c\u3002\u5982\u679c \\(A\\) \u548c \\(B\\) \u53ef\u4ee5\u540c\u65f6\u53d1\u751f\uff0c\u8ba1\u6570\u4e3a \\(|A \\cup B| = |A| + |B| - |A \\cap B|\\)\u3002\u8fd9\u5c31\u662f\u5bb9\u65a5\u539f\u7406\uff0c\u5b83\u5c06\u5728\u6211\u4eec\u8ba8\u8bba\u6982\u7387\u52a0\u6cd5\u89c4\u5219\u65f6\u518d\u6b21\u51fa\u73b0\u3002</p> </li> <li> <p>\u975e\u8d1f\u6574\u6570 \\(n\\) \u7684\u9636\u4e58\u662f\u4ece 1 \u5230 \\(n\\) \u7684\u6240\u6709\u6b63\u6574\u6570\u7684\u4e58\u79ef\uff1a</p> </li> </ul> \\[n! = n \\times (n-1) \\times (n-2) \\times \\cdots \\times 2 \\times 1\\] <ul> <li> <p>\u53ef\u4ee5\u5c06\u9636\u4e58\u7406\u89e3\u4e3a\uff1a\u5c06 \\(n\\) \u4e2a\u4e0d\u540c\u7684\u7269\u4f53\u6392\u6210\u4e00\u5217\u6709\u591a\u5c11\u79cd\u65b9\u5f0f\uff1f\u4e09\u672c\u4e66\u5728\u4e66\u67b6\u4e0a\u6709 \\(3! = 3 \\times 2 \\times 1 = 6\\) \u79cd\u6392\u5217\u65b9\u5f0f\u3002\u6309\u7ea6\u5b9a\uff0c\\(0! = 1\\)\u3002</p> </li> <li> <p>\u9636\u4e58\u7684\u589e\u957f\u901f\u5ea6\u6781\u5feb\u3002\\(10! = 3{,}628{,}800\\)\uff0c\u800c \\(20!\\) \u5df2\u7ecf\u8d85\u8fc7 \\(2.4 \\times 10^{18}\\)\u3002\u8fd9\u79cd\u7206\u70b8\u5f0f\u589e\u957f\u6b63\u662f\u66b4\u529b\u641c\u7d22\u5728\u7ec4\u5408\u95ee\u9898\u4e2d\u53d8\u5f97\u4e0d\u5207\u5b9e\u9645\u7684\u539f\u56e0\u3002</p> </li> <li> <p>\u6392\u5217\u662f\u5bf9\u7269\u4f53\u7684\u6709\u5e8f\u5b89\u6392\u3002\u5f53\u4f60\u4ece \\(n\\) \u4e2a\u4e0d\u540c\u7684\u7269\u4f53\u4e2d\u9009\u53d6 \\(r\\) \u4e2a\u4e14\u987a\u5e8f\u91cd\u8981\u65f6\uff0c\u6392\u5217\u6570\u4e3a\uff1a</p> </li> </ul> \\[P(n, r) = \\frac{n!}{(n - r)!}\\] <ul> <li> <p>\u60f3\u8c61\u4ece\u4e00\u4e2a 10 \u4eba\u7684\u4ff1\u4e50\u90e8\u4e2d\u9009\u51fa\u4f1a\u957f\u3001\u526f\u4f1a\u957f\u548c\u8d22\u52a1\u4e3b\u7ba1\u3002\u7b2c\u4e00\u4e2a\u804c\u4f4d\u6709 10 \u4e2a\u5019\u9009\u4eba\uff0c\u7b2c\u4e8c\u4e2a\u6709 9 \u4e2a\uff0c\u7b2c\u4e09\u4e2a\u6709 8 \u4e2a\u3002\u56e0\u6b64 \\(P(10, 3) = 10 \\times 9 \\times 8 = 720\\)\u3002\u516c\u5f0f\u4e5f\u5370\u8bc1\u4e86\u8fd9\u4e00\u70b9\uff1a\\(\\frac{10!}{7!} = 720\\)\u3002</p> </li> <li> <p>\u7ec4\u5408\u662f\u65e0\u5e8f\u7684\u9009\u62e9\u3002\u5f53\u4f60\u4ece \\(n\\) \u4e2a\u4e2d\u9009\u53d6 \\(r\\) \u4e2a\u4e14\u987a\u5e8f\u65e0\u5173\u7d27\u8981\u65f6\uff0c\u9700\u8981\u9664\u53bb\u91cd\u590d\u7684\u6392\u5217\u987a\u5e8f\uff1a</p> </li> </ul> \\[C(n, r) = \\binom{n}{r} = \\frac{n!}{r!(n - r)!}\\] <ul> <li>\u7b26\u53f7 \\(\\binom{n}{r}\\) \u8bfb\u4f5c\"n \u9009 r\"\u3002\u6838\u5fc3\u601d\u60f3\u662f\uff1a\u6bcf\u4e2a\u7ec4\u5408\u5bf9\u5e94 \\(r!\\) \u79cd\u6392\u5217\uff08\u9009\u51fa\u7684 \\(r\\) \u4e2a\u7269\u54c1\u53ef\u4ee5\u6709 \\(r!\\) \u79cd\u91cd\u65b0\u6392\u5217\u7684\u65b9\u5f0f\uff09\uff0c\u56e0\u6b64\u6211\u4eec\u5c06\u6392\u5217\u6570\u9664\u4ee5 \\(r!\\)\u3002</li> </ul> <p></p> <ul> <li>\u793a\u4f8b\uff1a\u4ece 10 \u4eba\u4e2d\u7ec4\u6210\u4e00\u4e2a 3 \u4eba\u59d4\u5458\u4f1a\u6709\u591a\u5c11\u79cd\u65b9\u5f0f\uff1f\u987a\u5e8f\u65e0\u5173\u7d27\u8981\uff08\u6ca1\u6709\u4f1a\u957f\u6216\u526f\u4f1a\u957f\u4e4b\u5206\uff0c\u53ea\u6709\u6210\u5458\uff09\uff0c\u56e0\u6b64\u6211\u4eec\u4f7f\u7528\u7ec4\u5408\uff1a</li> </ul> \\[\\binom{10}{3} = \\frac{10!}{3! \\cdot 7!} = \\frac{10 \\times 9 \\times 8}{3 \\times 2 \\times 1} = 120\\] <ul> <li> <p>\u540c\u6837\u7684 10 \u4e2a\u4eba\u4ea7\u751f 720 \u79cd\u6392\u5217\uff0c\u4f46\u53ea\u6709 120 \u79cd\u7ec4\u5408\uff0c\u56e0\u4e3a\u6bcf\u4e2a 3 \u4eba\u7ec4\u5185\u90e8\u6709 \\(3! = 6\\) \u79cd\u6392\u5e8f\u65b9\u5f0f\u3002</p> </li> <li> <p>\u7ec4\u5408\u5728\u6982\u7387\u4e2d\u81f3\u5173\u91cd\u8981\u3002\u4e8c\u9879\u5f0f\u7cfb\u6570 \\(\\binom{n}{r}\\) \u7edf\u8ba1\u4e86\u5728 \\(n\\) \u6b21\u8bd5\u9a8c\u4e2d\u6070\u597d\u83b7\u5f97 \\(r\\) \u6b21\u6210\u529f\u7684\u65b9\u5f0f\u6570\uff0c\u8fd9\u6b63\u662f\u4e8c\u9879\u5206\u5e03\uff08\u89c1\u6587\u4ef6 03\uff09\u7684\u6838\u5fc3\u3002</p> </li> <li> <p>\u8ba9\u6211\u4eec\u901a\u8fc7\u4e00\u4e2a\u7ecf\u5178\u7684\u59d4\u5458\u4f1a\u95ee\u9898\u6765\u7efc\u5408\u8fd0\u7528\u591a\u79cd\u8ba1\u6570\u601d\u8def\u3002</p> </li> <li> <p>\u95ee\u9898\uff1a\u4e00\u4e2a\u4ff1\u4e50\u90e8\u6709 8 \u540d\u7537\u6027\u548c 6 \u540d\u5973\u6027\u3002\u8981\u7ec4\u6210\u4e00\u4e2a 5 \u4eba\u59d4\u5458\u4f1a\uff0c\u5176\u4e2d\u6070\u597d\u5305\u542b 3 \u540d\u7537\u6027\u548c 2 \u540d\u5973\u6027\uff0c\u6709\u591a\u5c11\u79cd\u65b9\u5f0f\uff1f</p> </li> <li> <p>\u7b2c 1 \u6b65\uff1a\u4ece 8 \u4eba\u4e2d\u9009 3 \u540d\u7537\u6027\u3002</p> </li> </ul> \\[\\binom{8}{3} = \\frac{8!}{3! \\cdot 5!} = \\frac{8 \\times 7 \\times 6}{3 \\times 2 \\times 1} = 56\\] <ul> <li>\u7b2c 2 \u6b65\uff1a\u4ece 6 \u4eba\u4e2d\u9009 2 \u540d\u5973\u6027\u3002</li> </ul> \\[\\binom{6}{2} = \\frac{6!}{2! \\cdot 4!} = \\frac{6 \\times 5}{2 \\times 1} = 15\\] <ul> <li>\u7b2c 3 \u6b65\uff1a\u5e94\u7528\u4e58\u6cd5\u89c4\u5219\u3002\u6bcf\u79cd\u7537\u6027\u9009\u62e9\u53ef\u4ee5\u4e0e\u6bcf\u79cd\u5973\u6027\u9009\u62e9\u914d\u5bf9\uff1a</li> </ul> \\[56 \\times 15 = 840 \\text{ \u4e2a\u59d4\u5458\u4f1a}\\] <ul> <li> <p>\u8fd9\u79cd\u5c06\u590d\u6742\u8ba1\u6570\u95ee\u9898\u5206\u89e3\u4e3a\u72ec\u7acb\u5b50\u9009\u62e9\u518d\u76f8\u4e58\u7684\u6a21\u5f0f\uff0c\u662f\u7ec4\u5408\u6570\u5b66\u4e2d\u7684\u6807\u51c6\u65b9\u6cd5\u3002</p> </li> <li> <p>\u8fd8\u6709\u53ef\u91cd\u590d\u7684\u6392\u5217\u3002\u5f53\u7269\u54c1\u53ef\u4ee5\u91cd\u590d\u65f6\uff0c\u4ece \\(n\\) \u79cd\u7c7b\u578b\u4e2d\u9009 \\(r\\) \u4e2a\u4f1a\u4ea7\u751f \\(n^r\\) \u79cd\u7ed3\u679c\u3002\u4e00\u4e2a\u4f7f\u7528\u6570\u5b57 0-9 \u7684 4 \u4f4d PIN \u7801\u6709 \\(10^4 = 10{,}000\\) \u79cd\u53ef\u80fd\u6027\u3002\u6bcf\u4e00\u4f4d\u90fd\u6709 10 \u79cd\u9009\u62e9\uff0c\u4e58\u6cd5\u89c4\u5219\u5373\u53ef\u89e3\u51b3\u3002</p> </li> <li> <p>\u53ef\u91cd\u590d\u7684\u7ec4\u5408\uff08\u4e5f\u79f0\"\u661f\u6761\u6cd5\"\uff09\u7edf\u8ba1\u4ece \\(n\\) \u79cd\u7c7b\u578b\u4e2d\u9009 \\(r\\) \u4e2a\u3001\u5141\u8bb8\u91cd\u590d\u4e14\u987a\u5e8f\u65e0\u5173\u7684\u65b9\u5f0f\u6570\uff1a</p> </li> </ul> \\[\\binom{n + r - 1}{r} = \\frac{(n + r - 1)!}{r!(n - 1)!}\\] <ul> <li> <p>\u793a\u4f8b\uff1a\u4ece 4 \u79cd\u51b0\u6dc7\u6dcb\u53e3\u5473\u4e2d\u9009\u62e9 3 \u52fa\uff08\u5141\u8bb8\u91cd\u590d\uff09\u6709 \\(\\binom{4 + 3 - 1}{3} = \\binom{6}{3} = 20\\) \u79cd\u9009\u9879\u3002</p> </li> <li> <p>\u603b\u7ed3\u8ba1\u6570\u5de5\u5177\u7bb1\uff1a</p> </li> </ul> \u573a\u666f \u516c\u5f0f \u6709\u5e8f\uff0c\u65e0\u91cd\u590d\uff08\u6392\u5217\uff09 \\(P(n,r) = \\frac{n!}{(n-r)!}\\) \u65e0\u5e8f\uff0c\u65e0\u91cd\u590d\uff08\u7ec4\u5408\uff09 \\(\\binom{n}{r} = \\frac{n!}{r!(n-r)!}\\) \u6709\u5e8f\uff0c\u53ef\u91cd\u590d \\(n^r\\) \u65e0\u5e8f\uff0c\u53ef\u91cd\u590d \\(\\binom{n+r-1}{r}\\) <ul> <li>\u6bcf\u4e2a\u6d89\u53ca\u7b49\u53ef\u80fd\u7ed3\u679c\uff08\u7b49\u6982\u7387\u7ed3\u679c\uff09\u7684\u6982\u7387\u8ba1\u7b97\u90fd\u4f7f\u7528\u516c\u5f0f \\(P(\\text{\u4e8b\u4ef6}) = \\frac{\\text{\u6709\u5229\u7ed3\u679c\u6570}}{\\text{\u603b\u7ed3\u679c\u6570}}\\)\u3002\u8ba1\u6570\u4e3a\u6211\u4eec\u63d0\u4f9b\u4e86\u8fd9\u4e24\u4e2a\u6570\u5b57\u3002\u6709\u4e86\u8fd9\u4e2a\u57fa\u7840\uff0c\u6211\u4eec\u5c06\u5728\u4e0b\u4e00\u4e2a\u6587\u4ef6\u4e2d\u6b63\u5f0f\u5b9a\u4e49\u6982\u7387\u672c\u8eab\u3002</li> </ul>"},{"location":"chapter%2005%3A%20probability/01.%20counting/#colab-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u5728 CoLab \u6216 notebook \u4e2d\u5b8c\u6210\uff09","text":"<ol> <li> <p>\u4f7f\u7528\u9636\u4e58\u516c\u5f0f\u548c\u76f4\u63a5\u8ba1\u7b97\u4e24\u79cd\u65b9\u5f0f\u8ba1\u7b97 \\(P(10, 3)\\) \u548c \\(\\binom{10}{3}\\)\u3002\u9a8c\u8bc1\u6392\u5217\u6570\u603b\u662f\u7ec4\u5408\u6570\u7684 \\(r!\\) \u500d\u3002 <pre><code>import jax.numpy as jnp\nfrom math import factorial\n\nn, r = 10, 3\n\nperm = factorial(n) // factorial(n - r)\ncomb = factorial(n) // (factorial(r) * factorial(n - r))\n\nprint(f\"P({n},{r}) = {perm}\")\nprint(f\"C({n},{r}) = {comb}\")\nprint(f\"P / C = {perm // comb} (\u5e94\u7b49\u4e8e {r}! = {factorial(r)})\")\n</code></pre></p> </li> <li> <p>\u901a\u8fc7\u7a0b\u5e8f\u89e3\u51b3\u59d4\u5458\u4f1a\u95ee\u9898\uff088 \u4eba\u4e2d\u9009 3 \u540d\u7537\u6027\uff0c6 \u4eba\u4e2d\u9009 2 \u540d\u5973\u6027\uff09\uff0c\u5e76\u901a\u8fc7\u679a\u4e3e\u6240\u6709\u6709\u6548\u59d4\u5458\u4f1a\u6765\u9a8c\u8bc1\u3002 <pre><code>from itertools import combinations\nfrom math import factorial\n\ndef comb_count(n, r):\n    return factorial(n) // (factorial(r) * factorial(n - r))\n\n# \u516c\u5f0f\u6cd5\nmen_ways = comb_count(8, 3)\nwomen_ways = comb_count(6, 2)\nprint(f\"\u516c\u5f0f\u6cd5: {men_ways} \u00d7 {women_ways} = {men_ways * women_ways}\")\n\n# \u679a\u4e3e\u6cd5\nmen = [f\"M{i}\" for i in range(1, 9)]\nwomen = [f\"W{i}\" for i in range(1, 7)]\ncount = sum(1 for _ in combinations(men, 3) for _ in combinations(women, 2))\nprint(f\"\u679a\u4e3e\u6cd5: {count}\")\n</code></pre></p> </li> <li> <p>\u7edf\u8ba1\u7531 26 \u4e2a\u5c0f\u5199\u5b57\u6bcd\u7ec4\u6210\u7684 4 \u4f4d\u5bc6\u7801\u6709\u591a\u5c11\u79cd\uff08\u5141\u8bb8\u91cd\u590d\uff09\u3002\u7136\u540e\u7edf\u8ba1\u6ca1\u6709\u91cd\u590d\u5b57\u6bcd\u7684\u5bc6\u7801\u6709\u591a\u5c11\u79cd\u3002 <pre><code>from math import factorial\n\nn = 26\nr = 4\n\nwith_rep = n ** r\nwithout_rep = factorial(n) // factorial(n - r)\n\nprint(f\"\u5141\u8bb8\u91cd\u590d:    {with_rep:&gt;10,}\")\nprint(f\"\u4e0d\u5141\u8bb8\u91cd\u590d: {without_rep:&gt;10,}\")\nprint(f\"\u542b\u91cd\u590d\u7684\u6bd4\u4f8b: {1 - without_rep/with_rep:.2%}\")\n</code></pre></p> </li> <li> <p>\u6a21\u62df\u751f\u65e5\u95ee\u9898\uff1a\u5728 \\(k\\) \u4eba\u7684\u7fa4\u4f53\u4e2d\uff0c\u81f3\u5c11\u4e24\u4eba\u5171\u4eab\u751f\u65e5\u7684\u6982\u7387\u662f\u591a\u5c11\uff1f\u7ed8\u5236 \\(k = 1\\) \u5230 \\(60\\) \u7684\u6982\u7387\u66f2\u7ebf\uff0c\u5e76\u627e\u51fa\u6982\u7387\u8d85\u8fc7 50% \u7684\u4f4d\u7f6e\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef birthday_prob_exact(k):\n    \\\"\\\"\\\"k \u4eba\u7fa4\u4f53\u4e2d\u81f3\u5c11\u6709\u4e00\u5bf9\u5171\u4eab\u751f\u65e5\u7684\u6982\u7387\u3002\\\"\\\"\\\"\n    p_no_match = 1.0\n    for i in range(k):\n        p_no_match *= (365 - i) / 365\n    return 1 - p_no_match\n\nks = list(range(1, 61))\nprobs = [birthday_prob_exact(k) for k in ks]\n\nplt.figure(figsize=(8, 4))\nplt.plot(ks, probs, color=\"#3498db\", linewidth=2)\nplt.axhline(y=0.5, color=\"#e74c3c\", linestyle=\"--\", alpha=0.7, label=\"50%\")\ncross = next(k for k, p in zip(ks, probs) if p &gt;= 0.5)\nplt.axvline(x=cross, color=\"#e74c3c\", linestyle=\"--\", alpha=0.7)\nplt.xlabel(\"\u7fa4\u4f53\u5927\u5c0f (k)\")\nplt.ylabel(\"P(\u81f3\u5c11\u4e24\u4eba\u5171\u4eab\u751f\u65e5)\")\nplt.title(f\"\u751f\u65e5\u95ee\u9898\uff08\u5728 k={cross} \u65f6\u8d85\u8fc7 50%\uff09\")\nplt.legend()\nplt.grid(alpha=0.3)\nplt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2005%3A%20probability/02.%20probability%20concepts/","title":"\u6982\u7387\u6982\u5ff5","text":"<p>\u6982\u7387\u8bba\u5f62\u5f0f\u5316\u4e86\u4e0d\u786e\u5b9a\u6027\uff0c\u5e76\u63d0\u4f9b\u4e86\u5728\u6b64\u6846\u67b6\u4e0b\u8fdb\u884c\u63a8\u7406\u7684\u89c4\u5219\u3002\u672c\u6587\u6db5\u76d6\u6837\u672c\u7a7a\u95f4\u3001\u4e8b\u4ef6\u3001\u6982\u7387\u516c\u7406\u3001\u6761\u4ef6\u6982\u7387\u3001\u72ec\u7acb\u6027\u3001\u8d1d\u53f6\u65af\u5b9a\u7406\u3001\u9891\u7387\u6d3e\u4e0e\u8d1d\u53f6\u65af\u6d3e\u89e3\u91ca\uff0c\u8fd9\u662f\u673a\u5668\u5b66\u4e60\u4e2d\u6bcf\u4e2a\u751f\u6210\u6a21\u578b\u548c\u5224\u522b\u6a21\u578b\u80cc\u540e\u7684\u6570\u5b66\u6846\u67b6\u3002</p> <ul> <li> <p>\u6982\u7387\u4e3a\u4e00\u4e2a\u4e8b\u4ef6\u8d4b\u4e88\u4e00\u4e2a\u4ecb\u4e8e 0 \u548c 1 \u4e4b\u95f4\u7684\u6570\u5b57\uff0c\u8861\u91cf\u8be5\u4e8b\u4ef6\u53d1\u751f\u7684\u53ef\u80fd\u6027\u3002</p> </li> <li> <p>\u6982\u7387\u4e3a 0 \u8868\u793a\u4e0d\u53ef\u80fd\uff0c1 \u8868\u793a\u5fc5\u7136\uff0c0.5 \u5219\u50cf\u629b\u786c\u5e01\u4e00\u6837\u3002</p> </li> <li> <p>\u6709\u4e24\u79cd\u4e3b\u8981\u89e3\u91ca\u3002\u9891\u7387\u6d3e\u89c2\u70b9\u8ba4\u4e3a\u6982\u7387\u662f\u957f\u671f\u76f8\u5bf9\u9891\u7387\uff1a\u629b\u4e00\u679a\u5747\u5300\u786c\u5e01 10,000 \u6b21\uff0c\u6b63\u9762\u5927\u7ea6\u4f1a\u51fa\u73b0 50% \u7684\u6b21\u6570\u3002</p> </li> <li> <p>\u8d1d\u53f6\u65af\u6d3e\u89c2\u70b9\u8ba4\u4e3a\u6982\u7387\u662f\u4fe1\u5ff5\u7a0b\u5ea6\uff1a\u4f60\u53ef\u80fd\u4f1a\u8bf4\u660e\u5929\u964d\u96e8\u7684\u6982\u7387\u662f 70%\uff0c\u5c3d\u7ba1\u660e\u5929\u53ea\u4f1a\u53d1\u751f\u4e00\u6b21\u3002</p> </li> <li> <p>\u4e24\u79cd\u89e3\u91ca\u4f7f\u7528\u76f8\u540c\u7684\u6570\u5b66\u89c4\u5219\u3002\u533a\u522b\u5728\u4e8e\u54f2\u5b66\u5c42\u9762\uff0c\u4f46\u5728\u673a\u5668\u5b66\u4e60\u4e2d\u8fd9\u5f88\u91cd\u8981\u3002\u9891\u7387\u6d3e\u65b9\u6cd5\u7ed9\u51fa\u70b9\u4f30\u8ba1\u3002\u8d1d\u53f6\u65af\u6d3e\u65b9\u6cd5\u7ed9\u51fa\u53c2\u6570\u7684\u5b8c\u6574\u5206\u5e03\u3002</p> </li> <li> <p>\u6837\u672c\u7a7a\u95f4 \\(S\\) \u662f\u5b9e\u9a8c\u6240\u6709\u53ef\u80fd\u7ed3\u679c\u7684\u96c6\u5408\u3002\u629b\u4e00\u679a\u786c\u5e01\uff1a\\(S = \\{H, T\\}\\)\u3002\u63b7\u4e00\u4e2a\u9ab0\u5b50\uff1a\\(S = \\{1, 2, 3, 4, 5, 6\\}\\)\u3002</p> </li> <li> <p>\u4e8b\u4ef6\u662f\u6837\u672c\u7a7a\u95f4\u7684\u4efb\u610f\u5b50\u96c6\u3002\"\u63b7\u51fa\u5076\u6570\"\u662f\u4e8b\u4ef6 \\(A = \\{2, 4, 6\\}\\)\uff0c\u5b83\u662f \\(S\\) \u7684\u4e00\u4e2a\u5b50\u96c6\u3002</p> </li> <li> <p>\u5f53\u6240\u6709\u7ed3\u679c\u7b49\u53ef\u80fd\u65f6\uff0c\u4e8b\u4ef6\u7684\u6982\u7387\u5c31\u662f\u7b80\u5355\u7684\u8ba1\u6570\uff08\u6765\u81ea\u6587\u4ef6 01\uff09\uff1a</p> </li> </ul> \\[P(A) = \\frac{|A|}{|S|} = \\frac{\\text{\u6709\u5229\u7ed3\u679c}}{\\text{\u603b\u7ed3\u679c}}\\] <ul> <li>\u5bf9\u4e8e\u5076\u6570\u4f8b\u5b50\uff1a\\(P(\\text{\u5076\u6570}) = \\frac{3}{6} = 0.5\\)\u3002</li> </ul> <p></p> <ul> <li>\u4e8b\u4ef6 \\(A\\) \u7684\u8865\u96c6\uff0c\u8bb0\u4f5c \\(A'\\) \u6216 \\(A^c\\)\uff0c\u662f \\(S\\) \u4e2d\u6240\u6709\u4e0d\u5728 \\(A\\) \u4e2d\u7684\u5143\u7d20\u3002\u7531\u4e8e\u6bcf\u4e2a\u7ed3\u679c\u8981\u4e48\u5728 \\(A\\) \u4e2d\uff0c\u8981\u4e48\u4e0d\u5728\uff1a</li> </ul> \\[P(A') = 1 - P(A)\\] <ul> <li> <p>\u8865\u96c6\u901a\u5e38\u662f\u66f4\u7b80\u4fbf\u7684\u9014\u5f84\u3002\u4e0e\u5176\u8ba1\u7b97 5 \u6b21\u629b\u786c\u5e01\u4e2d\u81f3\u5c11\u5f97\u5230\u4e00\u4e2a\u6b63\u9762\u7684\u6240\u6709\u65b9\u5f0f\uff0c\u4e0d\u5982\u8ba1\u7b97\u5f97\u5230\u5168\u53cd\u9762\u7684\u4e00\u79cd\u65b9\u5f0f\u7136\u540e\u76f8\u51cf\uff1a\\(P(\\text{\u81f3\u5c11\u4e00\u4e2a\u6b63\u9762}) = 1 - P(\\text{\u5168\u53cd\u9762}) = 1 - (0.5)^5 = 0.969\\)\u3002</p> </li> <li> <p>\u5982\u679c\u4e24\u4e2a\u4e8b\u4ef6\u4e0d\u80fd\u540c\u65f6\u53d1\u751f\uff0c\u5219\u5b83\u4eec\u662f\u4e92\u65a5\uff08\u4e0d\u76f8\u4ea4\uff09\u7684\uff1a\\(A \\cap B = \\emptyset\\)\u3002\u4e00\u6b21\u63b7\u9ab0\u5b50\u4e2d\u63b7\u51fa 2 \u548c\u63b7\u51fa 5 \u662f\u4e92\u65a5\u4e8b\u4ef6\u3002</p> </li> <li> <p>\u4e92\u65a5\u4e8b\u4ef6\u7684\u52a0\u6cd5\u6cd5\u5219\u5f88\u76f4\u63a5\uff1a</p> </li> </ul> \\[P(A \\cup B) = P(A) + P(B) \\quad \\text{(\u82e5 } A \\cap B = \\emptyset\\text{)}\\] <ul> <li>\u5f53\u4e8b\u4ef6\u53ef\u80fd\u6709\u91cd\u53e0\u65f6\uff0c\u9700\u8981\u4f7f\u7528\u4e00\u822c\u52a0\u6cd5\u6cd5\u5219\u6765\u907f\u514d\u91cd\u590d\u8ba1\u7b97\u4ea4\u96c6\uff1a</li> </ul> \\[P(A \\cup B) = P(A) + P(B) - P(A \\cap B)\\] <ul> <li> <p>\u8fd9\u4e0e\u8ba1\u6570\u4e2d\u7684\u5bb9\u65a5\u539f\u7406\u76f8\u5bf9\u5e94\u3002\u4e0a\u65b9\u7684\u7ef4\u6069\u56fe\u8bf4\u660e\u4e86\u539f\u56e0\uff1a\u7d2b\u8272\u533a\u57df\uff08\u4ea4\u96c6\uff09\u5728 \\(P(A)\\) \u4e2d\u88ab\u8ba1\u7b97\u4e00\u6b21\uff0c\u5728 \\(P(B)\\) \u4e2d\u53c8\u88ab\u8ba1\u7b97\u4e00\u6b21\uff0c\u56e0\u6b64\u6211\u4eec\u51cf\u53bb\u4e00\u6b21\u3002</p> </li> <li> <p>\u8054\u5408\u6982\u7387 \\(P(A \\cap B)\\) \u662f \\(A\\) \u548c \\(B\\) \u540c\u65f6\u53d1\u751f\u7684\u6982\u7387\u3002\u5728\u4e00\u526f\u6251\u514b\u724c\u4e2d\uff0c\\(P(\\text{\u7ea2\u8272} \\cap \\text{\u56fd\u738b}) = \\frac{2}{52}\\)\uff0c\u56e0\u4e3a\u6709 2 \u5f20\u7ea2\u8272\u56fd\u738b\u3002</p> </li> <li> <p>\u8fb9\u9645\u6982\u7387\u662f\u5355\u4e2a\u4e8b\u4ef6\u4e0d\u8003\u8651\u5176\u4ed6\u4e8b\u4ef6\u65f6\u7684\u6982\u7387\u3002\\(P(\\text{\u7ea2\u8272}) = \\frac{26}{52} = 0.5\\) \u662f\u4e00\u4e2a\u8fb9\u9645\u6982\u7387\u3002\u5982\u679c\u4f60\u6709\u5173\u4e8e\u4e24\u4e2a\u53d8\u91cf\u7684\u8054\u5408\u5206\u5e03\uff0c\u901a\u8fc7\u5bf9\u53e6\u4e00\u4e2a\u53d8\u91cf\u6c42\u548c\uff08\u6216\u79ef\u5206\uff09\u5373\u53ef\u5f97\u5230\u8fb9\u9645\u6982\u7387\u3002</p> </li> <li> <p>\u6761\u4ef6\u6982\u7387\u56de\u7b54\u7684\u662f\uff1a\u5df2\u77e5 \\(B\\) \u5df2\u7ecf\u53d1\u751f\uff0c\\(A\\) \u7684\u6982\u7387\u662f\u591a\u5c11\uff1f\u6211\u4eec\u5c06\u6837\u672c\u7a7a\u95f4\u4ece \\(S\\) \u7f29\u5c0f\u5230 \\(B\\)\uff0c\u5e76\u95ee \\(B\\) \u4e2d\u540c\u65f6\u5c5e\u4e8e \\(A\\) \u7684\u6bd4\u4f8b\u662f\u591a\u5c11\uff1a</p> </li> </ul> \\[P(A | B) = \\frac{P(A \\cap B)}{P(B)}, \\quad P(B) &gt; 0\\] <p></p> <ul> <li> <p>\u793a\u4f8b\uff1a\u4f60\u62bd\u4e00\u5f20\u724c\uff0c\u6709\u4eba\u544a\u8bc9\u4f60\u5b83\u662f\u7ea2\u8272\u3002\u5b83\u662f\u56fd\u738b\u7684\u6982\u7387\u662f\u591a\u5c11\uff1f\u6709 26 \u5f20\u7ea2\u8272\u724c\uff0c\u5176\u4e2d 2 \u5f20\u662f\u56fd\u738b\uff0c\u6240\u4ee5 \\(P(\\text{\u56fd\u738b} | \\text{\u7ea2\u8272}) = \\frac{2}{26} = \\frac{1}{13}\\)\u3002\u4f7f\u7528\u516c\u5f0f\uff1a\\(P(\\text{\u56fd\u738b} \\cap \\text{\u7ea2\u8272}) / P(\\text{\u7ea2\u8272}) = \\frac{2/52}{26/52} = \\frac{1}{13}\\)\u3002</p> </li> <li> <p>\u5982\u679c\u77e5\u9053\u4e00\u4e2a\u4e8b\u4ef6\u53d1\u751f\u4e86\u4e0d\u4f1a\u544a\u8bc9\u4f60\u5173\u4e8e\u53e6\u4e00\u4e2a\u4e8b\u4ef6\u7684\u4efb\u4f55\u4fe1\u606f\uff0c\u5219\u8fd9\u4e24\u4e2a\u4e8b\u4ef6\u662f\u72ec\u7acb\u7684\u3002\u5f62\u5f0f\u5316\u5b9a\u4e49\uff1a</p> </li> </ul> \\[P(A \\cap B) = P(A) \\cdot P(B)\\] <ul> <li> <p>\u7b49\u4ef7\u5730\uff0c\\(P(A | B) = P(A)\\)\u3002\u5206\u522b\u629b\u4e24\u679a\u786c\u5e01\u662f\u72ec\u7acb\u4e8b\u4ef6\u3002\u65e0\u653e\u56de\u5730\u62bd\u4e24\u5f20\u724c\u4e0d\u662f\u72ec\u7acb\u7684\uff08\u7b2c\u4e00\u6b21\u62bd\u53d6\u4f1a\u6539\u53d8\u5269\u4f59\u724c\u7684\u6570\u91cf\uff09\u3002</p> </li> <li> <p>\u72ec\u7acb\u6027\u662f\u4e00\u4e2a\u5de8\u5927\u7684\u7b80\u5316\u5de5\u5177\u3002\u5bf9\u4e8e\u72ec\u7acb\u4e8b\u4ef6\uff0c\u8054\u5408\u6982\u7387\u5206\u89e3\u4e3a\u4e58\u79ef\u5f62\u5f0f\uff0c\u8fd9\u4f7f\u5f97\u8ba1\u7b97\u53ef\u5904\u7406\u3002\u8bb8\u591a\u673a\u5668\u5b66\u4e60\u6a21\u578b\u5047\u8bbe\u7279\u5f81\u4e4b\u95f4\u72ec\u7acb\uff08\u4f8b\u5982\u6734\u7d20\u8d1d\u53f6\u65af\uff09\uff0c\u6b63\u662f\u57fa\u4e8e\u8fd9\u79cd\u7b80\u5316\u3002</p> </li> <li> <p>\u4efb\u610f\u4e24\u4e2a\u4e8b\u4ef6\u7684\u4e58\u6cd5\u6cd5\u5219\u7531\u6761\u4ef6\u6982\u7387\u516c\u5f0f\u91cd\u65b0\u6392\u5217\u5f97\u5230\uff1a</p> </li> </ul> \\[P(A \\cap B) = P(A | B) \\cdot P(B) = P(B | A) \\cdot P(A)\\] <ul> <li> <p>\u5bf9\u4e8e\u72ec\u7acb\u4e8b\u4ef6\uff0c\u7531\u4e8e\u6761\u4ef6\u6982\u7387\u7b49\u4e8e\u8fb9\u9645\u6982\u7387\uff0c\u4e0a\u5f0f\u7b80\u5316\u4e3a \\(P(A \\cap B) = P(A) \\cdot P(B)\\)\u3002</p> </li> <li> <p>\u8d1d\u53f6\u65af\u5b9a\u7406\u662f\u6982\u7387\u8bba\u4e2d\u6700\u91cd\u8981\u7684\u7ed3\u8bba\u4e4b\u4e00\uff0c\u4e5f\u662f\u8d1d\u53f6\u65af\u673a\u5668\u5b66\u4e60\u7684\u57fa\u7840\u3002\u5b83\u8ba9\u6211\u4eec\u53ef\u4ee5\u53cd\u8f6c\u6761\u4ef6\u6982\u7387\u7684\u65b9\u5411\uff1a</p> </li> </ul> \\[P(A | B) = \\frac{P(B | A) \\cdot P(A)}{P(B)}\\] <ul> <li>\u8be5\u5b9a\u7406\u76f4\u63a5\u6e90\u4e8e\u5c06 \\(P(A \\cap B)\\) \u5199\u6210\u4e24\u79cd\u5f62\u5f0f\uff1a\\(P(B|A) \\cdot P(A) = P(A|B) \\cdot P(B)\\)\uff0c\u7136\u540e\u89e3\u51fa \\(P(A|B)\\)\u3002</li> </ul> <p></p> <ul> <li> <p>\u6bcf\u4e2a\u90e8\u5206\u90fd\u6709\u540d\u79f0\uff1a</p> <ul> <li>\u5148\u9a8c \\(P(A)\\)\uff1a\u770b\u5230\u8bc1\u636e\u4e4b\u524d\u7684\u521d\u59cb\u4fe1\u5ff5</li> <li>\u4f3c\u7136 \\(P(B|A)\\)\uff1a\u5047\u8bbe \\(A\\) \u4e3a\u771f\u7684\u524d\u63d0\u4e0b\uff0c\u8bc1\u636e\u51fa\u73b0\u7684\u6982\u7387</li> <li>\u8bc1\u636e \\(P(B)\\)\uff1a\u770b\u5230\u8bc1\u636e\u7684\u603b\u6982\u7387\uff0c\u8d77\u5f52\u4e00\u5316\u4f5c\u7528</li> <li>\u540e\u9a8c \\(P(A|B)\\)\uff1a\u770b\u5230\u8bc1\u636e\u4e4b\u540e\u66f4\u65b0\u540e\u7684\u4fe1\u5ff5</li> </ul> </li> <li> <p>\u8ba9\u6211\u4eec\u901a\u8fc7\u7ecf\u5178\u7684\u533b\u5b66\u8bca\u65ad\u4f8b\u5b50\u6765\u7406\u89e3\u3002\u5047\u8bbe\u67d0\u79cd\u75be\u75c5\u5f71\u54cd 1% \u7684\u4eba\u53e3\u3002\u9488\u5bf9\u8be5\u75be\u75c5\u7684\u68c0\u6d4b\u51c6\u786e\u7387\u4e3a 95%\uff1a\u5b83\u80fd\u6b63\u786e\u8bc6\u522b 95% \u7684\u60a3\u75c5\u8005\uff08\u7075\u654f\u5ea6\uff09\uff0c\u5e76\u80fd\u6b63\u786e\u8bc6\u522b 90% \u7684\u5065\u5eb7\u4eba\uff08\u7279\u5f02\u5ea6\uff09\u3002</p> </li> <li> <p>\u4f60\u7684\u68c0\u6d4b\u7ed3\u679c\u4e3a\u9633\u6027\u3002\u4f60\u5b9e\u9645\u60a3\u75c5\u7684\u6982\u7387\u662f\u591a\u5c11\uff1f</p> </li> <li> <p>\u8bbe \\(D\\) = \u60a3\u75c5\uff0c\\(+\\) = \u68c0\u6d4b\u9633\u6027\u3002</p> <ul> <li>\u5148\u9a8c\uff1a\\(P(D) = 0.01\\)</li> <li>\u4f3c\u7136\uff1a\\(P(+ | D) = 0.95\\)</li> <li>\u5047\u9633\u6027\u7387\uff1a\\(P(+ | D') = 0.10\\)</li> </ul> </li> <li> <p>\u6211\u4eec\u9700\u8981 \\(P(+)\\)\u3002\u6839\u636e\u5168\u6982\u7387\u516c\u5f0f\uff1a</p> </li> </ul> \\[P(+) = P(+ | D) \\cdot P(D) + P(+ | D') \\cdot P(D')$$ $$= 0.95 \\times 0.01 + 0.10 \\times 0.99 = 0.0095 + 0.099 = 0.1085\\] <ul> <li>\u73b0\u5728\u5e94\u7528\u8d1d\u53f6\u65af\u5b9a\u7406\uff1a</li> </ul> \\[P(D | +) = \\frac{P(+ | D) \\cdot P(D)}{P(+)} = \\frac{0.95 \\times 0.01}{0.1085} \\approx 0.088\\] <ul> <li> <p>\u5c3d\u7ba1\u68c0\u6d4b\"\u51c6\u786e\u7387\u9ad8\u8fbe 95%\"\uff0c\u4f46\u9633\u6027\u7ed3\u679c\u53ea\u80fd\u7ed9\u4f60\u7ea6 8.8% \u7684\u60a3\u75c5\u6982\u7387\u3002\u5148\u9a8c\u81f3\u5173\u91cd\u8981\u3002\u7531\u4e8e\u8be5\u75be\u75c5\u7f55\u89c1\uff0c\u5927\u591a\u6570\u9633\u6027\u7ed3\u679c\u90fd\u662f\u5047\u9633\u6027\u3002\u8fd9\u5bf9\u673a\u5668\u5b66\u4e60\u4e2d\u7684\u4efb\u4f55\u5206\u7c7b\u95ee\u9898\u90fd\u662f\u4e00\u4e2a\u5173\u952e\u89c1\u89e3\uff1a\u5f53\u7c7b\u522b\u4e0d\u5e73\u8861\u65f6\uff0c\u4ec5\u9760\u51c6\u786e\u7387\u662f\u5177\u6709\u8bef\u5bfc\u6027\u7684\u3002</p> </li> <li> <p>\u5168\u6982\u7387\u516c\u5f0f\u5c06\u6837\u672c\u7a7a\u95f4\u5212\u5206\u4e3a\u4e92\u65a5\u4e14\u5b8c\u5907\u7684\u4e8b\u4ef6 \\(B_1, B_2, \\ldots, B_n\\)\uff0c\u5e76\u5c06\u4efb\u610f\u4e8b\u4ef6 \\(A\\) \u8868\u793a\u4e3a\uff1a</p> </li> </ul> \\[P(A) = \\sum_{i=1}^{n} P(A | B_i) \\cdot P(B_i)\\] <ul> <li> <p>\u8fd9\u6b63\u662f\u6211\u4eec\u5728\u533b\u5b66\u4f8b\u5b50\u4e2d\u8ba1\u7b97 \\(P(+)\\) \u6240\u7528\u7684\u65b9\u6cd5\uff1a\u6211\u4eec\u5c06\u4eba\u7fa4\u5206\u4e3a\"\u60a3\u75c5\"\u548c\"\u672a\u60a3\u75c5\"\u4e24\u7c7b\u3002</p> </li> <li> <p>\u6982\u7387\u7684\u94fe\u5f0f\u6cd5\u5219\u5c06\u4e58\u6cd5\u6cd5\u5219\u63a8\u5e7f\u5230\u4efb\u610f\u6570\u91cf\u7684\u4e8b\u4ef6\uff1a</p> </li> </ul> \\[P(A_1 \\cap A_2 \\cap \\cdots \\cap A_n) = P(A_1) \\cdot P(A_2 | A_1) \\cdot P(A_3 | A_1 \\cap A_2) \\cdots P(A_n | A_1 \\cap \\cdots \\cap A_{n-1})\\] <ul> <li> <p>\u6bcf\u4e2a\u56e0\u5b50\u90fd\u4ee5\u524d\u9762\u6240\u6709\u4e8b\u4ef6\u4e3a\u6761\u4ef6\u3002\u8fd9\u662f\u81ea\u56de\u5f52\u8bed\u8a00\u6a21\u578b\u7684\u57fa\u77f3\uff1a\u4e00\u4e2a\u53e5\u5b50\u7684\u6982\u7387\u7b49\u4e8e\u6bcf\u4e2a\u5355\u8bcd\u5728\u7ed9\u5b9a\u524d\u9762\u6240\u6709\u5355\u8bcd\u6761\u4ef6\u4e0b\u7684\u6982\u7387\u7684\u4e58\u79ef\u3002</p> </li> <li> <p>\u6761\u4ef6\u72ec\u7acb\u610f\u5473\u7740\u4e24\u4e2a\u4e8b\u4ef6\u5728\u7ed9\u5b9a\u7b2c\u4e09\u4e2a\u4e8b\u4ef6\u7684\u6761\u4ef6\u4e0b\u662f\u72ec\u7acb\u7684\u3002\u5982\u679c\u6ee1\u8db3\u4e0b\u5f0f\uff0c\u5219 \\(A\\) \u548c \\(B\\) \u5728\u7ed9\u5b9a \\(C\\) \u7684\u6761\u4ef6\u4e0b\u6761\u4ef6\u72ec\u7acb\uff1a</p> </li> </ul> \\[P(A \\cap B | C) = P(A | C) \\cdot P(B | C)\\] <ul> <li> <p>\u4e8b\u4ef6\u53ef\u4ee5\u8fb9\u9645\u4e0a\u76f8\u5173\u4f46\u6761\u4ef6\u72ec\u7acb\uff0c\u53cd\u4e4b\u4ea6\u7136\u3002\u4f8b\u5982\uff0c\u4e24\u540d\u5b66\u751f\u7684\u8003\u8bd5\u6210\u7ee9\u53ef\u80fd\u76f8\u5173\uff08\u90fd\u4f9d\u8d56\u4e8e\u8003\u8bd5\u7684\u96be\u5ea6\uff09\uff0c\u4f46\u7ed9\u5b9a\u8003\u8bd5\u96be\u5ea6\u540e\uff0c\u4ed6\u4eec\u7684\u6210\u7ee9\u662f\u72ec\u7acb\u7684\u3002</p> </li> <li> <p>\u6761\u4ef6\u72ec\u7acb\u662f\u8d1d\u53f6\u65af\u7f51\u7edc\u7b49\u56fe\u6a21\u578b\u80cc\u540e\u7684\u5173\u952e\u5047\u8bbe\u3002\u5b83\u5141\u8bb8\u5c06\u590d\u6742\u7684\u8054\u5408\u5206\u5e03\u5206\u89e3\u4e3a\u53ef\u7ba1\u7406\u7684\u90e8\u5206\uff0c\u4f7f\u63a8\u65ad\u5728\u8ba1\u7b97\u4e0a\u53ef\u884c\u3002</p> </li> </ul>"},{"location":"chapter%2005%3A%20probability/02.%20probability%20concepts/#colab-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ol> <li> <p>\u6a21\u62df\u533b\u5b66\u8bca\u65ad\u95ee\u9898\u3002\u751f\u6210 100,000 \u4eba\u7684\u603b\u4f53\uff0c\u5e94\u7528\u75be\u75c5\u60a3\u75c5\u7387\u548c\u68c0\u6d4b\u51c6\u786e\u7387\uff0c\u9a8c\u8bc1\u8d1d\u53f6\u65af\u5b9a\u7406\u7ed9\u51fa\u6b63\u786e\u7684\u540e\u9a8c\u6982\u7387\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\nkey = jax.random.PRNGKey(42)\nn = 100_000\n\n# \u751f\u6210\u603b\u4f53\nk1, k2 = jax.random.split(key)\nhas_disease = jax.random.bernoulli(k1, p=0.01, shape=(n,))\n\n# \u751f\u6210\u68c0\u6d4b\u7ed3\u679c\nk3, k4 = jax.random.split(k2)\n# \u7075\u654f\u5ea6\uff1aP(+|D) = 0.95\uff0c\u7279\u5f02\u5ea6\uff1aP(-|D') = 0.90\ntest_positive = jnp.where(\n    has_disease,\n    jax.random.bernoulli(k3, p=0.95, shape=(n,)),\n    jax.random.bernoulli(k4, p=0.10, shape=(n,))\n)\n\n# \u5728\u68c0\u6d4b\u9633\u6027\u7684\u4eba\u7fa4\u4e2d\uff0c\u5b9e\u9645\u60a3\u75c5\u7684\u6bd4\u4f8b\u662f\u591a\u5c11\uff1f\npositives = test_positive.astype(bool)\ntrue_positives = (has_disease &amp; positives).sum()\ntotal_positives = positives.sum()\n\nprint(f\"\u68c0\u6d4b\u9633\u6027\u603b\u4eba\u6570: {total_positives}\")\nprint(f\"\u771f\u9633\u6027\u4eba\u6570: {true_positives}\")\nprint(f\"P(\u60a3\u75c5 | \u9633\u6027) = {true_positives / total_positives:.4f}\")\nprint(f\"\u8d1d\u53f6\u65af\u516c\u5f0f:         {0.95 * 0.01 / 0.1085:.4f}\")\n</code></pre></p> </li> <li> <p>\u901a\u8fc7\u6a21\u62df\u9a8c\u8bc1\u52a0\u6cd5\u6cd5\u5219\u3002\u751f\u6210\u5177\u6709\u5df2\u77e5\u6982\u7387\u548c\u91cd\u53e0\u7a0b\u5ea6\u7684\u968f\u673a\u4e8b\u4ef6 A \u548c B\uff0c\u7136\u540e\u9a8c\u8bc1 \\(P(A \\cup B) = P(A) + P(B) - P(A \\cap B)\\)\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\nkey = jax.random.PRNGKey(0)\nn = 200_000\nk1, k2 = jax.random.split(key)\n\n# \u4e8b\u4ef6\uff1aA = \u503c &lt; 0.4\uff0cB = \u503c &lt; 0.6\uff08\u5728 &lt; 0.4 \u5904\u91cd\u53e0\uff09\nvals_a = jax.random.uniform(k1, shape=(n,))\nvals_b = jax.random.uniform(k2, shape=(n,))\n\nA = vals_a &lt; 0.4\nB = vals_b &lt; 0.6\n\np_a = A.mean()\np_b = B.mean()\np_a_and_b = (A &amp; B).mean()\np_a_or_b = (A | B).mean()\n\nprint(f\"P(A) = {p_a:.4f}\")\nprint(f\"P(B) = {p_b:.4f}\")\nprint(f\"P(A \u2229 B) = {p_a_and_b:.4f}\")\nprint(f\"P(A \u222a B) \u6a21\u62df\u503c = {p_a_or_b:.4f}\")\nprint(f\"P(A) + P(B) - P(A\u2229B) = {p_a + p_b - p_a_and_b:.4f}\")\n</code></pre></p> </li> <li> <p>\u6f14\u793a\u6761\u4ef6\u6982\u7387\u968f\u8bc1\u636e\u53d8\u5316\u3002\u6a21\u62df\u63b7\u4e24\u4e2a\u9ab0\u5b50\uff0c\u8ba1\u7b97 \\(P(\\text{\u548c} = 7)\\)\uff0c\u7136\u540e\u8ba1\u7b97 \\(P(\\text{\u548c} = 7 | \\text{\u7b2c\u4e00\u4e2a\u9ab0\u5b50} = 3)\\)\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\nkey = jax.random.PRNGKey(1)\nn = 500_000\nk1, k2 = jax.random.split(key)\n\nd1 = jax.random.randint(k1, shape=(n,), minval=1, maxval=7)\nd2 = jax.random.randint(k2, shape=(n,), minval=1, maxval=7)\ntotal = d1 + d2\n\n# \u65e0\u6761\u4ef6\u6982\u7387\np_sum7 = (total == 7).mean()\nprint(f\"P(\u548c=7) = {p_sum7:.4f} (\u7cbe\u786e\u503c: {6/36:.4f})\")\n\n# \u6761\u4ef6\u4e8e\u7b2c\u4e00\u4e2a\u9ab0\u5b50 = 3\nmask = d1 == 3\np_sum7_given_d1_3 = (total[mask] == 7).mean()\nprint(f\"P(\u548c=7 | d1=3) = {p_sum7_given_d1_3:.4f} (\u7cbe\u786e\u503c: {1/6:.4f})\")\n</code></pre></p> </li> <li> <p>\u5c06\u8d1d\u53f6\u65af\u5b9a\u7406\u5b9e\u73b0\u4e3a\u4e00\u4e2a\u51fd\u6570\uff0c\u5e76\u7528\u5b83\u8fed\u4ee3\u66f4\u65b0\u4fe1\u5ff5\u3002\u4ece\u786c\u5e01\u504f\u5411\u7684\u5747\u5300\u5148\u9a8c\u5f00\u59cb\uff0c\u5728\u89c2\u5bdf\u5230\u6bcf\u6b21\u629b\u63b7\u540e\u66f4\u65b0\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef bayes_update(prior, likelihood):\n    \"\"\"\u5c06\u5148\u9a8c\u4e58\u4ee5\u4f3c\u7136\u5e76\u5f52\u4e00\u5316\u3002\"\"\"\n    posterior = prior * likelihood\n    return posterior / posterior.sum()\n\n# \u79bb\u6563\u5316\u53ef\u80fd\u7684\u504f\u5411\u503c\ntheta = jnp.linspace(0, 1, 200)\nprior = jnp.ones_like(theta)  # \u5747\u5300\u5148\u9a8c\nprior = prior / prior.sum()\n\n# \u89c2\u6d4b\u5230\u7684\u629b\u63b7\u7ed3\u679c\uff1a1=\u6b63\u9762\uff0c0=\u53cd\u9762\nflips = [1, 1, 0, 1, 1, 1, 0, 1, 0, 1]\n\nplt.figure(figsize=(10, 5))\nplt.plot(theta, prior, \"--\", color=\"#999\", label=\"\u5148\u9a8c\")\n\nfor i, flip in enumerate(flips):\n    likelihood = theta if flip == 1 else (1 - theta)\n    prior = bayes_update(prior, likelihood)\n    if i in [0, 2, 4, 9]:\n        plt.plot(theta, prior, label=f\"\u7ecf\u8fc7 {i+1} \u6b21\u629b\u63b7\u540e\", linewidth=2)\n\nplt.xlabel(\"\u786c\u5e01\u504f\u5411 \u03b8\")\nplt.ylabel(\"\u4fe1\u5ff5\uff08\u5f52\u4e00\u5316\uff09\")\nplt.title(\"\u8d1d\u53f6\u65af\u66f4\u65b0\uff1a\u5173\u4e8e\u786c\u5e01\u504f\u5411\u7684\u4fe1\u5ff5\")\nplt.legend()\nplt.grid(alpha=0.3)\nplt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2005%3A%20probability/03.%20distributions/","title":"\u6982\u7387\u5206\u5e03","text":"<p>\u6982\u7387\u5206\u5e03\u63cf\u8ff0\u4e86\u968f\u673a\u7ed3\u679c\u5982\u4f55\u5728\u53ef\u80fd\u53d6\u503c\u4e0a\u5206\u5e03\u3002\u672c\u6587\u6863\u6574\u7406\u4e86\u5173\u952e\u7684\u79bb\u6563\u548c\u8fde\u7eed\u5206\u5e03\uff1a\u4f2f\u52aa\u5229\u5206\u5e03\u3001\u4e8c\u9879\u5206\u5e03\u3001\u6cca\u677e\u5206\u5e03\u3001\u9ad8\u65af\u5206\u5e03\u3001\u6307\u6570\u5206\u5e03\u3001\u8d1d\u5854\u5206\u5e03\u7b49\uff0c\u7ed9\u51fa\u4e86\u5404\u81ea\u7684\u516c\u5f0f\u3001\u76f4\u89c2\u7406\u89e3\u53ca\u5176\u5728\u673a\u5668\u5b66\u4e60\u4e2d\u7684\u5e94\u7528\uff08\u635f\u5931\u51fd\u6570\u3001\u5148\u9a8c\u3001\u566a\u58f0\u6a21\u578b\uff09\u3002</p> <ul> <li> <p>\u5728\u7b2c4\u7ae0\u4e2d\uff0c\u6211\u4eec\u4ecb\u7ecd\u4e86\u968f\u673a\u53d8\u91cf\u3001PMF\u3001PDF\u548cCDF\u3002\u672c\u7ae0\u5217\u51fa\u4f60\u5728\u673a\u5668\u5b66\u4e60\u548c\u7edf\u8ba1\u5b66\u4e2d\u6700\u5e38\u9047\u5230\u7684\u91cd\u8981\u6982\u7387\u5206\u5e03\uff0c\u7ed9\u51fa\u6bcf\u4e2a\u5206\u5e03\u7684\u76f4\u89c2\u7406\u89e3\u3001\u516c\u5f0f\u3001\u5747\u503c\u548c\u65b9\u5dee\u3002</p> </li> <li> <p>\u4e09\u79cd\u6838\u5fc3\u51fd\u6570\u7684\u5feb\u901f\u56de\u987e\uff08\u5b8c\u6574\u5b9a\u4e49\u89c1\u7b2c4\u7ae0\uff09\uff1a</p> <ul> <li>PMF \\(P(X = x)\\)\uff1a\u7ed9\u51fa\u6bcf\u4e2a\u79bb\u6563\u7ed3\u679c\u7684\u6982\u7387\u3002\u5373\u6761\u5f62\u56fe\u4e2d\u6bcf\u4e2a\u6761\u5f62\u7684\u9ad8\u5ea6\u3002</li> <li>PDF \\(f(x)\\)\uff1a\u7ed9\u51fa\u8fde\u7eed\u53d8\u91cf\u5728\u6bcf\u4e2a\u70b9\u4e0a\u7684\u5bc6\u5ea6\u3002\u4e24\u70b9\u4e4b\u95f4\u66f2\u7ebf\u4e0b\u7684\u9762\u79ef\u5373\u4e3a\u6982\u7387\u3002</li> <li>CDF \\(F(x) = P(X \\le x)\\)\uff1a\u7d2f\u79ef\u5230 \\(x\\) \u4e3a\u6b62\u7684\u6982\u7387\u3002\u53d6\u503c\u8303\u56f4\u59cb\u7ec8\u4ece0\u52301\u4e14\u5355\u8c03\u4e0d\u51cf\u3002</li> </ul> </li> <li> <p>\u5206\u5e03\u7684\u652f\u6491\u96c6\u662f\u6307PMF\u6216PDF\u53d6\u6b63\u503c\u7684\u96c6\u5408\u3002\u5bf9\u63b7\u9ab0\u5b50\u800c\u8a00\uff0c\u652f\u6491\u96c6\u4e3a \\(\\{1,2,3,4,5,6\\}\\)\u3002\u5bf9\u6b63\u6001\u5206\u5e03\u800c\u8a00\uff0c\u652f\u6491\u96c6\u4e3a\u5168\u4f53\u5b9e\u6570 \\((-\\infty, \\infty)\\)\u3002</p> </li> <li> <p>\u5206\u5e03\u6e05\u6670\u5730\u5206\u4e3a\u4e24\u4e2a\u5bb6\u65cf\uff1a\u79bb\u6563\u5206\u5e03\uff08\u7ed3\u679c\u53ef\u6570\uff0c\u4f7f\u7528PMF\uff09\u548c\u8fde\u7eed\u5206\u5e03\uff08\u7ed3\u679c\u4e0d\u53ef\u6570\uff0c\u4f7f\u7528PDF\uff09\u3002</p> </li> <li> <p>\u4f2f\u52aa\u5229\u5206\u5e03\uff1a\u6700\u7b80\u5355\u7684\u5206\u5e03\u3002\u5355\u6b21\u8bd5\u9a8c\u6709\u4e24\u79cd\u7ed3\u679c\uff1a\u6210\u529f\uff081\uff09\u7684\u6982\u7387\u4e3a \\(p\\)\uff0c\u5931\u8d25\uff080\uff09\u7684\u6982\u7387\u4e3a \\(1-p\\)\u3002</p> </li> </ul> \\[P(X = x) = p^x (1 - p)^{1-x}, \\quad x \\in \\{0, 1\\}\\] <ul> <li> <p>\u5747\u503c\uff1a\\(E[X] = p\\)\u3002\u65b9\u5dee\uff1a\\(\\text{Var}(X) = p(1-p)\\)\u3002</p> </li> <li> <p>\u6bcf\u4e00\u6b21\u629b\u786c\u5e01\u3001\u6bcf\u4e00\u4e2a\u662f/\u5426\u5206\u7c7b\u3001\u6bcf\u4e00\u4e2a\u4e8c\u5143\u7ed3\u679c\u90fd\u662f\u4f2f\u52aa\u5229\u8bd5\u9a8c\u3002\u5728\u673a\u5668\u5b66\u4e60\u4e2d\uff0csigmoid\u51fd\u6570\u7684\u8f93\u51fa\u6b63\u662f\u4f2f\u52aa\u5229\u5206\u5e03\u7684\u53c2\u6570 \\(p\\)\u3002</p> </li> <li> <p>\u4e8c\u9879\u5206\u5e03\uff1a\u8ba1\u7b97 \\(n\\) \u6b21\u72ec\u7acb\u4f2f\u52aa\u5229\u8bd5\u9a8c\u4e2d\u6210\u529f\u7684\u6b21\u6570\uff0c\u6bcf\u6b21\u8bd5\u9a8c\u7684\u6210\u529f\u6982\u7387 \\(p\\) \u76f8\u540c\u3002</p> </li> </ul> \\[P(X = k) = \\binom{n}{k} p^k (1-p)^{n-k}, \\quad k = 0, 1, \\ldots, n\\] <ul> <li> <p>\u4e8c\u9879\u5f0f\u7cfb\u6570 \\(\\binom{n}{k}\\)\uff08\u89c1\u6587\u4ef601\uff09\u8ba1\u7b97\u4e86 \\(k\\) \u6b21\u6210\u529f\u5728 \\(n\\) \u6b21\u8bd5\u9a8c\u4e2d\u7684\u6392\u5217\u65b9\u5f0f\u6570\u91cf\u3002</p> </li> <li> <p>\u5747\u503c\uff1a\\(E[X] = np\\)\u3002\u65b9\u5dee\uff1a\\(\\text{Var}(X) = np(1-p)\\)\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u793a\u4f8b\uff1a\u629b\u4e00\u679a\u6709\u504f\u786c\u5e01\uff08\\(p = 0.7\\)\uff09\u516b\u6b21\u3002\u6070\u597d\u5f97\u52306\u6b21\u6b63\u9762\u7684\u6982\u7387\u4e3a \\(\\binom{8}{6}(0.7)^6(0.3)^2 = 28 \\times 0.1176 \\times 0.09 \\approx 0.296\\)\u3002</p> </li> <li> <p>\u6cca\u677e\u5206\u5e03\uff1a\u5728\u56fa\u5b9a\u7684\u65f6\u95f4\u6216\u7a7a\u95f4\u533a\u95f4\u5185\uff0c\u4ee5\u5df2\u77e5\u7684\u5e73\u5747\u901f\u7387 \\(\\lambda\\) \u8ba1\u7b97\u4e8b\u4ef6\u53d1\u751f\u7684\u6b21\u6570\u3002\u9002\u7528\u4e8e\u4e8b\u4ef6\u7a00\u5c11\u4e14\u76f8\u4e92\u72ec\u7acb\u7684\u60c5\u5f62\u3002</p> </li> </ul> \\[P(X = k) = \\frac{\\lambda^k e^{-\\lambda}}{k!}, \\quad k = 0, 1, 2, \\ldots\\] <ul> <li> <p>\u5747\u503c\uff1a\\(E[X] = \\lambda\\)\u3002\u65b9\u5dee\uff1a\\(\\text{Var}(X) = \\lambda\\)\u3002\u5747\u503c\u7b49\u4e8e\u65b9\u5dee\u662f\u5176\u6807\u5fd7\u6027\u7279\u5f81\u3002</p> </li> <li> <p>\u793a\u4f8b\uff1a\u6bcf\u5c0f\u65f6\u6536\u5230\u7684\u90ae\u4ef6\u6570\uff08\\(\\lambda = 5\\)\uff09\u3001\u6bcf\u9875\u7684\u9519\u522b\u5b57\u6570\u3001\u6bcf\u79d2\u7684\u670d\u52a1\u5668\u8bf7\u6c42\u6570\u3002\u5728\u673a\u5668\u5b66\u4e60\u4e2d\uff0c\u6cca\u677e\u56de\u5f52\u7528\u4e8e\u5efa\u6a21\u8ba1\u6570\u6570\u636e\uff0c\u800c\u7ebf\u6027\u6a21\u578b\u53ef\u80fd\u4f1a\u9884\u6d4b\u51fa\u8d1f\u7684\u8ba1\u6570\u503c\u3002</p> </li> <li> <p>\u5f53 \\(n \\to \\infty\\) \u4e14 \\(p \\to 0\\)\uff0c\u4e14 \\(np = \\lambda\\) \u4fdd\u6301\u4e0d\u53d8\u65f6\uff0c\u4e8c\u9879\u5206\u5e03 Binomial\\((n,p)\\) \u6536\u655b\u4e8e\u6cca\u677e\u5206\u5e03 Poisson\\((\\lambda)\\)\u3002\u8fd9\u5c31\u662f\u6cca\u677e\u5206\u5e03\u9002\u7528\u4e8e\u5927\u603b\u4f53\u4e2d\u7a00\u6709\u4e8b\u4ef6\u7684\u539f\u56e0\u3002</p> </li> <li> <p>\u51e0\u4f55\u5206\u5e03\uff1a\u8ba1\u7b97\u76f4\u5230\u9996\u6b21\u6210\u529f\u6240\u9700\u7684\u8bd5\u9a8c\u6b21\u6570\u3002\"\u6211\u8981\u629b\u591a\u5c11\u6b21\u786c\u5e01\u624d\u80fd\u7b2c\u4e00\u6b21\u5f97\u5230\u6b63\u9762\uff1f\"</p> </li> </ul> \\[P(X = k) = (1-p)^{k-1} p, \\quad k = 1, 2, 3, \\ldots\\] <ul> <li> <p>\u5747\u503c\uff1a\\(E[X] = 1/p\\)\u3002\u65b9\u5dee\uff1a\\(\\text{Var}(X) = (1-p)/p^2\\)\u3002</p> </li> <li> <p>\u51e0\u4f55\u5206\u5e03\u5177\u6709\u65e0\u8bb0\u5fc6\u6027\uff1a\u518d\u7b49\u5f85 \\(k\\) \u6b21\u8bd5\u9a8c\u624d\u6210\u529f\u7684\u6982\u7387\u4e0e\u4f60\u5df2\u7ecf\u7b49\u5f85\u4e86\u591a\u5c11\u6b21\u8bd5\u9a8c\u65e0\u5173\u3002\u8fd9\u4f7f\u5f97\u5b83\u5728\u79bb\u6563\u5206\u5e03\u4e2d\u975e\u5e38\u7279\u6b8a\u3002</p> </li> <li> <p>\u8d1f\u4e8c\u9879\u5206\u5e03\uff1a\u63a8\u5e7f\u4e86\u51e0\u4f55\u5206\u5e03\uff0c\u8ba1\u7b97\u76f4\u5230\u7b2c \\(r\\) \u6b21\u6210\u529f\u6240\u9700\u7684\u8bd5\u9a8c\u6b21\u6570\uff08\u51e0\u4f55\u5206\u5e03\u662f \\(r=1\\) \u7684\u7279\u6b8a\u60c5\u5f62\uff09\u3002</p> </li> </ul> \\[P(X = k) = \\binom{k-1}{r-1} p^r (1-p)^{k-r}, \\quad k = r, r+1, r+2, \\ldots\\] <ul> <li> <p>\u5747\u503c\uff1a\\(E[X] = r/p\\)\u3002\u65b9\u5dee\uff1a\\(\\text{Var}(X) = r(1-p)/p^2\\)\u3002</p> </li> <li> <p>\u8d1f\u4e8c\u9879\u5206\u5e03\u5728\u5b9e\u8df5\u4e2d\u4e5f\u7528\u4e8e\u5efa\u6a21\u8fc7\u5ea6\u79bb\u6563\u7684\u8ba1\u6570\u6570\u636e\uff08\u65b9\u5dee\u8d85\u8fc7\u5747\u503c\u7684\u60c5\u5f62\uff09\uff0c\u8fd9\u662f\u6cca\u677e\u5206\u5e03\u65e0\u6cd5\u5904\u7406\u7684\u3002</p> </li> <li> <p>\u63a5\u4e0b\u6765\u6211\u4eec\u8fdb\u5165\u8fde\u7eed\u5206\u5e03\u3002</p> </li> <li> <p>\u5747\u5300\u5206\u5e03\uff1a\u533a\u95f4 \\([a, b]\\) \u5185\u7684\u6240\u6709\u503c\u7b49\u53ef\u80fd\u3002\u5176PDF\u662f\u4e00\u4e2a\u5e73\u5766\u7684\u77e9\u5f62\u3002</p> </li> </ul> \\[f(x) = \\frac{1}{b - a}, \\quad a \\le x \\le b\\] <ul> <li> <p>\u5747\u503c\uff1a\\(E[X] = \\frac{a+b}{2}\\)\u3002\u65b9\u5dee\uff1a\\(\\text{Var}(X) = \\frac{(b-a)^2}{12}\\)\u3002</p> </li> <li> <p>\u968f\u673a\u6570\u751f\u6210\u5668\u4ee5\u751f\u6210\u5747\u5300\u5206\u5e03 Uniform(0,1) \u6837\u672c\u4e3a\u8d77\u70b9\u3002\u5176\u4ed6\u5206\u5e03\u901a\u8fc7\u5bf9\u8fd9\u4e9b\u5747\u5300\u6837\u672c\u8fdb\u884c\u53d8\u6362\u5f97\u5230\u3002</p> </li> <li> <p>\u6b63\u6001\uff08\u9ad8\u65af\uff09\u5206\u5e03\uff1a\u7edf\u8ba1\u5b66\u4e2d\u6700\u91cd\u8981\u7684\u5206\u5e03\u3002\u5b83\u7531\u4e2d\u5fc3\u6781\u9650\u5b9a\u7406\uff08\u89c1\u7b2c4\u7ae0\uff09\u81ea\u7136\u5bfc\u51fa\uff1a\u5927\u91cf\u72ec\u7acb\u968f\u673a\u53d8\u91cf\u7684\u5e73\u5747\u503c\u8d8b\u4e8e\u6b63\u6001\u5206\u5e03\uff0c\u65e0\u8bba\u539f\u59cb\u5206\u5e03\u662f\u4ec0\u4e48\u3002</p> </li> </ul> \\[f(x) = \\frac{1}{\\sigma\\sqrt{2\\pi}} \\exp\\!\\left(-\\frac{(x - \\mu)^2}{2\\sigma^2}\\right)\\] <ul> <li> <p>\u5747\u503c\uff1a\\(E[X] = \\mu\\)\u3002\u65b9\u5dee\uff1a\\(\\text{Var}(X) = \\sigma^2\\)\u3002</p> </li> <li> <p>\u6807\u51c6\u6b63\u6001\u5206\u5e03\u7684 \\(\\mu = 0\\) \u4e14 \\(\\sigma = 1\\)\u3002\u4efb\u610f\u6b63\u6001\u53d8\u91cf \\(X\\) \u53ef\u901a\u8fc7 \\(Z = (X - \\mu)/\\sigma\\) \u6807\u51c6\u5316\u4e3a\u6807\u51c6\u6b63\u6001\u53d8\u91cf \\(Z\\)\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u7ecf\u9a8c\u6cd5\u5219\uff0868-95-99.7\u6cd5\u5219\uff09\u6307\u51fa\uff1a</p> <ul> <li>\u7ea668%\u7684\u6570\u636e\u843d\u5728\u5747\u503c \\(\\pm 1\\sigma\\) \u8303\u56f4\u5185</li> <li>\u7ea695%\u7684\u6570\u636e\u843d\u5728 \\(\\pm 2\\sigma\\) \u8303\u56f4\u5185</li> <li>\u7ea699.7%\u7684\u6570\u636e\u843d\u5728 \\(\\pm 3\\sigma\\) \u8303\u56f4\u5185</li> </ul> </li> <li> <p>\u5728\u673a\u5668\u5b66\u4e60\u4e2d\uff0c\u6b63\u6001\u5206\u5e03\u65e0\u5904\u4e0d\u5728\uff1a\u6743\u91cd\u521d\u59cb\u5316\u3001\u6570\u636e\u589e\u5f3a\u4e2d\u7684\u566a\u58f0\u3001MSE\u635f\u5931\u80cc\u540e\u7684\u5047\u8bbe\uff08\u5176\u9690\u542b\u5047\u8bbe\u9ad8\u65af\u8bef\u5dee\uff09\u3001\u4ee5\u53ca\u53d8\u5206\u81ea\u7f16\u7801\u5668\u4e2d\u7684\u91cd\u53c2\u6570\u5316\u6280\u5de7\u3002</p> </li> <li> <p>\u6307\u6570\u5206\u5e03\uff1a\u6a21\u62df\u6cca\u677e\u8fc7\u7a0b\u4e2d\u4e8b\u4ef6\u4e4b\u95f4\u7684\u65f6\u95f4\u95f4\u9694\u3002\u5982\u679c\u4e8b\u4ef6\u4ee5\u901f\u7387 \\(\\lambda\\) \u5230\u8fbe\uff0c\u5219\u5b83\u4eec\u4e4b\u95f4\u7684\u7b49\u5f85\u65f6\u95f4\u670d\u4ece\u6307\u6570\u5206\u5e03 Exponential\\((\\lambda)\\)\u3002</p> </li> </ul> \\[f(x) = \\lambda e^{-\\lambda x}, \\quad x \\ge 0\\] <ul> <li> <p>\u5747\u503c\uff1a\\(E[X] = 1/\\lambda\\)\u3002\u65b9\u5dee\uff1a\\(\\text{Var}(X) = 1/\\lambda^2\\)\u3002</p> </li> <li> <p>\u4e0e\u79bb\u6563\u53d8\u91cf\u4e2d\u7684\u51e0\u4f55\u5206\u5e03\u7c7b\u4f3c\uff0c\u6307\u6570\u5206\u5e03\u4e5f\u5177\u6709\u65e0\u8bb0\u5fc6\u6027\uff1a\\(P(X &gt; s + t | X &gt; s) = P(X &gt; t)\\)\u3002\u518d\u7b49\u5f85 \\(t\\) \u4e2a\u65f6\u95f4\u5355\u4f4d\u7684\u6982\u7387\u4e0e\u4f60\u5df2\u7ecf\u7b49\u5f85\u4e86\u591a\u957f\u65f6\u95f4\u65e0\u5173\u3002</p> </li> <li> <p>\u4f3d\u9a6c\u5206\u5e03\uff1a\u63a8\u5e7f\u4e86\u6307\u6570\u5206\u5e03\u3002\u5b83\u6a21\u62df\u6cca\u677e\u8fc7\u7a0b\u4e2d\u7b2c \\(\\alpha\\) \u4e2a\u4e8b\u4ef6\u53d1\u751f\u7684\u65f6\u95f4\uff08\u6307\u6570\u5206\u5e03\u662f \\(\\alpha = 1\\) \u7684\u7279\u6b8a\u60c5\u5f62\uff09\u3002</p> </li> </ul> \\[f(x) = \\frac{\\beta^\\alpha}{\\Gamma(\\alpha)} x^{\\alpha - 1} e^{-\\beta x}, \\quad x &gt; 0\\] <ul> <li> <p>\u8fd9\u91cc \\(\\alpha\\)\uff08\u5f62\u72b6\u53c2\u6570\uff09\u63a7\u5236\u5f62\u72b6\uff0c\\(\\beta\\)\uff08\u901f\u7387\u53c2\u6570\uff09\u63a7\u5236\u5c3a\u5ea6\u3002\\(\\Gamma(\\alpha)\\) \u662f\u4f3d\u9a6c\u51fd\u6570\uff0c\u5b83\u5c06\u9636\u4e58\u63a8\u5e7f\u5230\u5b9e\u6570\uff1a\u5bf9\u6b63\u6574\u6570 \\(n\\) \u6709 \\(\\Gamma(n) = (n-1)!\\)\u3002</p> </li> <li> <p>\u5747\u503c\uff1a\\(E[X] = \\alpha/\\beta\\)\u3002\u65b9\u5dee\uff1a\\(\\text{Var}(X) = \\alpha/\\beta^2\\)\u3002</p> </li> <li> <p>\u8d1d\u5854\u5206\u5e03\uff1a\u5b9a\u4e49\u5728\u533a\u95f4 \\([0, 1]\\) \u4e0a\uff0c\u975e\u5e38\u9002\u5408\u5bf9\u6982\u7387\u3001\u6bd4\u4f8b\u548c\u6bd4\u7387\u8fdb\u884c\u5efa\u6a21\u3002</p> </li> </ul> \\[f(x) = \\frac{x^{\\alpha - 1}(1 - x)^{\\beta - 1}}{B(\\alpha, \\beta)}, \\quad 0 \\le x \\le 1\\] <ul> <li> <p>\u5206\u6bcd \\(B(\\alpha, \\beta) = \\frac{\\Gamma(\\alpha)\\Gamma(\\beta)}{\\Gamma(\\alpha + \\beta)}\\) \u662f\u8d1d\u5854\u51fd\u6570\uff0c\u8d77\u5230\u5f52\u4e00\u5316\u5e38\u6570\u7684\u4f5c\u7528\u3002</p> </li> <li> <p>\u5747\u503c\uff1a\\(E[X] = \\frac{\\alpha}{\\alpha + \\beta}\\)\u3002\u65b9\u5dee\uff1a\\(\\text{Var}(X) = \\frac{\\alpha\\beta}{(\\alpha+\\beta)^2(\\alpha+\\beta+1)}\\)\u3002</p> </li> <li> <p>\u8d1d\u5854\u5206\u5e03\u662f\u4f2f\u52aa\u5229\u548c\u4e8c\u9879\u4f3c\u7136\u51fd\u6570\u7684\u5171\u8f6d\u5148\u9a8c\u3002\u8fd9\u610f\u5473\u7740\u5982\u679c\u5148\u9a8c\u662f\u8d1d\u5854\u5206\u5e03\u4e14\u6570\u636e\u670d\u4ece\u4f2f\u52aa\u5229\u5206\u5e03\uff0c\u5219\u540e\u9a8c\u4e5f\u662f\u8d1d\u5854\u5206\u5e03\uff0c\u8fd9\u4f7f\u5f97\u8d1d\u53f6\u65af\u66f4\u65b0\u5728\u89e3\u6790\u4e0a\u6613\u4e8e\u5904\u7406\u3002\u6211\u4eec\u5c06\u5728\u6587\u4ef604\u4e2d\u4f7f\u7528\u8fd9\u4e00\u6027\u8d28\u3002</p> </li> </ul> <p></p> <ul> <li>\u5361\u65b9\u5206\u5e03\uff08\\(\\chi^2\\)\uff09\uff1a\u5982\u679c\u4f60\u53d6 \\(k\\) \u4e2a\u72ec\u7acb\u7684\u6807\u51c6\u6b63\u6001\u968f\u673a\u53d8\u91cf\u5e76\u6c42\u5176\u5e73\u65b9\u548c\uff0c\u7ed3\u679c\u670d\u4ece\u81ea\u7531\u5ea6\u4e3a \\(k\\) \u7684 \\(\\chi^2\\) \u5206\u5e03\u3002</li> </ul> \\[f(x) = \\frac{1}{2^{k/2}\\Gamma(k/2)} x^{k/2 - 1} e^{-x/2}, \\quad x &gt; 0\\] <ul> <li> <p>\u5747\u503c\uff1a\\(E[X] = k\\)\u3002\u65b9\u5dee\uff1a\\(\\text{Var}(X) = 2k\\)\u3002</p> </li> <li> <p>\\(\\chi^2\\) \u5206\u5e03\u5b9e\u9645\u4e0a\u662f\u4f3d\u9a6c\u5206\u5e03\u7684\u7279\u6b8a\u60c5\u5f62\uff0c\u5176\u4e2d \\(\\alpha = k/2\\) \u4e14 \\(\\beta = 1/2\\)\u3002\u5b83\u51fa\u73b0\u5728\u5047\u8bbe\u68c0\u9a8c\uff08\u7b2c4\u7ae0\u4e2d\u7684\u5361\u65b9\u68c0\u9a8c\uff09\u3001\u62df\u5408\u4f18\u5ea6\u68c0\u9a8c\u4ee5\u53ca\u65b9\u5dee\u7f6e\u4fe1\u533a\u95f4\u7684\u8ba1\u7b97\u4e2d\u3002</p> </li> <li> <p>\u5b66\u751ft\u5206\u5e03\uff1a\u5f62\u72b6\u7c7b\u4f3c\u4e8e\u6b63\u6001\u5206\u5e03\u4f46\u5c3e\u90e8\u66f4\u91cd\u3002\u5f53\u4f60\u4f7f\u7528\u5c0f\u6837\u672c\u4e14\u603b\u4f53\u65b9\u5dee\u672a\u77e5\u65f6\uff0c\u5bf9\u6b63\u6001\u5206\u5e03\u603b\u4f53\u7684\u5747\u503c\u8fdb\u884c\u4f30\u8ba1\u65f6\u5c31\u4f1a\u51fa\u73b0t\u5206\u5e03\u3002</p> </li> </ul> \\[f(x) = \\frac{\\Gamma\\!\\left(\\frac{\\nu+1}{2}\\right)}{\\sqrt{\\nu\\pi}\\,\\Gamma\\!\\left(\\frac{\\nu}{2}\\right)} \\left(1 + \\frac{x^2}{\\nu}\\right)^{-(\\nu+1)/2}\\] <ul> <li> <p>\u53c2\u6570 \\(\\nu\\)\uff08\u81ea\u7531\u5ea6\uff09\u3002\u5f53 \\(\\nu \\to \\infty\\) \u65f6\uff0ct\u5206\u5e03\u6536\u655b\u4e8e\u6807\u51c6\u6b63\u6001\u5206\u5e03\u3002\u5f53 \\(\\nu\\) \u8f83\u5c0f\u65f6\uff0c\u66f4\u91cd\u7684\u5c3e\u90e8\u8d4b\u4e88\u6781\u7aef\u503c\u66f4\u9ad8\u7684\u6982\u7387\uff0c\u53cd\u6620\u4e86\u5c0f\u6837\u672c\u5e26\u6765\u7684\u989d\u5916\u4e0d\u786e\u5b9a\u6027\u3002</p> </li> <li> <p>\u5747\u503c\uff1a\\(E[X] = 0\\)\uff08\u5f53 \\(\\nu &gt; 1\\) \u65f6\uff09\u3002\u65b9\u5dee\uff1a\\(\\text{Var}(X) = \\frac{\\nu}{\\nu - 2}\\)\uff08\u5f53 \\(\\nu &gt; 2\\) \u65f6\uff09\u3002</p> </li> <li> <p>t\u5206\u5e03\u7528\u4e8et\u68c0\u9a8c\uff08\u7b2c4\u7ae0\uff09\uff0c\u5e76\u51fa\u73b0\u5728\u8d1d\u53f6\u65af\u63a8\u65ad\u4e2d\uff0c\u4f5c\u4e3a\u5728\u79ef\u5206\u6d88\u53bb\u672a\u77e5\u65b9\u5dee\u65f6\u7684\u8fb9\u7f18\u5206\u5e03\u3002</p> </li> <li> <p>\u5173\u952e\u5206\u5e03\u603b\u7ed3\uff1a</p> </li> </ul> \u5206\u5e03 \u7c7b\u578b \u652f\u6491\u96c6 \u5747\u503c \u65b9\u5dee Bernoulli\\((p)\\) \u79bb\u6563 \\(\\{0,1\\}\\) \\(p\\) \\(p(1-p)\\) Binomial\\((n,p)\\) \u79bb\u6563 \\(\\{0,\\ldots,n\\}\\) \\(np\\) \\(np(1-p)\\) Poisson\\((\\lambda)\\) \u79bb\u6563 \\(\\{0,1,2,\\ldots\\}\\) \\(\\lambda\\) \\(\\lambda\\) Geometric\\((p)\\) \u79bb\u6563 \\(\\{1,2,3,\\ldots\\}\\) \\(1/p\\) \\((1-p)/p^2\\) Uniform\\((a,b)\\) \u8fde\u7eed \\([a,b]\\) \\((a+b)/2\\) \\((b-a)^2/12\\) Normal\\((\\mu,\\sigma^2)\\) \u8fde\u7eed \\((-\\infty,\\infty)\\) \\(\\mu\\) \\(\\sigma^2\\) Exponential\\((\\lambda)\\) \u8fde\u7eed \\([0,\\infty)\\) \\(1/\\lambda\\) \\(1/\\lambda^2\\) Gamma\\((\\alpha,\\beta)\\) \u8fde\u7eed \\((0,\\infty)\\) \\(\\alpha/\\beta\\) \\(\\alpha/\\beta^2\\) Beta\\((\\alpha,\\beta)\\) \u8fde\u7eed \\([0,1]\\) \\(\\alpha/(\\alpha+\\beta)\\) \u89c1\u4e0a\u6587 \\(\\chi^2(k)\\) \u8fde\u7eed \\((0,\\infty)\\) \\(k\\) \\(2k\\) Student's \\(t(\\nu)\\) \u8fde\u7eed \\((-\\infty,\\infty)\\) \\(0\\) \\(\\nu/(\\nu-2)\\)"},{"location":"chapter%2005%3A%20probability/03.%20distributions/#colab","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528CoLab\u6216\u7b14\u8bb0\u672c\uff09","text":"<ol> <li> <p>\u7ed8\u5236 \\(n=20\\) \u65f6\u4e8c\u9879\u5206\u5e03PMF\u5728\u4e0d\u540c \\(p\\) \u53d6\u503c\u4e0b\u7684\u56fe\u50cf\u3002\u89c2\u5bdf\u5f62\u72b6\u5982\u4f55\u4ece\u5de6\u504f\u53d8\u4e3a\u5bf9\u79f0\u518d\u53d8\u4e3a\u53f3\u504f\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\nfrom math import comb\n\nn = 20\nks = jnp.arange(0, n + 1)\n\nfig, axes = plt.subplots(1, 3, figsize=(12, 4), sharey=True)\nfor ax, p, color in zip(axes, [0.2, 0.5, 0.8], [\"#e74c3c\", \"#3498db\", \"#27ae60\"]):\n    pmf = jnp.array([comb(n, int(k)) * p**k * (1-p)**(n-k) for k in ks])\n    ax.bar(ks, pmf, color=color, alpha=0.7)\n    ax.set_title(f\"Binomial(n={n}, p={p})\")\n    ax.set_xlabel(\"k\")\naxes[0].set_ylabel(\"P(X = k)\")\nplt.tight_layout()\nplt.show()\n</code></pre></p> </li> <li> <p>\u9a8c\u8bc1\u6cca\u677e\u5206\u5e03\u5bf9\u4e8c\u9879\u5206\u5e03\u7684\u8fd1\u4f3c\u3002\u8bbe \\(n = 1000\\)\uff0c\\(p = 0.003\\)\uff0c\u6bd4\u8f83\u4e8c\u9879\u5206\u5e03 Binomial\\((n, p)\\) \u548c\u6cca\u677e\u5206\u5e03 Poisson\\((\\lambda = np)\\)\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\nfrom math import comb, factorial, exp\n\nn, p = 1000, 0.003\nlam = n * p\nks = jnp.arange(0, 15)\n\nbinom_pmf = jnp.array([comb(n, int(k)) * p**k * (1-p)**(n-k) for k in ks])\npoisson_pmf = jnp.array([lam**k * exp(-lam) / factorial(int(k)) for k in ks])\n\nplt.figure(figsize=(8, 4))\nplt.bar(ks - 0.15, binom_pmf, width=0.3, color=\"#3498db\", alpha=0.7, label=f\"Binomial({n},{p})\")\nplt.bar(ks + 0.15, poisson_pmf, width=0.3, color=\"#e74c3c\", alpha=0.7, label=f\"Poisson({lam})\")\nplt.xlabel(\"k\")\nplt.ylabel(\"P(X = k)\")\nplt.title(\"\u6cca\u677e\u5206\u5e03\u5bf9\u4e8c\u9879\u5206\u5e03\u7684\u8fd1\u4f3c\")\nplt.legend()\nplt.show()\n</code></pre></p> </li> <li> <p>\u4ece\u6b63\u6001\u5206\u5e03\u4e2d\u91c7\u6837\u5e76\u9a8c\u8bc1\u7ecf\u9a8c\u6cd5\u5219\u3002\u8ba1\u7b97\u843d\u57281\u30012\u548c3\u4e2a\u6807\u51c6\u5dee\u5185\u7684\u6837\u672c\u6bd4\u4f8b\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\nkey = jax.random.PRNGKey(42)\nmu, sigma = 5.0, 2.0\nsamples = mu + sigma * jax.random.normal(key, shape=(100_000,))\n\nfor k in [1, 2, 3]:\n    within = jnp.abs(samples - mu) &lt;= k * sigma\n    print(f\"Within {k}\u03c3: {within.mean():.4f} (expected: {[0.6827, 0.9545, 0.9973][k-1]:.4f})\")\n</code></pre></p> </li> <li> <p>\u901a\u8fc7\u6539\u53d8 \\(\\alpha\\) \u548c \\(\\beta\\) \u63a2\u7d22\u8d1d\u5854\u5206\u5e03\u3002\u7ed8\u5236\u51e0\u79cd\u5f62\u72b6\uff0c\u89c2\u5bdf\u5206\u5e03\u5982\u4f55\u4ece\u5747\u5300\u53d8\u4e3a\u504f\u659c\u518d\u53d8\u4e3a\u96c6\u4e2d\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\nx = jnp.linspace(0.01, 0.99, 200)\n\ndef beta_pdf(x, a, b):\n    # \u672a\u5f52\u4e00\u5316\uff0c\u7528\u4e8e\u5f62\u72b6\u6bd4\u8f83\n    return x**(a-1) * (1-x)**(b-1)\n\nplt.figure(figsize=(10, 5))\nparams = [(1,1,\"\u5747\u5300\"), (2,5,\"\u5de6\u504f\"), (5,2,\"\u53f3\u504f\"),\n          (5,5,\"\u5bf9\u79f0\"), (0.5,0.5,\"U\u5f62\")]\ncolors = [\"#999\", \"#e74c3c\", \"#3498db\", \"#27ae60\", \"#9b59b6\"]\n\nfor (a, b, label), color in zip(params, colors):\n    y = beta_pdf(x, a, b)\n    y = y / jnp.trapezoid(y, x)  # \u5f52\u4e00\u5316\n    plt.plot(x, y, label=f\"\u03b1={a}, \u03b2={b} ({label})\", color=color, linewidth=2)\n\nplt.xlabel(\"x\")\nplt.ylabel(\"\u5bc6\u5ea6\")\nplt.title(\"\u8d1d\u5854\u5206\u5e03\u5f62\u72b6\")\nplt.legend()\nplt.grid(alpha=0.3)\nplt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2005%3A%20probability/04.%20bayesian/","title":"\u8d1d\u53f6\u65af\u65b9\u6cd5\u4e0e\u5e8f\u5217\u6a21\u578b","text":"<p>\u8d1d\u53f6\u65af\u65b9\u6cd5\u5c06\u5148\u9a8c\u4fe1\u5ff5\u4e0e\u89c2\u6d4b\u6570\u636e\u76f8\u7ed3\u5408\uff0c\u751f\u6210\u6a21\u578b\u53c2\u6570\u7684\u540e\u9a8c\u5206\u5e03\u3002\u672c\u6587\u6db5\u76d6\u6700\u5927\u4f3c\u7136\u4f30\u8ba1\u3001\u6700\u5927\u540e\u9a8c\u4f30\u8ba1\u3001\u5171\u8f6d\u5148\u9a8c\u3001\u8d1d\u53f6\u65af\u63a8\u65ad\u3001\u9690\u9a6c\u5c14\u53ef\u592b\u6a21\u578b\u548cEM\u7b97\u6cd5\u2014\u2014\u8fd9\u4e9b\u6280\u672f\u662f\u5783\u573e\u90ae\u4ef6\u8fc7\u6ee4\u5668\u3001\u8bed\u8a00\u6a21\u578b\u548c\u4e0d\u786e\u5b9a\u6027\u611f\u77e5\u673a\u5668\u5b66\u4e60\u7684\u57fa\u7840\u3002</p> <ul> <li> <p>\u5230\u76ee\u524d\u4e3a\u6b62\uff0c\u6211\u4eec\u4ecb\u7ecd\u4e86\u5404\u79cd\u5206\u5e03\u4ee5\u53ca\u5982\u4f55\u8ba1\u7b97\u6982\u7387\u3002\u73b0\u5728\u6211\u4eec\u6765\u5904\u7406\u673a\u5668\u5b66\u4e60\u7684\u6838\u5fc3\u95ee\u9898\uff1a\u7ed9\u5b9a\u89c2\u6d4b\u6570\u636e\uff0c\u5982\u4f55\u627e\u5230\u6a21\u578b\u7684\u6700\u4f73\u53c2\u6570\uff1f</p> </li> <li> <p>\u6700\u5927\u4f3c\u7136\u4f30\u8ba1 (MLE) \u76f4\u63a5\u56de\u7b54\u4e86\u8fd9\u4e2a\u95ee\u9898\uff1a\u9009\u62e9\u4f7f\u89c2\u6d4b\u6570\u636e\u6982\u7387\u6700\u5927\u7684\u53c2\u6570\u503c\u3002</p> </li> <li> <p>\u5f62\u5f0f\u4e0a\uff0c\u7ed9\u5b9a\u6570\u636e \\(D = \\{x_1, x_2, \\ldots, x_n\\}\\) \u548c\u5e26\u6709\u53c2\u6570 \\(\\theta\\) \u7684\u6a21\u578b\uff0c\u4f3c\u7136\u51fd\u6570\u4e3a\uff1a</p> </li> </ul> \\[L(\\theta | D) = P(D | \\theta) = \\prod_{i=1}^{n} P(x_i | \\theta)\\] <ul> <li>\u4e58\u79ef\u5047\u8bbe\u6570\u636e\u70b9\u72ec\u7acb\u540c\u5206\u5e03\uff08i.i.d.\uff09\u3002MLE\u4f30\u8ba1\u91cf\u4e3a\uff1a</li> </ul> \\[\\hat{\\theta}_{\\text{MLE}} = \\arg\\max_\\theta L(\\theta | D)\\] <ul> <li>\u5b9e\u8df5\u4e2d\u6211\u4eec\u6700\u5927\u5316\u5bf9\u6570\u4f3c\u7136\uff0c\u56e0\u4e3a\u5bf9\u6570\u5c06\u4e58\u79ef\u8f6c\u5316\u4e3a\u6c42\u548c\uff0c\u5e76\u9632\u6b62\u6570\u503c\u4e0b\u6ea2\uff1a</li> </ul> \\[\\ell(\\theta) = \\log L(\\theta | D) = \\sum_{i=1}^{n} \\log P(x_i | \\theta)\\] <ul> <li> <p>\u7531\u4e8e \\(\\log\\) \u662f\u5355\u8c03\u9012\u589e\u51fd\u6570\uff0c\u4f7f\u5f97 \\(\\ell(\\theta)\\) \u6700\u5927\u7684 \\(\\theta\\) \u4e5f\u540c\u6837\u4f7f\u5f97 \\(L(\\theta)\\) \u6700\u5927\u3002</p> </li> <li> <p>\u629b\u786c\u5e01\u793a\u4f8b\uff1a\u4f60\u629b\u4e00\u679a\u786c\u5e0110\u6b21\uff0c\u5f97\u52307\u6b21\u6b63\u9762\u3002\u786c\u5e01\u504f\u7f6e \\(p\\)\uff08\u6b63\u9762\u6982\u7387\uff09\u7684MLE\u4f30\u8ba1\u662f\u591a\u5c11\uff1f</p> </li> <li> <p>\u6bcf\u6b21\u629b\u63b7\u670d\u4ece Bernoulli(\\(p\\))\uff0c\u56e0\u6b6410\u6b21\u629b\u63b7\u4e2d\u51fa\u73b07\u6b21\u6b63\u9762\u7684\u4f3c\u7136\u4e3a\uff1a</p> </li> </ul> \\[L(p) = \\binom{10}{7} p^7 (1-p)^3\\] <ul> <li> <p>\u53d6\u5bf9\u6570\u5e76\u6c42\u5bfc\uff1a\\(\\frac{d\\ell}{dp} = \\frac{7}{p} - \\frac{3}{1-p} = 0\\)\uff0c\u89e3\u5f97 \\(\\hat{p}_{\\text{MLE}} = 7/10 = 0.7\\)\u3002</p> </li> <li> <p>MLE\u76f4\u89c2\u4e14\u7b80\u5355\u3002\u5982\u679c10\u6b21\u629b\u63b7\u4e2d\u5f97\u52307\u6b21\u6b63\u9762\uff0c\u6700\u53ef\u80fd\u7684\u504f\u7f6e\u662f0.7\u3002\u4f46\u6ce8\u610f\u4e00\u4e2a\u95ee\u9898\uff1a\u5982\u679c10\u6b21\u629b\u63b7\u4e2d\u5f97\u523010\u6b21\u6b63\u9762\uff0cMLE\u4f1a\u5f97\u51fa \\(\\hat{p} = 1\\)\uff0c\u610f\u5473\u7740\u786c\u5e01\u5c06\u6c38\u8fdc\u6b63\u9762\u671d\u4e0a\u3002\u4ec5\u51ed10\u6b21\u89c2\u6d4b\u5c31\u5f97\u51fa\u8fd9\u6837\u7684\u7ed3\u8bba\u4f3c\u4e4e\u8fc7\u4e8e\u81ea\u4fe1\u3002</p> </li> <li> <p>\u6700\u5927\u540e\u9a8c\u4f30\u8ba1 (MAP) \u901a\u8fc7\u52a0\u5165\u5148\u9a8c\u4fe1\u5ff5\u6765\u4fee\u590d\u8fd9\u4e2a\u95ee\u9898\u3002MAP\u4e0d\u662f\u4ec5\u6700\u5927\u5316\u4f3c\u7136\uff0c\u800c\u662f\u6700\u5927\u5316\u540e\u9a8c\uff1a</p> </li> </ul> \\[\\hat{\\theta}_{\\text{MAP}} = \\arg\\max_\\theta P(\\theta | D) = \\arg\\max_\\theta P(D | \\theta) \\cdot P(\\theta)\\] <ul> <li> <p>\u6211\u4eec\u7701\u7565\u4e86\u5206\u6bcd \\(P(D)\\)\uff0c\u56e0\u4e3a\u5b83\u4e0d\u4f9d\u8d56\u4e8e \\(\\theta\\)\uff0c\u4e0d\u5f71\u54cdargmax\u7684\u7ed3\u679c\u3002</p> </li> <li> <p>\u5148\u9a8c \\(P(\\theta)\\) \u7f16\u7801\u4e86\u6211\u4eec\u5728\u770b\u5230\u6570\u636e\u4e4b\u524d\u5bf9 \\(\\theta\\) \u7684\u4fe1\u5ff5\u3002\u5982\u679c\u6211\u4eec\u4f7f\u7528 Beta(2, 2) \u5148\u9a8c\u6765\u8868\u793a\u786c\u5e01\u504f\u7f6e\uff08\u8868\u8fbe\"\u786c\u5e01\u5927\u81f4\u662f\u516c\u5e73\u7684\"\u8fd9\u4e00\u6e29\u548c\u4fe1\u5ff5\uff09\uff0cMAP\u4f30\u8ba1\u5c31\u4e0d\u518d\u4ec5\u4ec5\u662f\u6b63\u9762\u7684\u6bd4\u4f8b\uff0c\u800c\u662f\u88ab\u62c9\u54110.5\u3002</p> </li> </ul> <p></p> <ul> <li>\u4f7f\u7528 Beta(\\(\\alpha\\), \\(\\beta\\)) \u5148\u9a8c\uff0c\u89c2\u6d4b\u5230 \\(h\\) \u6b21\u6b63\u9762\u548c \\(t\\) \u6b21\u53cd\u9762\u540e\uff0c\u540e\u9a8c\u4e3a Beta(\\(\\alpha + h\\), \\(\\beta + t\\))\uff0cMAP\u4f30\u8ba1\u4e3a\uff1a</li> </ul> \\[\\hat{p}_{\\text{MAP}} = \\frac{\\alpha + h - 1}{\\alpha + \\beta + h + t - 2}\\] <ul> <li> <p>\u5bf9\u4e8e\u6211\u4eec\u7684\u793a\u4f8b\uff0cBeta(2,2)\u5148\u9a8c\uff0c7\u6b21\u6b63\u9762\uff0c3\u6b21\u53cd\u9762\uff1a\\(\\hat{p}_{\\text{MAP}} = \\frac{2 + 7 - 1}{2 + 2 + 10 - 2} = \\frac{8}{12} = 0.667\\)\u3002</p> </li> <li> <p>\u6ce8\u610fMAP\u4f30\u8ba1\uff080.667\uff09\u76f8\u6bd4MLE\uff080.7\uff09\u5982\u4f55\u88ab\u62c9\u54110.5\u3002\u5148\u9a8c\u8d77\u5230\u4e86\u6b63\u5219\u5316\u7684\u4f5c\u7528\u3002\u5728\u673a\u5668\u5b66\u4e60\u4e2d\uff0cL2\u6b63\u5219\u5316\uff08\u6743\u91cd\u8870\u51cf\uff09\u5b8c\u5168\u7b49\u4ef7\u4e8e\u5728\u6743\u91cd\u4e0a\u4f7f\u7528\u9ad8\u65af\u5148\u9a8c\u7684MAP\u4f30\u8ba1\u3002</p> </li> <li> <p>\u5b8c\u6574\u7684\u8d1d\u53f6\u65af\u63a8\u65ad\u6bd4MAP\u66f4\u8fdb\u4e00\u6b65\u3002\u5b83\u4e0d\u662f\u5bfb\u627e\u5355\u4e00\u7684\u6700\u4f73 \\(\\theta\\)\uff0c\u800c\u662f\u7ef4\u62a4\u6574\u4e2a\u540e\u9a8c\u5206\u5e03 \\(P(\\theta | D)\\)\u3002\u8fd9\u4e0d\u4ec5\u7ed9\u4f60\u4e00\u4e2a\u70b9\u4f30\u8ba1\uff0c\u8fd8\u7ed9\u51fa\u4e86\u4e0d\u786e\u5b9a\u6027\u7684\u5ea6\u91cf\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u5177\u6709Beta(2,2)\u5148\u9a8c\u548c7\u6b21\u6b63\u9762\u30013\u6b21\u53cd\u9762\u7684\u504f\u7f6e\u786c\u5e01\uff0c\u5b8c\u6574\u7684\u540e\u9a8c\u662f Beta(9, 5)\u3002\u8be5\u5206\u5e03\u7684\u5747\u503c\u4e3a \\(9/14 \\approx 0.643\\)\uff0c\u5176\u5f25\u6563\u7a0b\u5ea6\u544a\u8bc9\u6211\u4eec\u7f6e\u4fe1\u5ea6\u7684\u9ad8\u4f4e\u3002\u6570\u636e\u8d8a\u591a\uff0c\u540e\u9a8c\u8d8a\u7a84\u3002</p> </li> <li> <p>\u4e09\u79cd\u65b9\u6cd5\u5f62\u6210\u4e86\u4e00\u4e2a\u8c31\u7cfb\uff1a</p> <ul> <li>MLE\uff1a\u65e0\u5148\u9a8c\uff0c\u4ec5\u4f9d\u8d56\u6570\u636e\u3002\u901f\u5ea6\u5feb\uff0c\u4f46\u6570\u636e\u5c11\u65f6\u53ef\u80fd\u8fc7\u62df\u5408\u3002</li> <li>MAP\uff1a\u5e26\u5148\u9a8c\u6b63\u5219\u5316\u7684\u70b9\u4f30\u8ba1\u3002\u589e\u52a0\u9c81\u68d2\u6027\u3002</li> <li>\u5b8c\u6574\u8d1d\u53f6\u65af\uff1a\u5b8c\u6574\u7684\u540e\u9a8c\u5206\u5e03\u3002\u4fe1\u606f\u91cf\u6700\u5927\uff0c\u4f46\u901a\u5e38\u8ba1\u7b97\u6210\u672c\u9ad8\u3002</li> </ul> </li> <li> <p>\u9a6c\u5c14\u53ef\u592b\u94fe\u5bf9\u5e8f\u5217\u8fdb\u884c\u5efa\u6a21\uff0c\u5176\u4e2d\u4e0b\u4e00\u72b6\u6001\u4ec5\u4f9d\u8d56\u4e8e\u5f53\u524d\u72b6\u6001\uff0c\u800c\u4e0d\u4f9d\u8d56\u4e8e\u5386\u53f2\u3002\u8fd9\u79cd\"\u65e0\u8bb0\u5fc6\u6027\"\u79f0\u4e3a\u9a6c\u5c14\u53ef\u592b\u6027\uff1a</p> </li> </ul> \\[P(X_{t+1} | X_t, X_{t-1}, \\ldots, X_1) = P(X_{t+1} | X_t)\\] <ul> <li> <p>\u4ee5\u5929\u6c14\u4e3a\u4f8b\u3002\u660e\u5929\u7684\u5929\u6c14\u53d6\u51b3\u4e8e\u4eca\u5929\u7684\u5929\u6c14\uff0c\u4f46\u4e0d\u53d6\u51b3\u4e8e\u4e0a\u5468\u7684\u5929\u6c14\uff08\u8fd9\u662f\u4e00\u4e2a\u7b80\u5316\uff0c\u4f46\u51fa\u5947\u5730\u6709\u7528\uff09\u3002</p> </li> <li> <p>\u9a6c\u5c14\u53ef\u592b\u94fe\u5177\u6709\u6709\u9650\u4e2a\u72b6\u6001\u548c\u4e00\u4e2a\u8f6c\u79fb\u77e9\u9635 \\(T\\)\uff0c\u5176\u4e2d\u5143\u7d20 \\(T_{ij}\\) \u8868\u793a\u4ece\u72b6\u6001 \\(i\\) \u8f6c\u79fb\u5230\u72b6\u6001 \\(j\\) \u7684\u6982\u7387\u3002\u6bcf\u4e00\u884c\u4e4b\u548c\u4e3a1\u3002</p> </li> </ul> <p></p> <ul> <li>\u5bf9\u4e8e\u4e0a\u56fe\u7684\u5929\u6c14\u793a\u4f8b\uff0c\u8f6c\u79fb\u77e9\u9635\u4e3a\uff1a</li> </ul> \\[ T = \\begin{pmatrix} 0.3 &amp; 0.4 &amp; 0.3 \\\\ 0.2 &amp; 0.5 &amp; 0.3 \\\\ 0.4 &amp; 0.3 &amp; 0.3 \\end{pmatrix} \\] <ul> <li> <p>\u5982\u679c\u4eca\u5929\u662f\u96e8\u5929\uff08\u72b6\u6001\u5411\u91cf \\(\\mathbf{s}_0 = [1, 0, 0]\\)\uff09\uff0c\u660e\u5929\u5929\u6c14\u7684\u6982\u7387\u5206\u5e03\u4e3a \\(\\mathbf{s}_1 = \\mathbf{s}_0 T = [0.3, 0.4, 0.3]\\)\u3002\u4e24\u5929\u540e\uff1a\\(\\mathbf{s}_2 = \\mathbf{s}_0 T^2\\)\u3002\u8fd9\u4f7f\u7528\u4e86\u7b2c\u4e00\u7ae0\u4e2d\u7684\u77e9\u9635\u4e58\u6cd5\u3002</p> </li> <li> <p>\u8bb8\u591a\u9a6c\u5c14\u53ef\u592b\u94fe\u4f1a\u6536\u655b\u5230\u4e00\u4e2a\u5e73\u7a33\u5206\u5e03 \\(\\pi\\)\uff0c\u6ee1\u8db3 \\(\\pi T = \\pi\\)\u3002\u65e0\u8bba\u4ece\u54ea\u91cc\u51fa\u53d1\uff0c\u7ecf\u8fc7\u8db3\u591f\u591a\u7684\u6b65\u6570\u540e\uff0c\u94fe\u4f1a\u6536\u655b\u5230 \\(\\pi\\)\u3002\u8fd9\u4e00\u6027\u8d28\u662fMCMC\uff08\u9a6c\u5c14\u53ef\u592b\u94fe\u8499\u7279\u5361\u7f57\uff09\u7684\u57fa\u7840\uff0cMCMC\u662f\u8d1d\u53f6\u65af\u673a\u5668\u5b66\u4e60\u4e2d\u5e7f\u6cdb\u4f7f\u7528\u7684\u91c7\u6837\u6280\u672f\u3002</p> </li> <li> <p>\u9690\u9a6c\u5c14\u53ef\u592b\u6a21\u578b (HMM) \u901a\u8fc7\u589e\u52a0\u4e00\u5c42\u95f4\u63a5\u6027\u6765\u6269\u5c55\u9a6c\u5c14\u53ef\u592b\u94fe\u3002\u771f\u5b9e\u72b6\u6001\u662f\u9690\u85cf\u7684\uff08\u4e0d\u53ef\u89c2\u6d4b\u7684\uff09\uff0c\u6bcf\u4e2a\u65f6\u95f4\u6b65\u9690\u85cf\u72b6\u6001\u4f1a\u53d1\u51fa\u4e00\u4e2a\u53ef\u89c2\u6d4b\u7684\u4fe1\u53f7\u3002</p> </li> </ul> <p></p> <ul> <li> <p>HMM \u6709\u4e09\u4e2a\u7ec4\u6210\u90e8\u5206\uff1a</p> <ul> <li>\u8f6c\u79fb\u6982\u7387 \\(P(z_t | z_{t-1})\\)\uff1a\u9690\u85cf\u72b6\u6001\u5982\u4f55\u6f14\u5316\uff08\u9a6c\u5c14\u53ef\u592b\u94fe\uff09</li> <li>\u53d1\u5c04\u6982\u7387 \\(P(x_t | z_t)\\)\uff1a\u6bcf\u4e2a\u9690\u85cf\u72b6\u6001\u4ea7\u751f\u4ec0\u4e48\u53ef\u89c2\u6d4b\u8f93\u51fa</li> <li>\u521d\u59cb\u5206\u5e03 \\(P(z_1)\\)\uff1a\u8d77\u59cb\u9690\u85cf\u72b6\u6001\u7684\u6982\u7387</li> </ul> </li> <li> <p>\u96e8\u4f1e\u793a\u4f8b\uff1a\u5047\u8bbe\u4f60\u4e0d\u80fd\u76f4\u63a5\u770b\u5230\u5929\u6c14\uff0c\u4f46\u53ef\u4ee5\u89c2\u5bdf\u5230\u4f60\u7684\u670b\u53cb\u662f\u5426\u5e26\u4f1e\u3002\u9690\u85cf\u72b6\u6001\u4e3a {\u96e8\u5929, \u6674\u5929}\uff0c\u89c2\u6d4b\u4e3a {\u5e26\u4f1e, \u4e0d\u5e26\u4f1e}\u3002</p> </li> <li> <p>\u8f6c\u79fb\u6982\u7387\uff1a\\(P(\\text{\u96e8\u5929}|\\text{\u96e8\u5929}) = 0.7\\)\uff0c\\(P(\\text{\u6674\u5929}|\\text{\u96e8\u5929}) = 0.3\\)\uff0c\\(P(\\text{\u96e8\u5929}|\\text{\u6674\u5929}) = 0.4\\)\uff0c\\(P(\\text{\u6674\u5929}|\\text{\u6674\u5929}) = 0.6\\)\u3002</p> </li> <li> <p>\u53d1\u5c04\u6982\u7387\uff1a\\(P(\\text{\u5e26\u4f1e}|\\text{\u96e8\u5929}) = 0.9\\)\uff0c\\(P(\\text{\u4e0d\u5e26\u4f1e}|\\text{\u96e8\u5929}) = 0.1\\)\uff0c\\(P(\\text{\u5e26\u4f1e}|\\text{\u6674\u5929}) = 0.2\\)\uff0c\\(P(\\text{\u4e0d\u5e26\u4f1e}|\\text{\u6674\u5929}) = 0.8\\)\u3002</p> </li> <li> <p>HMM \u7684\u5173\u952e\u95ee\u9898\u6709\uff1a</p> <ul> <li>\u89e3\u7801\uff1a\u7ed9\u5b9a\u89c2\u6d4b\uff0c\u6700\u53ef\u80fd\u7684\u9690\u85cf\u72b6\u6001\u5e8f\u5217\u662f\u4ec0\u4e48\uff1f\u7531\u7ef4\u7279\u6bd4\u7b97\u6cd5\u6c42\u89e3\u3002</li> <li>\u8bc4\u4f30\uff1a\u89c2\u6d4b\u5e8f\u5217\u7684\u6982\u7387\u662f\u591a\u5c11\uff1f\u7531\u524d\u5411\u7b97\u6cd5\u6c42\u89e3\u3002</li> <li>\u5b66\u4e60\uff1a\u7ed9\u5b9a\u89c2\u6d4b\uff0c\u6700\u4f73\u6a21\u578b\u53c2\u6570\u662f\u4ec0\u4e48\uff1f\u7531Baum-Welch\u7b97\u6cd5\u6c42\u89e3\uff08\u671f\u671b\u6700\u5927\u5316\u7b97\u6cd5\u7684\u4e00\u4e2a\u5b9e\u4f8b\uff09\u3002</li> </ul> </li> <li> <p>\u7ef4\u7279\u6bd4\u6f14\u7b97\uff1a\u5047\u8bbe\u4f60\u89c2\u6d4b\u5230 [\u5e26\u4f1e, \u5e26\u4f1e, \u4e0d\u5e26\u4f1e]\uff0c\u60f3\u627e\u5230\u6700\u53ef\u80fd\u7684\u5929\u6c14\u5e8f\u5217\u3002</p> </li> <li> <p>\u4ece\u521d\u59cb\u6982\u7387\u5f00\u59cb\u3002\u5047\u8bbe \\(P(R) = 0.5\\)\uff0c\\(P(S) = 0.5\\)\u3002</p> </li> <li> <p>\u7b2c1\u5929\uff08\u89c2\u6d4b\u5230\u5e26\u4f1e\uff09\uff1a</p> <ul> <li>\\(V_1(R) = P(R) \\cdot P(U|R) = 0.5 \\times 0.9 = 0.45\\)</li> <li>\\(V_1(S) = P(S) \\cdot P(U|S) = 0.5 \\times 0.2 = 0.10\\)</li> </ul> </li> <li> <p>\u7b2c2\u5929\uff08\u89c2\u6d4b\u5230\u5e26\u4f1e\uff09\uff1a</p> <ul> <li>\\(V_2(R) = \\max(V_1(R) \\cdot P(R|R), V_1(S) \\cdot P(R|S)) \\cdot P(U|R)\\)</li> <li>\\(= \\max(0.45 \\times 0.7, 0.10 \\times 0.4) \\times 0.9 = \\max(0.315, 0.04) \\times 0.9 = 0.2835\\)</li> <li>\\(V_2(S) = \\max(V_1(R) \\cdot P(S|R), V_1(S) \\cdot P(S|S)) \\cdot P(U|S)\\)</li> <li>\\(= \\max(0.45 \\times 0.3, 0.10 \\times 0.6) \\times 0.2 = \\max(0.135, 0.06) \\times 0.2 = 0.027\\)</li> </ul> </li> <li> <p>\u7b2c3\u5929\uff08\u89c2\u6d4b\u5230\u4e0d\u5e26\u4f1e\uff09\uff1a</p> <ul> <li>\\(V_3(R) = \\max(0.2835 \\times 0.7, 0.027 \\times 0.4) \\times 0.1 = 0.1985 \\times 0.1 = 0.01985\\)</li> <li>\\(V_3(S) = \\max(0.2835 \\times 0.3, 0.027 \\times 0.6) \\times 0.8 = 0.08505 \\times 0.8 = 0.06804\\)</li> </ul> </li> <li> <p>\u7b2c3\u5929\u7684\u6700\u5927\u503c\u5728\u6674\u5929\u3002\u56de\u6eaf\uff1a\u7b2c3\u5929 = \u6674\u5929\uff08\u6765\u81eaR\uff09\uff0c\u7b2c2\u5929 = \u96e8\u5929\uff08\u6765\u81eaR\uff09\uff0c\u7b2c1\u5929 = \u96e8\u5929\u3002\u6700\u53ef\u80fd\u7684\u5e8f\u5217\uff1a\u96e8\u5929, \u96e8\u5929, \u6674\u5929\u3002</p> </li> <li> <p>\u524d\u5411-\u540e\u5411\u7b97\u6cd5\u8ba1\u7b97\u5728\u7ed9\u5b9a\u6574\u4e2a\u89c2\u6d4b\u5e8f\u5217\u6761\u4ef6\u4e0b\uff0c\u6bcf\u4e2a\u65f6\u95f4\u6b65\u5904\u4e8e\u6bcf\u4e2a\u9690\u85cf\u72b6\u6001\u7684\u6982\u7387\u3002\u524d\u5411\u8fc7\u7a0b\u8ba1\u7b97 \\(P(z_t, x_{1:t})\\)\uff0c\u540e\u5411\u8fc7\u7a0b\u8ba1\u7b97 \\(P(x_{t+1:T} | z_t)\\)\u3002\u4e24\u8005\u76f8\u4e58\u5f97\u5230\u5e73\u6ed1\u540e\u7684\u72b6\u6001\u6982\u7387\u3002</p> </li> <li> <p>Baum-Welch\u7b97\u6cd5\u5728\u9690\u85cf\u72b6\u6001\u4e0d\u53ef\u89c2\u6d4b\u65f6\u4ece\u6570\u636e\u4e2d\u5b66\u4e60HMM\u53c2\u6570\u3002\u5b83\u662f\u4e00\u79cd\u671f\u671b\u6700\u5927\u5316\uff08EM\uff09\u7b97\u6cd5\uff1aE\u6b65\u4f7f\u7528\u524d\u5411-\u540e\u5411\u7b97\u6cd5\u4f30\u8ba1\u54ea\u4e9b\u9690\u85cf\u72b6\u6001\u751f\u6210\u4e86\u89c2\u6d4b\uff0cM\u6b65\u66f4\u65b0\u8f6c\u79fb\u6982\u7387\u548c\u53d1\u5c04\u6982\u7387\u3002</p> </li> <li> <p>HMM\u5728\u5386\u53f2\u4e0a\u4e3b\u5bfc\u4e86\u8bed\u97f3\u8bc6\u522b\uff08\u9690\u85cf\u7684\u97f3\u7d20\u72b6\u6001\u53d1\u51fa\u58f0\u5b66\u4fe1\u53f7\uff09\u548c\u751f\u7269\u4fe1\u606f\u5b66\uff08\u9690\u85cf\u7684\u57fa\u56e0\u72b6\u6001\u53d1\u51faDNA\u78b1\u57fa\u5bf9\uff09\u3002\u867d\u7136\u6df1\u5ea6\u5b66\u4e60\u5728\u5f88\u5927\u7a0b\u5ea6\u4e0a\u5df2\u53d6\u4ee3\u4e86\u8fd9\u4e9b\u9886\u57df\u4e2d\u7684HMM\uff0c\u4f46\u9690\u85cf\u72b6\u6001\u3001\u53d1\u5c04\u548c\u5e8f\u5217\u63a8\u65ad\u7684\u601d\u60f3\u4ecd\u7136\u662f\u5e8f\u5217\u6a21\u578b\u7684\u6838\u5fc3\u3002</p> </li> <li> <p>\u6761\u4ef6\u968f\u673a\u573a (CRF) \u901a\u8fc7\u53bb\u9664\u53d1\u5c04\u72ec\u7acb\u5047\u8bbe\u6765\u6539\u8fdbHMM\u3002\u5728HMM\u4e2d\uff0c\u65f6\u95f4 \\(t\\) \u7684\u89c2\u6d4b\u4ec5\u4f9d\u8d56\u4e8e\u65f6\u95f4 \\(t\\) \u7684\u9690\u85cf\u72b6\u6001\u3002CRF\u5141\u8bb8\u4f4d\u7f6e \\(t\\) \u7684\u6807\u7b7e\u4f9d\u8d56\u4e8e\u6574\u4e2a\u8f93\u5165\u5e8f\u5217\u3002</p> </li> <li> <p>\u7ebf\u6027\u94feCRF\u5bf9\u7ed9\u5b9a\u8f93\u5165\u5e8f\u5217 \\(\\mathbf{x}\\) \u6761\u4ef6\u4e0b\u6807\u7b7e\u5e8f\u5217 \\(\\mathbf{y}\\) \u7684\u6761\u4ef6\u6982\u7387\u5efa\u6a21\uff1a</p> </li> </ul> \\[P(\\mathbf{y} | \\mathbf{x}) = \\frac{1}{Z(\\mathbf{x})} \\exp\\!\\left(\\sum_t \\left[\\sum_k \\lambda_k f_k(y_t, y_{t-1}, \\mathbf{x}, t)\\right]\\right)\\] <ul> <li> <p>\u5176\u4e2d \\(f_k\\) \u662f\u7279\u5f81\u51fd\u6570\uff08\u53ef\u4ee5\u67e5\u770b\u8f93\u5165\u7684\u4efb\u610f\u90e8\u5206\uff09\uff0c\\(\\lambda_k\\) \u662f\u5b66\u4e60\u5230\u7684\u6743\u91cd\uff0c\\(Z(\\mathbf{x})\\) \u662f\u5f52\u4e00\u5316\u5e38\u6570\u3002</p> </li> <li> <p>CRF\u662f\u5224\u522b\u5f0f\u6a21\u578b\uff08\u76f4\u63a5\u5efa\u6a21 \\(P(\\mathbf{y}|\\mathbf{x})\\)\uff09\uff0c\u800cHMM\u662f\u751f\u6210\u5f0f\u6a21\u578b\uff08\u5efa\u6a21 \\(P(\\mathbf{x}, \\mathbf{y})\\)\uff09\u3002\u8fd9\u4e00\u533a\u522b\u4e0e\u903b\u8f91\u56de\u5f52\uff08\u5224\u522b\u5f0f\uff09\u548c\u6734\u7d20\u8d1d\u53f6\u65af\uff08\u751f\u6210\u5f0f\uff09\u4e4b\u95f4\u7684\u533a\u522b\u76f8\u540c\u3002</p> </li> <li> <p>\u5728\u73b0\u4ee3NLP\u4e2d\uff0cCRF\u5c42\u901a\u5e38\u88ab\u52a0\u5728\u795e\u7ecf\u7f51\u7edc\u4e4b\u4e0a\uff08BiLSTM-CRF\u3001BERT-CRF\uff09\uff0c\u7528\u4e8e\u547d\u540d\u5b9e\u4f53\u8bc6\u522b\u548c\u8bcd\u6027\u6807\u6ce8\u7b49\u9700\u8981\u6355\u6349\u6807\u7b7e\u4f9d\u8d56\u5173\u7cfb\u7684\u4efb\u52a1\u3002</p> </li> </ul>"},{"location":"chapter%2005%3A%20probability/04.%20bayesian/#colab-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ol> <li> <p>\u5b9e\u73b0\u629b\u786c\u5e01\u5b9e\u9a8c\u7684MLE\u548cMAP\u3002\u89c2\u5bdfMAP\u4f30\u8ba1\u5982\u4f55\u968f\u4e0d\u540c\u7684\u5148\u9a8c\u548c\u4e0d\u540c\u7684\u6570\u636e\u91cf\u800c\u53d8\u5316\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u6570\u636e\uff1a\u89c2\u6d4b\u5230\u7684\u786c\u5e01\u629b\u63b7\u7ed3\u679c\nheads, tails = 7, 3\n\n# MLE\np_mle = heads / (heads + tails)\nprint(f\"MLE: {p_mle:.4f}\")\n\n# \u4f7f\u7528 Beta \u5148\u9a8c\u7684 MAP\nfor alpha, beta in [(1,1), (2,2), (5,5), (10,10)]:\n    p_map = (alpha + heads - 1) / (alpha + beta + heads + tails - 2)\n    print(f\"MAP (Beta({alpha},{beta})): {p_map:.4f}\")\n\n# \u53ef\u89c6\u5316 Beta(2,2) \u5148\u9a8c\u4e0b\u7684\u540e\u9a8c\ntheta = jnp.linspace(0.01, 0.99, 200)\n# \u540e\u9a8c\u4e3a Beta(alpha+heads, beta+tails)\na_post, b_post = 2 + heads, 2 + tails\nposterior = theta**(a_post-1) * (1-theta)**(b_post-1)\nposterior = posterior / jnp.trapezoid(posterior, theta)\n\nplt.figure(figsize=(8, 4))\nplt.plot(theta, posterior, color=\"#e74c3c\", linewidth=2, label=f\"\u540e\u9a8c Beta({a_post},{b_post})\")\nplt.axvline(p_mle, color=\"#3498db\", linestyle=\"--\", label=f\"MLE = {p_mle:.2f}\")\nplt.axvline((a_post-1)/(a_post+b_post-2), color=\"#e74c3c\", linestyle=\"--\", label=f\"MAP = {(a_post-1)/(a_post+b_post-2):.3f}\")\nplt.xlabel(\"\u03b8 (\u786c\u5e01\u504f\u7f6e)\")\nplt.ylabel(\"\u5bc6\u5ea6\")\nplt.title(\"7\u6b21\u6b63\u9762\u30013\u6b21\u53cd\u9762\u540e Beta(2,2) \u5148\u9a8c\u4e0b\u7684\u540e\u9a8c\u5206\u5e03\")\nplt.legend()\nplt.grid(alpha=0.3)\nplt.show()\n</code></pre></p> </li> <li> <p>\u4e3a\u5929\u6c14\u6a21\u578b\u6784\u5efa\u4e00\u4e2a\u9a6c\u5c14\u53ef\u592b\u94fe\u5e76\u8fdb\u884c\u6a21\u62df\u3002\u5206\u522b\u901a\u8fc7\u6a21\u62df\u548c\u6c42\u89e3 \\(\\pi T = \\pi\\) \u8ba1\u7b97\u5e73\u7a33\u5206\u5e03\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\n# \u8f6c\u79fb\u77e9\u9635\uff1aR\uff08\u96e8\u5929\uff09, S\uff08\u6674\u5929\uff09, C\uff08\u591a\u4e91\uff09\nT = jnp.array([\n    [0.3, 0.4, 0.3],\n    [0.2, 0.5, 0.3],\n    [0.4, 0.3, 0.3]\n])\nstates = [\"\u96e8\u5929\", \"\u6674\u5929\", \"\u591a\u4e91\"]\n\n# \u6a21\u62df 100,000 \u6b65\nkey = jax.random.PRNGKey(42)\nn_steps = 100_000\nstate = 0  # \u4ece\u96e8\u5929\u5f00\u59cb\ncounts = jnp.zeros(3)\n\nfor i in range(n_steps):\n    key, subkey = jax.random.split(key)\n    state = jax.random.choice(subkey, 3, p=T[state])\n    counts = counts.at[state].add(1)\n\nsim_stationary = counts / n_steps\nprint(\"\u6a21\u62df\u5f97\u5230\u7684\u5e73\u7a33\u5206\u5e03\uff1a\")\nfor s, p in zip(states, sim_stationary):\n    print(f\"  {s}: {p:.4f}\")\n\n# \u89e3\u6790\u6cd5\uff1a\u627e\u5230\u7279\u5f81\u503c\u4e3a1\u7684\u5de6\u7279\u5f81\u5411\u91cf\neigenvalues, eigenvectors = jnp.linalg.eig(T.T)\nidx = jnp.argmin(jnp.abs(eigenvalues - 1.0))\npi = jnp.real(eigenvectors[:, idx])\npi = pi / pi.sum()\nprint(\"\\n\u89e3\u6790\u5f97\u5230\u7684\u5e73\u7a33\u5206\u5e03\uff1a\")\nfor s, p in zip(states, pi):\n    print(f\"  {s}: {p:.4f}\")\n</code></pre></p> </li> <li> <p>\u4e3a\u96e8\u4f1eHMM\u5b9e\u73b0\u7ef4\u7279\u6bd4\u7b97\u6cd5\uff0c\u5e76\u89e3\u7801\u4e00\u4e2a\u89c2\u6d4b\u5e8f\u5217\u3002 <pre><code>import jax.numpy as jnp\n\n# HMM \u53c2\u6570\nstates = [\"\u96e8\u5929\", \"\u6674\u5929\"]\nobs_names = [\"\u5e26\u4f1e\", \"\u4e0d\u5e26\u4f1e\"]\n\ntrans = jnp.array([[0.7, 0.3],   # R-&gt;R, R-&gt;S\n                    [0.4, 0.6]])  # S-&gt;R, S-&gt;S\n\nemit = jnp.array([[0.9, 0.1],    # R-&gt;\u5e26\u4f1e, R-&gt;\u4e0d\u5e26\u4f1e\n                   [0.2, 0.8]])   # S-&gt;\u5e26\u4f1e, S-&gt;\u4e0d\u5e26\u4f1e\n\ninit = jnp.array([0.5, 0.5])\n\n# \u89c2\u6d4b\uff1a\u5e26\u4f1e=0\uff0c\u4e0d\u5e26\u4f1e=1\nobservations = [0, 0, 1]  # \u5e26\u4f1e, \u5e26\u4f1e, \u4e0d\u5e26\u4f1e\n\ndef viterbi(obs, init, trans, emit):\n    n_states = len(init)\n    T = len(obs)\n    V = jnp.zeros((T, n_states))\n    path = jnp.zeros((T, n_states), dtype=int)\n\n    # \u521d\u59cb\u5316\n    V = V.at[0].set(init * emit[:, obs[0]])\n\n    # \u9012\u63a8\n    for t in range(1, T):\n        for j in range(n_states):\n            probs = V[t-1] * trans[:, j]\n            V = V.at[t, j].set(jnp.max(probs) * emit[j, obs[t]])\n            path = path.at[t, j].set(jnp.argmax(probs))\n\n    # \u56de\u6eaf\n    best = [int(jnp.argmax(V[-1]))]\n    for t in range(T-1, 0, -1):\n        best.insert(0, int(path[t, best[0]]))\n    return best, V\n\ndecoded, scores = viterbi(observations, init, trans, emit)\nprint(\"\u89c2\u6d4b\u5e8f\u5217\uff1a\", [obs_names[o] for o in observations])\nprint(\"\u89e3\u7801\u7ed3\u679c\uff1a\", [states[s] for s in decoded])\n</code></pre></p> </li> <li> <p>\u53ef\u89c6\u5316\u968f\u7740\u89c2\u6d4b\u66f4\u591a\u629b\u786c\u5e01\u7ed3\u679c\uff0c\u540e\u9a8c\u5982\u4f55\u6f14\u5316\u3002\u4ece Beta(1,1) \u5148\u9a8c\uff08\u5747\u5300\u5206\u5e03\uff09\u5f00\u59cb\uff0c\u6bcf\u6b21\u629b\u63b7\u540e\u66f4\u65b0\u540e\u9a8c\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ntheta = jnp.linspace(0.01, 0.99, 300)\nkey = jax.random.PRNGKey(7)\n\n# \u771f\u5b9e\u504f\u7f6e = 0.65\nflips = jax.random.bernoulli(key, p=0.65, shape=(50,))\n\nplt.figure(figsize=(10, 5))\na, b = 1, 1  # Beta(1,1) = \u5747\u5300\u5206\u5e03\n\nfor n_obs in [0, 1, 5, 10, 25, 50]:\n    h = int(flips[:n_obs].sum())\n    t = n_obs - h\n    a_post = a + h\n    b_post = b + t\n    y = theta**(a_post-1) * (1-theta)**(b_post-1)\n    y = y / jnp.trapezoid(y, theta)\n    plt.plot(theta, y, linewidth=2, label=f\"n={n_obs} (h={h})\")\n\nplt.axvline(0.65, color=\"black\", linestyle=\":\", alpha=0.5, label=\"\u771f\u5b9e p=0.65\")\nplt.xlabel(\"\u03b8\")\nplt.ylabel(\"\u5bc6\u5ea6\")\nplt.title(\"\u8d1d\u53f6\u65af\u66f4\u65b0\uff1a\u6570\u636e\u8d8a\u591a\u540e\u9a8c\u8d8a\u7a84\")\nplt.legend()\nplt.grid(alpha=0.3)\nplt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2005%3A%20probability/05.%20information%20theory/","title":"\u4fe1\u606f\u8bba","text":"<p>\u4fe1\u606f\u8bba\u91cf\u5316\u4e86\u4fe1\u606f\u3001\u60ca\u5947\u5ea6\u4ee5\u53ca\u6982\u7387\u5206\u5e03\u4e4b\u95f4\u7684\u5dee\u5f02\u3002\u672c\u6587\u6db5\u76d6\u71b5\u3001\u4ea4\u53c9\u71b5\u3001KL\u6563\u5ea6\u3001\u4e92\u4fe1\u606f\u548c\u81ea\u4fe1\u606f\u2014\u2014\u8fd9\u4e9b\u6982\u5ff5\u662f\u673a\u5668\u5b66\u4e60\u4e2d\u6bcf\u4e00\u4e2a\u5206\u7c7b\u635f\u5931\u51fd\u6570\u3001VAE\u76ee\u6807\u548c\u6570\u636e\u538b\u7f29\u65b9\u6848\u80cc\u540e\u7684\u7406\u8bba\u57fa\u7840\u3002</p> <ul> <li> <p>\u4fe1\u606f\u8bba\u7531\u514b\u52b3\u5fb7\u00b7\u9999\u519c\u4e8e1948\u5e74\u521b\u7acb\uff0c\u4e3a\u6211\u4eec\u63d0\u4f9b\u4e86\u91cf\u5316\u4fe1\u606f\u7684\u6570\u5b66\u6846\u67b6\u3002\u5b83\u56de\u7b54\u4e86\u8bf8\u5982\u6b64\u7c7b\u7684\u95ee\u9898\uff1a\u4e00\u4e2a\u4e8b\u4ef6\u5e94\u5f53\u8ba9\u4f60\u611f\u5230\u591a\u60ca\u8bb6\uff1f\u4e00\u6761\u6d88\u606f\u643a\u5e26\u4e86\u591a\u5c11\u4fe1\u606f\uff1f\u4e24\u4e2a\u6982\u7387\u5206\u5e03\u4e4b\u95f4\u6709\u591a\u5927\u7684\u5dee\u5f02\uff1f</p> </li> <li> <p>\u8fd9\u4e9b\u95ee\u9898\u770b\u4f3c\u62bd\u8c61\uff0c\u4f46\u5b83\u4eec\u662f\u673a\u5668\u5b66\u4e60\u635f\u5931\u51fd\u6570\u3001\u6570\u636e\u538b\u7f29\u548c\u901a\u4fe1\u7cfb\u7edf\u7684\u57fa\u7840\u3002\u4ea4\u53c9\u71b5\u635f\u5931\u2014\u2014\u5206\u7c7b\u4e2d\u6700\u5e38\u89c1\u7684\u635f\u5931\u51fd\u6570\u2014\u2014\u76f4\u63a5\u6e90\u4e8e\u4fe1\u606f\u8bba\u3002</p> </li> <li> <p>\u4ece\u6700\u7b80\u5355\u7684\u95ee\u9898\u5f00\u59cb\uff1a\u5355\u4e2a\u4e8b\u4ef6\u643a\u5e26\u4e86\u591a\u5c11\u4fe1\u606f\uff1f</p> </li> <li> <p>\u81ea\u4fe1\u606f\uff08surprisal\uff0c\u4e5f\u79f0 self-information\uff09\u8861\u91cf\u4e00\u4e2a\u4e8b\u4ef6\u7684\u60ca\u5947\u7a0b\u5ea6\u3002\u5982\u679c\u67d0\u4ef6\u6781\u6709\u53ef\u80fd\u53d1\u751f\u7684\u4e8b\u60c5\u771f\u7684\u53d1\u751f\u4e86\uff0c\u4f60\u51e0\u4e4e\u5b66\u4e0d\u5230\u4efb\u4f55\u65b0\u4fe1\u606f\u3002\u5982\u679c\u67d0\u4ef6\u7f55\u89c1\u7684\u4e8b\u60c5\u53d1\u751f\u4e86\uff0c\u4f60\u5219\u4f1a\u83b7\u5f97\u5927\u91cf\u4fe1\u606f\u3002</p> </li> <li> <p>\u5982\u679c\u4f60\u4f4f\u5728\u6c99\u6f20\u91cc\uff0c\u6709\u4eba\u544a\u8bc9\u4f60\u4eca\u5929\u662f\u5927\u6674\u5929\uff0c\u8fd9\u5e76\u6ca1\u6709\u4ec0\u4e48\u4fe1\u606f\u91cf\u3002\u4f46\u5982\u679c\u4ed6\u4eec\u544a\u8bc9\u4f60\u6b63\u5728\u4e0b\u96ea\uff0c\u90a3\u4fe1\u606f\u91cf\u5c31\u6781\u5176\u4e30\u5bcc\u3002\u81ea\u4fe1\u606f\u5c06\u8fd9\u79cd\u76f4\u89c9\u5f62\u5f0f\u5316\uff1a</p> </li> </ul> \\[I(x) = \\log_2 \\frac{1}{p(x)} = -\\log_2 p(x)\\] <ul> <li> <p>\u4f7f\u7528 \\(\\log_2\\) \u65f6\uff0c\u5355\u4f4d\u662f\u6bd4\u7279\u3002\u4e00\u679a\u516c\u5e73\u7684\u786c\u5e01\u629b\u63b7\u7684\u81ea\u4fe1\u606f\u4e3a \\(-\\log_2(0.5) = 1\\) \u6bd4\u7279\u3002\u4e00\u4e2a\u6982\u7387\u4e3a \\(1/8\\) \u7684\u4e8b\u4ef6\u5177\u6709 $ \\log_2(8) = 3$ \u6bd4\u7279\u7684\u81ea\u4fe1\u606f\u3002</p> </li> <li> <p>\u4e3a\u4ec0\u4e48\u7528\u5bf9\u6570\u800c\u4e0d\u662f\u7b80\u5355\u7684 \\(1/p\\)\uff1f\u4e09\u4e2a\u539f\u56e0\uff1a</p> <ul> <li>\u5fc5\u7136\u4e8b\u4ef6\uff08\\(p = 1\\)\uff09\u5e94\u7ed9\u51fa\u96f6\u4fe1\u606f\uff1a\\(\\log(1) = 0\\) \u4f46 \\(1/1 = 1\\)\u3002</li> <li>\u72ec\u7acb\u4e8b\u4ef6\u7684\u4fe1\u606f\u5e94\u8be5\u662f\u53ef\u52a0\u7684\uff1a\\(\\log(1/p_1 p_2) = \\log(1/p_1) + \\log(1/p_2)\\)\u3002</li> <li>\u6211\u4eec\u9700\u8981\u4e00\u4e2a\u5e73\u6ed1\u3001\u6027\u8d28\u826f\u597d\u7684\u51fd\u6570\u3002\\(1/p\\) \u4f1a\u7206\u70b8\uff1b\\(\\log(1/p)\\) \u5219\u5e73\u7f13\u589e\u957f\u3002</li> </ul> </li> <li> <p>\u71b5\u662f\u81ea\u4fe1\u606f\u7684\u671f\u671b\u503c\uff0c\u5373\u4ece\u4e00\u4e2a\u5206\u5e03\u4e2d\u6bcf\u6b21\u91c7\u6837\u83b7\u5f97\u7684\u5e73\u5747\u4fe1\u606f\u91cf\u3002\u5b83\u8861\u91cf\u8be5\u5206\u5e03\u7684\u4e0d\u786e\u5b9a\u6027\u6216\"\u4e0d\u53ef\u9884\u6d4b\u6027\"\uff1a</p> </li> </ul> \\[H(X) = E[I(X)] = -\\sum_{x} p(x) \\log_2 p(x)\\] <p></p> <ul> <li> <p>\u4e00\u679a\u516c\u5e73\u786c\u5e01\u7684\u71b5\u4e3a \\(H = -0.5\\log_2(0.5) - 0.5\\log_2(0.5) = 1\\) \u6bd4\u7279\u3002\u4e0d\u786e\u5b9a\u6027\u6700\u5927\u3002</p> </li> <li> <p>\u4e00\u679a\u504f\u501a\u786c\u5e01\uff0c\\(p = 0.9\\)\uff0c\u5176\u71b5\u4e3a \\(H = -0.9\\log_2(0.9) - 0.1\\log_2(0.1) \\approx 0.469\\) \u6bd4\u7279\u3002\u4e0d\u592a\u786e\u5b9a\uff0c\u56e0\u6b64\u71b5\u66f4\u5c0f\u3002</p> </li> <li> <p>\u4e00\u4e2a\u786e\u5b9a\u6027\u4e8b\u4ef6\uff08\\(p = 1\\)\uff09\u7684\u71b5\u4e3a \\(H = 0\\)\u3002\u5b8c\u5168\u6ca1\u6709\u4e0d\u786e\u5b9a\u6027\u3002</p> </li> <li> <p>\u5f53\u6240\u6709\u7ed3\u679c\u7b49\u53ef\u80fd\u65f6\uff0c\u71b5\u8fbe\u5230\u6700\u5927\u3002\u5bf9\u4e8e \\(n\\) \u4e2a\u7b49\u53ef\u80fd\u7ed3\u679c\uff0c\\(H = \\log_2 n\\)\u3002\u4e00\u9897\u516c\u5e73\u9ab0\u5b50\u7684\u71b5\u4e3a \\(\\log_2 6 \\approx 2.585\\) \u6bd4\u7279\u3002</p> </li> <li> <p>\u71b5\u7684\u5b9e\u9645\u610f\u4e49\u5728\u4e8e\u538b\u7f29\u3002\u9999\u519c\u7684\u6e90\u7f16\u7801\u5b9a\u7406\u6307\u51fa\uff0c\u5982\u679c\u4e0d\u4e22\u5931\u4fe1\u606f\uff0c\u4f60\u65e0\u6cd5\u5c06\u6570\u636e\u538b\u7f29\u5230\u4f4e\u4e8e\u5176\u71b5\u7387\u3002\u4e00\u5e45\u6bcf\u4e2a\u50cf\u7d20\u90fd\u7b49\u53ef\u80fd\u7684\u56fe\u50cf\uff08\u6700\u5927\u71b5\uff09\u65e0\u6cd5\u538b\u7f29\u3002\u4e00\u5e45\u51e0\u4e4e\u5168\u662f\u767d\u8272\u7684\u56fe\u50cf\uff08\u4f4e\u71b5\uff09\u5219\u53ef\u4ee5\u5f88\u597d\u5730\u538b\u7f29\u3002</p> </li> <li> <p>\u5feb\u901f\u611f\u53d7\u4e00\u4e0b\u6570\u91cf\u7ea7\uff1a\u4e00\u4e2a\u7070\u5ea6\u50cf\u7d20\uff08256 \u4e2a\u503c\uff09\u7684\u6700\u5927\u71b5\u4e3a 8 \u6bd4\u7279\u3002\u4e00\u5f20 1080p \u7684\u7070\u5ea6\u56fe\u50cf\u6700\u591a\u6709 \\(1920 \\times 1080 \\times 8 \\approx 1660\\) \u4e07\u6bd4\u7279\u3002\u771f\u5b9e\u56fe\u50cf\u7684\u71b5\u8981\u4f4e\u5f97\u591a\uff0c\u56e0\u4e3a\u76f8\u90bb\u50cf\u7d20\u662f\u76f8\u5173\u7684\u2014\u2014\u8fd9\u6b63\u662f JPEG \u538b\u7f29\u80fd\u591f\u5de5\u4f5c\u7684\u539f\u56e0\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u8fde\u7eed\u968f\u673a\u53d8\u91cf\uff0c\u79bb\u6563\u6c42\u548c\u53d8\u4e3a\u79ef\u5206\u3002\u5fae\u5206\u71b5\u5b9a\u4e49\u4e3a\uff1a</p> </li> </ul> \\[h(X) = -\\int_{-\\infty}^{\\infty} f(x) \\log f(x)\\, dx\\] <ul> <li> <p>\u65b9\u5dee\u4e3a \\(\\sigma^2\\) \u7684\u9ad8\u65af\u5206\u5e03\u7684\u5fae\u5206\u71b5\u4e3a \\(h = \\frac{1}{2}\\log_2(2\\pi e \\sigma^2)\\)\u3002\u5728\u6240\u6709\u5177\u6709\u76f8\u540c\u65b9\u5dee\u7684\u5206\u5e03\u4e2d\uff0c\u9ad8\u65af\u5206\u5e03\u5177\u6709\u6700\u5927\u71b5\u3002\u8fd9\u4e5f\u662f\u9ad8\u65af\u5206\u5e03\u5728\u5efa\u6a21\u4e2d\u5982\u6b64\u5e38\u89c1\u7684\u539f\u56e0\u4e4b\u4e00\uff1a\u5b83\u5728\u6307\u5b9a\u5747\u503c\u548c\u65b9\u5dee\u4e4b\u5916\u505a\u51fa\u4e86\u6700\u5c11\u7684\u5047\u8bbe\u3002</p> </li> <li> <p>\u4e92\u4fe1\u606f\u8861\u91cf\u77e5\u9053\u4e00\u4e2a\u53d8\u91cf\u80fd\u544a\u8bc9\u4f60\u5173\u4e8e\u53e6\u4e00\u4e2a\u53d8\u91cf\u7684\u591a\u5c11\u4fe1\u606f\u3002\u5b83\u662f\u89c2\u5bdf\u5230 \\(Y\\) \u540e \\(X\\) \u4e0d\u786e\u5b9a\u6027\u7684\u51cf\u5c11\u91cf\uff1a</p> </li> </ul> \\[I(X; Y) = H(X) - H(X|Y) = H(Y) - H(Y|X)\\] <ul> <li>\u7b49\u4ef7\u5f62\u5f0f\uff1a</li> </ul> \\[I(X; Y) = \\sum_{x,y} p(x,y) \\log_2 \\frac{p(x,y)}{p(x) p(y)}\\] <ul> <li> <p>\u5982\u679c \\(X\\) \u548c \\(Y\\) \u72ec\u7acb\uff0c\u5219 \\(p(x,y) = p(x)p(y)\\)\uff0c\u4e92\u4fe1\u606f\u4e3a\u96f6\u3002\u5b83\u4eec\u4f9d\u8d56\u7a0b\u5ea6\u8d8a\u9ad8\uff0c\u4e92\u4fe1\u606f\u5c31\u8d8a\u5927\u3002</p> </li> <li> <p>\u5728\u673a\u5668\u5b66\u4e60\u4e2d\uff0c\u4e92\u4fe1\u606f\u7528\u4e8e\u7279\u5f81\u9009\u62e9\uff08\u6311\u9009\u4e0e\u76ee\u6807\u5177\u6709\u9ad8 MI \u7684\u7279\u5f81\uff09\u3001\u4fe1\u606f\u74f6\u9888\u65b9\u6cd5\u4ee5\u53ca\u805a\u7c7b\u8d28\u91cf\u8bc4\u4f30\u3002</p> </li> <li> <p>\u4ea4\u53c9\u71b5\u8861\u91cf\u4f7f\u7528\u9488\u5bf9\u5206\u5e03 \\(q\\) \u4f18\u5316\u7684\u7f16\u7801\u65b9\u6848\u6765\u7f16\u7801\u6765\u81ea\u5206\u5e03 \\(p\\) \u7684\u4e8b\u4ef6\u6240\u9700\u7684\u5e73\u5747\u6bd4\u7279\u6570\uff1a</p> </li> </ul> \\[H(p, q) = -\\sum_{x} p(x) \\log_2 q(x)\\] <ul> <li> <p>\u5982\u679c \\(q\\) \u4e0e \\(p\\) \u5b8c\u5168\u5339\u914d\uff0c\u5219\u4ea4\u53c9\u71b5\u7b49\u4e8e\u71b5\uff1a\\(H(p, p) = H(p)\\)\u3002\u5982\u679c \\(q\\) \u662f\u4e00\u4e2a\u7cdf\u7cd5\u7684\u8fd1\u4f3c\uff0c\u4ea4\u53c9\u71b5\u5c31\u4f1a\u66f4\u9ad8\u3002\"\u989d\u5916\"\u7684\u6bd4\u7279\u6765\u81ea\u8fd9\u79cd\u4e0d\u5339\u914d\u3002</p> </li> <li> <p>\u8fd9\u6b63\u662f\u4ea4\u53c9\u71b5\u6210\u4e3a\u673a\u5668\u5b66\u4e60\u4e2d\u5206\u7c7b\u6807\u51c6\u635f\u5931\u51fd\u6570\u7684\u539f\u56e0\u3002\u771f\u5b9e\u6807\u7b7e\u5b9a\u4e49\u4e86 \\(p\\)\uff08\u4e00\u4e2a one-hot \u5206\u5e03\uff09\uff0c\u6a21\u578b\u7684\u9884\u6d4b\u6982\u7387\u5b9a\u4e49\u4e86 \\(q\\)\u3002\u6700\u5c0f\u5316\u4ea4\u53c9\u71b5\u63a8\u52a8 \\(q\\) \u8d8b\u8fd1\u4e8e \\(p\\)\uff1a</p> </li> </ul> \\[\\mathcal{L} = -\\sum_{c} y_c \\log \\hat{y}_c\\] <ul> <li> <p>\u5bf9\u4e8e\u5355\u4e2a\u6837\u672c\uff0c\u82e5\u771f\u5b9e\u7c7b\u522b\u4e3a \\(c\\)\uff0c\u4e0a\u5f0f\u7b80\u5316\u4e3a \\(\\mathcal{L} = -\\log \\hat{y}_c\\)\u3002\u8be5\u635f\u5931\u5c31\u662f\u6a21\u578b\u9884\u6d4b\u4e0b\u771f\u5b9e\u7c7b\u522b\u7684\u81ea\u4fe1\u606f\u3002\u5982\u679c\u6a21\u578b\u5bf9\u6b63\u786e\u7c7b\u522b\u8d4b\u4e88\u9ad8\u6982\u7387\uff0c\u5219\u635f\u5931\u8f83\u4f4e\u3002</p> </li> <li> <p>KL \u6563\u5ea6\uff08Kullback-Leibler \u6563\u5ea6\uff0c\u4e5f\u79f0\u76f8\u5bf9\u71b5\uff09\u8861\u91cf\u4e00\u4e2a\u5206\u5e03\u4e0e\u53e6\u4e00\u4e2a\u5206\u5e03\u7684\u5dee\u5f02\u7a0b\u5ea6\uff1a</p> </li> </ul> \\[D_{\\text{KL}}(p \\| q) = \\sum_{x} p(x) \\log \\frac{p(x)}{q(x)} = H(p, q) - H(p)\\] <ul> <li>KL \u6563\u5ea6\u662f\"\u4f7f\u7528\u5206\u5e03 \\(q\\) \u800c\u975e\u771f\u5b9e\u5206\u5e03 \\(p\\) \u7684\u989d\u5916\u4ee3\u4ef7\"\u3002\u5b83\u603b\u662f\u975e\u8d1f\u7684\uff08\\(D_{\\text{KL}} \\ge 0\\)\uff09\uff0c\u4e14\u4ec5\u5728 \\(p = q\\) \u65f6\u4e3a\u96f6\u3002</li> </ul> <p></p> <ul> <li> <p>KL \u6563\u5ea6\u4e0d\u662f\u5bf9\u79f0\u7684\uff1a\\(D_{\\text{KL}}(p \\| q) \\ne D_{\\text{KL}}(q \\| p)\\)\u3002\u8fd9\u79cd\u4e0d\u5bf9\u79f0\u6027\u5f88\u91cd\u8981\u3002\\(D_{\\text{KL}}(p \\| q)\\) \u60e9\u7f5a \\(q\\) \u5728 \\(p\\) \u5177\u6709\u9ad8\u6982\u7387\u5904\u653e\u7f6e\u4f4e\u6982\u7387\uff08\u56e0\u4e3a \\(\\log(p/q)\\) \u4f1a\u8d8b\u4e8e\u65e0\u7a77\u5927\uff09\u3002\\(D_{\\text{KL}}(q \\| p)\\) \u5219\u60e9\u7f5a\u76f8\u53cd\u7684\u60c5\u51b5\u3002</p> </li> <li> <p>\u8fd9\u79cd\u4e0d\u5bf9\u79f0\u6027\u5bfc\u81f4\u4e86\u4e24\u79cd\u8fd1\u4f3c\u98ce\u683c\uff1a</p> <ul> <li>\u6700\u5c0f\u5316 \\(D_{\\text{KL}}(p \\| q)\\) \u4ea7\u751f\u77e9\u5339\u914d\u884c\u4e3a\uff1a\\(q\\) \u8986\u76d6 \\(p\\) \u7684\u6240\u6709\u6a21\u6001\uff0c\u4f46\u53ef\u80fd\u8fc7\u4e8e\u5206\u6563\u3002</li> <li>\u6700\u5c0f\u5316 \\(D_{\\text{KL}}(q \\| p)\\) \u4ea7\u751f\u6a21\u5f0f\u5bfb\u627e\u884c\u4e3a\uff1a\\(q\\) \u96c6\u4e2d\u4e8e \\(p\\) \u7684\u67d0\u4e00\u4e2a\u6a21\u6001\uff0c\u4f46\u53ef\u80fd\u9519\u8fc7\u5176\u4ed6\u6a21\u6001\u3002\u53d8\u5206\u63a8\u65ad\u4f7f\u7528\u7684\u6b63\u662f\u8fd9\u4e00\u79cd\u3002</li> </ul> </li> <li> <p>\u7531\u4e8e \\(H(p)\\) \u76f8\u5bf9\u4e8e\u6a21\u578b\u662f\u5e38\u6570\uff0c\u6700\u5c0f\u5316\u4ea4\u53c9\u71b5 \\(H(p, q)\\) \u7b49\u4ef7\u4e8e\u6700\u5c0f\u5316 \\(D_{\\text{KL}}(p \\| q)\\)\u3002\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48\u6211\u4eec\u53ef\u4ee5\u4f7f\u7528\u4ea4\u53c9\u71b5\u635f\u5931\uff0c\u540c\u65f6\u77e5\u9053\u6211\u4eec\u4e5f\u5728\u6700\u5c0f\u5316\u771f\u5b9e\u5206\u5e03\u4e0e\u9884\u6d4b\u5206\u5e03\u4e4b\u95f4\u7684 KL \u6563\u5ea6\u3002</p> </li> <li> <p>KL \u6563\u5ea6\u5728\u8d1d\u53f6\u65af\u66f4\u65b0\u4e2d\u626e\u6f14\u7740\u6838\u5fc3\u89d2\u8272\u3002\u540e\u9a8c \\(P(\\theta | D)\\) \u662f\u5728 KL \u6563\u5ea6\u610f\u4e49\u4e0a\u4e0e\u5148\u9a8c \\(P(\\theta)\\) \u6700\u63a5\u8fd1\u4e14\u4e0e\u89c2\u6d4b\u6570\u636e\u4e00\u81f4\u7684\u5206\u5e03\u3002\u6bcf\u4e00\u6b21\u65b0\u7684\u89c2\u6d4b\u90fd\u4f1a\u66f4\u65b0\u540e\u9a8c\uff0c\u51cf\u5c11\u5173\u4e8e \\(\\theta\\) \u7684\u4e0d\u786e\u5b9a\u6027\u3002</p> </li> <li> <p>\u5728\u53d8\u5206\u81ea\u7f16\u7801\u5668\uff08VAE\uff09\u4e2d\uff0c\u635f\u5931\u51fd\u6570\u5305\u542b\u4e24\u9879\uff1a\u91cd\u6784\u635f\u5931\uff08\u4ea4\u53c9\u71b5\uff09\u548c\u4e00\u4e2a KL \u6563\u5ea6\u9879\uff0c\u540e\u8005\u5bf9\u6f5c\u5728\u7a7a\u95f4\u8fdb\u884c\u6b63\u5219\u5316\uff0c\u4f7f\u5176\u4fdd\u6301\u63a5\u8fd1\u6807\u51c6\u6b63\u6001\u5206\u5e03\u3002</p> </li> <li> <p>\u5c06\u6240\u6709\u6982\u5ff5\u8054\u7cfb\u8d77\u6765\uff1a\u71b5\u544a\u8bc9\u4f60\u4e00\u4e2a\u5206\u5e03\u5185\u5728\u7684\u4e0d\u786e\u5b9a\u6027\uff0c\u4ea4\u53c9\u71b5\u544a\u8bc9\u4f60\u7684\u6a21\u578b\u5bf9\u73b0\u5b9e\u7684\u8fd1\u4f3c\u7a0b\u5ea6\uff0c\u800c KL \u6563\u5ea6\u5219\u544a\u8bc9\u4f60\u4e24\u8005\u4e4b\u95f4\u7684\u5dee\u8ddd\u3002\u8fd9\u4e09\u4e2a\u91cf\u6784\u6210\u4e86\u73b0\u4ee3\u673a\u5668\u5b66\u4e60\u4f18\u5316\u7684\u57fa\u77f3\u3002</p> </li> </ul>"},{"location":"chapter%2005%3A%20probability/05.%20information%20theory/#colab-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ol> <li> <p>\u8ba1\u7b97\u5404\u79cd\u5206\u5e03\u7684\u71b5\uff0c\u5e76\u9a8c\u8bc1\u5728\u7ed9\u5b9a\u7ed3\u679c\u6570\u91cf\u4e0b\uff0c\u5747\u5300\u5206\u5e03\u7684\u71b5\u6700\u5927\u3002 <pre><code>import jax.numpy as jnp\n\ndef entropy(p):\n    \"\"\"\u4ee5\u6bd4\u7279\u4e3a\u5355\u4f4d\u8ba1\u7b97\u71b5\u3002\u8fc7\u6ee4\u6389\u6982\u7387\u4e3a\u96f6\u7684\u4e8b\u4ef6\u3002\"\"\"\n    p = p[p &gt; 0]\n    return -jnp.sum(p * jnp.log2(p))\n\n# \u516c\u5e73\u9ab0\u5b50\nfair = jnp.ones(6) / 6\nprint(f\"\u516c\u5e73\u9ab0\u5b50\u71b5:   {entropy(fair):.4f} \u6bd4\u7279 (\u6700\u5927 = log2(6) = {jnp.log2(6.):.4f})\")\n\n# \u704c\u94c5\u9ab0\u5b50\nloaded = jnp.array([0.1, 0.1, 0.1, 0.1, 0.1, 0.5])\nprint(f\"\u704c\u94c5\u9ab0\u5b50\u71b5: {entropy(loaded):.4f} \u6bd4\u7279\")\n\n# \u786e\u5b9a\u6027\ndet = jnp.array([0.0, 0.0, 0.0, 0.0, 0.0, 1.0])\nprint(f\"\u786e\u5b9a\u6027:      {entropy(det):.4f} \u6bd4\u7279\")\n\n# \u516c\u5e73\u786c\u5e01\ncoin = jnp.array([0.5, 0.5])\nprint(f\"\u516c\u5e73\u786c\u5e01\u71b5:  {entropy(coin):.4f} \u6bd4\u7279\")\n</code></pre></p> </li> <li> <p>\u8ba1\u7b97\u771f\u5b9e\u5206\u5e03\u4e0e\u591a\u4e2a\u8fd1\u4f3c\u5206\u5e03\u4e4b\u95f4\u7684\u4ea4\u53c9\u71b5\u548c KL \u6563\u5ea6\u3002\u9a8c\u8bc1 \\(D_{\\text{KL}}(p \\| q) = H(p, q) - H(p)\\)\u3002 <pre><code>import jax.numpy as jnp\n\ndef cross_entropy(p, q):\n    return -jnp.sum(p * jnp.log2(jnp.clip(q, 1e-10, 1.0)))\n\ndef kl_divergence(p, q):\n    mask = p &gt; 0\n    return jnp.sum(jnp.where(mask, p * jnp.log2(p / jnp.clip(q, 1e-10, 1.0)), 0.0))\n\ndef entropy(p):\n    p = p[p &gt; 0]\n    return -jnp.sum(p * jnp.log2(p))\n\np = jnp.array([0.4, 0.3, 0.2, 0.1])  # \u771f\u5b9e\u5206\u5e03\n\nfor name, q in [(\"\u5b8c\u5168\u5339\u914d\", p),\n                (\"\u8f7b\u5fae\u504f\u5dee\", jnp.array([0.35, 0.30, 0.25, 0.10])),\n                (\"\u4e25\u91cd\u504f\u5dee\", jnp.array([0.1, 0.1, 0.1, 0.7]))]:\n    h_p = entropy(p)\n    h_pq = cross_entropy(p, q)\n    kl = kl_divergence(p, q)\n    print(f\"{name:20s}: H(p)={h_p:.4f}, H(p,q)={h_pq:.4f}, \"\n          f\"KL={kl:.4f}, H(p,q)-H(p)={h_pq-h_p:.4f}\")\n</code></pre></p> </li> <li> <p>\u901a\u8fc7\u8ba1\u7b97\u4e24\u4e2a\u4e0d\u540c\u5206\u5e03\u4e4b\u95f4\u7684 \\(D_{\\text{KL}}(p \\| q)\\) \u548c \\(D_{\\text{KL}}(q \\| p)\\)\uff0c\u8bc1\u660e KL \u6563\u5ea6\u4e0d\u662f\u5bf9\u79f0\u7684\u3002 <pre><code>import jax.numpy as jnp\n\ndef kl_div(p, q):\n    mask = p &gt; 0\n    return float(jnp.sum(jnp.where(mask, p * jnp.log2(p / jnp.clip(q, 1e-10, 1.0)), 0.0)))\n\np = jnp.array([0.9, 0.1])\nq = jnp.array([0.5, 0.5])\n\nprint(f\"D_KL(p || q) = {kl_div(p, q):.4f}\")\nprint(f\"D_KL(q || p) = {kl_div(q, p):.4f}\")\nprint(\"\u4e0d\u76f8\u540c\uff01KL \u6563\u5ea6\u662f\u4e0d\u5bf9\u79f0\u7684\u3002\")\n</code></pre></p> </li> <li> <p>\u6a21\u62df\u8bad\u7ec3\u8fc7\u7a0b\u4e2d\u4ea4\u53c9\u71b5\u635f\u5931\u7684\u53d8\u5316\u3002\u521b\u5efa\u4e00\u4e2a\"\u771f\u5b9e\"\u7684 one-hot \u6807\u7b7e\uff0c\u5c55\u793a\u968f\u7740\u6a21\u578b\u9884\u6d4b\u6982\u7387\u7684\u6539\u5584\uff0c\u635f\u5931\u5982\u4f55\u4e0b\u964d\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u771f\u5b9e\u6807\u7b7e\uff1a4 \u4e2a\u7c7b\u522b\u4e2d\u7684\u7b2c 2 \u7c7b\ntrue_label = jnp.array([0, 0, 1, 0])\n\n# \u6a21\u62df\u9884\u6d4b\u9010\u6b65\u6539\u5584\nsteps = []\nlosses = []\nfor confidence in jnp.linspace(0.25, 0.99, 50):\n    # \u6a21\u578b\u5bf9\u7c7b\u522b 2 \u7684\u7f6e\u4fe1\u5ea6\u9010\u6e10\u63d0\u9ad8\n    remaining = (1 - confidence) / 3\n    pred = jnp.array([remaining, remaining, confidence, remaining])\n    loss = -jnp.sum(true_label * jnp.log(jnp.clip(pred, 1e-10, 1.0)))\n    steps.append(float(confidence))\n    losses.append(float(loss))\n\nplt.figure(figsize=(8, 4))\nplt.plot(steps, losses, color=\"#e74c3c\", linewidth=2)\nplt.xlabel(\"\u6a21\u578b\u5bf9\u771f\u5b9e\u7c7b\u522b\u7684\u7f6e\u4fe1\u5ea6\")\nplt.ylabel(\"\u4ea4\u53c9\u71b5\u635f\u5931\")\nplt.title(\"\u4ea4\u53c9\u71b5\u635f\u5931\u968f\u9884\u6d4b\u6539\u5584\u800c\u4e0b\u964d\")\nplt.grid(alpha=0.3)\nplt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2006%3A%20machine%20learning/01.%20classical%20machine%20learning/","title":"\u7ecf\u5178\u673a\u5668\u5b66\u4e60","text":"<p>\u7ecf\u5178\u673a\u5668\u5b66\u4e60\u7b97\u6cd5\u901a\u8fc7\u6570\u636e\u5b66\u4e60\u6a21\u5f0f\u800c\u65e0\u9700\u663e\u5f0f\u7f16\u7a0b\uff0c\u4f7f\u7528\u95ed\u5f0f\u89e3\u6216\u542f\u53d1\u5f0f\u641c\u7d22\u800c\u975e\u68af\u5ea6\u4e0b\u964d\u3002\u672c\u6587\u6db5\u76d6\u6734\u7d20\u8d1d\u53f6\u65af\u3001k-NN\u3001\u51b3\u7b56\u6811\u3001\u968f\u673a\u68ee\u6797\u3001\u652f\u6301\u5411\u91cf\u673a\u3001k-means\u805a\u7c7b\u548c\u4e3b\u6210\u5206\u5206\u6790</p> <ul> <li> <p>\u673a\u5668\u5b66\u4e60\u662f\u7814\u7a76\u7b97\u6cd5\u901a\u8fc7\u4ece\u6570\u636e\u4e2d\u5b66\u4e60\u6765\u63d0\u5347\u5176\u5728\u67d0\u9879\u4efb\u52a1\u4e0a\u8868\u73b0\u7684\u5b66\u79d1\uff0c\u800c\u975e\u901a\u8fc7\u663e\u5f0f\u89c4\u5219\u7f16\u7a0b\u3002\u4e0e\u5176\u7f16\u5199\"\u5982\u679c\u6536\u5165 &gt; 50k \u4e14\u5e74\u9f84 &lt; 30 \u5219\u6279\u51c6\u8d37\u6b3e\"\uff0c\u4e0d\u5982\u5c06\u6570\u5343\u6761\u5386\u53f2\u8d37\u6b3e\u51b3\u7b56\u4ea4\u7ed9\u7b97\u6cd5\uff0c\u8ba9\u5b83\u81ea\u884c\u627e\u51fa\u6a21\u5f0f\u3002</p> </li> <li> <p>\u5b58\u5728\u4e09\u5927\u8303\u5f0f\u3002\u76d1\u7763\u5b66\u4e60\u4f7f\u7528\u5e26\u6807\u7b7e\u6570\u636e\uff0c\u5373\u6bcf\u4e2a\u8f93\u5165\u90fd\u6709\u5df2\u77e5\u7684\u6b63\u786e\u8f93\u51fa\u3002\u7b97\u6cd5\u5b66\u4e60\u4ece\u8f93\u5165\u5230\u8f93\u51fa\u7684\u6620\u5c04\u3002\u65e0\u76d1\u7763\u5b66\u4e60\u5904\u7406\u672a\u6807\u7b7e\u6570\u636e\uff0c\u8bd5\u56fe\u53d1\u73b0\u9690\u85cf\u7ed3\u6784\uff0c\u5982\u805a\u7c7b\u6216\u538b\u7f29\u8868\u793a\u3002\u5f3a\u5316\u5b66\u4e60\u901a\u8fc7\u8bd5\u9519\u5b66\u4e60\uff0c\u6839\u636e\u5728\u73af\u5883\u4e2d\u91c7\u53d6\u7684\u52a8\u4f5c\u63a5\u6536\u5956\u52b1\u6216\u60e9\u7f5a\uff08\u5728\u7b2c04\u7bc7\u4e2d\u4ecb\u7ecd\uff09\u3002</p> </li> <li> <p>\u5728\u76d1\u7763\u5b66\u4e60\u4e2d\uff0c\u5206\u7c7b\u9884\u6d4b\u79bb\u6563\u7c7b\u522b\uff08\u5783\u573e\u90ae\u4ef6\u6216\u975e\u5783\u573e\u90ae\u4ef6\uff0c\u732b\u6216\u72d7\uff09\uff0c\u800c\u56de\u5f52\u9884\u6d4b\u8fde\u7eed\u503c\uff08\u623f\u4ef7\u3001\u660e\u5929\u6e29\u5ea6\uff09\u3002\u8fb9\u754c\u5e76\u4e0d\u603b\u662f\u6e05\u6670\uff1a\u903b\u8f91\u56de\u5f52\u867d\u7136\u540d\u4e3a\"\u56de\u5f52\"\uff0c\u4f46\u5b9e\u9645\u4e0a\u6267\u884c\u5206\u7c7b\u4efb\u52a1\u3002</p> </li> <li> <p>\u6982\u7387\u6a21\u578b\u4e2d\u7684\u4e00\u4e2a\u5173\u952e\u533a\u5206\u662f\u751f\u6210\u5f0f vs \u5224\u522b\u5f0f\u3002\u751f\u6210\u6a21\u578b\u5b66\u4e60\u8054\u5408\u5206\u5e03 \\(P(x, y)\\)\uff0c\u8fd9\u610f\u5473\u7740\u5b83\u7406\u89e3\u6570\u636e\u672c\u8eab\u7684\u751f\u6210\u65b9\u5f0f\u3002\u5b83\u80fd\u4ea7\u751f\u65b0\u6837\u672c\u3002\u5224\u522b\u6a21\u578b\u76f4\u63a5\u5b66\u4e60 \\(P(y \\mid x)\\)\uff0c\u4ec5\u5173\u6ce8\u7c7b\u522b\u4e4b\u95f4\u7684\u8fb9\u754c\u3002\u6734\u7d20\u8d1d\u53f6\u65af\u662f\u751f\u6210\u5f0f\u7684\uff1b\u903b\u8f91\u56de\u5f52\uff08\u7b2c02\u7bc7\uff09\u662f\u5224\u522b\u5f0f\u7684\u3002\u751f\u6210\u6a21\u578b\u66f4\u7075\u6d3b\u4f46\u66f4\u96be\u8bad\u7ec3\u597d\uff1b\u5224\u522b\u6a21\u578b\u5728\u6570\u636e\u5145\u8db3\u65f6\u901a\u5e38\u7ed9\u51fa\u66f4\u597d\u7684\u5206\u7c7b\u51c6\u786e\u7387\u3002</p> </li> <li> <p>\u6734\u7d20\u8d1d\u53f6\u65af\u662f\u6700\u7b80\u5355\u4e14\u6700\u6709\u6548\u7684\u5206\u7c7b\u5668\u4e4b\u4e00\u3002\u5b83\u76f4\u63a5\u5e94\u7528\u8d1d\u53f6\u65af\u5b9a\u7406\uff08\u6765\u81ea\u7b2c05\u7ae0\uff09\uff1a</p> </li> </ul> \\[P(C_k \\mid x) = \\frac{P(x \\mid C_k) \\, P(C_k)}{P(x)}\\] <ul> <li> <p>\"\u6734\u7d20\"\u4e4b\u5904\u5728\u4e8e\u4e00\u4e2a\u5f3a\u70c8\u7684\u72ec\u7acb\u6027\u5047\u8bbe\uff1a\u5b83\u5047\u8bbe\u7ed9\u5b9a\u7c7b\u522b\u540e\u6bcf\u4e2a\u7279\u5f81\u76f8\u4e92\u72ec\u7acb\u3002\u5982\u679c\u4f60\u6b63\u5728\u5c06\u7535\u5b50\u90ae\u4ef6\u5206\u7c7b\u4e3a\u5783\u573e\u90ae\u4ef6\uff0c\u6734\u7d20\u8d1d\u53f6\u65af\u5047\u8bbe\u4e00\u65e6\u4f60\u77e5\u9053\u90ae\u4ef6\u662f\u5783\u573e\u90ae\u4ef6\uff0c\u5355\u8bcd\"\u514d\u8d39\"\u7684\u51fa\u73b0\u544a\u8bc9\u4f60\u5173\u4e8e\u5355\u8bcd\"\u8d62\u5bb6\"\u662f\u5426\u51fa\u73b0\u7684\u4fe1\u606f\u4e3a\u96f6\u3002\u8fd9\u5728\u73b0\u5b9e\u4e2d\u51e0\u4e4e\u4ece\u4e0d\u6210\u7acb\uff0c\u4f46\u5206\u7c7b\u5668\u4ecd\u7136\u51fa\u5947\u5730\u597d\u7528\u3002</p> </li> <li> <p>\u7531\u4e8e \\(P(x)\\) \u5bf9\u6240\u6709\u7c7b\u522b\u90fd\u4e00\u6837\uff0c\u5206\u7c7b\u7b80\u5316\u4e3a\u9009\u62e9\u6700\u5927\u5316\u5206\u5b50\u7684\u7c7b\u522b\uff1a</p> </li> </ul> \\[\\hat{y} = \\arg\\max_{k} \\; P(C_k) \\prod_{i=1}^{n} P(x_i \\mid C_k)\\] <ul> <li> <p>\u5148\u9a8c \\(P(C_k)\\) \u5c31\u662f\u6bcf\u4e2a\u7c7b\u522b\u4e2d\u8bad\u7ec3\u6837\u672c\u7684\u6bd4\u4f8b\u3002\u4f3c\u7136 \\(P(x_i \\mid C_k)\\) \u53d6\u51b3\u4e8e\u7279\u5f81\u7684\u7c7b\u578b\uff0c\u4ece\u800c\u4ea7\u751f\u4e09\u79cd\u5e38\u89c1\u53d8\u4f53\u3002</p> </li> <li> <p>\u591a\u9879\u5f0f\u6734\u7d20\u8d1d\u53f6\u65af\u4e13\u4e3a\u8ba1\u6570\u6570\u636e\u8bbe\u8ba1\uff0c\u5982\u6587\u6863\u4e2d\u7684\u8bcd\u9891\u3002\u6bcf\u4e2a\u7279\u5f81 \\(x_i\\) \u8868\u793a\u5355\u8bcd \\(i\\) \u51fa\u73b0\u7684\u6b21\u6570\uff0c\u4f3c\u7136\u9075\u5faa\u591a\u9879\u5206\u5e03\u3002\u8fd9\u662f\u6587\u672c\u5206\u7c7b\u3001\u60c5\u611f\u5206\u6790\u548c\u5783\u573e\u90ae\u4ef6\u8fc7\u6ee4\u7684\u6807\u51c6\u9009\u62e9\u3002</p> </li> <li> <p>\u9ad8\u65af\u6734\u7d20\u8d1d\u53f6\u65af\u5047\u8bbe\u6bcf\u4e2a\u7279\u5f81\u5728\u6bcf\u4e2a\u7c7b\u522b\u5185\u670d\u4ece\u6b63\u6001\u5206\u5e03\u3002\u4f60\u4ece\u8bad\u7ec3\u6570\u636e\u4e2d\u4f30\u8ba1\u7279\u5f81 \\(i\\) \u5bf9\u7c7b\u522b \\(k\\) \u7684\u5747\u503c \\(\\mu_{ik}\\) \u548c\u65b9\u5dee \\(\\sigma_{ik}^2\\)\uff0c\u7136\u540e\u8ba1\u7b97\uff1a</p> </li> </ul> \\[P(x_i \\mid C_k) = \\frac{1}{\\sqrt{2\\pi\\sigma_{ik}^2}} \\exp\\!\\left(-\\frac{(x_i - \\mu_{ik})^2}{2\\sigma_{ik}^2}\\right)\\] <ul> <li>\u5f53\u7279\u5f81\u4e3a\u8fde\u7eed\u6d4b\u91cf\u503c\u65f6\uff0c\u5982\u8eab\u9ad8\u3001\u4f53\u91cd\u6216\u4f20\u611f\u5668\u8bfb\u6570\uff0c\u8fd9\u662f\u81ea\u7136\u7684\u9009\u62e9\u3002</li> </ul> <p></p> <ul> <li> <p>\u4f2f\u52aa\u5229\u6734\u7d20\u8d1d\u53f6\u65af\u5bf9\u4e8c\u5143\u7279\u5f81\u5efa\u6a21\uff1a\u6bcf\u4e2a\u7279\u5f81\u8981\u4e48\u5b58\u5728\uff081\uff09\u8981\u4e48\u4e0d\u5b58\u5728\uff080\uff09\u3002\u4f60\u4e0d\u518d\u7edf\u8ba1\u5355\u8bcd\u51fa\u73b0\u7684\u6b21\u6570\uff0c\u800c\u662f\u53ea\u8ddf\u8e2a\u5b83\u662f\u5426\u51fa\u73b0\u3002\u8fd9\u9002\u7528\u4e8e\u77ed\u6587\u672c\u6216\u4e8c\u5143\u7279\u5f81\u5411\u91cf\u3002</p> </li> <li> <p>\u4e00\u4e2a\u5b9e\u9645\u95ee\u9898\u662f\uff0c\u5f53\u67d0\u4e2a\u7279\u5f81\u503c\u5728\u8bad\u7ec3\u6570\u636e\u4e2d\u4ece\u672a\u4e0e\u67d0\u4e2a\u7c7b\u522b\u4e00\u8d77\u51fa\u73b0\u65f6\uff0c\u4f3c\u7136\u53d8\u4e3a\u96f6\uff0c\u7531\u4e8e\u6240\u6709\u6982\u7387\u76f8\u4e58\uff0c\u6574\u4e2a\u540e\u9a8c\u6982\u7387\u4e5f\u5f52\u96f6\u3002\u62c9\u666e\u62c9\u65af\u5e73\u6ed1\u901a\u8fc7\u4e3a\u6bcf\u4e2a\u7279\u5f81-\u7c7b\u522b\u7ec4\u5408\u6dfb\u52a0\u4e00\u4e2a\u5c0f\u8ba1\u6570\uff08\u901a\u5e38\u4e3a1\uff09\u6765\u89e3\u51b3\u8fd9\u4e2a\u95ee\u9898\uff1a</p> </li> </ul> \\[P(x_i \\mid C_k) = \\frac{\\text{count}(x_i, C_k) + \\alpha}{\\text{count}(C_k) + \\alpha \\cdot V}\\] <ul> <li> <p>\u8fd9\u91cc \\(\\alpha\\) \u662f\u5e73\u6ed1\u53c2\u6570\uff08\u901a\u5e38\u4e3a1\uff09\uff0c\\(V\\) \u662f\u8be5\u7279\u5f81\u7684\u53ef\u80fd\u53d6\u503c\u6570\u91cf\u3002\u8fd9\u786e\u4fdd\u4e86\u4efb\u4f55\u6982\u7387\u6c38\u8fdc\u4e0d\u4f1a\u7cbe\u786e\u4e3a\u96f6\u3002</p> </li> <li> <p>\u51b3\u7b56\u6811\u91c7\u7528\u4e86\u4e00\u79cd\u5b8c\u5168\u4e0d\u540c\u7684\u65b9\u6cd5\u3002\u5b83\u4e0d\u662f\u8ba1\u7b97\u6982\u7387\uff0c\u800c\u662f\u901a\u8fc7\u4e00\u7cfb\u5217\u7684\"\u662f/\u5426\"\u95ee\u9898\u6765\u5212\u5206\u7279\u5f81\u7a7a\u95f4\u3002\u60f3\u8c61\"\u4e8c\u5341\u95ee\"\u6e38\u620f\uff1a\u6bcf\u4e00\u6b65\uff0c\u4f60\u95ee\u4e00\u4e2a\u6700\u80fd\u7f29\u5c0f\u53ef\u80fd\u6027\u8303\u56f4\u7684\u95ee\u9898\u3002</p> </li> <li> <p>\u6811\u4ece\u6839\u8282\u70b9\u5f00\u59cb\uff0c\u5305\u542b\u6240\u6709\u8bad\u7ec3\u6837\u672c\u3002\u5728\u6bcf\u4e2a\u5185\u90e8\u8282\u70b9\uff0c\u5b83\u9009\u62e9\u4e00\u4e2a\u7279\u5f81\u548c\u4e00\u4e2a\u9608\u503c\u8fdb\u884c\u5206\u88c2\uff08\u4f8b\u5982\uff0c\"\u5e74\u9f84 &lt; 30\uff1f\"\uff09\u3002\u6837\u672c\u6839\u636e\u7b54\u6848\u5411\u5de6\u6216\u5411\u53f3\u6d41\u52a8\u3002\u8fd9\u4e00\u8fc7\u7a0b\u9012\u5f52\u8fdb\u884c\u76f4\u5230\u53f6\u8282\u70b9\uff0c\u53f6\u8282\u70b9\u4e2d\u5b58\u653e\u9884\u6d4b\u7ed3\u679c\uff1a\u5206\u7c7b\u4efb\u52a1\u4e2d\u7684\u591a\u6570\u7c7b\u522b\uff0c\u6216\u56de\u5f52\u4efb\u52a1\u4e2d\u7684\u5747\u503c\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u5173\u952e\u95ee\u9898\u662f\uff1a\u5e94\u8be5\u9009\u62e9\u54ea\u4e2a\u7279\u5f81\u8fdb\u884c\u5206\u88c2\uff1f\u4f60\u5e0c\u671b\u5206\u88c2\u4ea7\u751f\u6700\"\u7eaf\"\u7684\u5b50\u8282\u70b9\uff0c\u5373\u5927\u591a\u6570\u6837\u672c\u5c5e\u4e8e\u540c\u4e00\u7c7b\u522b\u3002\u8861\u91cf\u4e0d\u7eaf\u5ea6\u7684\u4e24\u79cd\u5e38\u7528\u6307\u6807\u662f\u57fa\u5c3c\u4e0d\u7eaf\u5ea6\u548c\u71b5\u3002</p> </li> <li> <p>\u57fa\u5c3c\u4e0d\u7eaf\u5ea6\u8861\u91cf\u7684\u662f\u5982\u679c\u6309\u7167\u8be5\u8282\u70b9\u4e2d\u7684\u5206\u5e03\u6807\u8bb0\uff0c\u968f\u673a\u9009\u62e9\u7684\u6837\u672c\u88ab\u9519\u8bef\u5206\u7c7b\u7684\u6982\u7387\uff1a</p> </li> </ul> \\[\\text{Gini}(S) = 1 - \\sum_{k=1}^{K} p_k^2\\] <ul> <li> <p>\u5982\u679c\u8282\u70b9\u5b8c\u5168\u7eaf\uff08\u5168\u90e8\u5c5e\u4e8e\u4e00\u4e2a\u7c7b\u522b\uff09\uff0c\u57fa\u5c3c\u503c\u4e3a0\u3002\u5982\u679c\u7c7b\u522b\u5b8c\u5168\u5e73\u8861\uff08\u6bd4\u5982\u4e24\u7c7b\u5404\u536050%\uff09\uff0c\u57fa\u5c3c\u503c\u8fbe\u5230\u6700\u5927\u503c0.5\u3002</p> </li> <li> <p>\u71b5\uff08\u6765\u81ea\u7b2c05\u7ae0\u7684\u4fe1\u606f\u8bba\u90e8\u5206\uff09\u8861\u91cf\u5e73\u5747\u60ca\u8bb6\u7a0b\u5ea6\uff1a</p> </li> </ul> \\[H(S) = -\\sum_{k=1}^{K} p_k \\log_2 p_k\\] <ul> <li> <p>\u7eaf\u8282\u70b9\u7684\u71b5\u4e3a0\u3002\u5b8c\u5168\u5e73\u8861\u7684\u4e8c\u5143\u8282\u70b9\u7684\u71b5\u4e3a1\u6bd4\u7279\u3002\u5b9e\u9645\u4e0a\uff0c\u57fa\u5c3c\u548c\u71b5\u4ea7\u751f\u7684\u6811\u975e\u5e38\u76f8\u4f3c\uff1b\u57fa\u5c3c\u8ba1\u7b97\u7a0d\u5feb\uff0c\u56e0\u4e3a\u5b83\u907f\u514d\u4e86\u5bf9\u6570\u8fd0\u7b97\u3002</p> </li> <li> <p>\u4fe1\u606f\u589e\u76ca\u662f\u7531\u4e00\u6b21\u5206\u88c2\u5e26\u6765\u7684\u4e0d\u7eaf\u5ea6\u964d\u4f4e\u3002\u5bf9\u4e8e\u5c06\u96c6\u5408 \\(S\\) \u5212\u5206\u4e3a\u5b50\u96c6 \\(S_L\\) \u548c \\(S_R\\) \u7684\u5206\u88c2\uff1a</p> </li> </ul> \\[\\text{IG}(S, \\text{split}) = H(S) - \\frac{|S_L|}{|S|} H(S_L) - \\frac{|S_R|}{|S|} H(S_R)\\] <ul> <li> <p>\u7b97\u6cd5\u5728\u6bcf\u4e00\u8282\u70b9\u8d2a\u5fc3\u5730\u9009\u62e9\u4fe1\u606f\u589e\u76ca\u6700\u9ad8\u7684\u5206\u88c2\u3002\u8fd9\u662f\u4e00\u79cd\u5c40\u90e8\u6700\u4f18\u7b56\u7565\uff0c\u800c\u975e\u5168\u5c40\u6700\u4f18\uff0c\u4f46\u5728\u5b9e\u8df5\u4e2d\u6548\u679c\u5f88\u597d\u3002</p> </li> <li> <p>\u56de\u5f52\u6811\u5de5\u4f5c\u539f\u7406\u76f8\u540c\uff0c\u4f46\u53f6\u5b50\u9884\u6d4b\u8fde\u7eed\u503c\uff08\u5230\u8fbe\u8be5\u53f6\u5b50\u7684\u6837\u672c\u7684\u5747\u503c\uff09\uff0c\u5206\u88c2\u51c6\u5219\u4f7f\u7528\u65b9\u5dee\u51cf\u5c11\u800c\u975e\u57fa\u5c3c\u6216\u71b5\u3002</p> </li> <li> <p>\u5982\u679c\u4e0d\u52a0\u7ea6\u675f\uff0c\u51b3\u7b56\u6811\u4f1a\u4e00\u76f4\u5206\u88c2\u76f4\u5230\u6bcf\u4e2a\u53f6\u5b50\u90fd\u7eaf\uff0c\u672c\u8d28\u4e0a\u662f\u5728\u8bb0\u5fc6\u8bad\u7ec3\u6570\u636e\u3002\u8fd9\u662f\u4e25\u91cd\u7684\u8fc7\u62df\u5408\u3002\u526a\u679d\u7528\u4e8e\u5e94\u5bf9\u8fd9\u4e00\u95ee\u9898\u3002\u9884\u526a\u679d\u5728\u6811\u751f\u957f\u4e4b\u524d\u8bbe\u7f6e\u9650\u5236\uff1a\u6700\u5927\u6df1\u5ea6\u3001\u6bcf\u4e2a\u53f6\u5b50\u7684\u6700\u5c11\u6837\u672c\u6570\u3001\u6216\u8fdb\u884c\u5206\u88c2\u7684\u6700\u5c0f\u4fe1\u606f\u589e\u76ca\u3002\u540e\u526a\u679d\u5148\u751f\u957f\u5b8c\u6574\u6811\uff0c\u7136\u540e\u79fb\u9664\u90a3\u4e9b\u4e0d\u80fd\u63d0\u5347\u9a8c\u8bc1\u96c6\u6027\u80fd\u7684\u5206\u652f\u3002</p> </li> <li> <p>\u5355\u4e2a\u51b3\u7b56\u6811\u6613\u4e8e\u89e3\u91ca\uff0c\u4f46\u5f80\u5f80\u4e0d\u7a33\u5b9a\uff1a\u6570\u636e\u7684\u5fae\u5c0f\u53d8\u5316\u53ef\u80fd\u5bfc\u81f4\u5b8c\u5168\u4e0d\u540c\u7684\u6811\u3002\u96c6\u6210\u65b9\u6cd5\u7ec4\u5408\u591a\u4e2a\u6a21\u578b\uff0c\u4ee5\u83b7\u5f97\u6bd4\u4efb\u4f55\u5355\u4e2a\u6a21\u578b\u66f4\u597d\u7684\u9884\u6d4b\u7ed3\u679c\u3002</p> </li> <li> <p>\u6838\u5fc3\u601d\u60f3\u662f\"\u7fa4\u4f17\u667a\u6167\"\u3002\u5982\u679c\u4f60\u95ee100\u4e2a\u5e73\u5eb8\u7684\u5206\u7c7b\u5668\u7136\u540e\u8fdb\u884c\u591a\u6570\u6295\u7968\uff0c\u53ea\u8981\u5404\u4e2a\u5206\u7c7b\u5668\u505a\u51fa\u4e00\u5b9a\u7a0b\u5ea6\u4e0a\u72ec\u7acb\u7684\u9519\u8bef\uff0c\u96c6\u6210\u7ed3\u679c\u53ef\u4ee5\u975e\u5e38\u51fa\u8272\u3002</p> </li> <li> <p>Bagging\uff08\u81ea\u52a9\u6c47\u805a\u6cd5\uff09\u5728\u6570\u636e\u7684\u4e0d\u540c\u968f\u673a\u5b50\u96c6\u4e0a\u8bad\u7ec3\u591a\u4e2a\u6a21\u578b\uff0c\u91c7\u7528\u6709\u653e\u56de\u62bd\u6837\uff08bootstrap\u6837\u672c\uff09\u3002\u6bcf\u4e2a\u6a21\u578b\u5927\u7ea6\u770b\u5230\u539f\u59cb\u6570\u636e\u768463%\u3002\u5728\u9884\u6d4b\u65f6\uff0c\u4f60\u5bf9\u8f93\u51fa\u53d6\u5e73\u5747\uff08\u56de\u5f52\uff09\u6216\u8fdb\u884c\u591a\u6570\u6295\u7968\uff08\u5206\u7c7b\uff09\u3002\u7531\u4e8e\u6bcf\u4e2a\u6a21\u578b\u770b\u5230\u4e0d\u540c\u7684\u6570\u636e\uff0c\u5b83\u4eec\u72af\u4e0d\u540c\u7684\u9519\u8bef\uff0c\u5e73\u5747\u64cd\u4f5c\u62b5\u6d88\u4e86\u5927\u90e8\u5206\u65b9\u5dee\u3002</p> </li> <li> <p>\u968f\u673a\u68ee\u6797\u662f\u5c06bagging\u5e94\u7528\u4e8e\u51b3\u7b56\u6811\u5e76\u589e\u52a0\u4e00\u4e2a\u989d\u5916\u6280\u5de7\uff1a\u5728\u6bcf\u4e2a\u5206\u88c2\u5904\uff0c\u6811\u53ea\u8003\u8651\u4e00\u4e2a\u968f\u673a\u7684\u7279\u5f81\u5b50\u96c6\uff08\u901a\u5e38\u662f\u4ece \\(d\\) \u4e2a\u603b\u7279\u5f81\u4e2d\u9009 \\(\\sqrt{d}\\) \u4e2a\uff09\u3002\u8fd9\u8fdb\u4e00\u6b65\u53bb\u9664\u4e86\u6811\u4e4b\u95f4\u7684\u76f8\u5173\u6027\uff0c\u4f7f\u96c6\u6210\u66f4\u5f3a\u5927\u3002\u968f\u673a\u68ee\u6797\u662f\u6574\u4e2a\u673a\u5668\u5b66\u4e60\u4e2d\u6700\u53ef\u9760\u7684\u73b0\u6210\u5206\u7c7b\u5668\u4e4b\u4e00\u3002</p> </li> </ul> <p></p> <ul> <li> <p>Boosting\u91c7\u53d6\u4e86\u76f8\u53cd\u7684\u54f2\u5b66\u3002\u5b83\u4e0d\u662f\u72ec\u7acb\u5730\u8bad\u7ec3\u6a21\u578b\uff0c\u800c\u662f\u987a\u5e8f\u5730\u8bad\u7ec3\uff0c\u6bcf\u4e2a\u65b0\u6a21\u578b\u4e13\u6ce8\u4e8e\u4e4b\u524d\u6a21\u578b\u5206\u7c7b\u9519\u8bef\u7684\u6837\u672c\u3002</p> </li> <li> <p>AdaBoost\uff08\u81ea\u9002\u5e94\u63d0\u5347\uff09\u4e3a\u6bcf\u4e2a\u8bad\u7ec3\u6837\u672c\u7ef4\u62a4\u4e00\u4e2a\u6743\u91cd\u3002\u6700\u521d\u6240\u6709\u6743\u91cd\u76f8\u7b49\u3002\u8bad\u7ec3\u4e00\u4e2a\u5f31\u5b66\u4e60\u5668\uff08\u901a\u5e38\u662f\u6df1\u5ea6\u5f88\u6d45\u7684\u51b3\u7b56\u6811\uff0c\u79f0\u4e3a\"\u6869\"\uff09\u540e\uff0c\u88ab\u9519\u8bef\u5206\u7c7b\u7684\u6837\u672c\u83b7\u5f97\u66f4\u9ad8\u7684\u6743\u91cd\uff0c\u56e0\u6b64\u4e0b\u4e00\u4e2a\u5b66\u4e60\u5668\u66f4\u52a0\u5173\u6ce8\u5b83\u4eec\u3002\u6700\u7ec8\u9884\u6d4b\u662f\u6240\u6709\u5b66\u4e60\u5668\u7684\u52a0\u6743\u6295\u7968\uff0c\u8868\u73b0\u66f4\u597d\u7684\u5b66\u4e60\u5668\u62e5\u6709\u66f4\u5927\u7684\u53d1\u8a00\u6743\uff1a</p> </li> </ul> \\[H(x) = \\text{sign}\\!\\left(\\sum_{t=1}^{T} \\alpha_t \\, h_t(x)\\right)\\] <ul> <li>\u5b66\u4e60\u5668 \\(t\\) \u7684\u6743\u91cd \\(\\alpha_t\\) \u53d6\u51b3\u4e8e\u5176\u9519\u8bef\u7387 \\(\\epsilon_t\\)\uff1a</li> </ul> \\[\\alpha_t = \\frac{1}{2} \\ln\\!\\left(\\frac{1 - \\epsilon_t}{\\epsilon_t}\\right)\\] <ul> <li> <p>\u9519\u8bef\u7387\u4f4e\u7684\u5b66\u4e60\u5668\u83b7\u5f97\u5927\u7684\u6b63\u6743\u91cd\uff1b\u8868\u73b0\u4e0e\u968f\u673a\u6c34\u5e73\u6301\u5e73\uff08\\(\\epsilon = 0.5\\)\uff09\u7684\u5b66\u4e60\u5668\u83b7\u5f97\u96f6\u6743\u91cd\u3002</p> </li> <li> <p>\u68af\u5ea6\u63d0\u5347\u63a8\u5e7f\u4e86\u8fd9\u4e00\u601d\u60f3\u3002\u4e0d\u540c\u4e8e\u91cd\u65b0\u52a0\u6743\u6837\u672c\uff0c\u6bcf\u4e2a\u65b0\u6a21\u578b\u88ab\u8bad\u7ec3\u6765\u9884\u6d4b\u5f53\u524d\u96c6\u6210\u6574\u4f53\u7684\u6b8b\u5dee\u8bef\u5dee\uff08\u635f\u5931\u51fd\u6570\u7684\u8d1f\u68af\u5ea6\uff09\u3002\u5bf9\u4e8e\u5e73\u65b9\u8bef\u5dee\u635f\u5931\uff0c\u6b8b\u5dee\u5c31\u662f\u9884\u6d4b\u503c\u4e0e\u76ee\u6807\u503c\u4e4b\u95f4\u7684\u5dee\u503c\u3002\u57fa\u4e8e\u51b3\u7b56\u6811\u7684\u68af\u5ea6\u63d0\u5347\uff08GBDT\uff09\u662f\u7ed3\u6784\u5316\u6570\u636e\u7ade\u8d5b\u4e2d\u8bb8\u591a\u83b7\u80dc\u65b9\u6848\u80cc\u540e\u7684\u65b9\u6cd5\uff08XGBoost\u3001LightGBM\u3001CatBoost\u662f\u6d41\u884c\u7684\u5b9e\u73b0\uff09\u3002</p> </li> <li> <p>\u5173\u952e\u5bf9\u6bd4\uff1abagging\u964d\u4f4e\u65b9\u5dee\uff08\u901a\u8fc7\u5e73\u5747\u6d88\u9664\u566a\u58f0\uff09\uff0c\u800cboosting\u964d\u4f4e\u504f\u5dee\uff08\u7ea0\u6b63\u7cfb\u7edf\u6027\u9519\u8bef\uff09\u3002Bagging\u5728\u4e2a\u522b\u6a21\u578b\u8fc7\u62df\u5408\u65f6\u6548\u679c\u6700\u597d\uff1bboosting\u5728\u6a21\u578b\u6b20\u62df\u5408\u65f6\u6548\u679c\u6700\u597d\u3002</p> </li> <li> <p>\u8f6c\u5411\u65e0\u76d1\u7763\u5b66\u4e60\uff0cK-Means\u805a\u7c7b\u662f\u6700\u7b80\u5355\u4e14\u4f7f\u7528\u6700\u5e7f\u6cdb\u7684\u805a\u7c7b\u7b97\u6cd5\u3002\u7ed9\u5b9a \\(n\\) \u4e2a\u6570\u636e\u70b9\u548c\u76ee\u6807\u805a\u7c7b\u6570 \\(K\\)\uff0c\u5b83\u901a\u8fc7\u6700\u5c0f\u5316\u6bcf\u4e2a\u70b9\u5230\u5176\u805a\u7c7b\u4e2d\u5fc3\u7684\u8ddd\u79bb\u603b\u548c\uff0c\u5c06\u6bcf\u4e2a\u70b9\u5206\u914d\u7ed9 \\(K\\) \u4e2a\u7ec4\u4e4b\u4e00\u3002</p> </li> <li> <p>\u7b97\u6cd5\u4ea4\u66ff\u8fdb\u884c\u4e24\u4e2a\u6b65\u9aa4\u3002\u9996\u5148\uff0c\u5c06\u6bcf\u4e2a\u70b9\u5206\u914d\u5230\u6700\u8fd1\u7684\u4e2d\u5fc3\u70b9\u3002\u5176\u6b21\uff0c\u5c06\u6bcf\u4e2a\u4e2d\u5fc3\u70b9\u66f4\u65b0\u4e3a\u5206\u914d\u7ed9\u5b83\u7684\u6240\u6709\u70b9\u7684\u5747\u503c\u3002\u91cd\u590d\u76f4\u5230\u5206\u914d\u4e0d\u518d\u53d8\u5316\u3002\u8fd9\u4fdd\u8bc1\u6536\u655b\uff0c\u56e0\u4e3a\u6bcf\u4e00\u6b65\u603b\u7c07\u5185\u8ddd\u79bb\u90fd\u4f1a\u51cf\u5c0f\uff08\u6216\u4fdd\u6301\u4e0d\u53d8\uff09\u3002</p> </li> </ul> <p></p> <ul> <li>\u5f62\u5f0f\u4e0a\uff0cK-Means\u6700\u5c0f\u5316\u7c07\u5185\u5e73\u65b9\u548c\uff0c\u79f0\u4e3a\u60ef\u6027\uff1a</li> </ul> \\[J = \\sum_{k=1}^{K} \\sum_{x \\in C_k} \\|x - \\mu_k\\|^2\\] <ul> <li> <p>\u5176\u4e2d \\(\\mu_k\\) \u662f\u7c07 \\(C_k\\) \u7684\u4e2d\u5fc3\u70b9\u3002</p> </li> <li> <p>K-Means\u5bf9\u521d\u59cb\u5316\u654f\u611f\u3002\u7cdf\u7cd5\u7684\u8d77\u59cb\u4e2d\u5fc3\u70b9\u53ef\u80fd\u5bfc\u81f4\u8f83\u5dee\u7684\u5c40\u90e8\u6700\u5c0f\u503c\u3002K-Means++ \u521d\u59cb\u5316\u7b56\u7565\u9996\u5148\u968f\u673a\u9009\u62e9\u4e00\u4e2a\u4e2d\u5fc3\u70b9\uff0c\u7136\u540e\u6bcf\u4e2a\u540e\u7eed\u4e2d\u5fc3\u70b9\u7684\u9009\u62e9\u6982\u7387\u4e0e\u5176\u8ddd\u79bb\u6700\u8fd1\u73b0\u6709\u4e2d\u5fc3\u70b9\u7684\u5e73\u65b9\u8ddd\u79bb\u6210\u6b63\u6bd4\u3002\u8fd9\u5206\u6563\u4e86\u521d\u59cb\u4e2d\u5fc3\u70b9\uff0c\u51e0\u4e4e\u603b\u662f\u80fd\u7ed9\u51fa\u66f4\u597d\u7684\u7ed3\u679c\u3002</p> </li> <li> <p>\u5982\u4f55\u9009\u62e9 \\(K\\)\uff1f\u4e24\u79cd\u5e38\u7528\u5de5\u5177\u3002\u8098\u90e8\u6cd5\u7ed8\u5236\u60ef\u6027\u968f \\(K\\) \u53d8\u5316\u7684\u66f2\u7ebf\uff0c\u5bfb\u627e\"\u8098\u90e8\"\u2014\u2014\u589e\u52a0\u66f4\u591a\u7c07\u4e0d\u518d\u663e\u8457\u5e2e\u52a9\u7684\u70b9\u3002\u8f6e\u5ed3\u7cfb\u6570\u8861\u91cf\u4e00\u4e2a\u70b9\u4e0e\u5176\u81ea\u8eab\u7c07\u7684\u76f8\u4f3c\u5ea6\u76f8\u5bf9\u4e8e\u6700\u8fd1\u5176\u4ed6\u7c07\u7684\u76f8\u4f3c\u5ea6\uff0c\u8303\u56f4\u4ece-1\uff08\u9519\u8bef\u7c07\uff09\u5230+1\uff08\u826f\u597d\u805a\u7c7b\uff09\u3002\u6240\u6709\u70b9\u7684\u5e73\u5747\u8f6e\u5ed3\u7cfb\u6570\u7ed9\u51fa\u4e86\u805a\u7c7b\u8d28\u91cf\u7684\u6574\u4f53\u8861\u91cf\u3002</p> </li> <li> <p>K-Means\u6709\u5c40\u9650\u6027\uff1a\u5b83\u5047\u8bbe\u5927\u81f4\u76f8\u7b49\u5927\u5c0f\u7684\u7403\u5f62\u7c07\uff0c\u5e76\u4e14\u5b83\u505a\u51fa\"\u786c\"\u5206\u914d\uff08\u6bcf\u4e2a\u70b9\u6070\u597d\u5c5e\u4e8e\u4e00\u4e2a\u7c07\uff09\u3002\u9ad8\u65af\u6df7\u5408\u6a21\u578b\uff08GMM\uff09 \u653e\u677e\u4e86\u8fd9\u4e24\u4e2a\u9650\u5236\u3002</p> </li> <li> <p>GMM\u5c06\u6570\u636e\u5efa\u6a21\u4e3a \\(K\\) \u4e2a\u9ad8\u65af\u5206\u5e03\u7684\u6df7\u5408\uff0c\u6bcf\u4e2a\u5206\u5e03\u6709\u81ea\u5df1\u7684\u5747\u503c \\(\\mu_k\\)\u3001\u534f\u65b9\u5dee \\(\\Sigma_k\\) \u548c\u6df7\u5408\u6743\u91cd \\(\\pi_k\\)\uff08\u6240\u6709\u6743\u91cd\u4e4b\u548c\u4e3a1\uff09\uff1a</p> </li> </ul> \\[P(x) = \\sum_{k=1}^{K} \\pi_k \\, \\mathcal{N}(x \\mid \\mu_k, \\Sigma_k)\\] <ul> <li> <p>\u4e0d\u540c\u4e8e\u786c\u5206\u914d\uff0c\u6bcf\u4e2a\u70b9\u5f97\u5230\u4e00\u4e2a\u8f6f\u5206\u914d\uff1a\u5b83\u5c5e\u4e8e\u6bcf\u4e2a\u7c07\u7684\u6982\u7387\uff08\u79f0\u4e3a\"\u8d23\u4efb\"\uff09\u3002\u4f4d\u4e8e\u4e24\u4e2a\u9ad8\u65af\u8fb9\u754c\u9644\u8fd1\u7684\u70b9\u53ef\u80fd\u662f60%\u5c5e\u4e8e\u7c07A\uff0c40%\u5c5e\u4e8e\u7c07B\u3002</p> </li> <li> <p>GMM\u4f7f\u7528\u671f\u671b-\u6700\u5927\u5316\uff08EM\uff09\u7b97\u6cd5\u8fdb\u884c\u62df\u5408\uff0c\u8be5\u7b97\u6cd5\u4ea4\u66ff\u4e24\u4e2a\u6b65\u9aa4\uff0c\u4e0eK-Means\u975e\u5e38\u7c7b\u4f3c\u3002E\u6b65\u8ba1\u7b97\u8d23\u4efb\uff1a\u5bf9\u4e8e\u6bcf\u4e2a\u70b9\uff0c\u5b83\u6765\u81ea\u6bcf\u4e2a\u9ad8\u65af\u7684\u6982\u7387\u662f\u591a\u5c11\uff1fM\u6b65\u66f4\u65b0\u53c2\u6570\uff1a\u7ed9\u5b9a\u8d23\u4efb\uff0c\u6700\u4f73\u7684\u5747\u503c\u3001\u534f\u65b9\u5dee\u548c\u6df7\u5408\u6743\u91cd\u662f\u4ec0\u4e48\uff1fEM\u4fdd\u8bc1\u6bcf\u6b21\u8fed\u4ee3\u589e\u52a0\u6570\u636e\u4f3c\u7136\uff0c\u5e76\u6536\u655b\u5230\u5c40\u90e8\u6700\u5927\u503c\u3002</p> </li> <li> <p>K-Means\u5b9e\u9645\u4e0a\u662fGMM\u7684EM\u7b97\u6cd5\u7684\u4e00\u4e2a\u7279\u4f8b\uff1a\u5b83\u5bf9\u5e94\u4e8e\u5177\u6709\u76f8\u7b49\u534f\u65b9\u5dee\u7684\u7403\u5f62\u9ad8\u65af\u548c\u786c\uff080/1\uff09\u8d23\u4efb\u5206\u914d\u3002</p> </li> <li> <p>\u652f\u6301\u5411\u91cf\u673a\uff08SVM\uff09 \u4ece\u51e0\u4f55\u89c6\u89d2\u5904\u7406\u5206\u7c7b\u95ee\u9898\u3002\u7ed9\u5b9a\u4e24\u4e2a\u7ebf\u6027\u53ef\u5206\u7684\u7c7b\u522b\uff0c\u5b58\u5728\u65e0\u9650\u591a\u4e2a\u8d85\u5e73\u9762\u53ef\u4ee5\u5c06\u5b83\u4eec\u5206\u5f00\u3002SVM\u627e\u5230\u6700\u5927\u95f4\u9694\u7684\u90a3\u4e2a\u2014\u2014\u8d85\u5e73\u9762\u4e0e\u6bcf\u4e2a\u7c7b\u522b\u6700\u8fd1\u6570\u636e\u70b9\u4e4b\u95f4\u7684\u6700\u5927\u53ef\u80fd\u95f4\u9699\u3002</p> </li> <li> <p>\u6700\u8fd1\u7684\u70b9\uff0c\u5373\u6070\u597d\u4f4d\u4e8e\u95f4\u9694\u8fb9\u7f18\u7684\u70b9\uff0c\u79f0\u4e3a\u652f\u6301\u5411\u91cf\u3002\u5b83\u4eec\u662f\u5b9a\u4e49\u51b3\u7b56\u8fb9\u754c\u552f\u4e00\u91cd\u8981\u7684\u70b9\uff1b\u4f60\u53ef\u4ee5\u79fb\u9664\u6240\u6709\u5176\u4ed6\u8bad\u7ec3\u70b9\uff0c\u4ecd\u7136\u5f97\u5230\u76f8\u540c\u7684\u8d85\u5e73\u9762\u3002</p> </li> </ul> <p></p> <ul> <li>\u5bf9\u4e8e\u7ebf\u6027\u5206\u7c7b\u5668 \\(f(x) = w \\cdot x + b\\)\uff0c\u627e\u5230\u6700\u5927\u95f4\u9694\u7b49\u4ef7\u4e8e\u6c42\u89e3\uff1a</li> </ul> \\[\\min_{w, b} \\; \\frac{1}{2}\\|w\\|^2 \\quad \\text{subject to} \\quad y_i(w \\cdot x_i + b) \\geq 1 \\; \\text{for all } i\\] <ul> <li> <p>\u8fd9\u662f\u4e00\u4e2a\u51f8\u4e8c\u6b21\u89c4\u5212\u95ee\u9898\uff0c\u56e0\u6b64\u6709\u552f\u4e00\u7684\u5168\u5c40\u89e3\uff08\u65e0\u9700\u62c5\u5fc3\u5c40\u90e8\u6700\u5c0f\u503c\uff09\u3002</p> </li> <li> <p>\u771f\u5b9e\u6570\u636e\u5f88\u5c11\u5b8c\u7f8e\u53ef\u5206\u3002\u8f6f\u95f4\u9694SVM \u901a\u8fc7\u5f15\u5165\u677e\u5f1b\u53d8\u91cf \\(\\xi_i \\geq 0\\) \u5141\u8bb8\u4e00\u4e9b\u70b9\u8fdd\u53cd\u95f4\u9694\uff1a</p> </li> </ul> \\[\\min_{w, b, \\xi} \\; \\frac{1}{2}\\|w\\|^2 + C \\sum_{i=1}^{n} \\xi_i \\quad \\text{subject to} \\quad y_i(w \\cdot x_i + b) \\geq 1 - \\xi_i\\] <ul> <li> <p>\u8d85\u53c2\u6570 \\(C\\) \u63a7\u5236\u6743\u8861\uff1a\u5927\u7684 \\(C\\) \u5bf9\u9519\u8bef\u5206\u7c7b\u65bd\u52a0\u9ad8\u60e9\u7f5a\uff08\u66f4\u7d27\u7684\u62df\u5408\uff0c\u6709\u8fc7\u62df\u5408\u98ce\u9669\uff09\uff0c\u5c0f\u7684 \\(C\\) \u5141\u8bb8\u66f4\u591a\u8fdd\u89c4\uff08\u66f4\u5bbd\u7684\u95f4\u9694\uff0c\u66f4\u5f3a\u7684\u6b63\u5219\u5316\uff09\u3002</p> </li> <li> <p>SVM\u6700\u5f3a\u5927\u7684\u7279\u6027\u662f\u6838\u6280\u5de7\u3002\u8bb8\u591a\u5728\u539f\u59cb\u7279\u5f81\u7a7a\u95f4\u4e2d\u4e0d\u662f\u7ebf\u6027\u53ef\u5206\u7684\u6570\u636e\u96c6\uff0c\u5728\u6620\u5c04\u5230\u9ad8\u7ef4\u7a7a\u95f4\u540e\u53d8\u5f97\u53ef\u5206\u3002\u6838\u6280\u5de7\u8ba9\u4f60\u80fd\u591f\u5728\u90a3\u4e2a\u9ad8\u7ef4\u7a7a\u95f4\u4e2d\u8ba1\u7b97\u70b9\u79ef\uff0c\u800c\u65e0\u9700\u663e\u5f0f\u8ba1\u7b97\u53d8\u6362\u3002</p> </li> <li> <p>\u6838\u51fd\u6570 \\(K(x_i, x_j) = \\phi(x_i) \\cdot \\phi(x_j)\\) \u66ff\u6362SVM\u4f18\u5316\u4e2d\u7684\u6bcf\u4e2a\u70b9\u79ef\u3002\u6700\u6d41\u884c\u7684\u6838\u662f\u5f84\u5411\u57fa\u51fd\u6570\uff08RBF\uff09\u6838\uff1a</p> </li> </ul> \\[K(x_i, x_j) = \\exp\\!\\left(-\\gamma \\|x_i - x_j\\|^2\\right)\\] <ul> <li> <p>RBF\u6838\u9690\u5f0f\u5730\u5c06\u6570\u636e\u6620\u5c04\u5230\u65e0\u9650\u7ef4\u7a7a\u95f4\u3002\u53c2\u6570 \\(\\gamma\\) \u63a7\u5236\u5355\u4e2a\u8bad\u7ec3\u70b9\u7684\u5f71\u54cd\u8303\u56f4\uff1a\u5927\u7684 \\(\\gamma\\) \u610f\u5473\u7740\u6bcf\u4e2a\u70b9\u53ea\u5f71\u54cd\u5176\u7d27\u90bb\u533a\u57df\uff08\u8fc7\u62df\u5408\u98ce\u9669\uff09\uff0c\u5c0f\u7684 \\(\\gamma\\) \u7ed9\u51fa\u66f4\u5e73\u6ed1\u7684\u8fb9\u754c\u3002</p> </li> <li> <p>\u5176\u4ed6\u5e38\u89c1\u6838\u5305\u62ec\u591a\u9879\u5f0f\u6838 \\(K(x_i, x_j) = (x_i \\cdot x_j + c)^d\\) \u548c\u7ebf\u6027\u6838 \\(K(x_i, x_j) = x_i \\cdot x_j\\)\uff08\u5373\u6ca1\u6709\u4efb\u4f55\u53d8\u6362\u7684\u6807\u51c6SVM\uff09\u3002</p> </li> <li> <p>\u5b9e\u9645\u4e0a\uff0c\u5e26RBF\u6838\u7684SVM\u5728\u6df1\u5ea6\u5b66\u4e60\u51fa\u73b0\u4e4b\u524d\u662f\u4e3b\u5bfc\u5206\u7c7b\u5668\u3002\u5b83\u4eec\u5728\u4e2d\u5c0f\u89c4\u6a21\u6570\u636e\u96c6\u4e0a\u4ecd\u7136\u8868\u73b0\u826f\u597d\uff0c\u7279\u522b\u662f\u5f53\u7279\u5f81\u6570\u91cf\u76f8\u5bf9\u4e8e\u6837\u672c\u6570\u91cf\u8f83\u5927\u65f6\u3002</p> </li> <li> <p>SVM\u4e0e\u7b2c02\u7ae0\uff08\u77e9\u9635\uff09\u7684\u8054\u7cfb\u5f88\u6df1\u3002\u4f18\u5316\u901a\u5e38\u4ee5\u5176\u5bf9\u5076\u5f62\u5f0f\u6c42\u89e3\uff0c\u5176\u4e2d\u89e3\u4ec5\u4f9d\u8d56\u4e8e\u8bad\u7ec3\u6837\u672c\u4e4b\u95f4\u7684\u70b9\u79ef\u2014\u2014\u8fd9\u6b63\u662f\u4f7f\u6838\u6280\u5de7\u6210\u4e3a\u53ef\u80fd\u7684\u539f\u56e0\u3002\u6574\u4e2a\u7b97\u6cd5\u4ee5\u5185\u79ef\u548c\u7ebf\u6027\u4ee3\u6570\u7684\u8bed\u8a00\u8fd0\u4f5c\u3002</p> </li> <li> <p>\u6c47\u603b\u7ecf\u5178ML\u5de5\u5177\u7bb1\uff1a</p> </li> </ul> \u7b97\u6cd5 \u7c7b\u578b \u5173\u952e\u4f18\u52bf \u5173\u952e\u52a3\u52bf \u6734\u7d20\u8d1d\u53f6\u65af \u76d1\u7763\uff08\u751f\u6210\u5f0f\uff09 \u5feb\u901f\uff0c\u5c11\u91cf\u6570\u636e\u5373\u53ef\u5de5\u4f5c \u72ec\u7acb\u6027\u5047\u8bbe \u51b3\u7b56\u6811 \u76d1\u7763 \u53ef\u89e3\u91ca \u5bb9\u6613\u8fc7\u62df\u5408 \u968f\u673a\u68ee\u6797 \u76d1\u7763\uff08\u96c6\u6210\uff09 \u7a33\u5065\uff0c\u8d85\u53c2\u6570\u5c11 \u53ef\u89e3\u91ca\u6027\u8f83\u5dee \u68af\u5ea6\u63d0\u5347 \u76d1\u7763\uff08\u96c6\u6210\uff09 \u8868\u683c\u6570\u636e\u4e0a\u7684\u6700\u4f18\u6c34\u5e73 \u8f83\u6162\uff0c\u8c03\u53c2\u66f4\u591a K-Means \u65e0\u76d1\u7763\uff08\u805a\u7c7b\uff09 \u7b80\u5355\uff0c\u53ef\u6269\u5c55 \u5047\u8bbe\u7403\u5f62\u7c07 GMM \u65e0\u76d1\u7763\uff08\u805a\u7c7b\uff09 \u8f6f\u5206\u914d\uff0c\u5f62\u72b6\u7075\u6d3b \u5bf9\u521d\u59cb\u5316\u654f\u611f SVM \u76d1\u7763 \u9ad8\u7ef4\u6709\u6548 \u5927\u6570\u636e\u96c6\u4e0a\u6162"},{"location":"chapter%2006%3A%20machine%20learning/01.%20classical%20machine%20learning/#colab","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u5728CoLab\u6216\u7b14\u8bb0\u672c\u4e2d\u5b8c\u6210\uff09","text":"<ol> <li> <p>\u4ece\u5934\u5b9e\u73b0\u9ad8\u65af\u6734\u7d20\u8d1d\u53f6\u65af\u3002\u5728\u5408\u6210\u4e8c\u7ef4\u6570\u636e\uff08\u4e24\u4e2a\u7c7b\u522b\uff09\u4e0a\u8bad\u7ec3\u5e76\u53ef\u89c6\u5316\u51b3\u7b56\u8fb9\u754c\u3002\u4e0escikit-learn\u7684\u5b9e\u73b0\u8fdb\u884c\u6bd4\u8f83\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\nfrom sklearn.datasets import make_classification\n\n# \u751f\u6210\u5408\u6210\u6570\u636e\nX, y = make_classification(n_samples=300, n_features=2, n_redundant=0,\n                           n_informative=2, n_clusters_per_class=1, random_state=42)\nX, y = jnp.array(X), jnp.array(y)\n\n# \u4ece\u5934\u62df\u5408\u9ad8\u65af\u6734\u7d20\u8d1d\u53f6\u65af\nclasses = jnp.unique(y)\nparams = {}\nfor c in classes:\n    c = int(c)\n    mask = y == c\n    X_c = X[mask]\n    params[c] = {\n        'mean': jnp.mean(X_c, axis=0),\n        'var': jnp.var(X_c, axis=0),\n        'prior': jnp.sum(mask) / len(y)\n    }\n\ndef gaussian_log_likelihood(x, mean, var):\n    return -0.5 * jnp.sum(jnp.log(2 * jnp.pi * var) + (x - mean)**2 / var)\n\ndef predict(X):\n    preds = []\n    for x in X:\n        log_posts = []\n        for c in [0, 1]:\n            log_post = jnp.log(params[c]['prior']) + gaussian_log_likelihood(\n                x, params[c]['mean'], params[c]['var'])\n            log_posts.append(log_post)\n        preds.append(jnp.argmax(jnp.array(log_posts)))\n    return jnp.array(preds)\n\n# \u51b3\u7b56\u8fb9\u754c\u53ef\u89c6\u5316\nxx, yy = jnp.meshgrid(jnp.linspace(X[:,0].min()-1, X[:,0].max()+1, 200),\n                       jnp.linspace(X[:,1].min()-1, X[:,1].max()+1, 200))\ngrid = jnp.column_stack([xx.ravel(), yy.ravel()])\nzz = predict(grid).reshape(xx.shape)\n\nplt.figure(figsize=(8, 6))\nplt.contourf(xx, yy, zz, alpha=0.3, cmap='coolwarm')\nplt.scatter(X[y==0, 0], X[y==0, 1], c='#3498db', label='Class 0', edgecolors='k', s=20)\nplt.scatter(X[y==1, 0], X[y==1, 1], c='#e74c3c', label='Class 1', edgecolors='k', s=20)\nplt.title(\"Gaussian Naive Bayes Decision Boundary\")\nplt.legend()\nplt.grid(alpha=0.3)\nplt.show()\n\naccuracy = jnp.mean(predict(X) == y)\nprint(f\"Training accuracy: {accuracy:.2%}\")\n</code></pre></p> </li> <li> <p>\u6784\u5efa\u4e00\u4e2a\u4f7f\u7528\u57fa\u5c3c\u4e0d\u7eaf\u5ea6\u8fdb\u884c\u5206\u88c2\u7684\u51b3\u7b56\u6811\u3002\u5b9e\u73b0\u5355\u4e2a\u8282\u70b9\u7684\u5206\u88c2\u903b\u8f91\uff0c\u5e76\u5c55\u793a\u4fe1\u606f\u589e\u76ca\u5982\u4f55\u9009\u62e9\u6700\u4f73\u7279\u5f81\u548c\u9608\u503c\u3002 <pre><code>import jax.numpy as jnp\n\ndef gini_impurity(y):\n    \"\"\"\u8ba1\u7b97\u6807\u7b7e\u6570\u7ec4\u7684\u57fa\u5c3c\u4e0d\u7eaf\u5ea6\u3002\"\"\"\n    classes, counts = jnp.unique(y, return_counts=True)\n    probs = counts / len(y)\n    return 1.0 - jnp.sum(probs ** 2)\n\ndef information_gain(y, left_mask):\n    \"\"\"\u901a\u8fc7\u5e03\u5c14\u63a9\u7801\u5c06y\u5206\u88c2\u4e3a\u5de6/\u53f3\u540e\u7684\u4fe1\u606f\u589e\u76ca\u3002\"\"\"\n    parent_gini = gini_impurity(y)\n    left_y, right_y = y[left_mask], y[~left_mask]\n    n = len(y)\n    if len(left_y) == 0 or len(right_y) == 0:\n        return 0.0\n    child_gini = (len(left_y)/n) * gini_impurity(left_y) + \\\n                 (len(right_y)/n) * gini_impurity(right_y)\n    return float(parent_gini - child_gini)\n\ndef best_split(X, y):\n    \"\"\"\u627e\u5230\u6700\u5927\u5316\u4fe1\u606f\u589e\u76ca\u7684\u7279\u5f81\u548c\u9608\u503c\u3002\"\"\"\n    best_ig, best_feat, best_thresh = -1, None, None\n    for feat in range(X.shape[1]):\n        thresholds = jnp.unique(X[:, feat])\n        for thresh in thresholds:\n            mask = X[:, feat] &lt;= float(thresh)\n            ig = information_gain(y, mask)\n            if ig &gt; best_ig:\n                best_ig, best_feat, best_thresh = ig, feat, float(thresh)\n    return best_feat, best_thresh, best_ig\n\n# \u793a\u4f8b\uff1a\u5408\u6210\u6570\u636e\nfrom sklearn.datasets import make_classification\nX, y = make_classification(n_samples=100, n_features=4, n_redundant=0, random_state=0)\nX, y = jnp.array(X), jnp.array(y)\n\nfeat, thresh, ig = best_split(X, y)\nprint(f\"Best split: feature {feat}, threshold {thresh:.3f}, info gain {ig:.4f}\")\nprint(f\"Parent Gini: {gini_impurity(y):.4f}\")\nmask = X[:, feat] &lt;= thresh\nprint(f\"Left Gini:   {gini_impurity(y[mask]):.4f} ({int(jnp.sum(mask))} samples)\")\nprint(f\"Right Gini:  {gini_impurity(y[~mask]):.4f} ({int(jnp.sum(~mask))} samples)\")\n</code></pre></p> </li> <li> <p>\u4ece\u5934\u5b9e\u73b0\u5e26K-Means++\u521d\u59cb\u5316\u7684K-Means\u3002\u5bf9\u5408\u6210\u6570\u636e\u96c6\u8fdb\u884c\u805a\u7c7b\u5e76\u53ef\u89c6\u5316\u6bcf\u6b21\u8fed\u4ee3\u7684\u7c07\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\nfrom sklearn.datasets import make_blobs\n\n# \u751f\u6210\u5408\u6210\u7c07\nX, y_true = make_blobs(n_samples=300, centers=4, cluster_std=0.8, random_state=42)\nX = jnp.array(X)\n\ndef kmeans_plus_plus_init(X, K, key):\n    \"\"\"K-Means++\u521d\u59cb\u5316\u3002\"\"\"\n    n = X.shape[0]\n    idx = jax.random.randint(key, (), 0, n)\n    centroids = [X[idx]]\n    for _ in range(1, K):\n        dists = jnp.min(jnp.stack([jnp.sum((X - c)**2, axis=1) for c in centroids]), axis=0)\n        probs = dists / jnp.sum(dists)\n        key, subkey = jax.random.split(key)\n        idx = jax.random.choice(subkey, n, p=probs)\n        centroids.append(X[idx])\n    return jnp.stack(centroids)\n\ndef kmeans(X, K, max_iters=20, key=jax.random.PRNGKey(0)):\n    centroids = kmeans_plus_plus_init(X, K, key)\n    history = [centroids]\n    for _ in range(max_iters):\n        # \u5206\u914d\u6b65\u9aa4\n        dists = jnp.stack([jnp.sum((X - c)**2, axis=1) for c in centroids])\n        labels = jnp.argmin(dists, axis=0)\n        # \u66f4\u65b0\u6b65\u9aa4\n        new_centroids = jnp.stack([\n            jnp.mean(X[labels == k], axis=0) for k in range(K)\n        ])\n        history.append(new_centroids)\n        if jnp.allclose(centroids, new_centroids):\n            break\n        centroids = new_centroids\n    return labels, centroids, history\n\nK = 4\nlabels, centroids, history = kmeans(X, K)\n\n# \u7ed8\u5236\u6700\u7ec8\u7ed3\u679c\ncolors = ['#3498db', '#e74c3c', '#27ae60', '#9b59b6']\nplt.figure(figsize=(8, 6))\nfor k in range(K):\n    mask = labels == k\n    plt.scatter(X[mask, 0], X[mask, 1], c=colors[k], s=20, alpha=0.6)\n    plt.scatter(centroids[k, 0], centroids[k, 1], c=colors[k], marker='X',\n                s=200, edgecolors='k', linewidths=1.5)\nplt.title(f\"K-Means Clustering (K={K}, {len(history)-1} iterations)\")\nplt.grid(alpha=0.3)\nplt.show()\n\n# \u8ba1\u7b97\u60ef\u6027\ninertia = sum(jnp.sum((X[labels == k] - centroids[k])**2) for k in range(K))\nprint(f\"Final inertia: {inertia:.2f}\")\n</code></pre></p> </li> <li> <p>\u6f14\u793a\u6838\u6280\u5de7\u3002\u901a\u8fc7\u6bd4\u8f83\u6838\u77e9\u9635\u4e0e\u591a\u9879\u5f0f\u6838\u7684\u663e\u5f0f\u7279\u5f81\u6620\u5c04\uff0c\u5c55\u793aRBF\u6838\u5982\u4f55\u5728\u9ad8\u7ef4\u7a7a\u95f4\u4e2d\u8ba1\u7b97\u70b9\u79ef\u3002 <pre><code>import jax.numpy as jnp\n\n# \u7b80\u53552D\u6570\u636e\nX = jnp.array([[1.0, 2.0], [3.0, 4.0], [5.0, 6.0]])\n\n# \u591a\u9879\u5f0f\u6838\uff1aK(x,y) = (x\u00b7y + 1)^2\ndef poly_kernel(X, degree=2, c=1.0):\n    return (X @ X.T + c) ** degree\n\n# 2D\u7684\u663e\u5f0f\u4e8c\u6b21\u7279\u5f81\u6620\u5c04\uff1a(1, sqrt(2)*x1, sqrt(2)*x2, x1^2, x2^2, sqrt(2)*x1*x2)\ndef poly_features(X):\n    x1, x2 = X[:, 0], X[:, 1]\n    return jnp.column_stack([\n        jnp.ones(len(X)),\n        jnp.sqrt(2) * x1,\n        jnp.sqrt(2) * x2,\n        x1 ** 2,\n        x2 ** 2,\n        jnp.sqrt(2) * x1 * x2\n    ])\n\nK_trick = poly_kernel(X)\nphi = poly_features(X)\nK_explicit = phi @ phi.T\n\nprint(\"Kernel trick (polynomial degree 2):\")\nprint(K_trick)\nprint(\"\\nExplicit feature map dot products:\")\nprint(K_explicit)\nprint(f\"\\nMatrices match: {jnp.allclose(K_trick, K_explicit)}\")\n\n# RBF\u6838\uff1a\u4e0d\u5b58\u5728\u6709\u9650\u7684\u663e\u5f0f\u6620\u5c04\ndef rbf_kernel(X, gamma=0.5):\n    sq_dists = jnp.sum(X**2, axis=1, keepdims=True) + \\\n               jnp.sum(X**2, axis=1) - 2 * X @ X.T\n    return jnp.exp(-gamma * sq_dists)\n\nK_rbf = rbf_kernel(X)\nprint(\"\\nRBF kernel matrix:\")\nprint(K_rbf)\nprint(\"Diagonal is always 1 (a point is identical to itself)\")\nprint(\"Off-diagonal entries decay with distance\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2006%3A%20machine%20learning/02.%20gradient%20machine%20learning/","title":"\u68af\u5ea6\u673a\u5668\u5b66\u4e60","text":"<p>\u57fa\u4e8e\u68af\u5ea6\u7684\u5b66\u4e60\u901a\u8fc7\u6cbf\u7740\u635f\u5931\u66f2\u9762\u7684\u659c\u7387\u8fed\u4ee3\u4f18\u5316\u6a21\u578b\u53c2\u6570\u3002\u672c\u6587\u6db5\u76d6\u7ebf\u6027\u56de\u5f52\u3001\u903b\u8f91\u56de\u5f52\u3001softmax\u5206\u7c7b\u3001\u68af\u5ea6\u4e0b\u964d\u53d8\u4f53\u3001\u6b63\u5219\u5316\uff08L1/L2\uff09\u548c\u504f\u5dee-\u65b9\u5dee\u6743\u8861</p> <ul> <li> <p>\u7b2c01\u7bc7\u4e2d\u7684\u7ecf\u5178\u65b9\u6cd5\u4f7f\u7528\u5de7\u5999\u7684\u542f\u53d1\u5f0f\u6216\u95ed\u5f0f\u89e3\u3002\u672c\u6587\u6db5\u76d6\u901a\u8fc7\u6cbf\u7740\u68af\u5ea6\u5b66\u4e60\u3001\u5728\u635f\u5931\u66f2\u9762\u4e0a\u5c0f\u6b65\u4e0b\u5761\u76f4\u5230\u627e\u5230\u597d\u53c2\u6570\u7684\u7b97\u6cd5\u3002\u57fa\u4e8e\u68af\u5ea6\u7684\u5b66\u4e60\u662f\u4ece\u7ebf\u6027\u56de\u5f52\u5230\u6700\u5927\u795e\u7ecf\u7f51\u7edc\u7684\u4e00\u5207\u80cc\u540e\u7684\u5f15\u64ce\u3002</p> </li> <li> <p>\u7ebf\u6027\u56de\u5f52\u662f\u6700\u7b80\u5355\u7684\u57fa\u4e8e\u68af\u5ea6\u7684\u6a21\u578b\uff0c\u5b83\u4e5f\u6709\u95ed\u5f0f\u89e3\uff0c\u8fd9\u4f7f\u5176\u6210\u4e3a\u5b8c\u7f8e\u7684\u8d77\u70b9\u3002\u6a21\u578b\u662f\u4e00\u6761\u76f4\u7ebf\uff08\u6216\u66f4\u9ad8\u7ef4\u7684\u8d85\u5e73\u9762\uff09\uff1a</p> </li> </ul> \\[\\hat{y} = w \\cdot x + b = \\sum_{i=1}^{d} w_i x_i + b\\] <ul> <li> <p>\u7528\u77e9\u9635\u7b26\u53f7\uff08\u6765\u81ea\u7b2c02\u7ae0\uff09\uff0c\u5982\u679c\u6211\u4eec\u5c06\u6240\u6709\u8bad\u7ec3\u8f93\u5165\u5806\u53e0\u4e3a\u77e9\u9635 \\(X\\) \u7684\u884c\uff0c\u5e76\u901a\u8fc7\u8ffd\u52a0\u4e00\u52171\u5c06\u504f\u7f6e\u5438\u6536\u5230 \\(w\\) \u4e2d\uff0c\u8fd9\u5c31\u53d8\u6210\u4e86 \\(\\hat{y} = Xw\\)\u3002</p> </li> <li> <p>\u76ee\u6807\u662f\u6700\u5c0f\u5316\u5747\u65b9\u8bef\u5dee\uff08MSE\uff09\uff0c\u5373\u9884\u6d4b\u503c\u4e0e\u5b9e\u9645\u503c\u4e4b\u95f4\u5e73\u5747\u5e73\u65b9\u5dee\uff1a</p> </li> </ul> \\[\\mathcal{L}(w) = \\frac{1}{n} \\sum_{i=1}^{n} (y_i - \\hat{y}_i)^2 = \\frac{1}{n} \\|y - Xw\\|^2\\] <ul> <li>\u4e3a\u4ec0\u4e48\u91c7\u7528\u5e73\u65b9\u8bef\u5dee\uff1f\u5b83\u6709\u6982\u7387\u8bba\u4e0a\u7684\u4f9d\u636e\uff1a\u5982\u679c\u4f60\u5047\u8bbe\u76ee\u6807\u503c\u7531 \\(y = Xw + \\epsilon\\) \u751f\u6210\uff0c\u5176\u4e2d \\(\\epsilon \\sim \\mathcal{N}(0, \\sigma^2)\\)\uff0c\u90a3\u4e48\u6700\u5927\u5316\u6570\u636e\u7684\u9ad8\u65af\u4f3c\u7136\uff08\u7b2c05\u7ae0\uff09\u7b49\u4ef7\u4e8e\u6700\u5c0f\u5316MSE\u3002\u5e73\u65b9\u8bef\u5dee\u8fd8\u6bd4\u5c0f\u9519\u8bef\u66f4\u4e25\u5389\u5730\u60e9\u7f5a\u5927\u9519\u8bef\uff0c\u8fd9\u901a\u5e38\u662f\u53ef\u53d6\u7684\u3002</li> </ul> <p></p> <ul> <li>\u7531\u4e8eMSE\u662f \\(w\\) \u7684\u4e8c\u6b21\u51fd\u6570\uff0c\u5b83\u5177\u6709\u552f\u4e00\u7684\u5168\u5c40\u6700\u5c0f\u503c\uff0c\u6211\u4eec\u53ef\u4ee5\u901a\u8fc7\u89e3\u6790\u65b9\u6cd5\u627e\u5230\u3002\u6c42\u5bfc\u3001\u8bbe\u4e3a\u96f6\u5e76\u6c42\u89e3\uff0c\u5f97\u5230\u6b63\u89c4\u65b9\u7a0b\uff1a</li> </ul> \\[w^{*} = (X^T X)^{-1} X^T y\\] <ul> <li> <p>\u8fd9\u76f4\u63a5\u4f7f\u7528\u4e86\u7b2c02\u7ae0\u7684\u77e9\u9635\u9006\u8fd0\u7b97\u3002\u8868\u8fbe\u5f0f \\(X^T X\\) \u662f\u4e00\u4e2a \\(d \\times d\\) \u77e9\u9635\uff08\u5176\u4e2d \\(d\\) \u662f\u7279\u5f81\u6570\u91cf\uff09\uff0c\\(X^T y\\) \u662f\u4e00\u4e2a \\(d\\) \u7ef4\u5411\u91cf\u3002\u6b63\u89c4\u65b9\u7a0b\u4e00\u6b21\u6027\u7ed9\u51fa\u7cbe\u786e\u7684\u6700\u4f18\u6743\u91cd\u3002</p> </li> <li> <p>\u6b63\u89c4\u65b9\u7a0b\u4f55\u65f6\u5931\u6548\uff1f\u5f53 \\(X^T X\\) \u5947\u5f02\uff08\u4e0d\u53ef\u9006\uff09\u65f6\uff0c\u8fd9\u53d1\u751f\u5728\u7279\u5f81\u7ebf\u6027\u76f8\u5173\u6216\u7279\u5f81\u6570\u91cf\u591a\u4e8e\u6837\u672c\u6570\u91cf\uff08\\(d &gt; n\\)\uff09\u7684\u60c5\u51b5\u4e0b\u3002\u5728\u8fd9\u4e9b\u60c5\u51b5\u4e0b\uff0c\u4f60\u9700\u8981\u6b63\u5219\u5316\uff08\u540e\u7eed\u4ecb\u7ecd\uff09\u6216\u68af\u5ea6\u4e0b\u964d\u3002</p> </li> <li> <p>\u903b\u8f91\u56de\u5f52\u5c06\u7ebf\u6027\u6a21\u578b\u9002\u7528\u4e8e\u4e8c\u5143\u5206\u7c7b\u3002\u6211\u4eec\u4e0d\u9884\u6d4b\u8fde\u7eed\u503c\uff0c\u800c\u662f\u60f3\u8981\u4e00\u4e2a\u4ecb\u4e8e0\u548c1\u4e4b\u95f4\u7684\u6982\u7387\u3002Sigmoid\u51fd\u6570\u5c06\u6240\u6709\u5b9e\u6570\u538b\u7f29\u5230\u8fd9\u4e2a\u8303\u56f4\u5185\uff1a</p> </li> </ul> \\[\\sigma(z) = \\frac{1}{1 + e^{-z}}\\] <ul> <li>\u6a21\u578b\u8ba1\u7b97 \\(z = w \\cdot x + b\\)\uff08\u7ebf\u6027\u5f97\u5206\uff0c\u4e0e\u7ebf\u6027\u56de\u5f52\u76f8\u540c\uff09\uff0c\u7136\u540e\u5c06\u5176\u901a\u8fc7sigmoid\uff1a\\(\\hat{y} = \\sigma(w \\cdot x + b)\\)\u3002\u8f93\u51fa \\(\\hat{y}\\) \u88ab\u89e3\u91ca\u4e3a \\(P(y = 1 \\mid x)\\)\u3002</li> </ul> <p></p> <ul> <li> <p>Sigmoid\u5177\u6709\u826f\u597d\u7684\u6027\u8d28\uff1a\\(\\sigma(0) = 0.5\\)\uff0c\\(\\sigma(z) \\to 1\\) \u5f53 \\(z \\to \\infty\\)\uff0c\\(\\sigma(z) \\to 0\\) \u5f53 \\(z \\to -\\infty\\)\uff0c\u4e14\u5176\u5bfc\u6570\u5177\u6709\u4f18\u96c5\u7684\u5f62\u5f0f \\(\\sigma'(z) = \\sigma(z)(1 - \\sigma(z))\\)\u3002</p> </li> <li> <p>\u903b\u8f91\u56de\u5f52\u7684\u635f\u5931\u51fd\u6570\u662f\u4e8c\u5143\u4ea4\u53c9\u71b5\uff08BCE\uff09\uff0c\u76f4\u63a5\u6765\u81ea\u4e8e\u4f2f\u52aa\u5229\u4f3c\u7136\uff08\u7b2c05\u7ae0\uff09\uff1a</p> </li> </ul> \\[\\mathcal{L} = -\\frac{1}{n} \\sum_{i=1}^{n} \\left[ y_i \\log(\\hat{y}_i) + (1 - y_i) \\log(1 - \\hat{y}_i) \\right]\\] <ul> <li> <p>\u5f53\u771f\u5b9e\u6807\u7b7e\u4e3a1\u65f6\uff0c\u53ea\u6709\u7b2c\u4e00\u9879\u8d77\u4f5c\u7528\uff0c\u5b83\u60e9\u7f5a\u8fc7\u4f4e\u7684\u9884\u6d4b\u3002\u5f53\u771f\u5b9e\u6807\u7b7e\u4e3a0\u65f6\uff0c\u53ea\u6709\u7b2c\u4e8c\u9879\u8d77\u4f5c\u7528\uff0c\u5b83\u60e9\u7f5a\u8fc7\u9ad8\u7684\u9884\u6d4b\u3002\u5bf9\u6570\u4f7f\u5f97\u5bf9\u4e8e\u81ea\u4fe1\u7684\u9519\u8bef\u9884\u6d4b\uff0c\u60e9\u7f5a\u6781\u5176\u9661\u5ced\uff1a\u5f53\u771f\u5b9e\u6807\u7b7e\u4e3a1\u65f6\u9884\u6d4b0.01\uff0c\u4ee3\u4ef7\u8fdc\u9ad8\u4e8e\u9884\u6d4b0.4\u3002</p> </li> <li> <p>\u4e0e\u7ebf\u6027\u56de\u5f52\u7684MSE\u4e0d\u540c\uff0cBCE\u6700\u5c0f\u5316\u6743\u91cd\u6ca1\u6709\u95ed\u5f0f\u89e3\u3002\u6211\u4eec\u9700\u8981\u4e00\u79cd\u8fed\u4ee3\u65b9\u6cd5\uff1a\u68af\u5ea6\u4e0b\u964d\u3002</p> </li> <li> <p>\u68af\u5ea6\u4e0b\u964d\u7684\u76f4\u89c9\u5f88\u7b80\u5355\uff1a\u60f3\u8c61\u4f60\u8eab\u5904\u5927\u96fe\u4e2d\u7684\u4e18\u9675\u5730\u5e26\uff08\u635f\u5931\u66f2\u9762\uff09\u3002\u4f60\u770b\u4e0d\u5230\u5168\u5c40\u6700\u5c0f\u503c\uff0c\u4f46\u53ef\u4ee5\u611f\u53d7\u5230\u811a\u4e0b\u7684\u5761\u5ea6\u3002\u4f60\u5411\u4e0b\u5761\u8d70\u4e00\u6b65\uff0c\u518d\u6b21\u611f\u53d7\u5761\u5ea6\uff0c\u7136\u540e\u91cd\u590d\u3002\u6700\u7ec8\u4f60\u5230\u8fbe\u4e00\u4e2a\u5c71\u8c37\u3002</p> </li> </ul> \\[w \\leftarrow w - \\eta \\frac{\\partial \\mathcal{L}}{\\partial w}\\] <ul> <li>\u5b66\u4e60\u7387 \\(\\eta\\) \u63a7\u5236\u4f60\u7684\u6b65\u957f\u3002\u592a\u5927\u5219\u8d8a\u8fc7\u5c71\u8c37\uff0c\u6765\u56de\u5f39\u8df3\u800c\u4e0d\u6536\u655b\u3002\u592a\u5c0f\u5219\u7f13\u6162\u524d\u884c\uff0c\u53ef\u80fd\u9677\u5165\u5c40\u90e8\u6700\u5c0f\u503c\u3002</li> </ul> <p></p> <ul> <li> <p>\u68af\u5ea6 \\(\\frac{\\partial \\mathcal{L}}{\\partial w}\\) \u662f\u4e00\u4e2a\u6307\u5411\u6700\u9661\u4e0a\u5347\u65b9\u5411\u7684\u5411\u91cf\u3002\u6211\u4eec\u51cf\u53bb\u5b83\u662f\u56e0\u4e3a\u60f3\u5411\u4e0b\u5761\u8d70\u3002\u8fd9\u662f\u7b2c03\u7ae0\u4e2d\u7684\u94fe\u5f0f\u6cd5\u5219\u5e94\u7528\u4e8e\u635f\u5931\u51fd\u6570\u3002</p> </li> <li> <p>\u6279\u91cf\u68af\u5ea6\u4e0b\u964d\u6bcf\u4e00\u6b65\u4f7f\u7528\u6574\u4e2a\u8bad\u7ec3\u96c6\u8ba1\u7b97\u68af\u5ea6\u3002\u8fd9\u7ed9\u51fa\u7cbe\u786e\u68af\u5ea6\uff0c\u4f46\u5f53 \\(n\\) \u5f88\u5927\u65f6\u8ba1\u7b97\u4ee3\u4ef7\u9ad8\u6602\u3002</p> </li> <li> <p>\u968f\u673a\u68af\u5ea6\u4e0b\u964d\uff08SGD\uff09 \u6bcf\u4e00\u6b65\u4f7f\u7528\u5355\u4e2a\u968f\u673a\u6837\u672c\u3002\u68af\u5ea6\u5e26\u6709\u566a\u58f0\uff08\u5b83\u4ece\u4e00\u4e2a\u6837\u672c\u4f30\u8ba1\u771f\u5b9e\u68af\u5ea6\uff09\uff0c\u4f46\u6bcf\u4e00\u6b65\u975e\u5e38\u5feb\u3002\u566a\u58f0\u5b9e\u9645\u4e0a\u53ef\u4ee5\u5e2e\u52a9\u9003\u79bb\u6d45\u7684\u5c40\u90e8\u6781\u5c0f\u503c\u3002</p> </li> <li> <p>\u5c0f\u6279\u91cf\u68af\u5ea6\u4e0b\u964d\u6298\u4e2d\uff1a\u6bcf\u4e00\u6b65\u4f7f\u7528 \\(B\\) \u4e2a\u6837\u672c\u7684\u6279\u6b21\uff08\u901a\u5e38\u4e3a32\u300164\u6216256\uff09\u3002\u8fd9\u5e73\u8861\u4e86\u8ba1\u7b97\u6548\u7387\uff08\u5bf9\u6279\u6b21\u7684\u5411\u91cf\u5316\u64cd\u4f5c\uff09\u4e0e\u68af\u5ea6\u8d28\u91cf\u3002\u51e0\u4e4e\u6240\u6709\u6df1\u5ea6\u5b66\u4e60\u90fd\u4f7f\u7528\u5c0f\u6279\u91cfSGD\u3002</p> </li> <li> <p>\u53cd\u5411\u4f20\u64ad\u662f\u6211\u4eec\u5b9e\u9645\u8ba1\u7b97\u5177\u6709\u8bb8\u591a\u53c2\u6570\u7684\u6a21\u578b\uff08\u5982\u795e\u7ecf\u7f51\u7edc\uff09\u4e2d\u68af\u5ea6\u7684\u65b9\u6cd5\u3002\u5b83\u662f\u7b2c03\u7ae0\u7684\u94fe\u5f0f\u6cd5\u5219\u901a\u8fc7\u8ba1\u7b97\u56fe\u7cfb\u7edf\u5316\u5730\u5e94\u7528\u3002</p> </li> <li> <p>\u4efb\u4f55\u6a21\u578b\u90fd\u53ef\u4ee5\u8868\u793a\u4e3a\u64cd\u4f5c\u7684\u6709\u5411\u65e0\u73af\u56fe\uff1a\u8f93\u5165\u6d41\u5165\uff0c\u4e58\u4ee5\u6743\u91cd\uff0c\u52a0\u5728\u4e00\u8d77\uff0c\u901a\u8fc7\u975e\u7ebf\u6027\u51fd\u6570\u4f20\u9012\uff0c\u6700\u7ec8\u4ea7\u751f\u635f\u5931\u503c\u3002\u524d\u5411\u4f20\u64ad\u901a\u8fc7\u8ba9\u6570\u636e\u4ece\u8f93\u5165\u5230\u8f93\u51fa\u6d41\u7ecf\u6b64\u56fe\u6765\u8ba1\u7b97\u8f93\u51fa\uff08\u548c\u635f\u5931\uff09\u3002</p> </li> <li> <p>\u53cd\u5411\u4f20\u64ad\u53cd\u5411\u6d41\u52a8\u68af\u5ea6\u3002\u4ece\u635f\u5931\u5f00\u59cb\uff0c\u4f60\u4f7f\u7528\u6bcf\u4e2a\u8282\u70b9\u7684\u94fe\u5f0f\u6cd5\u5219\u8ba1\u7b97\u635f\u5931\u76f8\u5bf9\u4e8e\u6bcf\u4e2a\u4e2d\u95f4\u503c\u7684\u53d8\u5316\u3002\u5982\u679c \\(L\\) \u4f9d\u8d56\u4e8e \\(z\\)\uff0c\u800c \\(z\\) \u4f9d\u8d56\u4e8e \\(w\\)\uff0c\u5219\uff1a</p> </li> </ul> \\[\\frac{\\partial L}{\\partial w} = \\frac{\\partial L}{\\partial z} \\cdot \\frac{\\partial z}{\\partial w}\\] <ul> <li> <p>\u6bcf\u4e2a\u8282\u70b9\u53ea\u9700\u8981\u77e5\u9053\u81ea\u5df1\u7684\u5c40\u90e8\u5bfc\u6570\u548c\u4ece\u4e0a\u65b9\u6d41\u5165\u7684\u68af\u5ea6\u3002\u8fd9\u4f7f\u5f97\u53cd\u5411\u4f20\u64ad\u6a21\u5757\u5316\u4e14\u9ad8\u6548\uff1a\u4ee3\u4ef7\u5927\u7ea6\u662f\u524d\u5411\u4f20\u64ad\u7684\u4e24\u500d\uff08\u4e00\u6b21\u524d\u5411\uff0c\u4e00\u6b21\u53cd\u5411\uff09\u3002</p> </li> <li> <p>\u539f\u59cbSGD\u6709\u4e00\u4e2a\u95ee\u9898\uff1a\u5b83\u5728\u9661\u5ced\u66f2\u7387\u65b9\u5411\u4e0a\u632f\u8361\uff0c\u800c\u5728\u5e73\u5766\u65b9\u5411\u4e0a\u8fdb\u5c55\u7f13\u6162\u3002\u4f18\u5316\u5668\u901a\u8fc7\u6839\u636e\u68af\u5ea6\u5386\u53f2\u8c03\u6574\u6b65\u957f\u6765\u6539\u8fdb\u8fd9\u4e00\u70b9\u3002</p> </li> <li> <p>\u5e26\u52a8\u91cf\u7684SGD\u7ef4\u62a4\u8fc7\u53bb\u68af\u5ea6\u7684\u8fd0\u884c\u5e73\u5747\u503c\uff08\u6307\u6570\u79fb\u52a8\u5e73\u5747\uff0c\u6765\u81ea\u7b2c04\u7ae0\uff09\u3002\u8fd9\u5e73\u6ed1\u4e86\u632f\u8361\u5e76\u52a0\u901f\u4e86\u6cbf\u4e00\u81f4\u65b9\u5411\u7684\u8fdb\u5c55\uff1a</p> </li> </ul> \\[v_t = \\beta v_{t-1} + (1 - \\beta) \\nabla \\mathcal{L}$$ $$w \\leftarrow w - \\eta \\, v_t\\] <ul> <li> <p>\u60f3\u8c61\u4e00\u4e2a\u6eda\u4e0b\u5c71\u7684\u7403\uff1a\u52a8\u91cf\u8ba9\u5b83\u6cbf\u4e00\u81f4\u65b9\u5411\u79ef\u7d2f\u901f\u5ea6\u5e76\u6291\u5236\u4fa7\u5411\u6296\u52a8\u3002\u5178\u578b\u503c\u4e3a \\(\\beta = 0.9\\)\u3002</p> </li> <li> <p>\u5185\u65af\u7279\u7f57\u592b\u52a0\u901f\u68af\u5ea6\uff08NAG\uff09 \u662f\u4e00\u4e2a\u5c0f\u5de7\u4f46\u5de7\u5999\u7684\u8c03\u6574\uff1a\u4e0d\u5728\u5f53\u524d\u4f4d\u7f6e\u8ba1\u7b97\u68af\u5ea6\uff0c\u800c\u662f\u5728\"\u524d\u77bb\"\u4f4d\u7f6e \\(w - \\eta \\beta v_{t-1}\\) \u8ba1\u7b97\u68af\u5ea6\u3002\u8fd9\u4e00\u4fee\u6b63\u6b65\u9aa4\u51cf\u5c11\u4e86\u8fc7\u51b2\uff1a</p> </li> </ul> \\[v_t = \\beta \\, v_{t-1} + \\nabla \\mathcal{L}(w - \\eta \\beta \\, v_{t-1})$$ $$w \\leftarrow w - \\eta \\, v_t\\] <ul> <li>Adagrad \u4e3a\u6bcf\u4e2a\u53c2\u6570\u8c03\u6574\u5b66\u4e60\u7387\u3002\u63a5\u6536\u5927\u68af\u5ea6\u7684\u53c2\u6570\u83b7\u5f97\u8f83\u5c0f\u7684\u5b66\u4e60\u7387\uff0c\u53cd\u4e4b\u4ea6\u7136\u3002\u5b83\u7d2f\u79ef\u5e73\u65b9\u68af\u5ea6\uff1a</li> </ul> \\[G_t = G_{t-1} + g_t^2, \\quad w \\leftarrow w - \\frac{\\eta}{\\sqrt{G_t + \\epsilon}} g_t\\] <ul> <li> <p>\u95ee\u9898\u5728\u4e8e\uff1a\\(G_t\\) \u53ea\u589e\u4e0d\u51cf\uff0c\u56e0\u6b64\u6709\u6548\u5b66\u4e60\u7387\u5355\u8c03\u9012\u51cf\uff0c\u6700\u7ec8\u53d8\u5f97\u592a\u5c0f\u800c\u65e0\u6cd5\u5b66\u4e60\u4efb\u4f55\u4e1c\u897f\u3002</p> </li> <li> <p>RMSprop \u901a\u8fc7\u4f7f\u7528\u5e73\u65b9\u68af\u5ea6\u7684\u6307\u6570\u79fb\u52a8\u5e73\u5747\u800c\u975e\u6c42\u548c\u6765\u4fee\u590d\u6b64\u95ee\u9898\uff0c\u4f7f\u5f97\u8fd1\u671f\u68af\u5ea6\u6bd4\u65e9\u671f\u68af\u5ea6\u66f4\u91cd\u8981\uff1a</p> </li> </ul> \\[s_t = \\beta \\, s_{t-1} + (1 - \\beta) g_t^2, \\quad w \\leftarrow w - \\frac{\\eta}{\\sqrt{s_t + \\epsilon}} g_t\\] <ul> <li>Adam\uff08\u81ea\u9002\u5e94\u77e9\u4f30\u8ba1\uff09\u7ed3\u5408\u4e86\u52a8\u91cf\u548cRMSprop\u3002\u5b83\u540c\u65f6\u7ef4\u62a4\u4e00\u9636\u77e9\u4f30\u8ba1\uff08\u68af\u5ea6\u7684\u5747\u503c\uff0c\u50cf\u52a8\u91cf\uff09\u548c\u4e8c\u9636\u77e9\u4f30\u8ba1\uff08\u5e73\u65b9\u68af\u5ea6\u7684\u5747\u503c\uff0c\u50cfRMSprop\uff09\uff1a</li> </ul> \\[m_t = \\beta_1 m_{t-1} + (1 - \\beta_1) g_t$$ $$v_t = \\beta_2 v_{t-1} + (1 - \\beta_2) g_t^2\\] <ul> <li>\u7531\u4e8e \\(m_t\\) \u548c \\(v_t\\) \u521d\u59cb\u5316\u4e3a\u96f6\uff0c\u5b83\u4eec\u5728\u65e9\u671f\u6b65\u9aa4\u4e2d\u6709\u504f\u8fd1\u4e8e\u96f6\u3002\u504f\u5dee\u4fee\u6b63\u89e3\u51b3\u4e86\u8fd9\u4e2a\u95ee\u9898\uff1a</li> </ul> \\[\\hat{m}_t = \\frac{m_t}{1 - \\beta_1^t}, \\quad \\hat{v}_t = \\frac{v_t}{1 - \\beta_2^t}$$ $$w \\leftarrow w - \\frac{\\eta}{\\sqrt{\\hat{v}_t} + \\epsilon} \\hat{m}_t\\] <p></p> <ul> <li> <p>\u9ed8\u8ba4\u8d85\u53c2\u6570\uff08\\(\\beta_1 = 0.9\\), \\(\\beta_2 = 0.999\\), \\(\\epsilon = 10^{-8}\\)\uff09\u5728\u5e7f\u6cdb\u7684\u95ee\u9898\u4e0a\u8868\u73b0\u826f\u597d\uff0c\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48Adam\u662f\u5927\u591a\u6570\u6df1\u5ea6\u5b66\u4e60\u5de5\u4f5c\u4e2d\u7684\u9ed8\u8ba4\u4f18\u5316\u5668\u3002</p> </li> <li> <p>AdamW \u5c06\u6743\u91cd\u8870\u51cf\u4e0e\u68af\u5ea6\u66f4\u65b0\u89e3\u8026\u3002\u6807\u51c6L2\u6b63\u5219\u5316\u548c\u6743\u91cd\u8870\u51cf\u5bf9\u4e8eSGD\u662f\u7b49\u4ef7\u7684\uff0c\u4f46\u5bf9\u4e8eAdam\u5219\u4e0d\u7136\u3002AdamW\u76f4\u63a5\u5c06\u6743\u91cd\u8870\u51cf\u5e94\u7528\u4e8e\u53c2\u6570\uff0c\u800c\u4e0d\u662f\u5c06 \\(\\lambda w\\) \u52a0\u5230\u68af\u5ea6\u4e0a\u3002\u8fd9\u5e26\u6765\u4e86\u66f4\u597d\u7684\u6cdb\u5316\u6027\u80fd\uff0c\u73b0\u5728\u662fTransformer\u8bad\u7ec3\u7684\u6807\u51c6\uff1a</p> </li> </ul> \\[w \\leftarrow w - \\eta \\left( \\frac{\\hat{m}_t}{\\sqrt{\\hat{v}_t} + \\epsilon} + \\lambda \\, w \\right)\\] <ul> <li>LION\uff08\u6f14\u5316\u7b26\u53f7\u52a8\u91cf\uff09\u662f\u901a\u8fc7\u7a0b\u5e8f\u641c\u7d22\u53d1\u73b0\u7684\u65b0\u4f18\u5316\u5668\u3002\u5b83\u53ea\u4f7f\u7528\u52a8\u91cf\u66f4\u65b0\u7684\u7b26\u53f7\uff08\u800c\u4e0d\u662f\u5e45\u5ea6\uff09\uff0c\u4f7f\u5f97\u6bcf\u6b21\u66f4\u65b0\u7684\u5c3a\u5ea6\u5747\u5300\u3002LION\u6bd4Adam\u4f7f\u7528\u66f4\u5c11\u7684\u5185\u5b58\uff08\u6ca1\u6709\u4e8c\u9636\u77e9\u7f13\u51b2\u533a\uff09\uff0c\u5e76\u4e14\u5728\u8bb8\u591a\u4efb\u52a1\u4e0a\u53ef\u4ee5\u5339\u914d\u6216\u8d85\u8d8aAdam\uff1a</li> </ul> \\[w \\leftarrow w - \\eta \\cdot \\text{sign}(\\beta_1 \\, m_{t-1} + (1 - \\beta_1) \\, g_t)$$ $$m_t = \\beta_2 \\, m_{t-1} + (1 - \\beta_2) \\, g_t\\] <ul> <li>Muon\uff08\u52a8\u91cf + \u6b63\u4ea4\u5316\uff09\u5e94\u7528\u5185\u65af\u7279\u7f57\u592b\u52a8\u91cf\uff0c\u7136\u540e\u4f7f\u7528Newton-Schulz\u8fed\u4ee3\u5bf9\u66f4\u65b0\u77e9\u9635\u8fdb\u884c\u6b63\u4ea4\u5316\uff0c\u8be5\u8fed\u4ee3\u8fd1\u4f3c\u6781\u5206\u89e3\u3002\u5f97\u5230\u7684\u66f4\u65b0\u65b9\u5411\u4f4d\u4e8eStiefel\u6d41\u5f62\u4e0a\uff0c\u6bcf\u6b21\u66f4\u65b0\u5728\u6240\u6709\u5947\u5f02\u65b9\u5411\u4e0a\u5177\u6709\u5927\u81f4\u76f8\u7b49\u7684\u5e45\u5ea6\uff0c\u9632\u6b62\u4efb\u4f55\u5355\u4e00\u65b9\u5411\u4e3b\u5bfc\u3002\u8fd9\u6d88\u9664\u4e86\u5bf9\u81ea\u9002\u5e94\u4e8c\u9636\u77e9\u4f30\u8ba1\uff08\u5982Adam\u7684 \\(v_t\\) \u7f13\u51b2\u533a\uff09\u7684\u9700\u6c42\uff0c\u51cf\u5c11\u4e86\u5185\u5b58\u4f7f\u7528\u3002Muon\u5728Transformer\u8bad\u7ec3\u4e2d\u8868\u73b0\u51fa\u8272\uff0c\u901a\u5e38\u4ee5\u66f4\u5feb\u7684\u6536\u655b\u901f\u5ea6\u8fbe\u5230\u4e0eAdamW\u76f8\u5f53\u7684\u8d28\u91cf\uff0c\u5c24\u5176\u9002\u7528\u4e8e\u6ce8\u610f\u529b\u77e9\u9635\u548cMLP\u6743\u91cd\u77e9\u9635\u3002\u5d4c\u5165\u5c42\u548c\u8f93\u51fa\u5c42\u901a\u5e38\u4ecd\u7531AdamW\u5904\u7406\u3002</li> </ul> \\[G_t = \\text{NesterovMomentum}(\\nabla \\mathcal{L})$$ $$U_t = \\text{NewtonSchulz}(G_t) \\approx G_t (G_t^T G_t)^{-1/2}$$ $$W \\leftarrow W - \\eta \\, U_t\\] <ul> <li>Newton-Schulz\u8fed\u4ee3\u901a\u8fc7\u91cd\u590d \\(X_{k+1} = \\frac{1}{2} X_k (3I - X_k^T X_k)\\) \u51e0\u4e2a\u6b65\u9aa4\uff08\u901a\u5e385-10\u6b65\uff09\u6765\u8ba1\u7b97\u6b63\u4ea4\u56e0\u5b50\u3002\u8fd9\u907f\u514d\u4e86\u5b8c\u6574SVD\u7684\u8ba1\u7b97\u4ee3\u4ef7\uff0c\u540c\u65f6\u63d0\u4f9b\u4e86\u826f\u597d\u7684\u8fd1\u4f3c\u3002</li> </ul> <p></p> <p></p> <ul> <li> <p>\u9664\u4e86MSE\u548cBCE\u4e4b\u5916\uff0c\u8fd8\u6709\u51e0\u79cd\u5e38\u7528\u7684\u635f\u5931\u51fd\u6570\u3002</p> </li> <li> <p>\u5e73\u5747\u7edd\u5bf9\u8bef\u5dee\uff08MAE\uff09\uff0c\u6216L1\u635f\u5931\uff0c\u53d6\u7edd\u5bf9\u5dee\u7684\u5e73\u5747\u503c\uff1a\\(\\frac{1}{n}\\sum|y_i - \\hat{y}_i|\\)\u3002\u5b83\u5bf9\u5f02\u5e38\u503c\u6bd4MSE\u66f4\u9c81\u68d2\uff0c\u56e0\u4e3a\u5b83\u4e0d\u5bf9\u5927\u8bef\u5dee\u8fdb\u884c\u5e73\u65b9\u3002</p> </li> <li> <p>Huber\u635f\u5931\u7ed3\u5408\u4e86\u4e24\u8005\u7684\u4f18\u70b9\uff1a\u5bf9\u4e8e\u5c0f\u8bef\u5dee\u8868\u73b0\u50cfMSE\uff08\u5e73\u6ed1\uff0c\u6613\u4e8e\u4f18\u5316\uff09\uff0c\u5bf9\u4e8e\u5927\u8bef\u5dee\u8868\u73b0\u50cfMAE\uff08\u5bf9\u5f02\u5e38\u503c\u9c81\u68d2\uff09\u3002\u5b83\u6709\u4e00\u4e2a\u63a7\u5236\u8fc7\u6e21\u7684\u9608\u503c \\(\\delta\\)\u3002</p> </li> <li> <p>\u5206\u7c7b\u4ea4\u53c9\u71b5\uff08CCE\uff09 \u5c06BCE\u63a8\u5e7f\u5230\u591a\u4e2a\u7c7b\u522b\u3002\u5982\u679c \\(\\hat{y}_k\\) \u662f\u7c7b\u522b \\(k\\) \u7684\u9884\u6d4b\u6982\u7387\uff0c\u771f\u5b9e\u7c7b\u522b\u4e3a \\(c\\)\uff1a</p> </li> </ul> \\[\\mathcal{L} = -\\log(\\hat{y}_c)\\] <ul> <li> <p>\u8fd9\u53ea\u662f\u6b63\u786e\u7c7b\u522b\u7684\u8d1f\u5bf9\u6570\u6982\u7387\u3002\u6700\u5c0f\u5316\u4ea4\u53c9\u71b5\u7b49\u4ef7\u4e8e\u6700\u5927\u5316\u4f3c\u7136\uff0c\u8fd9\u8054\u7cfb\u5230\u7b2c05\u7ae0\u7684\u4fe1\u606f\u8bba\uff1a\u4ea4\u53c9\u71b5\u8861\u91cf\u5f53\u4f60\u4f7f\u7528\u9884\u6d4b\u5206\u5e03\u4ee3\u66ff\u771f\u5b9e\u5206\u5e03\u65f6\u9700\u8981\u591a\u5c11\u989d\u5916\u6bd4\u7279\u3002</p> </li> <li> <p>Hinge\u635f\u5931 \u88abSVM\u4f7f\u7528\uff1a\\(\\mathcal{L} = \\max(0, 1 - y \\cdot f(x))\\)\u3002\u5b83\u53ea\u60e9\u7f5a\u5728\u95f4\u9694\u9519\u8bef\u4e00\u4fa7\u6216\u95f4\u9694\u5185\u7684\u9884\u6d4b\u3002\u4e00\u65e6\u4e00\u4e2a\u70b9\u88ab\u8db3\u591f\u7f6e\u4fe1\u5730\u6b63\u786e\u5206\u7c7b\uff0c\u635f\u5931\u4e3a\u96f6\u3002</p> </li> <li> <p>\u6b63\u5219\u5316\u901a\u8fc7\u6dfb\u52a0\u5bf9\u590d\u6742\u6a21\u578b\u7684\u60e9\u7f5a\u6765\u9632\u6b62\u8fc7\u62df\u5408\u3002\u6b63\u5219\u5316\u540e\u7684\u635f\u5931\u4e3a\uff1a</p> </li> </ul> \\[\\mathcal{L}_{\\text{reg}} = \\mathcal{L}_{\\text{data}} + \\lambda \\, R(w)\\] <ul> <li> <p>L2\u6b63\u5219\u5316\uff08Ridge\uff0c\u6743\u91cd\u8870\u51cf\uff09\u60e9\u7f5a\u5e73\u65b9\u6743\u91cd\u4e4b\u548c\uff1a\\(R(w) = \\|w\\|^2 = \\sum w_i^2\\)\u3002\u5b83\u963b\u6b62\u4efb\u4f55\u5355\u4e2a\u6743\u91cd\u53d8\u5f97\u8fc7\u5927\uff0c\u6709\u6548\u5730\u5c06\u6240\u6709\u6743\u91cd\u5411\u96f6\u6536\u7f29\uff0c\u4f46\u5f88\u5c11\u4f7f\u5b83\u4eec\u7cbe\u786e\u4e3a\u96f6\u3002</p> </li> <li> <p>L1\u6b63\u5219\u5316\uff08Lasso\uff09\u60e9\u7f5a\u7edd\u5bf9\u6743\u91cd\u4e4b\u548c\uff1a\\(R(w) = \\|w\\|_1 = \\sum |w_i|\\)\u3002\u5b83\u9f13\u52b1\u7a00\u758f\u6027\uff0c\u5c06\u8bb8\u591a\u6743\u91cd\u9a71\u52a8\u5230\u7cbe\u786e\u4e3a\u96f6\uff0c\u5b9e\u73b0\u81ea\u52a8\u7279\u5f81\u9009\u62e9\u3002</p> </li> <li> <p>\u5f39\u6027\u7f51\u7edc \u7ed3\u5408\u4e86\u4e24\u8005\uff1a\\(R(w) = \\alpha \\|w\\|_1 + (1 - \\alpha) \\|w\\|^2\\)\uff0c\u878d\u5408\u4e86\u7a00\u758f\u6027\u548c\u6536\u7f29\u3002</p> </li> <li> <p>\u6709\u4e00\u4e2a\u4f18\u7f8e\u7684\u8d1d\u53f6\u65af\u89e3\u91ca\uff08\u6765\u81ea\u7b2c05\u7ae0\uff09\u3002L2\u6b63\u5219\u5316\u7b49\u4ef7\u4e8e\u5728\u6743\u91cd\u4e0a\u653e\u7f6e\u9ad8\u65af\u5148\u9a8c\u5e76\u5bfb\u627eMAP\u4f30\u8ba1\u3002L1\u6b63\u5219\u5316\u5bf9\u5e94\u4e8e\u62c9\u666e\u62c9\u65af\u5148\u9a8c\u3002\u6b63\u5219\u5316\u5f3a\u5ea6 \\(\\lambda\\) \u63a7\u5236\u4f60\u76f8\u5bf9\u4e8e\u6570\u636e\u4fe1\u4efb\u5148\u9a8c\u7684\u7a0b\u5ea6\u3002</p> </li> <li> <p>\u8bc4\u4f30\u6307\u6807\u544a\u8bc9\u4f60\u6a21\u578b\u662f\u5426\u771f\u6b63\u6709\u6548\u3002\u5bf9\u4e8e\u56de\u5f52\uff0cMSE\u548cMAE\u662f\u6807\u51c6\u6307\u6807\u3002\u5bf9\u4e8e\u5206\u7c7b\uff0c\u60c5\u51b5\u66f4\u4e3a\u5fae\u5999\u3002</p> </li> <li> <p>\u6df7\u6dc6\u77e9\u9635\u662f\u4e00\u4e2a\u4e8c\u5143\u5206\u7c7b\u7684\u56db\u683c\u8868\uff1a</p> </li> <li>\u771f\u6b63\u4f8b\uff08TP\uff09\uff1a\u9884\u6d4b\u4e3a\u6b63\uff0c\u5b9e\u9645\u4e3a\u6b63</li> <li>\u5047\u6b63\u4f8b\uff08FP\uff09\uff1a\u9884\u6d4b\u4e3a\u6b63\uff0c\u5b9e\u9645\u4e3a\u8d1f</li> <li>\u771f\u8d1f\u4f8b\uff08TN\uff09\uff1a\u9884\u6d4b\u4e3a\u8d1f\uff0c\u5b9e\u9645\u4e3a\u8d1f</li> <li> <p>\u5047\u8d1f\u4f8b\uff08FN\uff09\uff1a\u9884\u6d4b\u4e3a\u8d1f\uff0c\u5b9e\u9645\u4e3a\u6b63</p> </li> <li> <p>\u51c6\u786e\u7387 = \\(\\frac{TP + TN}{TP + TN + FP + FN}\\) \u5728\u7c7b\u522b\u4e0d\u5e73\u8861\u65f6\u53ef\u80fd\u5177\u6709\u8bef\u5bfc\u6027\u3002\u5982\u679c99%\u7684\u7535\u5b50\u90ae\u4ef6\u4e0d\u662f\u5783\u573e\u90ae\u4ef6\uff0c\u4e00\u4e2a\u603b\u662f\u9884\u6d4b\"\u975e\u5783\u573e\u90ae\u4ef6\"\u7684\u6a21\u578b\u670999%\u7684\u51c6\u786e\u7387\uff0c\u4f46\u6ca1\u6709\u7528\u5904\u3002</p> </li> <li> <p>\u7cbe\u786e\u7387 = \\(\\frac{TP}{TP + FP}\\) \u56de\u7b54\uff1a\u5728\u6240\u6709\u9884\u6d4b\u4e3a\u6b63\u7684\u6837\u672c\u4e2d\uff0c\u6709\u591a\u5c11\u5b9e\u9645\u4e3a\u6b63\uff1f\u9ad8\u7cbe\u786e\u7387\u610f\u5473\u7740\u8bef\u62a5\u5c11\u3002</p> </li> <li> <p>\u53ec\u56de\u7387\uff08\u654f\u611f\u5ea6\uff09= \\(\\frac{TP}{TP + FN}\\) \u56de\u7b54\uff1a\u5728\u6240\u6709\u5b9e\u9645\u4e3a\u6b63\u7684\u6837\u672c\u4e2d\uff0c\u4f60\u6355\u83b7\u4e86\u591a\u5c11\uff1f\u9ad8\u53ec\u56de\u7387\u610f\u5473\u7740\u6f0f\u68c0\u5c11\u3002</p> </li> <li> <p>F1\u5206\u6570 = \\(\\frac{2 \\cdot \\text{precision} \\cdot \\text{recall}}{\\text{precision} + \\text{recall}}\\) \u662f\u7cbe\u786e\u7387\u548c\u53ec\u56de\u7387\u7684\u8c03\u548c\u5e73\u5747\u6570\uff0c\u5e73\u8861\u4e86\u4e24\u8005\u3002</p> </li> <li> <p>ROC\u66f2\u7ebf\u7ed8\u5236\u4e86\u771f\u6b63\u7387\uff08\u53ec\u56de\u7387\uff09\u5bf9\u5047\u6b63\u7387\uff08\\(\\frac{FP}{FP + TN}\\)\uff09\u968f\u5206\u7c7b\u9608\u503c\u4ece0\u52301\u53d8\u5316\u7684\u66f2\u7ebf\u3002\u5b8c\u7f8e\u5206\u7c7b\u5668\u7d27\u8d34\u5de6\u4e0a\u89d2\u3002AUC\uff08ROC\u66f2\u7ebf\u4e0b\u9762\u79ef\uff09\u7528\u4e00\u4e2a\u6570\u5b57\u6982\u62ec\u6027\u80fd\uff1a1.0\u4e3a\u5b8c\u7f8e\uff0c0.5\u4e3a\u968f\u673a\u731c\u6d4b\u3002</p> </li> <li> <p>\u4ea4\u53c9\u9a8c\u8bc1\u63d0\u4f9b\u4e86\u66f4\u53ef\u9760\u7684\u6cdb\u5316\u6027\u80fd\u4f30\u8ba1\u3002\u5728 \\(k\\) \u6298\u4ea4\u53c9\u9a8c\u8bc1\u4e2d\uff0c\u4f60\u5c06\u6570\u636e\u5206\u6210 \\(k\\) \u4efd\uff0c\u5728 \\(k-1\\) \u4efd\u4e0a\u8bad\u7ec3\uff0c\u5728\u5269\u4f59\u4e00\u4efd\u4e0a\u6d4b\u8bd5\uff0c\u7136\u540e\u8f6e\u6362\u3002\u6240\u6709 \\(k\\) \u6298\u7684\u5e73\u5747\u6d4b\u8bd5\u6027\u80fd\u5c31\u662f\u4f60\u7684\u4f30\u8ba1\u3002\u8fd9\u4f7f\u7528\u4e86\u6240\u6709\u6570\u636e\u8fdb\u884c\u8bad\u7ec3\u548c\u6d4b\u8bd5\uff08\u53ea\u662f\u4e0d\u5728\u540c\u4e00\u65f6\u95f4\uff09\uff0c\u5728\u6570\u636e\u7a00\u7f3a\u65f6\u5c24\u4e3a\u5b9d\u8d35\u3002</p> </li> <li> <p>\u504f\u5dee-\u65b9\u5dee\u6743\u8861\uff08\u6765\u81ea\u7b2c04\u7ae0\uff09\u662fML\u4e2d\u7684\u57fa\u672c\u5f20\u529b\u3002\u6a21\u578b\u671f\u671b\u8bef\u5dee\u5206\u89e3\u4e3a\uff1a</p> </li> </ul> \\[\\text{Error} = \\text{Bias}^2 + \\text{Variance} + \\text{Irreducible Noise}\\] <ul> <li> <p>\u504f\u5dee\u662f\u9519\u8bef\u5047\u8bbe\u5e26\u6765\u7684\u7cfb\u7edf\u6027\u8bef\u5dee\uff08\u4f8b\u5982\uff0c\u7528\u76f4\u7ebf\u62df\u5408\u66f2\u7ebf\u6570\u636e\uff09\u3002\u65b9\u5dee\u662f\u5bf9\u8bad\u7ec3\u6570\u636e\u6ce2\u52a8\u7684\u654f\u611f\u5ea6\uff08\u4f8b\u5982\uff0c20\u6b21\u591a\u9879\u5f0f\u62df\u5408\u566a\u58f0\uff09\u3002\u7b80\u5355\u6a21\u578b\u5177\u6709\u9ad8\u504f\u5dee\u548c\u4f4e\u65b9\u5dee\uff1b\u590d\u6742\u6a21\u578b\u5177\u6709\u4f4e\u504f\u5dee\u548c\u9ad8\u65b9\u5dee\u3002\u6700\u4f18\u5728\u4e24\u8005\u4e4b\u95f4\u3002</p> </li> <li> <p>\u5b66\u4e60\u7387\u8c03\u5ea6\u5728\u8bad\u7ec3\u671f\u95f4\u8c03\u6574 \\(\\eta\\)\u3002\u5e38\u89c1\u7b56\u7565\uff1a</p> </li> <li>\u6b65\u957f\u8870\u51cf\uff1a\u6bcf \\(N\\) \u4e2aepoch\u5c06 \\(\\eta\\) \u4e58\u4ee5\u4e00\u4e2a\u56e0\u5b50\uff08\u59820.1\uff09</li> <li>\u4f59\u5f26\u9000\u706b\uff1a\u6309\u7167\u4f59\u5f26\u66f2\u7ebf\u4ece\u521d\u59cb\u503c\u5e73\u6ed1\u964d\u4f4e \\(\\eta\\) \u5230\u63a5\u8fd1\u96f6</li> <li>\u9884\u70ed\uff1a\u4ece\u4e00\u4e2a\u975e\u5e38\u5c0f\u7684 \\(\\eta\\) \u5f00\u59cb\uff0c\u5728\u524d\u51e0\u5343\u6b65\u7ebf\u6027\u589e\u52a0\uff0c\u7136\u540e\u8870\u51cf\u3002\u8fd9\u9632\u6b62\u4e86\u5927\u7684\u521d\u59cb\u68af\u5ea6\u7834\u574f\u8bad\u7ec3\u7a33\u5b9a\u6027</li> <li> <p>1cycle\uff1a\u4e00\u4e2a\u5148\u5347\u540e\u964d\u7684\u4f59\u5f26\u5468\u671f\uff0c\u53ef\u4ee5\u5e26\u6765\u66f4\u5feb\u7684\u6536\u655b</p> </li> <li> <p>\u8d85\u53c2\u6570\u8c03\u4f18\u662f\u627e\u5230\u5b66\u4e60\u7387\u3001\u6279\u91cf\u5927\u5c0f\u3001\u6b63\u5219\u5316\u5f3a\u5ea6\u548c\u5176\u4ed6\u4e0d\u7531\u68af\u5ea6\u4e0b\u964d\u5b66\u4e60\u7684\u8bbe\u7f6e\u7684\u826f\u597d\u503c\u7684\u8fc7\u7a0b\u3002\u5e38\u7528\u65b9\u6cd5\uff1a</p> </li> <li>\u7f51\u683c\u641c\u7d22\uff1a\u5728\u9884\u5b9a\u4e49\u7684\u7f51\u683c\u4e0a\u5c1d\u8bd5\u6bcf\u4e00\u79cd\u7ec4\u5408\uff08\u7a77\u4e3e\u4f46\u4ee3\u4ef7\u9ad8\uff09</li> <li>\u968f\u673a\u641c\u7d22\uff1a\u968f\u673a\u91c7\u6837\u7ec4\u5408\uff0c\u901a\u5e38\u66f4\u9ad8\u6548\uff0c\u56e0\u4e3a\u5e76\u975e\u6240\u6709\u8d85\u53c2\u6570\u540c\u7b49\u91cd\u8981</li> <li>\u8d1d\u53f6\u65af\u4f18\u5316\uff1a\u6784\u5efa\u76ee\u6807\u51fd\u6570\u7684\u6a21\u578b\u5e76\u667a\u80fd\u9009\u62e9\u4e0b\u4e00\u4e2a\u8981\u5c1d\u8bd5\u7684\u8d85\u53c2\u6570</li> <li> <p>ASHA\uff08\u5f02\u6b65\u8fde\u7eed\u51cf\u534a\u7b97\u6cd5\uff09\uff1a\u4f7f\u7528\u5c0f\u9884\u7b97\u5e76\u884c\u8fd0\u884c\u8bb8\u591a\u8bd5\u9a8c\uff0c\u7136\u540e\u5c06\u6700\u6709\u5e0c\u671b\u7684\u63d0\u5347\u5230\u66f4\u5927\u9884\u7b97\uff0c\u540c\u65f6\u53ca\u65e9\u7ec8\u6b62\u5176\u4f59\u8bd5\u9a8c\u3002\u5b83\u7ed3\u5408\u4e86\u65e9\u505c\u7684\u9ad8\u6548\u6027\u548c\u5927\u89c4\u6a21\u5e76\u884c\u6027\u2014\u2014\u4e0d\u662f\u8fd0\u884c100\u6b21\u5b8c\u6574\u7684\u8bad\u7ec3\uff0c\u800c\u662f\u5ec9\u4ef7\u5730\u542f\u52a8\u6240\u6709100\u6b21\uff0c\u5728\u6bcf\u7ea7\u4fdd\u7559\u524d\u56db\u5206\u4e4b\u4e00\uff0c\u53ea\u6709\u5c11\u6570\u8fd0\u884c\u5230\u5b8c\u6210\u3002\u8fd9\u662f\u73b0\u4ee3\u5927\u89c4\u6a21\u8c03\u4f18\u6846\u67b6\uff08\u5982Ray Tune\uff09\u7684\u9aa8\u5e72\u3002</p> </li> <li> <p>\u65e0\u8c03\u5ea6\u5b66\u4e60\u5b8c\u5168\u6d88\u9664\u4e86\u5bf9\u5b66\u4e60\u7387\u8c03\u5ea6\u7684\u9700\u6c42\u3002\u5b83\u4e0d\u662f\u5728\u56fa\u5b9a\u66f2\u7ebf\u4e0a\u8870\u51cf \\(\\eta\\)\uff0c\u800c\u662f\u7ef4\u62a4\u4e24\u4e2a\u5e8f\u5217\uff1a\u4e00\u4e2a\u7f13\u6162\u79fb\u52a8\u7684\u8fed\u4ee3\u5e73\u5747\u503c \\(z_t\\)\uff08\u6536\u655b\u5230\u6700\u4f18\u503c\uff09\u548c\u4e00\u4e2a\u5feb\u901f\u63a2\u7d22\u7684\u8fed\u4ee3 \\(y_t\\)\uff08\u5728\u5176\u4e0a\u8bc4\u4f30\u68af\u5ea6\uff09\u3002\u6700\u7ec8\u8f93\u51fa\u662f\u5e73\u5747\u5e8f\u5217\uff0c\u88ab\u8bc1\u660e\u5728\u4e8b\u540e\u80fd\u5339\u914d\u6700\u4f73\u8c03\u5ea6\u7684\u6536\u655b\u901f\u5ea6\u3002\u8fd9\u5b8c\u5168\u6d88\u9664\u4e86\u8c03\u5ea6\u4f5c\u4e3a\u4e00\u4e2a\u8d85\u53c2\u6570\u2014\u2014\u4f60\u53ea\u9700\u8bbe\u7f6e\u57fa\u7840\u5b66\u4e60\u7387\uff0c\u4f18\u5316\u5668\u5904\u7406\u5176\u4f59\u90e8\u5206\u3002SGD\u548cAdam\u7684\u65e0\u8c03\u5ea6\u53d8\u4f53\u5df2\u88ab\u8bc1\u660e\u80fd\u8fbe\u5230\u6216\u8d85\u8d8a\u5176\u7ecf\u8fc7\u8c03\u5ea6\u7684\u5bf9\u5e94\u7248\u672c\u3002</p> </li> </ul>"},{"location":"chapter%2006%3A%20machine%20learning/02.%20gradient%20machine%20learning/#colab","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u5728CoLab\u6216\u7b14\u8bb0\u672c\u4e2d\u5b8c\u6210\uff09","text":"<ol> <li> <p>\u4f7f\u7528\u6b63\u89c4\u65b9\u7a0b\u548c\u68af\u5ea6\u4e0b\u964d\u4e24\u79cd\u65b9\u6cd5\u5b9e\u73b0\u7ebf\u6027\u56de\u5f52\u3002\u6bd4\u8f83\u6c42\u89e3\u7ed3\u679c\uff0c\u5e76\u7ed8\u5236GD\u635f\u5931\u968f\u8fed\u4ee3\u7684\u6536\u655b\u66f2\u7ebf\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u751f\u6210\u5408\u6210\u6570\u636e\uff1ay = 3x + 2 + noise\nkey = jax.random.PRNGKey(42)\nn = 100\nX = jax.random.uniform(key, (n, 1), minval=0, maxval=10)\ny = 3 * X[:, 0] + 2 + jax.random.normal(key, (n,)) * 1.5\n\n# \u6dfb\u52a0\u504f\u7f6e\u5217\nX_b = jnp.column_stack([X, jnp.ones(n)])\n\n# \u6b63\u89c4\u65b9\u7a0b\nw_exact = jnp.linalg.solve(X_b.T @ X_b, X_b.T @ y)\nprint(f\"Normal equation: w={w_exact[0]:.4f}, b={w_exact[1]:.4f}\")\n\n# \u68af\u5ea6\u4e0b\u964d\nw_gd = jnp.zeros(2)\nlr = 0.005\nlosses = []\nfor step in range(500):\n    pred = X_b @ w_gd\n    error = pred - y\n    loss = jnp.mean(error ** 2)\n    losses.append(float(loss))\n    grad = (2 / n) * X_b.T @ error\n    w_gd = w_gd - lr * grad\n\nprint(f\"Gradient descent: w={w_gd[0]:.4f}, b={w_gd[1]:.4f}\")\n\nfig, axes = plt.subplots(1, 2, figsize=(12, 4))\naxes[0].scatter(X[:, 0], y, s=15, alpha=0.5, color='#3498db')\naxes[0].plot([0, 10], [w_exact[1], w_exact[0]*10 + w_exact[1]], color='#e74c3c', linewidth=2)\naxes[0].set_title(\"Linear Regression Fit\")\naxes[0].set_xlabel(\"x\"); axes[0].set_ylabel(\"y\")\n\naxes[1].plot(losses, color='#27ae60', linewidth=1.5)\naxes[1].set_title(\"GD Loss Convergence\")\naxes[1].set_xlabel(\"Step\"); axes[1].set_ylabel(\"MSE\")\naxes[1].set_yscale('log')\nplt.tight_layout()\nplt.show()\n</code></pre></p> </li> <li> <p>\u4ece\u5934\u5b9e\u73b0\u5e26\u68af\u5ea6\u4e0b\u964d\u7684\u903b\u8f91\u56de\u5f52\u3002\u5728\u4e8c\u7ef4\u6570\u636e\u96c6\u4e0a\u8bad\u7ec3\u5e76\u53ef\u89c6\u5316\u5b66\u4e60\u5230\u7684\u51b3\u7b56\u8fb9\u754c\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\nfrom sklearn.datasets import make_moons\n\n# \u751f\u6210\u6570\u636e\nX, y = make_moons(n_samples=300, noise=0.2, random_state=42)\nX, y = jnp.array(X), jnp.array(y, dtype=jnp.float32)\n\ndef sigmoid(z):\n    return 1 / (1 + jnp.exp(-z))\n\n# \u6dfb\u52a0\u504f\u7f6e\u5217\nX_b = jnp.column_stack([X, jnp.ones(len(X))])\nw = jnp.zeros(3)\nlr = 0.5\nlosses = []\n\nfor step in range(2000):\n    z = X_b @ w\n    pred = sigmoid(z)\n    # BCE\u635f\u5931\n    loss = -jnp.mean(y * jnp.log(pred + 1e-8) + (1 - y) * jnp.log(1 - pred + 1e-8))\n    losses.append(float(loss))\n    # \u68af\u5ea6\n    grad = X_b.T @ (pred - y) / len(y)\n    w = w - lr * grad\n\n# \u51b3\u7b56\u8fb9\u754c\nxx, yy = jnp.meshgrid(jnp.linspace(-2, 3, 200), jnp.linspace(-1.5, 2, 200))\ngrid = jnp.column_stack([xx.ravel(), yy.ravel(), jnp.ones(xx.size)])\nzz = sigmoid(grid @ w).reshape(xx.shape)\n\nplt.figure(figsize=(8, 6))\nplt.contourf(xx, yy, zz, levels=[0, 0.5, 1], alpha=0.3, colors=['#e74c3c', '#3498db'])\nplt.contour(xx, yy, zz, levels=[0.5], colors='#9b59b6', linewidths=2)\nplt.scatter(X[y==0, 0], X[y==0, 1], c='#e74c3c', s=15, label='Class 0')\nplt.scatter(X[y==1, 0], X[y==1, 1], c='#3498db', s=15, label='Class 1')\nplt.title(\"Logistic Regression Decision Boundary\")\nplt.legend()\nplt.grid(alpha=0.3)\nplt.show()\n</code></pre></p> </li> <li> <p>\u5728\u4e8c\u7ef4\u4e8c\u6b21\u66f2\u9762\u4e0a\u6bd4\u8f83\u4f18\u5316\u5668\u7684\u8f68\u8ff9\u3002\u4ece\u76f8\u540c\u7684\u8d77\u70b9\u8fd0\u884cSGD\u3001SGD+Momentum\u548cAdam\uff0c\u7ed8\u5236\u5b83\u4eec\u7684\u8def\u5f84\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u62c9\u957f\u7684\u4e8c\u6b21\u66f2\u9762\uff1aL(w1, w2) = 0.5*w1^2 + 10*w2^2\ndef loss_fn(w):\n    return 0.5 * w[0]**2 + 10 * w[1]**2\n\ngrad_fn = jax.grad(loss_fn)\n\ndef run_sgd(w0, lr=0.05, steps=80):\n    w = w0.copy()\n    path = [w.copy()]\n    for _ in range(steps):\n        g = grad_fn(w)\n        w = w - lr * g\n        path.append(w.copy())\n    return jnp.stack(path)\n\ndef run_momentum(w0, lr=0.05, beta=0.9, steps=80):\n    w, v = w0.copy(), jnp.zeros(2)\n    path = [w.copy()]\n    for _ in range(steps):\n        g = grad_fn(w)\n        v = beta * v + (1 - beta) * g\n        w = w - lr * v\n        path.append(w.copy())\n    return jnp.stack(path)\n\ndef run_adam(w0, lr=0.05, b1=0.9, b2=0.999, eps=1e-8, steps=80):\n    w, m, v = w0.copy(), jnp.zeros(2), jnp.zeros(2)\n    path = [w.copy()]\n    for t in range(1, steps + 1):\n        g = grad_fn(w)\n        m = b1 * m + (1 - b1) * g\n        v = b2 * v + (1 - b2) * g**2\n        m_hat = m / (1 - b1**t)\n        v_hat = v / (1 - b2**t)\n        w = w - lr * m_hat / (jnp.sqrt(v_hat) + eps)\n        path.append(w.copy())\n    return jnp.stack(path)\n\nw0 = jnp.array([8.0, 3.0])\nsgd_path = run_sgd(w0)\nmom_path = run_momentum(w0)\nadam_path = run_adam(w0)\n\n# \u7ed8\u56fe\nfig, ax = plt.subplots(figsize=(8, 6))\nw1 = jnp.linspace(-10, 10, 100)\nw2 = jnp.linspace(-4, 4, 100)\nW1, W2 = jnp.meshgrid(w1, w2)\nL = 0.5 * W1**2 + 10 * W2**2\nax.contour(W1, W2, L, levels=20, cmap='Greys', alpha=0.4)\nax.plot(sgd_path[:,0], sgd_path[:,1], 'o-', color='#3498db', markersize=2, linewidth=1, label='SGD')\nax.plot(mom_path[:,0], mom_path[:,1], 'o-', color='#27ae60', markersize=2, linewidth=1, label='Momentum')\nax.plot(adam_path[:,0], adam_path[:,1], 'o-', color='#e74c3c', markersize=2, linewidth=1, label='Adam')\nax.plot(0, 0, 'k*', markersize=15, label='Minimum')\nax.set_xlabel('w\u2081'); ax.set_ylabel('w\u2082')\nax.set_title(\"Optimizer Trajectories on Elongated Quadratic\")\nax.legend()\nplt.grid(alpha=0.3)\nplt.show()\n</code></pre></p> </li> <li> <p>\u5c55\u793aL1\u4e0eL2\u6b63\u5219\u5316\u5bf9\u6743\u91cd\u7a00\u758f\u6027\u7684\u5f71\u54cd\u3002\u4f7f\u7528\u4e24\u79cd\u60e9\u7f5a\u8bad\u7ec3\u7ebf\u6027\u56de\u5f52\uff0c\u5e76\u6bd4\u8f83\u5f97\u5230\u7684\u6743\u91cd\u5411\u91cf\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u5408\u6210\u6570\u636e\uff1a20\u4e2a\u7279\u5f81\u4e2d\u53ea\u6709\u524d3\u4e2a\u662f\u76f8\u5173\u7684\nkey = jax.random.PRNGKey(0)\nn, d = 200, 20\nw_true = jnp.zeros(d).at[:3].set(jnp.array([3.0, -2.0, 1.5]))\nX = jax.random.normal(key, (n, d))\ny = X @ w_true + 0.5 * jax.random.normal(key, (n,))\n\ndef train_ridge(X, y, lam=1.0, lr=0.01, steps=2000):\n    \"\"\"\u901a\u8fc7GD\u8fdb\u884cL2\u6b63\u5219\u5316\u7ebf\u6027\u56de\u5f52\u3002\"\"\"\n    w = jnp.zeros(X.shape[1])\n    for _ in range(steps):\n        pred = X @ w\n        grad = (2/len(y)) * X.T @ (pred - y) + 2 * lam * w\n        w = w - lr * grad\n    return w\n\ndef train_lasso(X, y, lam=1.0, lr=0.01, steps=2000):\n    \"\"\"\u901a\u8fc7\u8fd1\u7aefGD\u8fdb\u884cL1\u6b63\u5219\u5316\u7ebf\u6027\u56de\u5f52\u3002\"\"\"\n    w = jnp.zeros(X.shape[1])\n    for _ in range(steps):\n        pred = X @ w\n        grad = (2/len(y)) * X.T @ (pred - y)\n        w = w - lr * grad\n        # \u8f6f\u9608\u503c\uff08L1\u7684\u8fd1\u7aef\u7b97\u5b50\uff09\n        w = jnp.sign(w) * jnp.maximum(jnp.abs(w) - lr * lam, 0)\n    return w\n\nw_l2 = train_ridge(X, y, lam=0.1)\nw_l1 = train_lasso(X, y, lam=0.1)\n\nfig, axes = plt.subplots(1, 3, figsize=(14, 4))\naxes[0].bar(range(d), w_true, color='#333', alpha=0.7)\naxes[0].set_title(\"True Weights\"); axes[0].set_xlabel(\"Feature\")\naxes[1].bar(range(d), w_l2, color='#3498db', alpha=0.7)\naxes[1].set_title(\"L2 (Ridge): shrinks all\"); axes[1].set_xlabel(\"Feature\")\naxes[2].bar(range(d), w_l1, color='#e74c3c', alpha=0.7)\naxes[2].set_title(\"L1 (Lasso): zeros out irrelevant\"); axes[2].set_xlabel(\"Feature\")\nplt.tight_layout()\nplt.show()\n\nprint(f\"L2 non-zero weights: {int(jnp.sum(jnp.abs(w_l2) &gt; 0.01))}/{d}\")\nprint(f\"L1 non-zero weights: {int(jnp.sum(jnp.abs(w_l1) &gt; 0.01))}/{d}\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2006%3A%20machine%20learning/03.%20deep%20learning/","title":"\u6df1\u5ea6\u5b66\u4e60","text":"<p>\u6df1\u5ea6\u5b66\u4e60\u5806\u53e0\u975e\u7ebf\u6027\u5c42\u6765\u6784\u5efa\u5c42\u6b21\u5316\u8868\u793a\uff0c\u81ea\u52a8\u5c06\u539f\u59cb\u8f93\u5165\u8f6c\u6362\u4e3a\u6709\u7528\u7684\u7279\u5f81\u3002\u672c\u6587\u6db5\u76d6MLP\u3001\u6fc0\u6d3b\u51fd\u6570\u3001\u53cd\u5411\u4f20\u64ad\u3001CNN\u3001RNN\u3001LSTM\u3001\u6ce8\u610f\u529b\u673a\u5236\u3001Transformer\u3001GAN\u3001VAE\u3001\u6269\u6563\u6a21\u578b\u548c\u5f52\u4e00\u5316\u6280\u672f</p> <ul> <li> <p>\u4ec0\u4e48\u4f7f\u7f51\u7edc\"\u6df1\"\uff1f\u6d45\u7f51\u7edc\u53ea\u6709\u4e00\u4e2a\u9690\u85cf\u5c42\uff1b\u6df1\u7f51\u7edc\u6709\u8bb8\u591a\u5c42\u3002\u6df1\u5ea6\u8ba9\u7f51\u7edc\u6784\u5efa\u5c42\u6b21\u5316\u8868\u793a\uff0c\u65e9\u671f\u5c42\u5b66\u4e60\u7b80\u5355\u7279\u5f81\uff08\u8fb9\u7f18\u3001\u97f3\u8c03\uff09\uff0c\u540e\u671f\u5c42\u5c06\u5b83\u4eec\u7ec4\u5408\u6210\u590d\u6742\u6982\u5ff5\uff08\u4eba\u8138\u3001\u53e5\u5b50\uff09\u3002\u8fd9\u79cd\u7ec4\u5408\u6027\u6b63\u662f\u6df1\u5ea6\u5b66\u4e60\u529b\u91cf\u7684\u6765\u6e90\u3002</p> </li> <li> <p>\u6700\u7b80\u5355\u7684\u6df1\u5ea6\u7f51\u7edc\u662f\u591a\u5c42\u611f\u77e5\u5668\uff08MLP\uff09\uff0c\u4e5f\u79f0\u4e3a\u5168\u8fde\u63a5\u6216\u5bc6\u96c6\u7f51\u7edc\u3002\u6bcf\u5c42\u8ba1\u7b97\uff1a</p> </li> </ul> \\[h = \\sigma(Wx + b)\\] <ul> <li> <p>\u8fd9\u91cc \\(W\\) \u662f\u6743\u91cd\u77e9\u9635\uff08\u7b2c02\u7ae0\uff09\uff0c\\(b\\) \u662f\u504f\u7f6e\u5411\u91cf\uff0c\\(\\sigma\\) \u662f\u975e\u7ebf\u6027\u6fc0\u6d3b\u51fd\u6570\u3002\u4e00\u5c42\u7684\u8f93\u51fa\u6210\u4e3a\u4e0b\u4e00\u5c42\u7684\u8f93\u5165\u3002\u6ca1\u6709\u975e\u7ebf\u6027\uff0c\u5806\u53e0\u5c42\u5c06\u6beb\u65e0\u610f\u4e49\uff1a\\(W_2(W_1 x) = (W_2 W_1)x\\)\uff0c\u8fd9\u53ea\u662f\u53e6\u4e00\u4e2a\u7ebf\u6027\u53d8\u6362\u3002\u8fd9\u6b63\u662f\u7b2c02\u7ae0\u4e2d\u7684\u77e9\u9635\u4e58\u6cd5\u584c\u7f29\u3002</p> </li> <li> <p>\u6fc0\u6d3b\u51fd\u6570\u5f15\u5165\u4f7f\u6df1\u5ea6\u6709\u610f\u4e49\u7684\u975e\u7ebf\u6027\u3002</p> </li> <li> <p>ReLU\uff08\u4fee\u6b63\u7ebf\u6027\u5355\u5143\uff09\uff1a\\(\\text{ReLU}(x) = \\max(0, x)\\)\u3002\u5b83\u662f\u4f7f\u7528\u6700\u5e7f\u6cdb\u7684\u6fc0\u6d3b\u51fd\u6570\u3002\u8ba1\u7b97\u901f\u5ea6\u5feb\uff0c\u6b63\u8f93\u5165\u4e0d\u9971\u548c\uff0c\u5e76\u4ea7\u751f\u7a00\u758f\u6fc0\u6d3b\uff08\u8bb8\u591a\u795e\u7ecf\u5143\u8f93\u51fa\u7cbe\u786e\u4e3a\u96f6\uff09\u3002\u7f3a\u70b9\uff1a\u8d1f\u8f93\u5165\u7684\u795e\u7ecf\u5143\u603b\u662f\u8f93\u51fa\u96f6\uff0c\u5982\u679c\u5b83\u4eec\u6c38\u4e45\u5361\u5728\u90a3\u91cc\uff0c\u5c31\u4f1a\"\u6b7b\u4ea1\"\u5e76\u505c\u6b62\u5b66\u4e60\u3002</p> </li> <li> <p>Sigmoid\uff1a\\(\\sigma(x) = \\frac{1}{1+e^{-x}}\\)\uff0c\u5c06\u8f93\u5165\u538b\u7f29\u5230 \\((0, 1)\\)\u3002\u9002\u7528\u4e8e\u4e8c\u5143\u5206\u7c7b\u7684\u8f93\u51fa\u5c42\uff0c\u4f46\u5728\u9690\u85cf\u5c42\u4e2d\u6709\u95ee\u9898\uff0c\u56e0\u4e3a\u5f53\u8f93\u5165\u8fdc\u79bb\u96f6\u65f6\u68af\u5ea6\u6d88\u5931\uff08\u66f2\u7ebf\u51e0\u4e4e\u5e73\u5766\uff09\u3002</p> </li> <li> <p>Tanh\uff1a\\(\\tanh(x) = \\frac{e^x - e^{-x}}{e^x + e^{-x}}\\)\uff0c\u538b\u7f29\u5230 \\((-1, 1)\\)\u3002\u96f6\u4e2d\u5fc3\uff08\u4e0d\u540c\u4e8esigmoid\uff09\uff0c\u6709\u52a9\u4e8e\u68af\u5ea6\u6d41\u52a8\uff0c\u4f46\u5728\u6781\u7aef\u503c\u5904\u4ecd\u5b58\u5728\u68af\u5ea6\u6d88\u5931\u95ee\u9898\u3002</p> </li> <li> <p>GELU\uff08\u9ad8\u65af\u8bef\u5dee\u7ebf\u6027\u5355\u5143\uff09\uff1a\\(\\text{GELU}(x) = x \\cdot \\Phi(x)\\)\uff0c\u5176\u4e2d \\(\\Phi\\) \u662f\u6807\u51c6\u6b63\u6001CDF\u3002\u5b83\u662fReLU\u7684\u5e73\u6ed1\u8fd1\u4f3c\uff0c\u5141\u8bb8\u5fae\u5c0f\u7684\u8d1f\u503c\u901a\u8fc7\u3002GELU\u662fGPT\u548cBERT\u4e2d\u7684\u9ed8\u8ba4\u9009\u62e9\u3002</p> </li> <li> <p>Swish\uff1a\\(\\text{Swish}(x) = x \\cdot \\sigma(x)\\)\uff0c\u53e6\u4e00\u79cd\u5e73\u6ed1\u95e8\u63a7\u3002\u5b9e\u9645\u4f7f\u7528\u4e2d\u4e0eGELU\u7c7b\u4f3c\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u4e00\u4e2a\u5177\u6709 \\(d_{\\text{in}}\\) \u4e2a\u8f93\u5165\u548c \\(d_{\\text{out}}\\) \u4e2a\u8f93\u51fa\u7684\u5bc6\u96c6\u5c42\u6709 \\(d_{\\text{in}} \\times d_{\\text{out}} + d_{\\text{out}}\\) \u4e2a\u53c2\u6570\uff08\u6743\u91cd\u52a0\u504f\u7f6e\uff09\u3002\u77e9\u9635\u4e58\u6cd5 \\(Wx\\) \u5c31\u662f\u7b2c02\u7ae0\u4e2d\u7684\u77e9\u9635-\u5411\u91cf\u4e58\u6cd5\u3002\u5728\u6279\u5904\u7406\u8bbe\u7f6e\u4e2d\uff0c\u8f93\u5165\u662f\u5f62\u72b6\u4e3a \\((B, d_{\\text{in}})\\) \u7684\u77e9\u9635 \\(X\\)\uff0c\u8f93\u51fa\u662f\u5f62\u72b6\u4e3a \\((B, d_{\\text{out}})\\) \u7684 \\(XW^T + b\\)\u3002</p> </li> <li> <p>\u4e07\u80fd\u8fd1\u4f3c\u5b9a\u7406\u6307\u51fa\uff0c\u4e00\u4e2a\u5177\u6709\u8db3\u591f\u795e\u7ecf\u5143\u7684\u9690\u85cf\u5c42\u53ef\u4ee5\u5728\u7d27\u81f4\u57df\u4e0a\u4ee5\u4efb\u610f\u7cbe\u5ea6\u903c\u8fd1\u4efb\u4f55\u8fde\u7eed\u51fd\u6570\u3002\u8fd9\u542c\u8d77\u6765\u4f3c\u4e4e\u6df1\u5ea6\u65e0\u5173\u7d27\u8981\uff0c\u4f46\u5173\u952e\u5728\u4e8e\"\u8db3\u591f\u7684\u795e\u7ecf\u5143\"\u3002\u5b9e\u9645\u4e0a\uff0c\u6df1\u5c42\u7f51\u7edc\u53ef\u4ee5\u7528\u6307\u6570\u7ea7\u5c11\u4e8e\u6d45\u5c42\u7f51\u7edc\u7684\u53c2\u6570\u6765\u8868\u793a\u76f8\u540c\u7684\u51fd\u6570\u3002\u6df1\u5ea6\u5e26\u6765\u7684\u662f\u6548\u7387\uff0c\u800c\u4e0d\u4ec5\u4ec5\u662f\u8868\u8fbe\u80fd\u529b\u3002</p> </li> <li> <p>\u968f\u7740\u7f51\u7edc\u53d8\u6df1\uff0c\u51fa\u73b0\u4e24\u79cd\u68af\u5ea6\u75c5\u7406\u3002\u68af\u5ea6\u6d88\u5931\uff1a\u5f53\u68af\u5ea6\u901a\u8fc7\u8bb8\u591a\u5c42\u65f6\uff08\u901a\u8fc7\u94fe\u5f0f\u6cd5\u5219\uff0c\u7b2c03\u7ae0\uff09\uff0c\u5b83\u4eec\u88ab\u4e58\u4ee5\u8bb8\u591a\u56e0\u5b50\u3002\u5982\u679c\u8fd9\u4e9b\u56e0\u5b50\u90fd\u5c0f\u4e8e1\uff08\u5982sigmoid\u548ctanh\u9971\u548c\u65f6\u53d1\u751f\u7684\u60c5\u51b5\uff09\uff0c\u68af\u5ea6\u5448\u6307\u6570\u7ea7\u7f29\u5c0f\u8d8b\u8fd1\u4e8e\u96f6\u3002\u65e9\u671f\u5c42\u51e0\u4e4e\u65e0\u6cd5\u5b66\u4e60\u3002\u68af\u5ea6\u7206\u70b8\uff1a\u5982\u679c\u56e0\u5b50\u90fd\u5927\u4e8e1\uff0c\u68af\u5ea6\u5448\u6307\u6570\u7ea7\u589e\u957f\uff0c\u5bfc\u81f4\u6570\u503c\u6ea2\u51fa\u548c\u8bad\u7ec3\u4e0d\u7a33\u5b9a\u3002</p> </li> <li> <p>\u68af\u5ea6\u6d88\u5931/\u7206\u70b8\u7684\u89e3\u51b3\u65b9\u6848\uff1a</p> </li> <li>\u4f7f\u7528ReLU\u6216GELU\u6fc0\u6d3b\u51fd\u6570\uff08\u6b63\u8f93\u5165\u65f6\u68af\u5ea6\u4e3a1\uff0c\u65e0\u9971\u548c\uff09</li> <li>\u4ed4\u7ec6\u7684\u6743\u91cd\u521d\u59cb\u5316</li> <li>\u5f52\u4e00\u5316\u5c42</li> <li>\u6b8b\u5dee\u8fde\u63a5\uff08\u8df3\u8dc3\u8fde\u63a5\uff09</li> <li> <p>\u68af\u5ea6\u88c1\u526a\uff08\u9488\u5bf9\u68af\u5ea6\u7206\u70b8\uff09\uff1a\u5c06\u68af\u5ea6\u8303\u6570\u9650\u5236\u5728\u6700\u5927\u503c</p> </li> <li> <p>\u6743\u91cd\u521d\u59cb\u5316\u5f88\u91cd\u8981\uff0c\u56e0\u4e3a\u5b83\u51b3\u5b9a\u4e86\u8bad\u7ec3\u5f00\u59cb\u65f6\u6fc0\u6d3b\u503c\u548c\u68af\u5ea6\u7684\u5c3a\u5ea6\u3002\u5982\u679c\u6743\u91cd\u592a\u5927\uff0c\u6fc0\u6d3b\u503c\u7206\u70b8\uff1b\u592a\u5c0f\uff0c\u5b83\u4eec\u6d88\u5931\u3002</p> </li> <li> <p>Xavier (Glorot) \u521d\u59cb\u5316\u4ece\u65b9\u5dee\u4e3a \\(\\frac{2}{d_{\\text{in}} + d_{\\text{out}}}\\) \u7684\u5206\u5e03\u4e2d\u8bbe\u7f6e\u6743\u91cd\u3002\u8fd9\u5047\u8bbe\u4f7f\u7528\u7ebf\u6027\u6216tanh\u6fc0\u6d3b\u51fd\u6570\u65f6\uff0c\u80fd\u4f7f\u6fc0\u6d3b\u503c\u7684\u65b9\u5dee\u5728\u5404\u5c42\u5927\u81f4\u4fdd\u6301\u6052\u5b9a\u3002</p> </li> <li> <p>He (Kaiming) \u521d\u59cb\u5316\u4f7f\u7528\u65b9\u5dee \\(\\frac{2}{d_{\\text{in}}}\\)\uff0c\u9488\u5bf9ReLU\u6fc0\u6d3b\u51fd\u6570\u6821\u51c6\uff08\u7531\u4e8eReLU\u5c06\u534a\u6570\u6fc0\u6d3b\u503c\u7f6e\u96f6\uff0c\u9700\u8981\u53cc\u500d\u65b9\u5dee\u6765\u8865\u507f\uff09\u3002</p> </li> <li> <p>\u5f52\u4e00\u5316\u5c42\u901a\u8fc7\u786e\u4fdd\u6bcf\u5c42\u7684\u8f93\u5165\u5177\u6709\u4e00\u81f4\u7684\u7edf\u8ba1\u7279\u6027\uff08\u5927\u81f4\u96f6\u5747\u503c\u3001\u5355\u4f4d\u65b9\u5dee\uff09\u6765\u7a33\u5b9a\u8bad\u7ec3\u3002</p> </li> <li> <p>\u6279\u5f52\u4e00\u5316\uff08BatchNorm\uff09 \u5728\u6279\u6b21\u7ef4\u5ea6\u4e0a\u8fdb\u884c\u5f52\u4e00\u5316\uff1a\u5bf9\u4e8e\u6bcf\u4e2a\u901a\u9053/\u7279\u5f81\uff0c\u8ba1\u7b97\u5c0f\u6279\u6b21\u4e2d\u6240\u6709\u6837\u672c\u7684\u5747\u503c\u548c\u65b9\u5dee\uff0c\u7136\u540e\u5f52\u4e00\u5316\u3002\u5b83\u6dfb\u52a0\u4e86\u53ef\u5b66\u4e60\u7684\u5c3a\u5ea6\uff08\\(\\gamma\\)\uff09\u548c\u504f\u79fb\uff08\\(\\beta\\)\uff09\u53c2\u6570\uff0c\u4ee5\u4fbf\u7f51\u7edc\u5728\u9700\u8981\u65f6\u64a4\u9500\u5f52\u4e00\u5316\uff1a</p> </li> </ul> \\[\\hat{x} = \\frac{x - \\mu_B}{\\sqrt{\\sigma_B^2 + \\epsilon}}, \\quad y = \\gamma \\hat{x} + \\beta\\] <ul> <li> <p>BatchNorm\u6709\u4e00\u4e2a\u95ee\u9898\uff1a\u5b83\u4f9d\u8d56\u4e8e\u6279\u91cf\u5927\u5c0f\u3002\u5f53\u6279\u6b21\u975e\u5e38\u5c0f\u65f6\uff0c\u7edf\u8ba1\u6570\u636e\u6709\u566a\u58f0\u3002\u5728\u63a8\u7406\u65f6\uff0c\u4f7f\u7528\u8fd0\u884c\u5e73\u5747\u503c\u800c\u975e\u6279\u6b21\u7edf\u8ba1\uff0c\u8fd9\u9020\u6210\u4e86\u8bad\u7ec3/\u6d4b\u8bd5\u4e0d\u4e00\u81f4\u3002</p> </li> <li> <p>\u5c42\u5f52\u4e00\u5316\uff08LayerNorm\uff09 \u5bf9\u6bcf\u4e2a\u5355\u72ec\u6837\u672c\u5728\u7279\u5f81\u7ef4\u5ea6\u4e0a\u8fdb\u884c\u5f52\u4e00\u5316\u3002\u5b83\u4e0d\u4f9d\u8d56\u4e8e\u6279\u6b21\u4e2d\u7684\u5176\u4ed6\u6837\u672c\uff0c\u4f7f\u5176\u6210\u4e3aTransformer\u548c\u5faa\u73af\u7f51\u7edc\u7684\u6807\u51c6\u9009\u62e9\u3002</p> </li> <li> <p>\u5b9e\u4f8b\u5f52\u4e00\u5316 \u5bf9\u6bcf\u4e2a\u6837\u672c\u548c\u6bcf\u4e2a\u901a\u9053\u72ec\u7acb\u5730\u5728\u7a7a\u95f4\u7ef4\u5ea6\u4e0a\u8fdb\u884c\u5f52\u4e00\u5316\u3002\u5728\u98ce\u683c\u8fc1\u79fb\u4e2d\u5f88\u6d41\u884c\u3002</p> </li> <li> <p>\u7ec4\u5f52\u4e00\u5316 \u5c06\u901a\u9053\u5206\u6210\u7ec4\u5e76\u5728\u6bcf\u4e2a\u7ec4\u5185\u8fdb\u884c\u5f52\u4e00\u5316\u3002\u5b83\u662fLayerNorm\u548cInstanceNorm\u4e4b\u95f4\u7684\u6298\u4e2d\u3002</p> </li> </ul> <p></p> <ul> <li> <p>Dropout \u662f\u4e00\u79cd\u6b63\u5219\u5316\u6280\u672f\uff0c\u5728\u8bad\u7ec3\u671f\u95f4\u968f\u673a\u5c06\u4e00\u90e8\u5206 \\(p\\) \u7684\u795e\u7ecf\u5143\u7f6e\u96f6\u3002\u8fd9\u8feb\u4f7f\u7f51\u7edc\u4e0d\u4f9d\u8d56\u4efb\u4f55\u5355\u4e2a\u795e\u7ecf\u5143\uff0c\u9f13\u52b1\u5197\u4f59\u8868\u793a\u3002\u6d4b\u8bd5\u65f6\uff0c\u6240\u6709\u795e\u7ecf\u5143\u90fd\u88ab\u6fc0\u6d3b\u3002\u9006\u7f6eDropout \u5728\u8bad\u7ec3\u671f\u95f4\u5c06\u6fc0\u6d3b\u503c\u7f29\u653e \\(\\frac{1}{1-p}\\)\uff0c\u4ee5\u4fbf\u6d4b\u8bd5\u65f6\u65e0\u9700\u7f29\u653e\u3002\u8fd9\u662f\u6807\u51c6\u5b9e\u73b0\u3002</p> </li> <li> <p>\u5377\u79ef\u795e\u7ecf\u7f51\u7edc\uff08CNN\uff09 \u5229\u7528\u4e86\u7a7a\u95f4\u7ed3\u6784\u3002\u5377\u79ef\u5c42\u4e0d\u662f\u5c06\u6bcf\u4e2a\u8f93\u5165\u8fde\u63a5\u5230\u6bcf\u4e2a\u8f93\u51fa\uff08\u5982\u5bc6\u96c6\u5c42\uff09\uff0c\u800c\u662f\u5728\u8f93\u5165\u4e0a\u6ed1\u52a8\u4e00\u4e2a\u5c0f\u6ee4\u6ce2\u5668\uff08\u6838\uff09\uff0c\u5728\u6bcf\u4e2a\u4f4d\u7f6e\u8ba1\u7b97\u70b9\u79ef\u3002\u76f8\u540c\u7684\u6ee4\u6ce2\u5668\u6743\u91cd\u5728\u6240\u6709\u4f4d\u7f6e\u5171\u4eab\uff0c\u8fd9\u5927\u5927\u51cf\u5c11\u4e86\u53c2\u6570\u5e76\u5185\u5efa\u4e86\u5e73\u79fb\u4e0d\u53d8\u6027\u3002</p> </li> <li> <p>\u4e8c\u7ef4\u8f93\u5165\u4e0e\u5927\u5c0f\u4e3a \\(k \\times k\\) \u7684\u6ee4\u6ce2\u5668 \\(K\\) \u7684\u5377\u79ef\u64cd\u4f5c\uff1a</p> </li> </ul> \\[(\\text{input} * K)[i,j] = \\sum_{m=0}^{k-1} \\sum_{n=0}^{k-1} \\text{input}[i+m, j+n] \\cdot K[m, n]\\] <p></p> <ul> <li> <p>\u8f93\u51fa\u5927\u5c0f\u53d6\u51b3\u4e8e\u4e09\u4e2a\u8d85\u53c2\u6570\u3002\u6b65\u5e45\u63a7\u5236\u6ee4\u6ce2\u5668\u5728\u4f4d\u7f6e\u4e4b\u95f4\u79fb\u52a8\u591a\u5c11\u50cf\u7d20\uff08\u6b65\u5e452\u4f7f\u7a7a\u95f4\u7ef4\u5ea6\u51cf\u534a\uff09\u3002\u586b\u5145\u5728\u8f93\u5165\u8fb9\u754c\u5468\u56f4\u6dfb\u52a0\u96f6\uff08\"same\"\u586b\u5145\u4fdd\u6301\u7a7a\u95f4\u5927\u5c0f\uff0c\"valid\"\u586b\u5145\u4e0d\u586b\u5145\uff09\u3002\u8f93\u51fa\u5927\u5c0f\u516c\u5f0f\uff1a\\(\\text{out} = \\lfloor (\\text{in} - k + 2p) / s \\rfloor + 1\\)\u3002</p> </li> <li> <p>\u6c60\u5316\u5c42\u5bf9\u7279\u5f81\u56fe\u8fdb\u884c\u4e0b\u91c7\u6837\u3002\u6700\u5927\u6c60\u5316\u53d6\u6bcf\u4e2a\u7a97\u53e3\u4e2d\u7684\u6700\u5927\u503c\uff1b\u5e73\u5747\u6c60\u5316\u53d6\u5747\u503c\u3002\u6c60\u5316\u5728\u4fdd\u7559\u6700\u91cd\u8981\u4fe1\u606f\u7684\u540c\u65f6\u51cf\u5c11\u7a7a\u95f4\u7ef4\u5ea6\u3002</p> </li> <li> <p>\u6269\u5f20\u5377\u79ef \u5728\u6ee4\u6ce2\u5668\u5143\u7d20\u4e4b\u95f4\u63d2\u5165\u95f4\u9699\uff0c\u589e\u52a0\u611f\u53d7\u91ce\u800c\u4e0d\u589e\u52a0\u53c2\u6570\u3002\u6269\u5f20\u7387\u4e3a2\u610f\u5473\u77403x3\u6ee4\u6ce2\u5668\u8986\u76d65x5\u533a\u57df\u3002</p> </li> <li> <p>1x1\u5377\u79ef \u662f\u4f7f\u75281x1\u6ee4\u6ce2\u5668\u7684\u5377\u79ef\u3002\u5b83\u4eec\u4e0d\u67e5\u770b\u7a7a\u95f4\u90bb\u5c45\uff1b\u800c\u662f\u8de8\u901a\u9053\u6df7\u5408\u4fe1\u606f\u3002\u53ef\u4ee5\u5c06\u5176\u89c6\u4e3a\u5728\u6bcf\u4e2a\u7a7a\u95f4\u4f4d\u7f6e\u5e94\u7528\u5bc6\u96c6\u5c42\u3002\u7528\u4e8e\u5ec9\u4ef7\u5730\u6539\u53d8\u901a\u9053\u6570\u3002</p> </li> <li> <p>\u8df3\u8dc3\u8fde\u63a5\uff08\u6b8b\u5dee\u8fde\u63a5\uff09\u8ba9\u8f93\u5165\u7ed5\u8fc7\u4e00\u5c42\u6216\u591a\u5c42\uff1a\\(\\text{output} = F(x) + x\\)\u3002\u8be5\u5c42\u53ea\u9700\u5b66\u4e60\u6b8b\u5dee \\(F(x) = \\text{output} - x\\)\uff0c\u5f53\u6700\u4f18\u53d8\u6362\u63a5\u8fd1\u6052\u7b49\u6620\u5c04\u65f6\u8fd9\u66f4\u5bb9\u6613\u3002ResNet\uff08\u6b8b\u5dee\u7f51\u7edc\uff09\u4f7f\u7528\u8fd9\u4e00\u6280\u5de7\u5806\u53e0\u8d85\u8fc7100\u5c42\uff0c\u89e3\u51b3\u4e86\u66f4\u6df1\u7684\u7f51\u7edc\u8868\u73b0\u6bd4\u6d45\u5c42\u7f51\u7edc\u66f4\u5dee\u7684\u9000\u5316\u95ee\u9898\u3002</p> </li> <li> <p>CNN\u6784\u5efa\u4e86\u4e00\u4e2a\u7279\u5f81\u5c42\u6b21\u7ed3\u6784\u3002\u65e9\u671f\u5c42\u68c0\u6d4b\u8fb9\u7f18\u548c\u7eb9\u7406\u3002\u4e2d\u95f4\u5c42\u5c06\u8fd9\u4e9b\u7ec4\u5408\u6210\u90e8\u4ef6\uff08\u773c\u775b\u3001\u8f6e\u5b50\uff09\u3002\u540e\u671f\u5c42\u8bc6\u522b\u6574\u4e2a\u7269\u4f53\u3002\u6bcf\u5c42\u7684\u611f\u53d7\u91ce\uff08\u5b83\"\u770b\u5230\"\u7684\u8f93\u5165\u533a\u57df\uff09\u968f\u6df1\u5ea6\u589e\u52a0\u3002</p> </li> <li> <p>\u5d4c\u5165\u5c06\u79bb\u6563\u7684\u6807\u8bb0\uff08\u5355\u8bcd\u3001\u5b57\u7b26\u3001\u7269\u54c1ID\uff09\u6620\u5c04\u5230\u5bc6\u96c6\u5411\u91cf\u3002\u5d4c\u5165\u5c42\u53ea\u662f\u4e00\u4e2a\u67e5\u627e\u8868\uff1a\u4e00\u4e2a\u5f62\u72b6\u4e3a\uff08\u8bcd\u6c47\u8868\u5927\u5c0f\uff0c\u5d4c\u5165\u7ef4\u5ea6\uff09\u7684\u77e9\u9635 \\(E\\)\u3002\u67e5\u627e\u6807\u8bb0 \\(i\\) \u610f\u5473\u7740\u9009\u62e9 \\(E\\) \u7684\u7b2c \\(i\\) \u884c\u3002\u8fd9\u7b49\u4ef7\u4e8e\u4e58\u4ee5one-hot\u5411\u91cf\uff0c\u8fd9\u53ea\u662f\u77e9\u9635-\u5411\u91cf\u4e58\u6cd5\u7684\u4e00\u4e2a\u7279\u4f8b\uff08\u7b2c02\u7ae0\uff09\u3002\u5d4c\u5165\u5728\u8bad\u7ec3\u671f\u95f4\u5b66\u4e60\uff0c\u56e0\u6b64\u76f8\u4f3c\u7684\u6807\u8bb0\u6700\u7ec8\u5177\u6709\u76f8\u4f3c\u7684\u5411\u91cf\u3002</p> </li> <li> <p>\u5206\u8bcd\u662f\u5c06\u539f\u59cb\u6587\u672c\u8f6c\u6362\u4e3a\u6807\u8bb0\u5e8f\u5217\u7684\u8fc7\u7a0b\u3002\u8bcd\u7ea7\u5206\u8bcd\u6309\u7a7a\u683c\u5206\u5272\uff0c\u4f46\u65e0\u6cd5\u5904\u7406\u672a\u89c1\u8fc7\u7684\u8bcd\u3002\u5b50\u8bcd\u5206\u8bcd\uff08BPE\u3001WordPiece\u3001SentencePiece\uff09\u5c06\u6587\u672c\u5206\u89e3\u4e3a\u9891\u7e41\u7684\u5b50\u8bcd\u5355\u5143\uff0c\u5e73\u8861\u8bcd\u6c47\u8868\u5927\u5c0f\u548c\u8986\u76d6\u7387\u3002\u5355\u8bcd\"unhappiness\"\u53ef\u80fd\u53d8\u6210[\"un\", \"happiness\"]\u6216[\"un\", \"happ\", \"iness\"]\u3002</p> </li> <li> <p>\u5faa\u73af\u795e\u7ecf\u7f51\u7edc\uff08RNN\uff09 \u4e00\u6b21\u5904\u7406\u4e00\u4e2a\u5e8f\u5217\u5143\u7d20\uff0c\u7ef4\u62a4\u4e00\u4e2a\u5411\u524d\u4f20\u9012\u4fe1\u606f\u7684\u9690\u85cf\u72b6\u6001\uff1a</p> </li> </ul> \\[h_t = \\tanh(W_h h_{t-1} + W_x x_t + b)\\] <ul> <li> <p>\u9690\u85cf\u72b6\u6001 \\(h_t\\) \u662f\u7f51\u7edc\u5230\u65f6\u95f4 \\(t\\) \u4e3a\u6b62\u6240\u770b\u5230\u5185\u5bb9\u7684\u538b\u7f29\u6458\u8981\u3002\u76f8\u540c\u7684\u6743\u91cd \\(W_h\\) \u548c \\(W_x\\) \u5728\u6240\u6709\u65f6\u95f4\u6b65\u5171\u4eab\uff08\u6743\u91cd\u5171\u4eab\uff0c\u5982\u540cCNN\u5171\u4eab\u7a7a\u95f4\u6743\u91cd\uff09\u3002</p> </li> <li> <p>\u539f\u59cbRNN\u5728\u957f\u5e8f\u5217\u4e0a\u5b58\u5728\u68af\u5ea6\u6d88\u5931\u95ee\u9898\uff1a\u4ece\u6b65\u9aa4 \\(t\\) \u5230\u6b65\u9aa4 \\(t - k\\) \u7684\u68af\u5ea6\u4fe1\u53f7\u7ecf\u8fc7 \\(k\\) \u6b21\u4e0e \\(W_h\\) \u7684\u4e58\u6cd5\uff0c\u5448\u6307\u6570\u7ea7\u7f29\u5c0f\uff08\u6216\u7206\u70b8\uff09\u3002</p> </li> <li> <p>LSTM\uff08\u957f\u77ed\u65f6\u8bb0\u5fc6\u7f51\u7edc\uff09\u901a\u8fc7\u5f15\u5165\u4e00\u4e2a\u72ec\u7acb\u7684\u7ec6\u80de\u72b6\u6001 \\(c_t\\) \u6765\u89e3\u51b3\u8fd9\u4e00\u95ee\u9898\uff0c\u8be5\u72b6\u6001\u4ee5\u6700\u5c0f\u5e72\u6270\u6d41\u8fc7\u65f6\u95f4\u3002\u4e09\u4e2a\u95e8\u63a7\u5236\u54ea\u4e9b\u4fe1\u606f\u8fdb\u5165\u3001\u79bb\u5f00\u548c\u6301\u7eed\u5b58\u5728\uff1a</p> </li> <li> <p>\u9057\u5fd8\u95e8\u51b3\u5b9a\u4ece\u7ec6\u80de\u72b6\u6001\u4e2d\u64e6\u9664\u4ec0\u4e48\uff1a\\(f_t = \\sigma(W_f [h_{t-1}, x_t] + b_f)\\)</p> </li> <li>\u8f93\u5165\u95e8\u51b3\u5b9a\u5199\u5165\u4ec0\u4e48\u65b0\u4fe1\u606f\uff1a\\(i_t = \\sigma(W_i [h_{t-1}, x_t] + b_i)\\)\uff0c\u5019\u9009\u503c \\(\\tilde{c}_t = \\tanh(W_c [h_{t-1}, x_t] + b_c)\\)</li> <li>\u7ec6\u80de\u72b6\u6001\u66f4\u65b0\uff1a\\(c_t = f_t \\odot c_{t-1} + i_t \\odot \\tilde{c}_t\\)</li> <li>\u8f93\u51fa\u95e8\u51b3\u5b9a\u66b4\u9732\u4ec0\u4e48\uff1a\\(o_t = \\sigma(W_o [h_{t-1}, x_t] + b_o)\\)\uff0c\\(h_t = o_t \\odot \\tanh(c_t)\\)</li> </ul> <p></p> <ul> <li> <p>\u7ec6\u80de\u72b6\u6001\u50cf\u4f20\u9001\u5e26\u4e00\u6837\u5de5\u4f5c\uff1a\u4fe1\u606f\u53ef\u4ee5\u4e0d\u53d8\u5730\u6d41\u8fc7\u8bb8\u591a\u65f6\u95f4\u6b65\uff08\u9057\u5fd8\u95e8\u4fdd\u6301\u63a5\u8fd11\uff09\uff0c\u8fd9\u89e3\u51b3\u4e86\u957f\u8ddd\u79bb\u4f9d\u8d56\u7684\u68af\u5ea6\u6d88\u5931\u95ee\u9898\u3002</p> </li> <li> <p>GRU\uff08\u95e8\u63a7\u5faa\u73af\u5355\u5143\uff09\u901a\u8fc7\u5c06\u7ec6\u80de\u72b6\u6001\u548c\u9690\u85cf\u72b6\u6001\u5408\u5e76\u4e3a\u4e00\u4e2a\uff0c\u5e76\u4f7f\u7528\u4e24\u4e2a\u95e8\uff08\u66f4\u65b0\u95e8\u548c\u91cd\u7f6e\u95e8\uff09\u4ee3\u66ff\u4e09\u4e2a\u95e8\u6765\u7b80\u5316LSTM\u3002GRU\u53c2\u6570\u66f4\u5c11\uff0c\u901a\u5e38\u8868\u73b0\u4e0eLSTM\u76f8\u5f53\u3002</p> </li> <li> <p>RNN\uff08\u5305\u62ecLSTM\uff09\u7684\u6839\u672c\u9650\u5236\u662f\u987a\u5e8f\u5904\u7406\uff1a\u5fc5\u987b\u6309\u987a\u5e8f\u5904\u7406\u6807\u8bb01\u3001\u6807\u8bb02\u3001\u6807\u8bb03\u3002\u8fd9\u963b\u6b62\u4e86\u5e76\u884c\u5316\u5e76\u9020\u6210\u4fe1\u606f\u74f6\u9888\uff0c\u56e0\u4e3a\u6240\u6709\u4e0a\u4e0b\u6587\u5fc5\u987b\u901a\u8fc7\u56fa\u5b9a\u5927\u5c0f\u7684\u9690\u85cf\u72b6\u6001\u3002</p> </li> <li> <p>\u6ce8\u610f\u529b\u673a\u5236\u89e3\u51b3\u4e86\u8fd9\u4e24\u4e2a\u95ee\u9898\u3002\u6ce8\u610f\u529b\u673a\u5236\u4e0d\u662f\u5c06\u6574\u4e2a\u8f93\u5165\u538b\u7f29\u4e3a\u56fa\u5b9a\u5411\u91cf\uff0c\u800c\u662f\u8ba9\u6a21\u578b\u56de\u987e\u6240\u6709\u8f93\u5165\u4f4d\u7f6e\u5e76\u51b3\u5b9a\u54ea\u4e9b\u4f4d\u7f6e\u4e0e\u5f53\u524d\u8f93\u51fa\u76f8\u5173\u3002</p> </li> <li> <p>\u73b0\u4ee3\u516c\u5f0f\u4f7f\u7528\u67e5\u8be2\u3001\u952e\u548c\u503c\uff08Q, K, V\uff09\u3002\u5c06\u5176\u60f3\u8c61\u4e3a\u56fe\u4e66\u9986\u641c\u7d22\uff1a\u4f60\u6709\u4e00\u4e2a\u67e5\u8be2\uff08\u4f60\u5728\u627e\u4ec0\u4e48\uff09\u3001\u952e\uff08\u6bcf\u672c\u4e66\u7684\u6807\u7b7e\uff09\u548c\u503c\uff08\u5b9e\u9645\u4e66\u7c4d\u5185\u5bb9\uff09\u3002\u4f60\u5c06\u67e5\u8be2\u4e0e\u6240\u6709\u952e\u6bd4\u8f83\uff0c\u4ee5\u786e\u5b9a\u68c0\u7d22\u54ea\u4e9b\u503c\u3002</p> </li> <li> <p>\u7f29\u653e\u70b9\u79ef\u6ce8\u610f\u529b\uff1a</p> </li> </ul> \\[\\text{Attention}(Q, K, V) = \\text{softmax}\\!\\left(\\frac{QK^T}{\\sqrt{d_k}}\\right) V\\] <ul> <li> <p>\\(QK^T\\) \u8ba1\u7b97\u6bcf\u4e2a\u67e5\u8be2\u548c\u6bcf\u4e2a\u952e\u4e4b\u95f4\u7684\u76f8\u4f3c\u5ea6\u3002\u8fd9\u662f\u77e9\u9635\u4e58\u6cd5\uff08\u7b2c02\u7ae0\uff09\uff0c\u5176\u4e2d\u7684\u6761\u76ee\u662f\u70b9\u79ef\uff0c\u8861\u91cf\u4f59\u5f26\u76f8\u4f3c\u5ea6\uff08\u7b2c01\u7ae0\uff09\u3002\u9664\u4ee5 \\(\\sqrt{d_k}\\) \u9632\u6b62\u70b9\u79ef\u53d8\u5f97\u592a\u5927\uff08\u8fd9\u4f1a\u4f7fsoftmax\u9971\u548c\u5e76\u4ea7\u751f\u63a5\u8fd1one-hot\u5206\u5e03\uff0c\u5bfc\u81f4\u68af\u5ea6\u6d88\u5931\uff09\u3002Softmax\u5c06\u76f8\u4f3c\u5ea6\u8f6c\u6362\u4e3a\u6982\u7387\u5206\u5e03\u3002\u4e58\u4ee5 \\(V\\) \u4ea7\u751f\u503c\u7684\u52a0\u6743\u7ec4\u5408\u3002</p> </li> <li> <p>\u591a\u5934\u6ce8\u610f\u529b\u8fd0\u884c \\(h\\) \u4e2a\u5e76\u884c\u7684\u6ce8\u610f\u529b\u64cd\u4f5c\uff0c\u6bcf\u4e2a\u4f7f\u7528\u4e0d\u540c\u7684Q\u3001K\u3001V\u5b66\u4e60\u6295\u5f71\u3002\u8fd9\u8ba9\u6a21\u578b\u540c\u65f6\u4ece\u4e0d\u540c\u7684\u8868\u793a\u5b50\u7a7a\u95f4\u5173\u6ce8\u4fe1\u606f\u3002\u4e00\u4e2a\u5934\u53ef\u80fd\u5173\u6ce8\u53e5\u6cd5\u5173\u7cfb\uff0c\u800c\u53e6\u4e00\u4e2a\u5173\u6ce8\u8bed\u4e49\u5173\u7cfb\u3002\u8f93\u51fa\u88ab\u62fc\u63a5\u5e76\u6295\u5f71\uff1a</p> </li> </ul> \\[\\text{MultiHead}(Q, K, V) = \\text{Concat}(\\text{head}_1, \\ldots, \\text{head}_h) W^O\\] <ul> <li>Transformer\u67b6\u6784\uff08Vaswani\u7b49\u4eba\uff0c2017\uff09\u5b8c\u5168\u7531\u6ce8\u610f\u529b\u548c\u524d\u9988\u5c42\u6784\u5efa\uff0c\u6ca1\u6709\u5faa\u73af\u3002\u7f16\u7801\u5668\u5757\u91cd\u590d\uff1a\u591a\u5934\u81ea\u6ce8\u610f\u529b\u3001\u52a0\u6cd5\u548c\u5c42\u5f52\u4e00\u5316\u3001\u524d\u9988\u7f51\u7edc\u3001\u52a0\u6cd5\u548c\u5c42\u5f52\u4e00\u5316\u3002\u89e3\u7801\u5668\u5757\u6dfb\u52a0\u4e86\u63a9\u7801\u81ea\u6ce8\u610f\u529b\uff08\u9632\u6b62\u6a21\u578b\u770b\u5230\u672a\u6765\u7684\u6807\u8bb0\uff09\u548c\u5173\u6ce8\u7f16\u7801\u5668\u8f93\u51fa\u7684\u4ea4\u53c9\u6ce8\u610f\u529b\u5c42\u3002</li> </ul> <p></p> <ul> <li>\u4f4d\u7f6e\u7f16\u7801\u662f\u5fc5\u9700\u7684\uff0c\u56e0\u4e3a\u6ce8\u610f\u529b\u662f\u6392\u5217\u7b49\u53d8\u7684\uff0c\u610f\u5473\u7740\u5b83\u5c06\u8f93\u5165\u89c6\u4e3a\u96c6\u5408\u800c\u975e\u5e8f\u5217\u3002\u6ca1\u6709\u4f4d\u7f6e\u4fe1\u606f\uff0c\"\u732b\u5750\u5728\u57ab\u5b50\u4e0a\"\u548c\"\u57ab\u5b50\u5750\u5728\u732b\u4e0a\"\u5c06\u662f\u76f8\u540c\u7684\u3002\u539f\u59cbTransformer\u4f7f\u7528\u6b63\u5f26\u4f4d\u7f6e\u7f16\u7801\uff1a</li> </ul> \\[PE_{(pos, 2i)} = \\sin\\!\\left(\\frac{pos}{10000^{2i/d}}\\right), \\quad PE_{(pos, 2i+1)} = \\cos\\!\\left(\\frac{pos}{10000^{2i/d}}\\right)\\] <ul> <li> <p>\u6bcf\u4e2a\u4f4d\u7f6e\u83b7\u5f97\u4e00\u4e2a\u552f\u4e00\u7684\u5411\u91cf\uff0c\u6a21\u578b\u53ef\u4ee5\u7528\u6765\u533a\u5206\u4f4d\u7f6e\u3002\u73b0\u4ee3\u6a21\u578b\u901a\u5e38\u4f7f\u7528\u5b66\u4e60\u7684\u4f4d\u7f6e\u5d4c\u5165\u6216\u76f8\u5bf9\u4f4d\u7f6e\u7f16\u7801\uff08RoPE\u3001ALiBi\uff09\u4ee3\u66ff\u3002</p> </li> <li> <p>Transformer\u5e76\u884c\u5904\u7406\u6240\u6709\u6807\u8bb0\uff08\u81ea\u6ce8\u610f\u529b\u77e9\u9635 \\(QK^T\\) \u5728\u4e00\u6b21\u77e9\u9635\u4e58\u6cd5\u4e2d\u8ba1\u7b97\uff09\uff0c\u8fd9\u4f7f\u5f97\u5b83\u4eec\u5728\u73b0\u4ee3\u786c\u4ef6\u4e0a\u6bd4RNN\u8bad\u7ec3\u66f4\u5feb\u3002\u6743\u8861\u662f\u81ea\u6ce8\u610f\u529b\u5728\u5e8f\u5217\u957f\u5ea6\u4e0a\u662f \\(O(n^2)\\)\uff08\u6bcf\u4e2a\u6807\u8bb0\u5173\u6ce8\u6bcf\u4e2a\u5176\u4ed6\u6807\u8bb0\uff09\uff0c\u800cRNN\u662f \\(O(n)\\)\u3002\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48\u957f\u4e0a\u4e0b\u6587\u6a21\u578b\u9700\u8981\u7279\u6b8a\u7684\u6ce8\u610f\u529b\u53d8\u4f53\uff08\u7a00\u758f\u6ce8\u610f\u529b\u3001\u7ebf\u6027\u6ce8\u610f\u529b\u3001Flash Attention\uff09\u3002</p> </li> <li> <p>\u89c6\u89c9Transformer\uff08ViT\uff09 \u901a\u8fc7\u5c06\u56fe\u50cf\u5206\u5272\u4e3a\u56fa\u5b9a\u5927\u5c0f\u7684\u5757\uff08\u598216x16\uff09\uff0c\u5c06\u6bcf\u4e2a\u5757\u5c55\u5e73\u4e3a\u5411\u91cf\uff0c\u5e76\u5c06\u8fd9\u4e9b\u5757\u89c6\u4e3a\u6807\u8bb0\u5e8f\u5217\uff0c\u5c06Transformer\u5e94\u7528\u4e8e\u56fe\u50cf\u3002\u4e00\u4e2a\u53ef\u5b66\u4e60\u7684[CLS]\u6807\u8bb0\u88ab\u524d\u7f6e\uff0c\u5176\u6700\u7ec8\u8868\u793a\u7528\u4e8e\u5206\u7c7b\u3002\u5c3d\u7ba1\u6ca1\u6709\u5377\u79ef\u7684\u5f52\u7eb3\u504f\u7f6e\uff0cViT\u5728\u8db3\u591f\u6570\u636e\u4e0a\u8bad\u7ec3\u65f6\u53ef\u4ee5\u5339\u914d\u6216\u8d85\u8d8aCNN\u3002</p> </li> <li> <p>MLP-Mixer \u662f\u4e00\u79cd\u66f4\u7b80\u5355\u7684\u67b6\u6784\uff0c\u7528MLP\u66ff\u4ee3\u4e86\u6ce8\u610f\u529b\u548c\u5377\u79ef\u3002\u5b83\u5728\"\u6807\u8bb0\u6df7\u5408\"MLP\uff08\u8de8\u7a7a\u95f4\u4f4d\u7f6e\u5e94\u7528\uff09\u548c\"\u901a\u9053\u6df7\u5408\"MLP\uff08\u8de8\u7279\u5f81\u5e94\u7528\uff09\u4e4b\u95f4\u4ea4\u66ff\u3002\u5b83\u7684\u8868\u73b0\u5177\u6709\u7ade\u4e89\u529b\uff0c\u8868\u660e\u73b0\u4ee3\u67b6\u6784\u7684\u5173\u952e\u6d1e\u5bdf\u4e0d\u662f\u6ce8\u610f\u529b\u672c\u8eab\uff0c\u800c\u662f\u8de8\u6807\u8bb0\u548c\u7279\u5f81\u7684\u9ad8\u6548\u4fe1\u606f\u6df7\u5408\u3002</p> </li> <li> <p>\u81ea\u7f16\u7801\u5668\u901a\u8fc7\u8bad\u7ec3\u7f51\u7edc\u91cd\u6784\u81ea\u8eab\u8f93\u5165\u6765\u5b66\u4e60\u538b\u7f29\u8868\u793a\u3002\u7f16\u7801\u5668\u5c06\u8f93\u5165\u6620\u5c04\u5230\u4f4e\u7ef4\u74f6\u9888\uff08\u6f5c\u7801\uff09\uff0c\u89e3\u7801\u5668\u5c06\u5176\u6620\u5c04\u56de\u6765\uff1a</p> </li> </ul> \\[z = f_{\\text{enc}}(x), \\quad \\hat{x} = f_{\\text{dec}}(z), \\quad \\mathcal{L} = \\|x - \\hat{x}\\|^2\\] <ul> <li> <p>\u74f6\u9888\u8feb\u4f7f\u7f51\u7edc\u5b66\u4e60\u6700\u91cd\u8981\u7684\u7279\u5f81\u3002\u81ea\u7f16\u7801\u5668\u7528\u4e8e\u964d\u7ef4\u3001\u53bb\u566a\uff08\u5728\u566a\u58f0\u8f93\u5165\u4e0a\u8bad\u7ec3\uff0c\u91cd\u6784\u5e72\u51c0\u8f93\u51fa\uff09\u548c\u5f02\u5e38\u68c0\u6d4b\uff08\u9ad8\u91cd\u6784\u8bef\u5dee\u8868\u660e\u8f93\u5165\u5f02\u5e38\uff09\u3002</p> </li> <li> <p>\u53d8\u5206\u81ea\u7f16\u7801\u5668\uff08VAE\uff09 \u589e\u52a0\u4e86\u6982\u7387\u7684\u53d8\u4f53\u3002\u7f16\u7801\u5668\u4e0d\u662f\u7f16\u7801\u5230\u5355\u4e2a\u70b9 \\(z\\)\uff0c\u800c\u662f\u8f93\u51fa\u5206\u5e03\u7684\u53c2\u6570\uff08\u9ad8\u65af\u7684\u5747\u503c \\(\\mu\\) \u548c\u65b9\u5dee \\(\\sigma^2\\)\uff09\u3002\u6f5c\u7801\u4ece\u6b64\u5206\u5e03\u4e2d\u91c7\u6837\uff1a\\(z = \\mu + \\sigma \\odot \\epsilon\\)\uff0c\u5176\u4e2d \\(\\epsilon \\sim \\mathcal{N}(0, I)\\)\u3002\u8fd9\u4e2a\u91cd\u53c2\u6570\u5316\u6280\u5de7\u4f7f\u91c7\u6837\u53ef\u5fae\uff0c\u68af\u5ea6\u53ef\u4ee5\u6d41\u8fc7\u3002</p> </li> <li> <p>VAE\u635f\u5931\u6709\u4e24\u4e2a\u9879\uff1a</p> </li> </ul> \\[\\mathcal{L} = \\underbrace{\\|x - \\hat{x}\\|^2}_{\\text{reconstruction}} + \\underbrace{D_{\\text{KL}}(q(z|x) \\| p(z))}_{\\text{regularisation}}\\] <ul> <li>KL\u6563\u5ea6\u9879\uff08\u6765\u81ea\u7b2c05\u7ae0\uff09\u5c06\u5b66\u4e60\u5230\u7684\u540e\u9a8c \\(q(z|x)\\) \u63a8\u5411\u5148\u9a8c \\(p(z) = \\mathcal{N}(0, I)\\)\uff0c\u786e\u4fdd\u6f5c\u7a7a\u95f4\u5e73\u6ed1\u4e14\u7ed3\u6784\u826f\u597d\u3002\u7136\u540e\u4f60\u53ef\u4ee5\u4ece\u5148\u9a8c\u4e2d\u91c7\u6837\u5e76\u89e3\u7801\u4ee5\u751f\u6210\u65b0\u6570\u636e\u3002\u8fd9\u5c31\u662f\u4f7fVAE\u6210\u4e3a\u751f\u6210\u6a21\u578b\u7684\u539f\u56e0\u3002</li> </ul>"},{"location":"chapter%2006%3A%20machine%20learning/03.%20deep%20learning/#colab","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u5728CoLab\u6216\u7b14\u8bb0\u672c\u4e2d\u5b8c\u6210\uff09","text":"<ol> <li> <p>\u5728JAX\u4e2d\u4ece\u5934\u6784\u5efa\u4e00\u4e2a\u7b80\u5355\u7684MLP\u3002\u5728\u4e8c\u7ef4\u5206\u7c7b\u95ee\u9898\uff08\u5982\u540c\u5fc3\u5706\uff09\u4e0a\u8bad\u7ec3\u5e76\u53ef\u89c6\u5316\u51b3\u7b56\u8fb9\u754c\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\nfrom sklearn.datasets import make_circles\n\n# \u6570\u636e\nX, y = make_circles(n_samples=500, noise=0.1, factor=0.5, random_state=42)\nX, y = jnp.array(X), jnp.array(y, dtype=jnp.float32)\n\n# \u521d\u59cb\u5316\u4e00\u4e2a2\u5c42MLP\uff1a2 -&gt; 16 -&gt; 16 -&gt; 1\ndef init_params(key):\n    k1, k2, k3 = jax.random.split(key, 3)\n    return {\n        'W1': jax.random.normal(k1, (2, 16)) * 0.5,\n        'b1': jnp.zeros(16),\n        'W2': jax.random.normal(k2, (16, 16)) * 0.5,\n        'b2': jnp.zeros(16),\n        'W3': jax.random.normal(k3, (16, 1)) * 0.5,\n        'b3': jnp.zeros(1),\n    }\n\ndef forward(params, x):\n    h = jnp.maximum(0, x @ params['W1'] + params['b1'])  # ReLU\n    h = jnp.maximum(0, h @ params['W2'] + params['b2'])   # ReLU\n    logit = (h @ params['W3'] + params['b3']).squeeze()\n    return jax.nn.sigmoid(logit)\n\ndef loss_fn(params, X, y):\n    pred = forward(params, X)\n    return -jnp.mean(y * jnp.log(pred + 1e-7) + (1 - y) * jnp.log(1 - pred + 1e-7))\n\ngrad_fn = jax.jit(jax.grad(loss_fn))\nparams = init_params(jax.random.PRNGKey(0))\nlr = 0.1\n\nfor step in range(2000):\n    grads = grad_fn(params, X, y)\n    params = {k: params[k] - lr * grads[k] for k in params}\n\n# \u7ed8\u5236\u51b3\u7b56\u8fb9\u754c\nxx, yy = jnp.meshgrid(jnp.linspace(-2, 2, 200), jnp.linspace(-2, 2, 200))\ngrid = jnp.column_stack([xx.ravel(), yy.ravel()])\nzz = forward(params, grid).reshape(xx.shape)\n\nplt.figure(figsize=(7, 6))\nplt.contourf(xx, yy, zz, levels=[0, 0.5, 1], alpha=0.3, colors=['#e74c3c', '#3498db'])\nplt.scatter(X[y==0,0], X[y==0,1], c='#e74c3c', s=10, label='Class 0')\nplt.scatter(X[y==1,0], X[y==1,1], c='#3498db', s=10, label='Class 1')\nplt.title(\"MLP Decision Boundary on Concentric Circles\")\nplt.legend(); plt.grid(alpha=0.3); plt.show()\n\nacc = jnp.mean((forward(params, X) &gt; 0.5) == y)\nprint(f\"Accuracy: {acc:.2%}\")\n</code></pre></p> </li> <li> <p>\u4ece\u5934\u5b9e\u73b0\u4e00\u7ef4\u5377\u79ef\u3002\u5c06\u7b80\u5355\u7684\u8fb9\u7f18\u68c0\u6d4b\u6ee4\u6ce2\u5668\u5e94\u7528\u4e8e\u4fe1\u53f7\uff0c\u5e76\u4e0e\u5185\u7f6e\u7684 <code>jnp.convolve</code> \u8fdb\u884c\u6bd4\u8f83\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef conv1d(signal, kernel):\n    \"\"\"\u4ece\u5934\u5b9e\u73b0\u4e00\u7ef4\u5377\u79ef\uff08valid\u6a21\u5f0f\uff09\u3002\"\"\"\n    n, k = len(signal), len(kernel)\n    output = jnp.zeros(n - k + 1)\n    for i in range(n - k + 1):\n        output = output.at[i].set(jnp.sum(signal[i:i+k] * kernel))\n    return output\n\n# \u521b\u5efa\u4e00\u4e2a\u5e26\u6709\u9636\u8dc3\u51fd\u6570\u7684\u4fe1\u53f7\nt = jnp.linspace(0, 4, 200)\nsignal = jnp.where(t &lt; 1, 0.0, jnp.where(t &lt; 2, 1.0, jnp.where(t &lt; 3, 0.5, 1.5)))\n\n# \u8fb9\u7f18\u68c0\u6d4b\u6838\nedge_kernel = jnp.array([-1.0, 0.0, 1.0])\n\n# \u6211\u4eec\u7684\u5b9e\u73b0 vs \u5185\u7f6e\u51fd\u6570\nour_output = conv1d(signal, edge_kernel)\njnp_output = jnp.convolve(signal, edge_kernel, mode='valid')\n\nfig, axes = plt.subplots(3, 1, figsize=(10, 6), sharex=True)\naxes[0].plot(t, signal, color='#3498db', linewidth=1.5)\naxes[0].set_title(\"Original Signal\"); axes[0].set_ylabel(\"Value\")\n\naxes[1].plot(t[:len(our_output)], our_output, color='#e74c3c', linewidth=1.5)\naxes[1].set_title(\"After Edge Detection (our conv1d)\"); axes[1].set_ylabel(\"Value\")\n\naxes[2].plot(t[:len(jnp_output)], jnp_output, color='#27ae60', linewidth=1.5, linestyle='--')\naxes[2].set_title(\"After Edge Detection (jnp.convolve)\"); axes[2].set_ylabel(\"Value\")\naxes[2].set_xlabel(\"t\")\n\nplt.tight_layout(); plt.show()\nprint(f\"Outputs match: {jnp.allclose(our_output, jnp_output)}\")\n</code></pre></p> </li> <li> <p>\u4ece\u5934\u5b9e\u73b0\u7f29\u653e\u70b9\u79ef\u6ce8\u610f\u529b\u3002\u4e3a\u4e00\u4e2a\u5c0f\u4f8b\u5b50\u8ba1\u7b97\u6ce8\u610f\u529b\u6743\u91cd\uff0c\u5e76\u5c06\u6ce8\u610f\u529b\u77e9\u9635\u53ef\u89c6\u5316\u4e3a\u70ed\u529b\u56fe\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef scaled_dot_product_attention(Q, K, V):\n    \"\"\"\u7f29\u653e\u70b9\u79ef\u6ce8\u610f\u529b\u3002\"\"\"\n    d_k = Q.shape[-1]\n    scores = Q @ K.T / jnp.sqrt(d_k)\n    weights = jax.nn.softmax(scores, axis=-1)\n    output = weights @ V\n    return output, weights\n\n# \u793a\u4f8b\uff1a4\u4e2a\u6807\u8bb0\uff0c\u5d4c\u5165\u7ef4\u5ea68\nkey = jax.random.PRNGKey(42)\nk1, k2, k3 = jax.random.split(key, 3)\nseq_len, d_model = 4, 8\n\nQ = jax.random.normal(k1, (seq_len, d_model))\nK = jax.random.normal(k2, (seq_len, d_model))\nV = jax.random.normal(k3, (seq_len, d_model))\n\noutput, weights = scaled_dot_product_attention(Q, K, V)\n\nprint(f\"Q shape: {Q.shape}\")\nprint(f\"Attention weights shape: {weights.shape}\")\nprint(f\"Output shape: {output.shape}\")\nprint(f\"\\nAttention weights (rows sum to 1):\")\nprint(weights)\nprint(f\"Row sums: {weights.sum(axis=-1)}\")\n\n# \u53ef\u89c6\u5316\u6ce8\u610f\u529b\nfig, ax = plt.subplots(figsize=(5, 4))\nim = ax.imshow(weights, cmap='Blues', vmin=0, vmax=1)\nax.set_xlabel(\"Key position\"); ax.set_ylabel(\"Query position\")\nax.set_title(\"Attention Weights\")\ntokens = ['tok 0', 'tok 1', 'tok 2', 'tok 3']\nax.set_xticks(range(4)); ax.set_xticklabels(tokens)\nax.set_yticks(range(4)); ax.set_yticklabels(tokens)\nfor i in range(4):\n    for j in range(4):\n        ax.text(j, i, f\"{weights[i,j]:.2f}\", ha='center', va='center', fontsize=10)\nplt.colorbar(im); plt.tight_layout(); plt.show()\n</code></pre></p> </li> <li> <p>\u6784\u5efa\u4e00\u4e2a\u7b80\u5355\u7684\u81ea\u7f16\u7801\u5668\uff0c\u901a\u8fc7\u4e00\u7ef4\u74f6\u9888\u538b\u7f29\u4e8c\u7ef4\u6570\u636e\u5e76\u91cd\u5efa\u3002\u53ef\u89c6\u5316\u6f5c\u7a7a\u95f4\u548c\u91cd\u5efa\u7ed3\u679c\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\nfrom sklearn.datasets import make_moons\n\n# \u6570\u636e\nX, _ = make_moons(n_samples=500, noise=0.05, random_state=42)\nX = jnp.array(X)\n\n# \u81ea\u7f16\u7801\u5668\uff1a2 -&gt; 8 -&gt; 1 -&gt; 8 -&gt; 2\ndef init_ae(key):\n    k1, k2, k3, k4 = jax.random.split(key, 4)\n    return {\n        'enc_W1': jax.random.normal(k1, (2, 8)) * 0.5, 'enc_b1': jnp.zeros(8),\n        'enc_W2': jax.random.normal(k2, (8, 1)) * 0.5, 'enc_b2': jnp.zeros(1),\n        'dec_W1': jax.random.normal(k3, (1, 8)) * 0.5, 'dec_b1': jnp.zeros(8),\n        'dec_W2': jax.random.normal(k4, (8, 2)) * 0.5, 'dec_b2': jnp.zeros(2),\n    }\n\ndef encode(p, x):\n    h = jnp.tanh(x @ p['enc_W1'] + p['enc_b1'])\n    return h @ p['enc_W2'] + p['enc_b2']\n\ndef decode(p, z):\n    h = jnp.tanh(z @ p['dec_W1'] + p['dec_b1'])\n    return h @ p['dec_W2'] + p['dec_b2']\n\ndef ae_loss(p, X):\n    z = encode(p, X)\n    X_hat = decode(p, z)\n    return jnp.mean((X - X_hat) ** 2)\n\ngrad_fn = jax.jit(jax.grad(ae_loss))\nparams = init_ae(jax.random.PRNGKey(0))\nlr = 0.01\n\nfor step in range(3000):\n    grads = grad_fn(params, X)\n    params = {k: params[k] - lr * grads[k] for k in params}\n\nz = encode(params, X)\nX_hat = decode(params, z)\n\nfig, axes = plt.subplots(1, 2, figsize=(12, 5))\naxes[0].scatter(X[:,0], X[:,1], c=z.squeeze(), cmap='viridis', s=10)\naxes[0].set_title(\"Original Data (coloured by latent code)\")\naxes[1].scatter(X_hat[:,0], X_hat[:,1], c=z.squeeze(), cmap='viridis', s=10)\naxes[1].set_title(\"Reconstruction from 1D bottleneck\")\nfor ax in axes:\n    ax.set_aspect('equal'); ax.grid(alpha=0.3)\nplt.tight_layout(); plt.show()\n\nprint(f\"Reconstruction MSE: {ae_loss(params, X):.4f}\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2006%3A%20machine%20learning/04.%20reinforcement%20learning/","title":"\u5f3a\u5316\u5b66\u4e60","text":"<p>\u5f3a\u5316\u5b66\u4e60\u901a\u8fc7\u8bd5\u9519\u6cd5\u6700\u5927\u5316\u7d2f\u79ef\u5956\u52b1\u6765\u8bad\u7ec3\u667a\u80fd\u4f53\u505a\u51fa\u5e8f\u5217\u51b3\u7b56\u3002\u672c\u6587\u4ef6\u6db5\u76d6MDP\u3001\u4ef7\u503c\u51fd\u6570\u3001\u8d1d\u5c14\u66fc\u65b9\u7a0b\u3001Q\u5b66\u4e60\u3001\u7b56\u7565\u68af\u5ea6\u3001\u6f14\u5458-\u8bc4\u8bba\u5bb6\u65b9\u6cd5\u3001PPO\u548cRLHF\u2014\u2014\u8fd9\u4e9b\u662f\u6e38\u620f\u667a\u80fd\u4f53\u548c\u8bed\u8a00\u6a21\u578b\u5bf9\u9f50\u80cc\u540e\u7684\u6846\u67b6\u3002</p> <ul> <li> <p>\u76d1\u7763\u5b66\u4e60\u9700\u8981\u6807\u6ce8\u6570\u636e\u3002\u65e0\u76d1\u7763\u5b66\u4e60\u5728\u65e0\u6807\u6ce8\u6570\u636e\u4e2d\u53d1\u73b0\u6a21\u5f0f\u3002\u5f3a\u5316\u5b66\u4e60\uff08RL\uff09 \u4e0e\u4e24\u8005\u90fd\u4e0d\u540c\uff1a\u667a\u80fd\u4f53\u901a\u8fc7\u4e0e\u73af\u5883\u7684\u4ea4\u4e92\u3001\u91c7\u53d6\u884c\u52a8\u548c\u63a5\u6536\u5956\u52b1\u6765\u5b66\u4e60\u3002\u6ca1\u6709\u6b63\u786e\u7684\u6807\u7b7e\uff1b\u667a\u80fd\u4f53\u5fc5\u987b\u901a\u8fc7\u8bd5\u9519\u6765\u53d1\u73b0\u597d\u7684\u884c\u4e3a\u3002</p> </li> <li> <p>\u60f3\u8c61\u6559\u72d7\u4e00\u4e2a\u65b0\u628a\u620f\u3002\u4f60\u4e0d\u4f1a\u7ed9\u5b83\u5c55\u793a\u4e00\u4e2a\u6b63\u786e\u884c\u4e3a\u7684\u6570\u636e\u96c6\u3002\u76f8\u53cd\uff0c\u5b83\u5c1d\u8bd5\u5404\u79cd\u52a8\u4f5c\uff0c\u4f60\u5bf9\u597d\u7684\u884c\u4e3a\u7ed9\u4e88\u5956\u52b1\uff0c\u968f\u7740\u65f6\u95f4\u7684\u63a8\u79fb\u5b83\u660e\u767d\u4e86\u4f60\u60f3\u8981\u4ec0\u4e48\u3002RL\u5c06\u8fd9\u4e2a\u5f62\u5f0f\u5316\u3002</p> </li> <li> <p>RL\u8bbe\u7f6e\u5305\u542b\u4e94\u4e2a\u6838\u5fc3\u7ec4\u4ef6\u3002\u667a\u80fd\u4f53\uff08agent\uff09 \u662f\u5b66\u4e60\u8005\u548c\u51b3\u7b56\u8005\u3002\u73af\u5883\uff08environment\uff09 \u662f\u667a\u80fd\u4f53\u4e4b\u5916\u4e0e\u4e4b\u4ea4\u4e92\u7684\u4e00\u5207\u3002\u5728\u6bcf\u4e2a\u65f6\u95f4\u6b65\uff0c\u667a\u80fd\u4f53\u89c2\u5bdf\u4e00\u4e2a\u72b6\u6001\uff08state\uff09 \\(s_t\\)\uff0c\u9009\u62e9\u4e00\u4e2a\u52a8\u4f5c\uff08action\uff09 \\(a_t\\)\uff0c\u63a5\u6536\u4e00\u4e2a\u5956\u52b1\uff08reward\uff09 \\(r_t\\)\uff0c\u5e76\u8f6c\u79fb\u5230\u65b0\u72b6\u6001 \\(s_{t+1}\\)\u3002\u667a\u80fd\u4f53\u7684\u76ee\u6807\u662f\u6700\u5927\u5316\u5176\u968f\u65f6\u95f4\u6536\u96c6\u7684\u603b\u5956\u52b1\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u7b56\u7565\uff08policy\uff09 \\(\\pi\\) \u662f\u667a\u80fd\u4f53\u7684\u7b56\u7565\uff1a\u4ece\u72b6\u6001\u5230\u52a8\u4f5c\u7684\u6620\u5c04\u3002\u786e\u5b9a\u6027\u7b56\u7565\u5bf9\u6bcf\u4e2a\u72b6\u6001\u7ed9\u51fa\u4e00\u4e2a\u52a8\u4f5c\uff1a\\(a = \\pi(s)\\)\u3002\u968f\u673a\u7b56\u7565\u7ed9\u51fa\u52a8\u4f5c\u4e0a\u7684\u6982\u7387\u5206\u5e03\uff1a\\(\\pi(a \\mid s)\\)\u3002RL\u7684\u76ee\u6807\u662f\u627e\u5230\u6700\u4f18\u7b56\u7565\uff0c\u5373\u6700\u5927\u5316\u671f\u671b\u7d2f\u79ef\u5956\u52b1\u7684\u7b56\u7565\u3002</p> </li> <li> <p>RL\u7684\u6570\u5b66\u6846\u67b6\u662f\u9a6c\u5c14\u53ef\u592b\u51b3\u7b56\u8fc7\u7a0b\uff08MDP\uff09\uff0c\u7531\u5143\u7ec4 \\((S, A, P, R, \\gamma)\\) \u5b9a\u4e49\uff1a\u4e00\u7ec4\u72b6\u6001 \\(S\\)\uff0c\u4e00\u7ec4\u52a8\u4f5c \\(A\\)\uff0c\u8f6c\u79fb\u6982\u7387 \\(P(s' \\mid s, a)\\)\uff0c\u5956\u52b1\u51fd\u6570 \\(R(s, a)\\)\uff0c\u4ee5\u53ca\u6298\u6263\u56e0\u5b50 \\(\\gamma\\)\u3002</p> </li> <li> <p>\u9a6c\u5c14\u53ef\u592b\u6027\u8d28\uff08\u6765\u81ea\u7b2c05\u7ae0\uff09\u6307\u51fa\u672a\u6765\u4ec5\u53d6\u51b3\u4e8e\u5f53\u524d\u72b6\u6001\uff0c\u800c\u4e0d\u662f\u5982\u4f55\u5230\u8fbe\u90a3\u91cc\u7684\u5386\u53f2\uff1a\\(P(s_{t+1} \\mid s_t, a_t, s_{t-1}, \\ldots) = P(s_{t+1} \\mid s_t, a_t)\\)\u3002\u8fd9\u610f\u5473\u7740\u72b6\u6001\u5305\u542b\u4e86\u505a\u51fa\u51b3\u7b56\u6240\u9700\u7684\u5168\u90e8\u4fe1\u606f\u3002</p> </li> <li> <p>\u6298\u6263\u56e0\u5b50 \\(\\gamma \\in [0, 1)\\) \u51b3\u5b9a\u4e86\u667a\u80fd\u4f53\u5bf9\u672a\u6765\u5956\u52b1\u76f8\u5bf9\u4e8e\u5373\u65f6\u5956\u52b1\u7684\u91cd\u89c6\u7a0b\u5ea6\u3002\u4ece\u65f6\u95f4 \\(t\\) \u5f00\u59cb\u7684\u6298\u6263\u56de\u62a5\u4e3a\uff1a</p> </li> </ul> \\[G_t = r_t + \\gamma r_{t+1} + \\gamma^2 r_{t+2} + \\cdots = \\sum_{k=0}^{\\infty} \\gamma^k r_{t+k}\\] <ul> <li> <p>\u5f53 \\(\\gamma = 0\\) \u65f6\uff0c\u667a\u80fd\u4f53\u5b8c\u5168\u77ed\u89c6\uff0c\u53ea\u5173\u5fc3\u4e0b\u4e00\u4e2a\u5956\u52b1\u3002\u5f53 \\(\\gamma\\) \u63a5\u8fd11\u65f6\uff0c\u667a\u80fd\u4f53\u5177\u6709\u957f\u8fdc\u773c\u5149\u3002\u6298\u6263\u56e0\u5b50\u8fd8\u786e\u4fdd\u4e86\u6c42\u548c\u6536\u655b\uff08\u5982\u679c\u5956\u52b1\u6709\u754c\uff09\uff0c\u8fd9\u5bf9\u6570\u5b66\u4e0a\u7684\u826f\u5b9a\u4e49\u6027\u5f88\u91cd\u8981\u3002</p> </li> <li> <p>\u4ef7\u503c\u51fd\u6570\u4f30\u8ba1\u5904\u4e8e\u67d0\u4e2a\u72b6\u6001\uff08\u6216\u5728\u67d0\u4e2a\u72b6\u6001\u4e0b\u91c7\u53d6\u67d0\u4e2a\u52a8\u4f5c\uff09\u6709\u591a\u597d\u3002\u72b6\u6001\u4ef7\u503c\u51fd\u6570 \\(V^\\pi(s)\\) \u662f\u4ece\u72b6\u6001 \\(s\\) \u5f00\u59cb\u5e76\u6309\u7167\u7b56\u7565 \\(\\pi\\) \u884c\u52a8\u6240\u83b7\u5f97\u7684\u671f\u671b\u56de\u62a5\uff1a</p> </li> </ul> \\[V^\\pi(s) = \\mathbb{E}_\\pi \\left[ G_t \\mid s_t = s \\right]\\] <ul> <li>\u52a8\u4f5c\u4ef7\u503c\u51fd\u6570 \\(Q^\\pi(s, a)\\) \u662f\u4ece\u72b6\u6001 \\(s\\) \u5f00\u59cb\uff0c\u91c7\u53d6\u52a8\u4f5c \\(a\\)\uff0c\u7136\u540e\u6309\u7167 \\(\\pi\\) \u884c\u52a8\u6240\u83b7\u5f97\u7684\u671f\u671b\u56de\u62a5\uff1a</li> </ul> \\[Q^\\pi(s, a) = \\mathbb{E}_\\pi \\left[ G_t \\mid s_t = s, a_t = a \\right]\\] <ul> <li> <p>\u4e24\u8005\u5173\u7cfb\uff1a\\(V^\\pi(s) = \\sum_a \\pi(a \\mid s) \\, Q^\\pi(s, a)\\)\u3002\u72b6\u6001\u4ef7\u503c\u662f\u52a8\u4f5c\u4ef7\u503c\u6309\u7b56\u7565\u52a0\u6743\u7684\u5e73\u5747\u503c\u3002</p> </li> <li> <p>\u8d1d\u5c14\u66fc\u65b9\u7a0b\u8868\u8fbe\u4e86\u9012\u5f52\u5173\u7cfb\uff1a\u4e00\u4e2a\u72b6\u6001\u7684\u4ef7\u503c\u7b49\u4e8e\u5373\u65f6\u5956\u52b1\u52a0\u4e0a\u4e0b\u4e00\u4e2a\u72b6\u6001\u7684\u6298\u6263\u4ef7\u503c\u3002\u5bf9\u4e8e\u72b6\u6001\u4ef7\u503c\u51fd\u6570\uff1a</p> </li> </ul> \\[V^\\pi(s) = \\sum_a \\pi(a \\mid s) \\sum_{s'} P(s' \\mid s, a) \\left[ R(s, a) + \\gamma \\, V^\\pi(s') \\right]\\] <ul> <li>\u5bf9\u4e8e\u6700\u4f18\u4ef7\u503c\u51fd\u6570 \\(V^{*}(s)\\)\uff0c\u667a\u80fd\u4f53\u603b\u662f\u9009\u62e9\u6700\u4f73\u52a8\u4f5c\uff1a</li> </ul> \\[V^{*}(s) = \\max_a \\sum_{s'} P(s' \\mid s, a) \\left[ R(s, a) + \\gamma \\, V^{*}(s') \\right]\\] <ul> <li>\u7c7b\u4f3c\u5730\uff0c\\(Q^{*}\\) \u7684\u8d1d\u5c14\u66fc\u6700\u4f18\u65b9\u7a0b\u4e3a\uff1a</li> </ul> \\[Q^{*}(s, a) = \\sum_{s'} P(s' \\mid s, a) \\left[ R(s, a) + \\gamma \\max_{a'} Q^{*}(s', a') \\right]\\] <ul> <li> <p>\u4e00\u65e6\u4f60\u6709\u4e86 \\(Q^{*}\\)\uff0c\u6700\u4f18\u7b56\u7565\u5c31\u5f88\u7b80\u5355\u4e86\uff1a\u603b\u662f\u9009\u62e9Q\u503c\u6700\u9ad8\u7684\u52a8\u4f5c\uff1a\\(\\pi^{*}(s) = \\arg\\max_a Q^{*}(s, a)\\)\u3002</p> </li> <li> <p>\u52a8\u6001\u89c4\u5212\u65b9\u6cd5\u5728\u5df2\u77e5\u8f6c\u79fb\u6982\u7387\u548c\u5956\u52b1\uff08\u5b8c\u6574\u6a21\u578b\uff09\u65f6\u6c42\u89e3MDP\u3002\u7b56\u7565\u8bc4\u4f30\u901a\u8fc7\u8fed\u4ee3\u5e94\u7528\u8d1d\u5c14\u66fc\u65b9\u7a0b\u76f4\u5230\u6536\u655b\u6765\u8ba1\u7b97\u7ed9\u5b9a\u7b56\u7565\u7684 \\(V^\\pi\\)\u3002\u7b56\u7565\u6539\u8fdb\u5229\u7528\u4ef7\u503c\u51fd\u6570\u5e76\u901a\u8fc7\u5bf9\u6700\u4f18\u52a8\u4f5c\u8d2a\u5fc3\u6765\u6784\u5efa\u66f4\u597d\u7684\u7b56\u7565\uff1a\\(\\pi'(s) = \\arg\\max_a \\sum_{s'} P(s' \\mid s, a)[R(s,a) + \\gamma V^\\pi(s')]\\)\u3002</p> </li> <li> <p>\u7b56\u7565\u8fed\u4ee3\u5728\u8bc4\u4f30\u548c\u6539\u8fdb\u4e4b\u95f4\u4ea4\u66ff\uff0c\u76f4\u5230\u7b56\u7565\u505c\u6b62\u53d8\u5316\u3002\u5b83\u4fdd\u8bc1\u6536\u655b\u5230\u6700\u4f18\u7b56\u7565\u3002</p> </li> <li> <p>\u4ef7\u503c\u8fed\u4ee3\u5c06\u4e24\u4e2a\u6b65\u9aa4\u5408\u5e76\u4e3a\u4e00\u4e2a\uff1a\u91cd\u590d\u5e94\u7528\u8d1d\u5c14\u66fc\u6700\u4f18\u65b9\u7a0b\u76f4\u5230 \\(V^{*}\\) \u6536\u655b\uff0c\u7136\u540e\u63d0\u53d6\u7b56\u7565\u3002</p> </li> </ul> \\[V(s) \\leftarrow \\max_a \\sum_{s'} P(s' \\mid s, a) \\left[ R(s, a) + \\gamma \\, V(s') \\right]\\] <ul> <li> <p>\u52a8\u6001\u89c4\u5212\u9700\u8981\u77e5\u9053 \\(P(s' \\mid s, a)\\)\uff0c\u8fd9\u901a\u5e38\u4e0d\u53ef\u884c\u3002\u5728\u5927\u591a\u6570\u771f\u5b9e\u95ee\u9898\u4e2d\uff0c\u667a\u80fd\u4f53\u4e0d\u77e5\u9053\u73af\u5883\u7684\u52a8\u6001\uff1b\u5b83\u53ea\u80fd\u4e0e\u73af\u5883\u4ea4\u4e92\u3002\u8fd9\u5c31\u662f\u65e0\u6a21\u578b\u65b9\u6cd5\u53d1\u6325\u4f5c\u7528\u7684\u5730\u65b9\u3002</p> </li> <li> <p>\u65f6\u5e8f\u5dee\u5206\uff08TD\uff09\u5b66\u4e60\u5728\u4e0d\u4e86\u89e3\u6a21\u578b\u7684\u60c5\u51b5\u4e0b\u4ece\u7ecf\u9a8c\u4e2d\u5b66\u4e60\u3002\u5173\u952e\u601d\u60f3\u662f\u5f15\u5bfc\uff08bootstrapping\uff09\uff1a\u4e0d\u7b49\u60c5\u8282\u7ed3\u675f\u624d\u8ba1\u7b97\u5b9e\u9645\u56de\u62a5 \\(G_t\\)\uff0c\u800c\u662f\u4f7f\u7528\u5f53\u524d\u7684\u4ef7\u503c\u51fd\u6570\u5bf9\u5176\u8fdb\u884c\u4f30\u8ba1\uff1a</p> </li> </ul> \\[V(s_t) \\leftarrow V(s_t) + \\alpha \\left[ r_t + \\gamma \\, V(s_{t+1}) - V(s_t) \\right]\\] <ul> <li>\u62ec\u53f7\u4e2d\u7684\u9879\u662fTD\u8bef\u5dee\uff1aTD\u76ee\u6807\uff08\\(r_t + \\gamma V(s_{t+1})\\)\uff09\u4e0e\u5f53\u524d\u4f30\u8ba1 \\(V(s_t)\\) \u4e4b\u95f4\u7684\u5dee\u5f02\u3002\u5982\u679cTD\u8bef\u5dee\u4e3a\u6b63\uff0c\u8bf4\u660e\u8be5\u72b6\u6001\u6bd4\u9884\u671f\u597d\uff0c\u6211\u4eec\u589e\u52a0\u5176\u4ef7\u503c\u3002\u5982\u679c\u4e3a\u8d1f\uff0c\u5219\u51cf\u5c11\u5176\u4ef7\u503c\u3002</li> </ul> <p></p> <ul> <li> <p>TD\u5b66\u4e60\u5728\u6bcf\u4e00\u6b65\u4e4b\u540e\uff08\u800c\u4e0d\u662f\u5b8c\u6210\u6574\u4e2a\u60c5\u8282\u540e\uff09\u8fdb\u884c\u66f4\u65b0\uff0c\u8fd9\u4f7f\u5176\u6bd4\u8499\u7279\u5361\u6d1b\u65b9\u6cd5\u9ad8\u6548\u5f97\u591a\u3002\u5b83\u4e5f\u9002\u7528\u4e8e\u6301\u7eed\uff08\u975e\u60c5\u8282\u5f0f\uff09\u73af\u5883\u3002</p> </li> <li> <p>SARSA\uff08\u72b6\u6001-\u52a8\u4f5c-\u5956\u52b1-\u72b6\u6001-\u52a8\u4f5c\uff09\u662f\u5c06TD\u5b66\u4e60\u5e94\u7528\u4e8eQ\u503c\u3002\u667a\u80fd\u4f53\u5728\u72b6\u6001 \\(s\\) \u4e0b\u91c7\u53d6\u52a8\u4f5c \\(a\\)\uff0c\u89c2\u5bdf\u5956\u52b1 \\(r\\) \u548c\u4e0b\u4e00\u72b6\u6001 \\(s'\\)\uff0c\u7136\u540e\u6839\u636e\u5176\u7b56\u7565\u9009\u62e9\u4e0b\u4e00\u4e2a\u52a8\u4f5c \\(a'\\)\uff1a</p> </li> </ul> \\[Q(s, a) \\leftarrow Q(s, a) + \\alpha \\left[ r + \\gamma \\, Q(s', a') - Q(s, a) \\right]\\] <ul> <li> <p>SARSA\u662f\u5728\u7b56\u7565\uff08on-policy\uff09\uff1a\u5b83\u4f7f\u7528\u667a\u80fd\u4f53\u5b9e\u9645\u91c7\u53d6\u7684\u52a8\u4f5c\u8fdb\u884c\u66f4\u65b0\uff0c\u8fd9\u5305\u62ec\u4e86\u63a2\u7d22\u3002\u8fd9\u4f7f\u5f97SARSA\u66f4\u4e3a\u4fdd\u5b88\uff1b\u5b83\u5b66\u4e60\u4e00\u4e2a\u8003\u8651\u81ea\u8eab\u63a2\u7d22\u566a\u58f0\u7684\u7b56\u7565\u3002</p> </li> <li> <p>Q\u5b66\u4e60\u662f\u6700\u8457\u540d\u7684RL\u7b97\u6cd5\u3002\u5b83\u7c7b\u4f3c\u4e8eSARSA\uff0c\u4f46\u4e0d\u540c\u7684\u662f\u5b83\u4f7f\u7528\u6700\u4f73\u53ef\u80fd\u52a8\u4f5c\u800c\u975e\u667a\u80fd\u4f53\u5b9e\u9645\u91c7\u53d6\u7684\u52a8\u4f5c\uff1a</p> </li> </ul> \\[Q(s, a) \\leftarrow Q(s, a) + \\alpha \\left[ r + \\gamma \\max_{a'} Q(s', a') - Q(s, a) \\right]\\] <ul> <li> <p>Q\u5b66\u4e60\u662f\u79bb\u7b56\u7565\uff08off-policy\uff09\uff1a\u5b83\u5b66\u4e60\u6700\u4f18Q\u503c\uff0c\u4e0e\u6b63\u5728\u6267\u884c\u7684\u7b56\u7565\u65e0\u5173\u3002\u667a\u80fd\u4f53\u53ef\u4ee5\u968f\u673a\u63a2\u7d22\uff0c\u540c\u65f6\u4ecd\u7136\u5b66\u4e60\u6700\u4f18\u52a8\u4f5c\u4ef7\u503c\u3002\u8fd9\u4f7f\u5f97Q\u5b66\u4e60\u66f4\u5177\u653b\u51fb\u6027\uff0c\u901a\u5e38\u6536\u655b\u66f4\u5feb\uff0c\u4f46\u53ef\u80fd\u9ad8\u4f30\u503c\u3002</p> </li> <li> <p>\u63a2\u7d22 vs \u5229\u7528\u662f\u57fa\u672c\u56f0\u5883\uff1a\u667a\u80fd\u4f53\u5e94\u8be5\u5229\u7528\u5df2\u77e5\u4fe1\u606f\uff08\u9009\u62e9\u4f30\u8ba1\u4ef7\u503c\u6700\u9ad8\u7684\u52a8\u4f5c\uff09\u8fd8\u662f\u63a2\u7d22\u672a\u77e5\u52a8\u4f5c\uff08\u53ef\u80fd\u53d1\u73b0\u66f4\u597d\u7684\uff09\uff1f</p> </li> <li> <p>\u6700\u7b80\u5355\u7684\u7b56\u7565\u662f\u03b5-\u8d2a\u5fc3\uff1a\u4ee5\u6982\u7387 \\(\\epsilon\\) \u91c7\u53d6\u968f\u673a\u52a8\u4f5c\uff08\u63a2\u7d22\uff09\uff1b\u4ee5\u6982\u7387 \\(1 - \\epsilon\\) \u91c7\u53d6\u8d2a\u5fc3\u52a8\u4f5c\uff08\u5229\u7528\uff09\u3002\u4e00\u79cd\u5e38\u89c1\u7684\u65f6\u95f4\u8868\u662f\u4ece\u9ad8 \\(\\epsilon\\)\uff08\u5927\u91cf\u63a2\u7d22\uff09\u5f00\u59cb\uff0c\u968f\u65f6\u95f4\u8870\u51cf\u3002</p> </li> <li> <p>\u8868\u683c\u65b9\u6cd5\uff08\u5728\u8868\u4e2d\u5b58\u50a8\u6bcf\u4e2a\u72b6\u6001-\u52a8\u4f5c\u5bf9\u7684\u4ef7\u503c\uff09\u9002\u7528\u4e8e\u5c0f\u7684\u79bb\u6563\u72b6\u6001\u7a7a\u95f4\u3002\u5bf9\u4e8e\u5927\u6216\u8fde\u7eed\u7684\u72b6\u6001\u7a7a\u95f4\uff0c\u9700\u8981\u51fd\u6570\u8fd1\u4f3c\u3002\u6df1\u5ea6Q\u7f51\u7edc\uff08DQN\uff09 \u4f7f\u7528\u795e\u7ecf\u7f51\u7edc\u6765\u8fd1\u4f3c \\(Q(s, a; \\theta)\\)\uff0c\u5176\u4e2d \\(\\theta\\) \u662f\u7f51\u7edc\u6743\u91cd\u3002</p> </li> <li> <p>DQN\u5f15\u5165\u4e86\u4e24\u4e2a\u5173\u952e\u7684\u7a33\u5b9a\u6280\u672f\u3002\u7ecf\u9a8c\u56de\u653e\uff1a\u4e0d\u662f\u4ece\u8fde\u7eed\u7684\u8f6c\u79fb\u4e2d\u5b66\u4e60\uff08\u9ad8\u5ea6\u76f8\u5173\uff09\uff0c\u800c\u662f\u5c06\u8f6c\u79fb\u5b58\u50a8\u5728\u56de\u653e\u7f13\u51b2\u533a\u4e2d\uff0c\u5e76\u91c7\u6837\u968f\u673a\u5c0f\u6279\u6b21\u8fdb\u884c\u8bad\u7ec3\u3002\u8fd9\u6253\u7834\u4e86\u76f8\u5173\u6027\u5e76\u9ad8\u6548\u5730\u91cd\u7528\u6570\u636e\u3002</p> </li> <li> <p>\u76ee\u6807\u7f51\u7edc\uff1a\u4f7f\u7528\u4e00\u4e2a\u5355\u72ec\u7684\u3001\u7f13\u6162\u66f4\u65b0\u7684\u7f51\u7edc\u526f\u672c\u6765\u8ba1\u7b97TD\u76ee\u6807\u3002\u6ca1\u6709\u8fd9\u4e2a\uff0c\u6bcf\u6b21\u66f4\u65b0\u7f51\u7edc\u65f6\u76ee\u6807\u90fd\u4f1a\u79fb\u52a8\uff0c\u9020\u6210\"\u8ffd\u81ea\u5df1\u5c3e\u5df4\"\u7684\u4e0d\u7a33\u5b9a\u6027\u3002\u76ee\u6807\u7f51\u7edc\u5b9a\u671f\u66f4\u65b0\uff08\u6bcf \\(N\\) \u6b65\u786c\u66f4\u65b0\uff09\u6216\u8fde\u7eed\u66f4\u65b0\uff08\u8f6f\u66f4\u65b0\uff1a\\(\\theta^{-} \\leftarrow \\tau\\theta + (1-\\tau)\\theta^{-}\\)\uff09\u3002</p> </li> <li> <p>DQN\u635f\u5931\u53ea\u662f\u9884\u6d4bQ\u503c\u4e0eTD\u76ee\u6807\u4e4b\u95f4\u7684\u5747\u65b9\u8bef\u5dee\uff1a</p> </li> </ul> \\[\\mathcal{L}(\\theta) = \\mathbb{E} \\left[ \\left( r + \\gamma \\max_{a'} Q(s', a'; \\theta^{-}) - Q(s, a; \\theta) \\right)^2 \\right]\\] <ul> <li> <p>\u5230\u76ee\u524d\u4e3a\u6b62\u7684\u6240\u6709\u65b9\u6cd5\u90fd\u5b66\u4e60\u4ef7\u503c\u51fd\u6570\u5e76\u4ece\u4e2d\u63a8\u5bfc\u7b56\u7565\u3002\u7b56\u7565\u68af\u5ea6\u65b9\u6cd5\u91c7\u7528\u4e0d\u540c\u65b9\u6cd5\uff1a\u5b83\u4eec\u76f4\u63a5\u53c2\u6570\u5316\u7b56\u7565 \\(\\pi(a \\mid s; \\theta)\\) \u5e76\u901a\u8fc7\u68af\u5ea6\u4e0a\u5347\u4f18\u5316\u671f\u671b\u56de\u62a5\u3002</p> </li> <li> <p>\u7b56\u7565\u68af\u5ea6\u5b9a\u7406\u7ed9\u51fa\u4e86\u671f\u671b\u56de\u62a5\u76f8\u5bf9\u4e8e\u7b56\u7565\u53c2\u6570\u7684\u68af\u5ea6\uff1a</p> </li> </ul> \\[\\nabla_\\theta J(\\theta) = \\mathbb{E}_\\pi \\left[ \\nabla_\\theta \\log \\pi(a \\mid s; \\theta) \\cdot G_t \\right]\\] <ul> <li> <p>\u8fd9\u8bf4\u660e\uff1a\u589e\u52a0\u5bfc\u81f4\u9ad8\u56de\u62a5\u7684\u52a8\u4f5c\u7684\u6982\u7387\uff0c\u51cf\u5c11\u5bfc\u81f4\u4f4e\u56de\u62a5\u7684\u52a8\u4f5c\u7684\u6982\u7387\u3002\u5bf9\u6570\u6982\u7387\u68af\u5ea6\u7ed9\u51fa\u4e86\u6539\u53d8\u7b56\u7565\u7684\u65b9\u5411\uff0c\\(G_t\\) \u5219\u7f29\u653e\u6539\u53d8\u7684\u7a0b\u5ea6\u3002</p> </li> <li> <p>REINFORCE\u662f\u6700\u7b80\u5355\u7684\u7b56\u7565\u68af\u5ea6\u7b97\u6cd5\u3002\u8fd0\u884c\u4e00\u4e2a\u60c5\u8282\uff0c\u4e3a\u6bcf\u4e00\u6b65\u8ba1\u7b97\u56de\u62a5 \\(G_t\\)\uff0c\u7136\u540e\u66f4\u65b0\uff1a</p> </li> </ul> \\[\\theta \\leftarrow \\theta + \\alpha \\, \\nabla_\\theta \\log \\pi(a_t \\mid s_t; \\theta) \\cdot G_t\\] <ul> <li>REINFORCE\u65b9\u5dee\u5f88\u9ad8\uff0c\u56e0\u4e3a \\(G_t\\) \u662f\u671f\u671b\u56de\u62a5\u7684\u566a\u58f0\u5355\u6837\u672c\u4f30\u8ba1\u3002\u4e00\u4e2a\u5e38\u89c1\u4fee\u590d\u662f\u51cf\u53bb\u4e00\u4e2a\u57fa\u7ebf\uff08baseline\uff09\uff08\u901a\u5e38\u662f\u5e73\u5747\u56de\u62a5\u6216\u5b66\u4e60\u5230\u7684\u4ef7\u503c\u51fd\u6570\uff09\u6765\u964d\u4f4e\u65b9\u5dee\u800c\u4e0d\u5f15\u5165\u504f\u5dee\uff1a</li> </ul> \\[\\theta \\leftarrow \\theta + \\alpha \\, \\nabla_\\theta \\log \\pi(a_t \\mid s_t; \\theta) \\cdot (G_t - b)\\] <ul> <li>\u6f14\u5458-\u8bc4\u8bba\u5bb6\uff08Actor-Critic\uff09 \u65b9\u6cd5\u4f7f\u7528\u4e24\u4e2a\u7f51\u7edc\u3002\u6f14\u5458\uff08actor\uff09 \u662f\u7b56\u7565 \\(\\pi(a \\mid s; \\theta)\\)\u3002\u8bc4\u8bba\u5bb6\uff08critic\uff09 \u662f\u4ef7\u503c\u51fd\u6570 \\(V(s; \\phi)\\)\uff0c\u4f5c\u4e3a\u57fa\u7ebf\u3002\u4f18\u52bf \\(A_t = r_t + \\gamma V(s_{t+1}) - V(s_t)\\) \u66ff\u4ee3\u4e86 \\(G_t - b\\)\uff1a</li> </ul> \\[\\theta \\leftarrow \\theta + \\alpha \\, \\nabla_\\theta \\log \\pi(a_t \\mid s_t; \\theta) \\cdot A_t\\] <ul> <li>\u8bc4\u8bba\u5bb6\u901a\u8fc7\u6700\u5c0f\u5316TD\u8bef\u5dee\u6765\u66f4\u65b0\uff0c\u4e0e\u57fa\u4e8e\u4ef7\u503c\u7684\u65b9\u6cd5\u76f8\u540c\u3002\u6f14\u5458\u4f7f\u7528\u7b56\u7565\u68af\u5ea6\u66f4\u65b0\uff0c\u8bc4\u8bba\u5bb6\u7684\u4f18\u52bf\u4f30\u8ba1\u964d\u4f4e\u4e86\u65b9\u5dee\u3002\u8fd9\u662f\u4e24\u5168\u5176\u7f8e\u3002</li> </ul> <p></p> <ul> <li> <p>PPO\uff08\u8fd1\u7aef\u7b56\u7565\u4f18\u5316\uff09\u662f\u5b9e\u8df5\u4e2d\u4f7f\u7528\u6700\u5e7f\u6cdb\u7684\u7b56\u7565\u68af\u5ea6\u7b97\u6cd5\u3002\u5b83\u89e3\u51b3\u4e86\u4e00\u4e2a\u5173\u952e\u95ee\u9898\uff1a\u5982\u679c\u7b56\u7565\u66f4\u65b0\u8fc7\u5927\uff0c\u6027\u80fd\u53ef\u80fd\u707e\u96be\u6027\u5730\u5d29\u6e83\u3002</p> </li> <li> <p>PPO\u4f7f\u7528\u4e00\u4e2a\u88c1\u526a\u7684\u66ff\u4ee3\u76ee\u6807\u3002\u4ee4 \\(r_t(\\theta) = \\frac{\\pi(a_t | s_t; \\theta)}{\\pi(a_t | s_t; \\theta_{\\text{old}})}\\) \u4e3a\u65b0\u65e7\u7b56\u7565\u4e4b\u95f4\u7684\u6982\u7387\u6bd4\u3002\u635f\u5931\u4e3a\uff1a</p> </li> </ul> \\[\\mathcal{L}^{\\text{CLIP}}(\\theta) = \\mathbb{E} \\left[ \\min\\!\\left( r_t(\\theta) A_t, \\; \\text{clip}(r_t(\\theta), 1-\\epsilon, 1+\\epsilon) A_t \\right) \\right]\\] <ul> <li> <p>\u88c1\u526a\uff08\u901a\u5e38 \\(\\epsilon = 0.2\\)\uff09\u9632\u6b62\u6bd4\u7387\u8fdc\u79bb1\uff0c\u4f7f\u66f4\u65b0\u4fdd\u6301\u5c0f\u800c\u7a33\u5b9a\u3002\u5982\u679c\u4f18\u52bf\u4e3a\u6b63\uff08\u52a8\u4f5c\u597d\uff09\uff0c\u6bd4\u7387\u4e0a\u9650\u4e3a \\(1 + \\epsilon\\)\u3002\u5982\u679c\u4e3a\u8d1f\uff08\u52a8\u4f5c\u5dee\uff09\uff0c\u6bd4\u7387\u4e0b\u9650\u4e3a \\(1 - \\epsilon\\)\u3002\u8fd9\u6bd4\u65e9\u671f\u7684\u4fe1\u4efb\u533a\u57df\u65b9\u6cd5\uff08TRPO\uff09\u66f4\u7b80\u5355\u3001\u66f4\u7a33\u5b9a\u3002</p> </li> <li> <p>PPO\u88ab\u7528\u4e8e\u901a\u8fc7RLHF\uff08\u57fa\u4e8e\u4eba\u7c7b\u53cd\u9988\u7684\u5f3a\u5316\u5b66\u4e60\uff09\u8bad\u7ec3ChatGPT\u98ce\u683c\u7684\u6a21\u578b\u3002\u5728RLHF\u4e2d\uff0c\u4e00\u4e2a\u5956\u52b1\u6a21\u578b\u5728\u4eba\u7c7b\u504f\u597d\u6570\u636e\uff08\u4eba\u7c7b\u66f4\u559c\u6b22\u4e24\u4e2a\u8f93\u51fa\u4e2d\u7684\u54ea\u4e00\u4e2a\uff1f\uff09\u4e0a\u8bad\u7ec3\uff0c\u7136\u540ePPO\u4f18\u5316\u8bed\u8a00\u6a21\u578b\u7b56\u7565\u4ee5\u6700\u5927\u5316\u8fd9\u4e2a\u5b66\u4e60\u5230\u7684\u5956\u52b1\u3002</p> </li> <li> <p>DPO\uff08\u76f4\u63a5\u504f\u597d\u4f18\u5316\uff09\u901a\u8fc7\u5b8c\u5168\u6d88\u9664\u5956\u52b1\u6a21\u578b\u6765\u7b80\u5316RLHF\u3002DPO\u4e0d\u8bad\u7ec3\u5956\u52b1\u6a21\u578b\u7136\u540e\u8fd0\u884cRL\uff0c\u800c\u662f\u63a8\u5bfc\u51fa\u4e00\u4e2a\u95ed\u5f0f\u635f\u5931\uff0c\u76f4\u63a5\u4ece\u504f\u597d\u6570\u636e\u4f18\u5316\u7b56\u7565\uff1a</p> </li> </ul> \\[\\mathcal{L}_{\\text{DPO}}(\\theta) = -\\mathbb{E} \\left[ \\log \\sigma\\!\\left( \\beta \\log \\frac{\\pi_\\theta(y_w \\mid x)}{\\pi_{\\text{ref}}(y_w \\mid x)} - \\beta \\log \\frac{\\pi_\\theta(y_l \\mid x)}{\\pi_{\\text{ref}}(y_l \\mid x)} \\right) \\right]\\] <ul> <li> <p>\u8fd9\u91cc \\(y_w\\) \u662f\u504f\u597d\u7684\uff08\u80dc\u51fa\uff09\u56de\u7b54\uff0c\\(y_l\\) \u662f\u4e0d\u88ab\u504f\u597d\u7684\uff08\u5931\u8d25\uff09\u56de\u7b54\u3002DPO\u589e\u52a0\u504f\u597d\u8f93\u51fa\u7684\u76f8\u5bf9\u6982\u7387\uff0c\u5e76\u4e14\u6bd4\u57fa\u4e8ePPO\u7684RLHF\u5b9e\u73b0\u8d77\u6765\u7b80\u5355\u5f97\u591a\u3002</p> </li> <li> <p>RL\u7b97\u6cd5\u4e2d\u6709\u4e24\u4e2a\u91cd\u8981\u533a\u5206\u3002\u5728\u7b56\u7565 vs \u79bb\u7b56\u7565\uff1a\u5728\u7b56\u7565\u65b9\u6cd5\uff08SARSA, PPO\uff09\u4ece\u5f53\u524d\u7b56\u7565\u751f\u6210\u7684\u6570\u636e\u4e2d\u5b66\u4e60\uff1b\u79bb\u7b56\u7565\u65b9\u6cd5\uff08Q\u5b66\u4e60, DQN\uff09\u53ef\u4ee5\u4ece\u4efb\u4f55\u7b56\u7565\u751f\u6210\u7684\u6570\u636e\u4e2d\u5b66\u4e60\u3002\u79bb\u7b56\u7565\u65b9\u6cd5\u6837\u672c\u6548\u7387\u66f4\u9ad8\uff08\u5b83\u4eec\u91cd\u7528\u65e7\u6570\u636e\uff09\uff0c\u4f46\u53ef\u80fd\u4e0d\u90a3\u4e48\u7a33\u5b9a\u3002</p> </li> <li> <p>\u57fa\u4e8e\u6a21\u578b vs \u65e0\u6a21\u578b\uff1a\u65e0\u6a21\u578b\u65b9\u6cd5\uff08\u5230\u76ee\u524d\u4e3a\u6b62\u8ba8\u8bba\u7684\u6240\u6709\u65b9\u6cd5\uff09\u76f4\u63a5\u4ece\u7ecf\u9a8c\u4e2d\u5b66\u4e60\u4ef7\u503c\u6216\u7b56\u7565\u3002\u57fa\u4e8e\u6a21\u578b\u7684\u65b9\u6cd5\u5b66\u4e60\u73af\u5883\u7684\u6a21\u578b\uff08\\(P(s' \\mid s, a)\\) \u548c \\(R(s, a)\\)\uff09\u5e76\u7528\u5176\u8fdb\u884c\u89c4\u5212\uff08\u60f3\u8c61\u672a\u6765\u7684\u8f68\u8ff9\u800c\u4e0d\u5b9e\u9645\u91c7\u53d6\u52a8\u4f5c\uff09\u3002\u57fa\u4e8e\u6a21\u578b\u7684\u65b9\u6cd5\u6837\u672c\u6548\u7387\u66f4\u9ad8\uff0c\u4f46\u589e\u52a0\u4e86\u5b66\u4e60\u7cbe\u786e\u6a21\u578b\u7684\u590d\u6742\u6027\u3002</p> </li> <li> <p>\u603b\u7ed3RL\u9886\u57df\uff1a</p> </li> </ul> \u65b9\u6cd5 \u7c7b\u578b \u6838\u5fc3\u601d\u60f3 \u4f18\u52bf \u4ef7\u503c\u8fed\u4ee3 DP, \u57fa\u4e8e\u6a21\u578b \u8d1d\u5c14\u66fc\u6700\u4f18\u6027 \u7cbe\u786e\u89e3\uff08\u5c0fMDP\uff09 SARSA TD, \u5728\u7b56\u7565 \u5728\u7b56\u7565\u5b66\u4e60Q \u4fdd\u5b88\u3001\u5b89\u5168 Q\u5b66\u4e60 TD, \u79bb\u7b56\u7565 \u5b66\u4e60Q*, \u8d2a\u5fc3\u76ee\u6807 \u7b80\u5355\u3001\u6709\u6548 DQN \u6df1\u5ea6, \u79bb\u7b56\u7565 \u795e\u7ecfQ + \u56de\u653e + \u76ee\u6807\u7f51\u7edc \u6269\u5c55\u5230\u9ad8\u7ef4\u72b6\u6001 REINFORCE \u7b56\u7565\u68af\u5ea6 log-\u6982\u7387 * \u56de\u62a5\u7684\u68af\u5ea6 \u7b80\u5355\u7684\u7b56\u7565\u4f18\u5316 \u6f14\u5458-\u8bc4\u8bba\u5bb6 PG + \u4ef7\u503c \u6f14\u5458 + \u8bc4\u8bba\u5bb6\u964d\u4f4e\u65b9\u5dee \u5b9e\u7528\u4e14\u7075\u6d3b PPO PG, \u88c1\u526a \u4fe1\u4efb\u533a\u57df\u822c\u7684\u7a33\u5b9a\u6027 \u884c\u4e1a\u6807\u51c6 DPO \u76f4\u63a5\u504f\u597d \u8df3\u8fc7\u5956\u52b1\u6a21\u578b \u66f4\u7b80\u5355\u7684RLHF"},{"location":"chapter%2006%3A%20machine%20learning/04.%20reinforcement%20learning/#colab","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216\u7b14\u8bb0\u672c\uff09","text":"<ol> <li> <p>\u4e3a\u7b80\u5355\u7684\u7f51\u683c\u4e16\u754c\u5b9e\u73b0\u4ef7\u503c\u8fed\u4ee3\u3002\u8ba1\u7b97\u6700\u4f18\u4ef7\u503c\u51fd\u6570\u5e76\u63d0\u53d6\u6700\u4f18\u7b56\u7565\u3002\u5c06\u4e24\u8005\u53ef\u89c6\u5316\u4e3a\u70ed\u529b\u56fe\u548c\u7bad\u5934\u56fe\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# 4x4\u7f51\u683c\u4e16\u754c\uff1a\u76ee\u6807\u5728(3,3)\uff0c\u6bcf\u6b65\u5956\u52b1-1\uff0c\u76ee\u6807\u5904\u4e3a0\ngrid_size = 4\ngamma = 0.99\ngoal = (3, 3)\n\n# \u52a8\u4f5c\uff1a\u4e0a\u3001\u4e0b\u3001\u5de6\u3001\u53f3\nactions = [(-1, 0), (1, 0), (0, -1), (0, 1)]\naction_names = ['up', 'down', 'left', 'right']\naction_arrows = ['\\u2191', '\\u2193', '\\u2190', '\\u2192']\n\ndef step(s, a):\n    \"\"\"\u786e\u5b9a\u6027\u8f6c\u79fb\u3002\"\"\"\n    ns = (max(0, min(grid_size-1, s[0]+a[0])),\n          max(0, min(grid_size-1, s[1]+a[1])))\n    return ns\n\n# \u4ef7\u503c\u8fed\u4ee3\nV = jnp.zeros((grid_size, grid_size))\nfor iteration in range(100):\n    V_new = jnp.array(V)\n    for i in range(grid_size):\n        for j in range(grid_size):\n            if (i, j) == goal:\n                continue\n            values = []\n            for a in actions:\n                ns = step((i, j), a)\n                values.append(-1 + gamma * float(V[ns[0], ns[1]]))\n            V_new = V_new.at[i, j].set(max(values))\n    if jnp.max(jnp.abs(V_new - V)) &lt; 1e-6:\n        print(f\"\u5728{iteration+1}\u6b21\u8fed\u4ee3\u540e\u6536\u655b\")\n        break\n    V = V_new\n\n# \u63d0\u53d6\u7b56\u7565\npolicy = [['' for _ in range(grid_size)] for _ in range(grid_size)]\nfor i in range(grid_size):\n    for j in range(grid_size):\n        if (i, j) == goal:\n            policy[i][j] = 'G'\n            continue\n        best_a = max(range(4), key=lambda a: -1 + gamma * float(V[step((i,j), actions[a])[0], step((i,j), actions[a])[1]]))\n        policy[i][j] = action_arrows[best_a]\n\nfig, axes = plt.subplots(1, 2, figsize=(10, 4))\nim = axes[0].imshow(V, cmap='YlOrRd_r')\naxes[0].set_title(\"\u6700\u4f18\u4ef7\u503c\u51fd\u6570\")\nfor i in range(grid_size):\n    for j in range(grid_size):\n        axes[0].text(j, i, f\"{V[i,j]:.1f}\", ha='center', va='center', fontsize=10)\nplt.colorbar(im, ax=axes[0])\n\naxes[1].imshow(jnp.ones((grid_size, grid_size)), cmap='Greys', vmin=0, vmax=2)\naxes[1].set_title(\"\u6700\u4f18\u7b56\u7565\")\nfor i in range(grid_size):\n    for j in range(grid_size):\n        axes[1].text(j, i, policy[i][j], ha='center', va='center', fontsize=18)\nplt.tight_layout(); plt.show()\n</code></pre></p> </li> <li> <p>\u5728\u7b80\u5355\u7684\u7f51\u683c\u4e16\u754c\u4e0a\u5b9e\u73b0\u8868\u683cQ\u5b66\u4e60\u3002\u8bad\u7ec3\u667a\u80fd\u4f53\uff0c\u7ed8\u5236\u5b66\u4e60\u66f2\u7ebf\uff0c\u663e\u793a\u5b66\u4e60\u5230\u7684Q\u503c\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ngrid_size = 5\ngoal = (4, 4)\nactions = [(-1,0), (1,0), (0,-1), (0,1)]\n\n# Q\u8868\nQ = {}\nfor i in range(grid_size):\n    for j in range(grid_size):\n        Q[(i,j)] = [0.0] * 4\n\nalpha = 0.1\ngamma = 0.95\nepsilon = 1.0\nepsilon_decay = 0.995\nmin_epsilon = 0.01\n\ndef step(s, a_idx):\n    a = actions[a_idx]\n    ns = (max(0, min(grid_size-1, s[0]+a[0])),\n          max(0, min(grid_size-1, s[1]+a[1])))\n    r = 0.0 if ns == goal else -1.0\n    done = ns == goal\n    return ns, r, done\n\nkey = jax.random.PRNGKey(42)\nrewards_per_episode = []\n\nfor ep in range(500):\n    s = (0, 0)\n    total_reward = 0\n    for _ in range(100):\n        key, subkey = jax.random.split(key)\n        if float(jax.random.uniform(subkey)) &lt; epsilon:\n            key, subkey = jax.random.split(key)\n            a = int(jax.random.randint(subkey, (), 0, 4))\n        else:\n            a = max(range(4), key=lambda i: Q[s][i])\n\n        ns, r, done = step(s, a)\n        total_reward += r\n        # Q\u5b66\u4e60\u66f4\u65b0\n        Q[s][a] += alpha * (r + gamma * max(Q[ns]) - Q[s][a])\n        s = ns\n        if done:\n            break\n    rewards_per_episode.append(total_reward)\n    epsilon = max(min_epsilon, epsilon * epsilon_decay)\n\nplt.figure(figsize=(8, 4))\n# \u5e73\u6ed1\u66f2\u7ebf\nwindow = 20\nsmoothed = [sum(rewards_per_episode[max(0,i-window):i+1])/min(i+1, window)\n            for i in range(len(rewards_per_episode))]\nplt.plot(smoothed, color='#3498db', linewidth=1.5)\nplt.xlabel(\"Episode\"); plt.ylabel(\"Total Reward (smoothed)\")\nplt.title(\"Q-Learning on Gridworld\")\nplt.grid(alpha=0.3); plt.show()\n\n# \u663e\u793a\u5b66\u5230\u7684\u7b56\u7565\narrow = ['\\u2191', '\\u2193', '\\u2190', '\\u2192']\nprint(\"\u5b66\u5230\u7684\u7b56\u7565:\")\nfor i in range(grid_size):\n    row = \"\"\n    for j in range(grid_size):\n        if (i,j) == goal:\n            row += \" G \"\n        else:\n            row += f\" {arrow[max(range(4), key=lambda a: Q[(i,j)][a])]} \"\n    print(row)\n</code></pre></p> </li> <li> <p>\u5728\u591a\u81c2\u8001\u864e\u673a\u95ee\u9898\u4e0a\u5b9e\u73b0REINFORCE\u3002\u5c55\u793a\u7b56\u7565\u5982\u4f55\u968f\u8bad\u7ec3\u6f14\u53d8\u4ee5\u504f\u5411\u6700\u4f73\u81c2\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# 5\u81c2\u8001\u864e\u673a\uff0c\u4e0d\u540c\u671f\u671b\u5956\u52b1\ntrue_rewards = jnp.array([0.2, 0.5, 0.8, 0.3, 0.1])\nn_arms = len(true_rewards)\n\n# \u7b56\u7565\uff1a\u5728logits\u4e0a\u7684softmax\nlogits = jnp.zeros(n_arms)\nlr = 0.1\nkey = jax.random.PRNGKey(42)\n\npolicy_history = []\nreward_history = []\n\nfor step in range(2000):\n    probs = jax.nn.softmax(logits)\n    policy_history.append(probs)\n\n    # \u91c7\u6837\u52a8\u4f5c\n    key, subkey = jax.random.split(key)\n    action = jax.random.choice(subkey, n_arms, p=probs)\n\n    # \u83b7\u53d6\u5956\u52b1\uff08\u4f2f\u52aa\u5229\u5206\u5e03\uff09\n    key, subkey = jax.random.split(key)\n    reward = float(jax.random.uniform(subkey) &lt; true_rewards[action])\n    reward_history.append(reward)\n\n    # REINFORCE\u66f4\u65b0\n    # grad log pi(a) = e_a - probs\uff08\u5bf9\u4e8esoftmax\u53c2\u6570\u5316\uff09\n    grad_log_pi = -probs.at[action].add(1.0)  # one-hot(a) - probs\n    logits = logits + lr * reward * grad_log_pi\n\npolicy_history = jnp.stack(policy_history)\n\nfig, axes = plt.subplots(1, 2, figsize=(12, 4))\ncolors = ['#3498db', '#e74c3c', '#27ae60', '#9b59b6', '#f39c12']\nfor i in range(n_arms):\n    axes[0].plot(policy_history[:, i], color=colors[i],\n                 label=f'\u81c2{i} (\u771f\u5b9e={true_rewards[i]:.1f})', linewidth=1.5)\naxes[0].set_xlabel(\"\u6b65\u9aa4\"); axes[0].set_ylabel(\"P(\u81c2)\")\naxes[0].set_title(\"\u7b56\u7565\u6f14\u53d8 (REINFORCE)\")\naxes[0].legend(fontsize=8); axes[0].grid(alpha=0.3)\n\n# \u5e73\u6ed1\u5956\u52b1\nwindow = 50\nsmoothed = [sum(reward_history[max(0,i-window):i+1])/min(i+1,window)\n            for i in range(len(reward_history))]\naxes[1].plot(smoothed, color='#27ae60', linewidth=1.5)\naxes[1].axhline(y=0.8, color='#e74c3c', linestyle='--', alpha=0.5, label='\u6700\u4f73\u81c2')\naxes[1].set_xlabel(\"\u6b65\u9aa4\"); axes[1].set_ylabel(\"\u5e73\u5747\u5956\u52b1\")\naxes[1].set_title(\"\u5956\u52b1\u968f\u65f6\u95f4\u53d8\u5316\"); axes[1].legend()\naxes[1].grid(alpha=0.3)\nplt.tight_layout(); plt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2006%3A%20machine%20learning/05.%20distributed%20deep%20learning/","title":"\u5206\u5e03\u5f0f\u6df1\u5ea6\u5b66\u4e60","text":"<p>\u5206\u5e03\u5f0f\u8bad\u7ec3\u5c06\u8ba1\u7b97\u5206\u6563\u5230\u591a\u4e2aGPU\u548c\u673a\u5668\u4e0a\uff0c\u4ee5\u8bad\u7ec3\u5355\u4e2a\u8bbe\u5907\u65e0\u6cd5\u5bb9\u7eb3\u6216\u8bad\u7ec3\u592a\u6162\u7684\u6a21\u578b\u3002\u672c\u6587\u4ef6\u6db5\u76d6\u6df7\u5408\u7cbe\u5ea6\u3001\u6570\u636e\u5e76\u884c\u3001\u6a21\u578b\u5e76\u884c\u3001\u6d41\u6c34\u7ebf\u5e76\u884c\u3001ZeRO\u3001FSDP\u3001\u5f20\u91cf\u5e76\u884c\u4ee5\u53ca\u5168\u89c4\u7ea6\u7b49\u901a\u4fe1\u539f\u8bed\u2014\u2014\u8fd9\u4e9b\u5bf9\u4e8e\u5927\u89c4\u6a21\u8bad\u7ec3LLM\u81f3\u5173\u91cd\u8981\u3002</p> <ul> <li> <p>\u5728\u5355\u4e2aGPU\u4e0a\u8bad\u7ec3\u5927\u578b\u795e\u7ecf\u7f51\u7edc\u6700\u7ec8\u4f1a\u9047\u5230\u74f6\u9888\u3002\u6a21\u578b\u53ef\u80fd\u65e0\u6cd5\u653e\u5165\u5185\u5b58\uff0c\u6216\u8005\u8bad\u7ec3\u53ef\u80fd\u9700\u8981\u6570\u6708\u3002\u5206\u5e03\u5f0f\u8bad\u7ec3\u5c06\u5de5\u4f5c\u5206\u6563\u5230\u591a\u4e2a\u8bbe\u5907\uff08GPU\u3001TPU\u6216\u6574\u53f0\u673a\u5668\uff09\u4e0a\uff0c\u4ee5\u66f4\u5feb\u5730\u8bad\u7ec3\u548c\u8bad\u7ec3\u66f4\u5927\u7684\u6a21\u578b\u3002\u672c\u6587\u4ef6\u6db5\u76d6\u4e86\u5b9e\u73b0\u8fd9\u4e00\u76ee\u6807\u7684\u6280\u672f\u3002</p> </li> <li> <p>\u8981\u7406\u89e3\u4e3a\u4f55\u5206\u5e03\u5f0f\u91cd\u8981\uff0c\u4ece\u8bad\u7ec3\u7684\u8ba1\u7b97\u6210\u672c\u5f00\u59cb\u3002\u5728\u4e00\u4e2a\u5305\u542b \\(d_{\\text{in}}\\) \u4e2a\u8f93\u5165\u548c \\(d_{\\text{out}}\\) \u4e2a\u8f93\u51fa\u7684\u5bc6\u96c6\u5c42\u4e0a\uff0c\u5bf9\u4e00\u6279 \\(B\\) \u4e2a\u6837\u672c\u8fdb\u884c\u4e00\u6b21\u524d\u5411\u4f20\u64ad\u9700\u8981\u5927\u7ea6 \\(2 \\cdot B \\cdot d_{\\text{in}} \\cdot d_{\\text{out}}\\) \u6b21FLOP\uff08\u6d6e\u70b9\u8fd0\u7b97\uff09\uff1a\u5bf9\u8f93\u51fa\u77e9\u9635\u7684\u6bcf\u4e2a\u5143\u7d20\u8fdb\u884c\u4e00\u6b21\u4e58\u6cd5\u548c\u4e00\u6b21\u52a0\u6cd5\u3002\u53cd\u5411\u4f20\u64ad\u7684\u6210\u672c\u5927\u7ea6\u662f\u524d\u5411\u4f20\u64ad\u7684\u4e24\u500d\uff08\u8ba1\u7b97\u76f8\u5bf9\u4e8e\u8f93\u5165\u548c\u6743\u91cd\u7684\u68af\u5ea6\uff09\uff0c\u56e0\u6b64\u4e00\u4e2a\u5bc6\u96c6\u5c42\u7684\u4e00\u4e2a\u8bad\u7ec3\u6b65\u9aa4\u7ea6\u4e3a \\(6 \\cdot B \\cdot d_{\\text{in}} \\cdot d_{\\text{out}}\\) \u6b21FLOP\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u9690\u85cf\u7ef4\u5ea6\u4e3a \\(d\\) \u7684Transformer\u5c42\uff0c\u81ea\u6ce8\u610f\u529b\u5757\u6d89\u53ca\u56db\u4e2a\u6295\u5f71\uff08Q\u3001K\u3001V\u548c\u8f93\u51fa\uff09\uff0c\u6bcf\u4e2a\u7684\u6210\u672c\u4e3a \\(O(B \\cdot n \\cdot d^2)\\) \u6b21FLOP\uff08\u5176\u4e2d \\(n\\) \u662f\u5e8f\u5217\u957f\u5ea6\uff09\uff0c\u52a0\u4e0a\u6ce8\u610f\u529b\u77e9\u9635\u8ba1\u7b97 \\(O(B \\cdot n^2 \\cdot d)\\)\u3002\u524d\u9988\u5757\u6709\u4e24\u4e2a\u5bc6\u96c6\u5c42\uff0c\u901a\u5e38\u6269\u5c55\u5230 \\(4d\\) \u518d\u56de\u6765\uff1a\\(O(B \\cdot n \\cdot 8d^2)\\)\u3002\u6bcf\u5c42\u603b\u8ba1\uff1a\u5927\u7ea6 \\(O(B \\cdot n \\cdot 12d^2 + B \\cdot n^2 \\cdot d)\\)\u3002\u4e58\u4ee5\u5c42\u6570\uff0c\u4f60\u5c31\u4f1a\u660e\u767d\u4e3a\u4ec0\u4e48\u8bad\u7ec3GPT\u89c4\u6a21\u7684\u6a21\u578b\u9700\u8981\u6570\u5343\u4e2aGPU\u5c0f\u65f6\u3002</p> </li> <li> <p>\u5185\u5b58\u5899\u901a\u5e38\u662f\u66f4\u4e25\u683c\u7684\u7ea6\u675f\u3002\u5728\u8bad\u7ec3\u671f\u95f4\uff0cGPU\u5185\u5b58\u5fc5\u987b\u540c\u65f6\u5bb9\u7eb3\u56db\u6837\u4e1c\u897f\uff1a</p> </li> </ul> <p></p> <ul> <li>\u53c2\u6570\uff1a\u6a21\u578b\u6743\u91cd\u3002\u4e00\u4e2a70\u4ebf\u53c2\u6570\u7684\u6a21\u578b\u5728FP32\u4e2d\uff08\u6bcf\u4e2a\u53c2\u65704\u5b57\u8282\uff09\u4ec5\u6743\u91cd\u5c31\u9700\u898128 GB\u3002</li> <li>\u68af\u5ea6\uff1a\u4e0e\u53c2\u6570\u5927\u5c0f\u76f8\u540c\u3002\u53c8\u662f28 GB\u3002</li> <li>\u4f18\u5316\u5668\u72b6\u6001\uff1aAdam\u7ef4\u62a4\u4e24\u4e2a\u989d\u5916\u7684\u7f13\u51b2\u533a\uff08\u4e00\u9636\u548c\u4e8c\u9636\u77e9\u4f30\u8ba1\uff09\uff0c\u6bcf\u4e2a\u4e0e\u53c2\u6570\u5927\u5c0f\u76f8\u540c\u3002\u5373\u4f7f\u6a21\u578b\u4f7f\u7528\u8f83\u4f4e\u7cbe\u5ea6\uff0c\u8fd9\u4e9b\u4e5f\u4ee5FP32\u683c\u5f0f\u4fdd\u5b58\u4ee5\u786e\u4fdd\u6570\u503c\u7a33\u5b9a\u6027\u3002\u5bf9\u4e8e\u6211\u4eec\u76847B\u6a21\u578b\uff0c\u90a3\u5c31\u662f \\(2 \\times 28 = 56\\) GB\u3002</li> <li> <p>\u6fc0\u6d3b\u503c\uff1a\u5728\u524d\u5411\u4f20\u64ad\u8fc7\u7a0b\u4e2d\u4fdd\u5b58\u4e0b\u6765\u4f9b\u53cd\u5411\u4f20\u64ad\u4f7f\u7528\u7684\u4e2d\u95f4\u503c\u3002\u5927\u5c0f\u53d6\u51b3\u4e8e\u6279\u91cf\u5927\u5c0f\u3001\u5e8f\u5217\u957f\u5ea6\u548c\u6a21\u578b\u5bbd\u5ea6\u3002\u8fd9\u901a\u5e38\u662f\u6700\u4e3b\u8981\u7684\u7ec4\u6210\u90e8\u5206\uff0c\u5e76\u968f\u6279\u91cf\u5927\u5c0f\u7ebf\u6027\u589e\u957f\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u4f7f\u7528FP32 Adam\u76847B\u6a21\u578b\uff1a28\uff08\u53c2\u6570\uff09+ 28\uff08\u68af\u5ea6\uff09+ 56\uff08\u4f18\u5316\u5668\uff09= 112 GB\uff0c\u8fd9\u8fd8\u6ca1\u7b97\u6fc0\u6d3b\u503c\u3002\u5355\u4e2a80 GB\u7684A100 GPU\u65e0\u6cd5\u5bb9\u7eb3\u3002\u8fd9\u5c31\u662f\u5206\u5e03\u5f0f\u7b56\u7565\u81f3\u5173\u91cd\u8981\u7684\u539f\u56e0\u3002</p> </li> <li> <p>\u6df7\u5408\u7cbe\u5ea6\u8bad\u7ec3\u662f\u7b2c\u4e00\u9053\u9632\u7ebf\u3002\u4e0d\u662f\u5c06\u6240\u6709\u5185\u5bb9\u5b58\u50a8\u5728FP32\uff0832\u4f4d\u6d6e\u70b9\uff09\u4e2d\uff0c\u800c\u662f\u4f7f\u7528FP16\u6216BF16\uff0816\u4f4d\uff09\u8fdb\u884c\u524d\u5411\u548c\u53cd\u5411\u4f20\u64ad\uff0c\u540c\u65f6\u5c06\u6743\u91cd\u7684FP32\u4e3b\u526f\u672c\u4fdd\u7559\u7ed9\u4f18\u5316\u5668\u66f4\u65b0\u3002</p> </li> <li> <p>FP16\u5177\u6709\u9ad8\u7cbe\u5ea6\uff0810\u4f4d\u5c3e\u6570\uff09\uff0c\u4f46\u8303\u56f4\u6709\u9650\uff0c\u53ef\u80fd\u5bfc\u81f4\u4e0a\u6ea2/\u4e0b\u6ea2\u3002\u635f\u5931\u7f29\u653e\uff08\u5728\u53cd\u5411\u4f20\u64ad\u524d\u5c06\u635f\u5931\u4e58\u4ee5\u4e00\u4e2a\u5927\u56e0\u5b50\uff0c\u7136\u540e\u5c06\u68af\u5ea6\u9664\u4ee5\u76f8\u540c\u56e0\u5b50\uff09\u7f13\u89e3\u4e86\u8fd9\u4e2a\u95ee\u9898\u3002</p> </li> <li> <p>BF16\uff08\u8111\u6d6e\u70b9\uff09\u5177\u6709\u4e0eFP32\u76f8\u540c\u7684\u6307\u6570\u8303\u56f4\uff088\u4f4d\u6307\u6570\uff09\uff0c\u4f46\u7cbe\u5ea6\u8f83\u4f4e\uff087\u4f4d\u5c3e\u6570\uff09\u3002\u5b83\u51e0\u4e4e\u4ece\u4e0d\u6ea2\u51fa\uff0c\u5f88\u5c11\u9700\u8981\u635f\u5931\u7f29\u653e\uff0c\u56e0\u6b64\u4f7f\u7528\u66f4\u7b80\u5355\u3002BF16\u662f\u73b0\u4ee3Transformer\u8bad\u7ec3\u7684\u9ed8\u8ba4\u9009\u62e9\u3002</p> </li> <li> <p>\u6df7\u5408\u7cbe\u5ea6\u5927\u81f4\u5c06\u6fc0\u6d3b\u503c\u548c\u68af\u5ea6\u7684\u5185\u5b58\u51cf\u534a\uff08\u524d\u5411/\u53cd\u5411\u4f20\u64ad\u671f\u95f4\u7684\u4e3b\u8981\u6210\u672c\uff09\uff0c\u540c\u65f6\u5c06\u4f18\u5316\u5668\u72b6\u6001\u4fdd\u7559\u5728FP32\u4e2d\u4ee5\u786e\u4fdd\u6570\u503c\u7a33\u5b9a\u6027\u3002</p> </li> <li> <p>\u6570\u636e\u5e76\u884c\u662f\u6700\u7b80\u5355\u7684\u5206\u5e03\u5f0f\u7b56\u7565\u3002\u4f60\u5728 \\(N\\) \u4e2aGPU\u4e0a\u590d\u5236\u6574\u4e2a\u6a21\u578b\uff0c\u5c06\u6bcf\u4e2a\u5c0f\u6279\u91cf\u5206\u6210 \\(N\\) \u4e2a\u76f8\u7b49\u7684\u5757\uff0c\u5e76\u5c06\u4e00\u4e2a\u5757\u53d1\u9001\u5230\u6bcf\u4e2aGPU\u3002\u6bcf\u4e2aGPU\u5728\u5176\u5757\u4e0a\u72ec\u7acb\u8fd0\u884c\u524d\u5411\u548c\u53cd\u5411\u4f20\u64ad\u3002\u7136\u540e\u68af\u5ea6\u5728\u6240\u6709GPU\u4e0a\u5e73\u5747\uff08\u4f7f\u7528\u5168\u89c4\u7ea6\u64cd\u4f5c\uff09\uff0c\u6bcf\u4e2aGPU\u66f4\u65b0\u5176\u672c\u5730\u6a21\u578b\u526f\u672c\u3002</p> </li> <li> <p>\u4ece\u6a21\u578b\u7684\u89d2\u5ea6\u6765\u770b\uff0c\u8fd9\u76f8\u5f53\u4e8e\u4f7f\u7528\u5927\u4e86 \\(N\\) \u500d\u7684\u5c0f\u6279\u91cf\u8fdb\u884c\u8bad\u7ec3\u3002\u5982\u679c\u6bcf\u4e2aGPU\u5904\u7406\u4e00\u4e2a\u5927\u5c0f\u4e3a \\(B\\) \u7684\u6279\u6b21\uff0c\u5219\u6709\u6548\u6279\u91cf\u5927\u5c0f\u4e3a \\(N \\cdot B\\)\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u68af\u5ea6\u5e73\u5747\u53ef\u4ee5\u540c\u6b65\u6216\u5f02\u6b65\u8fdb\u884c\u3002\u540c\u6b65SGD\u7b49\u5f85\u6240\u6709GPU\u5b8c\u6210\u540e\u518d\u8fdb\u884c\u5e73\u5747\uff0c\u786e\u4fdd\u4e0e\u4f7f\u7528\u66f4\u5927\u6279\u91cf\u7684\u5355GPU\u8bad\u7ec3\u6570\u5b66\u4e0a\u7b49\u4ef7\u3002\u7f3a\u70b9\u662f\uff0c\u6700\u6162\u7684GPU\uff08\"\u6389\u961f\u8005\"\uff09\u4f1a\u62d6\u6162\u6240\u6709\u4eba\u3002</p> </li> <li> <p>\u5f02\u6b65SGD\u8ba9\u6bcf\u4e2aGPU\u72ec\u7acb\u5730\u66f4\u65b0\u4e00\u4e2a\u5171\u4eab\u7684\u53c2\u6570\u670d\u52a1\u5668\uff0c\u65e0\u9700\u7b49\u5f85\u3002\u8fd9\u6d88\u9664\u4e86\u6389\u961f\u8005\u95ee\u9898\uff0c\u4f46\u5f15\u5165\u4e86\"\u9648\u65e7\u68af\u5ea6\"\uff1a\u4e00\u4e2aGPU\u53ef\u80fd\u57fa\u4e8e\u7565\u5fae\u8fc7\u65f6\u7684\u53c2\u6570\u8ba1\u7b97\u68af\u5ea6\u3002\u9648\u65e7\u68af\u5ea6\u589e\u52a0\u4e86\u566a\u58f0\uff0c\u53ef\u80fd\u51cf\u7f13\u6536\u655b\u3002\u5728\u5b9e\u8df5\u4e2d\uff0c\u5e26\u9ad8\u6548\u901a\u4fe1\u7684\u540c\u6b65SGD\u66f4\u53d7\u9752\u7750\u3002</p> </li> <li> <p>\u68af\u5ea6\u7d2f\u79ef\u662f\u4e00\u79cd\u8f6f\u4ef6\u6280\u5de7\uff0c\u7528\u4e8e\u5728\u6709\u9650\u786c\u4ef6\u4e0a\u6a21\u62df\u66f4\u5927\u7684\u6279\u91cf\u5927\u5c0f\u3002\u4e0d\u5fc5\u6bcf\u4e2a\u5c0f\u6279\u91cf\u505a\u4e00\u6b21\u66f4\u65b0\uff0c\u800c\u662f\u8fd0\u884c\u591a\u6b21\u524d\u5411/\u53cd\u5411\u4f20\u64ad\u5e76\u7d2f\u79ef\u68af\u5ea6\uff0c\u7136\u540e\u505a\u4e00\u6b21\u66f4\u65b0\u3002\u8fd9\u4e0e\u66f4\u5927\u6279\u91cf\u5f97\u5230\u76f8\u540c\u7684\u7ed3\u679c\uff0c\u800c\u65e0\u9700\u66f4\u591aGPU\u5185\u5b58\u7528\u4e8e\u6fc0\u6d3b\u503c\uff08\u4e00\u6b21\u53ea\u6709\u4e00\u4e2a\u5c0f\u6279\u91cf\u7684\u6fc0\u6d3b\u503c\u5728\u5185\u5b58\u4e2d\uff09\u3002</p> </li> <li> <p>\u5f53\u6a21\u578b\u672c\u8eab\u592a\u5927\u65e0\u6cd5\u653e\u5165\u5355\u4e2aGPU\u65f6\uff0c\u9700\u8981\u6a21\u578b\u5e76\u884c\u3002\u6709\u4e24\u79cd\u4e3b\u8981\u5f62\u5f0f\u3002</p> </li> <li> <p>\u5f20\u91cf\u5e76\u884c\u5c06\u5355\u4e2a\u5c42\u5206\u5272\u5230\u591a\u4e2aGPU\u4e0a\u3002\u4e00\u4e2a\u5927\u7684\u77e9\u9635\u4e58\u6cd5 \\(Y = XW\\) \u53ef\u4ee5\u6309\u5217\u5206\u5272\uff1a\u5c06 \\(W\\) \u5206\u533a\u4e3a \\([W_1, W_2]\\) \u5206\u5e03\u5728\u4e24\u4e2aGPU\u4e0a\uff0c\u5e76\u884c\u8ba1\u7b97 \\(Y_1 = XW_1\\) \u548c \\(Y_2 = XW_2\\)\uff0c\u7136\u540e\u62fc\u63a5\u3002\u8fd9\u9002\u7528\u4e8e\u6ce8\u610f\u529b\u6295\u5f71\u548c\u524d\u9988\u5c42\u3002\u5b83\u9700\u8981GPU\u4e4b\u95f4\u5feb\u901f\u901a\u4fe1\uff08\u901a\u5e38\u662f\u8282\u70b9\u5185\u7684NVLink\uff09\uff0c\u56e0\u4e3a\u6bcf\u5c42\u90fd\u5fc5\u987b\u7ec4\u5408\u90e8\u5206\u7ed3\u679c\u3002</p> </li> <li> <p>\u6d41\u6c34\u7ebf\u5e76\u884c\u5c06\u4e0d\u540c\u7684\u5c42\u5206\u914d\u5230\u4e0d\u540c\u7684GPU\u4e0a\u3002GPU 0\u8fd0\u884c\u7b2c1-4\u5c42\uff0cGPU 1\u8fd0\u884c\u7b2c5-8\u5c42\uff0c\u4f9d\u6b64\u7c7b\u63a8\u3002\u6570\u636e\u50cf\u6d41\u6c34\u7ebf\u4e00\u6837\u6d41\u7ecf\u6574\u4e2a\u7ba1\u9053\u3002\u6734\u7d20\u7684\u65b9\u6cd5\u6709\u4e00\u4e2a\"\u6d41\u6c34\u7ebf\u6c14\u6ce1\"\uff1a\u5f53GPU 0\u5904\u7406\u5fae\u6279\u6b211\u7684\u524d\u5411\u4f20\u64ad\u65f6\uff0cGPU 1-3\u5904\u4e8e\u7a7a\u95f2\u72b6\u6001\u3002\u5fae\u6279\u5904\u7406\u901a\u8fc7\u5c06\u5c0f\u6279\u91cf\u5206\u5272\u6210\u66f4\u5c0f\u7684\u5fae\u6279\u6b21\u6765\u7f13\u89e3\u8fd9\u4e2a\u95ee\u9898\uff0c\u8fd9\u4e9b\u5fae\u6279\u6b21\u6309\u987a\u5e8f\u6d41\u7ecf\u6d41\u6c34\u7ebf\uff0c\u4f7f\u6240\u6709GPU\u5927\u90e8\u5206\u65f6\u95f4\u4fdd\u6301\u5fd9\u788c\u3002</p> </li> <li> <p>\u6df7\u5408\u5e76\u884c\u7ed3\u5408\u4e86\u6570\u636e\u5e76\u884c\u3001\u5f20\u91cf\u5e76\u884c\u548c\u6d41\u6c34\u7ebf\u5e76\u884c\u3002\u4e00\u4e2a\u5178\u578b\u7684\u5927\u6a21\u578b\u8bbe\u7f6e\u53ef\u80fd\u4f7f\u7528\u8282\u70b9\u5185\u7684\u5f20\u91cf\u5e76\u884c\uff088\u4e2aGPU\u901a\u8fc7\u5feb\u901fNVLink\u8fde\u63a5\uff09\u3001\u8de8\u8282\u70b9\u7684\u6d41\u6c34\u7ebf\u5e76\u884c\u4ee5\u53ca\u8de8\u8282\u70b9\u7ec4\u7684\u6570\u636e\u5e76\u884c\u3002\u8fd9\u5c31\u662fGPT-4\u548cLlama\u7b49\u6a21\u578b\u7684\u8bad\u7ec3\u65b9\u5f0f\u3002</p> </li> <li> <p>\u5206\u5e03\u5f0f\u8bad\u7ec3\u7684\u6548\u7387\u5728\u5f88\u5927\u7a0b\u5ea6\u4e0a\u53d6\u51b3\u4e8e\u901a\u4fe1\u3002\u5173\u952e\u64cd\u4f5c\u662f\u5168\u89c4\u7ea6\uff08all-reduce\uff09\uff1a\u7ed9\u5b9a \\(N\\) \u4e2aGPU\u4e0a\u5404\u6709\u4e00\u4e2a\u503c\uff0c\u8ba1\u7b97\u603b\u548c\uff08\u6216\u5e73\u5747\u503c\uff09\u5e76\u5c06\u7ed3\u679c\u5206\u53d1\u7ed9\u6240\u6709GPU\u3002</p> </li> <li> <p>\u6734\u7d20\u7684\u5168\u89c4\u7ea6\u5c06\u6240\u6709\u6570\u636e\u53d1\u9001\u5230\u4e00\u4e2aGPU\uff0c\u6c42\u548c\uff0c\u7136\u540e\u5e7f\u64ad\u56de\u6765\u3002\u901a\u4fe1\u91cf\u4e3a \\(O(N)\\)\uff0c\u5e76\u5728\u6839\u8282\u70b9\u9020\u6210\u74f6\u9888\u3002</p> </li> <li> <p>\u73af\u5168\u89c4\u7ea6\uff08Ring all-reduce\uff09 \u8981\u9ad8\u6548\u5f97\u591a\u3002\u5c06 \\(N\\) \u4e2aGPU\u6392\u5217\u6210\u4e00\u4e2a\u73af\u3002\u6bcf\u4e2aGPU\u5c06\u5176\u6570\u636e\u5206\u5272\u6210 \\(N\\) \u5757\u3002\u5728 \\(N - 1\\) \u6b65\u4e2d\uff0c\u6bcf\u4e2aGPU\u5411\u90bb\u5c45\u53d1\u9001\u4e00\u5757\uff0c\u5e76\u4ece\u53e6\u4e00\u4e2a\u90bb\u5c45\u63a5\u6536\u4e00\u5757\uff0c\u7d2f\u52a0\u90e8\u5206\u548c\u3002\u518d\u7ecf\u8fc7 \\(N - 1\\) \u6b65\u540e\uff0c\u5b8c\u6574\u7684\u603b\u548c\u4f20\u64ad\u5230\u6240\u6709GPU\u3002\u6bcf\u4e2aGPU\u7684\u603b\u6570\u636e\u4f20\u8f93\u91cf\uff1a\u6570\u636e\u5927\u5c0f\u7684 \\(2(N-1)/N\\) \u500d\uff0c\u968f\u7740 \\(N\\) \u7684\u589e\u957f\u8d8b\u8fd1\u4e8e \\(2\\times\\)\u3002\u5173\u952e\u5728\u4e8e\uff0c\u8fd9\u4e0d\u968f \\(N\\) \u589e\u52a0\uff0c\u4f7f\u5176\u5e26\u5bbd\u6700\u4f18\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u53c2\u6570\u670d\u52a1\u5668\u662f\u4e00\u79cd\u66ff\u4ee3\u67b6\u6784\uff0c\u5176\u4e2d\u4e13\u7528\u670d\u52a1\u5668\u8282\u70b9\u4fdd\u5b58\u6a21\u578b\u53c2\u6570\u3002\u5de5\u4f5c\u8282\u70b9\u8ba1\u7b97\u68af\u5ea6\u5e76\u5c06\u5176\u53d1\u9001\u5230\u670d\u52a1\u5668\uff0c\u670d\u52a1\u5668\u66f4\u65b0\u53c2\u6570\u5e76\u5c06\u5176\u53d1\u9001\u56de\u6765\u3002\u8fd9\u66f4\u7b80\u5355\uff0c\u4f46\u53ef\u80fd\u5728\u670d\u52a1\u5668\u5904\u9020\u6210\u901a\u4fe1\u74f6\u9888\u3002</p> </li> <li> <p>NCCL\uff08NVIDIA\u96c6\u5408\u901a\u4fe1\u5e93\uff09\u662fGPU\u95f4\u901a\u4fe1\u7684\u6807\u51c6\u5e93\u3002\u5b83\u63d0\u4f9b\u4e86\u5168\u89c4\u7ea6\u3001\u5168\u6536\u96c6\u3001\u5e7f\u64ad\u548c\u5176\u4ed6\u96c6\u5408\u64cd\u4f5c\u7684\u9ad8\u6548\u5b9e\u73b0\uff0c\u81ea\u52a8\u4e3a\u7f51\u7edc\u62d3\u6251\u9009\u62e9\u6700\u4f73\u7b97\u6cd5\u3002</p> </li> <li> <p>\u7f29\u653e\u5b9a\u5f8b\u63cf\u8ff0\u4e86\u6a21\u578b\u6027\u80fd\u5982\u4f55\u968f\u8ba1\u7b97\u91cf\u3001\u6570\u636e\u91cf\u548c\u6a21\u578b\u5927\u5c0f\u800c\u63d0\u5347\u3002\u539f\u59cb\u7684Kaplan\u7b49\u4eba\uff082020\uff09\u7f29\u653e\u5b9a\u5f8b\u53d1\u73b0\uff0c\u635f\u5931\u968f\u6bcf\u4e2a\u56e0\u7d20\u4ee5\u5e42\u5f8b\u65b9\u5f0f\u4e0b\u964d\uff1a</p> </li> </ul> \\[L(N) \\propto N^{-\\alpha_N}, \\quad L(D) \\propto D^{-\\alpha_D}, \\quad L(C) \\propto C^{-\\alpha_C}\\] <ul> <li> <p>\u5176\u4e2d \\(N\\) \u662f\u53c2\u6570\u6570\u91cf\uff0c\\(D\\) \u662f\u6570\u636e\u96c6\u5927\u5c0f\uff0c\\(C\\) \u662f\u8ba1\u7b97\u9884\u7b97\u3002</p> </li> <li> <p>Chinchilla\u7f29\u653e\u5b9a\u5f8b\uff08Hoffmann\u7b49\u4eba\uff0c2022\uff09\u8868\u660e\u5927\u591a\u6570\u6a21\u578b\u8bad\u7ec3\u4e0d\u8db3\uff1a\u5bf9\u4e8e\u7ed9\u5b9a\u7684\u8ba1\u7b97\u9884\u7b97\uff0c\u5e94\u8be5\u8bad\u7ec3\u4e00\u4e2a\u66f4\u5c0f\u7684\u6a21\u578b\uff0c\u4f7f\u7528\u6bd4\u4ee5\u524d\u8ba4\u4e3a\u7684\u66f4\u591a\u7684\u6570\u636e\u3002\u6700\u4f18\u6bd4\u4f8b\u5927\u7ea6\u662f\u6bcf\u53c2\u657020\u4e2atoken\u3002\u4e00\u4e2a7B\u6a21\u578b\u5e94\u8be5\u770b\u5230\u5927\u7ea6140B\u4e2atoken\uff0c\u800c\u4e0d\u662fLlama 1\u572865B\u6a21\u578b\u4e0a\u4f7f\u7528\u7684300B\u4e2atoken\u3002\u8fd9\u4e00\u53d1\u73b0\u5c06\u9886\u57df\u8f6c\u5411\u4e86\"\u8ba1\u7b97\u6700\u4f18\"\u8bad\u7ec3\u3002</p> </li> <li> <p>\u6df7\u5408\u4e13\u5bb6\uff08MoE\uff09 \u662f\u4e00\u79cd\u5728\u4e0d\u6309\u6bd4\u4f8b\u589e\u52a0\u8ba1\u7b97\u91cf\u7684\u60c5\u51b5\u4e0b\u6269\u5c55\u6a21\u578b\u5bb9\u91cf\u7684\u67b6\u6784\u3002\u6bcf\u4e2aTransformer\u5c42\u4e0d\u662f\u4f7f\u7528\u4e00\u4e2a\u524d\u9988\u7f51\u7edc\uff0c\u800c\u662f\u6709 \\(N\\) \u4e2a\"\u4e13\u5bb6\"\u7f51\u7edc\uff08\u6bcf\u4e2a\u90fd\u662f\u4e00\u4e2a\u6807\u51c6FFN\uff09\u3002\u4e00\u4e2a\u95e8\u63a7\u7f51\u7edc\uff08\u8def\u7531\u5668\uff09\u68c0\u67e5\u6bcf\u4e2atoken\u5e76\u5c06\u5176\u53d1\u9001\u5230top-\\(K\\)\u4e2a\u4e13\u5bb6\uff08\u901a\u5e38 \\(K = 1\\) \u6216 \\(K = 2\\)\uff09\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u603b\u53c2\u6570\u91cf\u8981\u5927\u5f97\u591a\uff08\u56e0\u4e3a\u6709 \\(N\\) \u4e2a\u4e13\u5bb6\uff09\uff0c\u4f46\u6bcf\u4e2atoken\u7684FLOPs\u5927\u81f4\u4fdd\u6301\u4e0d\u53d8\uff08\u56e0\u4e3a\u6bcf\u4e2atoken\u53ea\u6709 \\(K\\) \u4e2a\u4e13\u5bb6\u6fc0\u6d3b\uff09\u3002\u4f8b\u5982\uff0cMixtral 8x7B\u5171\u670947B\u4e2a\u53c2\u6570\uff0c\u4f46\u6bcf\u6b21\u524d\u5411\u4f20\u64ad\u53ea\u7528\u5927\u7ea613B\uff0c\u4ee5\u8f83\u5c0f\u6a21\u578b\u7684\u4ee3\u4ef7\u83b7\u5f97\u66f4\u5927\u6a21\u578b\u7684\u6027\u80fd\u3002</p> </li> <li> <p>MoE\u5e26\u6765\u4e86\u6311\u6218\u3002\u8d1f\u8f7d\u5747\u8861\uff1a\u5982\u679c\u8def\u7531\u5668\u5c06\u5927\u591a\u6570token\u53d1\u9001\u5230\u540c\u4e00\u4e2a\u4e13\u5bb6\uff0c\u5176\u4ed6\u4e13\u5bb6\u5c31\u88ab\u6d6a\u8d39\u4e86\u3002\u8f85\u52a9\u635f\u5931\u9f13\u52b1\u5747\u5300\u8def\u7531\u3002\u901a\u4fe1\uff1a\u4e0d\u540c\u7684\u4e13\u5bb6\u53ef\u80fd\u4f4d\u4e8e\u4e0d\u540c\u7684GPU\u4e0a\uff0c\u56e0\u6b64\u8def\u7531token\u9700\u8981\u5168\u5bf9\u5168\u901a\u4fe1\uff0c\u8fd9\u5f88\u6602\u8d35\u3002</p> </li> <li> <p>\u5bb9\u9519\u5728\u8bad\u7ec3\u8fd0\u884c\u6301\u7eed\u6570\u5468\u6216\u6570\u6708\u3001\u6d89\u53ca\u6570\u5343\u4e2aGPU\u65f6\u81f3\u5173\u91cd\u8981\u3002\u5982\u679c\u5355\u4e2aGPU\u5931\u6548\uff0c\u4f60\u4e0d\u60f3\u4e22\u5931\u6240\u6709\u8fdb\u5ea6\u3002\u68c0\u67e5\u70b9\u5b9a\u671f\u5c06\u6a21\u578b\u6743\u91cd\u3001\u4f18\u5316\u5668\u72b6\u6001\u548c\u8bad\u7ec3\u72b6\u6001\uff08\u5b66\u4e60\u7387\u3001\u6b65\u6570\u3001\u6570\u636e\u4f4d\u7f6e\uff09\u4fdd\u5b58\u5230\u78c1\u76d8\u3002\u5982\u679c\u53d1\u751f\u6545\u969c\uff0c\u4f60\u53ef\u4ee5\u4ece\u6700\u8fd1\u7684\u68c0\u67e5\u70b9\u91cd\u65b0\u5f00\u59cb\u3002</p> </li> <li> <p>\u68af\u5ea6\u68c0\u67e5\u70b9\uff08\u4e5f\u79f0\u4e3a\u6fc0\u6d3b\u91cd\u8ba1\u7b97\uff09\u662f\u4e00\u79cd\u5185\u5b58\u4f18\u5316\uff0c\u800c\u975e\u5bb9\u9519\u673a\u5236\u3002\u5728\u524d\u5411\u4f20\u64ad\u8fc7\u7a0b\u4e2d\uff0c\u4e0d\u662f\u4fdd\u5b58\u6240\u6709\u6fc0\u6d3b\u503c\u4f9b\u53cd\u5411\u4f20\u64ad\u4f7f\u7528\uff0c\u800c\u662f\u53ea\u5728\u67d0\u4e9b\u68c0\u67e5\u70b9\u4fdd\u5b58\u6fc0\u6d3b\u503c\u3002\u5728\u53cd\u5411\u4f20\u64ad\u8fc7\u7a0b\u4e2d\uff0c\u4ece\u68c0\u67e5\u70b9\u91cd\u65b0\u8ba1\u7b97\u7f3a\u5931\u7684\u6fc0\u6d3b\u503c\u3002\u8fd9\u4ee5\u8ba1\u7b97\u6362\u53d6\u5185\u5b58\uff1a\u5b83\u4f7f\u524d\u5411\u4f20\u64ad\u6210\u672c\u589e\u52a0\u7ea633%\uff0c\u4f46\u53ef\u4ee5\u5c06\u6fc0\u6d3b\u5185\u5b58\u51cf\u5c11 \\(\\sqrt{L}\\) \u500d\uff08\u5176\u4e2d \\(L\\) \u662f\u5c42\u6570\uff09\u3002</p> </li> <li> <p>\u7efc\u5408\u8d77\u6765\uff0c\u8bad\u7ec3\u524d\u6cbf\u6a21\u578b\u7ed3\u5408\u4e86\u6240\u6709\u8fd9\u4e9b\u6280\u672f\uff1aBF16\u6df7\u5408\u7cbe\u5ea6\u3001\u4f7f\u7528\u73af\u5168\u89c4\u7ea6\u5728\u6570\u5343\u4e2aGPU\u4e0a\u8fdb\u884c\u6570\u636e\u5e76\u884c\u3001\u8282\u70b9\u5185\u7684\u5f20\u91cf\u5e76\u884c\u3001\u8de8\u8282\u70b9\u7684\u6d41\u6c34\u7ebf\u5e76\u884c\u3001\u51cf\u5c11\u5185\u5b58\u7684\u68af\u5ea6\u68c0\u67e5\u70b9\u3001\u63d0\u9ad8\u53c2\u6570\u6548\u7387\u7684MoE\uff0c\u4ee5\u53ca\u7528\u4e8e\u5bb9\u9519\u7684\u5b9a\u671f\u68c0\u67e5\u70b9\u3002\u7cfb\u7edf\u5de5\u7a0b\u4e0e\u7b97\u6cd5\u8bbe\u8ba1\u4e00\u6837\u5177\u6709\u6311\u6218\u6027\u3002</p> </li> <li> <p>\u603b\u7ed3\u5206\u5e03\u5f0f\u8bad\u7ec3\u5de5\u5177\u5305\uff1a</p> </li> </ul> \u6280\u672f \u4f5c\u7528 \u6743\u8861 \u6df7\u5408\u7cbe\u5ea6 (BF16) \u5c06\u6fc0\u6d3b\u503c/\u68af\u5ea6\u7684\u5185\u5b58\u51cf\u534a \u8f7b\u5fae\u6570\u503c\u5dee\u5f02 \u6570\u636e\u5e76\u884c \u5728GPU\u95f4\u6269\u5c55\u6279\u91cf\u5927\u5c0f \u68af\u5ea6\u540c\u6b65\u7684\u901a\u4fe1\u5f00\u9500 \u5f20\u91cf\u5e76\u884c \u5728GPU\u95f4\u5206\u5272\u5c42 \u9700\u8981\u5feb\u901f\u4e92\u8054 \u6d41\u6c34\u7ebf\u5e76\u884c \u5728GPU\u95f4\u5206\u5272\u6a21\u578b\u9636\u6bb5 \u6d41\u6c34\u7ebf\u6c14\u6ce1\uff08\u8ba1\u7b97\u6d6a\u8d39\uff09 \u68af\u5ea6\u7d2f\u79ef \u6a21\u62df\u5927\u6279\u91cf \u66f4\u6162\uff08\u591a\u6b21\u524d\u5411/\u53cd\u5411\u4f20\u64ad\uff09 \u68af\u5ea6\u68c0\u67e5\u70b9 \u51cf\u5c11\u6fc0\u6d3b\u5185\u5b58 \u7ea6\u591a33%\u8ba1\u7b97 \u73af\u5168\u89c4\u7ea6 \u9ad8\u6548\u7684\u68af\u5ea6\u5e73\u5747 \u5927\u6a21\u578b\u53d7\u9650\u4e8e\u5e26\u5bbd MoE \u66f4\u591a\u5bb9\u91cf\uff0c\u76f8\u540cFLOPs \u8d1f\u8f7d\u5747\u8861\u3001\u8def\u7531\u590d\u6742\u6027 \u7f29\u653e\u5b9a\u5f8b \u6307\u5bfc\u8ba1\u7b97\u5206\u914d \u7ecf\u9a8c\u516c\u5f0f\uff0c\u672a\u5fc5\u5728\u6240\u6709\u89c4\u6a21\u90fd\u6210\u7acb"},{"location":"chapter%2006%3A%20machine%20learning/05.%20distributed%20deep%20learning/#colab","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216\u7b14\u8bb0\u672c\uff09","text":"<ol> <li> <p>\u8ba1\u7b97Transformer\u5c42\u7684FLOPs\u548c\u5185\u5b58\u9700\u6c42\u3002\u7ed9\u5b9a\u9690\u85cf\u7ef4\u5ea6 \\(d\\)\u3001\u5e8f\u5217\u957f\u5ea6 \\(n\\)\u3001\u6279\u91cf\u5927\u5c0f \\(B\\) \u548c\u5c42\u6570\uff0c\u4f30\u8ba1\u603b\u8bad\u7ec3\u6210\u672c\u3002 <pre><code>import jax.numpy as jnp\n\ndef transformer_layer_flops(d, n, B):\n    \"\"\"\u4e00\u4e2aTransformer\u5c42\u524d\u5411\u4f20\u64ad\u7684\u8fd1\u4f3cFLOPs\u3002\"\"\"\n    # QKV\u6295\u5f71\uff1a3 * (B * n * d * d) * 2\uff08\u4e58\u6cd5-\u52a0\u6cd5\uff09\n    qkv_flops = 3 * 2 * B * n * d * d\n    # \u6ce8\u610f\u529b\uff1a(B * n * n * d) * 2 \u7528\u4e8eQK^T\uff0c(B * n * n * d) * 2 \u7528\u4e8eattn*V\n    attn_flops = 2 * 2 * B * n * n * d\n    # \u8f93\u51fa\u6295\u5f71\uff1a(B * n * d * d) * 2\n    out_flops = 2 * B * n * d * d\n    # FFN\uff1a\u4e24\u5c42\uff0cd-&gt;4d \u548c 4d-&gt;d\uff1a2 * (B * n * d * 4d) * 2\n    ffn_flops = 2 * 2 * B * n * d * 4 * d\n    return qkv_flops + attn_flops + out_flops + ffn_flops\n\ndef transformer_layer_memory(d, n, B, dtype_bytes=2):\n    \"\"\"\u4e00\u4e2a\u5c42\u7684\u8fd1\u4f3c\u6fc0\u6d3b\u5185\u5b58\uff08\u5b57\u8282\uff09\u3002\"\"\"\n    # QKV\uff1a3 * B * n * d\n    qkv_mem = 3 * B * n * d * dtype_bytes\n    # \u6ce8\u610f\u529b\u6743\u91cd\uff1aB * heads * n * n\uff08\u8fd1\u4f3c B * n * n * sizeof\uff09\n    attn_mem = B * n * n * dtype_bytes\n    # FFN\u4e2d\u95f4\u503c\uff1aB * n * 4d\n    ffn_mem = B * n * 4 * d * dtype_bytes\n    return qkv_mem + attn_mem + ffn_mem\n\n# \u793a\u4f8b\uff1aGPT-2\u89c4\u6a21\nd, n, B, L = 1024, 1024, 8, 24\nfwd_flops = transformer_layer_flops(d, n, B)\ntotal_flops = 3 * L * fwd_flops  # \u524d\u5411+\u53cd\u5411\u76843\u500d\nact_mem = L * transformer_layer_memory(d, n, B)\nparam_count = L * (12 * d * d + 13 * d)  # \u8fd1\u4f3c\n\nprint(f\"\u6a21\u578b\uff1ad={d}, n={n}, B={B}, L={L}\")\nprint(f\"\u53c2\u6570\uff1a{param_count / 1e6:.0f}M\")\nprint(f\"\u6bcf\u6b65FLOPs\uff1a{total_flops / 1e12:.2f} TFLOPs\")\nprint(f\"\u6fc0\u6d3b\u5185\u5b58\uff1a{act_mem / 1e9:.2f} GB (BF16)\")\nprint(f\"\u53c2\u6570\u5185\u5b58 (FP32)\uff1a{param_count * 4 / 1e9:.2f} GB\")\nprint(f\"Adam\u4f18\u5316\u5668\u5185\u5b58\uff1a{param_count * 8 / 1e9:.2f} GB\")\nprint(f\"\u603b\u8bad\u7ec3\u5185\u5b58\uff1a{(param_count * 16 + act_mem) / 1e9:.2f} GB\")\n</code></pre></p> </li> <li> <p>\u6a21\u62df\u6570\u636e\u5e76\u884c\u8bad\u7ec3\u3002\u5c06\u6570\u636e\u96c6\u5206\u5272\u5230\u591a\u4e2a\"\u865a\u62dfGPU\"\u4e0a\uff0c\u72ec\u7acb\u8ba1\u7b97\u68af\u5ea6\uff0c\u5e73\u5747\u5b83\u4eec\uff0c\u5e76\u9a8c\u8bc1\u7ed3\u679c\u4e0e\u5355GPU\u8bad\u7ec3\u5339\u914d\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\n# \u7b80\u5355\u7ebf\u6027\u6a21\u578b\uff1ay = wx + b\nkey = jax.random.PRNGKey(0)\nX = jax.random.normal(key, (64, 4))\nw_true = jnp.array([1.0, -2.0, 3.0, 0.5])\ny = X @ w_true + 0.1 * jax.random.normal(key, (64,))\n\ndef loss_fn(w, X, y):\n    return jnp.mean((X @ w - y) ** 2)\n\ngrad_fn = jax.grad(loss_fn)\n\n# \u5355GPU\uff1a\u5168\u6279\u91cf\u68af\u5ea6\nw = jnp.zeros(4)\ngrad_single = grad_fn(w, X, y)\n\n# \u6570\u636e\u5e76\u884c\uff1a\u5206\u5272\u52304\u4e2a\"GPU\"\u4e0a\nn_gpus = 4\nchunk_size = len(X) // n_gpus\ngrads = []\nfor i in range(n_gpus):\n    X_chunk = X[i*chunk_size:(i+1)*chunk_size]\n    y_chunk = y[i*chunk_size:(i+1)*chunk_size]\n    grads.append(grad_fn(w, X_chunk, y_chunk))\n\n# \u5168\u89c4\u7ea6\uff1a\u5e73\u5747\u68af\u5ea6\ngrad_parallel = jnp.mean(jnp.stack(grads), axis=0)\n\nprint(\"\u5355GPU\u68af\u5ea6\uff1a\", grad_single)\nprint(\"\u6570\u636e\u5e76\u884c\u68af\u5ea6\uff08\u5e73\u5747\uff09\uff1a\", grad_parallel)\nprint(f\"\u5339\u914d\uff1a{jnp.allclose(grad_single, grad_parallel, atol=1e-5)}\")\n\n# \u8bad\u7ec3\u4e24\u8005\u5e76\u6bd4\u8f83\nw_single, w_parallel = jnp.zeros(4), jnp.zeros(4)\nlr = 0.1\nfor step in range(100):\n    w_single = w_single - lr * grad_fn(w_single, X, y)\n\n    grads = [grad_fn(w_parallel, X[i*chunk_size:(i+1)*chunk_size],\n                     y[i*chunk_size:(i+1)*chunk_size]) for i in range(n_gpus)]\n    avg_grad = jnp.mean(jnp.stack(grads), axis=0)\n    w_parallel = w_parallel - lr * avg_grad\n\nprint(f\"\\n100\u6b65\u4e4b\u540e\uff1a\")\nprint(f\"\u5355GPU\u6743\u91cd\uff1a{w_single}\")\nprint(f\"\u6570\u636e\u5e76\u884c\u6743\u91cd\uff1a{w_parallel}\")\nprint(f\"\u6700\u5927\u5dee\u5f02\uff1a{jnp.max(jnp.abs(w_single - w_parallel)):.2e}\")\n</code></pre></p> </li> <li> <p>\u5b9e\u73b0\u4e00\u4e2a\u7b80\u5355\u7684\u6df7\u5408\u4e13\u5bb6\u5c42\u3002\u521b\u5efa\u4e00\u4e2a\u95e8\u63a7\u7f51\u7edc\uff0c\u5c06token\u8def\u7531\u5230top-K\u4e2a\u4e13\u5bb6\u5e76\u7ec4\u5408\u5b83\u4eec\u7684\u8f93\u51fa\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\ndef expert_fn(x, W1, b1, W2, b2):\n    \"\"\"\u7b80\u5355\u76842\u5c42FFN\u4e13\u5bb6\u3002\"\"\"\n    h = jnp.maximum(0, x @ W1 + b1)  # ReLU\n    return h @ W2 + b2\n\ndef moe_layer(x, gate_W, experts_params, top_k=2):\n    \"\"\"\n    MoE\u524d\u5411\u4f20\u64ad\u3002\n    x: (batch, d_model)\n    gate_W: (d_model, n_experts)\n    experts_params: \u6bcf\u4e2a\u4e13\u5bb6\u7684 (W1, b1, W2, b2) \u5217\u8868\n    \"\"\"\n    n_experts = len(experts_params)\n\n    # \u95e8\u63a7\uff1a\u8ba1\u7b97\u8def\u7531\u5206\u6570\n    gate_logits = x @ gate_W  # (batch, n_experts)\n    gate_probs = jax.nn.softmax(gate_logits, axis=-1)\n\n    # Top-K\u9009\u62e9\n    top_k_indices = jnp.argsort(-gate_probs, axis=-1)[:, :top_k]\n    top_k_probs = jnp.take_along_axis(gate_probs, top_k_indices, axis=-1)\n    # \u91cd\u65b0\u5f52\u4e00\u5316\n    top_k_probs = top_k_probs / jnp.sum(top_k_probs, axis=-1, keepdims=True)\n\n    # \u8ba1\u7b97\u4e13\u5bb6\u8f93\u51fa\uff08\u7b80\u5316\uff1a\u8fd0\u884c\u6240\u6709\u4e13\u5bb6\uff0c\u7a0d\u540e\u63a9\u7801\uff09\n    expert_outputs = jnp.stack([\n        expert_fn(x, *experts_params[i]) for i in range(n_experts)\n    ], axis=1)  # (batch, n_experts, d_model)\n\n    # \u6536\u96c6top-K\u4e13\u5bb6\u8f93\u51fa\u5e76\u52a0\u6743\n    batch_idx = jnp.arange(x.shape[0])[:, None]\n    selected_outputs = expert_outputs[batch_idx, top_k_indices]  # (batch, top_k, d_model)\n    output = jnp.sum(selected_outputs * top_k_probs[:, :, None], axis=1)\n\n    return output, gate_probs\n\n# \u8bbe\u7f6e\nkey = jax.random.PRNGKey(42)\nbatch, d_model, d_ff, n_experts = 8, 16, 32, 4\n\n# \u521d\u59cb\u5316\u4e13\u5bb6\nexperts_params = []\nfor i in range(n_experts):\n    k1, k2, key = jax.random.split(key, 3)[0], jax.random.split(key, 3)[1], jax.random.split(key, 3)[2]\n    experts_params.append((\n        jax.random.normal(k1, (d_model, d_ff)) * 0.1,\n        jnp.zeros(d_ff),\n        jax.random.normal(k2, (d_ff, d_model)) * 0.1,\n        jnp.zeros(d_model),\n    ))\n\nkey, subkey = jax.random.split(key)\ngate_W = jax.random.normal(subkey, (d_model, n_experts)) * 0.1\nx = jax.random.normal(key, (batch, d_model))\n\noutput, gate_probs = moe_layer(x, gate_W, experts_params, top_k=2)\n\nprint(f\"\u8f93\u5165\u5f62\u72b6\uff1a{x.shape}\")\nprint(f\"\u8f93\u51fa\u5f62\u72b6\uff1a{output.shape}\")\nprint(f\"\u95e8\u63a7\u6982\u7387\uff08\u7b2c\u4e00\u4e2a\u6837\u672c\uff09\uff1a{gate_probs[0]}\")\nprint(f\"\u4e13\u5bb6\u4f7f\u7528\u7387\uff08\u6279\u91cf\u5e73\u5747\uff09\uff1a\")\nfor i in range(n_experts):\n    usage = jnp.mean(gate_probs[:, i])\n    print(f\"  \u4e13\u5bb6 {i}: {usage:.3f}\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2007%3A%20computational%20linguistics/01.%20linguistic%20foundations/","title":"\u8bed\u8a00\u5b66\u57fa\u7840","text":"<p>\u8bed\u8a00\u5b66\u4e3aNLP\u7cfb\u7edf\u63d0\u4f9b\u4e86\u5b83\u4eec\u9690\u5f0f\u5b66\u4e60\u5e76\u5229\u7528\u7684\u7ed3\u6784\u5316\u8bcd\u6c47\u3002\u672c\u6587\u6db5\u76d6\u5f62\u6001\u5b66\u3001\u53e5\u6cd5\u5b66\u3001\u8bed\u4e49\u5b66\u3001\u8bed\u7528\u5b66\u3001\u97f3\u7cfb\u5b66\u3001\u6210\u5206\u53e5\u6cd5\u548c\u4f9d\u5b58\u53e5\u6cd5\u5206\u6790\uff0c\u4ee5\u53ca\u5206\u5e03\u5047\u8bbe\u2014\u2014\u8fd9\u4e9b\u4eba\u7c7b\u8bed\u8a00\u79d1\u5b66\u6784\u6210\u4e86AI\u4e2d\u8bcd\u5143\u5316\u3001\u8bed\u6cd5\u548c\u610f\u4e49\u7684\u57fa\u7840\u3002</p> <ul> <li> <p>\u5728\u6784\u5efa\u80fd\u591f\u7406\u89e3\u6216\u751f\u6210\u8bed\u8a00\u7684\u7cfb\u7edf\u4e4b\u524d\uff0c\u6211\u4eec\u9700\u8981\u7406\u89e3\u8bed\u8a00\u672c\u8eab\u662f\u5982\u4f55\u8fd0\u4f5c\u7684\u3002</p> </li> <li> <p>\u8bed\u8a00\u5b66\u662f\u5bf9\u8bed\u8a00\u7684\u79d1\u5b66\u7814\u7a76\uff0c\u5b83\u4e3aNLP\u63d0\u4f9b\u4e86\u4e0d\u65ad\u501f\u7528\u7684\u6982\u5ff5\u6027\u8bcd\u6c47\u3002</p> </li> <li> <p>\u5373\u4f7f\u662f\u73b0\u4ee3\u795e\u7ecf\u6a21\u578b\u2014\u2014\u5b83\u4eec\u4ece\u539f\u59cb\u6570\u636e\u4e2d\u5b66\u4e60\u8bed\u8a00\u2014\u2014\u4e5f\u4f1a\u9690\u5f0f\u5730\u91cd\u65b0\u53d1\u73b0\u8bed\u8a00\u5b66\u5bb6\u4eec\u51e0\u5341\u5e74\u6765\u5df2\u7ecf\u7f16\u76ee\u7684\u8bb8\u591a\u7ed3\u6784\u3002</p> </li> <li> <p>\u8bed\u8a00\u5728\u6bcf\u4e00\u5c42\u90fd\u5177\u6709\u7ed3\u6784\uff1a\u7ec4\u6210\u5355\u8bcd\u7684\u58f0\u97f3\u3001\u7ec4\u6210\u5355\u8bcd\u7684\u90e8\u4ef6\u3001\u5c06\u5355\u8bcd\u7ec4\u5408\u6210\u53e5\u5b50\u7684\u89c4\u5219\u3001\u8fd9\u4e9b\u53e5\u5b50\u6240\u627f\u8f7d\u7684\u610f\u4e49\uff0c\u4ee5\u53ca\u8bed\u5883\u5982\u4f55\u5851\u9020\u89e3\u8bfb\u3002\u6211\u4eec\u5c06\u81ea\u4e0b\u800c\u4e0a\u5730\u9010\u5c42\u63a2\u7d22\u3002</p> </li> <li> <p>\u5f62\u6001\u5b66\u662f\u5bf9\u5355\u8bcd\u5185\u90e8\u7ed3\u6784\u7684\u7814\u7a76\u3002\u5355\u8bcd\u5e76\u975e\u4e0d\u53ef\u5206\u5272\u7684\u539f\u5b50\uff1b\u5b83\u4eec\u7531\u66f4\u5c0f\u7684\u6709\u610f\u4e49\u7684\u5355\u5143\u6784\u5efa\u800c\u6210\uff0c\u8fd9\u4e9b\u5355\u5143\u79f0\u4e3a\u8bed\u7d20\u3002</p> </li> <li> <p>\u5355\u8bcd\"unhappiness\"\u5305\u542b\u4e09\u4e2a\u8bed\u7d20\uff1a\"un-\"\uff08\u524d\u7f00\uff0c\u610f\u4e3a\"\u4e0d\"\uff09\u3001\"happy\"\uff08\u8bcd\u6839\uff09\u548c\"-ness\"\uff08\u540e\u7f00\uff0c\u5c06\u5f62\u5bb9\u8bcd\u8f6c\u5316\u4e3a\u540d\u8bcd\uff09\u3002\u6bcf\u4e2a\u8bed\u7d20\u90fd\u5bf9\u610f\u4e49\u6709\u6240\u8d21\u732e\u3002</p> </li> <li> <p>\u8bcd\u6839\uff08\u6216\u79f0\u8bcd\u5e72\uff09\u662f\u627f\u8f7d\u4e3b\u8981\u610f\u4e49\u7684\u6838\u5fc3\u8bed\u7d20\u3002\"Happy\"\u3001\"run\"\u3001\"compute\"\u90fd\u662f\u8bcd\u6839\u3002</p> </li> <li> <p>\u8bcd\u7f00\u662f\u9644\u52a0\u5230\u8bcd\u6839\u4e0a\u4ee5\u4fee\u9970\u5176\u610f\u4e49\u6216\u8bed\u6cd5\u529f\u80fd\u7684\u8bed\u7d20\u3002</p> </li> <li> <p>\u82f1\u8bed\u4e2d\u6709\u524d\u7f00\uff08\u4f4d\u4e8e\u8bcd\u6839\u4e4b\u524d\uff1aun-\u3001re-\u3001pre-\uff09\u548c\u540e\u7f00\uff08\u4f4d\u4e8e\u8bcd\u6839\u4e4b\u540e\uff1a-ing\u3001-ed\u3001-tion\uff09\u3002\u4e00\u4e9b\u8bed\u8a00\u8fd8\u5305\u542b\u4e2d\u7f00\uff08\u63d2\u5165\u8bcd\u6839\u5185\u90e8\uff09\u548c\u73af\u7f00\uff08\u5305\u88f9\u5728\u8bcd\u6839\u5468\u56f4\uff09\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u5f62\u6001\u5b66\u5bf9NLP\u5f88\u91cd\u8981\uff0c\u56e0\u4e3a\u5b83\u5f71\u54cd\u8bcd\u5143\u5316\u3002\u4e00\u4e2a\u57fa\u4e8e\u8bcd\u7ea7\u7684\u8bcd\u5143\u5316\u5668\u4f1a\u5c06\"run\"\u3001\"runs\"\u3001\"running\"\u548c\"ran\"\u89c6\u4e3a\u56db\u4e2a\u4e92\u4e0d\u76f8\u5173\u7684\u7b26\u53f7\u3002</p> </li> <li> <p>\u4e00\u4e2a\u5177\u6709\u5f62\u6001\u5b66\u610f\u8bc6\u7684\u7cfb\u7edf\u4f1a\u8bc6\u522b\u51fa\u5b83\u4eec\u5171\u4eab\u540c\u4e00\u4e2a\u8bcd\u6839\u3002\u5b50\u8bcd\u8bcd\u5143\u5316\uff08BPE\u3001WordPiece\uff09\u2014\u2014\u6211\u4eec\u5c06\u5728\u6587\u4ef602\u4e2d\u8ba8\u8bba\u2014\u2014\u662f\u5f62\u6001\u5b66\u5206\u6790\u7684\u7edf\u8ba1\u8fd1\u4f3c\u65b9\u6cd5\u3002</p> </li> <li> <p>\u53e5\u6cd5\u5b66\u7814\u7a76\u5355\u8bcd\u5982\u4f55\u7ec4\u5408\u6210\u77ed\u8bed\u548c\u53e5\u5b50\u3002\u6bcf\u79cd\u8bed\u8a00\u90fd\u6709\u63a7\u5236\u8bcd\u5e8f\u548c\u7ed3\u6784\u7684\u89c4\u5219\uff1b\u8fdd\u53cd\u8fd9\u4e9b\u89c4\u5219\u4f1a\u4ea7\u751f\u65e0\u610f\u4e49\u7684\u8f93\u51fa\u3002</p> </li> <li> <p>\"The cat sat on the mat\"\u662f\u5408\u4e4e\u8bed\u6cd5\u7684\u82f1\u8bed\uff1b\"Mat the on sat cat the\"\u5219\u4e0d\u662f\u3002</p> </li> <li> <p>\u63cf\u8ff0\u53e5\u6cd5\u7ed3\u6784\u4e3b\u8981\u6709\u4e24\u79cd\u6846\u67b6\u3002</p> </li> <li> <p>\u77ed\u8bed\u7ed3\u6784\u8bed\u6cd5\uff08\u4e5f\u79f0\u4e3a\u6210\u5206\u8bed\u6cd5\uff09\u8ba4\u4e3a\u53e5\u5b50\u662f\u901a\u8fc7\u5c06\u4e00\u4e2a\u77ed\u8bed\u5d4c\u5957\u5728\u53e6\u4e00\u4e2a\u77ed\u8bed\u5185\u90e8\u6784\u5efa\u800c\u6210\u7684\u3002\u4e00\u4e2a\u53e5\u5b50\uff08S\uff09\u7531\u4e00\u4e2a\u540d\u8bcd\u77ed\u8bed\uff08NP\uff09\u548c\u4e00\u4e2a\u52a8\u8bcd\u77ed\u8bed\uff08VP\uff09\u7ec4\u6210\u3002</p> </li> <li> <p>\u4e00\u4e2a\u540d\u8bcd\u77ed\u8bed\u53ef\u80fd\u7531\u4e00\u4e2a\u9650\u5b9a\u8bcd\uff08Det\uff09\u540e\u8ddf\u4e00\u4e2a\u540d\u8bcd\uff08N\uff09\u7ec4\u6210\u3002\u4e00\u4e2a\u52a8\u8bcd\u77ed\u8bed\u53ef\u80fd\u7531\u4e00\u4e2a\u52a8\u8bcd\uff08V\uff09\u540e\u8ddf\u4e00\u4e2a\u540d\u8bcd\u77ed\u8bed\u7ec4\u6210\u3002\u8fd9\u4e9b\u89c4\u5219\u6784\u5efa\u51fa\u4e00\u68f5\u6811\uff1a</p> </li> </ul> <p></p> <ul> <li> <p>\u8fd9\u68f5\u6811\u79f0\u4e3a\u6210\u5206\u6811\uff08\u6216\u5206\u6790\u6811\uff09\u3002\u6bcf\u4e2a\u5185\u90e8\u8282\u70b9\u662f\u4e00\u4e2a\u77ed\u8bed\u7c7b\u578b\uff0c\u6bcf\u4e2a\u53f6\u5b50\u8282\u70b9\u662f\u4e00\u4e2a\u5355\u8bcd\u3002\u8fd9\u68f5\u6811\u6355\u6349\u4e86\u5c42\u6b21\u5316\u5206\u7ec4\uff1a\"on the mat\"\u662f\u4e00\u4e2a\u5355\u5143\uff08\u4ecb\u8bcd\u77ed\u8bed\uff09\uff0c\"sat on the mat\"\u662f\u4e00\u4e2a\u5355\u5143\uff08\u52a8\u8bcd\u77ed\u8bed\uff09\uff0c\u800c\u6574\u4e2a\u7ed3\u6784\u662f\u4e00\u4e2a\u53e5\u5b50\u3002</p> </li> <li> <p>\u4e0a\u4e0b\u6587\u65e0\u5173\u6587\u6cd5\uff08CFG\uff09\u5c06\u8fd9\u4e9b\u89c4\u5219\u5f62\u5f0f\u5316\u3002\u5b83\u7531\u4e00\u7ec4\u4ea7\u751f\u5f0f\u89c4\u5219\u7ec4\u6210\uff0c\u6bcf\u6761\u89c4\u5219\u7684\u5f62\u5f0f\u4e3a \\(A \\to \\alpha\\)\uff0c\u5176\u4e2d \\(A\\) \u662f\u4e00\u4e2a\u975e\u7ec8\u7ed3\u7b26\uff08\u5982NP\u6216VP\u8fd9\u6837\u7684\u77ed\u8bed\u7c7b\u578b\uff09\uff0c\\(\\alpha\\) \u662f\u4e00\u4e2a\u7531\u7ec8\u7ed3\u7b26\uff08\u5355\u8bcd\uff09\u548c\u975e\u7ec8\u7ed3\u7b26\u7ec4\u6210\u7684\u5e8f\u5217\u3002\u4f8b\u5982\uff1a</p> </li> </ul> <pre><code>S  \u2192 NP VP\nNP \u2192 Det N\nNP \u2192 Det N PP\nVP \u2192 V NP\nVP \u2192 V PP\nPP \u2192 P NP\nDet \u2192 \"the\" | \"a\"\nN  \u2192 \"cat\" | \"mat\" | \"dog\"\nV  \u2192 \"sat\" | \"chased\"\nP  \u2192 \"on\" | \"under\"\n</code></pre> <ul> <li> <p>\u4eceS\u5f00\u59cb\uff0c\u53cd\u590d\u5e94\u7528\u89c4\u5219\uff0c\u4f60\u53ef\u4ee5\u751f\u6210\u8be5\u6587\u6cd5\u5141\u8bb8\u7684\u6240\u6709\u53e5\u5b50\u3002\u5206\u6790\u5219\u662f\u76f8\u53cd\u7684\u8fc7\u7a0b\uff1a\u7ed9\u5b9a\u4e00\u4e2a\u53e5\u5b50\uff0c\u627e\u51fa\u4ea7\u751f\u5b83\u7684\u6811\uff08\u6216\u6240\u6709\u53ef\u80fd\u7684\u6811\uff09\u3002\u4e00\u4e2a\u6709\u591a\u4e2a\u6709\u6548\u5206\u6790\u6811\u7684\u53e5\u5b50\u79f0\u4e3a\u53e5\u6cd5\u6b67\u4e49\u3002\"I saw the man with the telescope\"\u6709\u4e24\u79cd\u5206\u6790\uff1a\u6211\u4f7f\u7528\u671b\u8fdc\u955c\u770b\u5230\u4e86\u90a3\u4e2a\u7537\u4eba\uff0c\u6216\u8005\u6211\u770b\u5230\u4e86\u4e00\u4e2a\u62ff\u7740\u671b\u8fdc\u955c\u7684\u7537\u4eba\u3002</p> </li> <li> <p>\u4f9d\u5b58\u8bed\u6cd5\u91c7\u53d6\u4e86\u4e00\u79cd\u4e0d\u540c\u7684\u89c6\u89d2\u3002\u5b83\u4e0d\u4f9d\u8d56\u77ed\u8bed\u5d4c\u5957\uff0c\u800c\u662f\u63cf\u8ff0\u5355\u8bcd\u4e4b\u95f4\u7684\u76f4\u63a5\u5173\u7cfb\u3002\u53e5\u5b50\u4e2d\u7684\u6bcf\u4e2a\u5355\u8bcd\u90fd\u6070\u597d\u4f9d\u8d56\u4e8e\u53e6\u4e00\u4e2a\u5355\u8bcd\uff08\u5b83\u7684\u6838\u5fc3\u8bcd\uff09\uff0c\u9664\u4e86\u53e5\u5b50\u7684\u6839\u8282\u70b9\u3002\u7ed3\u679c\u662f\u4e00\u4e2a\u4f9d\u5b58\u6811\uff0c\u5176\u4e2d\u8fb9\u6807\u6709\u8bed\u6cd5\u5173\u7cfb\u6807\u7b7e\uff08\u4e3b\u8bed\u3001\u5bbe\u8bed\u3001\u4fee\u9970\u8bed\u7b49\uff09\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u5728\u4f9d\u5b58\u89c6\u89d2\u4e0b\uff0c\"sat\"\u662f\u6839\u8282\u70b9\u3002\"Cat\"\u4f5c\u4e3a\u4e3b\u8bed\uff08nsubj\uff09\u4f9d\u8d56\u4e8e\"sat\"\u3002\"On\"\u4f5c\u4e3a\u4ecb\u8bcd\u4fee\u9970\u8bed\u4f9d\u8d56\u4e8e\"sat\"\u3002\"Mat\"\u4f5c\u4e3a\u4ecb\u8bcd\u5bbe\u8bed\u4f9d\u8d56\u4e8e\"on\"\u3002\u6bcf\u4e2a\u5355\u8bcd\u90fd\u6302\u5728\u6070\u597d\u4e00\u4e2a\u6838\u5fc3\u8bcd\u4e0a\uff0c\u5f62\u6210\u4e00\u68f5\u6811\u3002</p> </li> <li> <p>\u4f9d\u5b58\u8bed\u6cd5\u5df2\u6210\u4e3a\u73b0\u4ee3NLP\u4e2d\u7684\u4e3b\u5bfc\u6846\u67b6\uff0c\u56e0\u4e3a\u4f9d\u5b58\u6811\u66f4\u5bb9\u6613\u7528\u7edf\u8ba1\u5206\u6790\u5668\u751f\u6210\uff0c\u800c\u4e14\u8fd9\u4e9b\u5173\u7cfb\u66f4\u76f4\u63a5\u5730\u6620\u5c04\u5230\u8bed\u4e49\u89d2\u8272\uff08\u8c01\u5bf9\u8c01\u505a\u4e86\u4ec0\u4e48\uff09\u3002</p> </li> <li> <p>\u914d\u4ef7\u63cf\u8ff0\u4e00\u4e2a\u52a8\u8bcd\u9700\u8981\u591a\u5c11\u4e2a\u8bba\u5143\u3002\"Sleep\"\u662f\u4e0d\u53ca\u7269\u52a8\u8bcd\uff08\u4e00\u4e2a\u8bba\u5143\uff1a\u7761\u89c9\u8005\uff09\u3002\"Eat\"\u662f\u53ca\u7269\u52a8\u8bcd\uff08\u4e24\u4e2a\uff1a\u5403\u8005\u548c\u88ab\u5403\u4e4b\u7269\uff09\u3002\"Give\"\u662f\u53cc\u53ca\u7269\u52a8\u8bcd\uff08\u4e09\u4e2a\uff1a\u7ed9\u4e88\u8005\u3001\u7ed9\u4e88\u4e4b\u7269\u548c\u63a5\u53d7\u8005\uff09\u3002\u4e86\u89e3\u52a8\u8bcd\u7684\u914d\u4ef7\u53ef\u4ee5\u7ea6\u675f\u54ea\u4e9b\u5206\u6790\u6811\u662f\u6709\u6548\u7684\u3002</p> </li> <li> <p>\u8bed\u4e49\u5b66\u662f\u5bf9\u610f\u4e49\u7684\u7814\u7a76\u3002\u53e5\u6cd5\u5b66\u544a\u8bc9\u4f60\u53e5\u5b50\u662f\u5982\u4f55\u7ed3\u6784\u7684\uff1b\u8bed\u4e49\u5b66\u544a\u8bc9\u4f60\u53e5\u5b50\u610f\u5473\u7740\u4ec0\u4e48\u3002</p> </li> <li> <p>\u8bcd\u6c47\u8bed\u4e49\u5b66\u5173\u6ce8\u5355\u4e2a\u5355\u8bcd\u7684\u610f\u4e49\u3002\u5355\u8bcd\u4e4b\u95f4\u4ee5\u7cfb\u7edf\u6027\u7684\u65b9\u5f0f\u76f8\u4e92\u5173\u8054\uff1a</p> <ul> <li>\u540c\u4e49\u5173\u7cfb\uff1a\u5177\u6709\uff08\u51e0\u4e4e\uff09\u76f8\u540c\u610f\u4e49\u7684\u5355\u8bcd\u3002\"Big\"\u548c\"large\"\u662f\u540c\u4e49\u8bcd\u3002\u771f\u6b63\u5b8c\u7f8e\u7684\u540c\u4e49\u8bcd\u662f\u7f55\u89c1\u7684\uff1b\u51e0\u4e4e\u603b\u662f\u5b58\u5728\u542b\u4e49\u6216\u7528\u6cd5\u4e0a\u7684\u7ec6\u5fae\u5dee\u522b\u3002</li> <li>\u53cd\u4e49\u5173\u7cfb\uff1a\u5177\u6709\u76f8\u53cd\u610f\u4e49\u7684\u5355\u8bcd\u3002\"Hot\"\u548c\"cold\"\uff0c\"buy\"\u548c\"sell\"\u3002</li> <li>\u4e0a\u4f4d\u5173\u7cfb/\u4e0b\u4f4d\u5173\u7cfb\uff1a\"\u662f\u4e00\u79cd\"\u5173\u7cfb\u3002\"Dog\"\u662f\"animal\"\u7684\u4e0b\u4f4d\u8bcd\uff08\u72d7\u662f\u4e00\u79cd\u52a8\u7269\uff09\u3002\"Animal\"\u662f\"dog\"\u7684\u4e0a\u4f4d\u8bcd\u3002\u8fd9\u4e9b\u5173\u7cfb\u5f62\u6210\u5206\u7c7b\u5c42\u6b21\u7ed3\u6784\u3002</li> <li>\u90e8\u5206\u6574\u4f53\u5173\u7cfb\uff1a\"\u7ec4\u6210\u90e8\u5206\"\u5173\u7cfb\u3002\"Wheel\"\u662f\"car\"\u7684\u90e8\u5206\u8bcd\u3002</li> <li>\u591a\u4e49\u5173\u7cfb\uff1a\u4e00\u4e2a\u5355\u8bcd\u5177\u6709\u591a\u4e2a\u76f8\u5173\u610f\u4e49\u3002\"Bank\"\u53ef\u4ee5\u6307\u91d1\u878d\u673a\u6784\u6216\u6cb3\u5cb8\u3002\u8bed\u5883\u53ef\u4ee5\u6d88\u9664\u6b67\u4e49\u3002</li> </ul> </li> <li> <p>\u8bcd\u4e49\u6d88\u6b67\uff08WSD\uff09\u662f\u6839\u636e\u4e0a\u4e0b\u6587\u786e\u5b9a\u591a\u4e49\u8bcd\u7684\u54ea\u4e2a\u4e49\u9879\u88ab\u4f7f\u7528\u7684\u4efb\u52a1\u3002\u5728\"I deposited money at the bank\"\u4e2d\uff0c\u91d1\u878d\u4e49\u9879\u662f\u6b63\u786e\u7684\u3002\u5728\"We sat by the river bank\"\u4e2d\uff0c\u5730\u7406\u4e49\u9879\u662f\u6b63\u786e\u7684\u3002WSD\u662f\u65e9\u671fNLP\u4e2d\u7684\u4e00\u4e2a\u6838\u5fc3\u95ee\u9898\uff1b\u73b0\u4ee3\u7684\u4e0a\u4e0b\u6587\u5d4c\u5165\uff08ELMo\u3001BERT\uff09\u901a\u8fc7\u4e3a\u540c\u4e00\u4e2a\u5355\u8bcd\u7684\u4e0d\u540c\u7528\u6cd5\u751f\u6210\u4e0d\u540c\u7684\u5411\u91cf\u8868\u793a\uff0c\u5728\u5f88\u5927\u7a0b\u5ea6\u4e0a\u89e3\u51b3\u4e86\u8fd9\u4e2a\u95ee\u9898\u3002</p> </li> <li> <p>\u7ec4\u5408\u8bed\u4e49\u5b66\u7814\u7a76\u5355\u4e2a\u5355\u8bcd\u7684\u610f\u4e49\u5982\u4f55\u7ec4\u5408\u4ee5\u5f62\u6210\u77ed\u8bed\u6216\u53e5\u5b50\u7684\u610f\u4e49\u3002\u7ec4\u5408\u6027\u539f\u5219\uff08\u5f52\u529f\u4e8e\u5f17\u96f7\u683c\uff09\u6307\u51fa\uff0c\u4e00\u4e2a\u590d\u6742\u8868\u8fbe\u5f0f\u7684\u610f\u4e49\u7531\u5176\u7ec4\u6210\u90e8\u5206\u7684\u610f\u4e49\u4ee5\u53ca\u7ec4\u5408\u8fd9\u4e9b\u90e8\u5206\u7684\u89c4\u5219\u5171\u540c\u51b3\u5b9a\u3002\"The cat chased the dog\"\u4e0e\"the dog chased the cat\"\u610f\u4e49\u4e0d\u540c\uff0c\u56e0\u4e3a\u53e5\u6cd5\u7ed3\u6784\uff08\u8c01\u662f\u4e3b\u8bed\u3001\u8c01\u662f\u5bbe\u8bed\uff09\u4e0e\u5355\u8bcd\u610f\u4e49\u76f8\u4e92\u4f5c\u7528\u3002</p> </li> <li> <p>\u5e76\u975e\u6240\u6709\u610f\u4e49\u90fd\u662f\u7ec4\u5408\u6027\u7684\u3002\u4e60\u8bed\u5982\"kick the bucket\"\uff08\u610f\u4e3a\"\u53bb\u4e16\"\uff09\u5177\u6709\u65e0\u6cd5\u4ece\u5176\u7ec4\u6210\u90e8\u5206\u63a8\u5bfc\u51fa\u7684\u610f\u4e49\u3002\u8fd9\u5bf9\u4efb\u4f55\u7ec4\u5408\u6027\u65b9\u6cd5\u90fd\u662f\u4e00\u4e2a\u6311\u6218\u3002</p> </li> <li> <p>\u5206\u5e03\u8bed\u4e49\u5b66\u662f\u652f\u6491\u73b0\u4ee3NLP\u7684\u8ba1\u7b97\u6027\u610f\u4e49\u7814\u7a76\u65b9\u6cd5\u3002\u5206\u5e03\u5047\u8bbe\uff08Firth, 1957\uff09\u6307\u51fa\uff1a\"\u89c2\u5176\u4f34\uff0c\u77e5\u5176\u610f\u3002\"\uff08You shall know a word by the company it keeps.\uff09\u51fa\u73b0\u5728\u76f8\u4f3c\u8bed\u5883\u4e2d\u7684\u5355\u8bcd\u5f80\u5f80\u5177\u6709\u76f8\u4f3c\u7684\u610f\u4e49\u3002\u8fd9\u662f\u8bcd\u5d4c\u5165\uff08Word2Vec\u3001GloVe\uff09\u7684\u7406\u8bba\u57fa\u7840\uff0c\u6211\u4eec\u5c06\u5728\u6587\u4ef603\u4e2d\u6df1\u5165\u63a2\u8ba8\u3002</p> </li> <li> <p>\u8bed\u7528\u5b66\u7814\u7a76\u8bed\u5883\u5982\u4f55\u5f71\u54cd\u610f\u4e49\u3002\u540c\u4e00\u4e2a\u53e5\u5b50\u6839\u636e\u8bf4\u8bdd\u8005\u3001\u65f6\u95f4\u3001\u5730\u70b9\u548c\u539f\u56e0\u7684\u4e0d\u540c\uff0c\u53ef\u80fd\u610f\u5473\u7740\u4e0d\u540c\u7684\u4e8b\u60c5\u3002</p> </li> <li> <p>\"Can you pass the salt?\"\u5728\u53e5\u6cd5\u4e0a\u662f\u4e00\u4e2a\u5173\u4e8e\u80fd\u529b\u7684\u7591\u95ee\u53e5\u3002\u5728\u8bed\u7528\u4e0a\uff0c\u5b83\u662f\u4e00\u4e2a\u8bf7\u6c42\u3002\u4f60\u4e0d\u4f1a\u56de\u7b54\"\u662f\u7684\uff0c\u6211\u80fd\"\u7136\u540e\u5750\u7740\u4e0d\u52a8\u3002\u7406\u89e3\u8fd9\u4e00\u70b9\u9700\u8981\u8d85\u8d8a\u5b57\u9762\u610f\u4e49\u7684\u77e5\u8bc6\uff0c\u5177\u4f53\u6765\u8bf4\uff0c\u662f\u5173\u4e8e\u8a00\u8bed\u884c\u4e3a\u7684\u60ef\u4f8b\u77e5\u8bc6\u3002</p> </li> <li> <p>\u8a00\u8bed\u884c\u4e3a\u7406\u8bba\uff08Austin, Searle\uff09\u533a\u5206\u4e86\uff1a</p> <ul> <li>\u8a00\u5185\u884c\u4e3a\uff1a\u5b57\u9762\u5185\u5bb9\uff08\"Can you pass the salt?\"\uff09</li> <li>\u8a00\u5916\u884c\u4e3a\uff1a\u610f\u56fe\u5b9e\u73b0\u7684\u529f\u80fd\uff08\u4e00\u4e2a\u8bf7\u6c42\uff09</li> <li>\u8a00\u540e\u884c\u4e3a\uff1a\u5bf9\u542c\u8005\u4ea7\u751f\u7684\u6548\u679c\uff08\u4ed6\u4eec\u9012\u8fc7\u76d0\uff09</li> </ul> </li> <li> <p>\u9690\u6db5\uff08Grice\uff09\u662f\u6307\u88ab\u6697\u793a\u4f46\u672a\u660e\u786e\u9648\u8ff0\u7684\u610f\u4e49\u3002\u5982\u679c\u6709\u4eba\u95ee\"Is John a good cook?\"\u800c\u4f60\u56de\u7b54\"He's British\"\uff0c\u4f60\u5e76\u6ca1\u6709\u4ece\u5b57\u9762\u4e0a\u56de\u7b54\u95ee\u9898\uff0c\u4f46\u542c\u8005\u53ef\u4ee5\u63a8\u65ad\uff08\u901a\u8fc7\u6587\u5316\u523b\u677f\u5370\u8c61\uff0c\u65e0\u8bba\u516c\u5e73\u4e0e\u5426\uff09\u4f60\u7684\u610f\u601d\u662f\"\u4e0d\u597d\"\u3002Grice\u7684\u5408\u4f5c\u539f\u5219\u6307\u51fa\uff0c\u8bf4\u8bdd\u8005\u901a\u5e38\u4f1a\u52aa\u529b\u505a\u5230\u4fe1\u606f\u5145\u5206\u3001\u771f\u5b9e\u3001\u76f8\u5173\u548c\u6e05\u6670\uff0c\u800c\u542c\u8005\u5047\u5b9a\u8fd9\u4e9b\u51c6\u5219\u6210\u7acb\u6765\u8fdb\u884c\u89e3\u8bfb\u3002</p> </li> <li> <p>\u5171\u6307\u662f\u4e00\u79cd\u8bed\u7528\u73b0\u8c61\uff0c\u5176\u4e2d\u4e0d\u540c\u7684\u8868\u8fbe\u6307\u5411\u540c\u4e00\u4e2a\u5b9e\u4f53\u3002\u5728\"Alice went to the store. She bought milk\"\u4e2d\uff0c\"she\"\u6307\u4ee3Alice\u3002\u89e3\u51b3\u5171\u6307\u95ee\u9898\u5bf9\u4e8e\u7406\u89e3\u591a\u53e5\u6587\u672c\u81f3\u5173\u91cd\u8981\uff0c\u662fNLP\u4e2d\u7684\u4e00\u4e2a\u5173\u952e\u4efb\u52a1\u3002</p> </li> <li> <p>\u7bc7\u7ae0\u7ed3\u6784\u63cf\u8ff0\u53e5\u5b50\u5982\u4f55\u8fde\u63a5\u4ee5\u5f62\u6210\u8fde\u8d2f\u7684\u6587\u672c\u3002\u53d9\u4e8b\u6709\u5f00\u5934\u3001\u4e2d\u95f4\u548c\u7ed3\u5c3e\u3002\u8bba\u8bc1\u6709\u4e3b\u5f20\u548c\u8bc1\u636e\u3002\u4fee\u8f9e\u7ed3\u6784\u7406\u8bba\uff08RST\uff09\u5c06\u6587\u672c\u5206\u6790\u4e3a\u7bc7\u7ae0\u5173\u7cfb\uff08\u9610\u8ff0\u3001\u5bf9\u6bd4\u3001\u56e0\u679c\u7b49\uff09\u7684\u6811\u72b6\u7ed3\u6784\u3002</p> </li> <li> <p>\u8bed\u7528\u5b66\u662fNLP\u4e2d\u6700\u56f0\u96be\u7684\u9886\u57df\u3002\u73b0\u4ee3\u8bed\u8a00\u6a21\u578b\u901a\u8fc7\u8bad\u7ec3\u6570\u636e\u9690\u5f0f\u5730\u5904\u7406\u4e86\u5927\u90e8\u5206\u53e5\u6cd5\u548c\u8bed\u4e49\uff0c\u4f46\u8bed\u7528\u63a8\u7406\u2014\u2014\u7406\u89e3\u8bbd\u523a\u3001\u9690\u6db5\u548c\u4f9d\u8d56\u8bed\u5883\u7684\u610f\u4e49\u2014\u2014\u4ecd\u7136\u662f\u4e00\u4e2a\u524d\u6cbf\u6311\u6218\u3002</p> </li> <li> <p>\u97f3\u7cfb\u5b66\u7814\u7a76\u8bed\u8a00\u7684\u58f0\u97f3\u7cfb\u7edf\u3002\u867d\u7136\u672c\u7ae0\u4e3b\u8981\u5173\u6ce8\u6587\u672c\uff0c\u4f46\u7b80\u8981\u6982\u8ff0\u53ef\u4ee5\u8854\u63a5\u97f3\u9891\u548c\u8bed\u97f3\u7ae0\u8282\uff08\u7b2c09\u7ae0\uff09\u3002</p> </li> <li> <p>\u97f3\u4f4d\u662f\u533a\u5206\u610f\u4e49\u7684\u6700\u5c0f\u58f0\u97f3\u5355\u4f4d\u3002\u82f1\u8bed\u7ea6\u670944\u4e2a\u97f3\u4f4d\u3002\u5355\u8bcd\"bat\"\u548c\"pat\"\u76f8\u5dee\u4e00\u4e2a\u97f3\u4f4d\uff08/b/ \u4e0e /p/\uff09\uff0c\u800c\u610f\u4e49\u7684\u6539\u53d8\u662f\u5b8c\u5168\u6027\u7684\u3002\u8fd9\u88ab\u79f0\u4e3a\u6700\u5c0f\u5bf9\u7acb\u4f53\u3002</p> </li> <li> <p>\u97f3\u4f4d\u53d8\u4f53\u662f\u540c\u4e00\u4e2a\u97f3\u4f4d\u7684\u4e0d\u540c\u7269\u7406\u5b9e\u73b0\uff0c\u4e0d\u6539\u53d8\u610f\u4e49\u3002\"pin\"\u4e2d\u7684\"p\"\uff08\u9001\u6c14\u97f3\uff0c\u5e26\u4e00\u80a1\u6c14\u6d41\uff09\u548c\"spin\"\u4e2d\u7684\"p\"\uff08\u4e0d\u9001\u6c14\u97f3\uff09\u5728\u82f1\u8bed\u4e2d\u662f\u97f3\u4f4d/p/\u7684\u97f3\u4f4d\u53d8\u4f53\uff1b\u6bcd\u8bed\u8005\u5c06\u5b83\u4eec\u89c6\u4e3a\u540c\u4e00\u4e2a\u58f0\u97f3\u3002</p> </li> <li> <p>\u56fd\u9645\u97f3\u6807\uff08IPA\uff09\u4e3a\u6240\u6709\u8bed\u8a00\u7684\u97f3\u4f4d\u63d0\u4f9b\u4e86\u6807\u51c6\u5316\u7684\u8bb0\u6cd5\u3002\u5355\u8bcd\"cat\"\u8f6c\u5f55\u4e3a/k\u00e6t/\u3002IPA\u662f\u4e66\u9762\u6587\u672c\u548c\u8bed\u97f3\u7cfb\u7edf\u4e4b\u95f4\u7684\u6865\u6881\u3002</p> </li> <li> <p>\u97f5\u5f8b\u6db5\u76d6\u8bed\u97f3\u7684\u8282\u594f\u3001\u91cd\u97f3\u548c\u8bed\u8c03\u3002\"I didn't say he stole the money\"\u6839\u636e\u91cd\u97f3\u843d\u5728\u54ea\u4e2a\u5355\u8bcd\u4e0a\uff0c\u53ef\u4ee5\u6709\u4e03\u79cd\u4e0d\u540c\u7684\u542b\u4e49\u3002\u97f5\u5f8b\u643a\u5e26\u4e86\u7eaf\u6587\u672c\u6240\u4e22\u5931\u7684\u4fe1\u606f\uff0c\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48\u6587\u672c\u8f6c\u8bed\u97f3\u7cfb\u7edf\u5fc5\u987b\u4ed4\u7ec6\u5efa\u6a21\u97f5\u5f8b\u7684\u539f\u56e0\u3002</p> </li> <li> <p>\u5728NLP\u4e2d\uff0c\u97f3\u7cfb\u5b66\u77e5\u8bc6\u51fa\u73b0\u5728\u6587\u672c\u8f6c\u8bed\u97f3\uff08\u5b57\u5f62\u5230\u97f3\u4f4d\u7684\u8f6c\u6362\uff09\u3001\u8bed\u97f3\u8bc6\u522b\uff08\u5c06\u58f0\u5b66\u4fe1\u53f7\u6620\u5c04\u5230\u97f3\u4f4d\uff09\uff0c\u751a\u81f3\u62fc\u5199\u7ea0\u6b63\u548c\u97f3\u8bd1\u4e2d\u3002</p> </li> </ul>"},{"location":"chapter%2007%3A%20computational%20linguistics/01.%20linguistic%20foundations/#colabnotebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528CoLab\u6216notebook\uff09","text":"<ol> <li> <p>\u6784\u5efa\u4e00\u4e2a\u7b80\u5355\u7684\u5f62\u6001\u5206\u6790\u5668\uff0c\u4f7f\u7528\u5e38\u89c1\u524d\u7f00\u548c\u540e\u7f00\u5217\u8868\u5c06\u82f1\u8bed\u5355\u8bcd\u5206\u89e3\u4e3a\u53ef\u80fd\u7684\u8bed\u7d20\u3002 <pre><code>prefixes = ['un', 're', 'pre', 'dis', 'mis', 'over', 'under', 'out', 'non']\nsuffixes = ['ing', 'ed', 'ly', 'ness', 'ment', 'tion', 'able', 'ible', 'er', 'est', 'ful', 'less', 'ous']\n\ndef analyse_morphemes(word):\n    \"\"\"\u4f7f\u7528\u5df2\u77e5\u8bcd\u7f00\u8fdb\u884c\u7b80\u5355\u7684\u8bed\u7d20\u5206\u6790\u3002\"\"\"\n    parts = []\n    remaining = word.lower()\n\n    # \u68c0\u67e5\u524d\u7f00\n    for p in sorted(prefixes, key=len, reverse=True):\n        if remaining.startswith(p) and len(remaining) &gt; len(p) + 2:\n            parts.append(f\"[prefix: {p}]\")\n            remaining = remaining[len(p):]\n            break\n\n    # \u68c0\u67e5\u540e\u7f00\n    for s in sorted(suffixes, key=len, reverse=True):\n        if remaining.endswith(s) and len(remaining) &gt; len(s) + 2:\n            root = remaining[:-len(s)]\n            parts.append(f\"[root: {root}]\")\n            parts.append(f\"[suffix: {s}]\")\n            remaining = None\n            break\n\n    if remaining is not None:\n        parts.append(f\"[root: {remaining}]\")\n\n    return parts\n\nfor word in ['unhappiness', 'reusable', 'disconnected', 'overreacting', 'kindness']:\n    print(f\"{word:20s} \u2192 {' + '.join(analyse_morphemes(word))}\")\n</code></pre></p> </li> <li> <p>\u5b9e\u73b0\u4e00\u4e2a\u4f7f\u7528\u9012\u5f52\u4e0b\u964d\u6cd5\u7684\u7b80\u5355\u4e0a\u4e0b\u6587\u65e0\u5173\u6587\u6cd5\u5206\u6790\u5668\u3002\u5b9a\u4e49\u4e00\u4e2a\u5c0f\u578b\u6587\u6cd5\uff0c\u5e76\u5c06\u53e5\u5b50\u5206\u6790\u4e3a\u6210\u5206\u6811\u3002 <pre><code>class CFGParser:\n    \"\"\"\u7528\u4e8e\u5c0f\u578b\u82f1\u8bed\u6587\u6cd5\u7684\u9012\u5f52\u4e0b\u964d\u5206\u6790\u5668\u3002\"\"\"\n    def __init__(self, tokens):\n        self.tokens = tokens\n        self.pos = 0\n\n    def peek(self):\n        return self.tokens[self.pos] if self.pos &lt; len(self.tokens) else None\n\n    def consume(self, expected=None):\n        tok = self.peek()\n        if expected and tok != expected:\n            return None\n        self.pos += 1\n        return tok\n\n    def parse_det(self):\n        if self.peek() in ('the', 'a'):\n            return ('Det', self.consume())\n        return None\n\n    def parse_noun(self):\n        if self.peek() in ('cat', 'dog', 'mat', 'man'):\n            return ('N', self.consume())\n        return None\n\n    def parse_verb(self):\n        if self.peek() in ('sat', 'chased', 'saw'):\n            return ('V', self.consume())\n        return None\n\n    def parse_prep(self):\n        if self.peek() in ('on', 'under', 'with'):\n            return ('P', self.consume())\n        return None\n\n    def parse_np(self):\n        save = self.pos\n        det = self.parse_det()\n        noun = self.parse_noun()\n        if det and noun:\n            # \u68c0\u67e5\u53ef\u9009\u7684PP\n            pp = self.parse_pp()\n            if pp:\n                return ('NP', det, noun, pp)\n            return ('NP', det, noun)\n        self.pos = save\n        return None\n\n    def parse_pp(self):\n        save = self.pos\n        prep = self.parse_prep()\n        np = self.parse_np()\n        if prep and np:\n            return ('PP', prep, np)\n        self.pos = save\n        return None\n\n    def parse_vp(self):\n        save = self.pos\n        verb = self.parse_verb()\n        if verb:\n            np = self.parse_np()\n            if np:\n                return ('VP', verb, np)\n            pp = self.parse_pp()\n            if pp:\n                return ('VP', verb, pp)\n        self.pos = save\n        return None\n\n    def parse_sentence(self):\n        np = self.parse_np()\n        vp = self.parse_vp()\n        if np and vp and self.pos == len(self.tokens):\n            return ('S', np, vp)\n        return None\n\ndef print_tree(tree, indent=0):\n    if isinstance(tree, str):\n        print(' ' * indent + tree)\n    elif isinstance(tree, tuple):\n        print(' ' * indent + tree[0])\n        for child in tree[1:]:\n            print_tree(child, indent + 2)\n\nsentences = [\n    \"the cat sat on the mat\",\n    \"a dog chased the cat\",\n]\n\nfor sent in sentences:\n    tokens = sent.split()\n    parser = CFGParser(tokens)\n    tree = parser.parse_sentence()\n    print(f\"\\n'{sent}':\")\n    if tree:\n        print_tree(tree)\n    else:\n        print(\"  (no parse found)\")\n</code></pre></p> </li> <li> <p>\u901a\u8fc7\u6784\u5efa\u4e00\u4e2a\u7b80\u5355\u7684\u8bcd\u56fe\u6765\u63a2\u7d22\u8bcd\u6c47\u5173\u7cfb\u3002\u7ed9\u5b9a\u4e00\u4e2a\u5305\u542b\u540c\u4e49\u3001\u53cd\u4e49\u548c\u4e0a\u4f4d\u5173\u7cfb\u7684\u5c0f\u578b\u8bcd\u6c47\u8868\uff0c\u67e5\u627e\u5355\u8bcd\u4e4b\u95f4\u7684\u8def\u5f84\u3002 <pre><code>relations = {\n    ('big', 'large'): 'synonym',\n    ('big', 'small'): 'antonym',\n    ('small', 'tiny'): 'synonym',\n    ('dog', 'animal'): 'hypernym',\n    ('cat', 'animal'): 'hypernym',\n    ('puppy', 'dog'): 'hypernym',\n    ('happy', 'glad'): 'synonym',\n    ('happy', 'sad'): 'antonym',\n    ('hot', 'cold'): 'antonym',\n    ('hot', 'warm'): 'synonym',\n}\n\n# \u6784\u5efa\u90bb\u63a5\u5217\u8868\nfrom collections import defaultdict, deque\n\ngraph = defaultdict(list)\nfor (w1, w2), rel in relations.items():\n    graph[w1].append((w2, rel))\n    graph[w2].append((w1, rel))\n\ndef find_path(start, end):\n    \"\"\"\u4f7f\u7528BFS\u5728\u5173\u7cfb\u56fe\u4e2d\u67e5\u627e\u4e24\u4e2a\u5355\u8bcd\u4e4b\u95f4\u7684\u8def\u5f84\u3002\"\"\"\n    queue = deque([(start, [(start, None)])])\n    visited = {start}\n    while queue:\n        node, path = queue.popleft()\n        if node == end:\n            return path\n        for neighbor, rel in graph[node]:\n            if neighbor not in visited:\n                visited.add(neighbor)\n                queue.append((neighbor, path + [(neighbor, rel)]))\n    return None\n\npairs = [('big', 'tiny'), ('puppy', 'cat'), ('happy', 'sad')]\nfor w1, w2 in pairs:\n    path = find_path(w1, w2)\n    if path:\n        steps = \" \u2192 \".join(f\"{w}({r})\" if r else w for w, r in path)\n        print(f\"{w1} \u2192 {w2}: {steps}\")\n    else:\n        print(f\"{w1} \u2192 {w2}: no path found\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2007%3A%20computational%20linguistics/02.%20text%20processing%20and%20classic%20NLP/","title":"\u6587\u672c\u5904\u7406\u4e0e\u7ecf\u5178NLP","text":"<p>\u6587\u672c\u5904\u7406\u5c06\u539f\u59cb\u5b57\u7b26\u8f6c\u6362\u4e3a\u6a21\u578b\u53ef\u6d88\u8d39\u7684\u7ed3\u6784\u5316\u8868\u793a\u3002\u672c\u6587\u6db5\u76d6\u5206\u8bcd\uff08\u8bcd\u7ea7\u3001\u5b50\u8bcd\u3001BPE\u3001WordPiece\uff09\u3001\u6587\u672c\u89c4\u8303\u5316\u3001\u7f16\u8f91\u8ddd\u79bb\u3001TF-IDF\u3001n\u5143\u7ec4\u8bed\u8a00\u6a21\u578b\u3001\u8bcd\u6027\u6807\u6ce8\u3001\u547d\u540d\u5b9e\u4f53\u8bc6\u522b\u548c\u60c5\u611f\u5206\u6790\u2014\u2014\u8fd9\u4e9b\u7ecf\u5178NLP\u6d41\u6c34\u7ebf\u81f3\u4eca\u4ecd\u662f\u73b0\u4ee3\u7cfb\u7edf\u7684\u57fa\u7840\u3002</p> <ul> <li> <p>\u539f\u59cb\u6587\u672c\u662f\u6df7\u4e71\u7684\u3002\u5728\u4efb\u4f55NLP\u6a21\u578b\u5904\u7406\u8bed\u8a00\u4e4b\u524d\uff0c\u6587\u672c\u5fc5\u987b\u7ecf\u8fc7\u6e05\u6d17\u3001\u89c4\u8303\u5316\u5e76\u8f6c\u6362\u4e3a\u7ed3\u6784\u5316\u8868\u793a\u3002\u672c\u6587\u6db5\u76d6\u4e86\u4ece\u539f\u59cb\u5b57\u7b26\u5230\u6a21\u578b\u53ef\u6d88\u8d39\u7279\u5f81\u7684\u5b8c\u6574\u6d41\u6c34\u7ebf\uff0c\u4ee5\u53ca\u6df1\u5ea6\u5b66\u4e60\u5174\u8d77\u4e4b\u524d\u4e3b\u5bfc\u9886\u57df\u7684\u7ecf\u5178NLP\u7b97\u6cd5\u3002</p> </li> <li> <p>\u6587\u672c\u89c4\u8303\u5316\u5c06\u539f\u59cb\u6587\u672c\u8f6c\u6362\u4e3a\u89c4\u8303\u5f62\u5f0f\u3002\u5176\u76ee\u6807\u662f\u51cf\u5c11\u4e0d\u76f8\u5173\u7684\u53d8\u5f02\uff0c\u4f7f\"Hello\"\u3001\"hello\"\u3001\"HELLO\"\u548c\"h\u00e9llo\"\u5f97\u5230\u6070\u5f53\u7684\u5904\u7406\u3002</p> </li> <li> <p>\u5927\u5c0f\u5199\u6298\u53e0\u5c06\u6587\u672c\u8f6c\u6362\u4e3a\u5c0f\u5199\u3002\u8fd9\u5c06\"The\"\u548c\"the\"\u5408\u5e76\u4e3a\u4e00\u4e2a\u8bcd\u5143\u3002\u8fd9\u5bf9\u5927\u591a\u6570\u4efb\u52a1\u6709\u5e2e\u52a9\uff0c\u4f46\u5728\u67d0\u4e9b\u60c5\u51b5\u4e0b\u4f1a\u7834\u574f\u6709\u7528\u4fe1\u606f\uff1a\"US\"\uff08\u56fd\u5bb6\uff09vs \"us\"\uff08\u4ee3\u8bcd\uff09\uff0c\u6216\"Apple\"\uff08\u516c\u53f8\uff09vs \"apple\"\uff08\u6c34\u679c\uff09\u3002</p> </li> <li> <p>Unicode\u89c4\u8303\u5316\u5904\u7406\u540c\u4e00\u5b57\u7b26\u6709\u591a\u79cd\u7f16\u7801\u65b9\u5f0f\u7684\u95ee\u9898\u3002\u5b57\u7b26\"\u00e9\"\u53ef\u4ee5\u662f\u5355\u4e2a\u7801\u70b9\uff08U+00E9\uff09\uff0c\u4e5f\u53ef\u4ee5\u662f\u57fa\u7840\"e\"\u52a0\u4e0a\u7ec4\u5408\u53d8\u97f3\u7b26\u53f7\uff08U+0065 + U+0301\uff09\u3002NFC\u89c4\u8303\u5316\u5c06\u5b83\u4eec\u7ec4\u5408\u6210\u4e00\u4e2a\u7801\u70b9\uff1bNFD\u5219\u8fdb\u884c\u5206\u89e3\u3002\u5982\u679c\u6ca1\u6709\u89c4\u8303\u5316\uff0c\u4e24\u4e2a\u770b\u8d77\u6765\u76f8\u540c\u7684\u5b57\u7b26\u4e32\u53ef\u80fd\u65e0\u6cd5\u5339\u914d\u3002</p> </li> <li> <p>\u7f16\u8f91\u8ddd\u79bb\u8861\u91cf\u4e24\u4e2a\u5b57\u7b26\u4e32\u4e4b\u95f4\u7684\u5dee\u5f02\u7a0b\u5ea6\u3002\u83b1\u6587\u65af\u5766\u8ddd\u79bb\u8ba1\u7b97\u5c06\u4e00\u4e2a\u5b57\u7b26\u4e32\u8f6c\u6362\u4e3a\u53e6\u4e00\u4e2a\u6240\u9700\u7684\u6700\u5c11\u5355\u5b57\u7b26\u63d2\u5165\u3001\u5220\u9664\u548c\u66ff\u6362\u6b21\u6570\u3002\"kitten\" \u2192 \"sitting\"\u7684\u7f16\u8f91\u8ddd\u79bb\u4e3a3\uff08k\u2192s\uff0ce\u2192i\uff0c\u63d2\u5165g\uff09\u3002</p> </li> <li> <p>\u7f16\u8f91\u8ddd\u79bb\u4f7f\u7528\u52a8\u6001\u89c4\u5212\u8ba1\u7b97\uff08\u6211\u4eec\u5728\u7b97\u6cd5\u7ae0\u8282\u4e2d\u56de\u987e\uff09\u3002\u5b9a\u4e49 \\(D[i][j]\\) \u4e3a\u5b57\u7b26\u4e32 \\(s\\) \u7684\u524d \\(i\\) \u4e2a\u5b57\u7b26\u4e0e\u5b57\u7b26\u4e32 \\(t\\) \u7684\u524d \\(j\\) \u4e2a\u5b57\u7b26\u4e4b\u95f4\u7684\u8ddd\u79bb\uff1a</p> </li> </ul> \\[ D[i][j] = \\begin{cases} j &amp; \\text{if } i = 0 \\\\ i &amp; \\text{if } j = 0 \\\\ D[i{-}1][j{-}1] &amp; \\text{if } s[i] = t[j] \\\\ 1 + \\min(D[i{-}1][j], \\; D[i][j{-}1], \\; D[i{-}1][j{-}1]) &amp; \\text{otherwise} \\end{cases} \\] <ul> <li> <p>\u7f16\u8f91\u8ddd\u79bb\u652f\u6491\u7740\u62fc\u5199\u7ea0\u6b63\u3001\u6a21\u7cca\u5339\u914d\u548cDNA\u5e8f\u5217\u6bd4\u5bf9\u3002\u5728NLP\u4e2d\uff0c\u5b83\u7528\u4e8e\u5904\u7406\u62fc\u5199\u9519\u8bef\u548c\u67e5\u627e\u76f8\u4f3c\u5355\u8bcd\u3002</p> </li> <li> <p>\u5206\u8bcd\u5c06\u6587\u672c\u5206\u5272\u6210\u6a21\u578b\u53ef\u4ee5\u5904\u7406\u7684\u79bb\u6563\u5355\u5143\uff08\u8bcd\u5143\uff09\u3002\u8fd9\u662f\u7b2c\u4e00\u4e2a\u4e5f\u662f\u6700\u91cd\u8981\u7684\u9884\u5904\u7406\u6b65\u9aa4\u3002\u5206\u8bcd\u7b56\u7565\u7684\u9009\u62e9\u6df1\u523b\u5f71\u54cd\u7740\u6a21\u578b\u884c\u4e3a\u3002</p> </li> <li> <p>\u7a7a\u767d\u5206\u8bcd\u4ee5\u7a7a\u683c\u5206\u5272\u3002\u7b80\u5355\u4f46\u5e7c\u7a1a\uff1a\"New York\"\u53d8\u6210\u4e24\u4e2a\u8bcd\u5143\uff0c\"don't\"\u662f\u4e00\u4e2a\u8bcd\u5143\uff08\u6216\u6839\u636e\u5206\u5272\u5668\u4e0d\u540c\uff0c\u62c6\u5206\u4e3a\"don\"\u548c\"'t\"\uff09\uff0c\u800c\u4e2d\u6587\u548c\u65e5\u6587\u7b49\u8bed\u8a00\u5728\u8bcd\u4e4b\u95f4\u6839\u672c\u6ca1\u6709\u7a7a\u683c\u3002</p> </li> <li> <p>\u57fa\u4e8e\u89c4\u5219\u7684\u5206\u8bcd\u4f7f\u7528\u624b\u5de5\u8bbe\u8ba1\u7684\u6a21\u5f0f\uff08\u6b63\u5219\u8868\u8fbe\u5f0f\uff09\u6765\u5904\u7406\u7f29\u5199\u3001\u6807\u70b9\u7b26\u53f7\u548c\u7279\u6b8a\u60c5\u51b5\u3002\"I'm\" \u2192 \"I\" + \"'m\"\uff0c\"U.S.A.\"\u4fdd\u6301\u4e3a\u4e00\u4e2a\u8bcd\u5143\u3002\u6bcf\u79cd\u8bed\u8a00\u90fd\u9700\u8981\u81ea\u5df1\u7684\u89c4\u5219\uff0c\u8fd9\u975e\u5e38\u8017\u8d39\u4eba\u529b\u3002</p> </li> <li> <p>\u5b50\u8bcd\u5206\u8bcd\u662f\u73b0\u4ee3\u89e3\u51b3\u65b9\u6848\u3002\u5b83\u4e0d\u662f\u5728\u8bcd\u8fb9\u754c\u5904\u5206\u5272\uff0c\u800c\u662f\u4ece\u6570\u636e\u4e2d\u5b66\u4e60\u4e00\u4e2a\u9ad8\u9891\u5b50\u8bcd\u5355\u5143\u7684\u8bcd\u6c47\u8868\u3002\u8fd9\u4f18\u96c5\u5730\u5904\u7406\u4e86\u672a\u77e5\u8bcd\uff1a\u5982\u679c\"unhappiness\"\u4e0d\u5728\u8bcd\u6c47\u8868\u4e2d\uff0c\u5b83\u53ef\u80fd\u88ab\u62c6\u5206\u4e3a\"un\" + \"happi\" + \"ness\"\uff0c\u4fdd\u7559\u4e86\u5f62\u6001\u7ed3\u6784\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u5b57\u8282\u5bf9\u7f16\u7801\uff08BPE\uff09\u4ece\u5355\u4e2a\u5b57\u7b26\u4f5c\u4e3a\u8bcd\u6c47\u8868\u5f00\u59cb\u3002\u5b83\u53cd\u590d\u67e5\u627e\u6700\u9891\u7e41\u7684\u76f8\u90bb\u5bf9\u5e76\u5c06\u5176\u5408\u5e76\u4e3a\u4e00\u4e2a\u65b0\u8bcd\u5143\u3002\u7ecf\u8fc7\u8db3\u591f\u6b21\u6570\u7684\u5408\u5e76\u540e\uff0c\u5e38\u89c1\u8bcd\u6210\u4e3a\u5355\u4e2a\u8bcd\u5143\uff0c\u7f55\u89c1\u8bcd\u5219\u88ab\u62c6\u5206\u4e3a\u9ad8\u9891\u5b50\u8bcd\u7247\u6bb5\u3002</p> </li> <li> <p>BPE\u7b97\u6cd5\uff1a</p> <ol> <li>\u7528\u8bad\u7ec3\u8bed\u6599\u4e2d\u7684\u6240\u6709\u5355\u4e2a\u5b57\u7b26\u521d\u59cb\u5316\u8bcd\u6c47\u8868</li> <li>\u7edf\u8ba1\u6bcf\u4e2a\u76f8\u90bb\u8bcd\u5143\u5bf9\u7684\u9891\u7387</li> <li>\u5c06\u6700\u9891\u7e41\u7684\u5bf9\u5408\u5e76\u4e3a\u4e00\u4e2a\u65b0\u8bcd\u5143</li> <li>\u91cd\u590d\u6b65\u9aa42-3\uff0c\u76f4\u5230\u8fbe\u5230\u6240\u9700\u7684\u5408\u5e76\u6b21\u6570\uff08\u8bcd\u6c47\u8868\u5927\u5c0f\uff09</li> </ol> </li> <li> <p>\u4f8b\u5982\uff0c\u4ece\"l o w\"\uff085\u6b21\uff09\u3001\"l o w e r\"\uff082\u6b21\uff09\u3001\"n e w e s t\"\uff086\u6b21\uff09\u5f00\u59cb\uff1a\u6700\u9891\u7e41\u7684\u5bf9\u53ef\u80fd\u662f\"e s\" \u2192 \u5408\u5e76\u4e3a\"es\"\u3002\u7136\u540e\"es t\" \u2192 \"est\"\u3002\u7136\u540e\"n e w\" \u2192 \"new\"\u3002\u6700\u7ec8\u7684\u8bcd\u6c47\u8868\u540c\u65f6\u5305\u542b\u5b8c\u6574\u5355\u8bcd\u548c\u5b50\u8bcd\u7247\u6bb5\u3002</p> </li> <li> <p>WordPiece\uff08BERT\u4f7f\u7528\uff09\u4e0eBPE\u7c7b\u4f3c\uff0c\u4f46\u57fa\u4e8e\u4f3c\u7136\u800c\u975e\u9891\u7387\u6765\u9009\u62e9\u5408\u5e76\u3002\u5b83\u5408\u5e76\u80fd\u4f7f\u8bad\u7ec3\u6570\u636e\u7684\u8bed\u8a00\u6a21\u578b\u4f3c\u7136\u6700\u5927\u5316\u7684\u5bf9\u3002\u975e\u8bcd\u9996\u7684\u5b50\u8bcd\u8bcd\u5143\u4ee5\"##\"\u4f5c\u4e3a\u524d\u7f00\uff08\u4f8b\u5982\uff0c\"playing\" \u2192 \"play\" + \"##ing\"\uff09\u3002</p> </li> <li> <p>Unigram\uff08SentencePiece\u4f7f\u7528\uff09\u91c7\u7528\u76f8\u53cd\u7684\u65b9\u6cd5\uff1a\u4ece\u4e00\u4e2a\u5927\u578b\u8bcd\u6c47\u8868\u5f00\u59cb\uff0c\u8fed\u4ee3\u5730\u79fb\u9664\u90a3\u4e9b\u79fb\u9664\u540e\u5bf9\u8bad\u7ec3\u6570\u636e\u4f3c\u7136\u635f\u5931\u6700\u5c0f\u7684\u8bcd\u5143\u3002\u6700\u7ec8\u7684\u8bcd\u6c47\u8868\u662f\u6700\u80fd\u89e3\u91ca\u8bed\u6599\u5e93\u7684\u5b50\u8bcd\u5355\u5143\u96c6\u5408\u3002</p> </li> <li> <p>SentencePiece\u662f\u4e00\u4e2a\u8bed\u8a00\u65e0\u5173\u7684\u5206\u8bcd\u5e93\uff0c\u5b83\u5c06\u8f93\u5165\u89c6\u4e3a\u539f\u59cb\u5b57\u8282\u6d41\uff08\u4e0d\u5728\u7a7a\u683c\u4e0a\u8fdb\u884c\u9884\u5206\u8bcd\uff09\u3002\u8fd9\u4f7f\u5f97\u5b83\u9002\u7528\u4e8e\u4efb\u4f55\u8bed\u8a00\uff0c\u5305\u62ec\u6ca1\u6709\u7a7a\u683c\u7684\u8bed\u8a00\u3002\u5b83\u540c\u65f6\u5b9e\u73b0\u4e86BPE\u548cUnigram\u7b97\u6cd5\u3002</p> </li> <li> <p>\u8bcd\u6c47\u8868\u5927\u5c0f\u662f\u4e00\u4e2a\u5173\u952e\u8d85\u53c2\u6570\u3002\u5178\u578b\u7684\u9009\u62e9\u8303\u56f4\u4ece30,000\u5230100,000\u4e2a\u8bcd\u5143\u3002\u66f4\u5927\u7684\u8bcd\u6c47\u8868\u610f\u5473\u7740\u6bcf\u4e2a\u5e8f\u5217\u7684\u8bcd\u5143\u66f4\u5c11\uff08\u66f4\u9ad8\u6548\uff09\uff0c\u4f46\u9700\u8981\u66f4\u5927\u7684\u5d4c\u5165\u8868\u3002\u66f4\u5c0f\u7684\u8bcd\u6c47\u8868\u610f\u5473\u7740\u66f4\u591a\u7684\u5b50\u8bcd\u5206\u5272\u548c\u66f4\u957f\u7684\u5e8f\u5217\u3002</p> </li> <li> <p>\u4e24\u79cd\u6280\u672f\u90fd\u5c06\u8bcd\u6c47\u7b80\u5316\u4e3a\u57fa\u672c\u5f62\u5f0f\uff0c\u4f46\u65b9\u6cd5\u4e0d\u540c\u3002</p> </li> <li> <p>\u8bcd\u5e72\u63d0\u53d6\u4f7f\u7528\u7c97\u7565\u89c4\u5219\u5207\u9664\u540e\u7f00\u3002\u6ce2\u7279\u8bcd\u5e72\u63d0\u53d6\u5668\u5c06\"running\"\u7b80\u5316\u4e3a\"run\"\uff0c\"happiness\"\u7b80\u5316\u4e3a\"happi\"\uff0c\"studies\"\u7b80\u5316\u4e3a\"studi\"\u3002\u5b83\u901f\u5ea6\u5feb\u4f46\u4e0d\u7cbe\u786e\uff1a\"university\"\u548c\"universe\"\u90fd\u88ab\u8bcd\u5e72\u5316\u4e3a\"univers\"\uff0c\u5c3d\u7ba1\u5b83\u4eec\u6beb\u4e0d\u76f8\u5173\u3002</p> </li> <li> <p>\u8bcd\u5f62\u8fd8\u539f\u4f7f\u7528\u8bcd\u6c47\u8868\u548c\u5f62\u6001\u5b66\u5206\u6790\u6765\u627e\u5230\u771f\u6b63\u7684\u8bcd\u5178\u5f62\u5f0f\uff08\u8bcd\u5143\uff09\u3002\"Running\" \u2192 \"run\"\uff0c\"better\" \u2192 \"good\"\uff0c\"mice\" \u2192 \"mouse\"\u3002\u5b83\u9700\u8981\u77e5\u9053\u8bcd\u6027\uff1a\"saw\"\u4f5c\u4e3a\u52a8\u8bcd\u65f6\u8bcd\u5f62\u8fd8\u539f\u4e3a\"see\"\uff0c\u4f46\u4f5c\u4e3a\u540d\u8bcd\u65f6\u4fdd\u6301\u4e3a\"saw\"\u3002</p> </li> <li> <p>\u73b0\u4ee3\u5b50\u8bcd\u5206\u8bcd\u5728\u5f88\u5927\u7a0b\u5ea6\u4e0a\u5df2\u53d6\u4ee3\u4e86\u795e\u7ecfNLP\u4e2d\u7684\u8bcd\u5e72\u63d0\u53d6\u548c\u8bcd\u5f62\u8fd8\u539f\uff0c\u4f46\u5b83\u4eec\u5728\u4fe1\u606f\u68c0\u7d22\u4ee5\u53ca\u5904\u7406\u8f83\u5c0f\u6a21\u578b\u6216\u6709\u9650\u6570\u636e\u65f6\u4ecd\u7136\u6709\u7528\u3002</p> </li> <li> <p>\u8bcd\u6027\u6807\u6ce8\u4e3a\u6bcf\u4e2a\u8bcd\u5206\u914d\u4e00\u4e2a\u8bed\u6cd5\u7c7b\u522b\uff1a\u540d\u8bcd\u3001\u52a8\u8bcd\u3001\u5f62\u5bb9\u8bcd\u3001\u9650\u5b9a\u8bcd\u7b49\u3002\u8fd9\u662f\u6700\u53e4\u8001\u7684NLP\u4efb\u52a1\u4e4b\u4e00\uff0c\u4e5f\u662f\u53e5\u6cd5\u5206\u6790\u7684\u57fa\u7840\u3002</p> </li> <li> <p>\u5bbe\u5dde\u6811\u5e93\u6807\u7b7e\u96c6\u662f\u82f1\u8bed\u4e2d\u6700\u5e38\u7528\u7684\uff0c\u5305\u542b36\u4e2a\u6807\u7b7e\uff08NN\u8868\u793a\u5355\u6570\u540d\u8bcd\uff0cNNS\u8868\u793a\u590d\u6570\u540d\u8bcd\uff0cVB\u8868\u793a\u52a8\u8bcd\u539f\u5f62\uff0cVBD\u8868\u793a\u8fc7\u53bb\u5f0f\uff0cJJ\u8868\u793a\u5f62\u5bb9\u8bcd\u7b49\uff09\u3002</p> </li> <li> <p>\u8bcd\u6027\u6807\u6ce8\u5f88\u68d8\u624b\uff0c\u56e0\u4e3a\u8bb8\u591a\u8bcd\u662f\u6709\u6b67\u4e49\u7684\u3002\"Book\"\u53ef\u4ee5\u662f\u540d\u8bcd\uff08\"the book\"\uff09\u6216\u52a8\u8bcd\uff08\"book a flight\"\uff09\u3002\"Run\"\u5728\u4e0d\u540c\u8bcd\u6027\u4e0b\u6709\u6570\u5341\u79cd\u542b\u4e49\u3002\u4e0a\u4e0b\u6587\u81f3\u5173\u91cd\u8981\u3002</p> </li> <li> <p>\u65e9\u671f\u7684\u6807\u6ce8\u5668\u4f7f\u7528\u7b2c05\u7ae0\u4e2d\u7684\u9690\u9a6c\u5c14\u53ef\u592b\u6a21\u578b\uff08HMM\uff09\u3002\u9690\u85cf\u72b6\u6001\u662f\u8bcd\u6027\u6807\u7b7e\uff0c\u89c2\u6d4b\u503c\u662f\u5355\u8bcd\u3002\u8f6c\u79fb\u6982\u7387\u6355\u6349\u6807\u7b7e\u5e8f\u5217\uff08\u9650\u5b9a\u8bcd\u540e\u9762\u5f88\u53ef\u80fd\u8ddf\u540d\u8bcd\u6216\u5f62\u5bb9\u8bcd\uff09\uff0c\u53d1\u5c04\u6982\u7387\u6355\u6349\u54ea\u4e9b\u8bcd\u4e0e\u54ea\u4e9b\u6807\u7b7e\u4e00\u8d77\u51fa\u73b0\u3002\u7ef4\u7279\u6bd4\u7b97\u6cd5\u627e\u51fa\u6700\u53ef\u80fd\u7684\u6807\u7b7e\u5e8f\u5217\u3002</p> </li> <li> <p>\u7528\u4e8e\u8bcd\u6027\u6807\u6ce8\u7684HMM\u6a21\u578b\uff1a</p> </li> </ul> \\[\\\\hat{t}_{1:n} = \\\\arg\\\\max_{t_{1:n}} \\\\prod_{i=1}^{n} P(w_i \\\\mid t_i) \\\\cdot P(t_i \\\\mid t_{i-1})\\] <ul> <li> <p>\u73b0\u4ee3\u8bcd\u6027\u6807\u6ce8\u5668\u4f7f\u7528\u795e\u7ecf\u7f51\u7edc\uff08\u53cc\u5411LSTM\u6216Transformer\uff09\uff0c\u5728\u82f1\u8bed\u4e0a\u8fbe\u5230\u8d85\u8fc797%\u7684\u51c6\u786e\u7387\uff0c\u63a5\u8fd1\u4eba\u7c7b\u6c34\u5e73\u3002</p> </li> <li> <p>\u547d\u540d\u5b9e\u4f53\u8bc6\u522b\uff08NER\uff09\u8bc6\u522b\u5e76\u5206\u7c7b\u6587\u672c\u4e2d\u7684\u4e13\u6709\u540d\u8bcd\u548c\u5176\u4ed6\u7279\u5b9a\u5b9e\u4f53\uff1a\u4eba\u7269\u3001\u7ec4\u7ec7\u3001\u5730\u70b9\u3001\u65e5\u671f\u3001\u8d27\u5e01\u91d1\u989d\u7b49\u3002</p> </li> <li> <p>\u5728\"Apple CEO Tim Cook announced the event in Cupertino on Monday\"\u4e2d\uff0cNER\u7cfb\u7edf\u5e94\u8bc6\u522b\u51fa\uff1aApple\uff08ORG\u7ec4\u7ec7\uff09\u3001Tim Cook\uff08PER\u4eba\u7269\uff09\u3001Cupertino\uff08LOC\u5730\u70b9\uff09\u3001Monday\uff08DATE\u65e5\u671f\uff09\u3002</p> </li> <li> <p>NER\u901a\u5e38\u88ab\u6846\u67b6\u5316\u4e3a\u5e8f\u5217\u6807\u6ce8\uff0c\u4f7f\u7528BIO\u6807\u6ce8\uff08\u4e5f\u79f0\u4e3aIOB\u6807\u6ce8\uff09\u3002\u6bcf\u4e2a\u8bcd\u5143\u83b7\u5f97\u4e00\u4e2a\u6807\u7b7e\uff1a</p> <ul> <li>B-TYPE\uff1aTYPE\u7c7b\u578b\u5b9e\u4f53\u7684\u5f00\u59cb</li> <li>I-TYPE\uff1aTYPE\u7c7b\u578b\u5b9e\u4f53\u7684\u5185\u90e8\uff08\u5ef6\u7eed\uff09</li> <li>O\uff1a\u5b9e\u4f53\u5916\u90e8</li> </ul> </li> <li> <p>\"Tim Cook visited New York\"\u53d8\u4e3a\uff1aTim/B-PER Cook/I-PER visited/O New/B-LOC York/I-LOC\u3002B\u6807\u7b7e\u6807\u8bb0\u65b0\u5b9e\u4f53\u7684\u8d77\u59cb\u4f4d\u7f6e\uff0c\u8fd9\u5bf9\u4e8e\u4e24\u4e2a\u540c\u7c7b\u578b\u5b9e\u4f53\u76f8\u90bb\u7684\u60c5\u51b5\u5f88\u91cd\u8981\u3002</p> </li> </ul> <p></p> <ul> <li>\u7ecf\u5178NER\u4f7f\u7528\u7b2c05\u7ae0\u4e2d\u7684\u6761\u4ef6\u968f\u673a\u573a\uff08CRF\uff09\uff0c\u5b83\u5bf9\u7ed9\u5b9a\u8f93\u5165\u4e0b\u6574\u4e2a\u6807\u7b7e\u5e8f\u5217\u7684\u6761\u4ef6\u6982\u7387\u5efa\u6a21\u3002\u4e0e\u751f\u6210\u5f0f\u6a21\u578b\uff08\\(P(x, y)\\)\uff09\u7684HMM\u4e0d\u540c\uff0cCRF\u662f\u5224\u522b\u5f0f\u6a21\u578b\uff0c\u76f4\u63a5\u5efa\u6a21 \\(P(y \\\\mid x)\\)\u3002\u7ebf\u6027\u94feCRF\u5b9a\u4e49\u4e3a\uff1a</li> </ul> \\[P(y_{1:n} \\\\mid x_{1:n}) = \\\\frac{1}{Z(x)} \\\\exp\\\\!\\\\left(\\\\sum_{i=1}^{n} \\\\left[\\\\sum_k \\\\lambda_k f_k(y_i, x, i) + \\\\sum_j \\\\mu_j g_j(y_i, y_{i-1}, x, i)\\\\right]\\\\right)\\] <ul> <li> <p>\u8fd9\u91cc \\(f_k\\) \u662f\u53d1\u5c04\u7279\u5f81\uff08\u7ed9\u5b9a\u4f4d\u7f6e \\(i\\) \u7684\u8f93\u5165\uff0c\u6807\u7b7e \\(y_i\\) \u7684\u53ef\u80fd\u6027\uff09\uff0c\\(g_j\\) \u662f\u8f6c\u79fb\u7279\u5f81\uff08\u7ed9\u5b9a\u524d\u4e00\u4e2a\u6807\u7b7e \\(y_{i-1}\\)\uff0c\u5f53\u524d\u6807\u7b7e \\(y_i\\) \u7684\u53ef\u80fd\u6027\uff09\u3002</p> </li> <li> <p>\u914d\u5206\u51fd\u6570 \\(Z(x) = \\\\sum_{y'} \\\\exp(\\\\ldots)\\) \u5bf9\u6240\u6709\u53ef\u80fd\u7684\u6807\u7b7e\u5e8f\u5217\u6c42\u548c\uff0c\u4ee5\u5f52\u4e00\u5316\u5206\u5e03\u3002\u8bad\u7ec3\u6700\u5927\u5316\u6761\u4ef6\u5bf9\u6570\u4f3c\u7136\uff0c\u8fd9\u9700\u8981\u4f7f\u7528\u524d\u5411\u7b97\u6cd5\uff08\u7b2c05\u7ae0\uff09\u9ad8\u6548\u8ba1\u7b97 \\(Z(x)\\)\u3002</p> </li> <li> <p>\u4e0e\u72ec\u7acb\u5206\u7c7b\u6bcf\u4e2a\u8bcd\u5143\u76f8\u6bd4\u7684\u5173\u952e\u4f18\u52bf\uff1aCRF\u7684\u8f6c\u79fb\u7279\u5f81\u5f3a\u5236\u7ed3\u6784\u7ea6\u675f\uff08\u4f8b\u5982\uff0cI-PER\u5e94\u8be5\u53ea\u8ddf\u5728B-PER\u6216I-PER\u4e4b\u540e\uff0c\u7edd\u4e0d\u5e94\u51fa\u73b0\u5728O\u4e4b\u540e\uff09\u3002</p> </li> <li> <p>\u73b0\u4ee3NER\u5c06CRF\u5806\u53e0\u5728\u795e\u7ecf\u7f16\u7801\u5668\u4e4b\u4e0a\uff08BiLSTM-CRF\u6216BERT-CRF\uff09\uff0c\u5176\u4e2d\u795e\u7ecf\u7f51\u7edc\u4ea7\u751f\u53d1\u5c04\u5206\u6570\uff0cCRF\u5c42\u5b66\u4e60\u8f6c\u79fb\u7ed3\u6784\u3002</p> </li> <li> <p>\u53e5\u6cd5\u5206\u6790\u5c06\u53e5\u5b50\u8f6c\u6362\u4e3a\u5176\u53e5\u6cd5\u7ed3\u6784\uff0c\u53ef\u4ee5\u662f\u6210\u5206\u6811\u6216\u4f9d\u5b58\u6811\uff08\u4e24\u8005\u5747\u89c1\u6587\u4ef601\uff09\u3002</p> </li> <li> <p>CYK\u7b97\u6cd5\uff08Cocke-Younger-Kasami\uff09\u4f7f\u7528\u52a8\u6001\u89c4\u5212\u7ed3\u5408\u4e0a\u4e0b\u6587\u65e0\u5173\u6587\u6cd5\u89e3\u6790\u53e5\u5b50\u3002</p> </li> <li> <p>\u5b83\u8981\u6c42\u6587\u6cd5\u4e3a\u4e54\u59c6\u65af\u57fa\u8303\u5f0f\uff08\u6bcf\u6761\u89c4\u5219\u7684\u53f3\u4fa7\u8981\u4e48\u6709\u4e24\u4e2a\u975e\u7ec8\u7ed3\u7b26\uff0c\u8981\u4e48\u6709\u4e00\u4e2a\u7ec8\u7ed3\u7b26\uff09\u3002\u5b83\u81ea\u5e95\u5411\u4e0a\u586b\u5145\u4e00\u4e2a\u4e09\u89d2\u8868\u683c\uff1a\u5355\u5143\u683c\u8868\u793a\u53e5\u5b50\u7684\u8de8\u5ea6\uff0c\u6bcf\u4e2a\u5355\u5143\u683c\u5b58\u50a8\u53ef\u4ee5\u751f\u6210\u8be5\u8de8\u5ea6\u7684\u975e\u7ec8\u7ed3\u7b26\u3002</p> </li> <li> <p>CYK\u7684\u65f6\u95f4\u590d\u6742\u5ea6\u4e3a \\(O(n^3 \\\\cdot |G|)\\)\uff0c\u5176\u4e2d \\(n\\) \u662f\u53e5\u5b50\u957f\u5ea6\uff0c\\(|G|\\) \u662f\u6587\u6cd5\u89c4\u6a21\u3002\u8fd9\u662f\u7cbe\u786e\u7b97\u6cd5\uff0c\u4f46\u5bf9\u4e8e\u5927\u578b\u6587\u6cd5\u6765\u8bf4\u901f\u5ea6\u8f83\u6162\u3002</p> </li> <li> <p>\u79fb\u8fdb-\u5f52\u7ea6\u89e3\u6790\u4ece\u5de6\u5230\u53f3\u5904\u7406\u53e5\u5b50\uff0c\u7ef4\u62a4\u4e00\u4e2a\u6808\u3002\u5728\u6bcf\u4e00\u6b65\uff0c\u5b83\u8981\u4e48\u79fb\u8fdb\uff08\u5c06\u4e0b\u4e00\u4e2a\u8bcd\u538b\u5165\u6808\uff09\uff0c\u8981\u4e48\u5f52\u7ea6\uff08\u4ece\u6808\u4e2d\u5f39\u51fa\u5143\u7d20\u5e76\u7528\u77ed\u8bed\u66ff\u6362\uff09\u3002\u4e00\u4e2a\u8bad\u7ec3\u597d\u7684\u5206\u7c7b\u5668\u5728\u6bcf\u4e00\u6b65\u51b3\u5b9a\u64cd\u4f5c\u3002\u65f6\u95f4\u590d\u6742\u5ea6\u4e3a \\(O(n)\\)\uff0c\u6bd4CYK\u5feb\u5f97\u591a\u3002</p> </li> <li> <p>\u4f9d\u5b58\u89e3\u6790\u5728\u5b9e\u8df5\u4e2d\u6bd4\u6210\u5206\u89e3\u6790\u66f4\u4e3a\u5e38\u89c1\u3002\u57fa\u4e8e\u8f6c\u6362\u7684\u4f9d\u5b58\u89e3\u6790\u5668\uff08\u5982\u79fb\u8fdb-\u5f52\u7ea6\uff09\u548c\u57fa\u4e8e\u56fe\u7684\u89e3\u6790\u5668\uff08\u5bf9\u6240\u6709\u53ef\u80fd\u7684\u8fb9\u8bc4\u5206\u5e76\u627e\u5230\u6700\u5927\u751f\u6210\u6811\uff09\u662f\u4e24\u79cd\u4e3b\u8981\u65b9\u6cd5\u3002\u4f7f\u7528BiLSTM\u6216Transformer\u7684\u795e\u7ecf\u4f9d\u5b58\u89e3\u6790\u5668\u53d6\u5f97\u4e86\u6700\u5148\u8fdb\u7684\u6210\u679c\u3002</p> </li> <li> <p>\u5728\u5d4c\u5165\u51fa\u73b0\u4e4b\u524d\uff0cNLP\u4f7f\u7528\u7b80\u5355\u7684\u8ba1\u6570\u65b9\u6cd5\u5c06\u6587\u6863\u8868\u793a\u4e3a\u5411\u91cf\u3002</p> </li> <li> <p>\u8bcd\u888b\u6a21\u578b\uff08BoW\uff09\u5c06\u6587\u6863\u8868\u793a\u4e3a\u8bcd\u9891\u5411\u91cf\uff0c\u5b8c\u5168\u5ffd\u7565\u8bcd\u5e8f\u3002\u5982\u679c\u8bcd\u6c47\u8868\u6709 \\(V\\) \u4e2a\u8bcd\uff0c\u6bcf\u4e2a\u6587\u6863\u5c31\u662f \\(\\\\mathbb{R}^V\\) \u7a7a\u95f4\u4e2d\u7684\u4e00\u4e2a\u5411\u91cf\uff08\u4e0e\u7b2c01\u7ae0\u7684\u5411\u91cf\u7a7a\u95f4\u76f8\u8054\u7cfb\uff09\u3002\u8bcd \\(w\\) \u5bf9\u5e94\u7684\u6761\u76ee\u662f \\(w\\) \u5728\u6587\u6863\u4e2d\u51fa\u73b0\u7684\u6b21\u6570\u3002</p> </li> </ul> <p></p> <ul> <li> <p>BoW\u7b80\u5355\u4f46\u51fa\u5947\u6709\u6548\uff0c\u9002\u7528\u4e8e\u6587\u6863\u5206\u7c7b\u548c\u5783\u573e\u90ae\u4ef6\u8fc7\u6ee4\u7b49\u4efb\u52a1\u3002\u5176\u4e3b\u8981\u7f3a\u70b9\u662f\u6bcf\u4e2a\u8bcd\u90fd\u88ab\u540c\u7b49\u5bf9\u5f85\uff1a\"the\"\u548c\"revolutionary\"\u83b7\u5f97\u76f8\u540c\u7684\u6743\u91cd\u3002</p> </li> <li> <p>TF-IDF\uff08\u8bcd\u9891-\u9006\u6587\u6863\u9891\u7387\uff09\u901a\u8fc7\u6839\u636e\u8bcd\u7684\u4fe1\u606f\u91cf\u5927\u5c0f\u6765\u52a0\u6743\uff0c\u89e3\u51b3\u4e86\u8fd9\u4e2a\u95ee\u9898\u3002\u5728\u5355\u4e2a\u6587\u6863\u4e2d\u9891\u7e41\u51fa\u73b0\u4f46\u5728\u6574\u4e2a\u8bed\u6599\u5e93\u4e2d\u7f55\u89c1\u7684\u8bcd\uff0c\u5f88\u53ef\u80fd\u5bf9\u8be5\u6587\u6863\u5f88\u91cd\u8981\u3002</p> </li> </ul> \\[\\\\text{TF-IDF}(t, d) = \\\\text{TF}(t, d) \\\\times \\\\text{IDF}(t)\\] <ul> <li> <p>\u8bcd\u9891 \\(\\\\text{TF}(t, d)\\) \u901a\u5e38\u662f\u8bcd \\(t\\) \u5728\u6587\u6863 \\(d\\) \u4e2d\u7684\u539f\u59cb\u8ba1\u6570\uff08\u6216\u5176\u5bf9\u6570\u5f62\u5f0f\uff1a\\(1 + \\\\log(\\\\text{count})\\)\uff09\u3002</p> </li> <li> <p>\u9006\u6587\u6863\u9891\u7387 \\(\\\\text{IDF}(t) = \\\\log\\\\frac{N}{|\\\\{d : t \\\\in d\\\\}|}\\)\uff0c\u5176\u4e2d \\(N\\) \u662f\u6587\u6863\u603b\u6570\u3002\u51fa\u73b0\u5728\u6bcf\u4e2a\u6587\u6863\u4e2d\u7684\u8bcd\uff08\u5982\"the\"\uff09\u7684IDF\u63a5\u8fd10\u3002\u7f55\u89c1\u8bcd\u83b7\u5f97\u9ad8IDF\u3002</p> </li> <li> <p>TF-IDF\u5411\u91cf\u53ef\u4ee5\u4f7f\u7528\u4f59\u5f26\u76f8\u4f3c\u5ea6\uff08\u6765\u81ea\u7b2c01\u7ae0\uff09\u8fdb\u884c\u6bd4\u8f83\uff0c\u4ee5\u8861\u91cf\u6587\u6863\u76f8\u4f3c\u6027\u3002\u8fd9\u662f\u7ecf\u5178\u4fe1\u606f\u68c0\u7d22\u548c\u641c\u7d22\u5f15\u64ce\u7684\u57fa\u7840\u3002</p> </li> <li> <p>\u8bed\u8a00\u6a21\u578b\u4e3a\u8bcd\u5e8f\u5217\u5206\u914d\u6982\u7387\u3002\u5b83\u56de\u7b54\u7684\u662f\uff1a\u8fd9\u4e2a\u53e5\u5b50\u7684\u53ef\u80fd\u6027\u6709\u591a\u5927\uff1f\u8bed\u8a00\u6a21\u578b\u662f\u673a\u5668\u7ffb\u8bd1\u3001\u8bed\u97f3\u8bc6\u522b\u3001\u62fc\u5199\u7ea0\u6b63\u548c\u6587\u672c\u751f\u6210\u7684\u6838\u5fc3\u3002</p> </li> <li> <p>\u53e5\u5b50 \\(w_1, w_2, \\\\ldots, w_n\\) \u7684\u6982\u7387\uff0c\u6839\u636e\u6982\u7387\u7684\u94fe\u5f0f\u6cd5\u5219\uff08\u7b2c05\u7ae0\uff09\u4e3a\uff1a</p> </li> </ul> \\[P(w_1, w_2, \\\\ldots, w_n) = \\\\prod_{i=1}^{n} P(w_i \\\\mid w_1, \\\\ldots, w_{i-1})\\] <ul> <li> <p>\u8fd9\u662f\u7cbe\u786e\u7684\u4f46\u4e0d\u5b9e\u7528\uff1a\u4f60\u9700\u8981\u4e3a\u6bcf\u4e2a\u53ef\u80fd\u7684\u5386\u53f2\u5b58\u50a8\u6982\u7387\u3002\u9a6c\u5c14\u53ef\u592b\u5047\u8bbe\uff08\u7b2c05\u7ae0\uff09\u5c06\u5386\u53f2\u622a\u65ad\u5230\u6700\u8fd1 \\(k-1\\) \u4e2a\u8bcd\uff0c\u5f97\u5230 n\u5143\u8bed\u6cd5\u6a21\u578b\uff08\u5176\u4e2d \\(n = k\\)\uff09\u3002</p> </li> <li> <p>\u4e8c\u5143\u6a21\u578b\uff08\\(n = 2\\)\uff09\u4ec5\u4f9d\u8d56\u524d\u4e00\u4e2a\u8bcd\uff1a</p> </li> </ul> \\[P(w_i \\\\mid w_1, \\\\ldots, w_{i-1}) \\\\approx P(w_i \\\\mid w_{i-1})\\] <ul> <li>\u4e09\u5143\u6a21\u578b\uff08\\(n = 3\\)\uff09\u4f9d\u8d56\u524d\u4e24\u4e2a\u8bcd\u3002n\u5143\u8bed\u6cd5\u6982\u7387\u901a\u8fc7\u5728\u8bed\u6599\u5e93\u4e2d\u8ba1\u6570\u6765\u4f30\u8ba1\uff1a</li> </ul> \\[P(w_i \\\\mid w_{i-1}) = \\\\frac{\\\\text{count}(w_{i-1}, w_i)}{\\\\text{count}(w_{i-1})}\\] <ul> <li>\u56f0\u60d1\u5ea6\u8861\u91cf\u8bed\u8a00\u6a21\u578b\u5bf9\u6d4b\u8bd5\u96c6\u7684\u9884\u6d4b\u80fd\u529b\u3002\u5b83\u662f\u6d4b\u8bd5\u96c6\u6982\u7387\u7684\u5012\u6570\uff0c\u6309\u8bcd\u6570\u5f52\u4e00\u5316\uff1a</li> </ul> \\[\\\\text{PPL} = P(w_1, \\\\ldots, w_N)^{-1/N} = \\\\exp\\\\!\\\\left(-\\\\frac{1}{N} \\\\sum_{i=1}^{N} \\\\log P(w_i \\\\mid w_{&lt;i})\\\\right)\\] <ul> <li> <p>\u56f0\u60d1\u5ea6\u8d8a\u4f4e\uff0c\u8bf4\u660e\u6a21\u578b\u5bf9\u6d4b\u8bd5\u6570\u636e\u8d8a\"\u4e0d\u60ca\u8bb6\"\uff0c\u56e0\u6b64\u6027\u80fd\u8d8a\u597d\u3002\u572810,000\u8bcd\u8bcd\u6c47\u8868\u4e0a\u5206\u914d\u5747\u5300\u6982\u7387\u7684\u6a21\u578b\uff0c\u56f0\u60d1\u5ea6\u4e3a10,000\u3002\u4e00\u4e2a\u597d\u7684\u4e8c\u5143\u6a21\u578b\u53ef\u80fd\u8fbe\u5230\u7ea6200\u7684\u56f0\u60d1\u5ea6\u3002\u73b0\u4ee3\u795e\u7ecf\u8bed\u8a00\u6a21\u578b\u7684\u56f0\u60d1\u5ea6\u4f4e\u4e8e20\u3002</p> </li> <li> <p>\u6ce8\u610f\uff0c\u56f0\u60d1\u5ea6\u662f\u6307\u6570\u5316\u7684\u4ea4\u53c9\u71b5\uff08\u6765\u81ea\u7b2c05\u7ae0\u7684\u4fe1\u606f\u8bba\u90e8\u5206\uff09\u3002\u8bad\u7ec3\u671f\u95f4\u6700\u5c0f\u5316\u4ea4\u53c9\u71b5\u635f\u5931\u76f4\u63a5\u6700\u5c0f\u5316\u56f0\u60d1\u5ea6\u3002</p> </li> <li> <p>\u5e73\u6ed1\u5904\u7406\u96f6\u6982\u7387\u95ee\u9898\uff1a\u5982\u679c\u67d0\u4e2an\u5143\u7ec4\u4ece\u672a\u5728\u8bad\u7ec3\u4e2d\u51fa\u73b0\u8fc7\uff0c\u6a21\u578b\u4f1a\u8d4b\u4e88\u5b83\u6982\u73870\uff0c\u8fd9\u4f1a\u4f7f\u6574\u4e2a\u53e5\u5b50\u7684\u6982\u7387\u4e3a0\u3002\u62c9\u666e\u62c9\u65af\u5e73\u6ed1\uff08\u52a01\uff09\u4e3a\u6bcf\u4e2an\u5143\u7ec4\u6dfb\u52a0\u4e00\u4e2a\u5c0f\u8ba1\u6570\uff1a</p> </li> </ul> \\[P_{\\\\text{Laplace}}(w_i \\\\mid w_{i-1}) = \\\\frac{\\\\text{count}(w_{i-1}, w_i) + 1}{\\\\text{count}(w_{i-1}) + V}\\] <ul> <li> <p>\u5bf9\u4e8e\u5927\u8bcd\u6c47\u8868\u6765\u8bf4\u8fd9\u8fc7\u4e8e\u6fc0\u8fdb\uff08\u4ece\u5df2\u89c2\u5bdf\u5230\u7684n\u5143\u7ec4\u4e2d\u632a\u8d70\u4e86\u592a\u591a\u6982\u7387\uff09\u3002Kneser-Ney\u5e73\u6ed1\u662fn\u5143\u8bed\u6cd5\u6a21\u578b\u7684\u91d1\u6807\u51c6\u3002\u5b83\u7ed3\u5408\u4e86\u4e24\u4e2a\u601d\u60f3\uff1a\u7edd\u5bf9\u6298\u6263\u548c\u7528\u4e8e\u56de\u9000\u7684\u5ef6\u7eed\u6982\u7387\u3002</p> </li> <li> <p>\u9996\u5148\uff0c\u7edd\u5bf9\u6298\u6263\u4ece\u6bcf\u4e2a\u89c2\u5bdf\u5230\u7684\u8ba1\u6570\u4e2d\u51cf\u53bb\u4e00\u4e2a\u56fa\u5b9a\u6298\u6263 \\(d\\)\uff08\u901a\u5e38 \\(d \\\\approx 0.75\\)\uff09\uff0c\u800c\u4e0d\u662f\u6dfb\u52a0\u4f2a\u8ba1\u6570\u3002\u91ca\u653e\u51fa\u7684\u6982\u7387\u8d28\u91cf\u91cd\u65b0\u5206\u914d\u7ed9\u672a\u89c1\u8fc7\u7684n\u5143\u7ec4\u3002\u63d2\u503c\u5f62\u5f0f\u4e3a\uff1a</p> </li> </ul> \\[P_{\\\\text{KN}}(w_i \\\\mid w_{i-1}) = \\\\frac{\\\\max(\\\\text{count}(w_{i-1}, w_i) - d, \\\\; 0)}{\\\\text{count}(w_{i-1})} + \\\\lambda(w_{i-1}) \\\\cdot P_{\\\\text{cont}}(w_i)\\] <ul> <li>\u5176\u4e2d \\(\\\\lambda(w_{i-1})\\) \u662f\u4e00\u4e2a\u5f52\u4e00\u5316\u5e38\u6570\uff0c\u7528\u4e8e\u5206\u914d\u6298\u6263\u540e\u7684\u8d28\u91cf\u3002\u5173\u952e\u7684\u521b\u65b0\u662f\u5ef6\u7eed\u6982\u7387 \\(P_{\\\\text{cont}}(w_i)\\)\uff0c\u5b83\u8861\u91cf \\(w_i\\) \u51fa\u73b0\u5728\u591a\u5c11\u4e2a\u4e0d\u540c\u7684\u4e0a\u4e0b\u6587\u4e2d\uff0c\u800c\u4e0d\u662f\u5b83\u603b\u4f53\u4e0a\u51fa\u73b0\u7684\u9891\u7387\uff1a</li> </ul> \\[P_{\\\\text{cont}}(w_i) = \\\\frac{|\\\\{w' : \\\\text{count}(w', w_i) &gt; 0\\\\}|}{|\\\\{(w', w'') : \\\\text{count}(w', w'') &gt; 0\\\\}|}\\] <ul> <li> <p>\u5206\u5b50\u7edf\u8ba1\u5728\u8bed\u6599\u5e93\u4e2d\u51fa\u73b0\u5728 \\(w_i\\) \u4e4b\u524d\u7684\u4e0d\u540c\u8bcd\u7684\u6570\u91cf\u3002\u50cf\"Francisco\"\u8fd9\u6837\u7684\u8bcd\u51fa\u73b0\u5728\u5f88\u5c11\u7684\u4e0a\u4e0b\u6587\u4e2d\uff08\u51e0\u4e4e\u603b\u662f\u5728\"San\"\u4e4b\u540e\uff09\uff0c\u6240\u4ee5\u5373\u4f7f\"San Francisco\"\u975e\u5e38\u9891\u7e41\uff0c\"Francisco\"\u7684\u5ef6\u7eed\u6982\u7387\u4e5f\u5f88\u4f4e\uff0c\u4e0d\u4f1a\u5728\u5176\u4ed6\u4e0a\u4e0b\u6587\u4e2d\u88ab\u9519\u8bef\u9884\u6d4b\u3002</p> </li> <li> <p>\u76f8\u53cd\uff0c\u50cf\"the\"\u8fd9\u6837\u7684\u5e38\u89c1\u8bcd\u51fa\u73b0\u5728\u8bb8\u591a\u4e0d\u540c\u8bcd\u4e4b\u540e\uff0c\u83b7\u5f97\u9ad8\u5ef6\u7eed\u6982\u7387\u3002\u8fd9\u4f53\u73b0\u4e86\u8fd9\u6837\u4e00\u79cd\u76f4\u89c9\uff1a\u5bf9\u4e8e\u56de\u9000\u4f30\u8ba1\u800c\u8a00\uff0c\u8bcd\u7684\u591a\u529f\u80fd\u6027\u6bd4\u5176\u539f\u59cb\u9891\u7387\u66f4\u91cd\u8981\u3002</p> </li> <li> <p>n\u5143\u8bed\u6cd5\u6a21\u578b\u51e0\u5341\u5e74\u6765\u4e00\u76f4\u662f\u4e3b\u6d41\u6280\u672f\u3002\u5b83\u4eec\u901f\u5ea6\u5feb\u3001\u53ef\u89e3\u91ca\u6027\u5f3a\uff0c\u4e14\u65e0\u9700\u8bad\u7ec3\uff08\u53ea\u9700\u8ba1\u6570\uff09\u3002\u4f46\u5b83\u4eec\u96be\u4ee5\u5904\u7406\u957f\u8ddd\u79bb\u4f9d\u8d56\uff08\"The keys that I left on the table are missing\"\u9700\u8981\u77e5\u9053\u4e3b\u8bed\"keys\"\u662f\u590d\u6570\uff0c\u800c\u5b83\u4e0e\u52a8\u8bcd\u76f8\u8ddd\u751a\u8fdc\uff09\u3002\u795e\u7ecf\u8bed\u8a00\u6a21\u578b\u2014\u2014\u4eceRNN\u5f00\u59cb\u5230Transformer\u8fbe\u5230\u9876\u5cf0\u2014\u2014\u89e3\u51b3\u4e86\u8fd9\u4e00\u5c40\u9650\u6027\u3002</p> </li> </ul>"},{"location":"chapter%2007%3A%20computational%20linguistics/02.%20text%20processing%20and%20classic%20NLP/#colabnotebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528CoLab\u6216notebook\uff09","text":"<ol> <li> <p>\u4f7f\u7528\u52a8\u6001\u89c4\u5212\u5b9e\u73b0\u83b1\u6587\u65af\u5766\u7f16\u8f91\u8ddd\u79bb\u3002\u5728\u8bcd\u5bf9\u4e0a\u6d4b\u8bd5\uff0c\u5e76\u7528\u4e8e\u7b80\u5355\u7684\u62fc\u5199\u7ea0\u6b63\u3002 <pre><code>import jax.numpy as jnp\n\ndef edit_distance(s, t):\n    \"\"\"Compute Levenshtein edit distance using DP.\"\"\"\n    m, n = len(s), len(t)\n    D = [[0] * (n + 1) for _ in range(m + 1)]\n\n    for i in range(m + 1):\n        D[i][0] = i\n    for j in range(n + 1):\n        D[0][j] = j\n\n    for i in range(1, m + 1):\n        for j in range(1, n + 1):\n            if s[i-1] == t[j-1]:\n                D[i][j] = D[i-1][j-1]\n            else:\n                D[i][j] = 1 + min(D[i-1][j], D[i][j-1], D[i-1][j-1])\n\n    return D[m][n]\n\n# Test\npairs = [(\"kitten\", \"sitting\"), (\"sunday\", \"saturday\"), (\"hello\", \"hallo\")]\nfor s, t in pairs:\n    print(f\"d('{s}', '{t}') = {edit_distance(s, t)}\")\n\n# Simple spelling correction\ndictionary = [\"the\", \"their\", \"there\", \"then\", \"than\", \"this\", \"that\", \"these\", \"those\"]\nmisspelled = \"thier\"\ncorrections = sorted(dictionary, key=lambda w: edit_distance(misspelled, w))\nprint(f\"\\nClosest to '{misspelled}': {corrections[:3]}\")\n</code></pre></p> </li> <li> <p>\u4ece\u5934\u5b9e\u73b0BPE\u5206\u8bcd\u3002\u4ece\u5b57\u7b26\u7ea7\u8bcd\u5143\u5f00\u59cb\uff0c\u8fed\u4ee3\u5730\u5408\u5e76\u6700\u9891\u7e41\u7684\u5bf9\u3002 <pre><code>from collections import Counter\n\ndef get_pairs(corpus):\n    \"\"\"Count adjacent token pairs across all words.\"\"\"\n    pairs = Counter()\n    for word, freq in corpus.items():\n        symbols = word.split()\n        for i in range(len(symbols) - 1):\n            pairs[(symbols[i], symbols[i+1])] += freq\n    return pairs\n\ndef merge_pair(pair, corpus):\n    \"\"\"Merge all occurrences of a pair in the corpus.\"\"\"\n    new_corpus = {}\n    bigram = ' '.join(pair)\n    replacement = ''.join(pair)\n    for word, freq in corpus.items():\n        new_word = word.replace(bigram, replacement)\n        new_corpus[new_word] = freq\n    return new_corpus\n\n# Training corpus with word frequencies\ntext = \"low low low low low lower lower newest newest newest newest newest newest\"\nword_freqs = Counter(text.split())\n# Initialise: split each word into characters with end-of-word marker\ncorpus = {' '.join(word) + ' _': freq for word, freq in word_freqs.items()}\n\nprint(\"Initial corpus:\")\nfor word, freq in corpus.items():\n    print(f\"  {word}: {freq}\")\n\n# Run BPE for 10 merges\nfor i in range(10):\n    pairs = get_pairs(corpus)\n    if not pairs:\n        break\n    best_pair = max(pairs, key=pairs.get)\n    corpus = merge_pair(best_pair, corpus)\n    print(f\"\\nMerge {i+1}: {best_pair} (freq={pairs[best_pair]})\")\n    for word, freq in corpus.items():\n        print(f\"  {word}: {freq}\")\n</code></pre></p> </li> <li> <p>\u6784\u5efa\u4e00\u4e2a\u4e8c\u5143\u8bed\u8a00\u6a21\u578b\uff0c\u5e76\u8ba1\u7b97\u6d4b\u8bd5\u53e5\u5b50\u7684\u56f0\u60d1\u5ea6\u3002\u5c1d\u8bd5\u62c9\u666e\u62c9\u65af\u5e73\u6ed1\u3002 <pre><code>from collections import Counter, defaultdict\nimport math\n\n# Training corpus\ntrain = \"\"\"the cat sat on the mat . the dog chased the cat .\nthe cat ran from the dog . a dog sat on a mat .\"\"\".split()\n\n# Count bigrams and unigrams\nbigrams = Counter(zip(train[:-1], train[1:]))\nunigrams = Counter(train)\nvocab_size = len(set(train))\n\ndef bigram_prob(w2, w1, alpha=0):\n    \"\"\"P(w2 | w1) with optional Laplace smoothing.\"\"\"\n    return (bigrams[(w1, w2)] + alpha) / (unigrams[w1] + alpha * vocab_size)\n\n# Compute perplexity\ntest = \"the cat sat on a mat .\".split()\n\nfor alpha in [0, 1, 0.1]:\n    log_prob = 0\n    for w1, w2 in zip(test[:-1], test[1:]):\n        p = bigram_prob(w2, w1, alpha=alpha)\n        if p &gt; 0:\n            log_prob += math.log(p)\n        else:\n            log_prob += float('-inf')\n\n    ppl = math.exp(-log_prob / (len(test) - 1)) if log_prob &gt; float('-inf') else float('inf')\n    print(f\"Smoothing \u03b1={alpha}: perplexity = {ppl:.2f}\")\n</code></pre></p> </li> <li> <p>\u4ece\u5934\u5b9e\u73b0TF-IDF\uff0c\u5e76\u4f7f\u7528\u4f59\u5f26\u76f8\u4f3c\u5ea6\u627e\u5230\u4e0e\u67e5\u8be2\u6700\u76f8\u4f3c\u7684\u6587\u6863\u3002 <pre><code>import jax.numpy as jnp\nimport math\nfrom collections import Counter\n\ndocuments = [\n    \"the cat sat on the mat\",\n    \"the dog chased the cat around the park\",\n    \"a mat was placed on the floor by the door\",\n    \"the quick brown fox jumped over the lazy dog\",\n]\n\n# Build vocabulary\nvocab = sorted(set(word for doc in documents for word in doc.split()))\nword_to_idx = {w: i for i, w in enumerate(vocab)}\nV = len(vocab)\nN = len(documents)\n\n# Compute TF-IDF matrix\ndoc_freq = Counter()\nfor doc in documents:\n    for word in set(doc.split()):\n        doc_freq[word] += 1\n\ntfidf_matrix = jnp.zeros((N, V))\nfor i, doc in enumerate(documents):\n    word_counts = Counter(doc.split())\n    for word, count in word_counts.items():\n        tf = 1 + math.log(count)\n        idf = math.log(N / doc_freq[word])\n        j = word_to_idx[word]\n        tfidf_matrix = tfidf_matrix.at[i, j].set(tf * idf)\n\n# Query\nquery = \"cat on the mat\"\nquery_vec = jnp.zeros(V)\nquery_counts = Counter(query.split())\nfor word, count in query_counts.items():\n    if word in word_to_idx:\n        tf = 1 + math.log(count)\n        idf = math.log(N / doc_freq.get(word, 1))\n        query_vec = query_vec.at[word_to_idx[word]].set(tf * idf)\n\n# Cosine similarity (from chapter 01)\ndef cosine_sim(a, b):\n    return jnp.dot(a, b) / (jnp.linalg.norm(a) * jnp.linalg.norm(b) + 1e-8)\n\nprint(f\"Query: '{query}'\\n\")\nfor i, doc in enumerate(documents):\n    sim = cosine_sim(query_vec, tfidf_matrix[i])\n    print(f\"  Doc {i} (sim={sim:.3f}): '{doc}'\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2007%3A%20computational%20linguistics/03.%20embeddings%20and%20sequence%20models/","title":"\u5d4c\u5165\u4e0e\u5e8f\u5217\u6a21\u578b","text":"<p>\u8bcd\u5d4c\u5165\u5c06\u7a00\u758f\u7684\u7b26\u53f7\u5316\u6587\u672c\u538b\u7f29\u5230\u7a20\u5bc6\u5411\u91cf\u7a7a\u95f4\u4e2d\uff0c\u4f7f\u5f97\u8bed\u4e49\u76f8\u4f3c\u6027\u8f6c\u5316\u4e3a\u51e0\u4f55\u90bb\u8fd1\u6027\u3002\u672c\u6587\u6db5\u76d6 Word2Vec\uff08CBOW\u3001Skip-gram\uff09\u3001GloVe\u3001FastText\u3001RNN\u3001LSTM\u3001GRU\u3001\u5e26\u6ce8\u610f\u529b\u673a\u5236\u7684 seq2seq\u3001\u7f16\u7801\u5668-\u89e3\u7801\u5668\u8303\u5f0f\uff0c\u4ee5\u53ca\u4ece\u8bcd\u888b\u6a21\u578b\u5230\u4e0a\u4e0b\u6587\u8868\u793a\u7684\u53d1\u5c55\u5386\u7a0b\u3002</p> <ul> <li> <p>\u5728\u6587\u4ef6 01 \u4e2d\uff0c\u6211\u4eec\u4ecb\u7ecd\u4e86\u5206\u5e03\u5047\u8bbe\uff1a\u51fa\u73b0\u5728\u76f8\u4f3c\u8bed\u5883\u4e2d\u7684\u8bcd\u5f80\u5f80\u5177\u6709\u76f8\u4f3c\u7684\u542b\u4e49\u3002\u5728\u6587\u4ef6 02 \u4e2d\uff0c\u6211\u4eec\u4f7f\u7528\u7a00\u758f\u7684\u3001\u624b\u5de5\u8bbe\u8ba1\u7684\u7279\u5f81\uff08\u5982 TF-IDF \u5411\u91cf\uff09\u6765\u8868\u793a\u6587\u672c\u3002\u8fd9\u4e9b\u5411\u91cf\u4f4d\u4e8e\u6781\u9ad8\u7ef4\u7a7a\u95f4\u4e2d\uff08\u6bcf\u4e2a\u8bcd\u6c47\u8868\u8bcd\u5360\u4e00\u7ef4\uff09\uff0c\u4e14\u5927\u90e8\u5206\u4e3a\u96f6\u3002\u8bcd\u5d4c\u5165\u5c06\u8fd9\u4e9b\u4fe1\u606f\u538b\u7f29\u5230\u7a20\u5bc6\u7684\u4f4e\u7ef4\u5411\u91cf\u4e2d\uff0c\u6355\u6349\u8bed\u4e49\u5173\u7cfb\uff0c\u5e76\u4e14\u76f4\u63a5\u4ece\u6570\u636e\u4e2d\u5b66\u4e60\u3002</p> </li> <li> <p>Word2Vec\uff08Mikolov et al., 2013\uff09\u901a\u8fc7\u5728\u7b80\u5355\u7684\u9884\u6d4b\u4efb\u52a1\u4e0a\u8bad\u7ec3\u4e00\u4e2a\u6d45\u5c42\u795e\u7ecf\u7f51\u7edc\u6765\u5b66\u4e60\u8bcd\u5d4c\u5165\u3002\u5171\u6709\u4e24\u79cd\u67b6\u6784\u3002</p> </li> <li> <p>\u8fde\u7eed\u8bcd\u888b\u6a21\u578b\uff08CBOW\uff09\u6839\u636e\u76ee\u6807\u8bcd\u5468\u56f4\u7684\u4e0a\u4e0b\u6587\u8bcd\u6765\u9884\u6d4b\u8be5\u8bcd\u3002\u7ed9\u5b9a\u4e00\u4e2a\u7a97\u53e3\u5927\u5c0f\u7684\u4e0a\u4e0b\u6587\u8bcd\uff08\u4f8b\u5982\uff0c\"the cat ___ on the\"\uff09\uff0c\u6a21\u578b\u6c42\u5b83\u4eec\u7684\u5d4c\u5165\u5411\u91cf\u7684\u5e73\u5747\u503c\uff0c\u5e76\u5c06\u7ed3\u679c\u901a\u8fc7\u4e00\u4e2a\u7ebf\u6027\u5c42\u6765\u9884\u6d4b\u7f3a\u5931\u7684\u8bcd\uff08\"sat\"\uff09\u3002\u8bad\u7ec3\u76ee\u6807\u6700\u5927\u5316\uff1a</p> </li> </ul> \\[P(w_t \\mid w_{t-k}, \\ldots, w_{t-1}, w_{t+1}, \\ldots, w_{t+k})\\] <ul> <li>Skip-gram \u6a21\u578b\u5219\u53cd\u8fc7\u6765\uff1a\u7ed9\u5b9a\u4e00\u4e2a\u76ee\u6807\u8bcd\uff0c\u9884\u6d4b\u5176\u5468\u56f4\u7684\u4e0a\u4e0b\u6587\u8bcd\u3002\u5bf9\u4e8e\u76ee\u6807\u8bcd \"sat\"\uff0c\u6a21\u578b\u5206\u522b\u5c1d\u8bd5\u9884\u6d4b \"the\"\u3001\"cat\"\u3001\"on\"\u3001\"the\"\u3002\u76ee\u6807\u6700\u5927\u5316\uff1a</li> </ul> \\[P(w_{t+j} \\mid w_t) \\quad \\text{\u5bf9\u4e8e\u6bcf\u4e2a } j \\in [-k, k], \\; j \\neq 0\\] <p></p> <ul> <li> <p>Skip-gram \u901a\u5e38\u5bf9\u7f55\u89c1\u8bcd\u6548\u679c\u66f4\u597d\uff0c\u56e0\u4e3a\u6bcf\u4e2a\u8bcd\u4f1a\u4ea7\u751f\u591a\u4e2a\u8bad\u7ec3\u6837\u672c\uff08\u6bcf\u4e2a\u4e0a\u4e0b\u6587\u4f4d\u7f6e\u4e00\u4e2a\uff09\u3002CBOW \u901f\u5ea6\u66f4\u5feb\uff0c\u5bf9\u9891\u7e41\u8bcd\u7565\u4f18\uff0c\u56e0\u4e3a\u5b83\u5bf9\u591a\u4e2a\u4e0a\u4e0b\u6587\u4fe1\u53f7\u53d6\u5e73\u5747\u3002</p> </li> <li> <p>\u5728\u6574\u4e2a\u8bcd\u6c47\u8868\u4e0a\u8bad\u7ec3\u4ee3\u4ef7\u5f88\u9ad8\uff0c\u56e0\u4e3a softmax \u5206\u6bcd\u9700\u8981\u5bf9\u6240\u6709 \\(V\\) \u4e2a\u8bcd\u6c42\u548c\u3002\u8d1f\u91c7\u6837\u901a\u8fc7\u5c06\u95ee\u9898\u8f6c\u5316\u4e3a\u4e8c\u5206\u7c7b\u6765\u8fd1\u4f3c\u8fd9\u4e00\u8fc7\u7a0b\uff1a\u533a\u5206\u771f\u5b9e\u7684\u4e0a\u4e0b\u6587\u8bcd\uff08\u6b63\u6837\u672c\uff09\u4e0e\u968f\u673a\u91c7\u6837\u7684\u566a\u58f0\u8bcd\uff08\u8d1f\u6837\u672c\uff09\u3002\u6a21\u578b\u65e0\u9700\u8ba1\u7b97\u5b8c\u6574\u7684 softmax\uff0c\u53ea\u9700\u66f4\u65b0\u76ee\u6807\u8bcd\u3001\u771f\u5b9e\u4e0a\u4e0b\u6587\u8bcd\u4ee5\u53ca\u5c11\u6570\u8d1f\u6837\u672c\u7684\u5d4c\u5165\uff1a</p> </li> </ul> \\[\\mathcal{L} = \\log \\sigma(v_{w_O}^T v_{w_I}) + \\sum_{i=1}^{k} \\mathbb{E}_{w_i \\sim P_n} [\\log \\sigma(-v_{w_i}^T v_{w_I})]\\] <ul> <li> <p>\u8fd9\u91cc \\(v_{w_I}\\) \u662f\u8f93\u5165\u8bcd\u5d4c\u5165\uff0c\\(v_{w_O}\\) \u662f\u8f93\u51fa\uff08\u4e0a\u4e0b\u6587\uff09\u8bcd\u5d4c\u5165\uff0c\\(P_n\\) \u662f\u566a\u58f0\u5206\u5e03\uff0c\u901a\u5e38\u91c7\u7528\u8bcd\u9891\u7684 3/4 \u6b21\u65b9\uff08\u8fd9\u4f1a\u964d\u4f4e\"the\"\u8fd9\u7c7b\u9ad8\u9891\u8bcd\u7684\u6743\u91cd\uff09\u3002</p> </li> <li> <p>\u4e3a\u4ec0\u4e48\u8fd9\u4e2a\u7b80\u5355\u7684\u76ee\u6807\u51fd\u6570\u80fd\u4ea7\u751f\u6709\u610f\u4e49\u7684\u5d4c\u5165\uff1fLevy \u548c Goldberg\uff082014\uff09\u8bc1\u660e\uff0c\u5e26\u8d1f\u91c7\u6837\u7684 skip-gram \u5b9e\u9645\u4e0a\u662f\u5728\u5206\u89e3\u4e00\u4e2a\u79fb\u4f4d\u70b9\u4e92\u4fe1\u606f\uff08PMI\uff09\u77e9\u9635\u3002\u5728\u6536\u655b\u65f6\uff0c\u4e24\u4e2a\u8bcd\u5411\u91cf\u7684\u70b9\u79ef\u8fd1\u4f3c\u4e8e\uff1a</p> </li> </ul> \\[v_w^T v_c \\approx \\text{PMI}(w, c) - \\log k\\] <ul> <li> <p>\u5176\u4e2d \\(\\text{PMI}(w, c) = \\log \\frac{P(w, c)}{P(w) P(c)}\\) \u8861\u91cf\u8bcd \\(w\\) \u548c \\(c\\) \u5171\u73b0\u7684\u9891\u7387\u6bd4\u968f\u673a\u671f\u671b\u9ad8\u51fa\u591a\u5c11\uff08\u89c1\u7b2c 05 \u7ae0\u4fe1\u606f\u8bba\uff09\uff0c\\(k\\) \u662f\u8d1f\u6837\u672c\u6570\u91cf\u3002\u5171\u73b0\u8fdc\u9ad8\u4e8e\u968f\u673a\u671f\u671b\u7684\u8bcd\u5177\u6709\u9ad8 PMI\uff0c\u4ece\u800c\u5177\u6709\u9ad8\u70b9\u79ef\uff08\u76f8\u4f3c\u7684\u5d4c\u5165\uff09\u3002\u5171\u73b0\u4f4e\u4e8e\u9884\u671f\u7684\u8bcd\u5177\u6709\u8d1f PMI \u548c\u4e0d\u76f8\u4f3c\u7684\u5d4c\u5165\u3002\u8fd9\u8868\u660e Word2Vec \u5b9e\u9645\u4e0a\u4e0e\u7ecf\u5178\u7684\u5206\u5e03\u8bed\u4e49\u5b66\u65b9\u6cd5\uff08\u5982\u6f5c\u5728\u8bed\u4e49\u5206\u6790\uff0c\u5373\u5bf9\u5171\u73b0\u77e9\u9635\u505a SVD\uff09\u5728\u505a\u540c\u6837\u7684\u4e8b\u60c5\uff0c\u53ea\u662f\u91c7\u7528\u4e86\u66f4\u5177\u6269\u5c55\u6027\u7684\u5728\u7ebf\u65b9\u5f0f\u3002</p> </li> <li> <p>Word2Vec \u5d4c\u5165\u6700\u4ee4\u4eba\u60ca\u8bb6\u7684\u7279\u6027\u662f\u5b83\u4eec\u80fd\u901a\u8fc7\u5411\u91cf\u7b97\u672f\u6355\u6349\u7c7b\u6bd4\u5173\u7cfb\u3002\u5411\u91cf \\(v_{\\text{king}} - v_{\\text{man}} + v_{\\text{woman}}\\) \u6700\u63a5\u8fd1 \\(v_{\\text{queen}}\\)\u3002\u8fd9\u662f\u56e0\u4e3a\u5d4c\u5165\u7a7a\u95f4\u5c06\u8bed\u4e49\u5173\u7cfb\u7f16\u7801\u4e3a\u8fd1\u4f3c\u7ebf\u6027\u65b9\u5411\uff1a\"\u738b\u5ba4\"\u65b9\u5411\u5927\u81f4\u4e3a \\(v_{\\text{king}} - v_{\\text{man}}\\)\uff0c\u5c06\u5176\u52a0\u5230 \\(v_{\\text{woman}}\\) \u4e0a\u5c31\u4f1a\u843d\u5728 \\(v_{\\text{queen}}\\) \u9644\u8fd1\u3002\u8fd9\u4e0e\u7b2c 01 \u7ae0\u7684\u7ebf\u6027\u4ee3\u6570\u76f8\u5173\u8054\uff1a\u8bed\u4e49\u5173\u7cfb\u5c31\u662f\u5411\u91cf\u5e73\u79fb\u3002</p> </li> <li> <p>GloVe\uff08Global Vectors for Word Representation\uff0cPennington et al., 2014\uff09\u91c7\u7528\u4e0d\u540c\u7684\u65b9\u6cd5\u3002\u5b83\u4e0d\u662f\u4e00\u6b21\u4e00\u4e2a\u5730\u4ece\u5c40\u90e8\u4e0a\u4e0b\u6587\u7a97\u53e3\u5b66\u4e60\uff0c\u800c\u662f\u6784\u5efa\u4e00\u4e2a\u5168\u5c40\u7684\u8bcd\u5171\u73b0\u77e9\u9635 \\(X\\)\uff0c\u5176\u4e2d \\(X_{ij}\\) \u7edf\u8ba1\u5728\u6574\u4e2a\u8bed\u6599\u5e93\u4e2d\u8bcd \\(j\\) \u51fa\u73b0\u5728\u8bcd \\(i\\) \u4e0a\u4e0b\u6587\u4e2d\u7684\u6b21\u6570\u3002\u7136\u540e\u6a21\u578b\u5b66\u4e60\u5d4c\u5165\uff0c\u4f7f\u5176\u70b9\u79ef\u8fd1\u4f3c\u4e8e\u5bf9\u6570\u5171\u73b0\u6b21\u6570\uff1a</p> </li> </ul> \\[w_i^T \\tilde{w}_j + b_i + \\tilde{b}_j = \\log X_{ij}\\] <ul> <li>\u635f\u5931\u51fd\u6570\u901a\u8fc7\u4e00\u4e2a\u622a\u65ad\u51fd\u6570 \\(f(X_{ij})\\) \u5bf9\u6bcf\u4e00\u5bf9\u52a0\u6743\uff0c\u9632\u6b62\u975e\u5e38\u9891\u7e41\u7684\u5171\u73b0\u4e3b\u5bfc\u8bad\u7ec3\uff1a</li> </ul> \\[\\mathcal{L} = \\sum_{i,j=1}^{V} f(X_{ij}) \\left(w_i^T \\tilde{w}_j + b_i + \\tilde{b}_j - \\log X_{ij}\\right)^2\\] <ul> <li> <p>GloVe \u7ed3\u5408\u4e86\u5168\u5c40\u77e9\u9635\u5206\u89e3\uff08\u5982\u6f5c\u5728\u8bed\u4e49\u5206\u6790\uff09\u548c Word2Vec \u7684\u5c40\u90e8\u4e0a\u4e0b\u6587\u5b66\u4e60\u7684\u4f18\u70b9\u3002\u5728\u5b9e\u8df5\u4e2d\uff0cGloVe \u548c Word2Vec \u751f\u6210\u7684\u5d4c\u5165\u8d28\u91cf\u76f8\u8fd1\u3002</p> </li> <li> <p>FastText\uff08Bojanowski et al., 2017\uff09\u6269\u5c55\u4e86 skip-gram\uff0c\u5c06\u6bcf\u4e2a\u8bcd\u8868\u793a\u4e3a\u4e00\u7ec4\u5b57\u7b26 n-gram \u7684\u96c6\u5408\u3002\u5bf9\u4e8e \\(n = 3\\)\uff0c\u8bcd \"where\" \u53d8\u6210\uff1a\"\\&lt;wh\"\u3001\"whe\"\u3001\"her\"\u3001\"ere\"\u3001\"re&gt;\"\uff0c\u52a0\u4e0a\u5b8c\u6574\u8bcd\u6807\u8bb0 \"\\&lt;where&gt;\"\u3002\u8be5\u8bcd\u7684\u5d4c\u5165\u662f\u5176\u6240\u6709 n-gram \u5d4c\u5165\u4e4b\u548c\u3002</p> </li> <li> <p>\u8fd9\u6709\u4e00\u4e2a\u5173\u952e\u4f18\u52bf\uff1aFastText \u80fd\u591f\u4e3a\u8bad\u7ec3\u4e2d\u4ece\u672a\u89c1\u8fc7\u7684\u8bcd\u751f\u6210\u5d4c\u5165\u3002\u8bcd \"whereabouts\" \u4e0e \"where\" \u5171\u4eab n-gram\uff0c\u56e0\u6b64\u5373\u4f7f \"whereabouts\" \u4ece\u672a\u51fa\u73b0\u5728\u8bad\u7ec3\u6570\u636e\u4e2d\uff0c\u5176\u5d4c\u5165\u4e5f\u662f\u5408\u7406\u7684\u3002\u8fd9\u5bf9\u4e8e\u5f62\u6001\u4e30\u5bcc\u7684\u8bed\u8a00\uff08\u6587\u4ef6 01\uff09\u5c24\u4e3a\u6709\u7528\uff0c\u56e0\u4e3a\u8fd9\u4e9b\u8bed\u8a00\u4e2d\u7684\u8bcd\u6709\u8bb8\u591a\u5c48\u6298\u5f62\u5f0f\u3002</p> </li> <li> <p>\u5d4c\u5165\u8bc4\u4f30\u901a\u5e38\u4f7f\u7528\u4e24\u7c7b\u57fa\u51c6\u6d4b\u8bd5\u3002\u7c7b\u6bd4\u4efb\u52a1\u6d4b\u8bd5 \\(v_a - v_b + v_c \\approx v_d\\) \u662f\u5426\u6210\u7acb\uff08\u4f8b\u5982\uff0c\"Paris\" \\(-\\) \"France\" \\(+\\) \"Italy\" \\(\\approx\\) \"Rome\"\uff09\u3002\u76f8\u4f3c\u6027\u57fa\u51c6\u5c06\u8bcd\u5bf9\u4e4b\u95f4\u7684\u4f59\u5f26\u76f8\u4f3c\u5ea6\uff08\u7b2c 01 \u7ae0\uff09\u4e0e\u4eba\u5de5\u5224\u65ad\u8fdb\u884c\u6bd4\u8f83\u3002\u5e38\u89c1\u7684\u6570\u636e\u96c6\u5305\u62ec WordSim-353\u3001SimLex-999 \u548c Google \u7c7b\u6bd4\u6d4b\u8bd5\u96c6\u3002\u4e00\u4e2a\u5b9e\u7528\u6ce8\u610f\u4e8b\u9879\uff1a\u5728\u7c7b\u6bd4\u4efb\u52a1\u4e0a\u8868\u73b0\u51fa\u8272\u7684\u5d4c\u5165\u4e0d\u4e00\u5b9a\u6700\u9002\u5408\u4e0b\u6e38\u4efb\u52a1\uff0c\u5982\u60c5\u611f\u5206\u7c7b\u3002\u6700\u597d\u7684\u8bc4\u4f30\u5f80\u5f80\u662f\u4efb\u52a1\u672c\u8eab\u3002</p> </li> <li> <p>\u5728\u7b2c 06 \u7ae0\u4e2d\uff0c\u6211\u4eec\u4ecb\u7ecd\u4e86 RNN\u3001LSTM \u548c GRU \u4f5c\u4e3a\u5904\u7406\u5e8f\u5217\u6570\u636e\u7684\u67b6\u6784\u3002\u8fd9\u91cc\u6211\u4eec\u91cd\u70b9\u8ba8\u8bba\u5b83\u4eec\u5982\u4f55\u5177\u4f53\u5e94\u7528\u4e8e\u8bed\u8a00\u4efb\u52a1\u3002</p> </li> <li> <p>\u8bed\u8a00\u6a21\u578b RNN \u6bcf\u6b21\u8bfb\u53d6\u4e00\u4e2a\u8bcd\u5143\uff0c\u5e76\u5728\u6bcf\u4e00\u6b65\u9884\u6d4b\u4e0b\u4e00\u4e2a\u8bcd\u5143\u3002\u9690\u85cf\u72b6\u6001 \\(h_t\\) \u5c06\u6574\u4e2a\u5386\u53f2\u5e8f\u5217 \\(w_1, \\ldots, w_t\\) \u538b\u7f29\u4e3a\u4e00\u4e2a\u56fa\u5b9a\u5927\u5c0f\u7684\u5411\u91cf\uff0c\u7ebf\u6027\u5c42\u52a0 softmax \u5c06 \\(h_t\\) \u6620\u5c04\u5230\u8bcd\u6c47\u8868\u4e0a\u7684\u5206\u5e03\u3002\u8bad\u7ec3\u4f7f\u7528\u4e0e\u771f\u5b9e\u4e0b\u4e00\u8bcd\u5143\u7684\u4ea4\u53c9\u71b5\u635f\u5931\uff0c\u8fd9\u7b49\u4ef7\u4e8e\u6700\u5c0f\u5316\u56f0\u60d1\u5ea6\uff08\u6587\u4ef6 02\uff09\u3002\u5173\u952e\u5c40\u9650\u5728\u4e8e\uff1a\u56fa\u5b9a\u5927\u5c0f\u7684\u9690\u85cf\u72b6\u6001\u5fc5\u987b\u7f16\u7801\u5173\u4e8e\u5386\u53f2\u7684\u6240\u6709\u4fe1\u606f\uff0c\u65e9\u671f\u8bcd\u5143\u7684\u4fe1\u606f\u4f1a\u9010\u6e10\u88ab\u8986\u76d6\u3002</p> </li> <li> <p>\u53cc\u5411 RNN \u4ece\u4e24\u4e2a\u65b9\u5411\u5904\u7406\u5e8f\u5217\uff1a\u4e00\u4e2a RNN \u4ece\u5de6\u5230\u53f3\u8bfb\u53d6\uff0c\u53e6\u4e00\u4e2a\u4ece\u53f3\u5230\u5de6\u8bfb\u53d6\u3002\u5728\u6bcf\u4e2a\u4f4d\u7f6e \\(t\\)\uff0c\u524d\u5411\u9690\u85cf\u72b6\u6001 \\(\\overrightarrow{h}_t\\) \u548c\u540e\u5411\u9690\u85cf\u72b6\u6001 \\(\\overleftarrow{h}_t\\) \u88ab\u62fc\u63a5\u8d77\u6765\uff0c\u5f62\u6210\u4e0a\u4e0b\u6587\u611f\u77e5\u7684\u8868\u793a \\(h_t = [\\overrightarrow{h}_t ; \\overleftarrow{h}_t]\\)\u3002\u8fd9\u4f7f\u6a21\u578b\u80fd\u591f\u540c\u65f6\u8bbf\u95ee\u8fc7\u53bb\u548c\u672a\u6765\u7684\u4e0a\u4e0b\u6587\uff0c\u5bf9\u4e8e\u8bcd\u6027\u6807\u6ce8\u548c\u547d\u540d\u5b9e\u4f53\u8bc6\u522b\uff08\u6587\u4ef6 02\uff09\u7b49\u4efb\u52a1\u975e\u5e38\u6709\u6548\uff0c\u56e0\u4e3a\u8fd9\u4e9b\u4efb\u52a1\u4e2d\u4e00\u4e2a\u8bcd\u7684\u6807\u7b7e\u4f9d\u8d56\u4e8e\u5176\u524d\u540e\u7684\u8bcd\u3002\u53cc\u5411 RNN \u4e0d\u80fd\u7528\u4e8e\u8bed\u8a00\u5efa\u6a21\uff0c\u56e0\u4e3a\u5728\u9884\u6d4b\u672a\u6765\u8bcd\u5143\u65f6\u4e0d\u80fd\u7aa5\u89c6\u5b83\u4eec\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u6df1\u5c42\u5806\u53e0 RNN \u5c06\u591a\u4e2a RNN \u5c42\u53e0\u653e\u5728\u4e00\u8d77\u3002\u7b2c \\(l\\) \u5c42\u6240\u6709\u65f6\u95f4\u6b65\u7684\u9690\u85cf\u72b6\u6001\u6210\u4e3a\u7b2c \\(l+1\\) \u5c42\u7684\u8f93\u5165\u5e8f\u5217\u3002\u5806\u53e0 2-4 \u5c42\u901a\u5e38\u80fd\u901a\u8fc7\u6784\u5efa\u5c42\u6b21\u5316\u8868\u793a\u6765\u63d0\u5347\u6027\u80fd\uff0c\u7c7b\u4f3c\u4e8e\u6df1\u5c42 CNN \u6784\u5efa\u7279\u5f81\u5c42\u6b21\u7ed3\u6784\uff08\u7b2c 06 \u7ae0\uff09\u3002\u8d85\u8fc7 4 \u5c42\u65f6\uff0c\u68af\u5ea6\u6d88\u5931\u548c\u8fc7\u62df\u5408\u4f1a\u6210\u4e3a\u95ee\u9898\uff0c\u9664\u975e\u5728\u5c42\u4e4b\u95f4\u6dfb\u52a0\u6b8b\u5dee\u8fde\u63a5\u3002</p> </li> <li> <p>\u5e8f\u5217\u5230\u5e8f\u5217\uff08seq2seq\uff09\u67b6\u6784\uff08Sutskever et al., 2014\uff09\u5c06\u53ef\u53d8\u957f\u5ea6\u7684\u8f93\u5165\u5e8f\u5217\u6620\u5c04\u5230\u53ef\u53d8\u957f\u5ea6\u7684\u8f93\u51fa\u5e8f\u5217\u3002\u5b83\u7531\u4e00\u4e2a\u7f16\u7801\u5668 RNN\uff08\u8bfb\u53d6\u8f93\u5165\u5e76\u5c06\u5176\u538b\u7f29\u4e3a\u4e0a\u4e0b\u6587\u5411\u91cf\uff0c\u5373\u6700\u7ec8\u7684\u9690\u85cf\u72b6\u6001\uff09\u548c\u4e00\u4e2a\u89e3\u7801\u5668 RNN\uff08\u57fa\u4e8e\u8be5\u4e0a\u4e0b\u6587\u5411\u91cf\u9010\u6b65\u751f\u6210\u8f93\u51fa\uff09\u7ec4\u6210\u3002</p> </li> </ul> <p></p> <ul> <li> <p>Seq2seq \u662f\u673a\u5668\u7ffb\u8bd1\u7684\u7a81\u7834\u6027\u67b6\u6784\u3002\u7f16\u7801\u5668\u8bfb\u53d6\u6cd5\u8bed\u53e5\u5b50\uff0c\u89e3\u7801\u5668\u751f\u6210\u82f1\u6587\u7ffb\u8bd1\u3002\u89e3\u7801\u5668\u4ece\u4e00\u4e2a\u7279\u6b8a\u7684\u5e8f\u5217\u8d77\u59cb\u8bcd\u5143\u5f00\u59cb\uff0c\u81ea\u56de\u5f52\u5730\u751f\u6210\u8bcd\u5143\uff0c\u76f4\u5230\u4ea7\u751f\u5e8f\u5217\u7ed3\u675f\u8bcd\u5143\u3002\u4e00\u4e2a\u5b9e\u7528\u7684\u6280\u5de7\uff1a\u53cd\u8f6c\u8f93\u5165\u5e8f\u5217\uff08\u8f93\u5165 \"chat le\" \u800c\u4e0d\u662f \"le chat\"\uff09\u53ef\u4ee5\u6539\u5584\u7ed3\u679c\uff0c\u56e0\u4e3a\u8fd9\u4f7f\u5f97\u7b2c\u4e00\u4e2a\u8f93\u5165\u8bcd\u5728\u8ba1\u7b97\u56fe\u4e2d\u66f4\u9760\u8fd1\u7b2c\u4e00\u4e2a\u8f93\u51fa\u8bcd\uff0c\u7f29\u77ed\u4e86\u68af\u5ea6\u8def\u5f84\u3002</p> </li> <li> <p>\u74f6\u9888\u95ee\u9898\uff1a\u6574\u4e2a\u8f93\u5165\u5fc5\u987b\u88ab\u538b\u7f29\u5230\u4e00\u4e2a\u56fa\u5b9a\u5927\u5c0f\u7684\u5411\u91cf\u4e2d\u3002\u5bf9\u4e8e\u957f\u53e5\u5b50\uff0c\u8fd9\u4e2a\u5411\u91cf\u65e0\u6cd5\u6355\u6349\u6240\u6709\u4fe1\u606f\uff0c\u6027\u80fd\u4f1a\u4e0b\u964d\u3002\u8fd9\u63a8\u52a8\u4e86\u6ce8\u610f\u529b\u673a\u5236\u7684\u53d1\u5c55\u3002</p> </li> <li> <p>\u7b2c 06 \u7ae0\u4ecb\u7ecd\u4e86\u73b0\u4ee3\u7684\u70b9\u79ef\u6ce8\u610f\u529b Q\u3001K\u3001V \u5f62\u5f0f\u3002NLP \u4e2d\u6700\u65e9\u7684\u6ce8\u610f\u529b\u673a\u5236\u4ee5\u4e0d\u540c\u7684\u65b9\u5f0f\u63d0\u51fa\uff0c\u4f5c\u4e3a\u7f16\u7801\u5668\u548c\u89e3\u7801\u5668\u72b6\u6001\u4e4b\u95f4\u7684\u5bf9\u9f50\u6a21\u578b\u3002</p> </li> <li> <p>Bahdanau \u6ce8\u610f\u529b\uff08\u52a0\u6027\u6ce8\u610f\u529b\uff0cBahdanau et al., 2015\uff09\u4f7f\u7528\u4e00\u4e2a\u53ef\u5b66\u4e60\u7684\u524d\u9988\u7f51\u7edc\u8ba1\u7b97\u89e3\u7801\u5668\u9690\u85cf\u72b6\u6001 \\(s_t\\) \u4e0e\u6bcf\u4e2a\u7f16\u7801\u5668\u9690\u85cf\u72b6\u6001 \\(h_i\\) \u4e4b\u95f4\u7684\u5bf9\u9f50\u5206\u6570\uff1a</p> </li> </ul> \\[e_{ti} = v^T \\tanh(W_s s_{t-1} + W_h h_i)\\] <ul> <li>\u5206\u6570\u901a\u8fc7 softmax \u5f52\u4e00\u5316\u4e3a\u6ce8\u610f\u529b\u6743\u91cd\uff0c\u4e0a\u4e0b\u6587\u5411\u91cf\u662f\u7f16\u7801\u5668\u72b6\u6001\u7684\u52a0\u6743\u548c\uff1a</li> </ul> \\[\\alpha_{ti} = \\frac{\\exp(e_{ti})}{\\sum_j \\exp(e_{tj})}, \\quad c_t = \\sum_i \\alpha_{ti} h_i\\] <ul> <li> <p>\u7136\u540e\u89e3\u7801\u5668\u540c\u65f6\u4f7f\u7528 \\(s_{t-1}\\) \u548c \\(c_t\\) \u6765\u751f\u6210\u4e0b\u4e00\u4e2a\u8f93\u51fa\u3002\u5173\u952e\u6d1e\u5bdf\uff1a\u4e0d\u662f\u4e3a\u6574\u4e2a\u53e5\u5b50\u4f7f\u7528\u4e00\u4e2a\u56fa\u5b9a\u7684\u4e0a\u4e0b\u6587\u5411\u91cf\uff0c\u6bcf\u4e2a\u89e3\u7801\u6b65\u9aa4\u83b7\u5f97\u7f16\u7801\u5668\u72b6\u6001\u7684\u4e0d\u540c\u52a0\u6743\u7ec4\u5408\uff0c\u4f7f\u6a21\u578b\u80fd\u591f\"\u56de\u987e\"\u8f93\u5165\u7684\u76f8\u5173\u90e8\u5206\u3002</p> </li> <li> <p>Luong \u6ce8\u610f\u529b\uff08\u4e58\u6027\u6ce8\u610f\u529b\uff0cLuong et al., 2015\uff09\u7b80\u5316\u4e86\u5206\u6570\u8ba1\u7b97\u3002\u70b9\u79ef\u53d8\u4f53\u4f7f\u7528 \\(e_{ti} = s_t^T h_i\\)\u3002\u901a\u7528\u53d8\u4f53\u4f7f\u7528 \\(e_{ti} = s_t^T W h_i\\)\u3002\u8fd9\u4e9b\u6bd4 Bahdanau \u7684\u52a0\u6027\u5206\u6570\u66f4\u5feb\uff0c\u56e0\u4e3a\u5b83\u4eec\u4f7f\u7528\u77e9\u9635\u4e58\u6cd5\u800c\u975e\u524d\u9988\u7f51\u7edc\u3002Luong \u6ce8\u610f\u529b\u8fd8\u4ece\u5f53\u524d\u89e3\u7801\u5668\u72b6\u6001 \\(s_t\\)\uff08\u800c\u975e \\(s_{t-1}\\)\uff09\u8ba1\u7b97\u4e0a\u4e0b\u6587\u5411\u91cf\uff0c\u8fd9\u4f7f\u5f97\u5b83\u80fd\u83b7\u53d6\u66f4\u591a\u4fe1\u606f\uff0c\u4f46\u8ba1\u7b97\u65b9\u5f0f\u7565\u6709\u4e0d\u540c\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u6ce8\u610f\u529b\u6743\u91cd\u901a\u5e38\u53ef\u89c6\u5316\u4e3a\u70ed\u529b\u56fe\uff0c\u663e\u793a\u89e3\u7801\u5668\u5728\u751f\u6210\u6bcf\u4e2a\u8f93\u51fa\u8bcd\u5143\u65f6\u5173\u6ce8\u54ea\u4e9b\u8f93\u5165\u8bcd\u5143\u3002\u5728\u7ffb\u8bd1\u4e2d\uff0c\u8fd9\u4e9b\u70ed\u529b\u56fe\u5927\u81f4\u52fe\u52d2\u51fa\u6e90\u8bed\u8a00\u548c\u76ee\u6807\u8bed\u8a00\u4e4b\u95f4\u7684\u8bcd\u5bf9\u9f50\u5173\u7cfb\uff0c\u5bf9\u89d2\u6a21\u5f0f\u4f1a\u88ab\u91cd\u6392\u5e8f\u6253\u7834\uff08\u4f8b\u5982\uff0c\u5f62\u5bb9\u8bcd-\u540d\u8bcd\u987a\u5e8f\u5728\u6cd5\u8bed\u548c\u82f1\u8bed\u4e2d\u6709\u6240\u4e0d\u540c\uff09\u3002</p> </li> <li> <p>\u63a8\u7406\u65f6\uff0c\u89e3\u7801\u5668\u6bcf\u4e00\u6b65\u5fc5\u987b\u9009\u62e9\u4e00\u4e2a\u8bcd\u5143\u3002\u8d2a\u5fc3\u89e3\u7801\u5728\u6bcf\u4e2a\u4f4d\u7f6e\u9009\u62e9\u6982\u7387\u6700\u9ad8\u7684\u8bcd\u5143\uff0c\u4f46\u8fd9\u53ef\u80fd\u5bfc\u81f4\u6b21\u4f18\u5e8f\u5217\uff1a\u4e00\u4e2a\u5c40\u90e8\u597d\u7684\u9009\u62e9\u53ef\u80fd\u8feb\u4f7f\u6a21\u578b\u8fdb\u5165\u5168\u5c40\u4e0d\u4f73\u7684\u53e5\u5b50\u3002\u675f\u641c\u7d22\u5728\u6bcf\u4e00\u6b65\u7ef4\u62a4\u5206\u6570\u6700\u9ad8\u7684 \\(k\\) \u4e2a\uff08\u675f\u5bbd\uff09\u90e8\u5206\u5e8f\u5217\uff0c\u5bf9\u6bcf\u4e2a\u5e8f\u5217\u6269\u5c55\u6240\u6709\u53ef\u80fd\u7684\u4e0b\u4e00\u8bcd\u5143\uff0c\u5e76\u4fdd\u7559\u603b\u4f53\u6700\u597d\u7684 \\(k\\) \u4e2a\u3002</p> </li> <li> <p>\u5f53\u675f\u5bbd \\(k = 1\\) \u65f6\uff0c\u675f\u641c\u7d22\u9000\u5316\u4e3a\u8d2a\u5fc3\u89e3\u7801\u3002\u5178\u578b\u503c\u4e3a \\(k = 4\\) \u5230 \\(k = 10\\)\u3002\u66f4\u5927\u7684\u675f\u80fd\u627e\u5230\u66f4\u597d\u7684\u5e8f\u5217\uff0c\u4f46\u901f\u5ea6\u4f1a\u6210\u6bd4\u4f8b\u964d\u4f4e\u3002\u675f\u641c\u7d22\u8fd8\u9700\u8981\u957f\u5ea6\u5f52\u4e00\u5316\uff0c\u4ee5\u907f\u514d\u504f\u5411\u8f83\u77ed\u7684\u5e8f\u5217\uff08\u56e0\u4e3a\u8f83\u77ed\u7684\u5e8f\u5217\u4e58\u6cd5\u9879\u66f4\u5c11\uff0c\u81ea\u7136\u5177\u6709\u66f4\u9ad8\u7684\u603b\u6982\u7387\uff09\u3002\u5f52\u4e00\u5316\u540e\u7684\u5206\u6570\u4e3a\uff1a</p> </li> </ul> \\[\\text{score}(y) = \\frac{1}{|y|^\\alpha} \\sum_{t=1}^{|y|} \\log P(y_t \\mid y_{&lt;t})\\] <ul> <li> <p>\u5176\u4e2d \\(|y|\\) \u662f\u5e8f\u5217\u957f\u5ea6\uff0c\\(\\alpha\\)\uff08\u901a\u5e38\u4e3a 0.6-0.7\uff09\u63a7\u5236\u957f\u5ea6\u60e9\u7f5a\u7684\u5f3a\u5ea6\u3002\u5f53 \\(\\alpha = 0\\) \u65f6\uff0c\u6ca1\u6709\u957f\u5ea6\u5f52\u4e00\u5316\u3002\u5f53 \\(\\alpha = 1\\) \u65f6\uff0c\u5206\u6570\u662f\u6bcf\u4e2a\u8bcd\u5143\u7684\u5bf9\u6570\u6982\u7387\uff08\u51e0\u4f55\u5e73\u5747\uff09\u3002\u4e2d\u95f4\u503c\u5728\u503e\u5411\u4e8e\u7b80\u6d01\u8f93\u51fa\u548c\u4e0d\u8fc7\u65e9\u622a\u65ad\u4e4b\u95f4\u53d6\u5f97\u5e73\u8861\u3002</p> </li> <li> <p>\u867d\u7136 RNN \u987a\u5e8f\u5904\u7406\u6587\u672c\uff0c\u4f46 1D CNN \u901a\u8fc7\u5728\u8bcd\u5143\u5e8f\u5217\u4e0a\u6ed1\u52a8\u6ee4\u6ce2\u5668\u6765\u5e76\u884c\u5904\u7406\u6587\u672c\u3002\u6bcf\u4e2a\u6ee4\u6ce2\u5668\u68c0\u6d4b\u4e00\u4e2a\u5c40\u90e8\u6a21\u5f0f\uff08n-gram \u7279\u5f81\uff09\u3002</p> </li> <li> <p>TextCNN\uff08Kim, 2014\uff09\u5bf9\u8f93\u5165\u7684\u5d4c\u5165\u77e9\u9635\u5e94\u7528\u591a\u4e2a\u4e0d\u540c\u5bbd\u5ea6\uff08\u4f8b\u5982 3\u30014\u30015 \u4e2a\u8bcd\u5143\uff09\u7684\u4e00\u7ef4\u5377\u79ef\u6ee4\u6ce2\u5668\u3002\u6bcf\u4e2a\u6ee4\u6ce2\u5668\u751f\u6210\u4e00\u4e2a\u7279\u5f81\u56fe\uff0c\u65f6\u5e8f\u6700\u5927\u6c60\u5316\u4ece\u6bcf\u4e2a\u7279\u5f81\u56fe\u4e2d\u53d6\u5355\u4e00\u6700\u5927\u503c\uff0c\u6355\u83b7\u8be5\u6a21\u5f0f\u662f\u5426\u5728\u6587\u672c\u4e2d\u7684\u4efb\u4f55\u4f4d\u7f6e\u88ab\u68c0\u6d4b\u5230\uff0c\u800c\u4e0d\u8003\u8651\u4f4d\u7f6e\u3002\u6240\u6709\u6ee4\u6ce2\u5668\u7684\u6c60\u5316\u7279\u5f81\u88ab\u62fc\u63a5\u540e\u4f20\u9012\u7ed9\u5206\u7c7b\u5668\u3002</p> </li> </ul> <p></p> <ul> <li> <p>TextCNN \u901f\u5ea6\u5feb\uff0c\u5bf9\u4e8e\u60c5\u611f\u5206\u6790\u7b49\u6587\u672c\u5206\u7c7b\u4efb\u52a1\u6548\u679c\u51fa\u5947\u5730\u597d\u3002\u5b83\u80fd\u6355\u83b7\u5c40\u90e8 n-gram \u6a21\u5f0f\uff0c\u4f46\u65e0\u6cd5\u5efa\u6a21\u957f\u8ddd\u79bb\u4f9d\u8d56\uff1a\u5bbd\u5ea6\u4e3a 5 \u7684\u6ee4\u6ce2\u5668\u53ea\u80fd\u770b\u5230 5 \u4e2a\u8fde\u7eed\u7684\u8bcd\u5143\u3002\u81a8\u80c0\u56e0\u679c\u5377\u79ef\u901a\u8fc7\u5728\u6ee4\u6ce2\u5668\u5143\u7d20\u4e4b\u95f4\u63d2\u5165\u95f4\u9699\uff08\u81a8\u80c0\uff09\u6765\u89e3\u51b3\u8fd9\u4e2a\u95ee\u9898\u3002\u5806\u53e0\u81a8\u80c0\u7387\u5448\u6307\u6570\u589e\u957f\uff081\u30012\u30014\u30018\u3001...\uff09\u7684\u5c42\uff0c\u53ef\u4ee5\u5728\u4e0d\u589e\u52a0\u53c2\u6570\u7684\u60c5\u51b5\u4e0b\u6307\u6570\u7ea7\u5730\u6269\u5927\u611f\u53d7\u91ce\uff0c\u4f7f\u6a21\u578b\u80fd\u591f\u6355\u83b7\u8de8\u8d8a\u6570\u767e\u4e2a\u8bcd\u5143\u7684\u4f9d\u8d56\u5173\u7cfb\u3002</p> </li> <li> <p>\u5230\u76ee\u524d\u4e3a\u6b62\u8ba8\u8bba\u7684\u6240\u6709\u5d4c\u5165\uff08Word2Vec\u3001GloVe\u3001FastText\uff09\u9488\u5bf9\u6bcf\u4e2a\u8bcd\u7c7b\u578b\u751f\u6210\u5355\u4e00\u5411\u91cf\uff0c\u4e0e\u4e0a\u4e0b\u6587\u65e0\u5173\u3002\"Bank\"\u65e0\u8bba\u662f\u6307\u91d1\u878d\u673a\u6784\u8fd8\u662f\u6cb3\u5cb8\uff0c\u90fd\u5f97\u5230\u76f8\u540c\u7684\u5d4c\u5165\u3002\u8fd9\u662f\u4e00\u4e2a\u6839\u672c\u6027\u7684\u5c40\u9650\uff0c\u800c\u4e0a\u4e0b\u6587\u5d4c\u5165\u89e3\u51b3\u4e86\u8fd9\u4e00\u95ee\u9898\u3002</p> </li> <li> <p>ELMo\uff08Embeddings from Language Models\uff0cPeters et al., 2018\uff09\u901a\u8fc7\u5728\u8f93\u5165\u6587\u672c\u4e0a\u8fd0\u884c\u4e00\u4e2a\u6df1\u5c42\u53cc\u5411 LSTM \u8bed\u8a00\u6a21\u578b\u6765\u751f\u6210\u4e0a\u4e0b\u6587\u76f8\u5173\u7684\u8bcd\u8868\u793a\u3002\u524d\u5411 LSTM \u5728\u6bcf\u4e2a\u4f4d\u7f6e\u9884\u6d4b\u4e0b\u4e00\u4e2a\u8bcd\uff1b\u4e00\u4e2a\u72ec\u7acb\u7684\u540e\u5411 LSTM \u9884\u6d4b\u524d\u4e00\u4e2a\u8bcd\u3002\u4e24\u8005\u90fd\u5728\u5927\u89c4\u6a21\u8bed\u6599\u5e93\u4e0a\u4f5c\u4e3a\u8bed\u8a00\u6a21\u578b\u8fdb\u884c\u8bad\u7ec3\u3002</p> </li> <li> <p>\u5728\u6bcf\u4e2a\u4f4d\u7f6e \\(k\\)\uff0cELMo \u4f7f\u7528\u4efb\u52a1\u7279\u5b9a\u7684\u5b66\u4e60\u6743\u91cd\u7ec4\u5408\u6240\u6709 \\(L\\) \u5c42\u7684\u9690\u85cf\u72b6\u6001\uff1a</p> </li> </ul> \\[\\text{ELMo}_k = \\gamma \\sum_{j=0}^{L} s_j \\, h_{k,j}\\] <ul> <li> <p>\u8fd9\u91cc \\(h_{k,j}\\) \u662f\u4f4d\u7f6e \\(k\\) \u5c42 \\(j\\) \u7684\u9690\u85cf\u72b6\u6001\uff08\u5c42 0 \u662f\u539f\u59cb\u8bcd\u5d4c\u5165\uff09\uff0c\\(s_j\\) \u662f softmax \u5f52\u4e00\u5316\u7684\u6807\u91cf\u6743\u91cd\uff0c\\(\\gamma\\) \u662f\u4efb\u52a1\u7279\u5b9a\u7684\u7f29\u653e\u56e0\u5b50\u3002\u4e0d\u540c\u5c42\u6355\u83b7\u4e0d\u540c\u4fe1\u606f\uff1a\u8f83\u4f4e\u5c42\u6355\u83b7\u53e5\u6cd5\uff08\u8bcd\u6027\u6807\u6ce8\u3001\u8bcd\u5f62\u6001\uff09\uff0c\u8f83\u9ad8\u5c42\u6355\u83b7\u8bed\u4e49\uff08\u8bcd\u4e49\u3001\u8bed\u4e49\u89d2\u8272\uff09\u3002\u901a\u8fc7\u4f7f\u7528\u5b66\u4e60\u5230\u7684\u6743\u91cd\u6df7\u5408\u6240\u6709\u5c42\uff0cELMo \u5d4c\u5165\u80fd\u591f\u9002\u5e94\u591a\u6837\u5316\u7684\u4e0b\u6e38\u4efb\u52a1\u3002</p> </li> <li> <p>ELMo \u6807\u5fd7\u7740\u9884\u8bad\u7ec3\u7136\u540e\u5fae\u8c03\u8303\u5f0f\u7684\u5f00\u59cb\uff1a\u5728\u6d77\u91cf\u65e0\u6807\u6ce8\u6587\u672c\u4e0a\u8bad\u7ec3\u5927\u578b\u8bed\u8a00\u6a21\u578b\uff0c\u7136\u540e\u5c06\u5176\u8868\u793a\u7528\u4e8e\u4e0b\u6e38\u4efb\u52a1\u3002ELMo \u5177\u4f53\u4f7f\u7528\u9884\u8bad\u7ec3\u7684\u8868\u793a\u4f5c\u4e3a\u56fa\u5b9a\u7684\u6216\u8f7b\u5ea6\u5fae\u8c03\u7684\u7279\u5f81\uff0c\u4e0e\u4efb\u52a1\u7279\u5b9a\u7684\u8f93\u5165\u62fc\u63a5\u5728\u4e00\u8d77\u3002BERT \u548c GPT\uff08\u6587\u4ef6 04\uff09\u901a\u8fc7\u7aef\u5230\u7aef\u5730\u5fae\u8c03\u6574\u4e2a\u6a21\u578b\u8fdb\u4e00\u6b65\u63a8\u8fdb\u4e86\u8fd9\u4e00\u8303\u5f0f\uff0c\u4e8b\u5b9e\u8bc1\u660e\u8fd9\u8981\u6709\u6548\u5f97\u591a\u3002</p> </li> <li> <p>\u4ece Word2Vec \u5230 ELMo \u7684\u53d1\u5c55\u8fc7\u7a0b\u5c55\u793a\u4e86 NLP \u4e2d\u4e00\u4e2a\u53cd\u590d\u51fa\u73b0\u7684\u4e3b\u9898\uff1a\u4ece\u9759\u6001\u8868\u793a\u5230\u52a8\u6001\u8868\u793a\uff0c\u4ece\u5c40\u90e8\u4e0a\u4e0b\u6587\u5230\u5168\u5c40\u4e0a\u4e0b\u6587\uff0c\u4ece\u6d45\u5c42\u6a21\u578b\u5230\u6df1\u5c42\u6a21\u578b\u3002\u6bcf\u4e00\u6b65\u90fd\u4ee5\u8ba1\u7b97\u6210\u672c\u6362\u53d6\u66f4\u4e30\u5bcc\u7684\u8868\u793a\u3002Transformer\uff08\u6587\u4ef6 04\uff09\u901a\u8fc7\u7528\u6ce8\u610f\u529b\u5b8c\u5168\u53d6\u4ee3\u5faa\u73af\uff0c\u5b9e\u73b0\u4e86\u6df1\u5c42\u4e0a\u4e0b\u6587\u5316\u548c\u5e76\u884c\u8ba1\u7b97\uff0c\u5b8c\u6210\u4e86\u8fd9\u4e00\u6f14\u8fdb\u3002</p> </li> </ul>"},{"location":"chapter%2007%3A%20computational%20linguistics/03.%20embeddings%20and%20sequence%20models/#colab-notebook","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ol> <li> <p>\u4ece\u5934\u5b9e\u73b0\u5e26\u8d1f\u91c7\u6837\u7684 Word2Vec skip-gram\u3002\u5728\u5c0f\u578b\u8bed\u6599\u5e93\u4e0a\u8bad\u7ec3\uff0c\u5e76\u4f7f\u7528 PCA \u53ef\u89c6\u5316\u5b66\u4e60\u5230\u7684\u5d4c\u5165\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u5c0f\u578b\u8bed\u6599\u5e93\ncorpus = \"\"\"the king ruled the kingdom . the queen ruled the kingdom .\nthe prince is the son of the king . the princess is the daughter of the queen .\na man worked in the castle . a woman worked in the castle .\nthe king and queen lived in the castle . the prince and princess played outside .\"\"\".lower().split()\n\nvocab = sorted(set(corpus))\nword2idx = {w: i for i, w in enumerate(vocab)}\nidx2word = {i: w for w, i in word2idx.items()}\nV = len(vocab)\n\n# \u751f\u6210 skip-gram \u5bf9\uff0c\u7a97\u53e3\u5927\u5c0f\u4e3a 2\nwindow = 2\npairs = []\nfor i, word in enumerate(corpus):\n    for j in range(max(0, i - window), min(len(corpus), i + window + 1)):\n        if i != j:\n            pairs.append((word2idx[word], word2idx[corpus[j]]))\n\npairs = jnp.array(pairs)\nprint(f\"\u8bcd\u6c47\u8868\u5927\u5c0f: {V} \u4e2a\u8bcd, \u8bad\u7ec3\u6837\u672c\u6570: {len(pairs)}\")\n\n# \u6a21\u578b\u53c2\u6570\nembed_dim = 16\nkey = jax.random.PRNGKey(42)\nk1, k2 = jax.random.split(key)\nW_in = jax.random.normal(k1, (V, embed_dim)) * 0.1    # \u8f93\u5165\u5d4c\u5165\nW_out = jax.random.normal(k2, (V, embed_dim)) * 0.1   # \u8f93\u51fa\u5d4c\u5165\n\n# \u5355\u4e2a\u6837\u672c\u5bf9\u7684\u8d1f\u91c7\u6837\u635f\u5931\ndef neg_sampling_loss(W_in, W_out, target, context, neg_ids):\n    v_in = W_in[target]      # (embed_dim,)\n    v_out = W_out[context]   # (embed_dim,)\n    v_neg = W_out[neg_ids]   # (k, embed_dim)\n\n    pos_loss = -jax.nn.log_sigmoid(jnp.dot(v_in, v_out))\n    neg_loss = -jnp.sum(jax.nn.log_sigmoid(-v_neg @ v_in))\n    return pos_loss + neg_loss\n\n# \u8bad\u7ec3\u5faa\u73af\nnum_neg = 5\nlr = 0.05\n\n@jax.jit\ndef train_step(W_in, W_out, target, context, neg_ids):\n    loss, (g_in, g_out) = jax.value_and_grad(neg_sampling_loss, argnums=(0, 1))(\n        W_in, W_out, target, context, neg_ids)\n    return loss, W_in - lr * g_in, W_out - lr * g_out\n\nkey = jax.random.PRNGKey(0)\nfor epoch in range(50):\n    total_loss = 0.0\n    for i in range(len(pairs)):\n        key, subkey = jax.random.split(key)\n        neg_ids = jax.random.randint(subkey, (num_neg,), 0, V)\n        loss, W_in, W_out = train_step(W_in, W_out, pairs[i, 0], pairs[i, 1], neg_ids)\n        total_loss += loss\n    if (epoch + 1) % 10 == 0:\n        print(f\"Epoch {epoch+1}: avg loss = {total_loss / len(pairs):.4f}\")\n\n# \u4f7f\u7528 PCA \u53ef\u89c6\u5316\uff08\u7b2c 01 \u7ae0\uff09\nembeddings = W_in\nmean = embeddings.mean(axis=0)\ncentered = embeddings - mean\nU, S, Vt = jnp.linalg.svd(centered, full_matrices=False)\ncoords = centered @ Vt[:2].T  # \u6295\u5f71\u5230\u524d\u4e24\u4e2a\u4e3b\u6210\u5206\n\nplt.figure(figsize=(10, 8))\nfor i, word in idx2word.items():\n    plt.scatter(coords[i, 0], coords[i, 1], c='#3498db', s=40)\n    plt.annotate(word, (coords[i, 0] + 0.02, coords[i, 1] + 0.02), fontsize=9)\nplt.title(\"Word2Vec Skip-gram \u5d4c\u5165\uff08PCA \u6295\u5f71\uff09\")\nplt.grid(alpha=0.3); plt.show()\n</code></pre></p> </li> <li> <p>\u6784\u5efa\u4e00\u4e2a\u5b57\u7b26\u7ea7 RNN \u8bed\u8a00\u6a21\u578b\uff0c\u4ece\u4e00\u5c0f\u6bb5\u8bad\u7ec3\u6587\u672c\u4e2d\u5b66\u4e60\u751f\u6210\u6587\u672c\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\n# \u5c0f\u578b\u8bad\u7ec3\u6587\u672c\ntext = \"to be or not to be that is the question \"\nchars = sorted(set(text))\nchar2idx = {c: i for i, c in enumerate(chars)}\nidx2char = {i: c for c, i in char2idx.items()}\nV = len(chars)\ndata = jnp.array([char2idx[c] for c in text])\n\n# RNN \u53c2\u6570\nhidden_dim = 64\nkey = jax.random.PRNGKey(0)\nk1, k2, k3, k4, k5 = jax.random.split(key, 5)\n\nparams = {\n    'Wx': jax.random.normal(k1, (V, hidden_dim)) * 0.1,\n    'Wh': jax.random.normal(k2, (hidden_dim, hidden_dim)) * 0.05,\n    'bh': jnp.zeros(hidden_dim),\n    'Wy': jax.random.normal(k3, (hidden_dim, V)) * 0.1,\n    'by': jnp.zeros(V),\n}\n\ndef rnn_step(params, h, x_idx):\n    x = jnp.eye(V)[x_idx]  # one-hot \u7f16\u7801\n    h = jnp.tanh(x @ params['Wx'] + h @ params['Wh'] + params['bh'])\n    logits = h @ params['Wy'] + params['by']\n    return h, logits\n\ndef loss_fn(params, inputs, targets):\n    h = jnp.zeros(hidden_dim)\n    total_loss = 0.0\n    for t in range(len(inputs)):\n        h, logits = rnn_step(params, h, inputs[t])\n        log_probs = jax.nn.log_softmax(logits)\n        total_loss -= log_probs[targets[t]]\n    return total_loss / len(inputs)\n\ngrad_fn = jax.jit(jax.grad(loss_fn))\n\n# \u8bad\u7ec3\ninputs = data[:-1]\ntargets = data[1:]\nlr = 0.01\n\nfor step in range(500):\n    grads = grad_fn(params, inputs, targets)\n    params = {k: params[k] - lr * grads[k] for k in params}\n    if (step + 1) % 100 == 0:\n        l = loss_fn(params, inputs, targets)\n        print(f\"Step {step+1}: loss = {l:.4f}\")\n\n# \u751f\u6210\u6587\u672c\ndef generate(params, seed_char, length=60):\n    h = jnp.zeros(hidden_dim)\n    idx = char2idx[seed_char]\n    result = [seed_char]\n    key = jax.random.PRNGKey(42)\n    for _ in range(length):\n        h, logits = rnn_step(params, h, idx)\n        key, subkey = jax.random.split(key)\n        idx = jax.random.categorical(subkey, logits)\n        result.append(idx2char[int(idx)])\n    return ''.join(result)\n\nprint(f\"\\n\u751f\u6210\u6587\u672c: {generate(params, 't')}\")\n</code></pre></p> </li> <li> <p>\u5b9e\u73b0\u4e00\u4e2a\u5e26 Bahdanau \u6ce8\u610f\u529b\u7684\u7b80\u6613 seq2seq \u6a21\u578b\uff0c\u7528\u4e8e\u5e8f\u5217\u53cd\u8f6c\u3002\u53ef\u89c6\u5316\u6ce8\u610f\u529b\u5bf9\u9f50\u77e9\u9635\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u4efb\u52a1\uff1a\u53cd\u8f6c\u6570\u5b57\u5e8f\u5217\uff08\u4f8b\u5982\uff0c[3, 1, 4] -&gt; [4, 1, 3]\uff09\nvocab_size = 10  # \u6570\u5b57 0-9\nSOS, EOS = 10, 11  # \u7279\u6b8a\u8bcd\u5143\ntotal_vocab = 12\nembed_dim, hidden_dim = 16, 32\nmax_len = 5\n\nkey = jax.random.PRNGKey(42)\nkeys = jax.random.split(key, 8)\n\nparams = {\n    'embed': jax.random.normal(keys[0], (total_vocab, embed_dim)) * 0.1,\n    'enc_Wx': jax.random.normal(keys[1], (embed_dim, hidden_dim)) * 0.1,\n    'enc_Wh': jax.random.normal(keys[2], (hidden_dim, hidden_dim)) * 0.05,\n    'dec_Wx': jax.random.normal(keys[3], (embed_dim, hidden_dim)) * 0.1,\n    'dec_Wh': jax.random.normal(keys[4], (hidden_dim, hidden_dim)) * 0.05,\n    # Bahdanau \u6ce8\u610f\u529b\n    'Ws': jax.random.normal(keys[5], (hidden_dim, hidden_dim)) * 0.1,\n    'Wh_att': jax.random.normal(keys[6], (hidden_dim, hidden_dim)) * 0.1,\n    'v_att': jax.random.normal(keys[7], (hidden_dim,)) * 0.1,\n    # \u8f93\u51fa\u6295\u5f71\uff08\u4ece\u9690\u85cf\u72b6\u6001+\u4e0a\u4e0b\u6587\u5230\u8bcd\u6c47\u8868\uff09\n    'Wo': jax.random.normal(keys[0], (hidden_dim * 2, total_vocab)) * 0.1,\n}\n\ndef encode(params, seq):\n    \"\"\"\u7f16\u7801\u8f93\u5165\u5e8f\u5217\uff0c\u8fd4\u56de\u6240\u6709\u9690\u85cf\u72b6\u6001\u3002\"\"\"\n    h = jnp.zeros(hidden_dim)\n    states = []\n    for t in range(len(seq)):\n        x = params['embed'][seq[t]]\n        h = jnp.tanh(x @ params['enc_Wx'] + h @ params['enc_Wh'])\n        states.append(h)\n    return jnp.stack(states), h\n\ndef bahdanau_attention(params, dec_state, enc_states):\n    \"\"\"\u8ba1\u7b97 Bahdanau \u6ce8\u610f\u529b\u6743\u91cd\u548c\u4e0a\u4e0b\u6587\u5411\u91cf\u3002\"\"\"\n    scores = jnp.tanh(enc_states @ params['Wh_att'] + dec_state @ params['Ws'])\n    e = scores @ params['v_att']  # (src_len,)\n    alpha = jax.nn.softmax(e)\n    context = alpha @ enc_states\n    return context, alpha\n\ndef decode_step(params, dec_h, prev_token, enc_states):\n    x = params['embed'][prev_token]\n    dec_h = jnp.tanh(x @ params['dec_Wx'] + dec_h @ params['dec_Wh'])\n    context, alpha = bahdanau_attention(params, dec_h, enc_states)\n    combined = jnp.concatenate([dec_h, context])\n    logits = combined @ params['Wo']\n    return dec_h, logits, alpha\n\ndef seq2seq_loss(params, src, tgt):\n    enc_states, enc_final = encode(params, src)\n    dec_h = enc_final\n    loss = 0.0\n    prev_token = SOS\n    for t in range(len(tgt)):\n        dec_h, logits, _ = decode_step(params, dec_h, prev_token, enc_states)\n        log_probs = jax.nn.log_softmax(logits)\n        loss -= log_probs[tgt[t]]\n        prev_token = tgt[t]\n    return loss / len(tgt)\n\n# \u751f\u6210\u8bad\u7ec3\u6570\u636e\uff1a\u53cd\u8f6c\u5e8f\u5217\nkey = jax.random.PRNGKey(0)\ntrain_srcs, train_tgts = [], []\nfor _ in range(200):\n    key, subkey = jax.random.split(key)\n    length = jax.random.randint(subkey, (), 3, max_len + 1)\n    key, subkey = jax.random.split(key)\n    seq = jax.random.randint(subkey, (int(length),), 0, vocab_size)\n    train_srcs.append(seq)\n    train_tgts.append(seq[::-1])  # \u53cd\u8f6c\n\n# \u8bad\u7ec3\ngrad_fn = jax.grad(seq2seq_loss)\nlr = 0.01\n\nfor epoch in range(100):\n    total_loss = 0.0\n    for src, tgt in zip(train_srcs, train_tgts):\n        grads = grad_fn(params, src, tgt)\n        params = {k: params[k] - lr * grads[k] for k in params}\n        total_loss += seq2seq_loss(params, src, tgt)\n    if (epoch + 1) % 20 == 0:\n        print(f\"Epoch {epoch+1}: avg loss = {total_loss / len(train_srcs):.4f}\")\n\n# \u53ef\u89c6\u5316\u4e00\u4e2a\u793a\u4f8b\u7684\u6ce8\u610f\u529b\ntest_src = jnp.array([3, 1, 4, 1, 5])\ntest_tgt = test_src[::-1]\n\nenc_states, enc_final = encode(params, test_src)\ndec_h = enc_final\nattentions = []\nprev_token = SOS\nfor t in range(len(test_tgt)):\n    dec_h, logits, alpha = decode_step(params, dec_h, prev_token, enc_states)\n    attentions.append(alpha)\n    prev_token = test_tgt[t]\n\natt_matrix = jnp.stack(attentions)\nfig, ax = plt.subplots(figsize=(6, 5))\nim = ax.imshow(att_matrix, cmap='Blues')\nax.set_xlabel(\"\u6e90\u4f4d\u7f6e\"); ax.set_ylabel(\"\u76ee\u6807\u4f4d\u7f6e\")\nsrc_labels = [str(int(x)) for x in test_src]\ntgt_labels = [str(int(x)) for x in test_tgt]\nax.set_xticks(range(len(src_labels))); ax.set_xticklabels(src_labels)\nax.set_yticks(range(len(tgt_labels))); ax.set_yticklabels(tgt_labels)\nfor i in range(len(tgt_labels)):\n    for j in range(len(src_labels)):\n        ax.text(j, i, f\"{att_matrix[i,j]:.2f}\", ha='center', va='center', fontsize=9)\nax.set_title(\"Bahdanau \u6ce8\u610f\u529b\u5bf9\u9f50\uff08\u5e8f\u5217\u53cd\u8f6c\uff09\")\nplt.colorbar(im); plt.tight_layout(); plt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2007%3A%20computational%20linguistics/04.%20transformers%20and%20language%20models/","title":"Transformer\u4e0e\u8bed\u8a00\u6a21\u578b","text":"<p>Transformer\u7528\u81ea\u6ce8\u610f\u529b\u53d6\u4ee3\u4e86\u5faa\u73af\u7ed3\u6784\uff0c\u6210\u4e3a\u8bed\u8a00\u7406\u89e3\u548c\u751f\u6210\u7684\u4e3b\u5bfc\u67b6\u6784\u3002\u672c\u6587\u4ef6\u6db5\u76d6BERT\u3001GPT\u3001T5\u3001\u4f4d\u7f6e\u7f16\u7801\uff08\u6b63\u5f26\u7f16\u7801\u3001RoPE\uff09\u3001\u9884\u8bad\u7ec3\u76ee\u6807\uff08MLM\u3001CLM\uff09\u3001\u5fae\u8c03\u3001\u63d0\u793a\u5de5\u7a0b\u548c\u7f29\u653e\u5b9a\u5f8b\u2014\u2014\u8fd9\u4e9b\u662f\u73b0\u4ee3\u5927\u8bed\u8a00\u6a21\u578b\u80cc\u540e\u7684\u84dd\u56fe\u3002</p> <ul> <li> <p>\u5728\u7b2c06\u7ae0\u4e2d\uff0c\u6211\u4eec\u4ecb\u7ecd\u4e86Transformer\u67b6\u6784\uff1a\u81ea\u6ce8\u610f\u529b\u3001\u591a\u5934\u6ce8\u610f\u529b\u3001\u4f4d\u7f6e\u7f16\u7801\u4ee5\u53ca\u7f16\u7801\u5668-\u89e3\u7801\u5668\u7ed3\u6784\u3002\u8fd9\u91cc\u6211\u4eec\u805a\u7126\u4e8eTransformer\u5982\u4f55\u9002\u914d\u7279\u5b9a\u7684NLP\u8303\u5f0f\u3001\u5b9a\u4e49\u73b0\u4ee3NLP\u7684\u6a21\u578b\uff08BERT\u3001GPT\u3001T5\uff09\uff0c\u4ee5\u53ca\u8ba9\u5b83\u4eec\u5728\u5927\u89c4\u6a21\u4e0b\u5207\u5b9e\u53ef\u884c\u7684\u6280\u672f\u3002</p> </li> <li> <p>\u56de\u987e\u6838\u5fc3\u64cd\u4f5c\uff1a\u7f29\u653e\u70b9\u79ef\u6ce8\u610f\u529b\u8ba1\u7b97 \\(\\text{softmax}(QK^T / \\sqrt{d_k}) V\\)\uff0c\u5176\u4e2d\u67e5\u8be2\u3001\u952e\u548c\u503c\u90fd\u662f\u8f93\u5165\u7684\u7ebf\u6027\u6295\u5f71\u3002\u591a\u5934\u6ce8\u610f\u529b\u5e76\u884c\u8fd0\u884c \\(h\\) \u4e2a\u6ce8\u610f\u529b\u5934\uff0c\u6bcf\u4e2a\u5934\u4f7f\u7528\u4e0d\u540c\u7684\u5b66\u4e60\u6295\u5f71\uff0c\u7136\u540e\u5c06\u7ed3\u679c\u62fc\u63a5\u8d77\u6765\u3002Transformer\u5757\u901a\u8fc7\u6b8b\u5dee\u8fde\u63a5\u3001\u5c42\u5f52\u4e00\u5316\u548c\u9010\u4f4d\u7f6e\u524d\u9988\u7f51\u7edc\uff08\u7b2c06\u7ae0\uff09\u5c06\u8fd9\u4e00\u5207\u5305\u88f9\u8d77\u6765\u3002</p> </li> <li> <p>\u4e00\u4e2a\u5fae\u5999\u4f46\u91cd\u8981\u7684\u67b6\u6784\u9009\u62e9\u662f\u5c42\u5f52\u4e00\u5316\u7684\u653e\u7f6e\u4f4d\u7f6e\u3002\u539f\u59cbTransformer\u4f7f\u7528\u540e\u5f52\u4e00\u5316\uff1a\u6b8b\u5dee\u548c\u5f52\u4e00\u5316\u5728\u5b50\u5c42\u4e4b\u540e\u6267\u884c\uff0c\u5373 \\(\\text{LayerNorm}(x + \\text{Sublayer}(x))\\)\u3002</p> </li> <li> <p>\u5927\u591a\u6570\u73b0\u4ee3\u6a21\u578b\u4f7f\u7528\u524d\u5f52\u4e00\u5316\uff1a\u5728\u5b50\u5c42\u4e4b\u524d\u8fdb\u884c\u5f52\u4e00\u5316\uff0c\u5373 \\(x + \\text{Sublayer}(\\text{LayerNorm}(x))\\)\u3002\u524d\u5f52\u4e00\u5316\u5728\u8bad\u7ec3\u8fc7\u7a0b\u4e2d\u66f4\u52a0\u7a33\u5b9a\uff0c\u56e0\u4e3a\u6b8b\u5dee\u8fde\u63a5\u76f4\u63a5\u5c06\u68af\u5ea6\u901a\u8fc7\u6052\u7b49\u8def\u5f84\u4f20\u9012\uff0c\u4e0d\u53d7\u5f52\u4e00\u5316\u7684\u5f71\u54cd\u3002\u8fd9\u4f7f\u5f97\u8bad\u7ec3\u975e\u5e38\u6df1\u7684\u6a21\u578b\u53d8\u5f97\u66f4\u5bb9\u6613\uff0c\u65e0\u9700\u4ed4\u7ec6\u7684\u5b66\u4e60\u7387\u9884\u70ed\u3002</p> </li> <li> <p>\u6bcf\u4e2aTransformer\u5757\u4e2d\u7684\u524d\u9988\u5b50\u5c42\u662f\u4e00\u4e2a\u4e24\u5c42MLP\uff0c\u72ec\u7acb\u5e94\u7528\u4e8e\u6bcf\u4e2a\u6807\u8bb0\u4f4d\u7f6e\uff1a</p> </li> </ul> \\[\\text{FFN}(x) = W_2 \\cdot \\text{GELU}(W_1 x + b_1) + b_2\\] <ul> <li> <p>\u5185\u90e8\u7ef4\u5ea6\u901a\u5e38\u662f\u6a21\u578b\u7ef4\u5ea6\u76844\u500d\uff08\u4f8b\u5982\uff0c\\(d_{\\text{model}} = 768\\)\uff0c\\(d_{\\text{ff}} = 3072\\)\uff09\u3002\u8fd9\u4e2aFFN\u7ea6\u5360\u6bcf\u4e2a\u5757\u4e2d\u53c2\u6570\u7684\u4e09\u5206\u4e4b\u4e8c\uff0c\u88ab\u8ba4\u4e3a\u8d77\u5230\u952e-\u503c\u8bb0\u5fc6\u7684\u4f5c\u7528\uff0c\u5b58\u50a8\u8bad\u7ec3\u8fc7\u7a0b\u4e2d\u5b66\u5230\u7684\u4e8b\u5b9e\u77e5\u8bc6\u3002</p> </li> <li> <p>\u4f4d\u7f6e\u7f16\u7801\u4e3a\u6a21\u578b\u63d0\u4f9b\u6807\u8bb0\u987a\u5e8f\u7684\u4fe1\u606f\uff0c\u56e0\u4e3a\u6ce8\u610f\u529b\u672c\u8eab\u662f\u7f6e\u6362\u7b49\u53d8\u7684\u3002\u539f\u59cb\u7684\u6b63\u5f26\u7f16\u7801\uff08\u7b2c06\u7ae0\uff09\u4f7f\u7528\u4e0d\u540c\u9891\u7387\u7684\u56fa\u5b9a\u6b63\u5f26\u548c\u4f59\u5f26\u51fd\u6570\u3002\u53ef\u5b66\u4e60\u4f4d\u7f6e\u5d4c\u5165\u5219\u7b80\u5355\u5730\u4e3a\u6bcf\u4e2a\u4f4d\u7f6e\u6dfb\u52a0\u4e00\u4e2a\u53ef\u8bad\u7ec3\u5411\u91cf\uff08\u7528\u4e8eBERT\u548cGPT-2\uff09\u3002\u4e24\u8005\u90fd\u662f\u7edd\u5bf9\u7f16\u7801\uff1a\u65e0\u8bba\u4e0a\u4e0b\u6587\u5982\u4f55\uff0c\u4f4d\u7f6e5\u603b\u662f\u5f97\u5230\u76f8\u540c\u7684\u5411\u91cf\u3002</p> </li> <li> <p>\u65cb\u8f6c\u4f4d\u7f6e\u7f16\u7801\uff08RoPE\uff09\u901a\u8fc7\u5728\u4e8c\u7ef4\u5b50\u7a7a\u95f4\u4e2d\u65cb\u8f6c\u67e5\u8be2\u548c\u952e\u5411\u91cf\u6765\u7f16\u7801\u4f4d\u7f6e\u3002\u5bf9\u4e8e\u4e00\u5bf9\u7ef4\u5ea6 \\((q_{2i}, q_{2i+1})\\)\uff0c\u6309\u89d2\u5ea6 \\(m\\theta_i\\) \u7684\u65cb\u8f6c\uff08\u5176\u4e2d \\(m\\) \u662f\u4f4d\u7f6e\uff0c\\(\\theta_i = 10000^{-2i/d}\\)\uff09\u5e94\u7528\u5982\u4e0b\uff1a</p> </li> </ul> \\[ \\begin{bmatrix} q'_{2i} \\\\ q'_{2i+1} \\end{bmatrix} = \\begin{bmatrix} \\cos m\\theta_i &amp; -\\sin m\\theta_i \\\\ \\sin m\\theta_i &amp; \\cos m\\theta_i \\end{bmatrix} \\begin{bmatrix} q_{2i} \\\\ q_{2i+1} \\end{bmatrix} \\] <p></p> <ul> <li> <p>RoPE\u7684\u7cbe\u5999\u4e4b\u5904\u5728\u4e8e\uff0c\u65cb\u8f6c\u540e\u7684\u67e5\u8be2\u548c\u952e\u4e4b\u95f4\u7684\u70b9\u79ef \\(q'^T k'\\) \u4ec5\u4f9d\u8d56\u4e8e\u76f8\u5bf9\u4f4d\u7f6e \\(m - n\\)\uff0c\u800c\u975e\u7edd\u5bf9\u4f4d\u7f6e\u3002</p> </li> <li> <p>\u4e3a\u4e86\u7406\u89e3\u539f\u56e0\uff0c\u5c06\u65cb\u8f6c\u5199\u4e3a \\(q' = R_m q\\) \u548c \\(k' = R_n k\\)\uff0c\u5176\u4e2d \\(R_m\\) \u662f\u4e00\u4e2a\u5757\u5bf9\u89d2\u65cb\u8f6c\u77e9\u9635\u3002\u6ce8\u610f\u529b\u5206\u6570\u53d8\u4e3a\uff1a</p> </li> </ul> \\[q'^T k' = (R_m q)^T (R_n k) = q^T R_m^T R_n \\, k = q^T R_{n-m} \\, k\\] <ul> <li> <p>\u6700\u540e\u4e00\u6b65\u5229\u7528\u4e86\u65cb\u8f6c\u7fa4\u6027\u8d28\uff1a\\(R_m^T R_n = R_{n-m}\\)\uff08\u5148\u5411\u540e\u65cb\u8f6c \\(m\\) \u518d\u5411\u524d\u65cb\u8f6c \\(n\\)\uff0c\u7b49\u4ef7\u4e8e\u65cb\u8f6c \\(n - m\\)\uff09\u3002</p> </li> <li> <p>\u8fd9\u610f\u5473\u7740\u6ce8\u610f\u529b\u5206\u6570\u4ec5\u4f9d\u8d56\u4e8e\u76f8\u5bf9\u8ddd\u79bb \\(n - m\\)\uff0c\u800c\u975e\u7edd\u5bf9\u4f4d\u7f6e \\(m\\) \u548c \\(n\\) \u672c\u8eab\u3002</p> </li> <li> <p>\u6a21\u578b\u65e0\u9700\u4efb\u4f55\u5b66\u4e60\u7684\u4f4d\u7f6e\u53c2\u6570\u5c31\u80fd\u83b7\u5f97\u81ea\u7136\u7684\u8ddd\u79bb\u6982\u5ff5\uff0c\u5e76\u4e14\u53ef\u4ee5\u6cdb\u5316\u5230\u8bad\u7ec3\u65f6\u672a\u89c1\u8fc7\u7684\u5e8f\u5217\u957f\u5ea6\u3002</p> </li> <li> <p>ALiBi\uff08\u5e26\u7ebf\u6027\u504f\u7f6e\u7684\u6ce8\u610f\u529b\uff09\u91c7\u7528\u4e86\u4e00\u79cd\u66f4\u7b80\u5355\u7684\u65b9\u6cd5\uff1a\u5b83\u6839\u636e\u8ddd\u79bb\u5411\u6ce8\u610f\u529b\u5206\u6570\u6dfb\u52a0\u4e00\u4e2a\u56fa\u5b9a\u7684\u7ebf\u6027\u60e9\u7f5a\uff0c\u5373 \\(\\text{score}_{ij} = q_i^T k_j - m \\cdot |i - j|\\)\uff0c\u5176\u4e2d \\(m\\) \u662f\u6bcf\u4e2a\u5934\u7279\u5b9a\u7684\u659c\u7387\u3002\u4e0d\u540c\u7684\u5934\u4f7f\u7528\u4e0d\u540c\u7684\u659c\u7387\uff0c\u4f7f\u4e00\u4e9b\u5934\u53ef\u4ee5\u5173\u6ce8\u5c40\u90e8\u4fe1\u606f\uff0c\u53e6\u4e00\u4e9b\u5934\u5173\u6ce8\u5168\u5c40\u4fe1\u606f\u3002ALiBi\u4e0d\u9700\u8981\u4efb\u4f55\u53ef\u5b66\u4e60\u7684\u4f4d\u7f6e\u53c2\u6570\uff0c\u5e76\u4e14\u80fd\u591f\u5f88\u597d\u5730\u6cdb\u5316\u5230\u6bd4\u8bad\u7ec3\u65f6\u66f4\u957f\u7684\u5e8f\u5217\u3002</p> </li> <li> <p>\u57fa\u4e8eTransformer\u7684\u8bed\u8a00\u6a21\u578b\u7684\u4e09\u79cd\u4e3b\u5bfc\u8303\u5f0f\u662f\u4ec5\u7f16\u7801\u5668\u3001\u4ec5\u89e3\u7801\u5668\u548c\u7f16\u7801\u5668-\u89e3\u7801\u5668\u3002\u5b83\u4eec\u5728\u6a21\u578b\u80fd\u770b\u5230\u7684\u8303\u56f4\uff08\u6ce8\u610f\u529b\u63a9\u7801\uff09\u4ee5\u53ca\u8bad\u7ec3\u65b9\u5f0f\u4e0a\u6709\u6240\u4e0d\u540c\u3002</p> </li> </ul> <p></p> <ul> <li> <p>BERT\uff08\u6765\u81eaTransformer\u7684\u53cc\u5411\u7f16\u7801\u5668\u8868\u793a\uff0cDevlin\u7b49\u4eba\uff0c2019\uff09\u662f\u5178\u578b\u7684\u4ec5\u7f16\u7801\u5668\u6a21\u578b\u3002\u5b83\u4f7f\u7528\u5b8c\u5168\u7684\u53cc\u5411\u6ce8\u610f\u529b\u5904\u7406\u6587\u672c\uff1a\u6bcf\u4e2a\u6807\u8bb0\u53ef\u4ee5\u5173\u6ce8\u6240\u6709\u5176\u4ed6\u6807\u8bb0\uff0c\u5305\u62ec\u5de6\u53f3\u4e24\u4fa7\u3002\u8fd9\u8d4b\u4e88\u4e86BERT\u4e30\u5bcc\u7684\u4e0a\u4e0b\u6587\u8868\u793a\uff0c\u4f46\u610f\u5473\u7740\u5b83\u4e0d\u80fd\u81ea\u56de\u5f52\u5730\u751f\u6210\u6587\u672c\u3002</p> </li> <li> <p>BERT\u901a\u8fc7\u4e24\u4e2a\u76ee\u6807\u8fdb\u884c\u9884\u8bad\u7ec3\u3002\u63a9\u7801\u8bed\u8a00\u5efa\u6a21\uff08MLM\uff09\u968f\u673a\u906e\u853d15%\u7684\u8f93\u5165\u6807\u8bb0\uff0c\u5e76\u8bad\u7ec3\u6a21\u578b\u53bb\u9884\u6d4b\u5b83\u4eec\u3002\u5728\u88ab\u9009\u4e2d\u7684\u6807\u8bb0\u4e2d\uff0c80%\u88ab\u66ff\u6362\u4e3a[MASK]\u6807\u8bb0\uff0c10%\u88ab\u66ff\u6362\u4e3a\u968f\u673a\u8bcd\uff0c10%\u4fdd\u6301\u4e0d\u53d8\uff08\u4ee5\u9632\u6b62\u6a21\u578b\u53ea\u5b66\u4f1a\u5728\u770b\u5230[MASK]\u65f6\u624d\u8fdb\u884c\u9884\u6d4b\uff09\u3002\u8bad\u7ec3\u76ee\u6807\u5982\u4e0b\uff1a</p> </li> </ul> \\[\\mathcal{L}_{\\text{MLM}} = -\\sum_{i \\in \\mathcal{M}} \\log P(w_i \\mid w_{\\backslash \\mathcal{M}})\\] <ul> <li>\u5176\u4e2d \\(\\mathcal{M}\\) \u662f\u88ab\u906e\u853d\u7684\u4f4d\u7f6e\u96c6\u5408\uff0c\\(w_{\\backslash \\mathcal{M}}\\) \u662f\u8fd9\u4e9b\u4f4d\u7f6e\u88ab\u906e\u853d\u540e\u7684\u53e5\u5b50\u3002\u8fd9\u662f\u4e00\u4e2a\u53bb\u566a\u76ee\u6807\uff1a\u6a21\u578b\u5b66\u4e60\u91cd\u5efa\u88ab\u7834\u574f\u7684\u8f93\u5165\u3002</li> </ul> <p></p> <ul> <li> <p>\u4e0b\u4e00\u53e5\u9884\u6d4b\uff08NSP\uff09\u8bad\u7ec3BERT\u9884\u6d4b\u4e24\u4e2a\u53e5\u5b50\u5728\u539f\u59cb\u6587\u672c\u4e2d\u662f\u5426\u8fde\u7eed\u3002\u8f93\u5165\u5f00\u5934\u7684\u7279\u6b8a[CLS]\u6807\u8bb0\u7528\u4e8e\u6b64\u4e8c\u5206\u7c7b\u3002NSP\u7684\u52a0\u5165\u662f\u4e3a\u4e86\u5e2e\u52a9\u7406\u89e3\u53e5\u5b50\u5173\u7cfb\u7684\u4efb\u52a1\uff08\u5982\u95ee\u7b54\uff09\uff0c\u4e0d\u8fc7\u540e\u6765\u7684\u5de5\u4f5c\uff08RoBERTa\uff09\u8868\u660e\u5176\u8d21\u732e\u5f88\u5c0f\uff0c\u53ef\u4ee5\u53bb\u6389\u3002</p> </li> <li> <p>BERT\u7684\u9884\u8bad\u7ec3\u8868\u793a\u901a\u8fc7\u5728\u5176\u9876\u90e8\u6dfb\u52a0\u7279\u5b9a\u4efb\u52a1\u7684\u5934\u90e8\uff08\u4e00\u4e2a\u7b80\u5355\u7684\u7ebf\u6027\u5c42\uff09\u5e76\u5fae\u8c03\u6574\u4e2a\u6a21\u578b\u6765\u9002\u5e94\u4e0b\u6e38\u4efb\u52a1\u3002\u5bf9\u4e8e\u5206\u7c7b\u4efb\u52a1\uff0c\u4f7f\u7528[CLS]\u6807\u8bb0\u7684\u8868\u793a\u3002\u5bf9\u4e8e\u6807\u8bb0\u7ea7\u4efb\u52a1\uff08\u547d\u540d\u5b9e\u4f53\u8bc6\u522b\u3001\u8bcd\u6027\u6807\u6ce8\uff09\uff0c\u4f7f\u7528\u6bcf\u4e2a\u6807\u8bb0\u7684\u8868\u793a\u3002\u8fd9\u79cd\u5fae\u8c03\u65b9\u6cd5\u5c06\u9884\u8bad\u7ec3\u671f\u95f4\u5b66\u5230\u7684\u8bed\u8a00\u77e5\u8bc6\u8fc1\u79fb\u5230\u65b0\u4efb\u52a1\u4e0a\uff0c\u53ea\u9700\u76f8\u5bf9\u8f83\u5c11\u7684\u6807\u6ce8\u6570\u636e\u3002</p> </li> <li> <p>GPT\uff08\u751f\u6210\u5f0f\u9884\u8bad\u7ec3Transformer\uff0cRadford\u7b49\u4eba\uff0c2018\uff09\u662f\u5178\u578b\u7684\u4ec5\u89e3\u7801\u5668\u6a21\u578b\u3002\u5b83\u4f7f\u7528\u56e0\u679c\uff08\u81ea\u56de\u5f52\uff09\u6ce8\u610f\u529b\uff1a\u6bcf\u4e2a\u6807\u8bb0\u53ea\u80fd\u5173\u6ce8\u66f4\u65e9\u4f4d\u7f6e\u7684\u6807\u8bb0\uff08\u4ee5\u53ca\u81ea\u8eab\uff09\u3002\u8fd9\u662f\u901a\u8fc7\u5728\u6ce8\u610f\u529b\u77e9\u9635\u4e2d\u906e\u853d\u672a\u6765\u4f4d\u7f6e\uff08\u5c06\u5176\u5206\u6570\u8bbe\u7f6e\u4e3a \\(-\\infty\\)\uff0c\u7136\u540e\u518d\u8fdb\u884csoftmax\uff09\u6765\u5b9e\u73b0\u7684\u3002\u8bad\u7ec3\u76ee\u6807\u662f\u7b80\u5355\u7684\u56e0\u679c\u8bed\u8a00\u5efa\u6a21\uff1a\u6839\u636e\u6240\u6709\u4e4b\u524d\u7684\u6807\u8bb0\u9884\u6d4b\u4e0b\u4e00\u4e2a\u6807\u8bb0\u3002</p> </li> </ul> \\[\\mathcal{L}_{\\text{CLM}} = -\\sum_{i=1}^{n} \\log P(w_i \\mid w_1, \\ldots, w_{i-1})\\] <ul> <li> <p>\u8fd9\u4e0e\u6587\u4ef602\u4e2d\u7684n-gram\u8bed\u8a00\u6a21\u578b\u76ee\u6807\u76f8\u540c\uff0c\u4f46\u91c7\u7528\u4e86Transformer\u53c2\u6570\u5316\u65b9\u5f0f\uff0c\u53ef\u4ee5\u57fa\u4e8e\u6574\u4e2a\u524d\u6587\u8fdb\u884c\u6761\u4ef6\u5efa\u6a21\uff0c\u800c\u4e0d\u4ec5\u4ec5\u662f\u6700\u540e \\(k-1\\) \u4e2a\u6807\u8bb0\u3002</p> </li> <li> <p>GPT-2\u5c06\u5176\u89c4\u6a21\u6269\u5927\u523015\u4ebf\u53c2\u6570\uff0c\u5e76\u5c55\u73b0\u4e86\u5f3a\u5927\u7684\u96f6\u6837\u672c\u80fd\u529b\uff1a\u65e0\u9700\u4efb\u4f55\u5fae\u8c03\uff0c\u5b83\u5c31\u80fd\u901a\u8fc7\u81ea\u7136\u8bed\u8a00\u63d0\u793a\uff08\"\u5c06\u82f1\u8bed\u7ffb\u8bd1\u6210\u6cd5\u8bed\uff1a\u2026\u2026\"\uff09\u6765\u6267\u884c\u4efb\u52a1\u3002</p> </li> <li> <p>GPT-3\uff081750\u4ebf\u53c2\u6570\uff09\u8868\u660e\uff0c\u4ec5\u51ed\u89c4\u6a21\u5c31\u80fd\u5b9e\u73b0\u4e0a\u4e0b\u6587\u5b66\u4e60\uff1a\u901a\u8fc7\u5728\u63d0\u793a\u4e2d\u63d0\u4f9b\u51e0\u4e2a\u8f93\u5165-\u8f93\u51fa\u793a\u4f8b\uff0c\u6a21\u578b\u65e0\u9700\u4efb\u4f55\u68af\u5ea6\u66f4\u65b0\u5c31\u80fd\u6267\u884c\u65b0\u4efb\u52a1\u3002</p> </li> <li> <p>\u7f16\u7801\u5668-\u89e3\u7801\u5668\u6a21\u578b\u5982T5\uff08\u6587\u672c\u5230\u6587\u672c\u8fc1\u79fbTransformer\uff0cRaffel\u7b49\u4eba\uff0c2020\uff09\u5c06\u6bcf\u4e2aNLP\u4efb\u52a1\u90fd\u89c6\u4e3a\u6587\u672c\u5230\u6587\u672c\uff1a\u8f93\u5165\u662f\u4e00\u4e2a\u6587\u672c\u5b57\u7b26\u4e32\uff08\u53ef\u80fd\u5e26\u6709\u4efb\u52a1\u524d\u7f00\uff0c\u5982\"\u5c06\u82f1\u8bed\u7ffb\u8bd1\u6210\u5fb7\u8bed\uff1a\"\uff09\uff0c\u8f93\u51fa\u4e5f\u662f\u4e00\u4e2a\u6587\u672c\u5b57\u7b26\u4e32\u3002\u7f16\u7801\u5668\u4f7f\u7528\u53cc\u5411\u6ce8\u610f\u529b\u5904\u7406\u8f93\u5165\uff0c\u89e3\u7801\u5668\u5219\u901a\u8fc7\u4ea4\u53c9\u6ce8\u610f\u529b\u81ea\u56de\u5f52\u5730\u751f\u6210\u8f93\u51fa\u3002</p> </li> <li> <p>T5\u901a\u8fc7\u8de8\u5ea6\u7834\u574f\u8fdb\u884c\u9884\u8bad\u7ec3\uff1a\u968f\u673a\u8fde\u7eed\u6807\u8bb0\u8de8\u5ea6\u88ab\u66ff\u6362\u4e3a\u54e8\u5175\u6807\u8bb0\uff0c\u6a21\u578b\u9700\u8981\u751f\u6210\u539f\u59cb\u6807\u8bb0\u3002\u4f8b\u5982\uff0c\"The cat sat on the mat\"\u53ef\u80fd\u53d8\u6210\u8f93\u5165\"The [X] on [Y]\"\uff0c\u76ee\u6807\u8f93\u51fa\u662f\"[X] cat sat [Y] the mat\"\u3002\u8fd9\u662fBERT\u7684MLM\u4ece\u5355\u4e2a\u6807\u8bb0\u5411\u8de8\u5ea6\u7684\u6cdb\u5316\u3002</p> </li> <li> <p>BART\uff08Lewis\u7b49\u4eba\uff0c2020\uff09\u662f\u53e6\u4e00\u79cd\u7f16\u7801\u5668-\u89e3\u7801\u5668\u6a21\u578b\uff0c\u901a\u8fc7\u53bb\u566a\u76ee\u6807\u8fdb\u884c\u9884\u8bad\u7ec3\uff0c\u4f46\u5b83\u5e94\u7528\u4e86\u66f4\u5e7f\u6cdb\u7684\u7834\u574f\u7b56\u7565\uff1a\u6807\u8bb0\u906e\u853d\u3001\u6807\u8bb0\u5220\u9664\u3001\u8de8\u5ea6\u906e\u853d\u3001\u53e5\u5b50\u7f6e\u6362\u548c\u6587\u6863\u65cb\u8f6c\u3002\u591a\u6837\u5316\u7684\u7834\u574f\u65b9\u5f0f\u8feb\u4f7f\u6a21\u578b\u5b66\u4e60\u66f4\u9c81\u68d2\u7684\u8868\u793a\u3002</p> </li> <li> <p>\u968f\u7740\u8bed\u8a00\u6a21\u578b\u53d8\u5f97\u8d8a\u6765\u8d8a\u5927\uff0c\u5168\u91cf\u5fae\u8c03\uff08\u66f4\u65b0\u6240\u6709\u53c2\u6570\uff09\u53d8\u5f97\u4e0d\u5207\u5b9e\u9645\uff1a\u4e00\u4e2a175B\u53c2\u6570\u7684\u6a21\u578b\u4ec5\u5b58\u50a8\u4f18\u5316\u5668\u72b6\u6001\u5c31\u9700\u8981\u6570\u767eGB\u3002\u53c2\u6570\u9ad8\u6548\u5fae\u8c03\uff08PEFT\uff09\u65b9\u6cd5\u53ea\u8c03\u6574\u4e00\u5c0f\u90e8\u5206\u53c2\u6570\u3002</p> </li> <li> <p>\u9002\u914d\u5668\u5728\u73b0\u6709Transformer\u5c42\u4e4b\u95f4\u63d2\u5165\u5c0f\u578b\u74f6\u9888\u5c42\uff08\u901a\u5e38\u662f\u4e24\u4e2a\u7ebf\u6027\u5c42\u52a0\u4e00\u4e2a\u975e\u7ebf\u6027\u6fc0\u6d3b\uff1a\u4e0b\u6295\u5f71\u5230\u5c0f\u7ef4\u5ea6\uff0c\u518d\u4e0a\u6295\u5f71\u56de\u6765\uff09\u3002\u53ea\u6709\u9002\u914d\u5668\u7684\u6743\u91cd\u88ab\u8bad\u7ec3\uff1b\u539f\u59cb\u6a21\u578b\u6743\u91cd\u88ab\u51bb\u7ed3\u3002\u8fd9\u589e\u52a0\u4e86\u4e0d\u52305%\u7684\u65b0\u53c2\u6570\uff0c\u540c\u65f6\u5728\u5927\u591a\u6570\u4efb\u52a1\u4e0a\u5339\u914d\u5168\u91cf\u5fae\u8c03\u7684\u6027\u80fd\u3002</p> </li> <li> <p>LoRA\uff08\u4f4e\u79e9\u9002\u914d\uff09\u76f4\u63a5\u4fee\u6539\u6743\u91cd\u77e9\u9635\uff0c\u800c\u4e0d\u6dfb\u52a0\u65b0\u5c42\u3002LoRA\u4e0d\u66f4\u65b0\u5b8c\u6574\u7684\u6743\u91cd\u77e9\u9635 \\(W\\)\uff0c\u800c\u662f\u5b66\u4e60\u4e00\u4e2a\u4f4e\u79e9\u5206\u89e3\u7684\u66f4\u65b0\uff1a\\(W' = W + BA\\)\uff0c\u5176\u4e2d \\(B\\) \u662f \\(d \\times r\\) \u77e9\u9635\uff0c\\(A\\) \u662f \\(r \\times d\\) \u77e9\u9635\uff0c\u4e14 \\(r \\ll d\\)\uff08\u901a\u5e38 \\(r = 4\\) \u5230 \\(r = 64\\)\uff09\u3002\u539f\u59cb \\(W\\) \u88ab\u51bb\u7ed3\uff1b\u53ea\u8bad\u7ec3 \\(A\\) \u548c \\(B\\)\u3002\u5728\u63a8\u7406\u65f6\uff0c\u66f4\u65b0\u53ef\u4ee5\u5408\u5e76\u5230\u539f\u59cb\u6743\u91cd\u4e2d\uff0c\u4e0d\u4f1a\u589e\u52a0\u989d\u5916\u5ef6\u8fdf\uff1a</p> </li> </ul> \\[W' = W + BA\\] <p></p> <ul> <li> <p>\u524d\u7f00\u5fae\u8c03\u5728\u6bcf\u4e2a\u6ce8\u610f\u529b\u5c42\u7684\u952e\u548c\u503c\u77e9\u9635\u524d\u6dfb\u52a0\u4e00\u4e32\u53ef\u5b66\u4e60\u7684\"\u865a\u62df\u6807\u8bb0\"\u3002\u6a21\u578b\u50cf\u5bf9\u5f85\u771f\u5b9e\u6807\u8bb0\u4e00\u6837\u5173\u6ce8\u8fd9\u4e9b\u524d\u7f00\u5411\u91cf\uff0c\u5e76\u4e14\u53ea\u8bad\u7ec3\u524d\u7f00\u53c2\u6570\u3002\u8fd9\u4e0e\u63d0\u793a\u5fae\u8c03\u7c7b\u4f3c\uff0c\u4f46\u5728\u6fc0\u6d3b\u7a7a\u95f4\u800c\u975e\u5d4c\u5165\u7a7a\u95f4\u4e2d\u64cd\u4f5c\u3002</p> </li> <li> <p>\u63d0\u793a\u5de5\u7a0b\u662f\u8bbe\u8ba1\u8f93\u5165\u6587\u672c\u7684\u827a\u672f\uff0c\u65e8\u5728\u4ece\u9884\u8bad\u7ec3\u6a21\u578b\u4e2d\u5f15\u51fa\u6240\u9700\u884c\u4e3a\uff0c\u800c\u65e0\u9700\u4efb\u4f55\u53c2\u6570\u66f4\u65b0\u3002</p> <ul> <li> <p>\u96f6\u6837\u672c\u63d0\u793a\u7528\u81ea\u7136\u8bed\u8a00\u63cf\u8ff0\u4efb\u52a1\uff08\"\u5bf9\u4ee5\u4e0b\u8bc4\u8bba\u7684\u60c5\u611f\u8fdb\u884c\u5206\u7c7b\uff1a\"\uff09\u3002</p> </li> <li> <p>\u5c11\u6837\u672c\u63d0\u793a\u5728\u5b9e\u9645\u67e5\u8be2\u4e4b\u524d\u63d0\u4f9b\u8f93\u5165-\u8f93\u51fa\u793a\u4f8b\u3002</p> </li> <li> <p>\u94fe\u5f0f\u601d\u7ef4\uff08CoT\uff09\u63d0\u793a\u6dfb\u52a0\"\u8ba9\u6211\u4eec\u4e00\u6b65\u4e00\u6b65\u5730\u601d\u8003\"\u6216\u5728\u793a\u4f8b\u4e2d\u5305\u542b\u63a8\u7406\u8fc7\u7a0b\uff0c\u8fd9\u901a\u8fc7\u5f15\u5bfc\u6a21\u578b\u5206\u89e3\u95ee\u9898\uff0c\u663e\u8457\u63d0\u9ad8\u4e86\u7b97\u672f\u548c\u903b\u8f91\u63a8\u7406\u4efb\u52a1\u7684\u6027\u80fd\u3002</p> </li> </ul> </li> <li> <p>\u4e0a\u4e0b\u6587\u5b66\u4e60\uff08ICL\uff09\u662f\u5927\u8bed\u8a00\u6a21\u578b\u80fd\u591f\u4ece\u63d0\u793a\u4e2d\u63d0\u4f9b\u7684\u793a\u4f8b\u5b66\u4e60\u6267\u884c\u4efb\u52a1\u7684\u73b0\u8c61\uff0c\u800c\u65e0\u9700\u4efb\u4f55\u68af\u5ea6\u66f4\u65b0\u3002\u6a21\u578b\u7684\u6743\u91cd\u6ca1\u6709\u6539\u53d8\uff1b\u5b83\u5c06\u793a\u4f8b\u4f5c\u4e3a\u4e00\u79cd\u9690\u5f0f\u89c4\u8303\u6765\u4f7f\u7528\u3002</p> </li> <li> <p>ICL\u5728\u673a\u5236\u4e0a\u662f\u5982\u4f55\u5de5\u4f5c\u7684\u4ecd\u7136\u662f\u4e00\u4e2a\u6d3b\u8dc3\u7684\u7814\u7a76\u95ee\u9898\uff1b\u4e00\u79cd\u5047\u8bf4\u662f\u6ce8\u610f\u529b\u5c42\u5728\u524d\u5411\u4f20\u64ad\u4e2d\u5b9e\u73b0\u4e86\u4e00\u79cd\u68af\u5ea6\u4e0b\u964d\u5f62\u5f0f\uff0c\u5b9e\u9645\u4e0a\u662f\u5728\u4e0a\u4e0b\u6587\u793a\u4f8b\u4e0a\u8fdb\u884c\"\u8bad\u7ec3\"\u3002</p> </li> <li> <p>\u7f29\u653e\u5b9a\u5f8b\u63cf\u8ff0\u4e86\u6a21\u578b\u5927\u5c0f\u3001\u6570\u636e\u5927\u5c0f\u3001\u8ba1\u7b97\u9884\u7b97\u4e0e\u6027\u80fd\uff08\u4ee5\u635f\u5931\u8861\u91cf\uff09\u4e4b\u95f4\u7684\u53ef\u9884\u6d4b\u5173\u7cfb\u3002Kaplan\u7b49\u4eba\uff082020\uff09\u53d1\u73b0\u635f\u5931\u5728\u6bcf\u4e2a\u53d8\u91cf\u4e0a\u90fd\u9075\u5faa\u5e42\u5f8b\uff1a</p> </li> </ul> \\[L(N) \\propto N^{-\\alpha_N}, \\quad L(D) \\propto D^{-\\alpha_D}, \\quad L(C) \\propto C^{-\\alpha_C}\\] <ul> <li>\u5176\u4e2d \\(N\\) \u662f\u53c2\u6570\u91cf\uff0c\\(D\\) \u662f\u6570\u636e\u96c6\u5927\u5c0f\uff0c\\(C\\) \u662f\u8ba1\u7b97\u9884\u7b97\u3002\u8fd9\u4e9b\u5e42\u5f8b\u5728\u591a\u4e2a\u6570\u91cf\u7ea7\u4e0a\u6210\u7acb\uff0c\u8868\u660e\u5355\u7eaf\u5730\u6269\u5927\u89c4\u6a21\u5c31\u80fd\u5e26\u6765\u53ef\u9884\u6d4b\u7684\u6539\u8fdb\u3002</li> </ul> <p></p> <ul> <li>Chinchilla\u7f29\u653e\u5b9a\u5f8b\uff08Hoffmann\u7b49\u4eba\uff0c2022\uff09\u4fee\u6b63\u4e86\u8fd9\u4e00\u70b9\uff0c\u6307\u51fa\u5927\u591a\u6570\u5927\u578b\u6a21\u578b\u90fd\u8bad\u7ec3\u4e0d\u8db3\u3002\u5bf9\u4e8e\u56fa\u5b9a\u7684\u8ba1\u7b97\u9884\u7b97 \\(C\\)\uff0c\u6700\u4f18\u5206\u914d\u662f\u540c\u7b49\u89c4\u6a21\u5730\u6269\u5927\u6a21\u578b\u5927\u5c0f\u548c\u8bad\u7ec3\u6570\u636e\uff1a</li> </ul> \\[N_{\\text{opt}} \\propto C^{0.5}, \\quad D_{\\text{opt}} \\propto C^{0.5}\\] <ul> <li> <p>\u8fd9\u610f\u5473\u7740\u5982\u679c\u8ba1\u7b97\u9884\u7b97\u7ffb\u500d\uff0c\u5e94\u8be5\u540c\u65f6\u5c06\u6a21\u578b\u5927\u5c0f\u548c\u6570\u636e\u96c6\u5927\u5c0f\u589e\u52a0 \\(\\sqrt{2}\\) \u500d\uff0c\u800c\u4e0d\u4ec5\u4ec5\u662f\u8ba9\u6a21\u578b\u53d8\u5f97\u66f4\u5927\u3002</p> </li> <li> <p>Kaplan\u7b49\u4eba\u66fe\u5efa\u8bae \\(N\\) \u7684\u7f29\u653e\u901f\u5ea6\u5e94\u5feb\u4e8e \\(D\\)\uff0c\u8fd9\u5bfc\u81f4\u4e86\u975e\u5e38\u5927\u4f46\u8bad\u7ec3\u4e0d\u8db3\u7684\u6a21\u578b\u3002Chinchilla\uff0870B\u53c2\u6570\uff0c1.4T\u6807\u8bb0\uff09\u5728\u76f8\u540c\u7684\u8ba1\u7b97\u9884\u7b97\u4e0b\u5339\u914d\u4e86Gopher\uff08280B\u53c2\u6570\uff0c300B\u6807\u8bb0\uff09\u7684\u6027\u80fd\uff0c\u8868\u660e\u65e9\u671f\u6a21\u578b\u4e25\u91cd\u7f3a\u4e4f\u6570\u636e\u3002</p> </li> <li> <p>\u5b9e\u7528\u7684\u7ecf\u9a8c\u6cd5\u5219\uff1a\u5927\u7ea6\u6bcf\u4e2a\u53c2\u6570\u8bad\u7ec320\u4e2a\u6807\u8bb0\u3002</p> </li> <li> <p>\u6df7\u5408\u4e13\u5bb6\uff08MoE\uff09\u662f\u4e00\u79cd\u5728\u4e0d\u6210\u6bd4\u4f8b\u589e\u52a0\u8ba1\u7b97\u91cf\u7684\u60c5\u51b5\u4e0b\u6269\u5927\u6a21\u578b\u5bb9\u91cf\u7684\u67b6\u6784\u3002MoE\u4e0d\u91c7\u7528\u5355\u4e00\u7684\u5927\u578b\u524d\u9988\u5c42\uff0c\u800c\u662f\u4f7f\u7528\u591a\u4e2a\u4e13\u5bb6FFN\u5c42\u548c\u4e00\u4e2a\u95e8\u63a7\u7f51\u7edc\uff08\u8def\u7531\u7f51\u7edc\uff09\u6765\u9009\u62e9\u6bcf\u4e2a\u6807\u8bb0\u5e94\u8be5\u6fc0\u6d3b\u54ea\u4e9b\u4e13\u5bb6\u3002</p> </li> <li> <p>\u95e8\u63a7\u51fd\u6570\u8ba1\u7b97\u6bcf\u4e2a\u4e13\u5bb6\u7684\u8def\u7531\u5206\u6570\uff0c\u5e76\u9009\u62e9\u524d \\(k\\) \u4e2a\uff08\u901a\u5e38 \\(k = 1\\) \u6216 \\(k = 2\\)\uff09\uff1a</p> </li> </ul> \\[G(x) = \\text{TopK}(\\text{softmax}(W_g x))\\] <ul> <li>\u53ea\u6709\u88ab\u9009\u4e2d\u7684\u4e13\u5bb6\u5904\u7406\u8be5\u6807\u8bb0\uff0c\u56e0\u6b64\u8ba1\u7b97\u6210\u672c\u968f \\(k\\)\uff08\u6d3b\u8dc3\u4e13\u5bb6\u6570\uff09\u800c\u975e\u603b\u4e13\u5bb6\u6570 \\(E\\) \u589e\u957f\u3002\u4e00\u4e2a\u67098\u4e2a\u4e13\u5bb6\u4e14\u91c7\u7528top-2\u8def\u7531\u7684\u6a21\u578b\uff0c\u53c2\u6570\u91cf\u662f\u7a20\u5bc6\u6a21\u578b\u76844\u500d\uff0c\u4f46\u8ba1\u7b97\u91cf\u4ec5\u4e3a2\u500d\u3002</li> </ul> <p></p> <ul> <li>MoE\u4e2d\u4e00\u4e2a\u5173\u952e\u7684\u6311\u6218\u662f\u8d1f\u8f7d\u5747\u8861\uff1a\u5982\u679c\u8def\u7531\u7f51\u7edc\u5c06\u5927\u591a\u6570\u6807\u8bb0\u53d1\u9001\u7ed9\u5c11\u6570\u70ed\u95e8\u4e13\u5bb6\uff0c\u5176\u4ed6\u4e13\u5bb6\u5c31\u88ab\u6d6a\u8d39\u4e86\u3002\u8bad\u7ec3\u65f6\u4f1a\u6dfb\u52a0\u4e00\u4e2a\u8f85\u52a9\u7684\u8d1f\u8f7d\u5747\u8861\u635f\u5931\uff0c\u9f13\u52b1\u5747\u5300\u7684\u4e13\u5bb6\u5229\u7528\u7387\uff1a</li> </ul> \\[\\mathcal{L}_{\\text{balance}} = E \\cdot \\sum_{i=1}^{E} f_i \\cdot p_i\\] <ul> <li> <p>\u5176\u4e2d \\(f_i\\) \u662f\u5206\u914d\u7ed9\u4e13\u5bb6 \\(i\\) \u7684\u6807\u8bb0\u6bd4\u4f8b\uff0c\\(p_i\\) \u662f\u4e13\u5bb6 \\(i\\) \u7684\u5e73\u5747\u8def\u7531\u6982\u7387\u3002\u5f53\u6807\u8bb0\u6bd4\u4f8b\u548c\u6982\u7387\u90fd\u5747\u5300\uff08\u5404\u7b49\u4e8e \\(1/E\\)\uff09\u65f6\uff0c\u8be5\u4e58\u79ef\u6700\u5c0f\u3002</p> </li> <li> <p>\u4e13\u5bb6\u5e76\u884c\u5c06\u4e0d\u540c\u7684\u4e13\u5bb6\u5206\u5e03\u5230\u4e0d\u540c\u7684\u52a0\u901f\u5668\u4e0a\u3002\u5728\u524d\u5411\u4f20\u64ad\u8fc7\u7a0b\u4e2d\uff0c\u901a\u8fc7\u4e00\u4e2a\u5168\u5230\u5168\u7684\u901a\u4fe1\u6b65\u9aa4\u5c06\u6807\u8bb0\u8def\u7531\u5230\u5176\u6307\u5b9a\u4e13\u5bb6\u6240\u5728\u7684\u8bbe\u5907\uff0c\u7136\u540e\u5c06\u7ed3\u679c\u8def\u7531\u56de\u6765\u3002\u8fd9\u79cd\u901a\u4fe1\u6210\u672c\u662fMoE\u5728\u5927\u89c4\u6a21\u90e8\u7f72\u4e2d\u7684\u4e3b\u8981\u5de5\u7a0b\u6311\u6218\u3002Switch Transformer\u3001Mixtral\u548cGShard\u7b49\u6a21\u578b\u4f7f\u7528MoE\u6765\u83b7\u5f97\u5f3a\u5927\u7684\u6027\u80fd\uff0c\u540c\u65f6\u4fdd\u6301\u5408\u7406\u7684\u63a8\u7406\u6210\u672c\u3002</p> </li> <li> <p>\u6784\u5efa\u6a21\u578b\u53ea\u662f\u5de5\u4f5c\u7684\u4e00\u534a\uff1b\u8861\u91cf\u5b83\u4eec\u662f\u5426\u6709\u6548\u662f\u53e6\u4e00\u534a\u3002NLP\u8bc4\u4f30\u7279\u522b\u56f0\u96be\uff0c\u56e0\u4e3a\u8bed\u8a00\u662f\u6a21\u7cca\u7684\u3001\u4e3b\u89c2\u7684\u548c\u5f00\u653e\u5f0f\u7684\u3002</p> </li> <li> <p>\u4e00\u4e2a\u7ffb\u8bd1\u53ef\u4ee5\u6709\u591a\u79cd\u6b63\u786e\u7684\u8868\u8fbe\u65b9\u5f0f\u3002\u4e00\u4e2a\u6458\u8981\u5373\u4f7f\u4e0e\u53c2\u8003\u6458\u8981\u6ca1\u6709\u4efb\u4f55\u5b8c\u5168\u76f8\u540c\u7684\u8bcd\u6c47\uff0c\u4e5f\u53ef\u80fd\u662f\u597d\u7684\u3002</p> </li> <li> <p>\u4e00\u4e2a\u804a\u5929\u673a\u5668\u4eba\u7684\u56de\u590d\u53ef\u80fd\u65e2\u6709\u7528\u3001\u53c8\u65e0\u5bb3\u3001\u53c8\u8bda\u5b9e\uff0c\u4f46\u7406\u6027\u7684\u4eba\u4ecd\u4f1a\u5bf9\u6b64\u6709\u4e0d\u540c\u770b\u6cd5\u3002</p> </li> <li> <p>\u7cbe\u786e\u5339\u914d\uff08EM\uff09\u662f\u6700\u7b80\u5355\u7684\u6307\u6807\uff1a\u6a21\u578b\u7684\u8f93\u51fa\u662f\u5426\u4e0e\u6807\u51c6\u7b54\u6848\u5b8c\u5168\u4e00\u81f4\uff1f\u5b83\u7528\u4e8e\u7b54\u6848\u7b80\u77ed\u4e14\u65e0\u6b67\u4e49\u7684\u4efb\u52a1\uff0c\u5982\u62bd\u53d6\u5f0f\u95ee\u7b54\uff08SQuAD\uff09\u6216\u5c01\u95ed\u5f0f\u6570\u5b66\u95ee\u9898\u3002</p> </li> <li> <p>EM\u662f\u4e25\u82db\u7684\uff1b\"New York City\"\u548c\"new york city\"\u5728\u4e0d\u505a\u5f52\u4e00\u5316\u7684\u60c5\u51b5\u4e0b\u65e0\u6cd5\u5339\u914d\u2014\u2014\u4f46\u5b83\u7684\u7b80\u5355\u6027\u4f7f\u5176\u6ca1\u6709\u6b67\u4e49\u3002</p> </li> <li> <p>\u6807\u8bb0\u7ea7\u6307\u6807\u5c06NLP\u89c6\u4e3a\u6807\u8bb0\u7ea7\u522b\u7684\u5206\u7c7b\u95ee\u9898\uff0c\u4f7f\u7528\u7b2c06\u7ae0\u4e2d\u7684\u7cbe\u786e\u7387\u3001\u53ec\u56de\u7387\u548cF1\u503c\u3002</p> </li> <li> <p>\u7cbe\u786e\u7387\uff08Precision\uff09\u8861\u91cf\u6a21\u578b\u9884\u6d4b\u7684\u6807\u8bb0\u4e2d\u6b63\u786e\u90e8\u5206\u7684\u6bd4\u4f8b\uff1a\\(P = \\text{TP} / (\\text{TP} + \\text{FP})\\)\u3002\u4e00\u4e2a\u9884\u6d4b\u5f88\u5c11\u4f46\u5168\u90e8\u6b63\u786e\u7684\u6a21\u578b\u5177\u6709\u9ad8\u7cbe\u786e\u7387\u3002</p> </li> <li> <p>\u53ec\u56de\u7387\uff08Recall\uff09\u8861\u91cf\u6a21\u578b\u627e\u5230\u4e86\u591a\u5c11\u6807\u51c6\u6807\u8bb0\uff1a\\(R = \\text{TP} / (\\text{TP} + \\text{FN})\\)\u3002\u4e00\u4e2a\u5c06\u6240\u6709\u6807\u8bb0\u90fd\u9884\u6d4b\u4e3a\u5b9e\u4f53\u7684\u6a21\u578b\u5177\u6709\u5b8c\u7f8e\u7684\u53ec\u56de\u7387\u4f46\u7cbe\u786e\u7387\u6781\u4f4e\u3002</p> </li> <li> <p>F1\u662f\u7cbe\u786e\u7387\u548c\u53ec\u56de\u7387\u7684\u8c03\u548c\u5e73\u5747\u503c\uff1a</p> </li> </ul> \\[F_1 = \\frac{2PR}{P + R}\\] <ul> <li> <p>\u8c03\u548c\u5e73\u5747\u503c\uff08\u800c\u975e\u7b97\u672f\u5e73\u5747\u503c\uff09\u60e9\u7f5a\u4e0d\u5747\u8861\uff1a\u5982\u679c \\(P\\) \u6216 \\(R\\) \u4e2d\u4efb\u4f55\u4e00\u4e2a\u8f83\u4f4e\uff0cF1\u5c31\u4f1a\u5f88\u4f4e\u3002\u5bf9\u4e8e\u547d\u540d\u5b9e\u4f53\u8bc6\u522b\uff08\u6587\u4ef602\uff09\uff0cF1\u6309\u6bcf\u4e2a\u5b9e\u4f53\u7c7b\u578b\u5206\u522b\u8ba1\u7b97\uff0c\u7136\u540e\u8de8\u7c7b\u578b\u53d6\u5b8f\u5e73\u5747\u3002\u5bf9\u4e8e\u8bcd\u6027\u6807\u6ce8\uff0c\u6807\u8bb0\u7ea7\u51c6\u786e\u7387\u66f4\u5e38\u89c1\uff0c\u56e0\u4e3a\u6bcf\u4e2a\u6807\u8bb0\u90fd\u6709\u4e00\u4e2a\u6807\u7b7e\u3002</p> </li> <li> <p>\u8de8\u5ea6\u7ea7F1\uff08\u7528\u4e8eSQuAD\uff09\u6bd4\u8f83\u9884\u6d4b\u8de8\u5ea6\u4e2d\u7684\u6807\u8bb0\u96c6\u4e0e\u6807\u51c6\u8de8\u5ea6\u4e2d\u7684\u6807\u8bb0\u96c6\u3002\u8fd9\u6bd4\u7cbe\u786e\u5339\u914d\u66f4\u5bbd\u5bb9\uff1a\u5982\u679c\u6807\u51c6\u7b54\u6848\u662f\"the Eiffel Tower\"\u800c\u6a21\u578b\u9884\u6d4b\u7684\u662f\"Eiffel Tower\"\uff0c\u8de8\u5ea6F1\u5f88\u9ad8\uff085\u4e2a\u91cd\u53e0\u6807\u8bb0\u4e2d\u76844\u4e2a\uff09\uff0c\u5373\u4f7fEM\u4e3a\u96f6\u3002</p> </li> <li> <p>BLEU\uff08\u53cc\u8bed\u8bc4\u4f30\u66ff\u8865\uff0cPapineni\u7b49\u4eba\uff0c2002\uff09\u662f\u673a\u5668\u7ffb\u8bd1\u7684\u7ecf\u5178\u6307\u6807\u3002\u5b83\u8861\u91cf\u5019\u9009\u7ffb\u8bd1\u4e0e\u4e00\u4e2a\u6216\u591a\u4e2a\u53c2\u8003\u7ffb\u8bd1\u4e4b\u95f4\u7684n-gram\u91cd\u53e0\u3002\u8be5\u8bc4\u5206\u7ed3\u5408\u4e86\u591a\u4e2an-gram\u7ea7\u522b\uff08unigram\u52304-gram\uff09\u7684\u7cbe\u786e\u7387\u548c\u4e00\u4e2a\u7b80\u77ed\u60e9\u7f5a\uff1a</p> </li> </ul> \\[\\text{BLEU} = \\text{BP} \\cdot \\exp\\!\\left(\\sum_{n=1}^{N} w_n \\log p_n\\right)\\] <ul> <li> <p>\u5176\u4e2d \\(p_n\\) \u662f\u4fee\u6b63\u7684n-gram\u7cbe\u786e\u7387\uff1a\u5019\u9009\u7ffb\u8bd1\u4e2d\u6bcf\u4e2an-gram\u7684\u8ba1\u6570\u88ab\u88c1\u526a\u4e3a\u5176\u5728\u4efb\u4f55\u53c2\u8003\u7ffb\u8bd1\u4e2d\u7684\u6700\u5927\u8ba1\u6570\uff0c\u9632\u6b62\u50cf\"the the the the\"\u8fd9\u6837\u7684\u9000\u5316\u5019\u9009\u83b7\u5f97\u9ad8\u5206\u3002\u6743\u91cd \\(w_n\\) \u901a\u5e38\u662f\u5747\u5300\u7684\uff08\\(w_n = 1/N\\)\uff0c\u5176\u4e2d \\(N = 4\\)\uff09\u3002</p> </li> <li> <p>\u7b80\u77ed\u60e9\u7f5a \\(\\text{BP} = \\min(1, \\exp(1 - r/c))\\) \u60e9\u7f5a\u6bd4\u53c2\u8003\u7ffb\u8bd1\u77ed\u7684\u5019\u9009\uff08\\(c\\) \u662f\u5019\u9009\u957f\u5ea6\uff0c\\(r\\) \u662f\u53c2\u8003\u957f\u5ea6\uff09\u3002\u6ca1\u6709\u8fd9\u4e2a\u60e9\u7f5a\uff0c\u6a21\u578b\u53ef\u4ee5\u901a\u8fc7\u8f93\u51fa\u5f88\u5c11\u4f46\u975e\u5e38\u5b89\u5168\u7684\u8bcd\u6765\u83b7\u5f97\u9ad8\u7cbe\u786e\u7387\u3002</p> </li> <li> <p>BLEU\u5728\u8bed\u6599\u7ea7\u522b\uff08\u5bf9\u591a\u4e2a\u53e5\u5b50\u53d6\u5e73\u5747\uff09\u4e0e\u4eba\u7c7b\u5224\u65ad\u6709\u5408\u7406\u7684\u76f8\u5173\u6027\uff0c\u4f46\u5728\u53e5\u5b50\u7ea7\u522b\u76f8\u5173\u6027\u8f83\u5dee\u3002</p> </li> <li> <p>\u5b83\u5956\u52b1\u7cbe\u786e\u7684n-gram\u5339\u914d\uff0c\u4f46\u4f1a\u9057\u6f0f\u6709\u6548\u7684\u91ca\u4e49\uff1a\"the cat is on the mat\"\u548c\"a feline sits atop the rug\"\u5c3d\u7ba1\u610f\u601d\u76f8\u540c\uff0c\u4f46\u4e8c\u5143\u7ec4\u91cd\u53e0\u4e3a\u96f6\u3002</p> </li> <li> <p>BLEU\u4e5f\u5b8c\u5168\u5ffd\u7565\u4e86\u53ec\u56de\u7387\u2014\u2014\u53ea\u8f93\u51fa\u6700\u5e38\u89c1\u8bcd\u6c47\u7684\u5019\u9009\u5728\u7cbe\u786e\u7387\u4e0a\u5f97\u5206\u5f88\u9ad8\u3002</p> </li> <li> <p>ROUGE\uff08\u9762\u5411\u53ec\u56de\u7387\u7684\u6458\u8981\u8bc4\u4f30\u66ff\u8865\uff0cLin\uff0c2004\uff09\u662f\u6458\u8981\u7684\u6807\u51c6\u6307\u6807\u3002\u4e0e\u5f3a\u8c03\u7cbe\u786e\u7387\u7684BLEU\u4e0d\u540c\uff0cROUGE\u5f3a\u8c03\u53ec\u56de\u7387\uff1a\u53c2\u8003n-gram\u4e2d\u6709\u591a\u5c11\u6bd4\u4f8b\u51fa\u73b0\u5728\u5019\u9009\u6458\u8981\u4e2d\uff1f</p> </li> <li> <p>ROUGE-N\u8ba1\u7b97n-gram\u7684\u53ec\u56de\u7387\uff1a\\(\\text{ROUGE-N} = \\frac{|\\text{n-grams}_{\\text{ref}} \\cap \\text{n-grams}_{\\text{cand}}|}{|\\text{n-grams}_{\\text{ref}}|}\\)\u3002ROUGE-1\uff08unigram\uff09\u548cROUGE-2\uff08bigram\uff09\u6700\u4e3a\u5e38\u7528\u3002</p> </li> <li> <p>ROUGE-L\u4f7f\u7528\u5019\u9009\u548c\u53c2\u8003\u4e4b\u95f4\u7684\u6700\u957f\u516c\u5171\u5b50\u5e8f\u5217\uff08LCS\uff09\uff0c\u8fd9\u53ef\u4ee5\u6355\u6349\u53e5\u5b50\u7ea7\u522b\u7684\u8bcd\u5e8f\u4fe1\u606f\uff0c\u800c\u4e0d\u8981\u6c42\u8fde\u7eed\u5339\u914d\u3002</p> </li> <li> <p>LCS\u957f\u5ea6\u9664\u4ee5\u53c2\u8003\u957f\u5ea6\u5f97\u5230\u53ec\u56de\u7387\uff0c\u9664\u4ee5\u5019\u9009\u957f\u5ea6\u5f97\u5230\u7cbe\u786e\u7387\uff0cF\u5ea6\u91cf\u5219\u7ec4\u5408\u4e24\u8005\u3002</p> </li> <li> <p>LCS\u901a\u8fc7\u52a8\u6001\u89c4\u5212\u5728 \\(O(mn)\\) \u65f6\u95f4\u5185\u8ba1\u7b97\uff08\u7c7b\u4f3c\u4e8e\u6587\u4ef602\u4e2d\u7684\u7f16\u8f91\u8ddd\u79bb\uff09\uff1a</p> </li> </ul> \\[R_{\\text{LCS}} = \\frac{\\text{LCS}(X, Y)}{m}, \\quad P_{\\text{LCS}} = \\frac{\\text{LCS}(X, Y)}{n}, \\quad F_{\\text{LCS}} = \\frac{(1 + \\beta^2) R_{\\text{LCS}} P_{\\text{LCS}}}{R_{\\text{LCS}} + \\beta^2 P_{\\text{LCS}}}\\] <ul> <li> <p>\u5176\u4e2d \\(m\\) \u548c \\(n\\) \u5206\u522b\u662f\u53c2\u8003\u548c\u5019\u9009\u7684\u957f\u5ea6\uff0c\\(\\beta\\) \u901a\u5e38\u8bbe\u7f6e\u4e3a\u504f\u5411\u53ec\u56de\u7387\uff08\\(\\beta \\to \\infty\\) \u7ed9\u51fa\u7eaf\u53ec\u56de\u7387\uff09\u3002</p> </li> <li> <p>METEOR\uff08\u5e26\u663e\u5f0f\u6392\u5e8f\u7684\u7ffb\u8bd1\u8bc4\u4f30\u5ea6\u91cf\uff0cBanerjee\u548cLavie\uff0c2005\uff09\u901a\u8fc7\u5f15\u5165\u540c\u4e49\u8bcd\u3001\u8bcd\u5e72\u63d0\u53d6\u548c\u8bcd\u5e8f\u6765\u89e3\u51b3BLEU\u7684\u5f31\u70b9\u3002</p> </li> <li> <p>\u5b83\u9996\u5148\u4f7f\u7528\u7cbe\u786e\u5339\u914d\u3001\u8bcd\u5e72\u5339\u914d\uff08\u901a\u8fc7\u6587\u4ef602\u4e2d\u7684Porter\u8bcd\u5e72\u63d0\u53d6\u7b97\u6cd5\uff09\u548c\u540c\u4e49\u8bcd\u5339\u914d\uff08\u901a\u8fc7\u6587\u4ef601\u4e2d\u7684WordNet\uff09\u5728\u5019\u9009\u548c\u53c2\u8003\u4e4b\u95f4\u5bf9\u9f50\u8bcd\u6c47\u3002</p> </li> <li> <p>\u7136\u540e\u8ba1\u7b97unigram\u7cbe\u786e\u7387\u548c\u53ec\u56de\u7387\u7684\u8c03\u548c\u5e73\u5747\u503c\uff08\u504f\u5411\u53ec\u56de\u7387\uff09\uff0c\u5e76\u5e94\u7528\u4e00\u4e2a\u788e\u7247\u5316\u60e9\u7f5a\uff0c\u60e9\u7f5a\u90a3\u4e9b\u5339\u914d\u8bcd\u987a\u5e8f\u4e0e\u53c2\u8003\u4e0d\u540c\u7684\u5019\u9009\u3002</p> </li> <li> <p>ChrF\uff08\u5b57\u7b26n-gram F\u503c\uff09\u8ba1\u7b97\u5b57\u7b26n-gram\u800c\u975e\u8bcd\u6c47n-gram\u7684F\u503c\u3002\u8fd9\u4f7f\u5176\u5bf9\u5f62\u6001\u53d8\u5316\u5177\u6709\u9c81\u68d2\u6027\uff08\u5bf9\u6587\u4ef601\u4e2d\u7684\u9ecf\u7740\u8bed\u81f3\u5173\u91cd\u8981\uff09\uff0c\u5e76\u90e8\u5206\u5904\u7406\u4e86\u5206\u8bcd\u5dee\u5f02\u3002ChrF++\u5728\u5b57\u7b26n-gram\u7684\u57fa\u7840\u4e0a\u589e\u52a0\u4e86\u8bcd\u6c47\u4e8c\u5143\u7ec4\u3002</p> </li> <li> <p>\u5b83\u5df2\u6210\u4e3a\u673a\u5668\u7ffb\u8bd1\u4e2d\u4e0eBLEU\u4e00\u8d77\u63a8\u8350\u7684\u5ea6\u91cf\u6807\u51c6\uff0c\u7279\u522b\u662f\u5bf9\u4e8e\u5f62\u6001\u4e30\u5bcc\u7684\u8bed\u8a00\u3002</p> </li> <li> <p>\u56f0\u60d1\u5ea6\uff08\u6587\u4ef602\uff09\u8861\u91cf\u8bed\u8a00\u6a21\u578b\u5728\u4fdd\u7559\u6d4b\u8bd5\u96c6\u4e0a\u7684\u9884\u6d4b\u6548\u679c\u3002\u8fd9\u662f\u8bed\u8a00\u6a21\u578b\u7684\u6807\u51c6\u5185\u5728\u6307\u6807\uff1a\\(\\text{PPL} = \\exp(-\\frac{1}{N} \\sum_{i} \\log P(w_i \\mid w_{&lt;i}))\\)\u3002\u8d8a\u4f4e\u8d8a\u597d\u3002</p> </li> <li> <p>\u56f0\u60d1\u5ea6\u53ea\u80fd\u5728\u4f7f\u7528\u4e86\u76f8\u540c\u5206\u8bcd\u65b9\u6cd5\u7684\u6a21\u578b\u4e4b\u95f4\u8fdb\u884c\u6bd4\u8f83\uff0c\u56e0\u4e3a\u4e0d\u540c\u7684\u5206\u8bcd\u5668\u5bf9\u540c\u4e00\u6587\u672c\u4f1a\u4ea7\u751f\u4e0d\u540c\u7684\u5e8f\u5217\u957f\u5ea6 \\(N\\)\u3002</p> </li> <li> <p>\u8bcd\u6c47\u91cf\u66f4\u5927\u7684\u6a21\u578b\u6bcf\u4e2a\u6807\u8bb0\u7684\u56f0\u60d1\u5ea6\u5f80\u5f80\u66f4\u4f4e\uff0c\u4f46\u6bcf\u4e2a\u53e5\u5b50\u5904\u7406\u7684\u6807\u8bb0\u6570\u4e5f\u66f4\u5c11\u3002</p> </li> <li> <p>\u6bcf\u5b57\u8282\u6bd4\u7279\u6570\uff08BPB\uff09\u6309\u7167\u6587\u672c\u4e2dUTF-8\u5b57\u8282\u6570\u800c\u975e\u6807\u8bb0\u6570\u8fdb\u884c\u5f52\u4e00\u5316\uff0c\u4f7f\u5176\u4e0e\u5206\u8bcd\u65b9\u5f0f\u65e0\u5173\uff1a</p> </li> </ul> \\[ \\text{BPB} = \\frac{-\\sum_{i} \\log_2 P(w_i \\mid w_{ <ul> <li>BERTScore\uff08Zhang\u7b49\u4eba\uff0c2020\uff09\u8d85\u8d8a\u4e86\u8868\u9762\u7684n-gram\u5339\u914d\uff0c\u5728\u5d4c\u5165\u7a7a\u95f4\u4e2d\u8ba1\u7b97\u76f8\u4f3c\u5ea6\u3002\u5019\u9009\u4e2d\u7684\u6bcf\u4e2a\u6807\u8bb0\u4e0e\u5176\u5728\u53c2\u8003\u4e2d\u6700\u76f8\u4f3c\u7684\u6807\u8bb0\u8fdb\u884c\u5339\u914d\uff0c\u4f7f\u7528\u4e0a\u4e0b\u6587\u5d4c\u5165\uff08\u901a\u5e38\u6765\u81ea\u9884\u8bad\u7ec3\u7684BERT\u6a21\u578b\uff09\u7684\u4f59\u5f26\u76f8\u4f3c\u5ea6\u3002\u5206\u6570\u6c47\u603b\u4e3a\u7cbe\u786e\u7387\u3001\u53ec\u56de\u7387\u548cF1\uff1a</li> </ul> \\[R_{\\text{BERT}} = \\frac{1}{|r|} \\sum_{r_i \\in r} \\max_{c_j \\in c} \\cos(r_i, c_j), \\quad P_{\\text{BERT}} = \\frac{1}{|c|} \\sum_{c_j \\in c} \\max_{r_i \\in r} \\cos(c_j, r_i)\\] <ul> <li> <p>\u5176\u4e2d \\(r_i\\) \u548c \\(c_j\\) \u662f\u53c2\u8003\u548c\u5019\u9009\u6807\u8bb0\u7684\u4e0a\u4e0b\u6587\u5d4c\u5165\u3002\u8fd9\u6355\u6349\u4e86n-gram\u6307\u6807\u65e0\u6cd5\u6355\u6349\u7684\u8bed\u4e49\u76f8\u4f3c\u6027\uff1a\"automobile\"\u548c\"car\"\u5f97\u5206\u5f88\u9ad8\uff0c\u56e0\u4e3a\u5b83\u4eec\u7684BERT\u5d4c\u5165\u76f8\u4f3c\uff0c\u5c3d\u7ba1\u5b83\u4eec\u6ca1\u6709\u5171\u4eab\u4efb\u4f55\u5b57\u7b26\u3002</p> </li> <li> <p>BLEURT\uff08Sellam\u7b49\u4eba\uff0c2020\uff09\u5728\u6b64\u57fa\u7840\u4e0a\u66f4\u8fdb\u4e00\u6b65\uff0c\u76f4\u63a5\u5728\u4eba\u5de5\u8d28\u91cf\u5224\u65ad\u4e0a\u5fae\u8c03BERT\u6a21\u578b\u3002\u7ed9\u5b9a\u4e00\u4e2a\u53c2\u8003\u548c\u5019\u9009\u5bf9\uff0c\u5b83\u8f93\u51fa\u4e00\u4e2a\u6807\u91cf\u8d28\u91cf\u5206\u6570\u3002BLEURT\u5728\u5408\u6210\u6570\u636e\uff08\u7531BLEU\u548cMETEOR\u7b49\u6307\u6807\u8bc4\u5206\u7684\u53c2\u8003\u7ffb\u8bd1\u7684\u968f\u673a\u6270\u52a8\uff09\u4e0a\u8bad\u7ec3\uff0c\u7136\u540e\u5728\u4eba\u5de5\u8bc4\u5206\u4e0a\u5fae\u8c03\u3002\u5b83\u4e0e\u4eba\u7c7b\u5224\u65ad\u7684\u76f8\u5173\u6027\u4f18\u4e8e\u4efb\u4f55\u8868\u9762\u7ea7\u6307\u6807\u3002</p> </li> <li> <p>COMET\uff08\u7ffb\u8bd1\u8bc4\u4f30\u8de8\u8bed\u8a00\u4f18\u5316\u6307\u6807\uff0cRei\u7b49\u4eba\uff0c2020\uff09\u662f\u4e00\u4e2a\u7528\u4e8e\u673a\u5668\u7ffb\u8bd1\u7684\u5b66\u4e60\u5ea6\u91cf\uff0c\u5b83\u540c\u65f6\u4ee5\u6e90\u53e5\u3001\u53c2\u8003\u548c\u5019\u9009\u4f5c\u4e3a\u6761\u4ef6\u2014\u2014\u800c\u4e0d\u4ec5\u4ec5\u662f\u53c2\u8003\u548c\u5019\u9009\u3002\u5b83\u4f7f\u7528\u591a\u8bed\u8a00\u7f16\u7801\u5668\uff08XLM-R\uff09\u5d4c\u5165\u4e09\u8005\uff0c\u5e76\u9884\u6d4b\u8d28\u91cf\u5206\u6570\u3002\u901a\u8fc7\u770b\u5230\u6e90\u53e5\uff0cCOMET\u53ef\u4ee5\u68c0\u6d4b\u4ec5\u57fa\u4e8e\u53c2\u8003\u7684\u6307\u6807\u6240\u9057\u6f0f\u7684\u610f\u4e49\u9519\u8bef\uff08\u4f8b\u5982\uff0c\u6d41\u7545\u4f46\u4e8b\u5b9e\u9519\u8bef\u7684\u7ffb\u8bd1\uff09\u3002</p> </li> <li> <p>\u5927\u8bed\u8a00\u6a21\u578b\u4f5c\u4e3a\u88c1\u5224\uff08LLM-as-judge\uff09\u662f\u5927\u89c4\u6a21\u8bc4\u4f30\u7684\u73b0\u4ee3\u65b9\u6cd5\u3002\u4e0d\u518d\u8ba1\u7b97\u4e0e\u53c2\u8003\u7684\u6307\u6807\uff0c\u800c\u662f\u8ba9\u4e00\u4e2a\u5f3a\u5927\u7684\u8bed\u8a00\u6a21\u578b\uff08GPT-4\u3001Claude\uff09\u88ab\u63d0\u793a\u8bc4\u4f30\u6a21\u578b\u8f93\u51fa\u7684\u8d28\u91cf\u3002\u88c1\u5224\u63a5\u6536\u8f93\u5165\u3001\u6a21\u578b\u7684\u56de\u590d\u4ee5\u53ca\u53ef\u9009\u7684\u53c2\u8003\u7b54\u6848\uff0c\u5e76\u7ed9\u51fa\u8bc4\u5206\uff08\u4f8b\u59821-5\u5206\uff09\u6216\u6210\u5bf9\u504f\u597d\uff08\u56de\u590dA\u4f18\u4e8e\u56de\u590dB\uff09\u3002</p> </li> <li> <p>\u6210\u5bf9\u6bd4\u8f83\uff08\u7528\u4e8eChatbot Arena\uff09\u662f\u6700\u53ef\u9760\u7684LLM-as-judge\u683c\u5f0f\u3002\u88c1\u5224\u770b\u5230\u4e24\u4e2a\u56de\u590d\u5e76\u9009\u62e9\u66f4\u597d\u7684\u90a3\u4e2a\uff0c\u800c\u4e0d\u662f\u7ed9\u51fa\u7edd\u5bf9\u5206\u6570\u3002\u8fd9\u907f\u514d\u4e86\u6821\u51c6\u95ee\u9898\uff08\u4e0d\u540c\u7684\u88c1\u5224\u53ef\u80fd\u5bf9\"3/5\"\u6709\u4e0d\u540c\u7684\u57fa\u51c6\uff09\u3002\u7ed3\u679c\u6c47\u603b\u4e3aElo\u8bc4\u5206\uff08\u6e90\u81ea\u56fd\u9645\u8c61\u68cb\uff09\uff0c\u6bcf\u4e2a\u6a21\u578b\u4ece\u4e00\u4e2a\u57fa\u51c6\u8bc4\u5206\u5f00\u59cb\uff0c\u6839\u636e\u4e0e\u5176\u4ed6\u6a21\u578b\u7684\u5bf9\u6218\u80dc\u8d1f\u589e\u51cf\u5206\u6570\u3002\u6a21\u578b \\(A\\) \u5bf9\u6a21\u578b \\(B\\) \u7684\u9884\u671f\u83b7\u80dc\u6982\u7387\u4e3a\uff1a</p> </li> </ul> \\[P(A \\succ B) = \\frac{1}{1 + 10^{(R_B - R_A) / 400}}\\] <ul> <li> <p>\u5176\u4e2d \\(R_A, R_B\\) \u662fElo\u8bc4\u5206\u3002\u6bcf\u6b21\u6bd4\u8f83\u540e\uff0c\u8bc4\u5206\u66f4\u65b0\uff1a\\(R_A' = R_A + K(S - P(A \\succ B))\\)\uff0c\u5176\u4e2d \\(S \\in \\{0, 1\\}\\) \u662f\u5b9e\u9645\u7ed3\u679c\uff0c\\(K\\) \u63a7\u5236\u66f4\u65b0\u5e45\u5ea6\u3002\u6301\u7eed\u51fb\u8d25\u5f3a\u5bf9\u624b\u7684\u6a21\u578b\u5feb\u901f\u4e0a\u5347\uff1b\u8f93\u7ed9\u5f31\u5bf9\u624b\u7684\u6a21\u578b\u4e0b\u964d\u3002</p> </li> <li> <p>\u4f4d\u7f6e\u504f\u7f6e\u662fLLM\u88c1\u5224\u7684\u4e00\u4e2a\u5df2\u77e5\u95ee\u9898\uff1a\u5b83\u4eec\u503e\u5411\u4e8e\u504f\u597d\u5148\u5c55\u793a\u7684\u56de\u590d\uff08\u6216\u8005\u5728\u67d0\u4e9b\u6a21\u578b\u4e2d\uff0c\u540e\u5c55\u793a\u7684\u56de\u590d\uff09\u3002\u4ea4\u6362\uff08\u4ee5\u4e24\u79cd\u987a\u5e8f\u5bf9\u6bcf\u5bf9\u8fdb\u884c\u8bc4\u4f30\uff09\u5e76\u5e73\u5747\u7ed3\u679c\u53ef\u4ee5\u7f13\u89e3\u8fd9\u4e00\u95ee\u9898\u3002</p> </li> <li> <p>\u5197\u957f\u504f\u7f6e\u662f\u53e6\u4e00\u4e2a\u95ee\u9898\uff1a\u88c1\u5224\u503e\u5411\u4e8e\u504f\u597d\u66f4\u957f\u3001\u66f4\u8be6\u7ec6\u7684\u56de\u590d\uff0c\u5373\u4f7f\u7b80\u6d01\u7684\u56de\u7b54\u66f4\u597d\u3002</p> </li> <li> <p>\u81ea\u4e00\u81f4\u6027\u68c0\u67e5\u88c1\u5224\u5728\u591a\u6b21\u8bc4\u4f30\u540c\u4e00\u8f93\u5165\u65f6\u662f\u5426\u7ed9\u51fa\u76f8\u540c\u7684\u8bc4\u5206\u3002\u9ad8\u65b9\u5dee\u8868\u660e\u8bc4\u4f30\u4fe1\u53f7\u5b58\u5728\u566a\u97f3\u3002</p> </li> <li> <p>\u6807\u6ce8\u8005\u95f4\u4e00\u81f4\u6027\uff08Cohen's kappa\u6216Krippendorff's alpha\uff09\u8861\u91cf\u591a\u4e2a\u88c1\u5224\u662f\u5426\u4e00\u81f4\uff0c\u4e3a\u8bc4\u4f30\u53ef\u9760\u6027\u63d0\u4f9b\u4e86\u4e00\u4e2a\u4e0a\u9650\u3002</p> </li> <li> <p>\u6570\u636e\u6c61\u67d3\u662f\u4e00\u4e2a\u5173\u952e\u95ee\u9898\uff1a\u5982\u679c\u8bc4\u4f30\u6570\u636e\u51fa\u73b0\u5728\u6a21\u578b\u7684\u8bad\u7ec3\u96c6\u4e2d\uff0c\u57fa\u51c6\u5206\u6570\u5c31\u4f1a\u88ab\u5938\u5927\u4e14\u6beb\u65e0\u610f\u4e49\u3002</p> </li> <li> <p>\u8fd9\u5bf9\u4e8e\u5728\u7f51\u9875\u6293\u53d6\u6570\u636e\u4e0a\u8bad\u7ec3\u7684\u5927\u8bed\u8a00\u6a21\u578b\u5c24\u5176\u6709\u95ee\u9898\uff0c\u56e0\u4e3a\u6d41\u884c\u7684\u57fa\u51c6\u5f88\u53ef\u80fd\u51fa\u73b0\u5728\u5176\u4e2d\u3002\u7f13\u89e3\u7b56\u7565\u5305\u62ec\uff1a\u4f7f\u7528\u672a\u516c\u5f00\u53d1\u5e03\u7684\u4fdd\u7559\u6d4b\u8bd5\u96c6\u3001\u521b\u5efa\u5b9a\u671f\u91cd\u65b0\u751f\u6210\u95ee\u9898\u7684\u52a8\u6001\u57fa\u51c6\u3001\u91d1\u4e1d\u96c0\u5b57\u7b26\u4e32\uff08\u5d4c\u5165\u5728\u57fa\u51c6\u6570\u636e\u4e2d\u7528\u4e8e\u68c0\u6d4b\u6cc4\u9732\u7684\u552f\u4e00\u6807\u8bc6\u7b26\uff09\uff0c\u4ee5\u53ca\u6bd4\u8f83\u5728\u6c61\u67d3\u4e0e\u6e05\u6d01\u5b50\u96c6\u4e0a\u7684\u6027\u80fd\u3002</p> </li> <li> <p>\u6807\u51c6NLU\u57fa\u51c6\u8bc4\u4f30\u8de8\u591a\u79cd\u4efb\u52a1\u7684\u8bed\u8a00\u7406\u89e3\u80fd\u529b\u3002</p> </li> <li> <p>GLUE\uff08\u901a\u7528\u8bed\u8a00\u7406\u89e3\u8bc4\u4f30\uff09\u548cSuperGLUE\u662f\u591a\u4efb\u52a1\u57fa\u51c6\uff0c\u6db5\u76d6\u60c5\u611f\u5206\u6790\uff08SST-2\uff09\u3001\u6587\u672c\u76f8\u4f3c\u5ea6\uff08STS-B\uff09\u3001\u81ea\u7136\u8bed\u8a00\u63a8\u7406\uff08MNLI\u3001RTE\uff09\u3001\u5171\u6307\u6d88\u89e3\uff08WSC\uff09\u548c\u95ee\u7b54\uff08BoolQ\uff09\u3002</p> </li> <li> <p>\u6a21\u578b\u5728\u6bcf\u4e2a\u4efb\u52a1\u4e0a\u5206\u522b\u8bc4\u4f30\uff0c\u5e76\u6309\u805a\u5408\u6307\u6807\u6253\u5206\u3002GLUE\u73b0\u5728\u88ab\u8ba4\u4e3a\u5df2\u7ecf\u9971\u548c\uff08\u6a21\u578b\u5728\u5927\u591a\u6570\u4efb\u52a1\u4e0a\u5df2\u8d85\u8fc7\u4eba\u7c7b\u8868\u73b0\uff09\uff1bSuperGLUE\u4ecd\u7136\u66f4\u5177\u6311\u6218\u6027\u3002</p> </li> <li> <p>MMLU\uff08\u5927\u89c4\u6a21\u591a\u4efb\u52a1\u8bed\u8a00\u7406\u89e3\uff09\u901a\u8fc7\u591a\u9879\u9009\u62e9\u9898\u8bc4\u4f3057\u4e2a\u5b66\u672f\u79d1\u76ee\uff08\u6570\u5b66\u3001\u5386\u53f2\u3001\u6cd5\u5f8b\u3001\u533b\u5b66\u3001\u8ba1\u7b97\u673a\u79d1\u5b66\u7b49\uff09\u4e2d\u7684\u77e5\u8bc6\u548c\u63a8\u7406\u80fd\u529b\u3002</p> </li> <li> <p>\u5b83\u6d4b\u8bd5\u6a21\u578b\u5728\u9884\u8bad\u7ec3\u671f\u95f4\u662f\u5426\u5438\u6536\u4e86\u5e7f\u6cdb\u7684\u77e5\u8bc6\u3002\u5206\u6570\u6309\u79d1\u76ee\u62a5\u544a\u5e76\u4f5c\u4e3a\u5b8f\u5e73\u5747\u7ed9\u51fa\u3002</p> </li> <li> <p>MMLU-Pro\u589e\u52a0\u4e86\u66f4\u56f0\u96be\u7684\u591a\u6b65\u63a8\u7406\u95ee\u9898\uff0c\u670910\u4e2a\u9009\u9879\u800c\u975e4\u4e2a\u3002</p> </li> <li> <p>HellaSwag\u901a\u8fc7\u8981\u6c42\u6a21\u578b\u9009\u62e9\u4e00\u4e2a\u573a\u666f\u6700\u5408\u7406\u7684\u7eed\u5199\u6765\u6d4b\u8bd5\u5e38\u8bc6\u63a8\u7406\u3002\u9519\u8bef\u7684\u7b54\u6848\u662f\u901a\u8fc7\u6a21\u578b\u5bf9\u6297\u6027\u751f\u6210\u7684\uff0c\u8868\u9762\u770b\u4f3c\u5408\u7406\u4f46\u8bed\u4e49\u9519\u8bef\u3002</p> </li> <li> <p>WinoGrande\u901a\u8fc7\u4ec5\u4e00\u8bcd\u4e4b\u5dee\u7684\u6781\u5c0f\u5bf9\u6d4b\u8bd5\u5e38\u8bc6\u5171\u6307\u6d88\u89e3\u3002</p> </li> <li> <p>ARC\uff08AI2\u63a8\u7406\u6311\u6218\uff09\u4f7f\u7528\u5c0f\u5b66\u79d1\u5b66\u95ee\u9898\uff0c\u5206\u4e3a\u7b80\u5355\u548c\u6311\u6218\u96c6\uff0c\u6d4b\u8bd5\u4e8b\u5b9e\u548c\u63a8\u7406\u80fd\u529b\u3002</p> </li> <li> <p>\u63a8\u7406\u548c\u6570\u5b66\u57fa\u51c6\u8bc4\u4f30\u533a\u5206\u5f3a\u5927LLM\u4e0e\u5f31\u5c0fLLM\u7684\u95ee\u9898\u89e3\u51b3\u80fd\u529b\u3002</p> </li> <li> <p>GSM8K\uff08\u5c0f\u5b66\u6570\u5b668K\uff09\u5305\u542b8,500\u9053\u5c0f\u5b66\u7b97\u672f\u5e94\u7528\u9898\uff0c\u9700\u8981\u591a\u6b65\u7b97\u672f\u63a8\u7406\u3002\u5b83\u662f\u57fa\u7840\u6570\u5b66\u63a8\u7406\u548c\u8bc4\u4f30\u94fe\u5f0f\u601d\u7ef4\u63d0\u793a\uff08\u6587\u4ef604\uff09\u7684\u6807\u51c6\u57fa\u51c6\u3002</p> </li> <li> <p>MATH\u662f\u4e00\u4e2a\u66f4\u96be\u7684\u6570\u636e\u96c6\uff0c\u5305\u542b\u4ee3\u6570\u3001\u6570\u8bba\u3001\u51e0\u4f55\u3001\u8ba1\u6570\u548c\u6982\u7387\u65b9\u9762\u7684\u7ade\u8d5b\u7ea7\u6570\u5b66\u95ee\u9898\u3002\u95ee\u9898\u9700\u8981\u591a\u6b65\u7b26\u53f7\u63a8\u7406\uff0cMATH-500\u662f\u5e38\u7528\u7684500\u9898\u5b50\u96c6\u3002</p> </li> <li> <p>AIME\uff08\u7f8e\u56fd\u6570\u5b66\u9080\u8bf7\u8d5b\uff09\u95ee\u9898\u662f\u7ade\u8d5b\u7ea7\u7684\uff1a\u6b63\u786e\u89e3\u7b54\u9700\u8981\u8de8\u8d8a\u591a\u4e2a\u6b65\u9aa4\u7684\u6df1\u5ea6\u6570\u5b66\u63a8\u7406\u3002DeepSeek-R1\u5728AIME 2024\u4e0a\u5f97\u5206\u4e3a79.8%\uff0c\u5c55\u793a\u4e86\u7ecf\u8fc7RL\u8bad\u7ec3\u7684\u63a8\u7406\u6a21\u578b\uff08\u6587\u4ef605\uff09\u53ef\u4ee5\u63a5\u8fd1\u4eba\u7c7b\u9ad8\u624b\u3002</p> </li> <li> <p>HumanEval\u548cMBPP\uff08\u57fa\u7840\u7f16\u7a0b\u95ee\u9898\uff09\u901a\u8fc7\u68c0\u67e5\u6a21\u578b\u751f\u6210\u7684\u4ee3\u7801\u662f\u5426\u901a\u8fc7\u5355\u5143\u6d4b\u8bd5\u6765\u8bc4\u4f30\u4ee3\u7801\u751f\u6210\u80fd\u529b\u3002HumanEval\u5305\u542b164\u4e2aPython\u95ee\u9898\uff0c\u5305\u62ec\u51fd\u6570\u7b7e\u540d\u548c\u6587\u6863\u5b57\u7b26\u4e32\uff1b\u6a21\u578b\u9700\u8981\u751f\u6210\u51fd\u6570\u4f53\u3002</p> </li> <li> <p>\u6307\u6807\u662fpass@k\uff1a\u5728 \\(k\\) \u4e2a\u751f\u6210\u7684\u89e3\u51b3\u65b9\u6848\u4e2d\u81f3\u5c11\u6709\u4e00\u4e2a\u901a\u8fc7\u6240\u6709\u6d4b\u8bd5\u7684\u6982\u7387\u3002\u5bf9\u4e8e\u5355\u4e2a\u6837\u672c\uff1a</p> </li> </ul> \\[\\text{pass@}k = 1 - \\frac{\\binom{n-c}{k}}{\\binom{n}{k}}\\] <ul> <li> <p>\u5176\u4e2d \\(n\\) \u662f\u751f\u6210\u7684\u6837\u672c\u603b\u6570\uff0c\\(c\\) \u662f\u901a\u8fc7\u7684\u6570\u91cf\u3002\u8fd9\u4e2a\u516c\u5f0f\u4fee\u6b63\u4e86\u7b80\u5355\u53d6 \\(k\\) \u4e2a\u6837\u672c\u4e2d\u6700\u597d\u7ed3\u679c\u7684\u504f\u5dee\u3002</p> </li> <li> <p>SWE-bench\u66f4\u8fdb\u4e00\u6b65\uff0c\u8bc4\u4f30\u6a21\u578b\u80fd\u5426\u901a\u8fc7\u4fee\u6539\u73b0\u6709\u4ee3\u7801\u5e93\u6765\u89e3\u51b3\u771f\u5b9e\u7684GitHub\u95ee\u9898\u2014\u2014\u8fd9\u662f\u5bf9\u5b9e\u9645\u8f6f\u4ef6\u5de5\u7a0b\u80fd\u529b\u7684\u66f4\u56f0\u96be\u6d4b\u8bd5\u3002</p> </li> <li> <p>GPQA\uff08\u7814\u7a76\u751f\u7ea7Google-proof\u95ee\u7b54\uff09\u5305\u542b\u751f\u7269\u5b66\u3001\u7269\u7406\u5b66\u548c\u5316\u5b66\u9886\u57df\u7684\u4e13\u5bb6\u7ea7\u95ee\u9898\uff0c\u5373\u4f7f\u662f\u9886\u57df\u4e13\u5bb6\u4e5f\u5f88\u96be\u89e3\u7b54\u3002\u5b83\u6d4b\u8bd5\u6a21\u578b\u662f\u5426\u5177\u6709\u771f\u6b63\u7684\u7406\u89e3\u80fd\u529b\u800c\u975e\u6a21\u5f0f\u5339\u914d\u3002\"Diamond\"\u5b50\u96c6\u662f\u6700\u96be\u7684\u90e8\u5206\u3002</p> </li> <li> <p>\u5b89\u5168\u548c\u5bf9\u9f50\u57fa\u51c6\u8bc4\u4f30\u6a21\u578b\u662f\u5426\u6709\u7528\u3001\u65e0\u5bb3\u548c\u8bda\u5b9e\u3002</p> </li> <li> <p>TruthfulQA\u6d4b\u8bd5\u6a21\u578b\u662f\u5426\u590d\u73b0\u4e86\u5e38\u89c1\u7684\u8bef\u89e3\u3002\u95ee\u9898\u8bbe\u8ba1\u4e3a\u6700\u5e38\u89c1\u7684\u4e92\u8054\u7f51\u7b54\u6848\u662f\u9519\u8bef\u7684\uff08\u4f8b\u5982\uff0c\"\u5982\u679c\u541e\u4e0b\u53e3\u9999\u7cd6\u4f1a\u600e\u6837\uff1f\"\uff0c\u5e38\u89c1\u7684\u8c23\u8a00\u662f\u5b83\u4f1a\u5728\u80c3\u91cc\u505c\u75597\u5e74\uff0c\u4f46\u4e8b\u5b9e\u662f\u5b83\u4f1a\u6b63\u5e38\u901a\u8fc7\uff09\u3002\u90a3\u4e9b\u8bb0\u5fc6\u4e86\u6d41\u884c\u4f46\u4e0d\u6b63\u786e\u8bf4\u6cd5\u7684\u6a21\u578b\u5f97\u5206\u5f88\u4f4e\u3002</p> </li> <li> <p>BBQ\uff08\u95ee\u7b54\u504f\u7f6e\u57fa\u51c6\uff09\u6d4b\u8bd5\u5728\u5e74\u9f84\u3001\u6027\u522b\u3001\u79cd\u65cf\u548c\u5b97\u6559\u7b49\u7c7b\u522b\u4e0a\u7684\u793e\u4f1a\u504f\u7f6e\u3002\u95ee\u9898\u7684\u7ed3\u6784\u4f7f\u5f97\u6709\u504f\u7f6e\u7684\u6a21\u578b\u4f1a\u7cfb\u7edf\u5730\u9009\u62e9\u523b\u677f\u5370\u8c61\u7684\u7b54\u6848\u3002Toxigen\u8bc4\u4f30\u6a21\u578b\u9488\u5bf9\u7279\u5b9a\u4eba\u53e3\u7fa4\u4f53\u751f\u6210\u6709\u5bb3\u5185\u5bb9\u7684\u503e\u5411\u3002</p> </li> <li> <p>MT-Bench\u4f7f\u752880\u4e2a\u7cbe\u5fc3\u8bbe\u8ba1\u7684\u95ee\u9898\u8bc4\u4f30\u591a\u8f6e\u5bf9\u8bdd\u80fd\u529b\uff0c\u6db5\u76d6\u5199\u4f5c\u3001\u89d2\u8272\u626e\u6f14\u3001\u63a8\u7406\u3001\u6570\u5b66\u3001\u7f16\u7a0b\u3001\u4fe1\u606f\u62bd\u53d6\u3001STEM\u548c\u4eba\u6587\u5b66\u79d1\u3002LLM\u88c1\u5224\uff08GPT-4\uff09\u63091-10\u5206\u5bf9\u56de\u590d\u8bc4\u5206\u3002\u591a\u8f6e\u683c\u5f0f\u6d4b\u8bd5\u6a21\u578b\u662f\u5426\u80fd\u8fdb\u884c\u540e\u7eed\u63d0\u95ee\u3001\u4fdd\u6301\u4e0a\u4e0b\u6587\u548c\u5904\u7406\u6f84\u6e05\u8bf7\u6c42\u3002</p> </li> <li> <p>Chatbot Arena\uff08LMSYS\uff09\u4f7f\u7528\u771f\u5b9e\u7528\u6237\u5bf9\u533f\u540d\u6a21\u578b\u8fdb\u884c\u76f2\u6cd5\u6210\u5bf9\u6bd4\u8f83\u3002\u7528\u6237\u63d0\u4ea4\u63d0\u793a\u5e76\u5bf9\u66f4\u597d\u7684\u56de\u590d\u6295\u7968\uff0c\u800c\u4e0d\u77e5\u9053\u662f\u54ea\u4e2a\u6a21\u578b\u751f\u6210\u7684\u3002\u7531\u6b64\u4ea7\u751f\u7684Elo\u6392\u884c\u699c\u88ab\u8ba4\u4e3a\u662f\u5bf9\u901a\u7528LLM\u8d28\u91cf\u6700\u751f\u6001\u6709\u6548\u7684\u8bc4\u4f30\uff0c\u56e0\u4e3a\u5b83\u53cd\u6620\u4e86\u771f\u5b9e\u7528\u6237\u5728\u591a\u6837\u5316\u3001\u672a\u7ecf\u7b56\u5212\u7684\u63d0\u793a\u4e0a\u7684\u504f\u597d\u3002</p> </li> <li> <p>AlpacaEval\u901a\u8fc7\u5728\u4e00\u7ec4\u56fa\u5b9a\u7684\u6307\u4ee4\u4e0a\u5c06\u6a21\u578b\u8f93\u51fa\u4e0e\u53c2\u8003\u6a21\u578b\uff08GPT-4\uff09\u8fdb\u884c\u6bd4\u8f83\u6765\u81ea\u52a8\u5316\u6210\u5bf9\u8bc4\u4f30\u3002\u7531\u88c1\u5224\u6a21\u578b\u51b3\u5b9a\u80dc\u7387\u3002</p> </li> <li> <p>AlpacaEval 2.0\u4f7f\u7528\u957f\u5ea6\u63a7\u5236\u7684\u80dc\u7387\u6765\u7ea0\u6b63\u5197\u957f\u504f\u7f6e\u3002</p> </li> <li> <p>\u4efb\u52a1\u7279\u5b9a\u8bc4\u4f30\u9700\u8981\u9488\u5bf9\u4e13\u4e1a\u9886\u57df\u91cf\u8eab\u5b9a\u5236\u7684\u6307\u6807\u3002</p> </li> <li> <p>\u8bcd\u9519\u8bef\u7387\uff08WER\uff09\u7528\u4e8e\u8bed\u97f3\u8bc6\u522b\uff1a\\(\\text{WER} = (S + D + I) / N\\)\uff0c\u5176\u4e2d \\(S\\)\u3001\\(D\\)\u3001\\(I\\) \u5206\u522b\u662f\u66ff\u6362\u3001\u5220\u9664\u548c\u63d2\u5165\u9519\u8bef\uff0c\\(N\\) \u662f\u53c2\u8003\u8bcd\u7684\u6570\u91cf\u3002\u8fd9\u662f\u6309\u53c2\u8003\u957f\u5ea6\u5f52\u4e00\u5316\u7684\u7f16\u8f91\u8ddd\u79bb\uff08\u6587\u4ef602\uff09\uff0c\u5e94\u7528\u4e8e\u8bcd\u6c47\u7ea7\u522b\u3002</p> </li> <li> <p>\u69fd\u4f4dF1\u7528\u4e8e\u4efb\u52a1\u5bfc\u5411\u7684\u5bf9\u8bdd\u7cfb\u7edf\uff0c\u8861\u91cf\u6a21\u578b\u662f\u5426\u6b63\u786e\u5730\u4ece\u7528\u6237\u8bdd\u8bed\u4e2d\u63d0\u53d6\u7ed3\u6784\u5316\u4fe1\u606f\uff08\u4f8b\u5982\uff0c\u4ece\"\u5e2e\u6211\u8ba2\u4e00\u5f20\u660e\u5929\u53bb\u5df4\u9ece\u7684\u673a\u7968\"\u4e2d\u63d0\u53d6\"\u76ee\u7684\u5730\uff1a\u5df4\u9ece\"\u548c\"\u65e5\u671f\uff1a\u660e\u5929\"\uff09\u3002</p> </li> <li> <p>\u5f15\u7528\u51c6\u786e\u7387\u7528\u4e8eRAG\u7cfb\u7edf\uff08\u6587\u4ef605\uff09\uff0c\u68c0\u67e5\u6a21\u578b\u751f\u6210\u7684\u5f15\u7528\u662f\u5426\u786e\u5b9e\u652f\u6301\u6240\u63d0\u51fa\u7684\u4e3b\u5f20\u3002\u5c06\u4e3b\u5f20\u4e0e\u68c0\u7d22\u5230\u7684\u6bb5\u843d\u8fdb\u884c\u9a8c\u8bc1\uff0c\u6307\u6807\u7edf\u8ba1\u5b8c\u5168\u652f\u6301\u3001\u90e8\u5206\u652f\u6301\u548c\u4e0d\u652f\u6301\u7684\u4e3b\u5f20\u6bd4\u4f8b\u3002</p> </li> <li> <p>\u8bc4\u4f30\u9677\u9631\u5f88\u5e38\u89c1\uff0c\u53ef\u80fd\u4f7f\u6574\u4e2a\u57fa\u51c6\u6bd4\u8f83\u65e0\u6548\u3002</p> </li> <li> <p>\u5bf9\u6d4b\u8bd5\u6295\u5176\u6240\u597d\uff1a\u4f18\u5316\u57fa\u51c6\u6027\u80fd\u800c\u975e\u771f\u6b63\u80fd\u529b\u3002\u5728MMLU\u98ce\u683c\u7684\u591a\u9879\u9009\u62e9\u4e0a\u5fae\u8c03\u7684\u6a21\u578b\u5728MMLU\u4e0a\u5f97\u5206\u5f88\u9ad8\uff0c\u4f46\u5728\u4ee5\u5f00\u653e\u5f0f\u5f62\u5f0f\u63d0\u51fa\u7684\u76f8\u540c\u95ee\u9898\u4e0a\u53ef\u80fd\u5931\u8d25\u3002</p> </li> <li> <p>\u6307\u6807\u6e38\u620f\u5316\uff1a\u6a21\u578b\u53ef\u4ee5\u88ab\u4f18\u5316\u4ee5\u4ea7\u751f\u5728\u81ea\u52a8\u6307\u6807\u4e0a\u5f97\u5206\u5f88\u9ad8\u7684\u8f93\u51fa\uff08\u9ad8BLEU\u3001\u4f4e\u56f0\u60d1\u5ea6\uff09\uff0c\u4f46\u5e76\u975e\u771f\u6b63\u4f18\u79c0\u3002BLEU\u6700\u4f18\u7684\u7ffb\u8bd1\u5f80\u5f80\u662f\u5b89\u5168\u3001\u901a\u7528\u7684\u91ca\u4e49\uff0c\u800c\u975e\u81ea\u7136\u6d41\u7545\u7684\u7ffb\u8bd1\u3002</p> </li> <li> <p>\u57fa\u51c6\u9971\u548c\uff1a\u5f53\u6a21\u578b\u5728\u57fa\u51c6\u4e0a\u63a5\u8fd1\u6216\u8d85\u8fc7\u4eba\u7c7b\u8868\u73b0\u65f6\uff0c\u8be5\u57fa\u51c6\u5c31\u4e0d\u518d\u63d0\u4f9b\u4fe1\u606f\u3002GLUE\u3001SQuAD 1.1\u548c\u5176\u4ed6\u51e0\u4e2a\u57fa\u51c6\u73b0\u5728\u5df2\u7ecf\u9971\u548c\u3002</p> </li> <li> <p>\u8be5\u9886\u57df\u4e0d\u65ad\u521b\u5efa\u66f4\u96be\u7684\u65b0\u57fa\u51c6\uff0c\u4f46\u8fd9\u79cd\u521b\u5efa\u3001\u9971\u548c\u548c\u66ff\u6362\u7684\u5faa\u73af\u4f7f\u5f97\u7eb5\u5411\u6bd4\u8f83\u53d8\u5f97\u56f0\u96be\u3002</p> </li> <li> <p>\u4eba\u5de5\u8bc4\u4f30\u4ecd\u7136\u662f\u9ec4\u91d1\u6807\u51c6\uff0c\u4f46\u6210\u672c\u9ad8\u3001\u901f\u5ea6\u6162\u4e14\u96be\u4ee5\u590d\u73b0\u3002\u4e0d\u540c\u7684\u6807\u6ce8\u8005\u7fa4\u4f53\uff08\u4f17\u5305\u5de5\u4f5c\u8005\u4e0e\u9886\u57df\u4e13\u5bb6\u3001\u4e0d\u540c\u6587\u5316\u3001\u4e0d\u540c\u8bed\u8a00\uff09\u4f1a\u4ea7\u751f\u4e0d\u540c\u7684\u5224\u65ad\u3002\u62a5\u544a\u6807\u6ce8\u8005\u95f4\u4e00\u81f4\u6027\u548c\u6807\u6ce8\u8005\u4eba\u53e3\u7edf\u8ba1\u4fe1\u606f\u5bf9\u53ef\u590d\u73b0\u6027\u81f3\u5173\u91cd\u8981\u3002</p> </li> </ul>"},{"location":"chapter%2007%3A%20computational%20linguistics/04.%20transformers%20and%20language%20models/#colab","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216\u7b14\u8bb0\u672c\uff09","text":"<ol> <li> <p>\u4ece\u5934\u5b9e\u73b0\u4e00\u4e2a\u5b8c\u6574\u7684Transformer\u7f16\u7801\u5668\u5757\uff08\u591a\u5934\u6ce8\u610f\u529b\u3001\u524d\u9988\u7f51\u7edc\u3001\u6b8b\u5dee\u8fde\u63a5\u3001\u5c42\u5f52\u4e00\u5316\uff09\u3002\u5c06\u5176\u5e94\u7528\u4e8e\u4e00\u4e2a\u7b80\u5355\u7684\u5e8f\u5217\u5206\u7c7b\u4efb\u52a1\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef layer_norm(x, gamma, beta, eps=1e-5):\n    mean = x.mean(axis=-1, keepdims=True)\n    var = x.var(axis=-1, keepdims=True)\n    return gamma * (x - mean) / jnp.sqrt(var + eps) + beta\n\ndef multi_head_attention(Q, K, V, W_q, W_k, W_v, W_o, n_heads):\n    B, T, D = Q.shape\n    head_dim = D // n_heads\n\n    q = Q @ W_q  # (B, T, D)\n    k = K @ W_k\n    v = V @ W_v\n\n    # Reshape to (B, n_heads, T, head_dim)\n    q = q.reshape(B, T, n_heads, head_dim).transpose(0, 2, 1, 3)\n    k = k.reshape(B, T, n_heads, head_dim).transpose(0, 2, 1, 3)\n    v = v.reshape(B, T, n_heads, head_dim).transpose(0, 2, 1, 3)\n\n    scores = q @ k.transpose(0, 1, 3, 2) / jnp.sqrt(head_dim)\n    weights = jax.nn.softmax(scores, axis=-1)\n    out = (weights @ v).transpose(0, 2, 1, 3).reshape(B, T, D)\n    return out @ W_o, weights\n\ndef transformer_block(x, params):\n    # Pre-norm multi-head self-attention\n    normed = layer_norm(x, params['ln1_g'], params['ln1_b'])\n    attn_out, weights = multi_head_attention(\n        normed, normed, normed,\n        params['W_q'], params['W_k'], params['W_v'], params['W_o'],\n        n_heads=4\n    )\n    x = x + attn_out\n\n    # Pre-norm feed-forward\n    normed = layer_norm(x, params['ln2_g'], params['ln2_b'])\n    ff = jax.nn.gelu(normed @ params['W1'] + params['b1'])\n    ff = ff @ params['W2'] + params['b2']\n    x = x + ff\n    return x, weights\n\n# Initialise parameters\nd_model, d_ff, n_heads = 32, 128, 4\nkey = jax.random.PRNGKey(42)\nkeys = jax.random.split(key, 10)\n\nparams = {\n    'W_q': jax.random.normal(keys[0], (d_model, d_model)) * 0.05,\n    'W_k': jax.random.normal(keys[1], (d_model, d_model)) * 0.05,\n    'W_v': jax.random.normal(keys[2], (d_model, d_model)) * 0.05,\n    'W_o': jax.random.normal(keys[3], (d_model, d_model)) * 0.05,\n    'ln1_g': jnp.ones(d_model), 'ln1_b': jnp.zeros(d_model),\n    'ln2_g': jnp.ones(d_model), 'ln2_b': jnp.zeros(d_model),\n    'W1': jax.random.normal(keys[4], (d_model, d_ff)) * 0.05,\n    'b1': jnp.zeros(d_ff),\n    'W2': jax.random.normal(keys[5], (d_ff, d_model)) * 0.05,\n    'b2': jnp.zeros(d_model),\n}\n\n# Test with random input\nx = jax.random.normal(keys[6], (2, 8, d_model))  # batch=2, seq_len=8\nout, attn_weights = transformer_block(x, params)\nprint(f\"Input shape:  {x.shape}\")\nprint(f\"Output shape: {out.shape}\")\nprint(f\"Attention weights shape: {attn_weights.shape}\")  # (B, n_heads, T, T)\n\n# Visualise attention patterns for each head\nfig, axes = plt.subplots(1, 4, figsize=(16, 3.5))\nfor h in range(4):\n    im = axes[h].imshow(attn_weights[0, h], cmap='Blues', vmin=0)\n    axes[h].set_title(f\"Head {h}\")\n    axes[h].set_xlabel(\"Key pos\"); axes[h].set_ylabel(\"Query pos\")\nplt.suptitle(\"Multi-Head Attention Patterns\")\nplt.tight_layout(); plt.show()\n</code></pre></p> </li> <li> <p>\u5b9e\u73b0\u56e0\u679c\uff08\u81ea\u56de\u5f52\uff09\u6ce8\u610f\u529b\u63a9\u7801\uff0c\u5e76\u4e0e\u53cc\u5411\u6ce8\u610f\u529b\u8fdb\u884c\u6bd4\u8f83\u3002\u5c55\u793a\u63a9\u7801\u5982\u4f55\u9632\u6b62\u4fe1\u606f\u4ece\u672a\u6765\u6d41\u5411\u8fc7\u53bb\u7684\u6807\u8bb0\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef attention(Q, K, V, mask=None):\n    d_k = Q.shape[-1]\n    scores = Q @ K.T / jnp.sqrt(d_k)\n    if mask is not None:\n        scores = jnp.where(mask, scores, -1e9)\n    weights = jax.nn.softmax(scores, axis=-1)\n    return weights @ V, weights\n\nseq_len, d_model = 6, 8\nkey = jax.random.PRNGKey(0)\nk1, k2, k3 = jax.random.split(key, 3)\nQ = jax.random.normal(k1, (seq_len, d_model))\nK = jax.random.normal(k2, (seq_len, d_model))\nV = jax.random.normal(k3, (seq_len, d_model))\n\n# Bidirectional (encoder-style): all positions visible\nbidir_mask = jnp.ones((seq_len, seq_len), dtype=bool)\nbidir_out, bidir_weights = attention(Q, K, V, bidir_mask)\n\n# Causal (decoder-style): only past and current positions visible\ncausal_mask = jnp.tril(jnp.ones((seq_len, seq_len), dtype=bool))\ncausal_out, causal_weights = attention(Q, K, V, causal_mask)\n\nfig, axes = plt.subplots(1, 3, figsize=(14, 4))\ntokens = [f\"t{i}\" for i in range(seq_len)]\n\naxes[0].imshow(bidir_weights, cmap='Blues', vmin=0, vmax=0.5)\naxes[0].set_title(\"Bidirectional Attention\\n(BERT-style)\")\naxes[0].set_xticks(range(seq_len)); axes[0].set_xticklabels(tokens)\naxes[0].set_yticks(range(seq_len)); axes[0].set_yticklabels(tokens)\n\naxes[1].imshow(causal_mask.astype(float), cmap='Greys', vmin=0, vmax=1)\naxes[1].set_title(\"Causal Mask\\n(1 = allowed, 0 = blocked)\")\naxes[1].set_xticks(range(seq_len)); axes[1].set_xticklabels(tokens)\naxes[1].set_yticks(range(seq_len)); axes[1].set_yticklabels(tokens)\n\naxes[2].imshow(causal_weights, cmap='Blues', vmin=0, vmax=0.5)\naxes[2].set_title(\"Causal Attention\\n(GPT-style)\")\naxes[2].set_xticks(range(seq_len)); axes[2].set_xticklabels(tokens)\naxes[2].set_yticks(range(seq_len)); axes[2].set_yticklabels(tokens)\n\nfor ax in axes:\n    ax.set_xlabel(\"Key\"); ax.set_ylabel(\"Query\")\nplt.tight_layout(); plt.show()\n\n# Verify: in causal attention, output at position i depends only on positions &lt;= i\nprint(\"Causal attention weight at position 2 (should only attend to 0, 1, 2):\")\nprint(f\"  Weights: {causal_weights[2]}\")\nprint(f\"  Sum of future weights (should be ~0): {causal_weights[2, 3:].sum():.6f}\")\n</code></pre></p> </li> <li> <p>\u5b9e\u73b0LoRA\uff08\u4f4e\u79e9\u9002\u914d\uff09\uff0c\u5e76\u5c55\u793a\u5b83\u5982\u4f55\u4ee5\u8fdc\u5c11\u4e8e\u5168\u91cf\u5fae\u8c03\u7684\u53ef\u8bad\u7ec3\u53c2\u6570\u6765\u4fee\u6539\u6743\u91cd\u77e9\u9635\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\nd_model = 256\nrank = 4  # LoRA rank (much smaller than d_model)\n\nkey = jax.random.PRNGKey(42)\nk1, k2, k3 = jax.random.split(key, 3)\n\n# Original frozen weight matrix\nW_frozen = jax.random.normal(k1, (d_model, d_model)) * 0.02\n\n# LoRA matrices (only these are trainable)\nB = jnp.zeros((d_model, rank))       # initialised to zero\nA = jax.random.normal(k2, (rank, d_model)) * 0.01  # random init\n\n# Forward pass: W_effective = W_frozen + B @ A\nx = jax.random.normal(k3, (8, d_model))\n\n# Without LoRA\ny_original = x @ W_frozen.T\n\n# With LoRA\nW_effective = W_frozen + B @ A\ny_lora = x @ W_effective.T\n\n# Parameter counts\nfull_params = d_model * d_model\nlora_params = d_model * rank + rank * d_model  # B + A\n\nprint(f\"Model dimension: {d_model}\")\nprint(f\"LoRA rank: {rank}\")\nprint(f\"Full fine-tuning parameters: {full_params:,}\")\nprint(f\"LoRA parameters: {lora_params:,}\")\nprint(f\"Parameter reduction: {full_params / lora_params:.1f}x\")\nprint(f\"\\nSince B is initialised to zeros, initial LoRA output matches original:\")\nprint(f\"  Max difference: {jnp.abs(y_original - y_lora).max():.2e}\")\n\n# Simulate training: only update A and B\ndef lora_forward(A, B, W_frozen, x):\n    return x @ (W_frozen + B @ A).T\n\ndef dummy_loss(A, B, W_frozen, x, target):\n    pred = lora_forward(A, B, W_frozen, x)\n    return jnp.mean((pred - target) ** 2)\n\n# Target: some transformation of x\ntarget = x @ jax.random.normal(jax.random.PRNGKey(99), (d_model, d_model)).T * 0.02\n\ngrad_fn = jax.jit(jax.grad(dummy_loss, argnums=(0, 1)))\nlr = 0.01\n\nfor step in range(200):\n    gA, gB = grad_fn(A, B, W_frozen, x, target)\n    A = A - lr * gA\n    B = B - lr * gB\n\nloss_before = dummy_loss(jnp.zeros_like(A), jnp.zeros_like(B), W_frozen, x, target)\nloss_after = dummy_loss(A, B, W_frozen, x, target)\nprint(f\"\\nLoss before LoRA: {loss_before:.6f}\")\nprint(f\"Loss after LoRA:  {loss_after:.6f}\")\nprint(f\"Effective weight change rank: {jnp.linalg.matrix_rank(B @ A)}\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2007%3A%20computational%20linguistics/05.%20advanced%20text%20generation/","title":"\u9ad8\u7ea7\u6587\u672c\u751f\u6210","text":"<p>\u9ad8\u7ea7\u6587\u672c\u751f\u6210\u8d85\u8d8a\u4e86\u666e\u901a\u7684\u81ea\u56de\u5f52\u89e3\u7801\uff0c\u65e8\u5728\u63d0\u5347\u8d28\u91cf\u3001\u53ef\u63a7\u6027\u548c\u901f\u5ea6\u3002\u672c\u6587\u6db5\u76d6\u6587\u672c\u6269\u6563\u6a21\u578b\uff08D3PM\u3001MDLM\uff09\u3001OCR\u3001\u7528\u4e8e\u5bf9\u9f50\u7684RLHF\u4e0eDPO\u3001\u957f\u4e0a\u4e0b\u6587\u65b9\u6cd5\uff08RoPE\u7f29\u653e\u3001\u73af\u5f62\u6ce8\u610f\u529b\uff09\u3001\u68c0\u7d22\u589e\u5f3a\u751f\u6210\uff0c\u4ee5\u53ca\u7528\u4e8e\u52a0\u901f\u63a8\u7406\u7684\u63a8\u6d4b\u6027\u89e3\u7801\u3002</p> <ul> <li> <p>\u6807\u51c6\u7684\u81ea\u56de\u5f52\u751f\u6210\uff08\u6587\u4ef604\uff09\u4ece\u5de6\u5230\u53f3\u9010\u4e2a\u751f\u6210token\u3002\u8fd9\u79cd\u65b9\u5f0f\u7b80\u5355\u6709\u6548\uff0c\u4f46\u672c\u8d28\u4e0a\u662f\u4e32\u884c\u7684\uff0c\u65e0\u6cd5\u8fdb\u884c\u5168\u5c40\u89c4\u5212\uff0c\u5bf9\u8f93\u51fa\u7684\u63a7\u5236\u4e5f\u6709\u9650\u3002\u672c\u6587\u6db5\u76d6\u4e86\u8d85\u8d8a\u666e\u901a\u81ea\u56de\u5f52\u89e3\u7801\u7684\u65b9\u6cd5\uff1a\u6587\u672c\u6269\u6563\u6a21\u578b\u3001\u5149\u5b66\u5b57\u7b26\u8bc6\u522b\u3001\u901a\u8fc7\u4eba\u7c7b\u53cd\u9988\u5b9e\u73b0\u7684\u53ef\u63a7\u751f\u6210\u3001\u957f\u4e0a\u4e0b\u6587\u5904\u7406\u3001\u68c0\u7d22\u589e\u5f3a\u751f\u6210\uff0c\u4ee5\u53ca\u7528\u4e8e\u52a0\u901f\u63a8\u7406\u7684\u63a8\u6d4b\u6027\u89e3\u7801\u3002</p> </li> <li> <p>\u6587\u672c\u6269\u6563\u6a21\u578b\u5c06\u6269\u6563\u6846\u67b6\uff08\u5728\u7b2c08\u7ae0\u4e2d\u4e3a\u56fe\u50cf\u5f15\u5165\uff09\u5e94\u7528\u4e8e\u79bb\u6563\u6587\u672c\u3002\u6838\u5fc3\u6311\u6218\u5728\u4e8e\u6587\u672c\u662f\u79bb\u6563\u7684\uff1a\u4f60\u4e0d\u80fd\u50cf\u5bf9\u50cf\u7d20\u6dfb\u52a0\u566a\u58f0\u90a3\u6837\uff0c\u5411token\u6dfb\u52a0\u8fde\u7eed\u7684\u9ad8\u65af\u566a\u58f0\u3002\u6709\u51e0\u79cd\u65b9\u6cd5\u53ef\u4ee5\u89e3\u51b3\u8fd9\u4e2a\u95ee\u9898\u3002</p> </li> <li> <p>D3PM\uff08\u79bb\u6563\u53bb\u566a\u6269\u6563\u6982\u7387\u6a21\u578b\uff0cAustin\u7b49\u4eba\uff0c2021\uff09\u5b9a\u4e49\u4e86\u4e00\u4e2a\u76f4\u63a5\u5728\u79bb\u6563token\u4e0a\u7684\u524d\u5411\u52a0\u566a\u8fc7\u7a0b\uff0c\u4f7f\u7528\u8f6c\u79fb\u77e9\u9635\u3002\u5728\u6bcf\u4e2a\u524d\u5411\u6b65\u9aa4\u4e2d\uff0c\u4e00\u4e2atoken\u6709\u4e00\u5b9a\u6982\u7387\u88ab\u53e6\u4e00\u4e2atoken\u66ff\u6362\uff08\u5747\u5300\u566a\u58f0\uff09\u3001\u88ab\u63a9\u7801\uff08\u5438\u6536\u6001\uff09\u6216\u4fdd\u6301\u4e0d\u53d8\u3002\u9006\u5411\u8fc7\u7a0b\u5b66\u4e60\u53bb\u566a\uff0c\u4ece\u52a0\u566a\u7684token\u9884\u6d4b\u51fa\u5e72\u51c0\u7684token\u3002\u5728\u6b65\u9aa4\\(t\\)\u5904\u7684\u8f6c\u79fb\u77e9\u9635\\(Q_t\\)\u63a7\u5236\u52a0\u566a\u8fc7\u7a0b\uff1a</p> </li> </ul> \\[q(x_t \\mid x_{t-1}) = \\text{Cat}(x_t ; \\, x_{t-1} Q_t)\\] <ul> <li>\u5176\u4e2d\\(\\text{Cat}\\)\u8868\u793a\u7c7b\u522b\u5206\u5e03\uff0c\\(x\\)\u662f\u4e00\u4e2aone-hot\u5411\u91cf\u3002\u591a\u6b65\u524d\u5411\u8fc7\u7a0b\\(q(x_t \\mid x_0)\\)\u6709\u4e00\u4e2a\u95ed\u5f0f\u5f62\u5f0f\uff1a\\(q(x_t \\mid x_0) = \\text{Cat}(x_t ; \\, x_0 \\bar{Q}_t)\\)\uff0c\u5176\u4e2d\\(\\bar{Q}_t = Q_1 Q_2 \\cdots Q_t\\)\u662f\u5230\u6b65\u9aa4\\(t\\)\u4e3a\u6b62\u6240\u6709\u8f6c\u79fb\u77e9\u9635\u7684\u4e58\u79ef\u3002\u8bad\u7ec3\u6700\u5c0f\u5316\u4e00\u4e2a\u53d8\u5206\u4e0b\u754c\uff08ELBO\uff09\uff0c\u8be5\u4e0b\u754c\u5728\u4e0d\u540c\u65f6\u95f4\u6b65\u4e0a\u5206\u89e3\uff0c\u4e0e\u8fde\u7eed\u60c5\u51b5\uff08\u7b2c08\u7ae0\uff09\u7c7b\u4f3c\uff1a</li> </ul> \\[\\mathcal{L}_{\\text{D3PM}} = D_{\\text{KL}}(q(x_T \\mid x_0) \\| p(x_T)) + \\sum_{t=2}^{T} D_{\\text{KL}}(q(x_{t-1} \\mid x_t, x_0) \\| p_\\theta(x_{t-1} \\mid x_t)) - \\log p_\\theta(x_0 \\mid x_1)\\] <ul> <li> <p>\u7b2c\u4e00\u9879\u786e\u4fdd\u5b8c\u5168\u52a0\u566a\u540e\u7684\u5206\u5e03\u4e0e\u5148\u9a8c\u5206\u5e03\uff08\u5747\u5300\u5206\u5e03\u6216\u5168\u63a9\u7801\uff09\u5339\u914d\u3002KL\u9879\u7684\u548c\u8bad\u7ec3\u6a21\u578b\u53bb\u9006\u8f6c\u6bcf\u4e2a\u52a0\u566a\u6b65\u9aa4\uff1a\u771f\u5b9e\u7684\u9006\u5411\u540e\u9a8c\\(q(x_{t-1} \\mid x_t, x_0)\\)\u53ef\u4ee5\u4f7f\u7528\u8d1d\u53f6\u65af\u89c4\u5219\u548c\u5df2\u77e5\u7684\u8f6c\u79fb\u77e9\u9635\u4ee5\u95ed\u5f0f\u5f62\u5f0f\u8ba1\u7b97\uff0c\u6a21\u578b\\(p_\\theta(x_{t-1} \\mid x_t)\\)\u88ab\u8bad\u7ec3\u53bb\u5339\u914d\u5b83\u3002</p> </li> <li> <p>\u7531\u4e8e\u8fd9\u4e24\u4e2a\u5206\u5e03\u90fd\u662f\u7c7b\u522b\u5206\u5e03\uff0cKL\u6563\u5ea6\u5c31\u662f\u8bcd\u6c47\u8868\u6761\u76ee\u4e0a\u7684\u7b80\u5355\u6c42\u548c\u3002\u6700\u540e\u4e00\u9879\u8861\u91cf\u6765\u81ea\u6700\u5e72\u51c0\u52a0\u566a\u72b6\u6001\u7684\u91cd\u5efa\u8d28\u91cf\u3002</p> </li> <li> <p>MDLM\uff08\u63a9\u7801\u6269\u6563\u8bed\u8a00\u6a21\u578b\uff0cSahoo\u7b49\u4eba\uff0c2024\uff09\u901a\u8fc7\u4ec5\u4f7f\u7528\u63a9\u7801\u4f5c\u4e3a\u552f\u4e00\u7684\u52a0\u566a\u64cd\u4f5c\u6765\u7b80\u5316D3PM\uff1a\u524d\u5411\u8fc7\u7a0b\u9010\u6b65\u7528[MASK]token\u66ff\u6362\u539f\u59cbtoken\uff0c\u9006\u5411\u8fc7\u7a0b\u9884\u6d4b\u539f\u59cbtoken\u3002\u8fd9\u4f7f\u6587\u672c\u6269\u6563\u4e0e\u63a9\u7801\u8bed\u8a00\u5efa\u6a21\uff08BERT\uff0c\u6587\u4ef604\uff09\u8054\u7cfb\u8d77\u6765\uff0c\u6269\u6563\u65f6\u95f4\u6b65\u63a7\u5236\u88ab\u63a9\u7801\u7684token\u6bd4\u4f8b\u3002\u5728\\(t = 0\\)\u65f6\u523b\u6587\u672c\u5b8c\u5168\u5e72\u51c0\uff1b\u5728\\(t = T\\)\u65f6\u523b\u6587\u672c\u88ab\u5b8c\u5168\u63a9\u7801\u3002</p> </li> <li> <p>\u8fde\u7eed\u6587\u672c\u6269\u6563\u901a\u8fc7\u5728\u8fde\u7eed\u7684\u5d4c\u5165\u7a7a\u95f4\u4e2d\u5de5\u4f5c\u6765\u89c4\u907f\u79bb\u6563\u95ee\u9898\u3002Token\u9996\u5148\u88ab\u6620\u5c04\u5230\u5b83\u4eec\u7684\u5d4c\u5165\u5411\u91cf\uff08\u7b2c06\u7ae0\uff09\uff0c\u566a\u58f0\u5728\u8fd9\u4e2a\u8fde\u7eed\u7a7a\u95f4\u4e2d\u88ab\u6dfb\u52a0\uff0c\u4e00\u4e2a\u53bb\u566a\u6a21\u578b\uff08\u901a\u5e38\u662fTransformer\uff09\u5b66\u4e60\u9006\u8f6c\u8fd9\u4e2a\u8fc7\u7a0b\u3002\u5728\u751f\u6210\u65f6\uff0c\u6a21\u578b\u4ea7\u751f\u8fde\u7eed\u5411\u91cf\uff0c\u901a\u8fc7\u627e\u5230\u6700\u8fd1\u7684\u5d4c\u5165\u5c06\u5176\u6620\u5c04\u56de\u79bb\u6563token\u3002\u6311\u6218\u5728\u4e8e\u8fde\u7eed\u7a7a\u95f4\u4e2d\u7684\u5c0f\u8bef\u5dee\u53ef\u80fd\u6620\u5c04\u5230\u5b8c\u5168\u9519\u8bef\u7684token\uff0c\u56e0\u6b64\u9700\u8981\u4ed4\u7ec6\u7684\u820d\u5165\u548c\u88c1\u526a\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u6587\u672c\u6269\u6563\u7684\u5438\u5f15\u529b\u5728\u4e8e\u5b83\u901a\u8fc7\u8fed\u4ee3\u7cbe\u70bc\u540c\u65f6\u751f\u6210\u6240\u6709token\uff0c\u800c\u4e0d\u662f\u4ece\u5de6\u5230\u53f3\u3002\u8fd9\u5141\u8bb8\u5168\u5c40\u8fde\u8d2f\u6027\u548c\u8f7b\u677e\u586b\u5145\uff08\u5728\u6bb5\u843d\u4e2d\u95f4\u751f\u6210\u7f3a\u5931\u7684\u6587\u672c\uff09\uff0c\u4f46\u5f53\u524d\u6587\u672c\u6269\u6563\u6a21\u578b\u5728\u957f\u6587\u672c\u7684\u751f\u6210\u8d28\u91cf\u4e0a\u4ecd\u7136\u843d\u540e\u4e8e\u81ea\u56de\u5f52\u6a21\u578b\u3002</p> </li> <li> <p>\u6587\u672cOCR\uff08\u5149\u5b66\u5b57\u7b26\u8bc6\u522b\uff09\u662f\u4ece\u56fe\u50cf\u4e2d\u63d0\u53d6\u6587\u672c\u7684\u4efb\u52a1\u3002\u867d\u7136\u4f20\u7edf\u4e0a\u4e0d\u5f52\u5165\u8bed\u8a00\u751f\u6210\uff0c\u4f46\u73b0\u4ee3OCR\u7cfb\u7edf\u4e0eNLP\u6df1\u5ea6\u96c6\u6210\uff0c\u5e76\u4e14\u8d8a\u6765\u8d8a\u591a\u5730\u4f7f\u7528\u8bed\u8a00\u6a21\u578b\u7ec4\u4ef6\u3002</p> </li> <li> <p>\u573a\u666f\u6587\u672c\u68c0\u6d4b\u5728\u81ea\u7136\u56fe\u50cf\uff08\u8def\u724c\u3001\u4ea7\u54c1\u6807\u7b7e\u3001\u8f66\u724c\uff09\u4e2d\u5b9a\u4f4d\u6587\u672c\u533a\u57df\u3002\u8fd9\u5f88\u6709\u6311\u6218\u6027\uff0c\u56e0\u4e3a\u91ce\u5916\u7684\u6587\u672c\u51fa\u73b0\u5728\u4efb\u610f\u89d2\u5ea6\u3001\u5c3a\u5bf8\u3001\u5b57\u4f53\u548c\u6742\u4e71\u7684\u80cc\u666f\u4e2d\u3002\u68c0\u6d4b\u65b9\u6cd5\u901a\u5e38\u4f7f\u7528CNN\u6216Transformer\u4e3b\u5e72\u7f51\u7edc\uff0c\u56f4\u7ed5\u6587\u672c\u533a\u57df\u751f\u6210\u8fb9\u754c\u6846\u6216\u5206\u5272\u63a9\u7801\u3002</p> </li> <li> <p>CRNN\uff08\u5377\u79ef\u5faa\u73af\u795e\u7ecf\u7f51\u7edc\uff0cShi\u7b49\u4eba\uff0c2017\uff09\u662f\u4e00\u79cd\u7ecf\u5178\u7684\u6587\u672c\u8bc6\u522b\u67b6\u6784\u3002CNN\u4ece\u6587\u672c\u56fe\u50cf\u4e2d\u63d0\u53d6\u89c6\u89c9\u7279\u5f81\uff0c\u7279\u5f81\u56fe\u88ab\u5207\u7247\u6210\u5217\u5e8f\u5217\uff08\u6bcf\u4e2a\u6c34\u5e73\u4f4d\u7f6e\u4e00\u5217\uff09\uff0c\u53cc\u5411LSTM\u8bfb\u53d6\u8fd9\u4e2a\u5e8f\u5217\u4ee5\u5efa\u6a21\u4e0a\u4e0b\u6587\u3002\u8f93\u51fa\u4f7f\u7528CTC\uff08\u8fde\u63a5\u65f6\u5e8f\u5206\u7c7b\uff09\u8fdb\u884c\u89e3\u7801\uff0c\u8be5\u7b97\u6cd5\u5904\u7406\u8f93\u5165\u5217\u548c\u8f93\u51fa\u5b57\u7b26\u4e4b\u95f4\u7684\u5bf9\u9f50\uff0c\u65e0\u9700\u663e\u5f0f\u5206\u5272\u3002</p> </li> <li> <p>CTC\u89e3\u51b3\u7684\u6839\u672c\u95ee\u9898\u662f\uff1a\u6a21\u578b\u4ea7\u751f\\(T\\)\u4e2a\u8f93\u51fa\u5206\u5e03\uff08\u6bcf\u4e2a\u8f93\u5165\u5217\u4e00\u4e2a\uff09\uff0c\u4f46\u76ee\u6807\u6587\u672c\u6709\\(L \\leq T\\)\u4e2a\u5b57\u7b26\u3002</p> </li> <li> <p>\u6211\u4eec\u4e0d\u77e5\u9053\u54ea\u4e9b\u5217\u5bf9\u5e94\u54ea\u4e9b\u5b57\u7b26\u3002CTC\u5f15\u5165\u4e86\u4e00\u4e2a\u7a7a\u767dtoken \\(\\epsilon\\)\uff0c\u5e76\u5b9a\u4e49\u4e86\u4e00\u4e2a\u591a\u5bf9\u4e00\u7684\u6620\u5c04\\(\\mathcal{B}\\)\uff0c\u8be5\u6620\u5c04\u6298\u53e0\u91cd\u590d\u5b57\u7b26\u5e76\u79fb\u9664\u7a7a\u767d\uff1a\\(\\mathcal{B}(\\text{\\\"HH-ee-ll-ll-oo\\\"}) = \\text{\\\"Hello\\\"}\\)\uff08\u5176\u4e2d\\\"-\\\"\u662f\u7a7a\u767d\uff09\u3002</p> </li> <li> <p>\u76ee\u6807\u5e8f\u5217\\(y\\)\u7684\u6982\u7387\u662f\u6240\u6709\u6298\u53e0\u540e\u5f97\u5230\\(y\\)\u7684\u8f93\u5165\u5bf9\u9f50\u8def\u5f84\u7684\u6982\u7387\u4e4b\u548c\uff1a</p> </li> </ul> \\[P(y \\mid x) = \\sum_{\\pi \\in \\mathcal{B}^{-1}(y)} \\prod_{t=1}^{T} P(\\pi_t \\mid x)\\] <ul> <li> <p>\u5176\u4e2d\\(\\pi\\)\u662f\u4e00\u6761\u957f\u5ea6\u4e3a\\(T\\)\u7684\u5bf9\u9f50\u8def\u5f84\uff08\u6bcf\u5217\u4e00\u4e2a\u6807\u7b7e\uff0c\u5305\u62ec\u7a7a\u767d\uff09\u3002\u6734\u7d20\u5730\u6c42\u548c\u6240\u6709\u8def\u5f84\u662f\u6307\u6570\u7ea7\u7684\uff0c\u4f46\u524d\u5411\u7b97\u6cd5\uff08\u7b2c05\u7ae0HMM\uff09\u4f7f\u7528\u52a8\u6001\u89c4\u5212\u5728\\(O(T \\cdot L)\\)\u65f6\u95f4\u5185\u9ad8\u6548\u5730\u8ba1\u7b97\u8fd9\u4e2a\u548c\u3002</p> </li> <li> <p>\u7a7a\u767dtoken\u662f\u5fc5\u4e0d\u53ef\u5c11\u7684\uff1a\u6ca1\u6709\u5b83\uff0c\u50cf\\\"Hello\\\"\u4e2d\u91cd\u590d\u7684\\\"ll\\\"\u5c31\u65e0\u6cd5\u4e0e\u5355\u4e2a\\\"l\\\"\u533a\u5206\u5f00\u6765\u3002\u8bad\u7ec3\u6700\u5927\u5316\\(\\log P(y \\mid x)\\)\uff0c\u5728\u63a8\u7406\u65f6\uff0c\u901a\u8fc7\u5728CTC\u8f93\u51fa\u4e0a\u8fdb\u884c\u675f\u641c\u7d22\u6216\u8d2a\u5fc3\u89e3\u7801\u6765\u627e\u5230\u6700\u4f73\u8def\u5f84\u3002</p> </li> <li> <p>\u6587\u6863OCR\u5904\u7406\u7ed3\u6784\u5316\u6587\u6863\uff08\u53d1\u7968\u3001\u8868\u683c\u3001\u79d1\u5b66\u8bba\u6587\uff09\uff0c\u9664\u4e86\u8bc6\u522b\u5b57\u7b26\u5916\uff0c\u8fd8\u5fc5\u987b\u7406\u89e3\u5e03\u5c40\u3002\u50cfLayoutLM\u8fd9\u6837\u7684\u73b0\u4ee3\u7cfb\u7edf\u5c06\u6587\u672c\u8bc6\u522b\u4e0e\u7a7a\u95f4\u4f4d\u7f6e\u7279\u5f81\u76f8\u7ed3\u5408\uff1a\u6bcf\u4e2atoken\u65e2\u6709\u5176\u6587\u672c\u5d4c\u5165\uff0c\u4e5f\u6709\u7f16\u7801\u5176\u5728\u9875\u9762\u4e0a\\((x, y)\\)\u5750\u6807\u7684\u4f4d\u7f6e\u5d4c\u5165\u3002\u8fd9\u4f7f\u5f97\u6a21\u578b\u80fd\u591f\u7406\u89e3\u51fa\u73b0\u5728\\\"\u603b\u8ba1\uff1a\\\"\u4e0b\u9762\u7684\u6570\u5b57\u5c31\u662f\u603b\u91d1\u989d\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u89c6\u89c9-\u8bed\u8a00OCR\u6a21\u578b\u5982TrOCR\u5c06\u6587\u672c\u8bc6\u522b\u89c6\u4e3a\u56fe\u50cf\u5230\u6587\u672c\u7684\u751f\u6210\uff1a\u89c6\u89c9Transformer\u7f16\u7801\u5668\u5904\u7406\u56fe\u50cf\uff0c\u8bed\u8a00\u6a21\u578b\u89e3\u7801\u5668\u9010\u5b57\u7b26\u751f\u6210\u6587\u672c\u3002\u8fd9\u5229\u7528\u4e86\u9884\u8bad\u7ec3\u89c6\u89c9\u548c\u8bed\u8a00\u6a21\u578b\u7684\u80fd\u529b\uff0c\u65e0\u9700\u624b\u5de5\u7279\u5f81\u5de5\u7a0b\u5373\u53ef\u5904\u7406\u591a\u79cd\u6587\u5b57\u3001\u5b57\u4f53\u548c\u5e03\u5c40\u3002</p> </li> <li> <p>\u53ef\u63a7\u751f\u6210\u662f\u5f15\u5bfc\u8bed\u8a00\u6a21\u578b\u4ea7\u751f\u5177\u6709\u6240\u9700\u5c5e\u6027\uff08\u7279\u5b9a\u7684\u98ce\u683c\u3001\u4e3b\u9898\u3001\u60c5\u611f\u3001\u5b89\u5168\u7ea7\u522b\u6216\u4e8b\u5b9e\u51c6\u786e\u6027\uff09\u7684\u8f93\u51fa\u7684\u6311\u6218\u3002\u6a21\u578b\u5e94\u5f53\u9075\u5faa\u6307\u4ee4\uff0c\u540c\u65f6\u4fdd\u6301\u6d41\u7545\u548c\u8fde\u8d2f\u3002</p> </li> <li> <p>\u9488\u5bf9\u6587\u672c\u7684\u5206\u7c7b\u5668\u65e0\u5173\u5f15\u5bfc\uff08CFG\uff09 \u6539\u7f16\u81ea\u56fe\u50cf\u751f\u6210\u4e2d\u7684\u6280\u672f\u3002\u5728\u8bad\u7ec3\u671f\u95f4\uff0c\u6761\u4ef6\u4fe1\u53f7\uff08\u5982\u63d0\u793a\u8bcd\uff09\u4ee5\u4e00\u5b9a\u6bd4\u4f8b\u88ab\u968f\u673a\u4e22\u5f03\uff0c\u4ece\u800c\u5728\u540c\u4e00\u4e2a\u6a21\u578b\u4e2d\u540c\u65f6\u8bad\u7ec3\u6761\u4ef6\u6a21\u578b\u548c\u65e0\u6761\u4ef6\u6a21\u578b\u3002\u5728\u63a8\u7406\u65f6\uff0c\u8f93\u51falogits\u88ab\u63d2\u503c\uff1a</p> </li> </ul> \\[\\text{logits}_{\\text{guided}} = (1 + w) \\cdot \\text{logits}_{\\text{conditional}} - w \\cdot \\text{logits}_{\\text{unconditional}}\\] <ul> <li> <p>\u5176\u4e2d\\(w &gt; 0\\)\u653e\u5927\u4e86\u6761\u4ef6\u7684\u5f71\u54cd\u3002\u8d8a\u5927\u7684\\(w\\)\u4f7f\u8f93\u51fa\u66f4\u5f3a\u70c8\u5730\u9075\u5faa\u63d0\u793a\u8bcd\uff0c\u4f46\u964d\u4f4e\u4e86\u591a\u6837\u6027\u3002</p> </li> <li> <p>RLHF\uff08\u57fa\u4e8e\u4eba\u7c7b\u53cd\u9988\u7684\u5f3a\u5316\u5b66\u4e60\uff0cOuyang\u7b49\u4eba\uff0c2022\uff09\u662f\u5bf9\u9f50\u8bed\u8a00\u6a21\u578b\u4e0e\u4eba\u7c7b\u504f\u597d\u7684\u4e3b\u6d41\u65b9\u6cd5\u3002\u8be5\u8fc7\u7a0b\u5206\u4e3a\u4e09\u4e2a\u9636\u6bb5\uff1a</p> </li> <li> <p>\u9996\u5148\uff0c\u76d1\u7763\u5fae\u8c03\uff08SFT\uff09\uff1a\u5728\u9ad8\u8d28\u91cf\u4eba\u5de5\u7f16\u5199\u7684\u63d0\u793a-\u56de\u590d\u6570\u636e\u96c6\u4e0a\u5bf9\u57fa\u7840\u8bed\u8a00\u6a21\u578b\u8fdb\u884c\u5fae\u8c03\u3002</p> </li> <li> <p>\u5176\u6b21\uff0c\u5956\u52b1\u6a21\u578b\u8bad\u7ec3\uff1a\u6536\u96c6\u4eba\u7c7b\u6bd4\u8f83\u6570\u636e\uff08\u7ed9\u5b9a\u63d0\u793a\\(x\\)\u548c\u4e24\u4e2a\u56de\u590d\\(y_1, y_2\\)\uff0c\u54ea\u4e2a\u66f4\u597d\uff1f\uff09\u5e76\u8bad\u7ec3\u4e00\u4e2a\u5956\u52b1\u6a21\u578b\\(r_\\phi(x, y)\\)\u6765\u9884\u6d4b\u4eba\u7c7b\u504f\u597d\u3002\u5956\u52b1\u6a21\u578b\u4f7f\u7528\u6210\u5bf9\u6392\u5e8f\u635f\u5931\u8fdb\u884c\u8bad\u7ec3\uff1a</p> </li> </ul> \\[\\mathcal{L}_{\\text{RM}} = -\\log \\sigma(r_\\phi(x, y_w) - r_\\phi(x, y_l))\\] <ul> <li> <p>\u5176\u4e2d\\(y_w\\)\u662f\u66f4\u53d7\u504f\u597d\u7684\u56de\u590d\uff0c\\(y_l\\)\u662f\u4e0d\u53d7\u504f\u597d\u7684\u56de\u590d\u3002</p> </li> <li> <p>\u7b2c\u4e09\uff0cRL\u5fae\u8c03\uff1a\u4f18\u5316\u8bed\u8a00\u6a21\u578b\u4ee5\u6700\u5927\u5316\u5956\u52b1\uff0c\u540c\u65f6\u4fdd\u6301\u63a5\u8fd1SFT\u6a21\u578b\uff08\u4ee5\u9632\u6b62\u6a21\u5f0f\u5d29\u584c\uff09\u3002\u8fd9\u4f7f\u7528\u5e26\u6709KL\u60e9\u7f5a\u7684PPO\uff08\u8fd1\u7aef\u7b56\u7565\u4f18\u5316\uff0c\u6765\u81ea\u7b2c06\u7ae0\uff09\uff1a</p> </li> </ul> \\[\\mathcal{L}_{\\text{RL}} = -\\mathbb{E}\\left[r_\\phi(x, y) - \\beta \\, D_{\\text{KL}}(\\pi_\\theta \\| \\pi_{\\text{SFT}})\\right]\\] <ul> <li>KL\u9879\u9632\u6b62\u6a21\u578b\u504f\u79bb\u57fa\u7840\u6a21\u578b\u592a\u8fdc\uff0c\u5e76\u9632\u6b62\u6a21\u578b\u5229\u7528\u5956\u52b1\u6a21\u578b\u7684\u7f3a\u9677\uff08\\\"\u5956\u52b1\u7834\u89e3\\\"\uff09\u3002</li> </ul> <p></p> <ul> <li>DPO\uff08\u76f4\u63a5\u504f\u597d\u4f18\u5316\uff0cRafailov\u7b49\u4eba\uff0c2023\uff09\u901a\u8fc7\u5b8c\u5168\u6d88\u9664\u5956\u52b1\u6a21\u578b\u6765\u7b80\u5316RLHF\u3002\u5173\u952e\u7684\u6570\u5b66\u6d1e\u89c1\u662f\uff0c\u4e0a\u8ff0KL\u7ea6\u675f\u7684RL\u76ee\u6807\u6709\u4e00\u4e2a\u95ed\u5f0f\u6700\u4f18\u7b56\u7565\uff1a</li> </ul> \\[\\pi^\\ast(y \\mid x) = \\frac{1}{Z(x)} \\pi_{\\text{ref}}(y \\mid x) \\exp\\!\\left(\\frac{r(x, y)}{\\beta}\\right)\\] <ul> <li>\u5176\u4e2d\\(Z(x)\\)\u662f\u4e00\u4e2a\u5f52\u4e00\u5316\u914d\u5206\u51fd\u6570\u3002\u6574\u7406\u4e0a\u5f0f\u6c42\u89e3\u5956\u52b1\u5f97\\(r(x, y) = \\beta \\log \\frac{\\pi^\\ast(y \\mid x)}{\\pi_{\\text{ref}}(y \\mid x)} + \\beta \\log Z(x)\\)\u3002\u5c06\u8fd9\u4e2a\u9690\u5f0f\u5956\u52b1\u4ee3\u5165Bradley-Terry\u504f\u597d\u6a21\u578b\\(P(y_w \\succ y_l) = \\sigma(r(x, y_w) - r(x, y_l))\\)\u4f1a\u5bfc\u81f4\u96be\u4ee5\u5904\u7406\u7684\\(Z(x)\\)\u9879\u76f8\u4e92\u62b5\u6d88\uff0c\u76f4\u63a5\u5f97\u5230DPO\u635f\u5931\uff1a</li> </ul> \\[\\mathcal{L}_{\\text{DPO}} = -\\log \\sigma\\!\\left(\\beta \\log \\frac{\\pi_\\theta(y_w \\mid x)}{\\pi_{\\text{ref}}(y_w \\mid x)} - \\beta \\log \\frac{\\pi_\\theta(y_l \\mid x)}{\\pi_{\\text{ref}}(y_l \\mid x)}\\right)\\] <ul> <li> <p>\u8fd9\u5728\u6570\u5b66\u4e0a\u7b49\u4ef7\u4e8eRLHF\uff0c\u4f46\u5c06\u5956\u52b1\u6a21\u578b\u548cRL\u8bad\u7ec3\u5408\u5e76\u4e3a\u4e00\u4e2a\u5355\u4e00\u7684\u76d1\u7763\u6b65\u9aa4\u3002</p> </li> <li> <p>sigmoid\u5185\u90e8\u7684\u8868\u8fbe\u5f0f\u53ef\u4ee5\u7406\u89e3\u4e3a\uff1a\"\u589e\u52a0\u504f\u597d\u56de\u590d\u7684\u76f8\u5bf9\u6982\u7387\uff0c\u964d\u4f4e\u4e0d\u504f\u597d\u56de\u590d\u7684\u76f8\u5bf9\u6982\u7387\uff0c\u8fd9\u662f\u76f8\u5bf9\u4e8e\u53c2\u8003\u6a21\u578b\u800c\u8a00\u7684\u3002\"</p> </li> <li> <p>\u53c2\u6570\\(\\beta\\)\u63a7\u5236\u7b56\u7565\u53ef\u4ee5\u504f\u79bb\u53c2\u8003\u6a21\u578b\u7684\u7a0b\u5ea6\u3002\u5728\u5b9e\u8df5\u4e2d\uff0cDPO\u5b9e\u73b0\u66f4\u7b80\u5355\uff08\u53ea\u9700\u8ba1\u7b97\u5f53\u524d\u6a21\u578b\u548c\u53c2\u8003\u6a21\u578b\u5bf9\u4e24\u4e2a\u5b8c\u6210\u5e8f\u5217\u7684\u5bf9\u6570\u6982\u7387\uff09\uff0c\u5e76\u4e14\u907f\u514d\u4e86PPO\u8bad\u7ec3\u7684\u4e0d\u7a33\u5b9a\u6027\u3002</p> </li> <li> <p>Constitutional AI\uff08Bai\u7b49\u4eba\uff0c2022\uff09\u81ea\u52a8\u5316\u4e86\u5bf9\u9f50\u8fc7\u7a0b\u7684\u67d0\u4e9b\u90e8\u5206\u3002\u5b83\u4e0d\u518d\u6536\u96c6\u4eba\u7c7b\u6bd4\u8f83\u6570\u636e\uff0c\u800c\u662f\u8ba9\u8bed\u8a00\u6a21\u578b\u672c\u8eab\u6839\u636e\u4e00\u7ec4\u539f\u5219\uff08\"\u5baa\u6cd5\"\uff09\u6765\u6279\u8bc4\u548c\u4fee\u8ba2\u81ea\u5df1\u7684\u8f93\u51fa\uff0c\u4f8b\u5982\"\u9009\u62e9\u5371\u5bb3\u8f83\u5c0f\u7684\u56de\u590d\"\u3002\u7136\u540e\uff0cAI\u751f\u6210\u7684\u6bd4\u8f83\u6570\u636e\u88ab\u7528\u4e8e\u504f\u597d\u8bad\u7ec3\uff08RLAIF\uff1a\u57fa\u4e8eAI\u53cd\u9988\u7684\u5f3a\u5316\u5b66\u4e60\uff09\u3002</p> </li> <li> <p>\u957f\u4e0a\u4e0b\u6587\u65b9\u6cd5\u89e3\u51b3\u4e86\u6807\u51c6\u81ea\u6ce8\u610f\u529b\u7684\\(O(n^2)\\)\u5185\u5b58\u548c\u8ba1\u7b97\u6210\u672c\u95ee\u9898\uff0c\u8fd9\u9650\u5236\u4e86\u5e8f\u5217\u957f\u5ea6\u3002\u5f53\\(n\\)\u589e\u957f\u5230\u6570\u4e07\u6216\u6570\u5341\u4e07\u4e2atoken\u65f6\uff0c\u6807\u51c6\u6ce8\u610f\u529b\u53d8\u5f97\u4e0d\u53ef\u884c\u3002</p> </li> <li> <p>\u7a00\u758f\u6ce8\u610f\u529b\u5c06\u7a20\u5bc6\u7684\\(n \\times n\\)\u6ce8\u610f\u529b\u77e9\u9635\u66ff\u6362\u4e3a\u4e00\u79cd\u7a00\u758f\u6a21\u5f0f\uff0c\u5176\u4e2d\u6bcf\u4e2atoken\u53ea\u5173\u6ce8\u5176\u4ed6token\u7684\u4e00\u4e2a\u5b50\u96c6\u3002\u5e38\u89c1\u7684\u6a21\u5f0f\u5305\u62ec\u5c40\u90e8\u6ce8\u610f\u529b\uff08\u6bcf\u4e2atoken\u5173\u6ce8\u4e00\u4e2a\u56fa\u5b9a\u5927\u5c0f\u7684\u76f8\u90bb\u7a97\u53e3\uff09\u3001\u6b65\u957f\u6ce8\u610f\u529b\uff08\u5173\u6ce8\u6bcf\u9694\\(k\\)\u4e2atoken\uff09\u548c\u968f\u673a\u6ce8\u610f\u529b\uff08\u5173\u6ce8\u4e00\u4e2a\u968f\u673a\u5b50\u96c6\uff09\u3002\u8fd9\u4e9b\u6a21\u5f0f\u7684\u7ec4\u5408\uff08\u7528\u4e8eBigBird\u3001Longformer\uff09\u5b9e\u73b0\u4e86\\(O(n)\\)\u6216\\(O(n \\sqrt{n})\\)\u7684\u590d\u6742\u5ea6\uff0c\u540c\u65f6\u4fdd\u6301\u4e86\u6355\u83b7\u5c40\u90e8\u548c\u5168\u5c40\u4f9d\u8d56\u5173\u7cfb\u7684\u80fd\u529b\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u6ed1\u52a8\u7a97\u53e3\u6ce8\u610f\u529b\u5c06\u6bcf\u4e2atoken\u9650\u5236\u4e3a\u53ea\u5173\u6ce8\u5176\u4e4b\u524d\u7684\\(w\\)\u4e2atoken\uff08\u5176\u5c40\u90e8\u7a97\u53e3\uff09\u3002\u8fd9\u662f\\(O(nw)\\)\u800c\u4e0d\u662f\\(O(n^2)\\)\uff0c\u4f46\u957f\u8ddd\u79bb\u4fe1\u606f\u5fc5\u987b\u901a\u8fc7\u8de8\u5c42\u7684\u91cd\u53e0\u7a97\u53e3\u4f20\u64ad\u3002\u5bf9\u4e8e\\(L\\)\u5c42\u548c\u7a97\u53e3\u5927\u5c0f\\(w\\)\uff0c\u6709\u6548\u611f\u53d7\u91ce\u4e3a\\(L \\times w\\)\u4e2atoken\u3002</p> </li> <li> <p>\u73af\u5f62\u6ce8\u610f\u529b\u901a\u8fc7\u5c06\u8bbe\u5907\u6392\u5217\u6210\u73af\u5f62\u62d3\u6251\u7ed3\u6784\uff0c\u5c06\u957f\u5e8f\u5217\u5206\u5e03\u5230\u591a\u4e2a\u8bbe\u5907\u4e0a\u3002\u6bcf\u4e2a\u8bbe\u5907\u6301\u6709\u5e8f\u5217\u7684\u4e00\u4e2a\u5757\uff0c\u5e76\u4e3a\u5176\u5757\u8ba1\u7b97\u6ce8\u610f\u529b\uff0c\u540c\u65f6\u5c06\u952e\u503c\u5757\u53d1\u9001\u7ed9\u73af\u4e2d\u7684\u4e0b\u4e00\u4e2a\u8bbe\u5907\u3002\u8fd9\u79cd\u65b9\u5f0f\u5c06\u8ba1\u7b97\u4e0e\u901a\u4fe1\u91cd\u53e0\uff0c\u5141\u8bb8\u4efb\u610f\u957f\u5ea6\u7684\u5e8f\u5217\uff0c\u4ec5\u53d7\u6240\u6709\u8bbe\u5907\u603b\u5185\u5b58\u7684\u9650\u5236\uff0c\u800c\u4e0d\u53d7\u4efb\u4f55\u5355\u4e2a\u8bbe\u5907\u5185\u5b58\u7684\u9650\u5236\u3002</p> </li> <li> <p>\u8bb0\u5fc6\u589e\u5f3a\u6a21\u578b\u901a\u8fc7\u4e3aTransformer\u914d\u5907\u4e00\u4e2a\u5916\u90e8\u8bb0\u5fc6\u5e93\u6765\u6269\u5c55\u4e0a\u4e0b\u6587\u3002\u5728\u6bcf\u4e2a\u5c42\u4e2d\uff0c\u6a21\u578b\u53ef\u4ee5\u4f7f\u7528\u6ce8\u610f\u529b\u4ece\u8fd9\u4e2a\u8bb0\u5fc6\u5e93\u4e2d\u8bfb\u53d6\u548c\u5199\u5165\u3002Memorizing Transformers\u7f13\u5b58\u6765\u81ea\u5148\u524d\u5757\u7684\u952e\u503c\u5bf9\uff0c\u5e76\u5728\u540e\u7eed\u5757\u4e2d\u5173\u6ce8\u5b83\u4eec\uff0c\u4ece\u800c\u6709\u6548\u5730\u5c06\u4e0a\u4e0b\u6587\u6269\u5c55\u5230\u8bad\u7ec3\u7a97\u53e3\u4e4b\u5916\u3002\u68c0\u7d22\u662f\u8fd1\u4f3c\u7684\uff08\u4f7f\u7528\u7f13\u5b58\u952e\u7684\\(k\\)\u8fd1\u90bb\u641c\u7d22\uff09\u4ee5\u4fdd\u6301\u9ad8\u6548\u3002</p> </li> <li> <p>\u4e0a\u8ff0\u65b9\u6cd5\u662f\u5904\u7406\u957f\u4e0a\u4e0b\u6587\u7684\u67b6\u6784\u89e3\u51b3\u65b9\u6848\u3002\u540c\u6837\u91cd\u8981\u7684\u662f\u6a21\u578b\u5982\u4f55\u88ab\u8bad\u7ec3\u4ee5\u6709\u6548\u4f7f\u7528\u957f\u4e0a\u4e0b\u6587\u3002</p> </li> <li> <p>\u6e10\u8fdb\u5f0f\u4e0a\u4e0b\u6587\u6269\u5c55\u662f\u6807\u51c6\u65b9\u6cd5\u3002\u4ece\u4e00\u5f00\u59cb\u5c31\u5728\u975e\u5e38\u957f\u7684\u5e8f\u5217\u4e0a\u8bad\u7ec3\u4ee3\u4ef7\u9ad8\u6602\uff08\\(O(n^2)\\)\u7684\u6ce8\u610f\u529b\u6210\u672c\uff09\uff0c\u56e0\u6b64\u6a21\u578b\u5728\u8f83\u77ed\u7684\u4e0a\u4e0b\u6587\u957f\u5ea6\u4e0a\u9884\u8bad\u7ec3\uff08\u901a\u5e38\u4e3a4K-8K token\uff09\uff0c\u7136\u540e\u901a\u8fc7\u7ee7\u7eed\u9884\u8bad\u7ec3\u5206\u9636\u6bb5\u6269\u5c55\u5230\u76ee\u6807\u957f\u5ea6\u3002</p> </li> <li> <p>Llama 3.1\u4ece8K\u6269\u5c55\u5230128K\uff0c\u4f7f\u7528\u4e86800B token\uff0c\u5e76\u9010\u6b65\u589e\u52a0\u5e8f\u5217\u957f\u5ea6\u3002DeepSeek-V3\u57284K\u5904\u8bad\u7ec3\uff0c\u7136\u540e\u6269\u5c55\u523032K\uff0c\u518d\u5230128K\u3002</p> </li> <li> <p>\u6bcf\u4e2a\u9636\u6bb5\u4f7f\u7528\u9002\u4e2d\u7684token\u6570\u91cf\uff08\u76f8\u5bf9\u4e8e\u5b8c\u6574\u7684\u9884\u8bad\u7ec3\u9884\u7b97\uff09\uff0c\u56e0\u4e3a\u6a21\u578b\u53ea\u9700\u8981\u5b66\u4e60\u5982\u4f55\u4f7f\u7528\u66f4\u957f\u7684\u4f4d\u7f6e\uff0c\u800c\u4e0d\u662f\u91cd\u65b0\u5b66\u4e60\u8bed\u8a00\u672c\u8eab\u3002</p> </li> <li> <p>\u5728\u6269\u5c55\u8fc7\u7a0b\u4e2d\uff0c\u4f4d\u7f6e\u7f16\u7801\u5fc5\u987b\u8fdb\u884c\u8c03\u6574\u3002RoPE\u63d2\u503c\u7f29\u5c0f\u4f4d\u7f6e\u7d22\u5f15\uff0c\u4f7f\u5f97\u6a21\u578b\u770b\u5230\u4e0e\u8bad\u7ec3\u65f6\u76f8\u540c\u7684\u65cb\u8f6c\u89d2\u5ea6\uff0c\u53ea\u662f\u5206\u5e03\u5728\u66f4\u957f\u7684\u5e8f\u5217\u4e0a\u3002\u5982\u679c\u6a21\u578b\u5728\u957f\u5ea6\\(L\\)\u4e0a\u8bad\u7ec3\uff0c\u4f60\u60f3\u8981\u6269\u5c55\u5230\\(L' = 4L\\)\uff0c\u4f60\u53ef\u4ee5\u5c06\u6240\u6709\u4f4d\u7f6e\u7d22\u5f15\u9664\u4ee54\u3002</p> </li> <li> <p>\u8fd9\u610f\u5473\u7740\u6a21\u578b\u6c38\u8fdc\u4e0d\u4f1a\u9047\u5230\u672a\u89c1\u8fc7\u7684\u65cb\u8f6c\u89d2\u5ea6\uff0c\u4f46\u76f8\u90bb\u4f4d\u7f6e\u4e4b\u95f4\u7684\u6709\u6548\u5206\u8fa8\u7387\u4f1a\u4e0b\u964d\u3002</p> </li> <li> <p>RoPE\u5916\u63a8\u4fdd\u6301\u539f\u59cb\u4f4d\u7f6e\u7d22\u5f15\u4e0d\u53d8\uff0c\u76f4\u63a5\u5c06RoPE\u5e94\u7528\u4e8e\u8d85\u51fa\\(L\\)\u7684\u4f4d\u7f6e\uff0c\u4f9d\u8d56\u6a21\u578b\u5bf9\u672a\u89c1\u89d2\u5ea6\u7684\u6cdb\u5316\u80fd\u529b\u3002</p> </li> <li> <p>\u63d2\u503c\u8981\u7a33\u5b9a\u5f97\u591a\uff1b\u5728\u4e0d\u8c03\u6574\u57fa\u9891\uff08ABF\uff09\u7684\u60c5\u51b5\u4e0b\uff0c\u5916\u63a8\u4f1a\u8fc5\u901f\u9000\u5316\u3002</p> </li> <li> <p>YaRN\uff08Yet another RoPE extensioN\uff0c\u53c8\u4e00\u79cdRoPE\u6269\u5c55\uff09\u6539\u8fdb\u4e86\u6734\u7d20\u63d2\u503c\uff0c\u56e0\u4e3a\u5b83\u8ba4\u8bc6\u5230\u5e76\u975e\u6240\u6709RoPE\u7ef4\u5ea6\u90fd\u5e94\u88ab\u540c\u7b49\u5bf9\u5f85\u3002</p> </li> <li> <p>\u9ad8\u9891\u7ef4\u5ea6\uff08\u5728\\(\\theta_i = \\theta_{\\text{base}}^{-2i/d}\\)\u4e2d\u8f83\u5c0f\u7684\\(i\\)\uff09\u5728\u8bad\u7ec3\u957f\u5ea6\u5185\u65cb\u8f6c\u591a\u6b21\uff0c\u53ef\u4ee5\u5f88\u597d\u5730\u5916\u63a8\u3002</p> </li> <li> <p>\u4f4e\u9891\u7ef4\u5ea6\uff08\u8f83\u5927\u7684\\(i\\)\uff09\u65cb\u8f6c\u7f13\u6162\uff0c\u5bf9\u957f\u5ea6\u6269\u5c55\u66f4\u654f\u611f\u3002</p> </li> <li> <p>YaRN\u53ea\u63d2\u503c\u4f4e\u9891\u7ef4\u5ea6\uff0c\u5916\u63a8\u9ad8\u9891\u7ef4\u5ea6\uff0c\u5e76\u5bf9\u6ce8\u610f\u529blogits\u5e94\u7528\u6e29\u5ea6\u7f29\u653e\\(t\\)\u4ee5\u8865\u507f\u5206\u5e03\u504f\u79fb\uff1a</p> </li> </ul> \\[\\text{score}'_{ij} = \\frac{q_i^T k_j}{t \\sqrt{d_k}}\\] <ul> <li> <p>\u5176\u4e2d\\(t &gt; 1\\)\u5c55\u5e73\u4e86\u6ce8\u610f\u529b\u5206\u5e03\uff0c\u9632\u6b62\u6a21\u578b\u5728\u4f4d\u7f6e\u4fe1\u53f7\u88ab\u538b\u7f29\u65f6\u8fc7\u4e8e\u5c16\u9510\u5730\u5173\u6ce8\u9644\u8fd1\u7684token\u3002</p> </li> <li> <p>\u957f\u4e0a\u4e0b\u6587\u6570\u636e\u7b56\u5c55\u662f\u4e00\u4e2a\u5173\u952e\u4e14\u5e38\u88ab\u4f4e\u4f30\u7684\u6311\u6218\u3002\u5927\u591a\u6570\u9884\u8bad\u7ec3\u8bed\u6599\u5e93\u7531\u77ed\u6587\u6863\u7ec4\u6210\uff08\u65b0\u95fb\u6587\u7ae0\u3001\u7f51\u9875\u3001\u793e\u4ea4\u5a92\u4f53\u5e16\u5b50\uff09\u3002</p> </li> <li> <p>\u957f\u4e0a\u4e0b\u6587\u8bad\u7ec3\u9700\u8981\u5b9e\u9645\u5229\u7528\u5b8c\u6574\u4e0a\u4e0b\u6587\u7a97\u53e3\u7684\u6570\u636e\u7ec4\u5408\uff1a\u4e66\u7c4d\u3001\u4ee3\u7801\u4ed3\u5e93\u3001\u957f\u7bc7\u79d1\u5b66\u6587\u7ae0\u3001\u591a\u8f6e\u5bf9\u8bdd\u65e5\u5fd7\uff0c\u4ee5\u53ca\u4e3b\u9898\u76f8\u5173\u7684\u62fc\u63a5\u6587\u6863\u3002</p> </li> <li> <p>\u5982\u679c\u6a21\u578b\u4ec5\u5728\u586b\u5145\u6216\u6253\u5305\u4ee5\u586b\u6ee1\u4e0a\u4e0b\u6587\u7a97\u53e3\u7684\u77ed\u6587\u6863\u4e0a\u8bad\u7ec3\uff0c\u5b83\u4f1a\u5b66\u4f1a\u5ffd\u7565\u8fdc\u5904\u7684token\uff0c\u56e0\u4e3a\u5b83\u4eec\u4ece\u6765\u90fd\u4e0d\u76f8\u5173\u3002</p> </li> <li> <p>\u5e8f\u5217\u6253\u5305\u662f\u4e00\u79cd\u8bad\u7ec3\u6548\u7387\u6280\u672f\uff1a\u591a\u4e2a\u6587\u6863\u62fc\u63a5\u6210\u4e00\u4e2a\u8bad\u7ec3\u5e8f\u5217\u4ee5\u907f\u514d\u586b\u5145\u6d6a\u8d39\uff0c\u4f7f\u7528\u6ce8\u610f\u529b\u63a9\u7801\u9632\u6b62\u8de8\u6587\u6863\u7684\u6ce8\u610f\u529b\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u957f\u4e0a\u4e0b\u6587\u8bad\u7ec3\uff0c\u6253\u5305\u7b56\u7565\u5f88\u91cd\u8981\uff1a\u6253\u5305\u8bb8\u591a\u4e0d\u76f8\u5173\u7684\u77ed\u6587\u6863\u4f1a\u6559\u6a21\u578b\u5c06\u8fdc\u5904\u7684token\u89c6\u4e3a\u566a\u58f0\uff0c\u800c\u6253\u5305\u66f4\u5c11\u7684\u3001\u771f\u6b63\u957f\u7684\u6587\u6863\u5219\u6559\u5b83\u4f7f\u7528\u5b8c\u6574\u7684\u4e0a\u4e0b\u6587\u3002</p> </li> <li> <p>\u4e00\u4e2a\u5df2\u77e5\u7684\u5931\u8d25\u6a21\u5f0f\u662f\"\u4e2d\u95f4\u8ff7\u5931\"\u73b0\u8c61\uff08Liu\u7b49\u4eba\uff0c2023\uff09\uff1a\u8bed\u8a00\u6a21\u578b\u80fd\u591f\u6709\u6548\u5229\u7528\u4e0a\u4e0b\u6587\u7a97\u53e3\u5f00\u5934\u548c\u7ed3\u5c3e\u7684\u4fe1\u606f\uff0c\u4f46\u5728\u5904\u7406\u4f4d\u4e8e\u4e2d\u95f4\u7684\u4fe1\u606f\u65f6\u8868\u73b0\u56f0\u96be\u3002</p> </li> <li> <p>\u8fd9\u7c7b\u4f3c\u4e8e\u4eba\u7c7b\u8bb0\u5fc6\u4e2d\u7684\u5e8f\u5217\u4f4d\u7f6e\u6548\u5e94\uff08\u9996\u56e0\u6548\u5e94\u548c\u8fd1\u56e0\u6548\u5e94\uff09\u3002</p> </li> <li> <p>\u5b83\u90e8\u5206\u6e90\u4e8e\u8bad\u7ec3\u6570\u636e\u7684\u5206\u5e03\uff08\u91cd\u8981\u4fe1\u606f\u901a\u5e38\u5728\u6587\u6863\u7684\u5f00\u5934\u6216\u7ed3\u5c3e\uff09\uff0c\u90e8\u5206\u6e90\u4e8e\u6ce8\u610f\u529b\u6a21\u5f0f\u96c6\u4e2d\u4e8e\u90bb\u8fd1token\u548c\u521d\u59cbtoken\u3002</p> </li> <li> <p>\u901a\u8fc7\u5728\u4e0d\u540c\u4f4d\u7f6e\u653e\u7f6e\u5173\u952e\u4fe1\u606f\u8fdb\u884c\u957f\u4e0a\u4e0b\u6587\u8bad\u7ec3\u53ef\u4ee5\u7f13\u89e3\u4f46\u65e0\u6cd5\u5b8c\u5168\u89e3\u51b3\u8fd9\u4e2a\u95ee\u9898\u3002</p> </li> <li> <p>\u5927\u6d77\u635e\u9488\u8bc4\u4f30\u6d4b\u8bd5\u6a21\u578b\u662f\u5426\u80fd\u591f\u4ece\u957f\u957f\u7684\u5e72\u6270\u4e0a\u4e0b\u6587\uff08\"\u5927\u6d77\"\uff09\u4e2d\u68c0\u7d22\u51fa\u4f4d\u4e8e\u4e0d\u540c\u4f4d\u7f6e\u7684\u7279\u5b9a\u4e8b\u5b9e\uff08\"\u9488\"\uff09\u3002</p> </li> <li> <p>\u5177\u6709\u771f\u6b63\u957f\u4e0a\u4e0b\u6587\u80fd\u529b\u7684\u6a21\u578b\u5e94\u8be5\u65e0\u8bba\u9488\u653e\u5728\u54ea\u91cc\u90fd\u80fd\u5b9e\u73b0\u8fd1\u4e4e\u5b8c\u7f8e\u7684\u68c0\u7d22\u3002</p> </li> <li> <p>\u8fd9\u4e2a\u6d4b\u8bd5\u6e05\u6670\u5730\u63ed\u793a\u4e86\"\u4e2d\u95f4\u8ff7\u5931\"\u6548\u5e94\uff0c\u5e76\u88ab\u7528\u4f5c\u4e0a\u4e0b\u6587\u6269\u5c55\u65b9\u6cd5\u7684\u57fa\u51c6\u3002</p> </li> <li> <p>\u9884\u8bad\u7ec3\u540e\u7684\u957f\u4e0a\u4e0b\u6587\u5fae\u8c03\u4f7f\u7528\u6709\u9488\u5bf9\u6027\u7684SFT\u6570\u636e\uff1a\u957f\u591a\u8f6e\u5bf9\u8bdd\u3001\u8bc1\u636e\u5206\u6563\u5728\u6570\u5343\u4e2atoken\u4e2d\u7684\u6587\u6863\u95ee\u7b54\u3001\u957f\u7bc7\u6458\u8981\uff0c\u4ee5\u53ca\u4ed3\u5e93\u7ea7\u522b\u7684\u4ee3\u7801\u7406\u89e3\u3002</p> </li> <li> <p>Qwen3\u5728\u6b64\u9636\u6bb5\u4f7f\u7528\u53cc\u5757\u6ce8\u610f\u529b\uff08DCA\uff09\uff0c\u5b83\u5c06\u957f\u5e8f\u5217\u4f5c\u4e3a\u6210\u5bf9\u7684\u5757\u8fdb\u884c\u5904\u7406\uff0c\u5176\u4e2d\u5757\u5185\u6ce8\u610f\u529b\u662f\u5b8c\u6574\u7684\uff0c\u5757\u95f4\u6ce8\u610f\u529b\u662f\u9ad8\u6548\u7684\uff0c\u5728\u5fae\u8c03\u671f\u95f4\u5b9e\u73b0\u4e864\u500d\u7684\u6709\u6548\u5e8f\u5217\u5bb9\u91cf\u3002</p> </li> <li> <p>\u72b6\u6001\u7a7a\u95f4\u6a21\u578b\uff08SSM\uff09\u63d0\u4f9b\u4e86\u4e00\u79cd\u6839\u672c\u4e0d\u540c\u7684\u957f\u5e8f\u5217\u5efa\u6a21\u65b9\u6cd5\u3002\u5b83\u4eec\u4e0d\u662f\u4fee\u6539\u6ce8\u610f\u529b\uff0c\u800c\u662f\u7528\u53d7\u8fde\u7eed\u65f6\u95f4\u63a7\u5236\u7406\u8bba\u542f\u53d1\u7684\u7ebf\u6027\u52a8\u529b\u7cfb\u7edf\u5b8c\u5168\u53d6\u4ee3\u6ce8\u610f\u529b\u3002</p> </li> <li> <p>\u4e00\u4e2aSSM\u5c06\u8f93\u5165\u5e8f\u5217\\(u(t)\\)\u901a\u8fc7\u4e00\u4e2a\u6f5c\u5728\u72b6\u6001\\(x(t) \\in \\mathbb{R}^N\\)\u6620\u5c04\u5230\u8f93\u51fa\\(y(t)\\)\uff0c\u5176\u63a7\u5236\u65b9\u7a0b\u4e3a\uff1a</p> </li> </ul> \\[x'(t) = Ax(t) + Bu(t), \\quad y(t) = Cx(t) + Du(t)\\] <ul> <li> <p>\u5176\u4e2d\\(A \\in \\mathbb{R}^{N \\times N}\\)\u662f\u72b6\u6001\u8f6c\u79fb\u77e9\u9635\uff0c\\(B \\in \\mathbb{R}^{N \\times 1}\\)\u662f\u8f93\u5165\u6295\u5f71\uff0c\\(C \\in \\mathbb{R}^{1 \\times N}\\)\u662f\u8f93\u51fa\u6295\u5f71\uff0c\\(D\\)\u662f\u4e00\u4e2a\u8df3\u8dc3\u8fde\u63a5\u3002</p> </li> <li> <p>\u4e3a\u4e86\u5c06\u5176\u5e94\u7528\u4e8e\u79bb\u6563\u5e8f\u5217\uff08token\uff09\uff0c\u4f7f\u7528\u6b65\u957f\\(\\Delta\\)\u5bf9\u8fde\u7eed\u7cfb\u7edf\u8fdb\u884c\u79bb\u6563\u5316\u3002\u96f6\u9636\u4fdd\u6301\u79bb\u6563\u5316\u7ed9\u51fa\uff1a</p> </li> </ul> \\[\\bar{A} = \\exp(\\Delta A), \\quad \\bar{B} = (\\Delta A)^{-1}(\\exp(\\Delta A) - I) \\cdot \\Delta B\\] <ul> <li> <p>\u79bb\u6563\u9012\u5f52\u53d8\u4e3a\\(x_k = \\bar{A} x_{k-1} + \\bar{B} u_k\\)\uff0c\\(y_k = C x_k + D u_k\\)\uff0c\u8fd9\u770b\u8d77\u6765\u50cf\u4e00\u4e2aRNN\uff1a\u6bcf\u6b21\u7528\u4e00\u4e2a\u9690\u85cf\u72b6\u6001\u5904\u7406\u4e00\u4e2atoken\u3002</p> </li> <li> <p>\u4e0eRNN\u4e0d\u540c\uff0c\u8fd9\u4e2a\u9012\u5f52\u4e5f\u53ef\u4ee5\u5c55\u5f00\u4e3a\u4e00\u4e2a\u5168\u5c40\u5377\u79ef\uff1a\u56e0\u4e3a\u7cfb\u7edf\u662f\u7ebf\u6027\u7684\uff0c\u8f93\u51fa\u4e3a\\(y = \\bar{K} \\ast u\\)\uff0c\u5176\u4e2d\u6838\\(\\bar{K} = (C\\bar{B}, \\, C\\bar{A}\\bar{B}, \\, C\\bar{A}^2\\bar{B}, \\ldots)\\)\u4ec5\u53d6\u51b3\u4e8e\u56fa\u5b9a\u53c2\u6570\u3002</p> </li> <li> <p>\u8fd9\u79cd\u53cc\u91cd\u89c6\u89d2\u2014\u2014\u7528\u4e8e\u9ad8\u6548\u81ea\u56de\u5f52\u63a8\u7406\u7684\u9012\u5f52\uff08\u6bcf\u6b65\\(O(1)\\)\uff09\u548c\u7528\u4e8e\u9ad8\u6548\u5e76\u884c\u8bad\u7ec3\u7684\u5377\u79ef\uff08\u901a\u8fc7FFT\u5b9e\u73b0\\(O(n \\log n)\\)\uff09\u2014\u2014\u662fSSM\u7684\u6838\u5fc3\u6d1e\u89c1\u3002</p> </li> </ul> <p></p> <ul> <li> <p>S4\uff08\u5e8f\u5217\u5efa\u6a21\u7684\u7ed3\u6784\u5316\u72b6\u6001\u7a7a\u95f4\uff0cGu\u7b49\u4eba\uff0c2022\uff09\u901a\u8fc7\u89e3\u51b3\u5173\u952e\u7684\u6570\u503c\u6311\u6218\u4f7fSSM\u53d8\u5f97\u5b9e\u7528\uff1a\u72b6\u6001\u77e9\u9635\\(A\\)\u5fc5\u987b\u6355\u83b7\u957f\u8ddd\u79bb\u4f9d\u8d56\u5173\u7cfb\uff0c\u4f46\u6734\u7d20\u5730\u53c2\u6570\u5316\u4f1a\u5bfc\u81f4\u68af\u5ea6\u6d88\u5931\u6216\u7206\u70b8\uff08\u4e0e\u666e\u901aRNN\u76f8\u540c\u7684\u95ee\u9898\uff09\u3002</p> </li> <li> <p>S4\u4f7f\u7528HiPPO\uff08\u9ad8\u9636\u591a\u9879\u5f0f\u6295\u5f71\u7b97\u5b50\uff09\u77e9\u9635\u521d\u59cb\u5316\\(A\\)\uff0c\u8be5\u77e9\u9635\u6765\u6e90\u4e8e\u8fde\u7eed\u4fe1\u53f7\u6700\u4f18\u591a\u9879\u5f0f\u903c\u8fd1\u7684\u7406\u8bba\u3002HiPPO\u77e9\u9635\u5177\u6709\u7279\u5b9a\u7684\u7ed3\u6784\uff0c\u88ab\u8bc1\u660e\u80fd\u4f7f\u72b6\u6001\u4ee5\u4f18\u96c5\u8870\u51cf\u7684\u65b9\u5f0f\u7ef4\u6301\u6574\u4e2a\u8f93\u5165\u5386\u53f2\u7684\u538b\u7f29\u8868\u793a\uff1a</p> </li> </ul> \\[ A_{nk} = -\\begin{cases} (2n+1)^{1/2}(2k+1)^{1/2} &amp; \\text{if } n &gt; k \\\\ n+1 &amp; \\text{if } n = k \\\\ 0 &amp; \\text{if } n &lt; k \\end{cases} \\] <ul> <li> <p>\u8fd9\u79cd\u4e0b\u4e09\u89d2\u7ed3\u6784\u786e\u4fdd\u72b6\u6001\u4f7f\u7528\u52d2\u8ba9\u5fb7\u591a\u9879\u5f0f\u4f5c\u4e3a\u4fe1\u53f7\u7684\u5728\u7ebf\u903c\u8fd1\u5668\u3002\u8ba1\u7b97\u957f\u6838\u7684\\(\\bar{A}^k\\)\u4ee3\u4ef7\u9ad8\u6602\uff0c\u56e0\u6b64S4\u5229\u7528HiPPO\u77e9\u9635\u53ef\u4ee5\u5206\u89e3\u4e3a\u4f4e\u79e9\u9879\u548c\u5bf9\u89d2\u9879\u4e4b\u548c\u7684\u4e8b\u5b9e\uff0c\u5b9e\u73b0\u4e86\\(O(n \\log n)\\)\u7684\u6838\u8ba1\u7b97\u3002</p> </li> <li> <p>Mamba\uff08Gu\u548cDao\uff0c2023\uff09\u5f15\u5165\u4e86\u9009\u62e9\u6027\u72b6\u6001\u7a7a\u95f4\u8fd9\u4e00\u5173\u952e\u521b\u65b0\uff1a\u4f7fSSM\u53c2\u6570\u4f9d\u8d56\u4e8e\u8f93\u5165\u3002\u5728S4\u4e2d\uff0c\u77e9\u9635\\(A\\)\u3001\\(B\\)\u3001\\(C\\)\u548c\u6b65\u957f\\(\\Delta\\)\u662f\u56fa\u5b9a\u7684\u2014\u2014\u65e0\u8bba\u5185\u5bb9\u5982\u4f55\uff0c\u76f8\u540c\u7684\u52a8\u529b\u5b66\u5e94\u7528\u4e8e\u6bcf\u4e2atoken\u3002Mamba\u4f7f\\(B\\)\u3001\\(C\\)\u548c\\(\\Delta\\)\u6210\u4e3a\u8f93\u5165\u7684\u51fd\u6570\uff1a</p> </li> </ul> \\[B_k = \\text{Linear}(u_k), \\quad C_k = \\text{Linear}(u_k), \\quad \\Delta_k = \\text{softplus}(\\text{Linear}(u_k))\\] <ul> <li> <p>\u8fd9\u79cd\u9009\u62e9\u6027\u5141\u8bb8\u6a21\u578b\u5728\u6bcf\u4e2a\u4f4d\u7f6e\u51b3\u5b9a\u54ea\u4e9b\u4fe1\u606f\u5b58\u5165\u72b6\u6001\u3001\u54ea\u4e9b\u4fe1\u606f\u5ffd\u7565\u2014\u2014\u7c7b\u4f3c\u4e8e\u6ce8\u610f\u529b\u5982\u4f55\u9009\u62e9\u76f8\u5173token\uff0c\u4f46\u6ca1\u6709\u4e8c\u6b21\u6210\u672c\u3002\u6b65\u957f\\(\\Delta_k\\)\u63a7\u5236\u7740\"\u95e8\"\uff1a\u5927\u7684\\(\\Delta\\)\u5bfc\u81f4\u72b6\u6001\u5f3a\u70c8\u5730\u6574\u5408\u5f53\u524d\u8f93\u5165\uff08\u8fde\u7eed\u52a8\u529b\u5b66\u524d\u8fdb\u4e00\u5927\u6b65\uff0c\u6709\u6548\u91cd\u7f6e\u72b6\u6001\uff09\uff0c\u800c\u5c0f\u7684\\(\\Delta\\)\u5219\u4fdd\u7559\u73b0\u6709\u72b6\u6001\u5e76\u5ffd\u7565\u5f53\u524d\u8f93\u5165\u3002</p> </li> <li> <p>\u6743\u8861\u4e4b\u5904\u5728\u4e8e\uff0c\u4f9d\u8d56\u4e8e\u8f93\u5165\u7684\u53c2\u6570\u6253\u7834\u4e86\u5377\u79ef\u89c6\u89d2\uff08\u6838\u4e0d\u518d\u56fa\u5b9a\uff09\uff0c\u56e0\u6b64Mamba\u65e0\u6cd5\u4f7f\u7528\u57fa\u4e8eFFT\u7684\u8bad\u7ec3\u3002\u76f8\u53cd\uff0c\u5b83\u4f7f\u7528\u4e00\u79cd\u786c\u4ef6\u611f\u77e5\u7684\u5e76\u884c\u626b\u63cf\u7b97\u6cd5\uff0c\u5229\u7528\u9012\u5f52\u7684\u7ed3\u5408\u5f8b\uff1a\u72b6\u6001\u66f4\u65b0\\((x_k, u_k) \\mapsto x_{k+1}\\)\u53ef\u4ee5\u8868\u793a\u4e3a\u4e00\u4e32\u7ed3\u5408\u6027\u64cd\u4f5c\uff0c\u5e76\u4f7f\u7528\u524d\u7f00\u548c\uff08\u626b\u63cf\uff09\u8fdb\u884c\u5e76\u884c\u5316\uff0c\u7c7b\u4f3c\u4e8e\u786c\u4ef6\u8bbe\u8ba1\u4e2d\u7684\u5e76\u884c\u524d\u7f00\u52a0\u6cd5\u3002\u8fd9\u5728GPU\u4e0a\u4ee5\\(O(n)\\)\u65f6\u95f4\u548c\\(O(\\log n)\\)\u6df1\u5ea6\u8fd0\u884c\uff0c\u51e0\u4e4e\u4e0e\u5377\u79ef\u7684\u6548\u7387\u76f8\u5f53\u3002</p> </li> <li> <p>Mamba\u5b9e\u73b0\u4e86\u771f\u6b63\u6bcftoken \\(O(1)\\)\u7684\u63a8\u7406\uff08\u53ea\u9700\u66f4\u65b0\u56fa\u5b9a\u5927\u5c0f\u7684\u72b6\u6001\uff0c\u6ca1\u6709\u968f\u4e0a\u4e0b\u6587\u589e\u957f\u7684KV\u7f13\u5b58\uff09\uff0c\u4f7f\u5176\u5728\u957f\u5e8f\u5217\u957f\u5ea6\u4e0a\u4ece\u6839\u672c\u4e0a\u6bd4Transformer\u66f4\u8282\u7701\u5185\u5b58\u3002\u72b6\u6001\u5927\u5c0f\\(N\\)\uff08\u901a\u5e38\u4e3a16\uff09\u8fdc\u5c0f\u4e8eTransformer\u7684KV\u7f13\u5b58\uff08\u5b58\u50a8\\(O(n \\cdot d)\\)\u4e2a\u503c\uff09\u3002\u5728\u5b9e\u8df5\u4e2d\uff0c\u5728\u76f8\u540c\u7684\u53c2\u6570\u91cf\u4e0b\uff0cMamba\u5728\u8bed\u8a00\u5efa\u6a21\u57fa\u51c6\u4e0a\u7684\u8d28\u91cf\u8fbe\u5230\u6216\u8d85\u8fc7Transformer\uff0c\u5e76\u4e14\u5728\u957f\u5e8f\u5217\u4e0a\u63a8\u7406\u901f\u5ea6\u663e\u8457\u66f4\u5feb\u3002</p> </li> <li> <p>\u6df7\u5408\u67b6\u6784\u5c06SSM\u5c42\u4e0e\u6ce8\u610f\u529b\u5c42\u76f8\u7ed3\u5408\uff0c\u4f7f\u7528SSM\u5904\u7406\u5927\u90e8\u5206\u5c42\uff08\u9ad8\u6548\u7684\u957f\u8ddd\u79bb\u4f20\u64ad\uff09\uff0c\u5e76\u7a7f\u63d2\u5c11\u91cf\u6ce8\u610f\u529b\u5c42\uff08\u7cbe\u786e\u7684\u57fa\u4e8e\u5185\u5bb9\u7684\u68c0\u7d22\uff09\u3002\u50cfJamba\u548cZamba\u8fd9\u6837\u7684\u6a21\u578b\u4ea4\u9519\u4e86Mamba\u548cTransformer\u5757\uff0c\u5728\u4fdd\u6301\u5927\u90e8\u5206\u63a8\u7406\u6548\u7387\u4f18\u52bf\u7684\u540c\u65f6\uff0c\u5b9e\u73b0\u4e86\u6bd4\u7eafSSM\u66f4\u597d\u7684\u8d28\u91cf\u3002\u8fd9\u8868\u660e\u6ce8\u610f\u529b\u548cSSM\u6355\u83b7\u4e86\u4e92\u8865\u7684\u80fd\u529b\uff1aSSM\u64c5\u957f\u5e73\u6ed1\u7684\u957f\u8ddd\u79bb\u72b6\u6001\u4f20\u64ad\uff0c\u800c\u6ce8\u610f\u529b\u64c5\u957f\u7cbe\u786e\u7684\u3001\u4f9d\u8d56\u4e8e\u5185\u5bb9\u7684\u67e5\u627e\u3002</p> </li> <li> <p>\u68c0\u7d22\u589e\u5f3a\u751f\u6210\uff08RAG\uff09\u901a\u8fc7\u5728\u63a8\u7406\u65f6\u8ba9\u8bed\u8a00\u6a21\u578b\u8bbf\u95ee\u5916\u90e8\u77e5\u8bc6\u5e93\uff0c\u6765\u89e3\u51b3\u8bed\u8a00\u6a21\u578b\u7684\u77e5\u8bc6\u5c40\u9650\u6027\u3002RAG\u4e0d\u662f\u4ec5\u4f9d\u8d56\u4e8e\u8bad\u7ec3\u671f\u95f4\u7f16\u7801\u5728\u6a21\u578b\u53c2\u6570\u4e2d\u7684\u77e5\u8bc6\uff0c\u800c\u662f\u68c0\u7d22\u76f8\u5173\u6587\u6863\u5e76\u57fa\u4e8e\u5b83\u4eec\u8fdb\u884c\u6761\u4ef6\u751f\u6210\u3002</p> </li> <li> <p>\u7ecf\u5178\u7684\u68c0\u7d22\u5668-\u9605\u8bfb\u5668\u67b6\u6784\u6709\u4e24\u4e2a\u7ec4\u4ef6\u3002\u68c0\u7d22\u5668\u63a5\u6536\u67e5\u8be2\u5e76\u4ece\u8bed\u6599\u5e93\u4e2d\u83b7\u53d6\u6700\u76f8\u5173\u7684top-\\(k\\)\u4e2a\u6bb5\u843d\u3002\u9605\u8bfb\u5668\uff08\u4e00\u4e2a\u8bed\u8a00\u6a21\u578b\uff09\u57fa\u4e8e\u67e5\u8be2\u548c\u68c0\u7d22\u5230\u7684\u6bb5\u843d\u751f\u6210\u7b54\u6848\u3002\u68c0\u7d22\u5668\u53ef\u4ee5\u4f7f\u7528\u7a00\u758f\u65b9\u6cd5\uff08BM25\uff0c\u5b83\u6269\u5c55\u4e86\u6587\u4ef602\u4e2d\u7684TF-IDF\uff09\u6216\u7a20\u5bc6\u65b9\u6cd5\u3002</p> </li> <li> <p>\u7a20\u5bc6\u6bb5\u843d\u68c0\u7d22\uff08DPR\uff09\u4f7f\u7528\u53cc\u7f16\u7801\u5668\u67b6\u6784\uff1a\u4e00\u4e2a\u7f16\u7801\u5668\u5c06\u95ee\u9898\u6620\u5c04\u4e3a\u5411\u91cf\uff0c\u53e6\u4e00\u4e2a\u5c06\u6bb5\u843d\u6620\u5c04\u4e3a\u5411\u91cf\u3002\u4e24\u8005\u901a\u5e38\u90fd\u662f\u57fa\u4e8eBERT\u7684\u3002\u5728\u7d22\u5f15\u65f6\uff0c\u6240\u6709\u6bb5\u843d\u88ab\u7f16\u7801\u5e76\u5b58\u50a8\u3002\u5728\u67e5\u8be2\u65f6\uff0c\u95ee\u9898\u88ab\u7f16\u7801\uff0c\u4f7f\u7528\u8fd1\u4f3c\u6700\u8fd1\u90bb\u641c\u7d22\uff08\u5982FAISS\uff09\u627e\u5230\u6700\u8fd1\u7684\u6bb5\u843d\u3002\u76f8\u4f3c\u5ea6\u5ea6\u91cf\u662f\u95ee\u9898\u5411\u91cf\u548c\u6bb5\u843d\u5411\u91cf\u4e4b\u95f4\u7684\u70b9\u79ef\u3002</p> </li> <li> <p>\u5206\u5757\u7b56\u7565\u663e\u8457\u5f71\u54cd\u68c0\u7d22\u8d28\u91cf\u3002\u6587\u6863\u5fc5\u987b\u88ab\u5206\u5272\u6210\u8db3\u591f\u5c0f\u4ee5\u4f7f\u68c0\u7d22\u5668\u80fd\u591f\u5904\u7406\u7684\u6bb5\u843d\uff0c\u4f46\u53c8\u8981\u8db3\u591f\u5927\u4ee5\u5305\u542b\u5b8c\u6574\u7684\u601d\u60f3\u3002\u56fa\u5b9a\u5927\u5c0f\u7684\u5206\u5757\uff08\u4f8b\u5982\uff0c256\u4e2atoken\uff0c50\u4e2atoken\u91cd\u53e0\uff09\u5f88\u7b80\u5355\uff0c\u4f46\u53ef\u80fd\u7b28\u62d9\u5730\u5206\u5272\u53e5\u5b50\u3002\u8bed\u4e49\u5206\u5757\u5728\u6bb5\u843d\u6216\u7ae0\u8282\u8fb9\u754c\u5904\u5206\u5272\u3002\u5c42\u6b21\u5316\u5206\u5757\u5728\u4e0d\u540c\u7c92\u5ea6\u4e0a\u521b\u5efa\u4e00\u4e2a\u6458\u8981\u6811\u3002</p> </li> </ul> <p></p> <ul> <li> <p>RAG\u6709\u51e0\u4e2a\u4f18\u52bf\uff1a\u77e5\u8bc6\u5e93\u53ef\u4ee5\u66f4\u65b0\u800c\u65e0\u9700\u91cd\u65b0\u8bad\u7ec3\u6a21\u578b\uff0c\u6a21\u578b\u53ef\u4ee5\u5f15\u7528\u6765\u6e90\uff0c\u5e76\u4e14\u56e0\u4e3a\u6a21\u578b\u53ef\u4ee5\u57fa\u4e8e\u68c0\u7d22\u5230\u7684\u6587\u672c\u8fdb\u884c\u56de\u7b54\uff0c\u5e7b\u89c9\u51cf\u5c11\u4e86\u3002\u4e3b\u8981\u6311\u6218\u662f\u68c0\u7d22\u8d28\u91cf\uff08\u5982\u679c\u68c0\u7d22\u5230\u9519\u8bef\u7684\u6bb5\u843d\uff0c\u6a21\u578b\u53ef\u80fd\u4f1a\u81ea\u4fe1\u5730\u7ed9\u51fa\u9519\u8bef\u7b54\u6848\uff09\u548c\u5ef6\u8fdf\uff08\u68c0\u7d22\u4e3a\u63a8\u7406\u589e\u52a0\u4e86\u4e00\u4e2a\u6b65\u9aa4\uff09\u3002</p> </li> <li> <p>\u63a8\u6d4b\u6027\u89e3\u7801\u901a\u8fc7\u4f7f\u7528\u4e00\u4e2a\u5c0f\u7684\u3001\u5feb\u901f\u7684\u8349\u7a3f\u6a21\u578b\u5e76\u884c\u63d0\u51fa\u591a\u4e2atoken\uff0c\u7136\u540e\u7531\u5927\u7684\u76ee\u6807\u6a21\u578b\u5728\u5355\u4e2a\u524d\u5411\u4f20\u64ad\u4e2d\u8fdb\u884c\u9a8c\u8bc1\uff0c\u4ece\u800c\u52a0\u901f\u81ea\u56de\u5f52\u751f\u6210\u3002</p> </li> <li> <p>\u8be5\u7b97\u6cd5\u7684\u5de5\u4f5c\u65b9\u5f0f\u5982\u4e0b\uff1a\u8349\u7a3f\u6a21\u578b\u81ea\u56de\u5f52\u5730\u751f\u6210\\(k\\)\u4e2a\u5019\u9009token\uff08\u56e0\u4e3a\u8349\u7a3f\u6a21\u578b\u5f88\u5c0f\uff0c\u6240\u4ee5\u8fd9\u5f88\u5feb\uff09\u3002</p> </li> <li> <p>\u7136\u540e\uff0c\u76ee\u6807\u6a21\u578b\u5728\u5355\u4e2a\u524d\u5411\u4f20\u64ad\u4e2d\u540c\u65f6\u5bf9\u5168\u90e8\\(k\\)\u4e2atoken\u8fdb\u884c\u8bc4\u5206\uff08\u56e0\u4e3a\u5de5\u4f5c\u88ab\u6279\u5904\u7406\uff0c\u6240\u4ee5\u8fd9\u5f88\u9ad8\u6548\uff09\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u4ece\u8349\u7a3f\u5206\u5e03\\(p_d(t)\\)\u4e2d\u91c7\u6837\u7684\u6bcf\u4e2a\u5019\u9009token \\(t\\)\uff0c\u5b83\u4ee5\u6982\u7387\\(\\min(1, \\, p_{\\text{target}}(t) / p_d(t))\\)\u88ab\u63a5\u53d7\u3002\u5982\u679c\u88ab\u62d2\u7edd\uff0c\u5219\u4ece\u8c03\u6574\u540e\u5206\u5e03\\(p_{\\text{adj}}(t) = \\max(0, \\, p_{\\text{target}}(t) - p_d(t))\\)\uff08\u7ecf\u5f52\u4e00\u5316\uff09\u4e2d\u91cd\u65b0\u91c7\u6837\u4e00\u4e2a\u4fee\u6b63\u540e\u7684token\u3002</p> </li> <li> <p>\u8fd9\u79cd\u63a5\u53d7-\u62d2\u7edd\u65b9\u6848\u4fdd\u8bc1\u4e86\u8f93\u51fa\u5206\u5e03\u4e0e\u5355\u72ec\u4f7f\u7528\u76ee\u6807\u6a21\u578b\u5b8c\u5168\u76f8\u540c\u3002</p> </li> <li> <p>\u4e3a\u4e86\u7406\u89e3\u539f\u56e0\uff0c\u8003\u8651\u751f\u6210token \\(t\\)\u7684\u6709\u6548\u6982\u7387\u3002\u5b83\u53ef\u4ee5\u76f4\u63a5\u88ab\u63a5\u53d7\uff08\u6982\u7387\\(p_d(t) \\cdot \\min(1, p_{\\text{target}}(t)/p_d(t))\\)\uff09\uff0c\u6216\u8005\u901a\u8fc7\u91cd\u65b0\u91c7\u6837\u4ea7\u751f\u3002</p> </li> <li> <p>\u5bf9\u4e8e\\(p_{\\text{target}}(t) \\leq p_d(t)\\)\u7684token\uff0c\u76f4\u63a5\u63a5\u53d7\u8d21\u732e\\(p_{\\text{target}}(t)\\)\u3002\u5bf9\u4e8e\\(p_{\\text{target}}(t) &gt; p_d(t)\\)\u7684token\uff0c\u76f4\u63a5\u63a5\u53d7\u8d21\u732e\\(p_d(t)\\)\uff0c\u91cd\u65b0\u91c7\u6837\u8d21\u732e\u5269\u4f59\u90e8\u5206\\(p_{\\text{target}}(t) - p_d(t)\\)\uff08\u5728\u8003\u8651\u62d2\u7edd\u6982\u7387\u4e4b\u540e\uff09\u3002</p> </li> <li> <p>\u5728\u8fd9\u4e24\u79cd\u60c5\u51b5\u4e0b\uff0c\u751f\u6210\\(t\\)\u7684\u603b\u6982\u7387\u7b49\u4e8e\\(p_{\\text{target}}(t)\\)\u3002\u8349\u7a3f\u6a21\u578b\u53ea\u5f71\u54cd\u901f\u5ea6\uff0c\u4e0d\u5f71\u54cd\u8d28\u91cf\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u52a0\u901f\u53d6\u51b3\u4e8e\u63a5\u53d7\u7387\uff1a\u5982\u679c\u8349\u7a3f\u6a21\u578b\u4e0e\u76ee\u6807\u6a21\u578b\u5bf9\u9f50\u826f\u597d\uff0c\u5927\u591a\u6570token\u88ab\u63a5\u53d7\uff0c\u5899\u4e0a\u65f6\u949f\u65f6\u95f4\u5927\u81f4\u7b49\u4e8e\u8349\u7a3f\u6a21\u578b\u7684\u65f6\u95f4\u3002\u5178\u578b\u52a0\u901f\u4e3a2-3\u500d\uff0c\u4e14\u8d28\u91cf\u65e0\u4e0b\u964d\u3002</p> </li> <li> <p>Medusa\uff08Cai\u7b49\u4eba\uff0c2024\uff09\u91c7\u7528\u4e0d\u540c\u7684\u65b9\u6cd5\uff1a\u4e0d\u662f\u4f7f\u7528\u5355\u72ec\u7684\u8349\u7a3f\u6a21\u578b\uff0c\u800c\u662f\u5728\u76ee\u6807\u6a21\u578b\u672c\u8eab\u4e2d\u6dfb\u52a0\u591a\u4e2a\u8f7b\u91cf\u7ea7\u7684\u9884\u6d4b\u5934\u3002\u6bcf\u4e2a\u5934\u540c\u65f6\u9884\u6d4b\u4e0d\u540c\u7684\u672a\u6765token\u4f4d\u7f6e\uff08\u63d0\u524d\\(k = 1, 2, 3, \\ldots\\)\u6b65\uff09\u3002\u5728\u6bcf\u4e00\u6b65\uff0cMedusa\u4f7f\u7528\u6811\u72b6\u7ed3\u6784\u63d0\u51fa\u82e5\u5e72\u5019\u9009\u5ef6\u7eed\uff0c\u901a\u8fc7\u76ee\u6807\u6a21\u578b\u6ce8\u610f\u529b\u5c42\u7684\u5355\u4e2a\u524d\u5411\u4f20\u64ad\u9a8c\u8bc1\u54ea\u4e9b\u5019\u9009\u662f\u4e00\u81f4\u7684\u3002\u8fd9\u5b8c\u5168\u907f\u514d\u4e86\u5bf9\u5355\u72ec\u8349\u7a3f\u6a21\u578b\u7684\u9700\u6c42\u3002</p> </li> <li> <p>\u5e76\u884c\u751f\u6210\u65b9\u6cd5\u66f4\u5e7f\u6cdb\u5730\u65e8\u5728\u6253\u7834\u81ea\u56de\u5f52\u89e3\u7801\u7684\u4e32\u884c\u74f6\u9888\u3002\u96c5\u53ef\u6bd4\u89e3\u7801\u4f7f\u7528\u731c\u6d4b\u521d\u59cb\u5316\u6240\u6709\u4f4d\u7f6e\uff0c\u5e76\u5e76\u884c\u5730\u8fed\u4ee3\u7cbe\u70bc\u76f4\u5230\u6536\u655b\uff0c\u5c06\u751f\u6210\u89c6\u4e3a\u4e00\u4e2a\u4e0d\u52a8\u70b9\u8fed\u4ee3\u3002\u975e\u81ea\u56de\u5f52\u6a21\u578b\uff08NAT\uff09\u5728\u5355\u4e2a\u524d\u5411\u4f20\u64ad\u4e2d\u540c\u65f6\u751f\u6210\u6240\u6709token\uff0c\u4f46\u901a\u5e38\u906d\u53d7\u8d28\u91cf\u4e0b\u964d\u7684\u95ee\u9898\uff0c\u9700\u8981\u50cf\u8fed\u4ee3\u7cbe\u70bc\u3001CTC\u635f\u5931\u6216\u6765\u81ea\u81ea\u56de\u5f52\u6559\u5e08\u7684\u77e5\u8bc6\u84b8\u998f\u8fd9\u6837\u7684\u6280\u672f\u6765\u7f29\u5c0f\u5dee\u8ddd\u3002</p> </li> <li> <p>\u4e0a\u8ff0\u6280\u672f\u2014\u2014\u5bf9\u9f50\u3001\u957f\u4e0a\u4e0b\u6587\u3001\u68c0\u7d22\u3001\u9ad8\u6548\u89e3\u7801\u3001\u72b6\u6001\u7a7a\u95f4\u6a21\u578b\u2014\u2014\u5728\u73b0\u4ee3\u751f\u4ea7\u7ea7LLM\u4e2d\u7ed3\u5408\u5728\u4e00\u8d77\u3002</p> </li> <li> <p>\u672c\u6587\u7684\u5176\u4f59\u90e8\u5206\u5ba1\u89c6\u4e86\u524d\u6cbf\u6a21\u578b\u7684\u67b6\u6784\u521b\u65b0\uff0c\u5c55\u793a\u4e86\u6587\u4ef601-04\u4e2d\u7684\u7406\u8bba\u601d\u60f3\u4ee5\u53ca\u4e0a\u8ff0\u65b9\u6cd5\u662f\u5982\u4f55\u5728\u5b9e\u8df5\u4e2d\u7ed3\u5408\u8d77\u6765\u7684\u3002</p> </li> <li> <p>\u5206\u7ec4\u67e5\u8be2\u6ce8\u610f\u529b\uff08GQA\uff09 \u662f\u91c7\u7528\u6700\u5e7f\u6cdb\u7684\u6ce8\u610f\u529b\u6548\u7387\u6280\u672f\u3002\u6807\u51c6\u591a\u5934\u6ce8\u610f\u529b\uff08MHA\uff09\u4e3a\u6bcf\u4e2a\u5934\u7ef4\u62a4\u72ec\u7acb\u7684\u952e\u548c\u503c\u6295\u5f71\uff0c\u6bcf\u4e2atoken\u9700\u8981\u7f13\u5b58\\(n_{\\text{heads}} \\times d_{\\text{head}}\\)\u4e2a\u503c\u3002GQA\u5c06\u591a\u4e2a\u67e5\u8be2\u5934\u5206\u7ec4\u4ee5\u5171\u4eab\u4e00\u4e2a\u952e-\u503c\u5934\u3002</p> </li> <li> <p>\u4f7f\u752864\u4e2a\u67e5\u8be2\u5934\u548c8\u4e2aKV\u5934\uff08Llama 3\u3001Qwen\u3001Gemma\u4e2d\u7684\u5e38\u89c1\u914d\u7f6e\uff09\uff0c\u6bcf\u4e2aKV\u5934\u88ab8\u4e2a\u67e5\u8be2\u5934\u5171\u4eab\uff0c\u4e0eMHA\u76f8\u6bd4KV\u7f13\u5b58\u51cf\u5c11\u4e868\u500d\u3002</p> </li> <li> <p>\u8f93\u51fa\u8d28\u91cf\u51e0\u4e4e\u4e0eMHA\u76f8\u540c\uff0c\u56e0\u4e3a\u67e5\u8be2\u4ecd\u7136\u53ef\u4ee5\u5173\u6ce8\u4e0d\u540c\u7684\u6a21\u5f0f\uff0c\u5b83\u4eec\u53ea\u662f\u5171\u4eab\u76f8\u540c\u7684\u952e-\u503c\u5b50\u7a7a\u95f4\u3002\u591a\u67e5\u8be2\u6ce8\u610f\u529b\uff08MQA\uff09\u662f\u6240\u6709\u67e5\u8be2\u4f7f\u7528\u5355\u4e2aKV\u5934\u7684\u6781\u7aef\u60c5\u51b5\uff0c\u4f46GQA\u63d0\u4f9b\u4e86\u66f4\u597d\u7684\u8d28\u91cf-\u6548\u7387\u6743\u8861\u3002</p> </li> <li> <p>\u591a\u5934\u6f5c\u5728\u6ce8\u610f\u529b\uff08MLA\uff09\uff0c\u7531DeepSeek-V2\u5f15\u5165\uff0c\u5b9e\u73b0\u4e86\u66f4\u6fc0\u8fdb\u7684KV\u7f13\u5b58\u538b\u7f29\u3002MLA\u4e0d\u662f\u7f13\u5b58\u5b8c\u6574\u7684\u952e-\u503c\u6295\u5f71\uff08\u5373\u4f7f\u4f7f\u7528GQA\uff09\uff0c\u800c\u662f\u5c06\u9690\u85cf\u72b6\u6001\u4e0b\u6295\u5f71\u4e3a\u4e00\u4e2a\u4f4e\u79e9\u7684\u6f5c\u5728\u5411\u91cf\\(c_t \\in \\mathbb{R}^{d_c}\\)\uff0c\u5176\u4e2d\\(d_c \\ll n_{\\text{heads}} \\times d_{\\text{head}}\\)\uff1a</p> </li> </ul> \\[c_t = W_{\\text{down}} \\, h_t\\] <ul> <li> <p>\u4ec5\u7f13\u5b58\u8fd9\u4e2a\u538b\u7f29\u5411\u91cf\u3002\u5728\u6ce8\u610f\u529b\u8ba1\u7b97\u65f6\uff0c\u901a\u8fc7\u4e0a\u6295\u5f71\u91cd\u5efa\u5b8c\u6574\u7684\u952e\u548c\u503c\u8868\u793a\uff1a\\(k_t = W_{\\text{up}}^K c_t\\)\uff0c\\(v_t = W_{\\text{up}}^V c_t\\)\u3002\u5728DeepSeek-V3\u4e2d\uff08671B\u603b\u53c2\u6570\uff0c37B\u6fc0\u6d3b\u53c2\u6570\uff09\uff0c\u538b\u7f29\u7ef4\u5ea6\u4e3a\\(d_c = 512\\)\uff0c\u800c\u5b8c\u6574MHA\u9700\u8981\\(128 \\times 128 = 16{,}384\\)\uff0cKV\u7f13\u5b58\u51cf\u5c11\u4e8693%\u3002</p> </li> <li> <p>\u4e00\u4e2a\u5fae\u5999\u7684\u70b9\uff1a\u6807\u51c6RoPE\u4f9d\u8d56\u4e8e\u4f4d\u7f6e\uff0c\u4e0e\u5171\u4eab\u538b\u7f29\u4e0d\u517c\u5bb9\uff0c\u56e0\u6b64MLA\u4f7f\u7528\u89e3\u8026\u7684RoPE\uff1a\u67e5\u8be2\u548c\u952e\u7684\u4e00\u4e2a\u5c0f\u7684\u72ec\u7acb\u6d41\uff08\u6bcf\u593464\u7ef4\uff09\u901a\u8fc7RoPE\u643a\u5e26\u4f4d\u7f6e\u4fe1\u606f\uff0c\u800c\u8868\u793a\u7684\u4e3b\u8981\u90e8\u5206\u901a\u8fc7\u538b\u7f29\u7684\u6f5c\u5728\u8def\u5f84\u6d41\u52a8\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u5927\u89c4\u6a21\u4f4d\u7f6e\u7f16\u7801\u5df2\u7ecf\u4ece\u539f\u59cb\u7684\u6b63\u5f26\u65b9\u6848\u663e\u8457\u5206\u5316\u3002\u6240\u6709\u524d\u6cbf\u6a21\u578b\u90fd\u4f7f\u7528RoPE\uff08\u6587\u4ef604\uff09\uff0c\u4f46\u9488\u5bf9\u957f\u4e0a\u4e0b\u6587\u6709\u5173\u952e\u4fee\u6539\u3002\u539f\u59cbRoPE\u516c\u5f0f\\(\\theta_i = \\theta_{\\text{base}}^{-2i/d}\\)\u4e2d\u7684\u57fa\u9891\\(\\theta_{\\text{base}}\\)\u901a\u5e38\u4e3a10,000\uff0c\u8fd9\u9650\u5236\u4e86\u8d85\u51fa\u8bad\u7ec3\u957f\u5ea6\u7684\u5916\u63a8\u80fd\u529b\u3002</p> </li> <li> <p>\u8c03\u6574\u57fa\u9891\uff08ABF\uff09\u53ea\u662f\u5c06\\(\\theta_{\\text{base}}\\)\u589e\u52a0\u5230500,000\uff08Llama 3\uff09\u62161,000,000\uff08Qwen3\u3001Gemma 3\uff09\uff0c\u62c9\u4f38\u65cb\u8f6c\u5468\u671f\uff0c\u4f7f\u5f97\u6a21\u578b\u5728\u8bad\u7ec3\u671f\u95f4\u9047\u5230\u66f4\u5c11\u7684\u5b8c\u6574\u65cb\u8f6c\uff0c\u4ece\u800c\u80fd\u591f\u5916\u63a8\u5f97\u66f4\u8fdc\u3002</p> </li> <li> <p>YaRN\uff08Yet another RoPE extensioN\uff0c\u53c8\u4e00\u79cdRoPE\u6269\u5c55\uff09\u5e94\u7528\u4f9d\u8d56\u4e8e\u9891\u7387\u7684\u63d2\u503c\uff1a\u4f4e\u9891\u7ef4\u5ea6\u88ab\u63d2\u503c\uff08\u7f29\u5c0f\u6bd4\u4f8b\uff09\uff0c\u9ad8\u9891\u7ef4\u5ea6\u88ab\u5916\u63a8\uff0c\u540c\u65f6\u6e29\u5ea6\u56e0\u5b50\u8c03\u6574\u6ce8\u610f\u529b\u5206\u5e03\u3002DeepSeek-V3\u3001Qwen\u548cKimi K2\u90fd\u4f7f\u7528\u57fa\u4e8eYaRN\u7684\u6269\u5c55\uff0c\u4ece\u9884\u8bad\u7ec3\u65f6\u76844K-8K\u4e0a\u4e0b\u6587\u8fbe\u5230128K\u4e0a\u4e0b\u6587\u3002</p> </li> <li> <p>iRoPE\uff08\u4ea4\u9519RoPE\uff09\uff0c\u7531Llama 4\u5f15\u5165\uff0c\u91c7\u53d6\u4e86\u66f4\u6fc0\u8fdb\u7684\u65b9\u6cd5\uff1a\u6bcf4\u4e2a\u6ce8\u610f\u529b\u5c42\u4e2d\u6709\u4e00\u4e2a\u5b8c\u5168\u4e0d\u4f7f\u7528\u4f4d\u7f6e\u7f16\u7801\uff08NoPE\uff09\uff0c\u800c\u5176\u4ed6\u5c42\u4f7f\u7528\u6807\u51c6RoPE\u914d\u5408\u5206\u5757\u6ce8\u610f\u529b\u3002</p> </li> <li> <p>NoPE\u5c42\u53ef\u4ee5\u5728\u6ca1\u6709\u4efb\u4f55\u4f4d\u7f6e\u504f\u5dee\u7684\u60c5\u51b5\u4e0b\u5173\u6ce8\u6240\u6709\u4f4d\u7f6e\uff0c\u800cRoPE\u5c42\u63d0\u4f9b\u5c40\u90e8\u6392\u5e8f\u3002\u7ed3\u5408\u63a8\u7406\u65f6\u7684\u6e29\u5ea6\u7f29\u653e\uff0c\u8fd9\u4f7f\u5f97Llama 4 Scout\u76841000\u4e07token\u4e0a\u4e0b\u6587\u7a97\u53e3\u6210\u4e3a\u53ef\u80fd\u2014\u2014\u6bd4\u4efb\u4f55\u7eafRoPE\u65b9\u6cd5\u90fd\u9ad8\u51fa\u51e0\u4e2a\u6570\u91cf\u7ea7\u3002</p> </li> <li> <p>\u5927\u89c4\u6a21\u6df7\u5408\u4e13\u5bb6\u5df2\u6210\u4e3a\u524d\u6cbf\u6a21\u578b\u7684\u4e3b\u5bfc\u67b6\u6784\uff08\u6587\u4ef604\u4ecb\u7ecd\u4e86MoE\u57fa\u7840\uff09\u3002\u5173\u952e\u7684\u8bbe\u8ba1\u9009\u62e9\u662f\u4e13\u5bb6\u6570\u91cf\u3001\u8def\u7531\u7a00\u758f\u6027\u548c\u8d1f\u8f7d\u5747\u8861\u3002</p> </li> <li> <p>\u8def\u7531\u7a00\u758f\u6027\u5dee\u5f02\u663e\u8457\uff1aDeepSeek-V3\u4f7f\u7528256\u4e2a\u4e13\u5bb6\uff0ctop-8\u8def\u7531\uff0832\u500d\u7a00\u758f\uff09\uff1bQwen3\u4f7f\u7528128\u4e2a\u4e13\u5bb6\uff0ctop-8\u8def\u7531\uff0816\u500d\u7a00\u758f\uff09\uff1bMixtral\u4f7f\u75288\u4e2a\u4e13\u5bb6\uff0ctop-2\u8def\u7531\uff084\u500d\u7a00\u758f\uff09\uff1bLlama 4 Maverick\u4f7f\u7528128\u4e2a\u4e13\u5bb6\uff0ctop-1\u52a0\u4e00\u4e2a\u5171\u4eab\u4e13\u5bb6\uff08128\u500d\u7a00\u758f\uff09\u3002</p> </li> <li> <p>\u66f4\u9ad8\u7684\u7a00\u758f\u6027\u610f\u5473\u7740\u5728\u76f8\u540c\u6fc0\u6d3b\u8ba1\u7b97\u91cf\u4e0b\u62e5\u6709\u66f4\u591a\u603b\u53c2\u6570\uff0c\u4f46\u9700\u8981\u66f4\u4ed4\u7ec6\u7684\u8d1f\u8f7d\u5747\u8861\u548c\u901a\u4fe1\u57fa\u7840\u8bbe\u65bd\u3002</p> </li> <li> <p>\u65e0\u8f85\u52a9\u635f\u5931\u7684\u8d1f\u8f7d\u5747\u8861\uff08DeepSeek-V3\uff09\u53d6\u4ee3\u4e86\u4f20\u7edf\u7684\u8d1f\u8f7d\u5747\u8861\u635f\u5931\uff08\u6587\u4ef604\uff09\uff0c\u540e\u8005\u88ab\u53d1\u73b0\u4f1a\u964d\u4f4e\u6a21\u578b\u8d28\u91cf\u3002\u6bcf\u4e2a\u4e13\u5bb6\u7ef4\u62a4\u4e00\u4e2a\u52a8\u6001\u504f\u7f6e\u9879\uff0c\u5728\u6bcf\u4e2a\u8bad\u7ec3\u6b65\u9aa4\u8fdb\u884c\u8c03\u6574\uff1a\u8fc7\u8f7d\u7684\u4e13\u5bb6\u5176\u504f\u7f6e\u964d\u4f4e\uff08\u63a5\u6536\u66f4\u5c11\u7684token\uff09\uff0c\u6b20\u8f7d\u7684\u4e13\u5bb6\u5176\u504f\u7f6e\u589e\u52a0\u3002\u8fd9\u5b9e\u73b0\u4e86\u5747\u8861\u7684\u8def\u7531\uff0c\u6ca1\u6709\u4efb\u4f55\u8f85\u52a9\u635f\u5931\u6c61\u67d3\u4e3b\u8981\u8bad\u7ec3\u4fe1\u53f7\u3002</p> </li> <li> <p>\u5171\u4eab\u4e13\u5bb6\u51fa\u73b0\u5728\u5927\u591a\u6570MoE\u8bbe\u8ba1\u4e2d\uff1a\u4e00\u4e2a\u6216\u591a\u4e2a\u4e13\u5bb6FFN\u5904\u7406\u6bcf\u4e2atoken\uff0c\u65e0\u8bba\u8def\u7531\u7ed3\u679c\u5982\u4f55\u3002\u8fd9\u4e9b\u5904\u7406\u6240\u6709token\u90fd\u9700\u8981\u7684\u5e38\u89c1\u6a21\u5f0f\uff08\u57fa\u672c\u8bed\u6cd5\u3001\u529f\u80fd\u8bcd\uff09\uff0c\u4f7f\u5f97\u8def\u7531\u4e13\u5bb6\u53ef\u4ee5\u4e13\u6ce8\u4e8e specialization\u3002Llama 4\u4f7f\u75281\u4e2a\u5171\u4eab\u4e13\u5bb6\u52a0\u6bcf\u4e2atoken 1\u4e2a\u8def\u7531\u4e13\u5bb6\uff08\u975e\u5e38\u7a00\u758f\uff09\uff1bDeepSeek-V3\u4f7f\u75281\u4e2a\u5171\u4eab\u52a08\u4e2a\u8def\u7531\u3002</p> </li> <li> <p>\u4ea4\u66ff\u7a20\u5bc6\u5c42\u548cMoE\u5c42\u63d0\u4f9b\u4e86\u53e6\u4e00\u4e2a\u8bbe\u8ba1\u7ef4\u5ea6\u3002Gemma 2\u548c3\u4ea4\u66ff\u4f7f\u7528\u5c40\u90e8/\u5168\u5c40\u6ce8\u610f\u529b\u5c42\uff08Gemma 3\u4e2d\u6bd4\u4f8b\u4e3a5:1\uff0c\u5176\u4e2d\u5c40\u90e8\u5c42\u4f7f\u75281024 token\u7684\u6ed1\u52a8\u7a97\u53e3\uff0c\u53ea\u6709\u5168\u5c40\u5c42\u7f13\u5b58\u5b8c\u6574\u7684128K\u4e0a\u4e0b\u6587\uff09\u3002</p> </li> <li> <p>Llama 4 Maverick\u4ea4\u9519\u4f7f\u7528\u7a20\u5bc6FFN\u5c42\u548cMoE\u5c42\u3002Kimi K2\u4f7f\u7528\u6df7\u5408\u7a00\u758f\u5c42\uff08\u4e00\u4e2a\u7a20\u5bc6\u5c42\u7a7f\u63d2\u5728\u4e13\u5bb6\u5c42\u4e4b\u95f4\uff09\u3002\u8fd9\u79cd\u5f02\u6784\u8bbe\u8ba1\u5141\u8bb8\u4e0d\u540c\u5c42\u670d\u52a1\u4e8e\u4e0d\u540c\u7684\u529f\u80fd\u3002</p> </li> <li> <p>\u591atoken\u9884\u6d4b\uff08MTP\uff09\uff0c\u7528\u4e8eDeepSeek-V3\uff0c\u8bad\u7ec3\u6a21\u578b\u4e0d\u4ec5\u9884\u6d4b\u4e0b\u4e00\u4e2atoken\uff0c\u8fd8\u9884\u6d4b\u540e\u9762\u7684token\u3002\u5728\u6bcf\u4e2a\u4f4d\u7f6e\uff0c\u4e00\u4e2a\u6b21\u7ea7\u9884\u6d4b\u6a21\u5757\uff08\u5171\u4eab\u4e3b\u6a21\u578b\u7684\u5d4c\u5165\uff09\u9884\u6d4b\u4e00\u4e2a\u989d\u5916\u7684\u672a\u6765token\u3002MTP\u635f\u5931\u7684\u6743\u91cd\u662f\u4e3b\u4e0b\u4e00\u4e2atoken\u635f\u5931\u76840.1-0.3\u500d\u3002\u9664\u4e86\u5728\u8bad\u7ec3\u671f\u95f4\u6539\u5584\u8868\u793a\u8d28\u91cf\u5916\uff0cMTP\u5934\u8fd8\u53ef\u4ee5\u5728\u63a8\u7406\u65f6\u4f5c\u4e3a\u63a8\u6d4b\u6027\u89e3\u7801\u7684\u8349\u7a3f\u5934\uff0c\u63d0\u4f9b\u514d\u8d39\u7684\u52a0\u901f\u3002</p> </li> <li> <p>\u77e5\u8bc6\u84b8\u998f\u662f\u4e00\u79cd\u8bad\u7ec3\u7b56\u7565\uff0c\u5176\u4e2d\u5927\u578b\"\u6559\u5e08\"\u6a21\u578b\u7684\u8f93\u51fa\u6307\u5bfc\u8f83\u5c0f\"\u5b66\u751f\"\u6a21\u578b\u7684\u8bad\u7ec3\u3002Gemma 2\u548c3\u5e7f\u6cdb\u4f7f\u7528\u84b8\u998f\uff1a\u8f83\u5c0f\u7684\u6a21\u578b\uff082B\u30014B\uff09\u5728\u8ba1\u7b97\u6700\u4f18\u6570\u636e\u91cf\u768450\u500d\u4e0a\u8bad\u7ec3\uff0c\u4f7f\u7528\u6559\u5e08\u7684\u6982\u7387\u5206\u5e03\u4f5c\u4e3a\u8f6f\u76ee\u6807\u3002\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48Gemma 3-4B\u5728\u8d28\u91cf\u4e0a\u5339\u914dGemma 2-27B\u3002</p> </li> <li> <p>\u84b8\u998f\u635f\u5931\u66ff\u4ee3\u6216\u8865\u5145\u4e86\u6807\u51c6\u4ea4\u53c9\u71b5\uff1a\u5b66\u751f\u6700\u5c0f\u5316\u5176\u8f93\u51fa\u5206\u5e03\u4e0e\u6559\u5e08\u5206\u5e03\u4e4b\u95f4\u7684KL\u6563\u5ea6\uff1a</p> </li> </ul> \\[\\mathcal{L}_{\\text{distill}} = D_{\\text{KL}}(p_{\\text{teacher}}(\\cdot \\mid x) \\| p_{\\text{student}}(\\cdot \\mid x))\\] <ul> <li> <p>DeepSeek-R1\u5c06\u5176671B\u63a8\u7406\u6a21\u578b\u84b8\u998f\u5230\u5c0f\u81f31.5B\u7684\u7a20\u5bc6\u6a21\u578b\u4e2d\uff0c\u4f7f\u7528\u4e8680\u4e07\u6761\u7cbe\u9009\u7684\u601d\u7ef4\u94fe\u6837\u672c\uff0c\u4ea7\u751f\u4e86\u63a8\u7406\u80fd\u529b\u5f02\u5e38\u5f3a\u7684\u5c0f\u6a21\u578b\u3002</p> </li> <li> <p>\u57fa\u4e8e\u5f3a\u5316\u5b66\u4e60\u7684\u63a8\u7406\u4ee3\u8868\u4e86LLM\u80fd\u529b\u4e2d\u6700\u663e\u8457\u7684\u6700\u65b0\u8fdb\u5c55\u3002DeepSeek-R1\u8bc1\u660e\uff0c\u5728\u57fa\u7840\u6a21\u578b\u4e0a\u8fdb\u884c\u7eaf\u5f3a\u5316\u5b66\u4e60\uff08\u65e0\u9700\u76d1\u7763\u5fae\u8c03\uff09\u53ef\u4ee5\u5f15\u51fa\u601d\u7ef4\u94fe\u63a8\u7406\u3001\u81ea\u6211\u9a8c\u8bc1\u548c\u7ea0\u9519\u884c\u4e3a\u2014\u2014\u5f53\u6a21\u578b\u56e0\u7ed9\u51fa\u6b63\u786e\u7684\u6700\u7ec8\u7b54\u6848\u800c\u83b7\u5f97\u5956\u52b1\u65f6\uff0c\u8fd9\u4e9b\u884c\u4e3a\u4f1a\u81ea\u53d1\u6d8c\u73b0\u3002</p> </li> <li> <p>DeepSeek-R1\u4f7f\u7528GRPO\uff08\u7ec4\u76f8\u5bf9\u7b56\u7565\u4f18\u5316\uff09\uff0c\u5b83\u6d88\u9664\u4e86PPO\u6240\u9700\u7684\u4ef7\u503c\u7f51\u7edc\u3002\u5bf9\u4e8e\u6bcf\u4e2a\u63d0\u793a\uff0cGRPO\u91c7\u6837\u4e00\u7ec4\\(G\\)\u4e2a\u8f93\u51fa\uff0c\u8ba1\u7b97\u5b83\u4eec\u7684\u5956\u52b1\uff0c\u5e76\u5728\u7ec4\u5185\u5f52\u4e00\u5316\u4f18\u52bf\u503c\uff1a</p> </li> </ul> \\[A_i = \\frac{r_i - \\text{mean}(r_1, \\ldots, r_G)}{\\text{std}(r_1, \\ldots, r_G)}\\] <ul> <li> <p>\u7136\u540e\u7b56\u7565\u68af\u5ea6\u4f7f\u7528\u8fd9\u4e9b\u7ec4\u76f8\u5bf9\u4f18\u52bf\u503c\uff0c\u914d\u5408\u4e00\u4e2a\u88c1\u526a\u76ee\u6807\uff08\u7c7b\u4f3c\u4e8ePPO\u7684\u88c1\u526a\uff09\u3002</p> </li> <li> <p>\u6d88\u9664\u8bc4\u8bba\u5bb6\u7f51\u7edc\u5c06RL\u8bad\u7ec3\u7684\u5185\u5b58\u548c\u8ba1\u7b97\u9700\u6c42\u51cf\u534a\uff0c\u4f7f\u5f97\u5728671B\u53c2\u6570\u6a21\u578b\u4e0a\u8fdb\u884cRL\u8bad\u7ec3\u53d8\u5f97\u53ef\u884c\u3002</p> </li> <li> <p>\u4e00\u4e2a\u5173\u952e\u7684\u8bbe\u8ba1\u9009\u62e9\uff1aDeepSeek-R1\u4f7f\u7528\u57fa\u4e8e\u89c4\u5219\u7684\u5956\u52b1\uff08\u5bf9\u7167\u6807\u51c6\u7b54\u6848\u68c0\u67e5\u6570\u5b66\u7b54\u6848\u3001\u8fd0\u884c\u4ee3\u7801\u6d4b\u8bd5\u7528\u4f8b\uff09\u800c\u4e0d\u662f\u795e\u7ecf\u5956\u52b1\u6a21\u578b\uff0c\u56e0\u4e3a\u795e\u7ecf\u5956\u52b1\u6a21\u578b\u5728\u6b64\u89c4\u6a21\u4e0b\u88ab\u53d1\u73b0\u5bb9\u6613\u53d7\u5230\u5956\u52b1\u7834\u89e3\u7684\u5f71\u54cd\u3002</p> </li> <li> <p>Qwen3\u7684\u6df7\u5408\u601d\u8003\u6a21\u5f0f\u5c06\u63a8\u7406\uff08\u4f7f\u7528<code>&lt;think&gt;</code>\u6807\u7b7e\u8fdb\u884c\u9010\u6b65\u601d\u7ef4\u94fe\uff09\u548c\u5feb\u901f\u76f4\u63a5\u56de\u590d\u6574\u5408\u5230\u4e00\u4e2a\u6a21\u578b\u4e2d\uff0c\u5141\u8bb8\u7528\u6237\u63a7\u5236\u4e00\u4e2a\"\u601d\u8003\u9884\u7b97\"\uff0c\u5728\u5ef6\u8fdf\u548c\u63a8\u7406\u6df1\u5ea6\u4e4b\u95f4\u8fdb\u884c\u6743\u8861\u3002</p> </li> <li> <p>\u8fd9\u662f\u901a\u8fc7\u5728\u601d\u8003\u548c\u601d\u8003\u6570\u636e\u4e0a\u8bad\u7ec3\u5b9e\u73b0\u7684\uff0c\u800c\u4e0d\u662f\u901a\u8fc7\u5355\u72ec\u7684\u6a21\u578b\u68c0\u67e5\u70b9\u3002</p> </li> <li> <p>\u5927\u89c4\u6a21\u8bad\u7ec3\u7a33\u5b9a\u5316\u9700\u8981\u8d85\u8d8a\u6807\u51c6\u5b9e\u8df5\u7684\u65b0\u6280\u672f\u3002Logits\u8f6f\u88c1\u526a\uff08Gemma 2\uff09\u5c06\u6ce8\u610f\u529b\u5206\u6570\u901a\u8fc7\\(s \\cdot \\tanh(\\text{logits} / s)\\)\u5904\u7406\uff0c\u8f6f\u88c1\u526a\u503c\\(s\\)\uff08\u901a\u5e38\u4e3a30-50\uff09\uff0c\u4ee5\u9632\u6b62\u65e0\u754c\u589e\u957f\u3002</p> </li> <li> <p>QK\u5f52\u4e00\u5316\uff08Qwen3\uff09\u5728\u8ba1\u7b97\u6ce8\u610f\u529b\u5206\u6570\u4e4b\u524d\u5bf9\u67e5\u8be2\u548c\u952e\u5411\u91cf\u5e94\u7528RMSNorm\uff0c\u53d6\u4ee3\u4e86\u5bf9QKV\u504f\u7f6e\u7684\u9700\u6c42\u3002QK\u88c1\u526a\uff08Kimi K2\u7684MuonClip\u4f18\u5316\u5668\uff09\u5728\u8bad\u7ec3\u671f\u95f4\u76d1\u63a7\u6700\u5927\u6ce8\u610f\u529blogits\uff0c\u5f53\u67e5\u8be2-\u952e\u6743\u91cd\u77e9\u9635\u8d85\u8fc7\u9608\u503c\u65f6\u5bf9\u5176\u8fdb\u884c\u91cd\u65b0\u7f29\u653e\uff0c\u4f7f\u5f971T\u53c2\u6570\u6a21\u578b\u7684\u9884\u8bad\u7ec3\u80fd\u591f\u7a33\u5b9a\u8fdb\u884c\uff0c\u4e14\u6ca1\u6709\u4e0d\u7a33\u5b9a\u4e8b\u4ef6\u3002</p> </li> <li> <p>FP8\u6df7\u5408\u7cbe\u5ea6\u8bad\u7ec3\uff08DeepSeek-V3\uff09\u5728\u524d\u5411\u548c\u53cd\u5411\u4f20\u64ad\u4e2d\u4f7f\u75288\u4f4d\u6d6e\u70b9\u6570\u8fdb\u884c\u8ba1\u7b97\u5bc6\u96c6\u7684\u77e9\u9635\u4e58\u6cd5\uff0c\u540c\u65f6\u5c06\u4e3b\u6743\u91cd\u4fdd\u6301\u5728\u66f4\u9ad8\u7cbe\u5ea6\u3002</p> </li> <li> <p>\u4e0eBF16/FP16\u8bad\u7ec3\u76f8\u6bd4\uff0c\u8fd9\u5927\u81f4\u5c06\u541e\u5410\u91cf\u63d0\u5347\u4e86\u4e00\u500d\uff0c\u4e14\u8d28\u91cf\u635f\u5931\u53ef\u5ffd\u7565\u4e0d\u8ba1\u3002DeepSeek-V3\u4f7f\u7528\u4ec5280\u4e07H800 GPU\u5c0f\u65f6\u8bad\u7ec3\u4e86\u5176671B\u53c2\u6570\u6a21\u578b\u2014\u2014\u53ea\u662f\u540c\u7c7b\u6a21\u578b\u7684\u4e00\u5c0f\u90e8\u5206\u2014\u2014\u8fd9\u4e3b\u8981\u5f52\u529f\u4e8e\u8fd9\u4e00\u4f18\u5316\u548c\u5176\u4ed6\u5de5\u7a0b\u4f18\u5316\u3002</p> </li> <li> <p>FP8\u6df7\u5408\u7cbe\u5ea6\u8bad\u7ec3\uff08DeepSeek-V3\uff09\u5728\u524d\u5411\u548c\u53cd\u5411\u4f20\u64ad\u4e2d\u4f7f\u75288\u4f4d\u6d6e\u70b9\u6570\u8fdb\u884c\u8ba1\u7b97\u5bc6\u96c6\u7684\u77e9\u9635\u4e58\u6cd5\uff0c\u540c\u65f6\u5c06\u4e3b\u6743\u91cd\u4fdd\u6301\u5728\u66f4\u9ad8\u7cbe\u5ea6\u3002</p> </li> <li> <p>\u4e0eBF16/FP16\u8bad\u7ec3\u76f8\u6bd4\uff0c\u8fd9\u5927\u81f4\u5c06\u541e\u5410\u91cf\u63d0\u5347\u4e86\u4e00\u500d\uff0c\u4e14\u8d28\u91cf\u635f\u5931\u53ef\u5ffd\u7565\u4e0d\u8ba1\u3002DeepSeek-V3\u4f7f\u7528\u4ec5280\u4e07H800 GPU\u5c0f\u65f6\u8bad\u7ec3\u4e86\u5176671B\u53c2\u6570\u6a21\u578b\u2014\u2014\u53ea\u662f\u540c\u7c7b\u6a21\u578b\u7684\u4e00\u5c0f\u90e8\u5206\u2014\u2014\u8fd9\u4e3b\u8981\u5f52\u529f\u4e8e\u8fd9\u4e00\u4f18\u5316\u548c\u5176\u4ed6\u5de5\u7a0b\u4f18\u5316\u3002</p> </li> </ul>"},{"location":"chapter%2007%3A%20computational%20linguistics/05.%20advanced%20text%20generation/#colab-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ol> <li> <p>\u4ece\u5934\u5b9e\u73b0\u4e00\u4e2a\u7b80\u5355\u7684\u68c0\u7d22\u589e\u5f3a\u751f\u6210\u7ba1\u7ebf\u3002\u4f7f\u7528TF-IDF\uff08\u6587\u4ef602\uff09\u7d22\u5f15\u4e00\u7ec4\u6587\u6863\uff0c\u4e3a\u67e5\u8be2\u68c0\u7d22\u6700\u76f8\u5173\u7684\u6bb5\u843d\uff0c\u5e76\u5c06\u5176\u524d\u7f6e\u5230\u63d0\u793a\u4e2d\u3002 <pre><code>import jax.numpy as jnp\nimport math\nfrom collections import Counter\n\n# \u77e5\u8bc6\u5e93\uff1a\u4e00\u7ec4\u7b80\u77ed\u6bb5\u843d\nknowledge_base = [\n    \"The Eiffel Tower is a wrought-iron lattice tower in Paris, France. It was constructed from 1887 to 1889 as the centerpiece of the 1889 World's Fair.\",\n    \"The Great Wall of China is a series of fortifications built along the northern borders of China. Construction began in the 7th century BC.\",\n    \"Photosynthesis is the process by which plants convert sunlight, water, and carbon dioxide into glucose and oxygen using chlorophyll.\",\n    \"The theory of general relativity, published by Albert Einstein in 1915, describes gravity as the curvature of spacetime caused by mass and energy.\",\n    \"Python is a high-level programming language known for its simple syntax and readability. It was created by Guido van Rossum and released in 1991.\",\n    \"The mitochondria are organelles found in eukaryotic cells. They generate most of the cell's supply of ATP, used as a source of chemical energy.\",\n]\n\n# \u6784\u5efa TF-IDF \u7d22\u5f15\uff08\u91cd\u7528\u4e86\u6587\u4ef602\u4e2d\u7684\u6982\u5ff5\uff09\ndef tokenise(text):\n    return text.lower().split()\n\nvocab = sorted(set(w for doc in knowledge_base for w in tokenise(doc)))\nword2idx = {w: i for i, w in enumerate(vocab)}\nV = len(vocab)\nN = len(knowledge_base)\n\n# \u6587\u6863\u9891\u7387\ndoc_freq = Counter()\nfor doc in knowledge_base:\n    for w in set(tokenise(doc)):\n        doc_freq[w] += 1\n\ndef tfidf_vector(text):\n    words = tokenise(text)\n    counts = Counter(words)\n    vec = jnp.zeros(V)\n    for w, c in counts.items():\n        if w in word2idx:\n            tf = 1 + math.log(c)\n            idf = math.log(N / (doc_freq.get(w, 0) + 1))\n            vec = vec.at[word2idx[w]].set(tf * idf)\n    return vec\n\n# \u7d22\u5f15\u6240\u6709\u6587\u6863\ndoc_vectors = jnp.stack([tfidf_vector(doc) for doc in knowledge_base])\n\ndef cosine_sim(a, b):\n    return jnp.dot(a, b) / (jnp.linalg.norm(a) * jnp.linalg.norm(b) + 1e-8)\n\ndef retrieve(query, top_k=2):\n    \"\"\"\u4e3a\u67e5\u8be2\u68c0\u7d22top-k\u4e2a\u6700\u76f8\u5173\u7684\u6bb5\u843d\u3002\"\"\"\n    q_vec = tfidf_vector(query)\n    sims = jnp.array([cosine_sim(q_vec, doc_vectors[i]) for i in range(N)])\n    top_indices = jnp.argsort(-sims)[:top_k]\n    return [(int(i), float(sims[i]), knowledge_base[int(i)]) for i in top_indices]\n\n# \u6d4b\u8bd5\u68c0\u7d22\nqueries = [\n    \"Who built the Eiffel Tower?\",\n    \"How do plants make food?\",\n    \"What did Einstein discover?\",\n]\n\nfor query in queries:\n    results = retrieve(query, top_k=1)\n    print(f\"\\nQuery: '{query}'\")\n    for idx, sim, passage in results:\n        print(f\"  Retrieved (sim={sim:.3f}): '{passage[:80]}...'\")\n\n    # RAG\u98ce\u683c\u7684\u63d0\u793a\u6784\u5efa\n    context = results[0][2]\n    rag_prompt = f\"Context: {context}\\n\\nQuestion: {query}\\nAnswer:\"\n    print(f\"  RAG prompt:\\n    {rag_prompt[:120]}...\")\n</code></pre></p> </li> <li> <p>\u4f7f\u7528\u73a9\u5177\u8349\u7a3f\u6a21\u578b\u548c\u76ee\u6807\u6a21\u578b\u5b9e\u73b0\u63a8\u6d4b\u6027\u89e3\u7801\u3002\u5c55\u793a\u63a5\u53d7\u7684\u8f93\u51fa\u4e0e\u76ee\u6807\u6a21\u578b\u7684\u5206\u5e03\u4e00\u81f4\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\n# \u6a21\u62df\u8349\u7a3f\u6a21\u578b\uff08\u5feb\u901f\uff0c\u4e0d\u592a\u51c6\u786e\uff09\u548c\u76ee\u6807\u6a21\u578b\uff08\u6162\u901f\uff0c\u51c6\u786e\uff09\nvocab_size = 8\nseq_len = 5\n\nkey = jax.random.PRNGKey(42)\n\n# \u76ee\u6807\u6a21\u578b\uff1a\u7ed9\u5b9a\u5e8f\u5217\u8fd4\u56delogits\ndef target_model(seq, key):\n    \"\"\"\u6a21\u62df\u7684\u76ee\u6807\u6a21\u578b\uff1a\u4ea7\u751ftoken logits\uff08\u6602\u8d35\u7684\uff09\u3002\"\"\"\n    # \u5b9e\u8df5\u4e2d\u8fd9\u5c06\u662f\u4e00\u4e2a\u5927\u578bTransformer\u524d\u5411\u4f20\u64ad\n    k1, k2 = jax.random.split(key)\n    logits = jax.random.normal(k1, (len(seq), vocab_size)) * 2\n    # \u4f7f\u5176\u6709\u4e9b\u53ef\u9884\u6d4b\u6027\uff1a\u504f\u5411\u4e8e token (seq[-1] + 1) % vocab_size\n    for i in range(len(seq)):\n        logits = logits.at[i, (seq[i] + 1) % vocab_size].add(3.0)\n    return logits\n\ndef draft_model(seq, key):\n    \"\"\"\u6a21\u62df\u7684\u8349\u7a3f\u6a21\u578b\uff1a\u7c7b\u4f3c\u4f46\u566a\u58f0\u66f4\u5927\uff08\u4fbf\u5b9c\u7684\uff09\u3002\"\"\"\n    k1, k2 = jax.random.split(key)\n    logits = jax.random.normal(k1, (len(seq), vocab_size))\n    for i in range(len(seq)):\n        logits = logits.at[i, (seq[i] + 1) % vocab_size].add(2.0)\n    return logits\n\ndef sample_token(logits, key):\n    return jax.random.categorical(key, logits)\n\ndef speculative_decode(prefix, draft_steps=3, key=jax.random.PRNGKey(0)):\n    \"\"\"\u63a8\u6d4b\u6027\u89e3\u7801\uff1a\u8349\u7a3f\u63d0\u51fa\uff0c\u76ee\u6807\u9a8c\u8bc1\u3002\"\"\"\n    seq = list(prefix)\n    total_accepted = 0\n    total_proposed = 0\n\n    for _ in range(4):  # \u751f\u62104\u8f6e\n        key, *subkeys = jax.random.split(key, draft_steps + 3)\n\n        # \u8349\u7a3f\u6a21\u578b\u63d0\u51fadraft_steps\u4e2atoken\n        draft_tokens = []\n        draft_probs = []\n        draft_seq = list(seq)\n        for i in range(draft_steps):\n            d_logits = draft_model(jnp.array(draft_seq), subkeys[i])\n            d_probs = jax.nn.softmax(d_logits[-1])\n            tok = sample_token(d_logits[-1], subkeys[i])\n            draft_tokens.append(int(tok))\n            draft_probs.append(d_probs)\n            draft_seq.append(int(tok))\n\n        # \u76ee\u6807\u6a21\u578b\u5728\u4e00\u6b21\u524d\u5411\u4e2d\u8bc4\u4f30\u6240\u6709\u8349\u7a3ftoken\n        target_logits = target_model(jnp.array(draft_seq), subkeys[draft_steps])\n        target_start = len(seq) - 1  # \u6700\u540e\u4e00\u4e2a\u524d\u7f00token\u7684\u4f4d\u7f6e\n\n        # \u63a5\u53d7/\u62d2\u7edd\u6bcf\u4e2a\u8349\u7a3ftoken\n        accepted = 0\n        for i in range(draft_steps):\n            t_probs = jax.nn.softmax(target_logits[target_start + i])\n            d_prob = draft_probs[i][draft_tokens[i]]\n            t_prob = t_probs[draft_tokens[i]]\n\n            # \u4ee5\u6982\u7387 min(1, target_prob / draft_prob) \u63a5\u53d7\n            accept_prob = jnp.minimum(1.0, t_prob / (d_prob + 1e-10))\n            key, accept_key = jax.random.split(key)\n            if jax.random.uniform(accept_key) &lt; accept_prob:\n                seq.append(draft_tokens[i])\n                accepted += 1\n            else:\n                # \u62d2\u7edd\uff1a\u4ece\u8c03\u6574\u540e\u7684\u5206\u5e03\u4e2d\u91c7\u6837\n                key, resample_key = jax.random.split(key)\n                adjusted = jnp.maximum(0, t_probs - draft_probs[i])\n                adjusted = adjusted / (adjusted.sum() + 1e-10)\n                new_tok = jax.random.categorical(resample_key, jnp.log(adjusted + 1e-10))\n                seq.append(int(new_tok))\n                break\n\n        total_accepted += accepted\n        total_proposed += draft_steps\n\n    return seq, total_accepted, total_proposed\n\n# \u8fd0\u884c\u63a8\u6d4b\u6027\u89e3\u7801\nprefix = [0, 1]\nresult_seq, accepted, proposed = speculative_decode(prefix)\nacceptance_rate = accepted / proposed if proposed &gt; 0 else 0\n\nprint(f\"Prefix: {prefix}\")\nprint(f\"Generated sequence: {result_seq}\")\nprint(f\"Draft proposals: {proposed}\")\nprint(f\"Accepted: {accepted}\")\nprint(f\"Acceptance rate: {acceptance_rate:.1%}\")\nprint(f\"Speedup potential: {(accepted + proposed) / proposed:.2f}x\")\n</code></pre></p> </li> <li> <p>\u6784\u5efa\u4e00\u4e2a\u7b80\u5355\u7684DPO\u8bad\u7ec3\u5faa\u73af\u3002\u7ed9\u5b9a\u504f\u597d\u548c\u4e0d\u504f\u597d\u7684\u5b8c\u6210\u5e8f\u5217\u5bf9\uff0c\u4f7f\u7528DPO\u635f\u5931\u66f4\u65b0\u4e00\u4e2a\u5c0f\u6a21\u578b\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\n# \u5fae\u578b\u8bed\u8a00\u6a21\u578b\uff1a\u4eceone-hot\u5230logits\u7684\u7ebf\u6027\u6295\u5f71\nvocab_size = 10\nseq_len = 4\n\nkey = jax.random.PRNGKey(42)\nk1, k2 = jax.random.split(key)\n\n# \u5f53\u524d\u7b56\u7565\u53c2\u6570\uff08\u53ef\u8bad\u7ec3\u7684\uff09\ntheta = jax.random.normal(k1, (vocab_size, vocab_size)) * 0.1\n# \u53c2\u8003\u7b56\u7565\u53c2\u6570\uff08theta\u7684\u51bb\u7ed3\u526f\u672c\uff09\ntheta_ref = theta.copy()\n\ndef log_prob_sequence(params, sequence):\n    \"\"\"\u8ba1\u7b97\u7b80\u5355\u81ea\u56de\u5f52\u6a21\u578b\u4e0b\u7684 log P(sequence)\u3002\"\"\"\n    total = 0.0\n    for t in range(1, len(sequence)):\n        # \u7b80\u5355\uff1a\u4f4d\u7f6et\u5904\u7684logits\u53d6\u51b3\u4e8e\u4f4d\u7f6et-1\u5904\u7684token\n        logits = params[sequence[t-1]]\n        log_probs = jax.nn.log_softmax(logits)\n        total += log_probs[sequence[t]]\n    return total\n\ndef dpo_loss(theta, theta_ref, preferred, dispreferred, beta=0.1):\n    \"\"\"\u4e00\u5bf9\u6570\u636e\u7684\u76f4\u63a5\u504f\u597d\u4f18\u5316\u635f\u5931\u3002\"\"\"\n    log_pi_w = log_prob_sequence(theta, preferred)\n    log_pi_l = log_prob_sequence(theta, dispreferred)\n    log_ref_w = log_prob_sequence(theta_ref, preferred)\n    log_ref_l = log_prob_sequence(theta_ref, dispreferred)\n\n    # DPO\u76ee\u6807\n    return -jax.nn.log_sigmoid(\n        beta * ((log_pi_w - log_ref_w) - (log_pi_l - log_ref_l))\n    )\n\n# \u504f\u597d\u6570\u636e\u96c6\uff1a(\u63d0\u793a\u524d\u7f00, \u504f\u597d\u5b8c\u6210\u5e8f\u5217, \u4e0d\u504f\u597d\u5b8c\u6210\u5e8f\u5217)\npreferences = [\n    (jnp.array([1, 3, 5, 7]), jnp.array([1, 3, 5, 2])),  # \u7ed3\u5c3e\u504f\u597d7\u800c\u4e0d\u662f2\n    (jnp.array([0, 2, 4, 6]), jnp.array([0, 2, 4, 9])),  # \u504f\u597d6\u800c\u4e0d\u662f9\n    (jnp.array([3, 3, 3, 3]), jnp.array([3, 3, 3, 0])),  # \u504f\u597d\u91cd\u590d\u800c\u4e0d\u662f0\n    (jnp.array([5, 6, 7, 8]), jnp.array([5, 6, 7, 1])),  # \u504f\u597d8\u800c\u4e0d\u662f1\n]\n\ngrad_fn = jax.jit(jax.grad(dpo_loss))\nlr = 0.05\n\nprint(\"\u8bad\u7ec3 DPO...\")\nfor epoch in range(100):\n    total_loss = 0.0\n    for preferred, dispreferred in preferences:\n        loss = dpo_loss(theta, theta_ref, preferred, dispreferred)\n        grads = grad_fn(theta, theta_ref, preferred, dispreferred)\n        theta = theta - lr * grads\n        total_loss += loss\n    if (epoch + 1) % 20 == 0:\n        avg_loss = total_loss / len(preferences)\n        print(f\"  Epoch {epoch+1}: avg DPO loss = {avg_loss:.4f}\")\n\n# \u68c0\u67e5\uff1a\u6a21\u578b\u73b0\u5728\u5e94\u8be5\u504f\u597d\u504f\u597d\u7684\u5b8c\u6210\u5e8f\u5217\nprint(\"\\nDPO\u8bad\u7ec3\u540e\u7684\u504f\u597d\u68c0\u67e5:\")\nfor preferred, dispreferred in preferences:\n    lp_w = log_prob_sequence(theta, preferred)\n    lp_l = log_prob_sequence(theta, dispreferred)\n    print(f\"  Preferred {list(preferred.astype(int))}: logP={lp_w:.3f}  \"\n          f\"Dispreferred {list(dispreferred.astype(int))}: logP={lp_l:.3f}  \"\n          f\"{'correct' if lp_w &gt; lp_l else 'WRONG'}\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2008%3A%20computer%20vision/01.%20image%20fundamentals/","title":"\u56fe\u50cf\u57fa\u7840","text":"<p>\u56fe\u50cf\u57fa\u7840\u89e3\u91ca\u6570\u5b57\u56fe\u50cf\u5728\u88ab\u4efb\u4f55\u6a21\u578b\u5904\u7406\u4e4b\u524d\u5982\u4f55\u8868\u793a\u3001\u5f62\u6210\u548c\u9884\u5904\u7406\u3002\u672c\u6587\u6db5\u76d6\u50cf\u7d20\u3001\u8272\u5f69\u7a7a\u95f4\uff08RGB\u3001HSV\u3001YCbCr\u3001LAB\uff09\u3001\u9488\u5b54\u76f8\u673a\u6a21\u578b\u3001\u5377\u79ef\u3001\u8fb9\u7f18\u68c0\u6d4b\uff08Sobel\u3001Canny\uff09\u3001\u76f4\u65b9\u56fe\u4ee5\u53ca\u7279\u5f81\u63cf\u8ff0\u5b50\uff08SIFT\u3001ORB\uff09\uff0c\u662f\u5e95\u5c42\u89c6\u89c9\u7684\u5de5\u5177\u5305\u3002</p> <ul> <li> <p>\u6570\u5b57\u56fe\u50cf\u662f\u4e00\u4e2a\u4e8c\u7ef4\u6570\u5b57\u7f51\u683c\u3002\u7f51\u683c\u4e2d\u7684\u6bcf\u4e2a\u5355\u5143\u683c\u662f\u4e00\u4e2a\u50cf\u7d20\uff08\u56fe\u50cf\u5143\u7d20\uff09\uff0c\u5176\u503c\u8868\u793a\u5f3a\u5ea6\u6216\u989c\u8272\u3002\u7070\u5ea6\u56fe\u50cf\u662f\u4e00\u4e2a\u5355\u4e00\u7684\u4e8c\u7ef4\u77e9\u9635\uff0c\u5176\u4e2d\u6bcf\u4e2a\u50cf\u7d20\u5305\u542b\u4e00\u4e2a\u4eae\u5ea6\u503c\uff0c\u5bf9\u4e8e 8 \u4f4d\u56fe\u50cf\uff0c\u901a\u5e38\u8303\u56f4\u4ece 0\uff08\u9ed1\u8272\uff09\u5230 255\uff08\u767d\u8272\uff09\u3002</p> </li> <li> <p>\u5f69\u8272\u56fe\u50cf\u5c06\u6b64\u6269\u5c55\u5230\u4e09\u4e2a\u901a\u9053\u3002\u5728 RGB \u8272\u5f69\u7a7a\u95f4\u4e2d\uff0c\u6bcf\u4e2a\u50cf\u7d20\u5b58\u50a8\u4e09\u4e2a\u503c\uff1a\u7ea2\u8272\u3001\u7eff\u8272\u548c\u84dd\u8272\u7684\u5f3a\u5ea6\u3002</p> </li> <li> <p>\u5f69\u8272\u56fe\u50cf\u662f\u4e00\u4e2a\u5f62\u72b6\u4e3a (\u9ad8\u5ea6, \u5bbd\u5ea6, 3) \u7684\u4e09\u7ef4\u5f20\u91cf\uff08\u77e9\u9635\uff09\u3002\u4ee5\u4e0d\u540c\u5f3a\u5ea6\u6df7\u5408\u8fd9\u4e09\u4e2a\u901a\u9053\u53ef\u4ee5\u4ea7\u751f\u5b8c\u6574\u7684\u53ef\u89c1\u5149\u8c31\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u4f4d\u6df1\u5ea6\u51b3\u5b9a\u6bcf\u4e2a\u901a\u9053\u53ef\u4ee5\u8868\u793a\u7684\u79bb\u6563\u5f3a\u5ea6\u7ea7\u522b\u6570\u91cf\u3002</p> </li> <li> <p>8 \u4f4d\u56fe\u50cf\u6bcf\u4e2a\u901a\u9053\u6709 \\(2^8 = 256\\) \u4e2a\u7ea7\u522b\uff0c\u603b\u5171 \\(256^3 \\approx 1670\\) \u4e07\u79cd\u53ef\u80fd\u7684\u989c\u8272\u300216 \u4f4d\u56fe\u50cf\u6bcf\u4e2a\u901a\u9053\u6709 65,536 \u4e2a\u7ea7\u522b\uff0c\u7528\u4e8e\u533b\u5b66\u6210\u50cf\u548c\u9ad8\u52a8\u6001\u8303\u56f4\u6444\u5f71\u7b49\u5bf9\u7cbe\u7ec6\u5f3a\u5ea6\u5dee\u5f02\u654f\u611f\u7684\u573a\u666f\u3002</p> </li> <li> <p>RGB \u4fbf\u4e8e\u663e\u793a\uff0c\u4f46\u5176\u4ed6\u8272\u5f69\u7a7a\u95f4\u66f4\u9002\u5408\u4e0d\u540c\u7684\u4efb\u52a1\u3002</p> </li> <li> <p>HSV\uff08\u8272\u8c03\u3001\u9971\u548c\u5ea6\u3001\u660e\u5ea6\uff09\u5c06\u989c\u8272\u4fe1\u606f\u4e0e\u4eae\u5ea6\u5206\u79bb\u3002\u8272\u8c03\u662f\u7eaf\u8272\uff08\u5728\u8272\u73af\u4e0a 0-360 \u5ea6\uff09\uff0c\u9971\u548c\u5ea6\u662f\u989c\u8272\u7684\u9c9c\u8273\u7a0b\u5ea6\uff080 = \u7070\u8272\uff0c1 = \u7eaf\u8272\uff09\uff0c\u660e\u5ea6\u662f\u4eae\u5ea6\u3002HSV \u9002\u5408\u57fa\u4e8e\u989c\u8272\u7684\u5206\u5272\uff0c\u56e0\u4e3a\u4f60\u53ef\u4ee5\u4ec5\u6839\u636e\u8272\u8c03\u8bbe\u5b9a\u9608\u503c\uff0c\u800c\u65e0\u9700\u8003\u8651\u5149\u7167\u6761\u4ef6\u3002\u5728 HSV \u4e2d\u68c0\u6d4b\"\u7ea2\u8272\u7269\u4f53\"\u6bd4\u5728 RGB \u4e2d\u5bb9\u6613\u5f97\u591a\u3002</p> </li> <li> <p>YCbCr \u5c06\u4eae\u5ea6\uff08Y\uff0c\u611f\u77e5\u4eae\u5ea6\uff09\u4e0e\u8272\u5ea6\uff08Cb\u3001Cr\uff0c\u989c\u8272\u5dee\u5f02\u4fe1\u53f7\uff09\u5206\u79bb\u3002\u8fd9\u662f JPEG \u538b\u7f29\u548c\u89c6\u9891\u7f16\u89e3\u7801\u5668\u4e2d\u4f7f\u7528\u7684\u8272\u5f69\u7a7a\u95f4\u3002\u4eba\u773c\u5bf9\u4eae\u5ea6\u6bd4\u5bf9\u989c\u8272\u66f4\u654f\u611f\uff0c\u56e0\u6b64\u8272\u5ea6\u53ef\u4ee5\u4ee5\u8f83\u4f4e\u5206\u8fa8\u7387\u5b58\u50a8\uff08\u8272\u5ea6\u5b50\u91c7\u6837\uff09\u800c\u51e0\u4e4e\u4e0d\u4ea7\u751f\u611f\u77e5\u635f\u5931\u3002</p> </li> <li> <p>LAB\uff08CIELAB\uff09\u7684\u8bbe\u8ba1\u76ee\u6807\u662f\u4f7f\u4e24\u79cd\u989c\u8272\u4e4b\u95f4\u7684\u6570\u503c\u8ddd\u79bb\u5bf9\u5e94\u4e8e\u611f\u77e5\u5dee\u5f02\u3002\u5728 LAB \u7a7a\u95f4\u4e2d\u76f8\u7b49\u7684\u6b65\u957f\u5bf9\u4eba\u773c\u89c2\u5bdf\u8005\u6765\u8bf4\u770b\u8d77\u6765\u4e5f\u662f\u76f8\u7b49\u7684\u3002L \u901a\u9053\u662f\u660e\u5ea6\uff0cA \u4ece\u7eff\u8272\u5230\u7ea2\u8272\uff0cB \u4ece\u84dd\u8272\u5230\u9ec4\u8272\u3002\u5f53\u9700\u8981\u611f\u77e5\u5747\u5300\u7684\u989c\u8272\u6bd4\u8f83\u65f6\uff0c\u4f7f\u7528 LAB\u3002</p> </li> <li> <p>\u56fe\u50cf\u5f62\u6210\u63cf\u8ff0\u4e09\u7ef4\u573a\u666f\u5982\u4f55\u53d8\u6210\u4e8c\u7ef4\u56fe\u50cf\u3002\u6700\u7b80\u5355\u7684\u6a21\u578b\u662f\u9488\u5b54\u76f8\u673a\uff1a\u6765\u81ea\u573a\u666f\u7684\u5149\u7ebf\u901a\u8fc7\u4e00\u4e2a\u5c0f\u5b54\u6295\u5c04\u5230\u5176\u540e\u7684\u4f20\u611f\u5668\u5e73\u9762\u4e0a\u3002\u4e16\u754c\u5750\u6807\u7cfb\u4e2d\u7684\u70b9 \\((X, Y, Z)\\) \u6295\u5f71\u5230\u50cf\u7d20\u5750\u6807 \\((u, v)\\)\uff1a</p> </li> </ul> \\[ \\begin{bmatrix} u \\\\ v \\\\ 1 \\end{bmatrix} = \\frac{1}{Z} \\begin{bmatrix} f_x &amp; 0 &amp; c_x \\\\ 0 &amp; f_y &amp; c_y \\\\ 0 &amp; 0 &amp; 1 \\end{bmatrix} \\begin{bmatrix} X \\\\ Y \\\\ Z \\end{bmatrix} \\] <ul> <li>\u8fd9\u4e2a 3x3 \u77e9\u9635\u662f\u5185\u53c2\u77e9\u9635 \\(K\\)\u3002\u5b83\u7f16\u7801\u4e86\u76f8\u673a\u7684\u5185\u90e8\u5c5e\u6027\uff1a\u7126\u8ddd \\(f_x, f_y\\)\uff08\u900f\u955c\u4f1a\u805a\u5149\u7ebf\u7684\u5f3a\u5ea6\uff09\u548c\u4e3b\u70b9 \\((c_x, c_y)\\)\uff08\u5149\u8f74\u4e0e\u4f20\u611f\u5668\u7684\u4ea4\u70b9\uff0c\u901a\u5e38\u9760\u8fd1\u56fe\u50cf\u4e2d\u5fc3\uff09\u3002\u5bf9\u4e8e\u7ed9\u5b9a\u7684\u76f8\u673a\u548c\u955c\u5934\u7ec4\u5408\uff0c\u8fd9\u4e9b\u53c2\u6570\u662f\u56fa\u5b9a\u7684\u3002</li> </ul> <p></p> <ul> <li>\u5916\u53c2\u63cf\u8ff0\u76f8\u673a\u5728\u4e16\u754c\u4e2d\u7684\u4f4d\u7f6e\uff1a\u4e00\u4e2a\u65cb\u8f6c\u77e9\u9635 \\(R\\)\uff083x3\uff0c\u6765\u81ea\u7b2c 02 \u7ae0\uff09\u548c\u4e00\u4e2a\u5e73\u79fb\u5411\u91cf \\(t\\)\uff083x1\uff09\u3002\u5b83\u4eec\u5171\u540c\u5c06\u4e16\u754c\u5750\u6807\u8f6c\u6362\u4e3a\u76f8\u673a\u5750\u6807\u3002\u5b8c\u6574\u7684\u6295\u5f71\u662f\uff1a</li> </ul> \\[\\mathbf{p} = K [R \\mid t] \\mathbf{P}\\] <ul> <li> <p>\u5176\u4e2d \\(\\mathbf{P} = [X, Y, Z, 1]^T\\) \u662f\u9f50\u6b21\u5750\u6807\u4e0b\u7684\u4e09\u7ef4\u70b9\uff0c\\(\\mathbf{p} = [u, v, 1]^T\\) \u662f\u6295\u5f71\u540e\u7684\u50cf\u7d20\u3002\\([R \\mid t]\\) \u77e9\u9635\u662f 3x4\uff0c\u5c06\u65cb\u8f6c\u548c\u5e73\u79fb\u5e76\u6392\u653e\u7f6e\u3002\u8fd9\u5168\u662f\u7b2c 02 \u7ae0\u4e2d\u7684\u7ebf\u6027\u4ee3\u6570\u3002</p> </li> <li> <p>\u771f\u5b9e\u955c\u5934\u4f1a\u5f15\u5165\u7578\u53d8\u3002</p> <ul> <li>\u5f84\u5411\u7578\u53d8\u4f7f\u76f4\u7ebf\u5f2f\u66f2\u6210\u66f2\u7ebf\uff08\u6876\u5f62\u7578\u53d8\u4f7f\u56fe\u50cf\u5411\u5916\u51f8\u51fa\uff1b\u6795\u5f62\u7578\u53d8\u4f7f\u5176\u5411\u5185\u6536\u7f29\uff09\u3002 \u5207\u5411\u7578\u53d8\u6e90\u4e8e\u955c\u5934\u672a\u4e0e\u4f20\u611f\u5668\u5b8c\u5168\u5e73\u884c\u3002</li> </ul> </li> <li> <p>\u76f8\u673a\u6807\u5b9a\u901a\u8fc7\u62cd\u6444\u5df2\u77e5\u56fe\u6848\uff08\u5982\u68cb\u76d8\u683c\uff09\u7684\u56fe\u50cf\u6765\u4f30\u8ba1\u5185\u53c2\u548c\u7578\u53d8\u7cfb\u6570\uff0c\u7136\u540e\u6821\u6b63\uff08\u53bb\u7578\u53d8\uff09\u56fe\u50cf\u3002</p> </li> <li> <p>\u7a7a\u95f4\u6ee4\u6ce2\u662f\u7ecf\u5178\u56fe\u50cf\u5904\u7406\u7684\u57fa\u7840\u3002\u4e00\u4e2a\u6ee4\u6ce2\u5668\uff08\u6216\u5377\u79ef\u6838\uff09\u662f\u4e00\u4e2a\u5c0f\u77e9\u9635\uff08\u901a\u5e38\u4e3a 3x3 \u6216 5x5\uff09\uff0c\u5b83\u5728\u56fe\u50cf\u4e0a\u6ed1\u52a8\u3002\u5728\u6bcf\u4e2a\u4f4d\u7f6e\uff0c\u6ee4\u6ce2\u5668\u7684\u503c\u4e0e\u91cd\u53e0\u7684\u56fe\u50cf\u5757\u9010\u5143\u7d20\u76f8\u4e58\u5e76\u6c42\u548c\uff0c\u4ea7\u751f\u4e00\u4e2a\u8f93\u51fa\u50cf\u7d20\u3002\u8fd9\u5c31\u662f\u4e8c\u7ef4\u5377\u79ef\uff0c\u4e0e\u9a71\u52a8 CNN\uff08\u6587\u4ef6 02\uff09\u7684\u8fd0\u7b97\u76f8\u540c\uff0c\u4f46\u8fd9\u91cc\u7684\u6ee4\u6ce2\u5668\u6743\u91cd\u662f\u624b\u5de5\u8bbe\u8ba1\u800c\u975e\u5b66\u4e60\u5f97\u5230\u7684\u3002</p> </li> </ul> \\[(\\text{\u56fe\u50cf} * K)[i,j] = \\sum_{m} \\sum_{n} \\text{\u56fe\u50cf}[i+m, j+n] \\cdot K[m, n]\\] <ul> <li> <p>\u8fd9\u662f\u7b2c 06 \u7ae0\u4e2d\u4e00\u7ef4\u5377\u79ef\u7684\u4e8c\u7ef4\u6269\u5c55\u3002\u6ee4\u6ce2\u5668\u51b3\u5b9a\u4e86\u8be5\u8fd0\u7b97\u68c0\u6d4b\u7684\u5185\u5bb9\uff1a\u4e0d\u540c\u7684\u6ee4\u6ce2\u5668\u68c0\u6d4b\u4e0d\u540c\u7684\u7279\u5f81\u3002</p> </li> <li> <p>\u6a21\u7cca\u901a\u8fc7\u5bf9\u76f8\u90bb\u50cf\u7d20\u53d6\u5e73\u5747\u6765\u5e73\u6ed1\u56fe\u50cf\u3002\u76d2\u5f0f\u6ee4\u6ce2\u5668\u5bf9\u6240\u6709\u76f8\u90bb\u50cf\u7d20\u8d4b\u4e88\u76f8\u540c\u7684\u6743\u91cd\u3002</p> </li> <li> <p>\u9ad8\u65af\u6ee4\u6ce2\u5668\u901a\u8fc7\u4e8c\u7ef4\u9ad8\u65af\u51fd\u6570\uff08\u7b2c 05 \u7ae0\uff09\u5bf9\u76f8\u90bb\u50cf\u7d20\u52a0\u6743\uff0c\u7ed9\u76f8\u90bb\u50cf\u7d20\u66f4\u5927\u7684\u6743\u91cd\uff0c\u7ed9\u8fdc\u5904\u7684\u50cf\u7d20\u66f4\u5c0f\u7684\u6743\u91cd\u3002\u9ad8\u65af\u6a21\u7cca\u662f\u6700\u5e38\u89c1\u7684\u5e73\u6ed1\u64cd\u4f5c\uff0c\u7531 \\(\\sigma\\) \u53c2\u6570\u5316\uff1a\\(\\sigma\\) \u8d8a\u5927\uff0c\u5e73\u6ed1\u7a0b\u5ea6\u8d8a\u9ad8\u3002</p> </li> <li> <p>\u4e2d\u503c\u6ee4\u6ce2\u7528\u90bb\u57df\u7684\u4e2d\u503c\u4ee3\u66ff\u6bcf\u4e2a\u50cf\u7d20\uff0c\u800c\u975e\u52a0\u6743\u5e73\u5747\u3002\u5b83\u5728\u53bb\u9664\u6912\u76d0\u566a\u58f0\uff08\u968f\u673a\u7684\u9ed1\u767d\u50cf\u7d20\uff09\u65b9\u9762\u7279\u522b\u6709\u6548\uff0c\u540c\u65f6\u4fdd\u7559\u8fb9\u7f18\uff0c\u56e0\u4e3a\u4e2d\u503c\u5bf9\u5f02\u5e38\u503c\u5177\u6709\u9c81\u68d2\u6027\uff08\u5982\u7b2c 04 \u7ae0\u6240\u8ba8\u8bba\u7684\uff09\u3002</p> </li> <li> <p>\u8fb9\u7f18\u68c0\u6d4b\u8bc6\u522b\u50cf\u7d20\u5f3a\u5ea6\u6025\u5267\u53d8\u5316\u7684\u8fb9\u754c\u3002\u8fb9\u7f18\u627f\u8f7d\u4e86\u56fe\u50cf\u4e2d\u7684\u5927\u90e8\u5206\u7ed3\u6784\u4fe1\u606f\uff1b\u4ec5\u51ed\u8fb9\u7f18\u5c31\u53ef\u4ee5\u8bc6\u522b\u7269\u4f53\u3002</p> </li> <li> <p>Sobel \u7b97\u5b50\u4f7f\u7528\u4e24\u4e2a 3x3 \u6ee4\u6ce2\u5668\u6765\u4f30\u8ba1\u6c34\u5e73\u65b9\u5411\u548c\u5782\u76f4\u65b9\u5411\u7684\u68af\u5ea6\uff1a</p> </li> </ul> \\[ G_x = \\begin{bmatrix} -1 &amp; 0 &amp; 1 \\\\ -2 &amp; 0 &amp; 2 \\\\ -1 &amp; 0 &amp; 1 \\end{bmatrix}, \\quad G_y = \\begin{bmatrix} -1 &amp; -2 &amp; -1 \\\\ 0 &amp; 0 &amp; 0 \\\\ 1 &amp; 2 &amp; 1 \\end{bmatrix} \\] <ul> <li> <p>\u5c06\u56fe\u50cf\u4e0e \\(G_x\\) \u5377\u79ef\u5f97\u5230\u6c34\u5e73\u68af\u5ea6\uff08\u5bf9\u5782\u76f4\u8fb9\u7f18\u54cd\u5e94\u5f3a\u70c8\uff09\uff0c\u4e0e \\(G_y\\) \u5377\u79ef\u5f97\u5230\u5782\u76f4\u68af\u5ea6\uff08\u5bf9\u6c34\u5e73\u8fb9\u7f18\u54cd\u5e94\u5f3a\u70c8\uff09\u3002</p> </li> <li> <p>\u68af\u5ea6\u5e45\u503c \\(\\sqrt{G_x^2 + G_y^2}\\) \u548c\u65b9\u5411 \\(\\arctan(G_y / G_x)\\) \u5171\u540c\u63cf\u8ff0\u6bcf\u4e2a\u50cf\u7d20\u5904\u7684\u8fb9\u7f18\u5f3a\u5ea6\u548c\u65b9\u5411\u3002\u8fd9\u662f\u7b2c 03 \u7ae0\u4e2d\u68af\u5ea6\u5728\u56fe\u50cf\u57df\u7684\u5bf9\u5e94\u6982\u5ff5\u3002</p> </li> </ul> <p></p> <ul> <li> <p>Canny \u8fb9\u7f18\u68c0\u6d4b\u5668\u662f\u8fb9\u7f18\u68c0\u6d4b\u7684\u9ec4\u91d1\u6807\u51c6\u3002\u5b83\u5305\u542b\u56db\u4e2a\u6b65\u9aa4\uff1a</p> <ol> <li>\u4f7f\u7528\u9ad8\u65af\u6ee4\u6ce2\u5668\u5e73\u6ed1\u56fe\u50cf\u4ee5\u51cf\u5c11\u566a\u58f0</li> <li>\u8ba1\u7b97\u68af\u5ea6\u5e45\u503c\u548c\u65b9\u5411\uff08\u4f7f\u7528 Sobel\uff09</li> <li>\u975e\u6781\u5927\u503c\u6291\u5236\uff1a\u4ec5\u4fdd\u7559\u6cbf\u68af\u5ea6\u65b9\u5411\u4e3a\u5c40\u90e8\u6700\u5927\u503c\u7684\u50cf\u7d20\uff0c\u7ec6\u5316\u8fb9\u7f18</li> <li>\u6ede\u540e\u9608\u503c\u5904\u7406\uff1a\u4f7f\u7528\u4e24\u4e2a\u9608\u503c\uff08\u9ad8\u9608\u503c\u548c\u4f4e\u9608\u503c\uff09\u3002\u9ad8\u4e8e\u9ad8\u9608\u503c\u7684\u50cf\u7d20\u662f\u786e\u5b9a\u8fb9\u7f18\u3002\u4ecb\u4e8e\u4e24\u4e2a\u9608\u503c\u4e4b\u95f4\u7684\u50cf\u7d20\u4ec5\u5f53\u8fde\u63a5\u5230\u786e\u5b9a\u8fb9\u7f18\u65f6\u624d\u88ab\u89c6\u4e3a\u8fb9\u7f18\u3002\u4f4e\u4e8e\u4f4e\u9608\u503c\u7684\u50cf\u7d20\u88ab\u820d\u5f03\u3002</li> </ol> </li> <li> <p>Canny \u4e2d\u7684\u53cc\u9608\u503c\u4f7f\u5176\u6bd4\u5355\u9608\u503c\u66f4\u9c81\u68d2\uff1a\u5f3a\u8fb9\u7f18\u59cb\u7ec8\u88ab\u4fdd\u7559\uff0c\u5f31\u8fb9\u7f18\u4ec5\u5f53\u5c5e\u4e8e\u8fde\u7eed\u8fb9\u7f18\u7ed3\u6784\u65f6\u624d\u88ab\u4fdd\u7559\u3002</p> </li> <li> <p>\u9891\u57df\u5206\u6790\u63ed\u793a\u4e86\u5728\u7a7a\u95f4\u57df\u96be\u4ee5\u770b\u5230\u7684\u6a21\u5f0f\u3002\u4e8c\u7ef4\u5085\u91cc\u53f6\u53d8\u6362\uff08\u6269\u5c55\u81ea\u7b2c 03 \u7ae0\u7684\u4e00\u7ef4\u7248\u672c\uff09\u5c06\u56fe\u50cf\u5206\u89e3\u4e3a\u4e0d\u540c\u9891\u7387\u548c\u65b9\u5411\u7684\u6b63\u5f26\u6a21\u5f0f\u4e4b\u548c\uff1a</p> </li> </ul> \\[F(u, v) = \\sum_{x=0}^{M-1} \\sum_{y=0}^{N-1} f(x, y) \\cdot e^{-j2\\pi(ux/M + vy/N)}\\] <ul> <li> <p>\u4f4e\u9891\u5bf9\u5e94\u5e73\u6ed1\u3001\u7f13\u6162\u53d8\u5316\u7684\u533a\u57df\uff08\u5929\u7a7a\u3001\u5899\u58c1\uff09\u3002\u9ad8\u9891\u5bf9\u5e94\u9510\u5229\u53d8\u5316\uff08\u8fb9\u7f18\u3001\u7eb9\u7406\u3001\u566a\u58f0\uff09\u3002\u5e45\u5ea6\u8c31\u663e\u793a\u6bcf\u4e2a\u9891\u7387\u4e0a\u5b58\u5728\u591a\u5c11\u80fd\u91cf\uff0c\u76f8\u4f4d\u8c31\u7f16\u7801\u4e86\u7a7a\u95f4\u6392\u5217\u4fe1\u606f\u3002</p> </li> <li> <p>\u4f4e\u901a\u6ee4\u6ce2\u53bb\u9664\u9ad8\u9891\uff0c\u4ece\u800c\u5e73\u6ed1\u56fe\u50cf\uff08\u76f8\u5f53\u4e8e\u7a7a\u95f4\u57df\u7684\u9ad8\u65af\u6a21\u7cca\uff09\u3002\u9ad8\u901a\u6ee4\u6ce2\u53bb\u9664\u4f4e\u9891\uff0c\u4ece\u800c\u5f3a\u8c03\u8fb9\u7f18\u548c\u7ec6\u8282\u3002\u5e26\u901a\u6ee4\u6ce2\u53ea\u4fdd\u7559\u4e00\u5b9a\u8303\u56f4\u7684\u9891\u7387\uff0c\u7528\u4e8e\u7eb9\u7406\u5206\u6790\u3002</p> </li> <li> <p>\u5728\u5b9e\u8df5\u4e2d\uff0c\u5bf9\u4e8e\u5927\u5c3a\u5bf8\u6ee4\u6ce2\u5668\uff0c\u9891\u57df\u6ee4\u6ce2\u53ef\u80fd\u6bd4\u7a7a\u95f4\u5377\u79ef\u66f4\u5feb\uff0c\u56e0\u4e3a\u7a7a\u95f4\u57df\u4e2d\u7684\u5377\u79ef\u7b49\u4ef7\u4e8e\u9891\u57df\u4e2d\u7684\u9010\u5143\u7d20\u4e58\u6cd5\uff08\u5377\u79ef\u5b9a\u7406\uff09\u3002\u8fd9\u76f4\u63a5\u8054\u7cfb\u5230\u7b2c 03 \u7ae0\u4e2d\u7684\u5085\u91cc\u53f6\u53d8\u6362\u6027\u8d28\u3002</p> </li> <li> <p>\u76f4\u65b9\u56fe\u603b\u7ed3\u50cf\u7d20\u5f3a\u5ea6\u7684\u5206\u5e03\u3002\u76f4\u65b9\u56fe\u7edf\u8ba1\u6bcf\u4e2a\u5f3a\u5ea6\u503c\u6709\u591a\u5c11\u50cf\u7d20\uff08\u5bf9\u4e8e 8 \u4f4d\u56fe\u50cf\u4e3a 0-255\uff09\u3002\u8fd9\u662f\u7b2c 04 \u7ae0\u4e2d\u7684\u9891\u7387\u5206\u5e03\u5e94\u7528\u4e8e\u50cf\u7d20\u503c\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u6697\u56fe\u50cf\u7684\u76f4\u65b9\u56fe\u96c6\u4e2d\u5728\u5de6\u4fa7\uff08\u4f4e\u503c\uff09\u3002\u4eae\u56fe\u50cf\u7684\u76f4\u65b9\u56fe\u96c6\u4e2d\u5728\u53f3\u4fa7\u3002\u4f4e\u5bf9\u6bd4\u5ea6\u56fe\u50cf\u7684\u76f4\u65b9\u56fe\u72ed\u7a84\u3002\u9ad8\u5bf9\u6bd4\u5ea6\u56fe\u50cf\u7684\u76f4\u65b9\u56fe\u5bbd\u800c\u5206\u6563\u3002</p> </li> <li> <p>\u76f4\u65b9\u56fe\u5747\u8861\u5316\u5c06\u76f4\u65b9\u56fe\u62c9\u4f38\u4ee5\u8986\u76d6\u6574\u4e2a\u5f3a\u5ea6\u8303\u56f4\uff0c\u4ece\u800c\u6539\u5584\u5bf9\u6bd4\u5ea6\u3002\u5176\u601d\u8def\u662f\u627e\u5230\u4e00\u4e2a\u6620\u5c04\uff0c\u4f7f\u50cf\u7d20\u5f3a\u5ea6\u7684\u7d2f\u79ef\u5206\u5e03\u51fd\u6570\uff08CDF\uff09\u8fd1\u4f3c\u4e3a\u7ebf\u6027\u3002\u8fd9\u662f\u7b2c 04 \u7ae0\u4e2d CDF \u6982\u5ff5\u7684\u76f4\u63a5\u5e94\u7528\u3002</p> </li> <li> <p>Otsu \u65b9\u6cd5\u81ea\u52a8\u627e\u5230\u5c06\u56fe\u50cf\u5206\u5272\u4e3a\u524d\u666f\u548c\u80cc\u666f\u7684\u6700\u4f73\u9608\u503c\u3002\u5b83\u5c1d\u8bd5\u6bcf\u4e2a\u53ef\u80fd\u7684\u9608\u503c\uff0c\u5e76\u9009\u62e9\u4f7f\u7c7b\u5185\u65b9\u5dee\u6700\u5c0f\uff08\u6216\u7b49\u4ef7\u5730\uff0c\u4f7f\u7c7b\u95f4\u65b9\u5dee\u6700\u5927\uff09\u7684\u9608\u503c\u3002\u8fd9\u662f\u7b2c 04 \u7ae0\u4e2d\u65b9\u5dee\u6982\u5ff5\u5e94\u7528\u4e8e\u50cf\u7d20\u5f3a\u5ea6\u7fa4\u4f53\u7684\u4f53\u73b0\u3002</p> </li> <li> <p>\u7279\u5f81\u63d0\u53d6\u8bc6\u522b\u56fe\u50cf\u4e2d\u53ef\u7528\u4e8e\u5339\u914d\u3001\u8bc6\u522b\u548c\u4e09\u7ef4\u91cd\u5efa\u7684\u72ec\u7279\u70b9\u6216\u533a\u57df\u3002\u597d\u7684\u7279\u5f81\u5e94\u5177\u6709\u53ef\u91cd\u590d\u6027\uff08\u5728\u4e0d\u540c\u89c6\u89d2\u4e0b\u80fd\u88ab\u518d\u6b21\u627e\u5230\uff09\u3001\u72ec\u7279\u6027\uff08\u53ef\u4e0e\u5176\u4ed6\u7279\u5f81\u533a\u5206\uff09\u548c\u8ba1\u7b97\u9ad8\u6548\u6027\u3002</p> </li> <li> <p>\u89d2\u70b9\u68c0\u6d4b\u5bfb\u627e\u56fe\u50cf\u5f3a\u5ea6\u5728\u591a\u4e2a\u65b9\u5411\u4e0a\u663e\u8457\u53d8\u5316\u7684\u70b9\u3002\u5e73\u6ed1\u533a\u57df\u5728\u4efb\u4f55\u65b9\u5411\u4e0a\u7684\u53d8\u5316\u90fd\u5f88\u5c0f\u3002\u8fb9\u7f18\u5728\u4e00\u4e2a\u65b9\u5411\u4e0a\u6709\u53d8\u5316\u3002\u89d2\u70b9\u5728\u81f3\u5c11\u4e24\u4e2a\u65b9\u5411\u4e0a\u90fd\u6709\u53d8\u5316\uff0c\u4f7f\u5176\u5728\u5c40\u90e8\u662f\u552f\u4e00\u7684\uff0c\u56e0\u6b64\u662f\u53ef\u9760\u7684\u6807\u5fd7\u70b9\u3002</p> </li> <li> <p>Harris \u89d2\u70b9\u68c0\u6d4b\u5668\u5206\u6790\u6bcf\u4e2a\u50cf\u7d20\u5904\u7684\u7ed3\u6784\u5f20\u91cf\uff08\u4e5f\u79f0\u4e3a\u4e8c\u9636\u77e9\u77e9\u9635\uff09\uff1a</p> </li> </ul> \\[ M = \\sum_{(x,y) \\in W} w(x,y) \\begin{bmatrix} I_x^2 &amp; I_x I_y \\\\ I_x I_y &amp; I_y^2 \\end{bmatrix} \\] <ul> <li> <p>\u5176\u4e2d \\(I_x\\) \u548c \\(I_y\\) \u662f\u56fe\u50cf\u68af\u5ea6\uff08\u4f7f\u7528 Sobel \u8ba1\u7b97\uff09\uff0c\\(W\\) \u662f\u5c40\u90e8\u7a97\u53e3\uff0c\\(w\\) \u662f\u9ad8\u65af\u52a0\u6743\u51fd\u6570\u3002\\(M\\) \u7684\u7279\u5f81\u503c\uff08\u6765\u81ea\u7b2c 02 \u7ae0\uff09\u544a\u8bc9\u4f60\u7279\u5f81\u7684\u7c7b\u578b\uff1a</p> <ul> <li>\u4e24\u4e2a\u7279\u5f81\u503c\u90fd\u5f88\u5c0f\uff1a\u5e73\u5766\u533a\u57df\uff08\u65e0\u7279\u5f81\uff09</li> <li>\u4e00\u4e2a\u5f88\u5927\uff0c\u4e00\u4e2a\u5f88\u5c0f\uff1a\u8fb9\u7f18</li> <li>\u4e24\u4e2a\u90fd\u5f88\u5927\uff1a\u89d2\u70b9</li> </ul> </li> <li> <p>Harris \u4e0d\u663e\u5f0f\u8ba1\u7b97\u7279\u5f81\u503c\uff0c\u800c\u662f\u4f7f\u7528\u89d2\u70b9\u54cd\u5e94\u51fd\u6570\uff1a\\(R = \\det(M) - k \\cdot (\\text{tr}(M))^2\\)\uff0c\u5176\u4e2d \\(\\det(M) = \\lambda_1 \\lambda_2\\) \u4e14 \\(\\text{tr}(M) = \\lambda_1 + \\lambda_2\\)\uff08\u5747\u6765\u81ea\u7b2c 02 \u7ae0\uff09\u3002\\(R\\) \u4e3a\u6b63\u4e14\u8f83\u5927\u65f6\u8868\u793a\u89d2\u70b9\u3002\u5e38\u6570 \\(k\\) \u901a\u5e38\u4e3a 0.04-0.06\u3002</p> </li> <li> <p>Shi-Tomasi \u68c0\u6d4b\u5668\u5c06\u5176\u7b80\u5316\u4e3a \\(R = \\min(\\lambda_1, \\lambda_2)\\)\uff0c\u76f4\u63a5\u68c0\u67e5\u8f83\u5c0f\u7684\u7279\u5f81\u503c\u662f\u5426\u8db3\u591f\u5927\u3002\u8fd9\u5728\u5b9e\u9645\u4e2d\u7a0d\u5fae\u66f4\u7a33\u5b9a\u3002</p> </li> <li> <p>\u6591\u70b9\u68c0\u6d4b\u5bfb\u627e\u4e0e\u5468\u56f4\u73af\u5883\u4e0d\u540c\u7684\u533a\u57df\u3002\u4e0e\u89d2\u70b9\uff08\u5c5e\u4e8e\u70b9\u7279\u5f81\uff09\u4e0d\u540c\uff0c\u6591\u70b9\u5177\u6709\u7279\u5f81\u5c3a\u5bf8\u3002</p> </li> <li> <p>SIFT\uff08\u5c3a\u5ea6\u4e0d\u53d8\u7279\u5f81\u53d8\u6362\uff0cLowe\uff0c2004\uff09\u5728\u591a\u4e2a\u5c3a\u5ea6\u4e0a\u68c0\u6d4b\u6591\u70b9\uff0c\u5e76\u6784\u5efa\u5bf9\u65cb\u8f6c\u3001\u5c3a\u5ea6\u5177\u6709\u4e0d\u53d8\u6027\uff0c\u5bf9\u5149\u7167\u53d8\u5316\u5177\u6709\u90e8\u5206\u4e0d\u53d8\u6027\u7684\u63cf\u8ff0\u5b50\u3002\u5b83\u7684\u5de5\u4f5c\u539f\u7406\u662f\uff1a</p> <ol> <li>\u4f7f\u7528\u9010\u6e10\u589e\u5927 \\(\\sigma\\) \u7684\u9ad8\u65af\u6a21\u7cca\u6784\u5efa\u5c3a\u5ea6\u7a7a\u95f4\uff08\u89c1\u4e0b\u6587\uff09</li> <li>\u5728\u5c3a\u5ea6\u95f4\u7684 Gaussian \u5dee\u5206\uff08DoG\uff09\u4e2d\u5bfb\u627e\u6781\u503c\u70b9</li> <li>\u7cbe\u70bc\u5173\u952e\u70b9\u4f4d\u7f6e\uff0c\u53bb\u9664\u4f4e\u5bf9\u6bd4\u5ea6\u70b9\u548c\u8fb9\u7f18\u54cd\u5e94</li> <li>\u57fa\u4e8e\u5c40\u90e8\u68af\u5ea6\u65b9\u5411\u5206\u914d\u4e3b\u65b9\u5411</li> <li>\u4ece\u5173\u952e\u70b9\u5468\u56f4 16x16 \u5757\u4e2d\u7684\u68af\u5ea6\u76f4\u65b9\u56fe\u6784\u5efa 128 \u7ef4\u63cf\u8ff0\u5b50</li> </ol> </li> <li> <p>SURF\uff08\u52a0\u901f\u7a33\u5065\u7279\u5f81\uff09\u4f7f\u7528\u76d2\u5f0f\u6ee4\u6ce2\u5668\u548c\u79ef\u5206\u56fe\u50cf\u8fd1\u4f3c SIFT \u4ee5\u5b9e\u73b0\u66f4\u5feb\u7684\u8ba1\u7b97\u3002ORB\uff08\u5b9a\u5411 FAST \u548c\u65cb\u8f6c BRIEF\uff09\u662f\u4e00\u4e2a\u5feb\u901f\u3001\u5f00\u6e90\u7684\u66ff\u4ee3\u65b9\u6848\uff0c\u5b83\u5c06 FAST \u89d2\u70b9\u68c0\u6d4b\u5668\u4e0e BRIEF \u4e8c\u8fdb\u5236\u63cf\u8ff0\u5b50\u7ed3\u5408\uff0c\u5e76\u589e\u52a0\u4e86\u65cb\u8f6c\u4e0d\u53d8\u6027\u3002</p> </li> <li> <p>HOG\uff08\u65b9\u5411\u68af\u5ea6\u76f4\u65b9\u56fe\uff09\u63cf\u8ff0\u5b50\u5c06\u56fe\u50cf\u5212\u5206\u4e3a\u5c0f\u5355\u5143\u683c\uff0c\u8ba1\u7b97\u6bcf\u4e2a\u5355\u5143\u683c\u5185\u68af\u5ea6\u65b9\u5411\u7684\u76f4\u65b9\u56fe\uff0c\u5e76\u5728\u5355\u5143\u683c\u5757\u95f4\u8fdb\u884c\u5f52\u4e00\u5316\u3002HOG \u6355\u6349\u8fb9\u7f18\u65b9\u5411\u7684\u5206\u5e03\uff0c\u8fd9\u5bf9\u7269\u4f53\u5f62\u72b6\u5177\u6709\u9ad8\u5ea6\u4fe1\u606f\u91cf\u3002\u5728\u6df1\u5ea6\u5b66\u4e60\u4e4b\u524d\uff0cHOG + SVM\uff08\u7b2c 06 \u7ae0\uff09\u662f\u884c\u4eba\u68c0\u6d4b\u548c\u7269\u4f53\u8bc6\u522b\u7684\u4e3b\u6d41\u65b9\u6cd5\u3002</p> </li> <li> <p>\u56fe\u50cf\u91d1\u5b57\u5854\u4ee5\u591a\u79cd\u5206\u8fa8\u7387\u8868\u793a\u56fe\u50cf\u3002</p> <ul> <li>\u9ad8\u65af\u91d1\u5b57\u5854\u901a\u8fc7\u91cd\u590d\u6a21\u7cca\u548c\u4e0b\u91c7\u6837\uff08\u5206\u8fa8\u7387\u51cf\u534a\uff09\u6784\u5efa\u3002\u6bcf\u4e00\u5c42\u90fd\u662f\u539f\u59cb\u56fe\u50cf\u7684\u7c97\u7565\u7248\u672c\u3002</li> <li>\u62c9\u666e\u62c9\u65af\u91d1\u5b57\u5854\u5b58\u50a8\u8fde\u7eed\u9ad8\u65af\u5c42\u4e4b\u95f4\u7684\u5dee\u5f02\uff0c\u6355\u6349\u6bcf\u4e00\u6b65\u4e0b\u91c7\u6837\u4e22\u5931\u7684\u7ec6\u8282\u3002\u62c9\u666e\u62c9\u65af\u91d1\u5b57\u5854\u662f\u53ef\u9006\u7684\uff1a\u4f60\u53ef\u4ee5\u4ece\u4e2d\u91cd\u5efa\u539f\u59cb\u56fe\u50cf\u3002</li> </ul> </li> </ul> <p></p> <ul> <li>\u5c3a\u5ea6\u7a7a\u95f4\u5f62\u5f0f\u5316\u4e86\u7269\u4f53\u5b58\u5728\u4e8e\u4e0d\u540c\u5c3a\u5ea6\u8fd9\u4e00\u6982\u5ff5\u3002\u4e00\u68f5\u6811\u662f\u4e00\u4e2a\u5927\u6591\u70b9\uff1b\u6811\u4e0a\u7684\u4e00\u7247\u53f6\u5b50\u662f\u4e00\u4e2a\u5c0f\u6591\u70b9\u3002\u8981\u540c\u65f6\u68c0\u6d4b\u4e24\u8005\uff0c\u4f60\u9700\u8981\u8de8\u5c3a\u5ea6\u641c\u7d22\u3002\u56fe\u50cf\u7684\u5c3a\u5ea6\u7a7a\u95f4\u662f\u901a\u8fc7\u5c06\u56fe\u50cf\u4e0e\u9010\u6e10\u589e\u5927 \\(\\sigma\\) \u7684\u9ad8\u65af\u51fd\u6570\u5377\u79ef\u5f97\u5230\u7684\u56fe\u50cf\u65cf\uff1a</li> </ul> \\[L(x, y, \\sigma) = G(x, y, \\sigma) * I(x, y)\\] <ul> <li>\u5176\u4e2d \\(G\\) \u662f\u6807\u51c6\u5dee\u4e3a \\(\\sigma\\) \u7684\u4e8c\u7ef4\u9ad8\u65af\u51fd\u6570\u3002\u8de8\u591a\u4e2a\u5c3a\u5ea6\u6301\u7eed\u5b58\u5728\u7684\u7279\u5f81\u66f4\u6709\u53ef\u80fd\u662f\u6709\u610f\u4e49\u7684\u7ed3\u6784\u800c\u975e\u566a\u58f0\u3002\u5c3a\u5ea6\u7a7a\u95f4\u662f SIFT \u7684\u7406\u8bba\u57fa\u7840\uff0c\u4e5f\u662f\u8d2f\u7a7f\u73b0\u4ee3\u8ba1\u7b97\u673a\u89c6\u89c9\u7684\u591a\u5c3a\u5ea6\u5904\u7406\u7684\u57fa\u7840\uff0c\u5305\u62ec\u76ee\u6807\u68c0\u6d4b\u4e2d\u7684\u7279\u5f81\u91d1\u5b57\u5854\u7f51\u7edc\uff08\u6587\u4ef6 03\uff09\u3002</li> </ul>"},{"location":"chapter%2008%3A%20computer%20vision/01.%20image%20fundamentals/#colab-notebook","title":"\u7f16\u7801\u4efb\u52a1\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ol> <li> <p>\u52a0\u8f7d\u56fe\u50cf\uff0c\u5c06\u5176\u8f6c\u6362\u4e3a\u4e0d\u540c\u7684\u8272\u5f69\u7a7a\u95f4\uff08RGB\u3001HSV\u3001LAB\uff09\uff0c\u5e76\u53ef\u89c6\u5316\u5404\u4e2a\u901a\u9053\u3002\u89c2\u5bdf\u989c\u8272\u4fe1\u606f\u5728\u4e0d\u540c\u7a7a\u95f4\u4e2d\u7684\u5206\u5e03\u5dee\u5f02\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\nfrom PIL import Image\nimport numpy as np\n\n# Create a synthetic test image with distinct colours\nH, W = 128, 256\nimg = np.zeros((H, W, 3), dtype=np.uint8)\nimg[:, :64] = [255, 50, 50]     # red\nimg[:, 64:128] = [50, 255, 50]  # green\nimg[:, 128:192] = [50, 50, 255] # blue\nimg[:, 192:] = [255, 255, 50]   # yellow\n\n# Add a brightness gradient\nfor y in range(H):\n    scale = 0.3 + 0.7 * y / H\n    img[y] = (img[y] * scale).astype(np.uint8)\n\nimg_jnp = jnp.array(img, dtype=jnp.float32) / 255.0\n\n# Manual RGB to HSV conversion\ndef rgb_to_hsv(rgb):\n    r, g, b = rgb[..., 0], rgb[..., 1], rgb[..., 2]\n    maxc = jnp.max(rgb, axis=-1)\n    minc = jnp.min(rgb, axis=-1)\n    diff = maxc - minc + 1e-7\n\n    # Hue\n    h = jnp.where(maxc == minc, 0.0,\n        jnp.where(maxc == r, 60 * ((g - b) / diff % 6),\n        jnp.where(maxc == g, 60 * ((b - r) / diff + 2),\n                              60 * ((r - g) / diff + 4))))\n    s = jnp.where(maxc &lt; 1e-7, 0.0, diff / maxc)\n    v = maxc\n    return jnp.stack([h / 360, s, v], axis=-1)\n\nhsv = rgb_to_hsv(img_jnp)\n\nfig, axes = plt.subplots(2, 3, figsize=(14, 8))\nfor i, (ch, name) in enumerate(zip([img_jnp[...,0], img_jnp[...,1], img_jnp[...,2]],\n                                     ['Red', 'Green', 'Blue'])):\n    axes[0, i].imshow(ch, cmap='gray', vmin=0, vmax=1)\n    axes[0, i].set_title(f'RGB: {name}'); axes[0, i].axis('off')\n\nfor i, (ch, name) in enumerate(zip([hsv[...,0], hsv[...,1], hsv[...,2]],\n                                     ['Hue', 'Saturation', 'Value'])):\n    axes[1, i].imshow(ch, cmap='gray', vmin=0, vmax=1)\n    axes[1, i].set_title(f'HSV: {name}'); axes[1, i].axis('off')\n\nplt.suptitle('RGB vs HSV Channels')\nplt.tight_layout(); plt.show()\n</code></pre></p> </li> <li> <p>\u4f7f\u7528\u4e8c\u7ef4\u5377\u79ef\u4ece\u5934\u5b9e\u73b0 Sobel \u8fb9\u7f18\u68c0\u6d4b\u548c\u9ad8\u65af\u6a21\u7cca\u3002\u5c06\u5176\u5e94\u7528\u4e8e\u56fe\u50cf\u5e76\u6bd4\u8f83\u7ed3\u679c\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef conv2d(image, kernel):\n    \"\"\"2D convolution (valid mode) from scratch.\"\"\"\n    H, W = image.shape\n    kH, kW = kernel.shape\n    out_h, out_w = H - kH + 1, W - kW + 1\n    output = jnp.zeros((out_h, out_w))\n    for i in range(out_h):\n        for j in range(out_w):\n            patch = image[i:i+kH, j:j+kW]\n            output = output.at[i, j].set(jnp.sum(patch * kernel))\n    return output\n\n# Create a test image: white rectangle on dark background\nimg = jnp.zeros((64, 64))\nimg = img.at[15:50, 20:45].set(1.0)\n# Add some noise\nkey = jax.random.PRNGKey(42)\nimg = img + jax.random.normal(key, img.shape) * 0.05\n\n# Sobel filters\nsobel_x = jnp.array([[-1, 0, 1], [-2, 0, 2], [-1, 0, 1]], dtype=jnp.float32)\nsobel_y = jnp.array([[-1, -2, -1], [0, 0, 0], [1, 2, 1]], dtype=jnp.float32)\n\n# Gaussian blur kernel (5x5, sigma=1)\nax = jnp.arange(-2, 3, dtype=jnp.float32)\nxx, yy = jnp.meshgrid(ax, ax)\ngaussian = jnp.exp(-(xx**2 + yy**2) / (2 * 1.0**2))\ngaussian = gaussian / gaussian.sum()\n\n# Apply filters\ngx = conv2d(img, sobel_x)\ngy = conv2d(img, sobel_y)\nedges = jnp.sqrt(gx**2 + gy**2)\nblurred = conv2d(img, gaussian)\n\nfig, axes = plt.subplots(1, 4, figsize=(16, 4))\nfor ax, data, title in zip(axes,\n    [img, edges, blurred, gx],\n    ['Original', 'Edge Magnitude', 'Gaussian Blur', 'Horizontal Gradient']):\n    ax.imshow(data, cmap='gray')\n    ax.set_title(title); ax.axis('off')\nplt.tight_layout(); plt.show()\n</code></pre></p> </li> <li> <p>\u4ece\u5934\u5b9e\u73b0\u76f4\u65b9\u56fe\u5747\u8861\u5316\uff0c\u5e76\u5c06\u5176\u5e94\u7528\u4e8e\u4f4e\u5bf9\u6bd4\u5ea6\u7070\u5ea6\u56fe\u50cf\u3002\u6bd4\u8f83\u5747\u8861\u524d\u540e\u7684\u76f4\u65b9\u56fe\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# Create a low-contrast image (values clustered in a narrow range)\nkey = __import__('jax').random.PRNGKey(42)\nimg = __import__('jax').random.uniform(key, (128, 128)) * 0.3 + 0.3  # values in [0.3, 0.6]\n\ndef histogram_equalise(img, n_bins=256):\n    \"\"\"Histogram equalisation for a grayscale image.\"\"\"\n    # Quantise to bins\n    bins = jnp.linspace(0, 1, n_bins + 1)\n    hist = jnp.histogram(img, bins=bins)[0]\n\n    # Compute CDF\n    cdf = jnp.cumsum(hist)\n    cdf_normalised = (cdf - cdf.min()) / (cdf.max() - cdf.min())\n\n    # Map each pixel through the CDF\n    indices = jnp.clip((img * n_bins).astype(jnp.int32), 0, n_bins - 1)\n    equalised = cdf_normalised[indices]\n    return equalised\n\neq_img = histogram_equalise(img)\n\nfig, axes = plt.subplots(2, 2, figsize=(12, 10))\naxes[0, 0].imshow(img, cmap='gray', vmin=0, vmax=1)\naxes[0, 0].set_title('Original (Low Contrast)'); axes[0, 0].axis('off')\naxes[0, 1].imshow(eq_img, cmap='gray', vmin=0, vmax=1)\naxes[0, 1].set_title('After Histogram Equalisation'); axes[0, 1].axis('off')\n\naxes[1, 0].hist(img.ravel(), bins=64, color='#3498db', alpha=0.8)\naxes[1, 0].set_title('Histogram Before'); axes[1, 0].set_xlim(0, 1)\naxes[1, 1].hist(eq_img.ravel(), bins=64, color='#e74c3c', alpha=0.8)\naxes[1, 1].set_title('Histogram After'); axes[1, 1].set_xlim(0, 1)\n\nplt.tight_layout(); plt.show()\n</code></pre></p> </li> <li> <p>\u4ece\u5934\u5b9e\u73b0 Harris \u89d2\u70b9\u68c0\u6d4b\u5668\u3002\u5728\u7b80\u5355\u56fe\u50cf\u4e2d\u68c0\u6d4b\u89d2\u70b9\u5e76\u53ef\u89c6\u5316\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef harris_corners(img, k=0.05, threshold=0.01):\n    \"\"\"Harris corner detection from scratch.\"\"\"\n    # Compute gradients with Sobel\n    sobel_x = jnp.array([[-1, 0, 1], [-2, 0, 2], [-1, 0, 1]], dtype=jnp.float32)\n    sobel_y = jnp.array([[-1, -2, -1], [0, 0, 0], [1, 2, 1]], dtype=jnp.float32)\n\n    # Pad image for valid convolution to preserve size\n    img_pad = jnp.pad(img, 1, mode='edge')\n    H, W = img.shape\n\n    Ix = jnp.zeros_like(img)\n    Iy = jnp.zeros_like(img)\n    for i in range(H):\n        for j in range(W):\n            patch = img_pad[i:i+3, j:j+3]\n            Ix = Ix.at[i, j].set(jnp.sum(patch * sobel_x))\n            Iy = Iy.at[i, j].set(jnp.sum(patch * sobel_y))\n\n    # Structure tensor components\n    Ixx = Ix * Ix\n    Iyy = Iy * Iy\n    Ixy = Ix * Iy\n\n    # Gaussian smoothing of structure tensor (approximate with window sum)\n    w = 3  # window half-size\n    R = jnp.zeros_like(img)\n    pad_xx = jnp.pad(Ixx, w, mode='constant')\n    pad_yy = jnp.pad(Iyy, w, mode='constant')\n    pad_xy = jnp.pad(Ixy, w, mode='constant')\n\n    for i in range(H):\n        for j in range(W):\n            sxx = jnp.sum(pad_xx[i:i+2*w+1, j:j+2*w+1])\n            syy = jnp.sum(pad_yy[i:i+2*w+1, j:j+2*w+1])\n            sxy = jnp.sum(pad_xy[i:i+2*w+1, j:j+2*w+1])\n            det = sxx * syy - sxy * sxy\n            trace = sxx + syy\n            R = R.at[i, j].set(det - k * trace * trace)\n\n    # Threshold\n    corners = R &gt; threshold * R.max()\n    return R, corners\n\n# Test image: checkerboard pattern (lots of corners)\nblock = 16\nn = 4\nchecker = jnp.zeros((block * n, block * n))\nfor i in range(n):\n    for j in range(n):\n        if (i + j) % 2 == 0:\n            checker = checker.at[i*block:(i+1)*block, j*block:(j+1)*block].set(1.0)\n\nR, corners = harris_corners(checker)\ncy, cx = jnp.where(corners)\n\nfig, axes = plt.subplots(1, 3, figsize=(14, 4))\naxes[0].imshow(checker, cmap='gray')\naxes[0].set_title('Checkerboard'); axes[0].axis('off')\naxes[1].imshow(R, cmap='hot')\naxes[1].set_title('Harris Response'); axes[1].axis('off')\naxes[2].imshow(checker, cmap='gray')\naxes[2].scatter(cx, cy, c='#e74c3c', s=15, marker='x')\naxes[2].set_title(f'Detected Corners ({len(cx)})'); axes[2].axis('off')\nplt.tight_layout(); plt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2008%3A%20computer%20vision/02.%20convolutional%20networks/","title":"\u5377\u79ef\u7f51\u7edc","text":"<p>\u5377\u79ef\u795e\u7ecf\u7f51\u7edc\u76f4\u63a5\u4ece\u50cf\u7d20\u6570\u636e\u4e2d\u5b66\u4e60\u7a7a\u95f4\u7279\u5f81\u5c42\u7ea7\uff0c\u7528\u68af\u5ea6\u4f18\u5316\u7684\u6ee4\u6ce2\u5668\u53d6\u4ee3\u4eba\u5de5\u8bbe\u8ba1\u7684\u6ee4\u6ce2\u5668\u3002\u672c\u6587\u6db5\u76d6\u5377\u79ef\u673a\u5236\u3001\u6c60\u5316\u3001\u6b65\u957f\u3001\u7a7a\u6d1e\u5377\u79ef\u3001\u611f\u53d7\u91ce\uff0c\u4ee5\u53ca\u5b9a\u4e49\u4e86\u56fe\u50cf\u5206\u7c7b\u7684\u6807\u5fd7\u6027\u67b6\u6784\uff08LeNet\u3001AlexNet\u3001VGG\u3001ResNet\u3001Inception\u3001EfficientNet\uff09\u3002</p> <ul> <li> <p>\u5728\u6587\u4ef6 01 \u4e2d\uff0c\u6211\u4eec\u624b\u5de5\u8bbe\u8ba1\u4e86\u7528\u4e8e\u8fb9\u7f18\u68c0\u6d4b\u3001\u6a21\u7cca\u548c\u89d2\u70b9\u68c0\u6d4b\u7684\u6ee4\u6ce2\u5668\u3002\u4e00\u4e2a\u81ea\u7136\u800c\u7136\u7684\u95ee\u9898\u662f\uff1a\u6211\u4eec\u80fd\u5426\u4ece\u6570\u636e\u4e2d\u5b66\u4e60\u6700\u4f18\u7684\u6ee4\u6ce2\u5668\uff1f\u8fd9\u6b63\u662f\u5377\u79ef\u795e\u7ecf\u7f51\u7edc\uff08CNN\uff09\u6240\u505a\u7684\u3002</p> </li> <li> <p>CNN \u4e0d\u662f\u624b\u52a8\u9009\u62e9\u6ee4\u6ce2\u5668\u6743\u91cd\uff0c\u800c\u662f\u901a\u8fc7\u68af\u5ea6\u4e0b\u964d\uff08\u7b2c 06 \u7ae0\uff09\u5b66\u4e60\u5b83\u4eec\uff0c\u53d1\u73b0\u5bf9\u5f53\u524d\u4efb\u52a1\u76f4\u63a5\u6709\u7528\u7684\u7279\u5f81\u3002</p> </li> <li> <p>\u5728\u7b2c 06 \u7ae0\u4e2d\uff0c\u6211\u4eec\u4ecb\u7ecd\u4e86\u5377\u79ef\u64cd\u4f5c\u3001CNN \u57fa\u7840\u4ee5\u53ca\u6ee4\u6ce2\u5668\u5b66\u4e60\u7684\u601d\u60f3\u3002\u5728\u8fd9\u91cc\uff0c\u6211\u4eec\u6df1\u5165\u63a2\u8ba8\u4f7f CNN \u5728\u5341\u591a\u5e74\u6765\u6210\u4e3a\u8ba1\u7b97\u673a\u89c6\u89c9\u4e3b\u5bfc\u8303\u5f0f\u7684\u67b6\u6784\u521b\u65b0\u3002</p> </li> <li> <p>\u56de\u987e\u6838\u5fc3\u7684\u5377\u79ef\u64cd\u4f5c\uff1a\u4e00\u4e2a\u5927\u5c0f\u4e3a \\(k \\times k\\) \u7684\u6ee4\u6ce2\u5668 \\(K\\) \u5728\u8f93\u5165\u7279\u5f81\u56fe\u4e0a\u6ed1\u52a8\uff0c\u5728\u6bcf\u4e2a\u4f4d\u7f6e\u8ba1\u7b97\u70b9\u79ef\uff08\u7b2c 06 \u7ae0\uff09\u3002\u8f93\u51fa\u5927\u5c0f\u7531\u4e09\u4e2a\u8d85\u53c2\u6570\u63a7\u5236\uff1a</p> <ul> <li>\u6b65\u957f\uff1a\u6ee4\u6ce2\u5668\u5728\u4f4d\u7f6e\u4e4b\u95f4\u79fb\u52a8\u7684\u50cf\u7d20\u6570\u3002\u6b65\u957f 1 \u610f\u5473\u7740\u6ee4\u6ce2\u5668\u6bcf\u6b21\u79fb\u52a8\u4e00\u4e2a\u50cf\u7d20\u3002\u6b65\u957f 2 \u610f\u5473\u7740\u6bcf\u6b21\u79fb\u52a8\u4e24\u4e2a\u50cf\u7d20\uff0c\u7a7a\u95f4\u7ef4\u5ea6\u51cf\u534a\u3002\u6b65\u957f\u5377\u79ef\u662f\u4e0b\u91c7\u6837\u65f6\u6c60\u5316\u7684\u4e00\u79cd\u66ff\u4ee3\u65b9\u6848\u3002</li> <li>\u586b\u5145\uff1a\u5728\u8f93\u5165\u8fb9\u754c\u5468\u56f4\u6dfb\u52a0\u96f6\u3002\"Same\"\u586b\u5145\uff08\\(p = \\lfloor k/2 \\rfloor\\)\uff09\u4fdd\u6301\u7a7a\u95f4\u7ef4\u5ea6\u4e0d\u53d8\u3002\"Valid\"\u586b\u5145\uff08\\(p = 0\\)\uff09\u4f1a\u51cf\u5c0f\u7a7a\u95f4\u7ef4\u5ea6\u3002</li> <li>\u7a7a\u6d1e\u5377\u79ef\uff1a\u5728\u6ee4\u6ce2\u5668\u5143\u7d20\u4e4b\u95f4\u63d2\u5165\u95f4\u9699\u3002\u4e00\u4e2a 3x3 \u7684\u6ee4\u6ce2\u5668\u4ee5\u7a7a\u6d1e\u7387 2 \u5de5\u4f5c\uff0c\u4ec5\u7528 9 \u4e2a\u53c2\u6570\u5c31\u8986\u76d6\u4e86 5x5 \u7684\u611f\u53d7\u91ce\u3002\u7a7a\u6d1e\u5377\u79ef\u6269\u5927\u4e86\u611f\u53d7\u91ce\u800c\u4e0d\u589e\u52a0\u8ba1\u7b97\u91cf\u3002</li> </ul> </li> <li> <p>\u5377\u79ef\u540e\u7684\u8f93\u51fa\u7a7a\u95f4\u5927\u5c0f\uff1a</p> </li> </ul> \\[\\text{out} = \\left\\lfloor \\frac{\\text{in} - k + 2p}{s} \\right\\rfloor + 1\\] <ul> <li> <p>\u5176\u4e2d \\(\\text{in}\\) \u662f\u8f93\u5165\u5927\u5c0f\uff0c\\(k\\) \u662f\u5377\u79ef\u6838\u5927\u5c0f\uff0c\\(p\\) \u662f\u586b\u5145\uff0c\\(s\\) \u662f\u6b65\u957f\u3002\u8be5\u516c\u5f0f\u72ec\u7acb\u5730\u9002\u7528\u4e8e\u9ad8\u5ea6\u548c\u5bbd\u5ea6\u3002</p> </li> <li> <p>\u611f\u53d7\u91ce\u662f\u6307\u80fd\u591f\u5f71\u54cd\u67d0\u4e2a\u795e\u7ecf\u5143\u503c\u7684\u539f\u59cb\u8f93\u5165\u533a\u57df\u3002</p> <ul> <li>\u65e9\u671f\u5c42\u7684\u611f\u53d7\u91ce\u8f83\u5c0f\uff08\u5b83\u4eec\u770b\u5230\u7684\u662f\u8fb9\u7f18\u7b49\u5c40\u90e8\u6a21\u5f0f\uff09\u3002</li> <li>\u66f4\u6df1\u5c42\u7684\u611f\u53d7\u91ce\u8f83\u5927\uff08\u5b83\u4eec\u770b\u5230\u7684\u662f\u7269\u4f53\u90e8\u4ef6\u7b49\u66f4\u5927\u7684\u7ed3\u6784\uff09\u3002</li> </ul> </li> <li> <p>\u611f\u53d7\u91ce\u968f\u7740\u6bcf\u4e00\u5c42\u589e\u957f\uff1a\u5927\u81f4\u6bcf\u5c42\u5377\u79ef\u589e\u52a0 \\(k - 1\\) \u4e2a\u50cf\u7d20\uff08\u52a0\u5165\u6b65\u957f\u6216\u7a7a\u6d1e\u5377\u79ef\u65f6\u589e\u957f\u66f4\u591a\uff09\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u6c60\u5316\u5c42\u5728\u4fdd\u7559\u6700\u91cd\u8981\u4fe1\u606f\u7684\u540c\u65f6\u964d\u4f4e\u7a7a\u95f4\u7ef4\u5ea6\u3002</p> <ul> <li>\u6700\u5927\u6c60\u5316\u53d6\u6bcf\u4e2a\u7a97\u53e3\u4e2d\u7684\u6700\u5927\u503c\uff0c\u4fdd\u7559\u6700\u5f3a\u7684\u6fc0\u6d3b\uff08\u6700\u7a81\u51fa\u7684\u7279\u5f81\uff09\u3002</li> <li>\u5e73\u5747\u6c60\u5316\u53d6\u5747\u503c\uff0c\u5e73\u6ed1\u7279\u5f81\u56fe\u3002\u4e00\u4e2a 2x2 \u7684\u6c60\u5316\u7a97\u53e3\u914d\u5408\u6b65\u957f 2 \u4f1a\u4f7f\u4e24\u4e2a\u7a7a\u95f4\u7ef4\u5ea6\u90fd\u51cf\u534a\u3002</li> </ul> </li> <li> <p>\u5168\u5c40\u5e73\u5747\u6c60\u5316\uff08GAP\uff09 \u5c06\u6bcf\u4e2a\u901a\u9053\u7684\u6574\u4e2a\u7a7a\u95f4\u8303\u56f4\u5e73\u5747\u4e3a\u5355\u4e2a\u6570\u503c\uff0c\u751f\u6210\u4e00\u4e2a\u957f\u5ea6\u7b49\u4e8e\u901a\u9053\u6570\u7684\u5411\u91cf\u3002GAP \u53d6\u4ee3\u4e86\u8bb8\u591a\u73b0\u4ee3\u67b6\u6784\u672b\u5c3e\u7684\u5168\u8fde\u63a5\u5c42\uff0c\u5927\u5e45\u51cf\u5c11\u4e86\u53c2\u6570\u91cf\uff0c\u5e76\u8d77\u5230\u4e86\u7ed3\u6784\u6b63\u5219\u5316\u7684\u4f5c\u7528\u3002</p> </li> <li> <p>\u6279\u5f52\u4e00\u5316\uff08BatchNorm\uff09 \u5c06\u6bcf\u4e2a\u5c0f\u6279\u91cf\u5185\u7684\u6fc0\u6d3b\u503c\u5f52\u4e00\u5316\u4e3a\u96f6\u5747\u503c\u548c\u5355\u4f4d\u65b9\u5dee\uff0c\u7136\u540e\u5e94\u7528\u53ef\u5b66\u4e60\u7684\u7f29\u653e\u548c\u5e73\u79fb\uff08\u7b2c 06 \u7ae0\uff09\u3002\u5728 CNN \u4e2d\uff0c\u6279\u5f52\u4e00\u5316\u6309\u901a\u9053\u5e94\u7528\uff1a\u7edf\u8ba1\u91cf\u5728\u8de8\u6279\u6b21\u548c\u7a7a\u95f4\u7ef4\u5ea6\u4e0a\u4e3a\u6bcf\u4e2a\u901a\u9053\u72ec\u7acb\u8ba1\u7b97\u3002\u5b83\u7a33\u5b9a\u4e86\u8bad\u7ec3\uff0c\u5141\u8bb8\u4f7f\u7528\u66f4\u9ad8\u7684\u5b66\u4e60\u7387\uff0c\u5e76\u8d77\u5230\u8f7b\u5ea6\u6b63\u5219\u5316\u7684\u4f5c\u7528\u3002</p> </li> <li> <p>\u4e22\u5f03\u6cd5\uff08\u7b2c 06 \u7ae0\uff09\u5728\u8bad\u7ec3\u671f\u95f4\u968f\u673a\u5c06\u795e\u7ecf\u5143\u7f6e\u96f6\u3002</p> </li> <li> <p>\u5728 CNN \u4e2d\uff0c\u7a7a\u95f4\u4e22\u5f03\u6cd5\uff08Dropout2D\uff09 \u4e22\u5f03\u6574\u4e2a\u7279\u5f81\u56fe\u901a\u9053\u800c\u975e\u5355\u4e2a\u50cf\u7d20\uff0c\u8fd9\u66f4\u4e3a\u6709\u6548\uff0c\u56e0\u4e3a\u7279\u5f81\u56fe\u4e2d\u76f8\u90bb\u50cf\u7d20\u9ad8\u5ea6\u76f8\u5173\u3002</p> </li> <li> <p>\u6570\u636e\u589e\u5e7f\u901a\u8fc7\u5728\u8bad\u7ec3\u671f\u95f4\u5bf9\u6bcf\u5f20\u56fe\u50cf\u5e94\u7528\u968f\u673a\u53d8\u6362\u6765\u4eba\u4e3a\u5730\u6269\u5c55\u8bad\u7ec3\u96c6\uff1a\u6c34\u5e73\u7ffb\u8f6c\u3001\u968f\u673a\u88c1\u526a\u3001\u65cb\u8f6c\u3001\u989c\u8272\u6296\u52a8\uff08\u8c03\u6574\u4eae\u5ea6\u3001\u5bf9\u6bd4\u5ea6\u3001\u9971\u548c\u5ea6\u3001\u8272\u8c03\uff09\u4ee5\u53ca cutout\uff08\u906e\u6321\u968f\u673a\u77e9\u5f62\u533a\u57df\uff09\u3002\u7f51\u7edc\u4ee5\u591a\u79cd\u4e0d\u540c\u5f62\u5f0f\u770b\u5230\u6bcf\u5f20\u56fe\u50cf\uff0c\u8feb\u4f7f\u5176\u5b66\u4e60\u53d8\u6362\u4e0d\u53d8\u7684\u7279\u5f81\uff0c\u800c\u975e\u8bb0\u5fc6\u7279\u5b9a\u7684\u50cf\u7d20\u6a21\u5f0f\u3002</p> </li> <li> <p>\u9ad8\u7ea7\u589e\u5e7f\u7b56\u7565\u5305\u62ec Mixup\uff08\u6df7\u5408\u4e24\u5f20\u56fe\u50cf\u53ca\u5176\u6807\u7b7e\uff1a\\(\\tilde{x} = \\lambda x_i + (1-\\lambda) x_j\\)\uff0c\\(\\tilde{y} = \\lambda y_i + (1-\\lambda) y_j\\)\uff09\u3001CutMix\uff08\u5c06\u4e00\u5f20\u56fe\u50cf\u7684\u77e9\u5f62\u533a\u57df\u7c98\u8d34\u5230\u53e6\u4e00\u5f20\u56fe\u50cf\u4e0a\uff0c\u5e76\u6309\u9762\u79ef\u6bd4\u4f8b\u6df7\u5408\u6807\u7b7e\uff09\u4ee5\u53ca RandAugment\uff08\u4ece\u4e00\u4e2a\u56fa\u5b9a\u96c6\u5408\u4e2d\u968f\u673a\u91c7\u6837\u4e00\u7cfb\u5217\u589e\u5e7f\u64cd\u4f5c\uff0c\u4f7f\u7528\u5355\u4e00\u7684\u5f3a\u5ea6\u53c2\u6570\uff09\u3002</p> </li> <li> <p>CNN \u67b6\u6784\u7684\u5386\u53f2\u662f\u4e00\u4e2a\u9010\u6b65\u8d70\u5411\u66f4\u6df1\u3001\u66f4\u9ad8\u6548\u8bbe\u8ba1\u7684\u6545\u4e8b\uff0c\u6bcf\u4e00\u6b65\u90fd\u89e3\u51b3\u4e86\u9650\u5236\u524d\u4ee3\u67b6\u6784\u7684\u95ee\u9898\u3002</p> </li> <li> <p>LeNet-5\uff08LeCun \u7b49\u4eba\uff0c1998 \u5e74\uff09\u662f\u6700\u65e9\u7684 CNN\uff0c\u4e13\u4e3a\u624b\u5199\u6570\u5b57\u8bc6\u522b\u8bbe\u8ba1\u3002\u4e24\u4e2a\u5377\u79ef\u5c42\u540e\u63a5\u4e09\u4e2a\u5168\u8fde\u63a5\u5c42\uff0c\u4f7f\u7528\u5e73\u5747\u6c60\u5316\u548c tanh \u6fc0\u6d3b\u51fd\u6570\u3002\u5b83\u8bc1\u660e\u4e86\u5b66\u4e60\u5230\u7684\u6ee4\u6ce2\u5668\u4f18\u4e8e\u624b\u5de5\u8bbe\u8ba1\u7684\u7279\u5f81\uff0c\u4f46\u6309\u73b0\u4ee3\u6807\u51c6\u6765\u770b\u5f88\u5c0f\uff086 \u4e07\u4e2a\u53c2\u6570\uff09\u3002</p> </li> <li> <p>AlexNet\uff08Krizhevsky \u7b49\u4eba\uff0c2012 \u5e74\uff09\u4ee5\u5de8\u5927\u4f18\u52bf\u8d62\u5f97\u4e86 ImageNet \u7ade\u8d5b\uff0c\u5f15\u53d1\u4e86\u6df1\u5ea6\u5b66\u4e60\u9769\u547d\u3002\u5173\u952e\u521b\u65b0\uff1aReLU \u6fc0\u6d3b\u51fd\u6570\uff08\u53d6\u4ee3\u4e86\u5b58\u5728\u68af\u5ea6\u6d88\u5931\u95ee\u9898\u7684 tanh\uff09\u3001\u7528\u4e8e\u6b63\u5219\u5316\u7684\u4e22\u5f03\u6cd5\u3001\u6570\u636e\u589e\u5e7f\u4ee5\u53ca\u5728 GPU \u4e0a\u8bad\u7ec3\u3002\u4e94\u4e2a\u5377\u79ef\u5c42\uff0c\u4e09\u4e2a\u5168\u8fde\u63a5\u5c42\uff0c6000 \u4e07\u4e2a\u53c2\u6570\u3002</p> </li> <li> <p>VGG\uff08Simonyan \u548c Zisserman\uff0c2014 \u5e74\uff09\u8bc1\u660e\uff0c\u4ec5\u4f7f\u7528 3x3 \u6ee4\u6ce2\u5668\u5e76\u6df1\u5c42\u5806\u53e0\u6548\u679c\u4f18\u4e8e\u66f4\u5927\u7684\u6ee4\u6ce2\u5668\u3002\u4e24\u4e2a\u5806\u53e0\u7684 3x3 \u6ee4\u6ce2\u5668\u5177\u6709\u4e0e\u4e00\u4e2a 5x5 \u6ee4\u6ce2\u5668\u76f8\u540c\u7684\u611f\u53d7\u91ce\uff0c\u4f46\u53c2\u6570\u66f4\u5c11\uff08\\(2 \\times 3^2 = 18\\) \u5bf9\u6bd4 \\(5^2 = 25\\)\uff09\u4e14\u591a\u4e86\u4e00\u4e2a\u975e\u7ebf\u6027\u5c42\u3002VGG-16\uff0816 \u5c42\uff09\u548c VGG-19\uff0819 \u5c42\uff09\u81f3\u4eca\u4ecd\u88ab\u5e7f\u6cdb\u7528\u4f5c\u7279\u5f81\u63d0\u53d6\u5668\u3002\u67b6\u6784\u975e\u5e38\u7b80\u5355\uff1a\u5377\u79ef\u5757\u901a\u9053\u6570\u9012\u589e\uff0864\u3001128\u3001256\u3001512\uff09\uff0c\u6bcf\u4e2a\u5757\u540e\u63a5\u6700\u5927\u6c60\u5316\u3002</p> </li> </ul> <p></p> <ul> <li>GoogLeNet/Inception\uff08Szegedy \u7b49\u4eba\uff0c2014 \u5e74\uff09\u5f15\u5165\u4e86 Inception \u6a21\u5757\uff1a\u4e0d\u662f\u9009\u62e9\u5355\u4e00\u7684\u6ee4\u6ce2\u5668\u5927\u5c0f\uff0c\u800c\u662f\u5e76\u884c\u4f7f\u7528 1x1\u30013x3 \u548c 5x5 \u5377\u79ef\uff0c\u5c06\u5b83\u4eec\u7684\u8f93\u51fa\u62fc\u63a5\u8d77\u6765\uff0c\u8ba9\u7f51\u7edc\u51b3\u5b9a\u54ea\u4e2a\u5c3a\u5ea6\u6700\u6709\u7528\u30021x1 \u5377\u79ef\u5728\u8f83\u5927\u6ee4\u6ce2\u5668\u4e4b\u524d\u7528\u4f5c\u74f6\u9888\u4ee5\u51cf\u5c11\u8ba1\u7b97\u91cf\u3002GoogLeNet \u4ee5\u6bd4 VGG \u5c11 12 \u500d\u7684\u53c2\u6570\uff08680 \u4e07\u5bf9\u6bd4 1.38 \u4ebf\uff09\u5b9e\u73b0\u4e86\u66f4\u9ad8\u7684\u51c6\u786e\u7387\u3002</li> </ul> <p></p> <ul> <li> <p>Inception \u6a21\u5757\u540c\u65f6\u6355\u83b7\u591a\u4e2a\u5c3a\u5ea6\u7684\u7279\u5f81\u30021x1 \u6ee4\u6ce2\u5668\u6355\u83b7\u9010\u70b9\u6a21\u5f0f\uff0c3x3 \u6355\u83b7\u5c40\u90e8\u7eb9\u7406\uff0c5x5 \u6355\u83b7\u66f4\u5927\u7684\u7ed3\u6784\u3002\u62fc\u63a5\u5c06\u6240\u6709\u89c6\u89d2\u7ec4\u5408\u6210\u4e30\u5bcc\u7684\u8868\u793a\u3002</p> </li> <li> <p>ResNet\uff08He \u7b49\u4eba\uff0c2016 \u5e74\uff09\u89e3\u51b3\u4e86\u9000\u5316\u95ee\u9898\uff1a\u66f4\u6df1\u7684\u7f51\u7edc\u8868\u73b0\u53cd\u800c\u4e0d\u5982\u8f83\u6d45\u7684\u7f51\u7edc\uff0c\u8fd9\u4e0d\u662f\u56e0\u4e3a\u8fc7\u62df\u5408\uff0c\u800c\u662f\u56e0\u4e3a\u66f4\u6df1\u7684\u7f51\u7edc\u66f4\u96be\u4f18\u5316\u3002\u89e3\u51b3\u65b9\u6848\u662f\u8df3\u8dc3\u8fde\u63a5\uff08\u6b8b\u5dee\u8fde\u63a5\uff09\uff1a</p> </li> </ul> \\[\\text{output} = F(x) + x\\] <ul> <li>\u8be5\u5c42\u5b66\u4e60\u6b8b\u5dee \\(F(x) = \\text{output} - x\\)\u3002\u5982\u679c\u6700\u4f18\u53d8\u6362\u63a5\u8fd1\u6052\u7b49\u6620\u5c04\uff08\u8fd9\u5728\u6df1\u5c42\u7f51\u7edc\u4e2d\u5f88\u5e38\u89c1\uff09\uff0c\u5b66\u4e60\u4e00\u4e2a\u63a5\u8fd1\u96f6\u7684\u6b8b\u5dee\u6bd4\u5b66\u4e60\u5b8c\u6574\u7684\u6620\u5c04\u8981\u5bb9\u6613\u5f97\u591a\u3002\u8df3\u8dc3\u8fde\u63a5\u8fd8\u63d0\u4f9b\u4e86\u76f4\u63a5\u7684\u68af\u5ea6\u901a\u9053\uff0c\u51cf\u5c11\u4e86\u68af\u5ea6\u6d88\u5931\u95ee\u9898\u3002ResNet \u8bad\u7ec3\u4e86 152 \u5c42\u7684\u7f51\u7edc\uff0c\u8fdc\u8d85\u6b64\u524d\u4efb\u4f55\u67b6\u6784\u3002</li> </ul> <p></p> <ul> <li> <p>\u5f53\u8f93\u5165\u548c\u8f93\u51fa\u7ef4\u5ea6\u4e0d\u540c\u65f6\uff08\u7531\u4e8e\u6b65\u957f\u6216\u901a\u9053\u6570\u53d8\u5316\uff09\uff0c\u6295\u5f71\u6377\u5f84\u4f1a\u5e94\u7528\u4e00\u4e2a 1x1 \u5377\u79ef\u6765\u5339\u914d \\(x\\) \u7684\u7ef4\u5ea6\uff1a\\(\\text{output} = F(x) + W_s x\\)\u3002</p> </li> <li> <p>\u74f6\u9888\u5757\uff08\u7528\u4e8e ResNet-50 \u53ca\u66f4\u6df1\u7248\u672c\uff09\u4f7f\u7528\u4e09\u4e2a\u5377\u79ef\uff1a1x1 \u964d\u901a\u9053\uff0c3x3 \u8fdb\u884c\u7a7a\u95f4\u5904\u7406\uff0c1x1 \u518d\u5c06\u901a\u9053\u6570\u6062\u590d\u3002\u8fd9\u6bd4\u4e24\u4e2a 3x3 \u5377\u79ef\u8ba1\u7b97\u91cf\u66f4\u5c0f\uff0c\u5141\u8bb8\u6784\u5efa\u66f4\u6df1\u7684\u7f51\u7edc\u3002</p> </li> <li> <p>DenseNet\uff08Huang \u7b49\u4eba\uff0c2017 \u5e74\uff09\u5c06\u8df3\u8dc3\u8fde\u63a5\u7684\u601d\u60f3\u8fdb\u4e00\u6b65\u63a8\u8fdb\uff1a\u5728\u4e00\u4e2a\u5bc6\u96c6\u5757\u5185\uff0c\u6bcf\u4e00\u5c42\u90fd\u4e0e\u6240\u6709\u540e\u7eed\u5c42\u76f8\u8fde\u3002\u7b2c \\(l\\) \u5c42\u63a5\u6536\u524d\u9762\u6240\u6709\u5c42\u7684\u7279\u5f81\u56fe\u4f5c\u4e3a\u8f93\u5165\uff1a\\(x_l = H_l([x_0, x_1, \\ldots, x_{l-1}])\\)\uff0c\u5176\u4e2d \\([\\cdot]\\) \u8868\u793a\u6cbf\u901a\u9053\u7ef4\u5ea6\u7684\u62fc\u63a5\u3002\u8fd9\u4fc3\u8fdb\u4e86\u7279\u5f81\u590d\u7528\uff0c\u589e\u5f3a\u4e86\u68af\u5ea6\u6d41\u52a8\uff0c\u5e76\u51cf\u5c11\u4e86\u603b\u53c2\u6570\u91cf\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u9ad8\u6548\u67b6\u6784\u9762\u5411\u79fb\u52a8\u8bbe\u5907\u548c\u8fb9\u7f18\u786c\u4ef6\u4e0a\u7684\u90e8\u7f72\uff0c\u8fd9\u4e9b\u573a\u666f\u4e0b\u8ba1\u7b97\u3001\u5185\u5b58\u548c\u80fd\u8017\u90fd\u53d7\u5230\u9650\u5236\u3002</p> </li> <li> <p>MobileNet\uff08Howard \u7b49\u4eba\uff0c2017 \u5e74\uff09\u7528\u6df1\u5ea6\u53ef\u5206\u79bb\u5377\u79ef\u53d6\u4ee3\u4e86\u6807\u51c6\u5377\u79ef\uff0c\u5c06\u64cd\u4f5c\u5206\u89e3\u4e3a\u4e24\u4e2a\u6b65\u9aa4\uff1a</p> <ol> <li>\u6df1\u5ea6\u5377\u79ef\uff1a\u6bcf\u4e2a\u8f93\u5165\u901a\u9053\u5e94\u7528\u4e00\u4e2a\u72ec\u7acb\u7684 \\(k \\times k\\) \u6ee4\u6ce2\u5668\uff08\u4e0d\u8de8\u901a\u9053\u4ea4\u4e92\uff09</li> <li>\u9010\u70b9\u5377\u79ef\uff1a\u5e94\u7528 1x1 \u5377\u79ef\u6765\u7ec4\u5408\u8de8\u901a\u9053\u7684\u4fe1\u606f</li> </ol> </li> <li> <p>\u4e00\u4e2a\u6807\u51c6 \\(k \\times k\\) \u5377\u79ef\uff0c\u8f93\u5165\u901a\u9053\u6570\u4e3a \\(C_{\\text{in}}\\)\uff0c\u8f93\u51fa\u901a\u9053\u6570\u4e3a \\(C_{\\text{out}}\\)\uff0c\u6bcf\u4e2a\u7a7a\u95f4\u4f4d\u7f6e\u9700\u8981 \\(k^2 \\cdot C_{\\text{in}} \\cdot C_{\\text{out}}\\) \u6b21\u4e58\u6cd5\u3002\u6df1\u5ea6\u53ef\u5206\u79bb\u5377\u79ef\u9700\u8981 \\(k^2 \\cdot C_{\\text{in}} + C_{\\text{in}} \\cdot C_{\\text{out}}\\) \u6b21\uff0c\u51cf\u5c11\u4e86\u5927\u7ea6 \\(k^2\\) \u500d\u3002\u5bf9\u4e8e 3x3 \u6ee4\u6ce2\u5668\uff0c\u8fd9\u5927\u7ea6\u4fbf\u5b9c 9 \u500d\u3002</p> </li> </ul> <p></p> <ul> <li> <p>MobileNet-V2 \u5f15\u5165\u4e86\u9006\u6b8b\u5dee\u5757\uff1a\u5148\u7528 1x1 \u5377\u79ef\u6269\u5c55\u901a\u9053\uff0c\u5728\u6269\u5c55\u7a7a\u95f4\u4e2d\u5e94\u7528\u6df1\u5ea6\u5377\u79ef\uff0c\u518d\u7528 1x1 \u5377\u79ef\u6295\u5f71\u56de\u4f4e\u7ef4\u3002\u8df3\u8dc3\u8fde\u63a5\u653e\u7f6e\u5728\u7a84\uff08\u74f6\u9888\uff09\u5c42\u4e0a\uff0c\u4e0e ResNet \u7684\u6a21\u5f0f\u76f8\u53cd\u3002\u6269\u5c55\u7387\u901a\u5e38\u4e3a 6\u3002</p> </li> <li> <p>EfficientNet\uff08Tan \u548c Le\uff0c2019 \u5e74\uff09\u5f15\u5165\u4e86\u590d\u5408\u7f29\u653e\uff1a\u4e0d\u662f\u72ec\u7acb\u5730\u4ec5\u7f29\u653e\u6df1\u5ea6\u3001\u6216\u4ec5\u7f29\u653e\u5bbd\u5ea6\u3001\u6216\u4ec5\u7f29\u653e\u5206\u8fa8\u7387\uff0c\u800c\u662f\u4f7f\u7528\u56fa\u5b9a\u6bd4\u4f8b\u540c\u65f6\u7f29\u653e\u6240\u6709\u4e09\u4e2a\u7ef4\u5ea6\u3002\u7ed9\u5b9a\u7f29\u653e\u7cfb\u6570 \\(\\phi\\)\uff1a</p> </li> </ul> \\[\\text{depth}: d = \\alpha^\\phi, \\quad \\text{width}: w = \\beta^\\phi, \\quad \\text{resolution}: r = \\gamma^\\phi\\] <ul> <li>\u7ea6\u675f\u6761\u4ef6\u4e3a \\(\\alpha \\cdot \\beta^2 \\cdot \\gamma^2 \\approx 2\\)\uff08\u8fd9\u6837 \\(\\phi\\) \u6bcf\u589e\u52a0\u4e00\u4e2a\u5355\u4f4d\uff0c\u603b\u8ba1\u7b97\u91cf\u5927\u7ea6\u7ffb\u500d\uff09\u3002\u901a\u8fc7\u7f51\u683c\u641c\u7d22\u5f97\u5230\u57fa\u7ebf\u6bd4\u4f8b \\(\\alpha = 1.2\\)\uff0c\\(\\beta = 1.1\\)\uff0c\\(\\gamma = 1.15\\)\u3002EfficientNet-B0 \u5230 B7 \u9010\u6b65\u653e\u5927\uff0c\u4ee5\u8fdc\u5c11\u4e8e\u4e4b\u524d\u6a21\u578b\u7684\u53c2\u6570\u548c FLOPs \u8fbe\u5230\u4e86\u6700\u5148\u8fdb\u7684\u51c6\u786e\u7387\u3002</li> </ul> <p></p> <ul> <li> <p>ShuffleNet \u901a\u8fc7\u4f7f\u7528\u5206\u7ec4\u5377\u79ef\u540e\u63a5\u901a\u9053\u6df7\u6d17\u6765\u964d\u4f4e 1x1 \u5377\u79ef\uff08\u5728 MobileNet \u98ce\u683c\u7684\u67b6\u6784\u4e2d\u5360\u4e3b\u5bfc\uff09\u7684\u6210\u672c\u3002\u5206\u7ec4\u5377\u79ef\u5c06\u901a\u9053\u5206\u6210\u591a\u4e2a\u7ec4\uff0c\u5728\u6bcf\u4e2a\u7ec4\u5185\u72ec\u7acb\u8fdb\u884c\u5377\u79ef\uff0c\u4f46\u8fd9\u963b\u6b62\u4e86\u8de8\u7ec4\u7684\u4fe1\u606f\u6d41\u52a8\u3002\u6df7\u6d17\u64cd\u4f5c\u5728\u7ec4\u4e4b\u95f4\u91cd\u65b0\u6392\u5217\u901a\u9053\uff0c\u4ee5\u53ef\u5ffd\u7565\u4e0d\u8ba1\u7684\u6210\u672c\u6062\u590d\u4e86\u4fe1\u606f\u6df7\u5408\u3002</p> </li> <li> <p>\u8fc1\u79fb\u5b66\u4e60\u662f\u5c06\u5728\u4e00\u4e2a\u4efb\u52a1\u4e0a\u8bad\u7ec3\u597d\u7684\u6a21\u578b\u9002\u914d\u5230\u4e0d\u540c\u4efb\u52a1\u7684\u5b9e\u8df5\u3002\u5728\u8ba1\u7b97\u673a\u89c6\u89c9\u4e2d\uff0c\u8fd9\u51e0\u4e4e\u603b\u662f\u610f\u5473\u7740\u4ece\u4e00\u4e2a\u5728 ImageNet\uff08140 \u4e07\u5f20\u56fe\u50cf\uff0c1000 \u4e2a\u7c7b\u522b\uff09\u4e0a\u9884\u8bad\u7ec3\u7684\u6a21\u578b\u5f00\u59cb\uff0c\u9002\u914d\u5230\u7279\u5b9a\u9886\u57df\u7684\u6570\u636e\u96c6\uff08\u533b\u5b66\u56fe\u50cf\u3001\u536b\u661f\u56fe\u50cf\u3001\u5236\u9020\u7f3a\u9677\u68c0\u6d4b\uff09\u3002</p> </li> <li> <p>\u7279\u5f81\u63d0\u53d6\uff1a\u51bb\u7ed3\u6240\u6709\u5377\u79ef\u5c42\uff0c\u79fb\u9664\u6700\u7ec8\u7684\u5206\u7c7b\u5934\uff0c\u4ec5\u5728\u4e0a\u9762\u8bad\u7ec3\u4e00\u4e2a\u65b0\u7684\u5206\u7c7b\u5934\u3002\u51bb\u7ed3\u7684\u5c42\u5145\u5f53\u901a\u7528\u7279\u5f81\u63d0\u53d6\u5668\u3002\u5f53\u76ee\u6807\u57df\u4e0e ImageNet \u76f8\u4f3c\u4e14\u76ee\u6807\u6570\u636e\u96c6\u8f83\u5c0f\u65f6\uff0c\u8fd9\u79cd\u65b9\u6cd5\u6548\u679c\u5f88\u597d\u3002</p> </li> <li> <p>\u5fae\u8c03\uff1a\u89e3\u51bb\u90e8\u5206\u6216\u5168\u90e8\u5377\u79ef\u5c42\uff0c\u4ee5\u8f83\u5c0f\u7684\u5b66\u4e60\u7387\u8fdb\u884c\u8bad\u7ec3\u3002\u9884\u8bad\u7ec3\u7684\u6743\u91cd\u4f5c\u4e3a\u8d77\u70b9\u800c\u975e\u56fa\u5b9a\u7279\u5f81\u3002\u5fae\u8c03\u901a\u5e38\u5148\u89e3\u51bb\u540e\u9762\u7684\u5c42\uff08\u8fd9\u4e9b\u5c42\u6355\u83b7\u9ad8\u7ea7\u7684\u3001\u4efb\u52a1\u7279\u5b9a\u7684\u7279\u5f81\uff09\uff0c\u518d\u6839\u636e\u9700\u8981\u89e3\u51bb\u66f4\u65e9\u7684\u5c42\u3002</p> </li> <li> <p>\u8fc1\u79fb\u5b66\u4e60\u4e4b\u6240\u4ee5\u6709\u6548\uff0c\u662f\u56e0\u4e3a CNN \u7684\u65e9\u671f\u5c42\u5b66\u4e60\u901a\u7528\u7279\u5f81\uff08\u8fb9\u7f18\u3001\u7eb9\u7406\u3001\u989c\u8272\uff09\uff0c\u8fd9\u4e9b\u7279\u5f81\u5bf9\u5404\u79cd\u4efb\u52a1\u90fd\u6709\u7528\uff0c\u800c\u540e\u9762\u5c42\u5b66\u4e60\u4efb\u52a1\u7279\u5b9a\u7684\u7279\u5f81\u3002\u4e00\u4e2a\u7528\u4e8e\u5206\u7c7b\u52a8\u7269\u7684\u7f51\u7edc\uff0c\u5176\u8fb9\u7f18\u68c0\u6d4b\u5668\u5bf9\u5206\u7c7b\u5efa\u7b51\u7269\u4ecd\u7136\u6709\u7528\u3002</p> </li> <li> <p>\u53ef\u89c6\u5316 CNN \u53ef\u4ee5\u63ed\u793a\u7f51\u7edc\u5b66\u5230\u4e86\u4ec0\u4e48\uff0c\u5e76\u5e2e\u52a9\u8c03\u8bd5\u610f\u5916\u884c\u4e3a\u3002</p> </li> <li> <p>\u6fc0\u6d3b\u56fe\uff08\u7279\u5f81\u56fe\uff09\u5c55\u793a\u4e86\u7ed9\u5b9a\u8f93\u5165\u56fe\u50cf\u4e0b\u6bcf\u4e2a\u6ee4\u6ce2\u5668\u7684\u8f93\u51fa\u3002\u65e9\u671f\u5c42\u7684\u6fc0\u6d3b\u56fe\u770b\u8d77\u6765\u50cf\u8fb9\u7f18\u56fe\uff1b\u66f4\u6df1\u5c42\u7684\u6fc0\u6d3b\u56fe\u5219\u8d8a\u6765\u8d8a\u62bd\u8c61\uff0c\u7a7a\u95f4\u4e0a\u8d8a\u6765\u8d8a\u7c97\u7cd9\u3002</p> </li> <li> <p>Grad-CAM\uff08\u68af\u5ea6\u52a0\u6743\u7c7b\u522b\u6fc0\u6d3b\u6620\u5c04\uff0cSelvaraju \u7b49\u4eba\uff0c2017 \u5e74\uff09\u9ad8\u4eae\u4e86\u8f93\u5165\u56fe\u50cf\u4e2d\u5bf9\u6a21\u578b\u9884\u6d4b\u6700\u91cd\u8981\u7684\u533a\u57df\u3002\u5176\u5de5\u4f5c\u539f\u7406\u662f\uff1a</p> <ol> <li>\u8ba1\u7b97\u76ee\u6807\u7c7b\u522b\u5206\u6570\u76f8\u5bf9\u4e8e\u6700\u540e\u4e00\u4e2a\u5377\u79ef\u5c42\u7279\u5f81\u56fe\u7684\u68af\u5ea6\uff08\u4f7f\u7528\u7b2c 03 \u7ae0\u7684\u94fe\u5f0f\u6cd5\u5219\uff09</li> <li>\u5bf9\u8fd9\u4e9b\u68af\u5ea6\u8fdb\u884c\u5168\u5c40\u5e73\u5747\u6c60\u5316\uff0c\u5f97\u5230\u6bcf\u4e2a\u901a\u9053\u7684\u91cd\u8981\u6027\u6743\u91cd</li> <li>\u8ba1\u7b97\u7279\u5f81\u56fe\u7684\u52a0\u6743\u7ec4\u5408\u5e76\u5e94\u7528 ReLU</li> </ol> </li> </ul> \\[L_{\\text{Grad-CAM}} = \\text{ReLU}\\!\\left(\\sum_k \\alpha_k A^k\\right), \\quad \\alpha_k = \\frac{1}{Z} \\sum_i \\sum_j \\frac{\\partial y^c}{\\partial A^k_{ij}}\\] <ul> <li>\u5176\u4e2d \\(A^k\\) \u662f\u7b2c \\(k\\) \u4e2a\u7279\u5f81\u56fe\uff0c\\(\\alpha_k\\) \u662f\u901a\u9053 \\(k\\) \u7684\u91cd\u8981\u6027\u6743\u91cd\uff0c\\(y^c\\) \u662f\u7c7b\u522b \\(c\\) \u7684\u5206\u6570\u3002\u7ed3\u679c\u662f\u4e00\u4e2a\u7c97\u7cd9\u7684\u70ed\u529b\u56fe\uff0c\u663e\u793a\u54ea\u4e9b\u533a\u57df\u9a71\u52a8\u4e86\u5206\u7c7b\u3002\u5e94\u7528 ReLU \u662f\u56e0\u4e3a\u6211\u4eec\u53ea\u5bf9\u5177\u6709\u6b63\u5f71\u54cd\u5206\u7c7b\u7684\u7279\u5f81\u611f\u5174\u8da3\u3002</li> </ul> <p></p> <ul> <li> <p>\u7279\u5f81\u53cd\u6f14\u901a\u8fc7\u4f18\u5316\u4e00\u5f20\u968f\u673a\u56fe\u50cf\u4f7f\u5176\u5339\u914d\u76ee\u6807\u7279\u5f81\uff08\u5bf9\u50cf\u7d20\u503c\u8fdb\u884c\u68af\u5ea6\u4e0b\u964d\uff09\uff0c\u4ece\u7279\u5f81\u8868\u793a\u4e2d\u91cd\u5efa\u8f93\u5165\u56fe\u50cf\u3002\u8fd9\u63ed\u793a\u4e86\u7f51\u7edc\u5728\u5404\u5c42\u4fdd\u7559\u4e86\u54ea\u4e9b\u4fe1\u606f\u3002\u6d45\u5c42\u51e0\u4e4e\u80fd\u5b8c\u7f8e\u91cd\u5efa\u56fe\u50cf\uff1b\u6df1\u5c42\u4ea7\u751f\u7684\u56fe\u50cf\u53ef\u8bc6\u522b\u4f46\u6709\u6240\u626d\u66f2\uff0c\u8fd9\u8868\u660e\u7cbe\u7ec6\u7684\u7a7a\u95f4\u7ec6\u8282\u4e22\u5931\u4e86\uff0c\u800c\u8bed\u4e49\u5185\u5bb9\u5f97\u4ee5\u4fdd\u7559\u3002</p> </li> <li> <p>Deep Dream \u548c\u795e\u7ecf\u98ce\u683c\u8fc1\u79fb\u662f\u7279\u5f81\u53ef\u89c6\u5316\u7684\u521b\u610f\u5e94\u7528\u3002Deep Dream \u6700\u5927\u5316\u9009\u5b9a\u5c42\u4e2d\u795e\u7ecf\u5143\u7684\u6fc0\u6d3b\uff0c\u4ea7\u751f\u8d85\u73b0\u5b9e\u7684\u3001\u653e\u5927\u6a21\u5f0f\u7684\u56fe\u50cf\u3002\u795e\u7ecf\u98ce\u683c\u8fc1\u79fb\u4f18\u5316\u76ee\u6807\u56fe\u50cf\uff0c\u4f7f\u5176\u540c\u65f6\u5339\u914d\u4e00\u5f20\u56fe\u50cf\u7684\u5185\u5bb9\u7279\u5f81\uff08\u6765\u81ea\u6df1\u5c42\uff09\u548c\u53e6\u4e00\u5f20\u56fe\u50cf\u7684\u98ce\u683c\u7279\u5f81\uff08\u6ee4\u6ce2\u5668\u6fc0\u6d3b\u7684 Gram \u77e9\u9635\uff0c\u6355\u83b7\u7eb9\u7406\u7edf\u8ba1\u4fe1\u606f\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2008%3A%20computer%20vision/02.%20convolutional%20networks/#colab-notebook","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ol> <li> <p>\u7528 JAX \u4ece\u5934\u5b9e\u73b0\u4e00\u4e2a\u7b80\u5355\u7684 CNN\uff0c\u5305\u542b\u4e24\u4e2a\u5377\u79ef\u5c42\u3001\u6700\u5927\u6c60\u5316\u548c\u4e00\u4e2a\u5206\u7c7b\u5934\u3002\u5728\u4e00\u4e2a\u5408\u6210\u7684\u4e8c\u7ef4\u6a21\u5f0f\u5206\u7c7b\u4efb\u52a1\u4e0a\u8bad\u7ec3\u5b83\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport jax.lax as lax\nimport matplotlib.pyplot as plt\n\ndef conv2d(x, kernel, stride=1):\n    \"\"\"\u7b80\u5355 2D \u5377\u79ef\uff0c\u5355\u8f93\u5165\uff0c\u5355\u6ee4\u6ce2\u5668\u3002\"\"\"\n    return lax.conv(x[None, None], kernel[None, None], (stride, stride), 'SAME')[0, 0]\n\ndef max_pool(x, size=2):\n    \"\"\"2x2 \u6700\u5927\u6c60\u5316\u3002\"\"\"\n    H, W = x.shape\n    x = x[:H//size*size, :W//size*size]\n    return x.reshape(H//size, size, W//size, size).max(axis=(1, 3))\n\ndef init_cnn(key):\n    k1, k2, k3 = jax.random.split(key, 3)\n    return {\n        'conv1': jax.random.normal(k1, (5, 5)) * 0.3,\n        'conv2': jax.random.normal(k2, (3, 3)) * 0.3,\n        'fc_w': jax.random.normal(k3, (64, 1)) * 0.1,\n        'fc_b': jnp.zeros(1),\n    }\n\ndef forward_cnn(params, img):\n    # Conv1 -&gt; ReLU -&gt; Pool\n    h = jnp.maximum(0, conv2d(img, params['conv1']))\n    h = max_pool(h)\n    # Conv2 -&gt; ReLU -&gt; Pool\n    h = jnp.maximum(0, conv2d(h, params['conv2']))\n    h = max_pool(h)\n    # Flatten and classify\n    flat = h.ravel()\n    # Pad or truncate to fixed size\n    flat = jnp.pad(flat, (0, max(0, 64 - len(flat))))[:64]\n    logit = (flat @ params['fc_w'] + params['fc_b']).squeeze()\n    return jax.nn.sigmoid(logit)\n\n# Generate synthetic data: class 0 = low-freq pattern, class 1 = high-freq\ndef make_data(key, n=200):\n    images, labels = [], []\n    for i in range(n):\n        k1, key = jax.random.split(key)\n        x, y = jnp.meshgrid(jnp.linspace(0, 4*jnp.pi, 32), jnp.linspace(0, 4*jnp.pi, 32))\n        if i &lt; n // 2:\n            img = jnp.sin(x) + jax.random.normal(k1, (32, 32)) * 0.1\n            labels.append(0)\n        else:\n            img = jnp.sin(4 * x) * jnp.sin(4 * y) + jax.random.normal(k1, (32, 32)) * 0.1\n            labels.append(1)\n        images.append(img)\n    return images, jnp.array(labels, dtype=jnp.float32)\n\nkey = jax.random.PRNGKey(42)\nimages, labels = make_data(key)\nparams = init_cnn(jax.random.PRNGKey(0))\n\ndef loss_fn(params, img, label):\n    pred = forward_cnn(params, img)\n    return -(label * jnp.log(pred + 1e-7) + (1 - label) * jnp.log(1 - pred + 1e-7))\n\ngrad_fn = jax.grad(loss_fn)\nlr = 0.01\n\nfor epoch in range(5):\n    total_loss = 0.0\n    for img, label in zip(images, labels):\n        grads = grad_fn(params, img, label)\n        params = {k: params[k] - lr * grads[k] for k in params}\n        total_loss += loss_fn(params, img, label)\n    print(f\"Epoch {epoch}: loss = {total_loss / len(images):.4f}\")\n\n# Test accuracy\npreds = jnp.array([forward_cnn(params, img) &gt; 0.5 for img in images])\nacc = jnp.mean(preds == labels)\nprint(f\"Accuracy: {acc:.2%}\")\n</code></pre></p> </li> <li> <p>\u53ef\u89c6\u5316\u4e0d\u540c\u6ee4\u6ce2\u5668\u5927\u5c0f\u5982\u4f55\u5f71\u54cd\u611f\u53d7\u91ce\u3002\u5c55\u793a\u4e24\u4e2a\u5806\u53e0\u7684 3x3 \u6ee4\u6ce2\u5668\u4e0e\u4e00\u4e2a 5x5 \u6ee4\u6ce2\u5668\u8986\u76d6\u76f8\u540c\u7684\u611f\u53d7\u91ce\uff0c\u4f46\u53c2\u6570\u66f4\u5c11\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef compute_receptive_field(layers):\n    \"\"\"\u4ece\u4e00\u7ec4 (kernel_size, stride) \u5143\u7ec4\u8ba1\u7b97\u611f\u53d7\u91ce\u5927\u5c0f\u3002\"\"\"\n    rf = 1  # \u4ece 1 \u4e2a\u50cf\u7d20\u5f00\u59cb\n    stride_product = 1\n    for k, s in layers:\n        rf += (k - 1) * stride_product\n        stride_product *= s\n    return rf\n\n# Compare architectures\nconfigs = {\n    'Single 5x5': [(5, 1)],\n    'Two 3x3':    [(3, 1), (3, 1)],\n    'Three 3x3':  [(3, 1), (3, 1), (3, 1)],\n    'Single 7x7': [(7, 1)],\n    '3x3 stride 2 + 3x3': [(3, 2), (3, 1)],\n}\n\nprint(f\"{'Config':&lt;25} {'RF':&gt;4} {'Params (per channel)':&gt;20}\")\nprint('-' * 55)\nfor name, layers in configs.items():\n    rf = compute_receptive_field(layers)\n    # Parameters: sum of k^2 for each layer (per input-output channel pair)\n    params = sum(k * k for k, s in layers)\n    print(f\"{name:&lt;25} {rf:&gt;4} {params:&gt;20}\")\n\n# Visualise receptive fields\nfig, axes = plt.subplots(1, 3, figsize=(14, 4))\nfor ax, (name, rf_size) in zip(axes, [('5x5 filter', 5), ('Two 3x3 filters', 5), ('Three 3x3 filters', 7)]):\n    grid = jnp.zeros((9, 9))\n    c = 4  # centre\n    half = rf_size // 2\n    grid = grid.at[c-half:c+half+1, c-half:c+half+1].set(1.0)\n    ax.imshow(grid, cmap='Blues', vmin=0, vmax=1)\n    ax.set_title(f'{name}\\nRF = {rf_size}x{rf_size}')\n    ax.set_xticks(range(9)); ax.set_yticks(range(9))\n    ax.grid(True, alpha=0.3)\nplt.suptitle('Receptive Field Comparison')\nplt.tight_layout(); plt.show()\n</code></pre></p> </li> <li> <p>\u4ece\u5934\u5b9e\u73b0 Grad-CAM\u3002\u7ed9\u5b9a\u4e00\u4e2a\u9884\u6784\u5efa\u7684\u7b80\u5355 CNN\uff0c\u8ba1\u7b97\u9488\u5bf9\u7279\u5b9a\u7c7b\u522b\u7684\u68af\u5ea6\u52a0\u6743\u6fc0\u6d3b\u56fe\uff0c\u5e76\u5c06\u5176\u53ef\u89c6\u5316\u4e3a\u70ed\u529b\u56fe\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef simple_cnn(params, img):\n    \"\"\"\u8fd4\u56de\u9884\u6d4b\u548c\u6700\u540e\u4e00\u4e2a\u5377\u79ef\u5c42\u6fc0\u6d3b\u7684\u7b80\u5355 CNN\u3002\"\"\"\n    # Conv layer (our \"last conv layer\" for Grad-CAM)\n    H, W = img.shape\n    k = params['conv'].shape[0]\n    pad = k // 2\n    img_pad = jnp.pad(img, pad, mode='edge')\n    activation_map = jnp.zeros((H, W))\n    for i in range(H):\n        for j in range(W):\n            activation_map = activation_map.at[i, j].set(\n                jnp.sum(img_pad[i:i+k, j:j+k] * params['conv'])\n            )\n    activation_map = jnp.maximum(0, activation_map)  # ReLU\n\n    # Global average pool -&gt; dense -&gt; output\n    pooled = activation_map.mean()\n    logit = pooled * params['w'] + params['b']\n    return jax.nn.sigmoid(logit), activation_map\n\n# Create test image: bright region on the left (class indicator)\nimg = jnp.zeros((32, 32))\nimg = img.at[8:24, 4:16].set(1.0)\nimg = img.at[5:10, 20:28].set(0.3)\n\nkey = jax.random.PRNGKey(42)\nparams = {\n    'conv': jax.random.normal(key, (5, 5)) * 0.3,\n    'w': jnp.array(2.0),\n    'b': jnp.array(-0.5),\n}\n\n# Compute Grad-CAM\ndef class_score(params, img):\n    pred, _ = simple_cnn(params, img)\n    return pred\n\n# Get activation map and gradients\npred, act_map = simple_cnn(params, img)\ngrad_fn = jax.grad(lambda img: simple_cnn(params, img)[0])\nimg_grad = grad_fn(img)\n\n# Weight = global average of gradients (simplified 1-channel Grad-CAM)\nalpha = img_grad.mean()\ngrad_cam = jnp.maximum(0, alpha * act_map)  # ReLU\ngrad_cam = (grad_cam - grad_cam.min()) / (grad_cam.max() - grad_cam.min() + 1e-8)\n\nfig, axes = plt.subplots(1, 3, figsize=(14, 4))\naxes[0].imshow(img, cmap='gray'); axes[0].set_title('Input Image'); axes[0].axis('off')\naxes[1].imshow(act_map, cmap='viridis'); axes[1].set_title('Activation Map'); axes[1].axis('off')\naxes[2].imshow(img, cmap='gray', alpha=0.6)\naxes[2].imshow(grad_cam, cmap='jet', alpha=0.4)\naxes[2].set_title(f'Grad-CAM (pred={pred:.2f})'); axes[2].axis('off')\nplt.tight_layout(); plt.show()\n</code></pre></p> </li> <li> <p>\u6bd4\u8f83\u6df1\u5ea6\u53ef\u5206\u79bb\u5377\u79ef\u4e0e\u6807\u51c6\u5377\u79ef\u3002\u7edf\u8ba1\u4e24\u8005\u7684\u53c2\u6570\u548c FLOPs\uff0c\u5e76\u5c55\u793a\u5b83\u4eec\u5728\u8ba1\u7b97\u91cf\u5c11\u5f97\u591a\u7684\u60c5\u51b5\u4e0b\u4ea7\u751f\u76f8\u4f3c\u7684\u8f93\u51fa\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\ndef standard_conv(x, kernel):\n    \"\"\"\u6807\u51c6\u5377\u79ef\uff1a(H, W, C_in) * (k, k, C_in, C_out) -&gt; (H, W, C_out)\u3002\"\"\"\n    H, W, C_in = x.shape\n    k, _, _, C_out = kernel.shape\n    pad = k // 2\n    x_pad = jnp.pad(x, ((pad, pad), (pad, pad), (0, 0)), mode='constant')\n    out = jnp.zeros((H, W, C_out))\n    for i in range(H):\n        for j in range(W):\n            patch = x_pad[i:i+k, j:j+k, :]  # (k, k, C_in)\n            for c in range(C_out):\n                out = out.at[i, j, c].set(jnp.sum(patch * kernel[:, :, :, c]))\n    return out\n\ndef depthwise_separable_conv(x, dw_kernel, pw_kernel):\n    \"\"\"\u6df1\u5ea6\u53ef\u5206\u79bb\uff1a\u6df1\u5ea6\u5377\u79ef (k,k,C_in) \u7136\u540e\u9010\u70b9\u5377\u79ef (C_in, C_out)\u3002\"\"\"\n    H, W, C_in = x.shape\n    k = dw_kernel.shape[0]\n    pad = k // 2\n    x_pad = jnp.pad(x, ((pad, pad), (pad, pad), (0, 0)), mode='constant')\n\n    # Depthwise: one filter per channel\n    dw_out = jnp.zeros((H, W, C_in))\n    for i in range(H):\n        for j in range(W):\n            for c in range(C_in):\n                patch = x_pad[i:i+k, j:j+k, c]\n                dw_out = dw_out.at[i, j, c].set(jnp.sum(patch * dw_kernel[:, :, c]))\n\n    # Pointwise: 1x1 conv across channels\n    out = dw_out @ pw_kernel\n    return out\n\n# Setup\nH, W, C_in, C_out, k = 8, 8, 16, 32, 3\nkey = jax.random.PRNGKey(42)\nk1, k2, k3, k4 = jax.random.split(key, 4)\n\nx = jax.random.normal(k1, (H, W, C_in))\nstd_kernel = jax.random.normal(k2, (k, k, C_in, C_out)) * 0.1\ndw_kernel = jax.random.normal(k3, (k, k, C_in)) * 0.1\npw_kernel = jax.random.normal(k4, (C_in, C_out)) * 0.1\n\n# Compare\nstd_params = k * k * C_in * C_out\ndw_params = k * k * C_in + C_in * C_out\n\nstd_flops = H * W * k * k * C_in * C_out\ndw_flops = H * W * (k * k * C_in + C_in * C_out)\n\nprint(f\"Standard conv:            {std_params:&gt;8,} params,  {std_flops:&gt;10,} FLOPs\")\nprint(f\"Depthwise separable conv: {dw_params:&gt;8,} params,  {dw_flops:&gt;10,} FLOPs\")\nprint(f\"Parameter reduction:      {std_params / dw_params:.1f}x\")\nprint(f\"FLOP reduction:           {std_flops / dw_flops:.1f}x\")\n\nstd_out = standard_conv(x, std_kernel)\nds_out = depthwise_separable_conv(x, dw_kernel, pw_kernel)\nprint(f\"\\nStandard output shape:    {std_out.shape}\")\nprint(f\"Depthwise sep output shape: {ds_out.shape}\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2008%3A%20computer%20vision/03.%20object%20detection%20and%20segmentation/","title":"\u76ee\u6807\u68c0\u6d4b\u4e0e\u5206\u5272","text":"<p>\u76ee\u6807\u68c0\u6d4b\u5b9a\u4f4d\u5e76\u5206\u7c7b\u56fe\u50cf\u4e2d\u7684\u6bcf\u4e2a\u7269\u4f53\uff1b\u5206\u5272\u4e3a\u6bcf\u4e2a\u50cf\u7d20\u5206\u914d\u4e00\u4e2a\u6807\u7b7e\u3002\u672c\u6587\u4ef6\u6db5\u76d6\u4ea4\u5e76\u6bd4\uff08IoU\uff09\u3001\u5e73\u5747\u7cbe\u5ea6\u5747\u503c\uff08mAP\uff09\u3001\u951a\u6846\u3001R-CNN\u7cfb\u5217\u3001YOLO\u3001SSD\u3001\u7279\u5f81\u91d1\u5b57\u5854\u7f51\u7edc\uff08FPN\uff09\u3001\u8bed\u4e49/\u5b9e\u4f8b/\u5168\u666f\u5206\u5272\uff08U-Net\u3001Mask R-CNN\u3001SAM\uff09\u4ee5\u53ca\u7528\u4e8e\u57fa\u51c6\u6d4b\u8bd5\u7684\u8bc4\u4f30\u6307\u6807\u3002</p> <ul> <li> <p>\u56fe\u50cf\u5206\u7c7b\uff08\u6587\u4ef602\uff09\u56de\u7b54\u4e86\"\u8fd9\u5f20\u56fe\u50cf\u91cc\u6709\u4ec0\u4e48\uff1f\"\u76ee\u6807\u68c0\u6d4b\u63d0\u51fa\u4e86\u4e00\u4e2a\u66f4\u96be\u7684\u95ee\u9898\uff1a\"\u8fd9\u5f20\u56fe\u50cf\u91cc\u6709\u54ea\u4e9b\u7269\u4f53\uff0c\u5b83\u4eec\u5728\u54ea\u91cc\uff1f\"</p> </li> <li> <p>\u5206\u5272\u5219\u66f4\u8fdb\u4e00\u6b65\uff1a\"\u54ea\u4e9b\u50cf\u7d20\u5c5e\u4e8e\u54ea\u4e2a\u7269\u4f53\u6216\u7c7b\u522b\uff1f\"\u8fd9\u4e9b\u4efb\u52a1\u5f62\u6210\u4e86\u4e00\u4e2a\u7a7a\u95f4\u7406\u89e3\u7cbe\u5ea6\u9010\u6b65\u63d0\u9ad8\u7684\u5c42\u6b21\u7ed3\u6784\u3002</p> </li> <li> <p>\u76ee\u6807\u68c0\u6d4b\u6a21\u578b\u8f93\u51fa\u4e00\u7ec4\u8fb9\u754c\u6846\uff0c\u6bcf\u4e2a\u8fb9\u754c\u6846\u7531\u56db\u4e2a\u5750\u6807\uff08\u5de6\u4e0a\u89d2 \\(x, y\\)\u3001\u5bbd\u5ea6\u3001\u9ad8\u5ea6\uff09\u4ee5\u53ca\u4e00\u4e2a\u5e26\u6709\u7f6e\u4fe1\u5ea6\u5206\u6570\u7684\u7c7b\u522b\u6807\u7b7e\u5b9a\u4e49\u3002\u4e00\u5f20\u56fe\u50cf\u53ef\u80fd\u5305\u542b\u96f6\u4e2a\u3001\u4e00\u4e2a\u6216\u6570\u767e\u4e2a\u6765\u81ea\u591a\u4e2a\u7c7b\u522b\u7684\u7269\u4f53\u3002</p> </li> </ul> <p></p> <ul> <li>\u4ea4\u5e76\u6bd4\uff08IoU\uff09\u8861\u91cf\u9884\u6d4b\u8fb9\u754c\u6846\u4e0e\u771f\u5b9e\u6807\u6ce8\u7684\u5339\u914d\u7a0b\u5ea6\u3002\u5b83\u662f\u91cd\u53e0\u9762\u79ef\u9664\u4ee5\u5e76\u96c6\u9762\u79ef\uff1a</li> </ul> \\[\\text{IoU} = \\frac{\\text{\u4ea4\u96c6\u9762\u79ef}}{\\text{\u5e76\u96c6\u9762\u79ef}}\\] <ul> <li> <p>IoU\u4e3a1\u8868\u793a\u5b8c\u5168\u91cd\u53e0\uff0cIoU\u4e3a0\u8868\u793a\u5b8c\u5168\u4e0d\u91cd\u53e0\u3002\"\u6b63\u786e\"\u68c0\u6d4b\u7684\u6807\u51c6\u9608\u503c\u4e3aIoU \\(\\geq 0.5\\)\uff0c\u4f46\u4e5f\u4f7f\u7528\u66f4\u4e25\u683c\u7684\u9608\u503c\uff080.75\u30010.9\uff09\u3002</p> </li> <li> <p>\u5982\u679c\u9884\u6d4b\u6846\u4e0e\u771f\u5b9e\u6846\u7684IoU\u8d85\u8fc7\u9608\u503c\u4e14\u7c7b\u522b\u6b63\u786e\uff0c\u5219\u68c0\u6d4b\u7ed3\u679c\u4e3a\u771f\u6b63\u4f8b\uff08TP\uff09\u3002</p> </li> <li> <p>\u5047\u6b63\u4f8b\uff08FP\uff09\u662f\u672a\u5339\u914d\u5230\u4efb\u4f55\u771f\u5b9e\u6807\u6ce8\u7684\u9884\u6d4b\u6846\u3002</p> </li> <li> <p>\u5047\u8d1f\u4f8b\uff08FN\uff09\u662f\u6ca1\u6709\u4efb\u4f55\u9884\u6d4b\u6846\u5339\u914d\u5230\u7684\u771f\u5b9e\u7269\u4f53\u3002\u8fd9\u4e9b\u4e0e\u7b2c06\u7ae0\u4e2d\u7684\u7cbe\u786e\u7387\u548c\u53ec\u56de\u7387\u6982\u5ff5\u76f8\u540c\u3002</p> </li> <li> <p>\u5e73\u5747\u7cbe\u5ea6\uff08AP\uff09\u603b\u7ed3\u5355\u4e2a\u7c7b\u522b\u7684\u68c0\u6d4b\u8d28\u91cf\u3002\u5bf9\u4e8e\u6bcf\u4e2a\u7c7b\u522b\uff0c\u6309\u7f6e\u4fe1\u5ea6\u5206\u6570\u5bf9\u6240\u6709\u68c0\u6d4b\u7ed3\u679c\u6392\u5e8f\uff0c\u8ba1\u7b97\u6bcf\u4e2a\u6392\u5e8f\u4f4d\u7f6e\u7684\u7cbe\u786e\u7387\u548c\u53ec\u56de\u7387\uff0c\u7136\u540e\u8ba1\u7b97\u7cbe\u786e\u7387-\u53ec\u56de\u7387\u66f2\u7ebf\u4e0b\u7684\u9762\u79ef\uff1a</p> </li> </ul> \\[\\text{AP} = \\int_0^1 p(r) \\, dr\\] <ul> <li> <p>\u5728\u5b9e\u8df5\u4e2d\uff0c\u66f2\u7ebf\u662f\u63d2\u503c\u5904\u7406\u7684\uff1a\u5728\u6bcf\u4e2a\u53ec\u56de\u7387\u6c34\u5e73\u4e0a\uff0c\u7cbe\u786e\u7387\u88ab\u8bbe\u7f6e\u4e3a\u6240\u6709\u53ec\u56de\u7387 \\(\\geq r\\) \u5904\u7684\u6700\u5927\u7cbe\u786e\u7387\u3002\u8fd9\u4f7f\u66f2\u7ebf\u5e73\u6ed1\u5e76\u4f7f\u5176\u5355\u8c03\u9012\u51cf\u3002</p> </li> <li> <p>\u5e73\u5747\u7cbe\u5ea6\u5747\u503c\uff08mAP\uff09\u5bf9\u6240\u6709\u7c7b\u522b\u7684AP\u8fdb\u884c\u5e73\u5747\u3002\"mAP@0.5\"\u4f7f\u7528IoU\u9608\u503c0.5\u3002\"mAP@[.5:.95]\"\uff08COCO\u6807\u51c6\uff09\u5728\u4ece0.5\u52300.95\u7684\u5341\u4e2aIoU\u9608\u503c\u4e0a\uff08\u6b65\u957f0.05\uff09\u5bf9mAP\u8fdb\u884c\u5e73\u5747\uff0c\u540c\u65f6\u5956\u52b1\u68c0\u6d4b\u80fd\u529b\u548c\u7cbe\u786e\u7684\u5b9a\u4f4d\u80fd\u529b\u3002</p> </li> <li> <p>\u975e\u6781\u5927\u503c\u6291\u5236\uff08NMS\uff09\u79fb\u9664\u91cd\u590d\u7684\u68c0\u6d4b\u7ed3\u679c\u3002\u5f53\u6a21\u578b\u4e3a\u540c\u4e00\u4e2a\u7269\u4f53\u9884\u6d4b\u51fa\u591a\u4e2a\u91cd\u53e0\u7684\u8fb9\u754c\u6846\u65f6\uff0cNMS\u4fdd\u7559\u7f6e\u4fe1\u5ea6\u6700\u9ad8\u7684\u6846\uff0c\u5e76\u79fb\u9664\u6240\u6709\u4e0e\u5176\u91cd\u53e0\u8d85\u8fc7IoU\u9608\u503c\u7684\u5176\u4ed6\u6846\u3002\u8fd9\u662f\u5728\u6a21\u578b\u751f\u6210\u539f\u59cb\u9884\u6d4b\u4e4b\u540e\uff0c\u6309\u6bcf\u4e2a\u7c7b\u522b\u5206\u522b\u8fdb\u884c\u7684\u3002</p> </li> <li> <p>\u4e24\u9636\u6bb5\u68c0\u6d4b\u5668\u9996\u5148\u63d0\u51fa\u5019\u9009\u533a\u57df\uff0c\u7136\u540e\u5bf9\u6bcf\u4e2a\u63d0\u6848\u8fdb\u884c\u5206\u7c7b\u548c\u7cbe\u7ec6\u5316\u8c03\u6574\u3002</p> </li> <li> <p>R-CNN\uff08Girshick \u7b49\u4eba\uff0c2014\u5e74\uff09\u662f\u7b2c\u4e00\u4e2a\u6210\u529f\u7684\u6df1\u5ea6\u5b66\u4e60\u68c0\u6d4b\u5668\u3002\u5b83\u4f7f\u7528\u9009\u62e9\u6027\u641c\u7d22\uff08\u4e00\u79cd\u7ecf\u5178\u7b97\u6cd5\uff09\u63d0\u51fa\u7ea62,000\u4e2a\u5019\u9009\u533a\u57df\uff0c\u5c06\u6bcf\u4e2a\u533a\u57df\u53d8\u5f62\u4e3a\u56fa\u5b9a\u5c3a\u5bf8\uff0c\u72ec\u7acb\u901a\u8fc7CNN\u8fd0\u884c\uff0c\u5e76\u4f7f\u7528SVM\uff08\u7b2c06\u7ae0\uff09\u8fdb\u884c\u5206\u7c7b\u3002R-CNN\u51c6\u786e\u4f46\u6781\u5176\u7f13\u6162\uff1a\u6bcf\u5f20\u56fe\u50cf\u9700\u8981\u8fd0\u884cCNN 2,000\u6b21\u3002</p> </li> <li> <p>Fast R-CNN\uff08Girshick\uff0c2015\u5e74\uff09\u89e3\u51b3\u4e86\u5197\u4f59\u95ee\u9898\uff1a\u5b83\u5728\u6574\u5f20\u56fe\u50cf\u4e0a\u8fd0\u884c\u4e00\u6b21CNN\u4ee5\u751f\u6210\u5171\u4eab\u7279\u5f81\u56fe\uff0c\u7136\u540e\u4f7f\u7528RoI\u6c60\u5316\uff08\u611f\u5174\u8da3\u533a\u57df\u6c60\u5316\uff09\u4ece\u8be5\u5171\u4eab\u7279\u5f81\u56fe\u4e2d\u4e3a\u6bcf\u4e2a\u63d0\u6848\u63d0\u53d6\u7279\u5f81\u3002</p> </li> <li> <p>RoI\u6c60\u5316\u4ece\u7279\u5f81\u56fe\u4e2d\u53d6\u51fa\u4e00\u4e2a\u53ef\u53d8\u5927\u5c0f\u7684\u533a\u57df\uff0c\u901a\u8fc7\u5c06\u8be5\u533a\u57df\u5212\u5206\u4e3a\u4e00\u4e2a\u7f51\u683c\u5e76\u5728\u6bcf\u4e2a\u5355\u5143\u683c\u5185\u8fdb\u884c\u6700\u5927\u6c60\u5316\uff0c\u751f\u6210\u56fa\u5b9a\u5927\u5c0f\u7684\u8f93\u51fa\u3002\u8fd9\u79cd\u65b9\u6cd5\u5feb\u5f97\u591a\uff0c\u56e0\u4e3a\u6602\u8d35\u7684CNN\u8ba1\u7b97\u53ea\u8fdb\u884c\u4e00\u6b21\u3002</p> </li> <li> <p>Faster R-CNN\uff08Ren \u7b49\u4eba\uff0c2015\u5e74\uff09\u5f15\u5165\u4e86\u533a\u57df\u63d0\u8bae\u7f51\u7edc\uff08RPN\uff09\uff0c\u4ece\u800c\u6d88\u9664\u4e86\u5916\u90e8\u533a\u57df\u63d0\u8bae\u7b97\u6cd5\u3002RPN\u662f\u4e00\u4e2a\u5c0f\u578bCNN\uff0c\u8fd0\u884c\u5728\u5171\u4eab\u7279\u5f81\u56fe\u4e4b\u4e0a\uff0c\u76f4\u63a5\u9884\u6d4b\u63d0\u6848\u3002RPN\u5728\u7279\u5f81\u56fe\u4e0a\u6ed1\u52a8\u4e00\u4e2a\u5c0f\u7a97\u53e3\uff0c\u5728\u6bcf\u4e2a\u4f4d\u7f6e\u4e0a\u9884\u6d4b \\(k\\) \u4e2a\u63d0\u6848\uff08\u6bcf\u4e2a\u951a\u6846\u5bf9\u5e94\u4e00\u4e2a\u63d0\u6848\uff09\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u951a\u6846\u662f\u7279\u5f81\u56fe\u4e0a\u6bcf\u4e2a\u7a7a\u95f4\u4f4d\u7f6e\u5904\u9884\u5b9a\u4e49\u7684\u8fb9\u754c\u6846\uff0c\u8986\u76d6\u4e0d\u540c\u7684\u5c3a\u5ea6\u548c\u957f\u5bbd\u6bd4\uff08\u4f8b\u5982\uff0c\u4e09\u4e2a\u5c3a\u5ea6 \\(\\times\\) \u4e09\u4e2a\u6bd4\u4f8b = \u6bcf\u4e2a\u4f4d\u7f6e9\u4e2a\u951a\u6846\uff09\u3002RPN\u4e3a\u6bcf\u4e2a\u951a\u6846\u9884\u6d4b\u4e24\u6837\u4e1c\u897f\uff1a\u7269\u4f53\u6027\u5206\u6570\uff08\u7269\u4f53vs\u80cc\u666f\uff09\u4ee5\u53ca\u7528\u4e8e\u5c06\u951a\u6846\u7cbe\u70bc\u4e3a\u66f4\u7d27\u51d1\u63d0\u6848\u7684\u5750\u6807\u504f\u79fb\u91cf\u3002\u8fd9\u79cd\u53c2\u6570\u5316\u4f7f\u56de\u5f52\u95ee\u9898\u66f4\u5bb9\u6613\uff1a\u7f51\u7edc\u4e0d\u9700\u8981\u9884\u6d4b\u7edd\u5bf9\u5750\u6807\uff0c\u53ea\u9700\u9884\u6d4b\u5bf9\u5408\u7406\u521d\u59cb\u6846\u7684\u5c0f\u5e45\u8c03\u6574\u3002</p> </li> <li> <p>\u951a\u6846\u504f\u79fb\u91cf\u7684\u53c2\u6570\u5316\u516c\u5f0f\u4e3a\uff1a</p> </li> </ul> \\[t_x = \\frac{x - x_a}{w_a}, \\quad t_y = \\frac{y - y_a}{h_a}, \\quad t_w = \\log\\frac{w}{w_a}, \\quad t_h = \\log\\frac{h}{h_a}\\] <ul> <li> <p>\u5176\u4e2d \\((x, y, w, h)\\) \u662f\u9884\u6d4b\u6846\u7684\u4e2d\u5fc3\u548c\u5c3a\u5bf8\uff0c\\((x_a, y_a, w_a, h_a)\\) \u662f\u951a\u6846\u3002\u5bbd\u5ea6\u548c\u9ad8\u5ea6\u7684\u5bf9\u6570\u53d8\u6362\u786e\u4fdd\u9884\u6d4b\u6846\u59cb\u7ec8\u4e3a\u6b63\u6570\uff0c\u5e76\u4f7f\u56de\u5f52\u5177\u6709\u5c3a\u5ea6\u4e0d\u53d8\u6027\u3002</p> </li> <li> <p>Faster R-CNN\u4f7f\u7528\u591a\u4efb\u52a1\u635f\u5931\u8fdb\u884c\u8bad\u7ec3\uff1a\u7c7b\u522b\u6807\u7b7e\u7684\u5206\u7c7b\u635f\u5931\uff08\u7b2c05\u7ae0\u7684\u4ea4\u53c9\u71b5\uff09\uff0c\u4ee5\u53ca\u7528\u4e8e\u8fb9\u754c\u6846\u56de\u5f52\u7684\u5e73\u6ed1L1\u635f\u5931\u3002\u5e73\u6ed1L1\u5bf9\u5f02\u5e38\u503c\u4e0d\u5982L2\u654f\u611f\uff1a</p> </li> </ul> \\[ \\text{smooth}_{L1}(x) = \\begin{cases} 0.5x^2 &amp; \\text{if } |x| &lt; 1 \\\\ |x| - 0.5 &amp; \\text{otherwise} \\end{cases} \\] <ul> <li> <p>\u7279\u5f81\u91d1\u5b57\u5854\u7f51\u7edc\uff08FPN\uff09\uff08Lin \u7b49\u4eba\uff0c2017\u5e74\uff09\u901a\u8fc7\u6784\u5efa\u4e00\u4e2a\u5e26\u6709\u4fa7\u8fb9\u8fde\u63a5\u7684\u81ea\u9876\u5411\u4e0b\u8def\u5f84\u6765\u89e3\u51b3\u591a\u5c3a\u5ea6\u95ee\u9898\uff0c\u8be5\u8def\u5f84\u5c06\u9ad8\u5c42\u8bed\u4e49\u4fe1\u606f\u4e0e\u4f4e\u5c42\u7a7a\u95f4\u7ec6\u8282\u878d\u5408\u3002\u9aa8\u5e72\u7f51\u7edc\u751f\u6210\u591a\u4e2a\u5c3a\u5ea6\u7684\u7279\u5f81\u56fe\uff08\u6bcf\u4e2a\u6c60\u5316\u5c42\u5c06\u5206\u8fa8\u7387\u51cf\u534a\uff09\u3002FPN\u6dfb\u52a0\u4e86\u4e00\u4e2a\u81ea\u9876\u5411\u4e0b\u7684\u8def\u5f84\uff0c\u5176\u4e2d\u6bcf\u4e2a\u5c42\u7ea7\u63a5\u6536\u6765\u81ea\u4e0a\u4e00\u5c42\u7ea7\u7684\u4e0a\u91c7\u6837\u7279\u5f81\uff0c\u5e76\u901a\u8fc7\u4fa7\u8fb91x1\u5377\u79ef\u4e0e\u5bf9\u5e94\u7684\u81ea\u5e95\u5411\u4e0a\u5c42\u7ea7\u5408\u5e76\u3002\u7ed3\u679c\u662f\u4e00\u4e2a\u7279\u5f81\u56fe\u91d1\u5b57\u5854\uff0c\u6bcf\u4e2a\u5c42\u7ea7\u7684\u7279\u5f81\u56fe\u65e2\u5177\u6709\u5f3a\u8bed\u4e49\u4fe1\u606f\u53c8\u5177\u6709\u826f\u597d\u7684\u7a7a\u95f4\u5206\u8fa8\u7387\u3002</p> </li> <li> <p>\u5c0f\u7269\u4f53\u4ece\u91d1\u5b57\u5854\u7684\u9ad8\u5206\u8fa8\u7387\u5c42\u7ea7\u68c0\u6d4b\uff1b\u5927\u7269\u4f53\u4ece\u4f4e\u5206\u8fa8\u7387\u5c42\u7ea7\u68c0\u6d4b\u3002FPN\u73b0\u5728\u5df2\u6210\u4e3a\u5927\u591a\u6570\u73b0\u4ee3\u68c0\u6d4b\u67b6\u6784\u7684\u6807\u51c6\u7ec4\u4ef6\u3002</p> </li> <li> <p>\u5355\u9636\u6bb5\u68c0\u6d4b\u5668\u5b8c\u5168\u8df3\u8fc7\u4e86\u63d0\u6848\u6b65\u9aa4\uff0c\u5728\u4e00\u6b21\u524d\u5411\u4f20\u64ad\u4e2d\u76f4\u63a5\u9884\u6d4b\u7c7b\u522b\u6807\u7b7e\u548c\u8fb9\u754c\u6846\u3002\u8fd9\u79cd\u65b9\u6cd5\u66f4\u5feb\uff0c\u4f46\u5728\u5386\u53f2\u4e0a\u51c6\u786e\u7387\u4f4e\u4e8e\u4e24\u9636\u6bb5\u68c0\u6d4b\u5668\uff0c\u76f4\u5230\u7126\u70b9\u635f\u5931\uff08focal loss\uff09\u7f29\u5c0f\u4e86\u8fd9\u4e00\u5dee\u8ddd\u3002</p> </li> <li> <p>YOLO\uff08You Only Look Once\uff0cRedmon \u7b49\u4eba\uff0c2016\u5e74\uff09\u5c06\u56fe\u50cf\u5212\u5206\u4e3a\u4e00\u4e2a \\(S \\times S\\) \u7684\u7f51\u683c\u3002\u6bcf\u4e2a\u7f51\u683c\u5355\u5143\u9884\u6d4b \\(B\\) \u4e2a\u8fb9\u754c\u6846\u548c \\(C\\) \u4e2a\u7c7b\u522b\u6982\u7387\u3002\u5982\u679c\u4e00\u4e2a\u7269\u4f53\u7684\u4e2d\u5fc3\u843d\u5728\u4e00\u4e2a\u7f51\u683c\u5355\u5143\u5185\uff0c\u8be5\u5355\u5143\u8d1f\u8d23\u68c0\u6d4b\u8be5\u7269\u4f53\u3002YOLO\u6781\u5176\u5feb\u901f\uff0c\u56e0\u4e3a\u6574\u4e2a\u68c0\u6d4b\u8fc7\u7a0b\u53ea\u6709\u4e00\u6b21\u524d\u5411\u4f20\u64ad\uff0c\u6ca1\u6709\u63d0\u6848\u9636\u6bb5\u3002</p> </li> <li> <p>YOLOv2\u6dfb\u52a0\u4e86\u951a\u6846\u3001\u6279\u5f52\u4e00\u5316\u548c\u591a\u5c3a\u5ea6\u8bad\u7ec3\u3002YOLOv3\u4f7f\u7528\u4e86\u7279\u5f81\u91d1\u5b57\u5854\u7f51\u7edc\u5e76\u5728\u4e09\u4e2a\u5c3a\u5ea6\u4e0a\u8fdb\u884c\u9884\u6d4b\u3002YOLOv4-v8\u7ee7\u7eed\u6539\u8fdb\uff0c\u91c7\u7528\u4e86\u66f4\u597d\u7684\u9aa8\u5e72\u7f51\u7edc\u3001\u8def\u5f84\u805a\u5408\u7f51\u7edc\u548c\u9a6c\u8d5b\u514b\u6570\u636e\u589e\u5f3a\uff08\u5728\u8bad\u7ec3\u4e2d\u5c06\u56db\u5f20\u56fe\u50cf\u62fc\u63a5\u5728\u4e00\u8d77\u4ee5\u589e\u52a0\u4e0a\u4e0b\u6587\u591a\u6837\u6027\uff09\u3002</p> </li> <li> <p>SSD\uff08Single Shot MultiBox Detector\uff0cLiu \u7b49\u4eba\uff0c2016\u5e74\uff09\u5728\u9aa8\u5e72\u7f51\u7edc\u5185\u7684\u591a\u4e2a\u7279\u5f81\u56fe\u5c3a\u5ea6\u4e0a\u8fdb\u884c\u9884\u6d4b\uff0c\u5728\u6bcf\u4e2a\u5c3a\u5ea6\u4e0a\u4f7f\u7528\u951a\u6846\u3002\u65e9\u671f\uff08\u9ad8\u5206\u8fa8\u7387\uff09\u7279\u5f81\u56fe\u68c0\u6d4b\u5c0f\u7269\u4f53\uff1b\u540e\u671f\uff08\u4f4e\u5206\u8fa8\u7387\uff09\u7279\u5f81\u56fe\u68c0\u6d4b\u5927\u7269\u4f53\u3002SSD\u6bd4Faster R-CNN\u66f4\u5feb\uff0c\u4e14\u5177\u6709\u7ade\u4e89\u529b\u7684\u51c6\u786e\u7387\u3002</p> </li> <li> <p>RetinaNet\uff08Lin \u7b49\u4eba\uff0c2017\u5e74\uff09\u6307\u51fa\u4e86\u5355\u9636\u6bb5\u68c0\u6d4b\u5668\u7684\u6838\u5fc3\u95ee\u9898\uff1a\u7c7b\u522b\u4e0d\u5e73\u8861\u3002\u7edd\u5927\u591a\u6570\u951a\u6846\u5bf9\u5e94\u7684\u662f\u80cc\u666f\uff0c\u8fd9\u4ea7\u751f\u4e86\u5927\u91cf\u5bb9\u6613\u7684\u8d1f\u6837\u672c\uff0c\u5b83\u4eec\u4e3b\u5bfc\u4e86\u635f\u5931\u51fd\u6570\u5e76\u538b\u5012\u4e86\u6765\u81ea\u7a00\u6709\u6b63\u6837\u672c\u7684\u68af\u5ea6\u3002</p> </li> <li> <p>\u7126\u70b9\u635f\u5931\uff08Focal Loss\uff09\u901a\u8fc7\u964d\u4f4e\u5bb9\u6613\u6837\u672c\u7684\u6743\u91cd\u6765\u89e3\u51b3\u8fd9\u4e2a\u95ee\u9898\uff1a</p> </li> </ul> \\[\\text{FL}(p_t) = -\\alpha_t (1 - p_t)^\\gamma \\log(p_t)\\] <ul> <li> <p>\u5176\u4e2d \\(p_t\\) \u662f\u6b63\u786e\u7c7b\u522b\u7684\u9884\u6d4b\u6982\u7387\u3002\u5f53\u6a21\u578b\u81ea\u4fe1\u4e14\u6b63\u786e\u65f6\uff08\\(p_t\\) \u5f88\u9ad8\uff09\uff0c\\((1 - p_t)^\\gamma\\) \u5f88\u5c0f\uff0c\u4ece\u800c\u51cf\u5c11\u4e86\u5bb9\u6613\u8d1f\u6837\u672c\u5bf9\u635f\u5931\u7684\u8d21\u732e\u3002\u8d85\u53c2\u6570 \\(\\gamma\\) \uff08\u901a\u5e38\u4e3a2\uff09\u63a7\u5236\u964d\u6743\u7684\u5f3a\u5ea6\u3002\u5f53 \\(\\gamma = 0\\) \u65f6\uff0c\u7126\u70b9\u635f\u5931\u9000\u5316\u4e3a\u6807\u51c6\u4ea4\u53c9\u71b5\u3002\u51ed\u501f\u7126\u70b9\u635f\u5931\uff0cRetinaNet\u4ee5\u5355\u9636\u6bb5\u7684\u901f\u5ea6\u5b9e\u73b0\u4e86\u4e0e\u4e24\u9636\u6bb5\u68c0\u6d4b\u5668\u76f8\u5f53\u7684\u51c6\u786e\u7387\u3002</p> </li> <li> <p>\u65e0\u951a\u6846\u68c0\u6d4b\u5b8c\u5168\u6d88\u9664\u4e86\u951a\u6846\uff0c\u51cf\u5c11\u4e86\u8d85\u53c2\u6570\u8c03\u4f18\u5e76\u7b80\u5316\u4e86\u6d41\u7a0b\u3002</p> </li> <li> <p>FCOS\uff08\u5168\u5377\u79ef\u5355\u9636\u6bb5\u68c0\u6d4b\u5668\uff0cTian \u7b49\u4eba\uff0c2019\u5e74\uff09\u5728\u7279\u5f81\u56fe\u7684\u6bcf\u4e2a\u7a7a\u95f4\u4f4d\u7f6e\u9884\u6d4b\u4ece\u8be5\u4f4d\u7f6e\u5230\u6700\u8fd1\u8fb9\u754c\u6846\u56db\u6761\u8fb9\uff08\u5de6\u3001\u4e0a\u3001\u53f3\u3001\u4e0b\uff09\u7684\u8ddd\u79bb\u4ee5\u53ca\u4e00\u4e2a\u7c7b\u522b\u6807\u7b7e\u3002\u4e2d\u5fc3\u6027\uff08centerness\uff09\u5206\u6570\u964d\u4f4e\u4e86\u8fdc\u79bb\u7269\u4f53\u4e2d\u5fc3\u7684\u9884\u6d4b\u7684\u6743\u91cd\uff0c\u4ece\u800c\u63d0\u9ad8\u4e86\u8d28\u91cf\u3002FCOS\u4f7f\u7528FPN\u6765\u5904\u7406\u591a\u5c3a\u5ea6\u95ee\u9898\u3002</p> </li> <li> <p>CenterNet\uff08Zhou \u7b49\u4eba\uff0c2019\u5e74\uff09\u5c06\u7269\u4f53\u68c0\u6d4b\u4e3a\u70b9\uff1a\u5b83\u9884\u6d4b\u4e00\u4e2a\u70ed\u529b\u56fe\uff0c\u5176\u4e2d\u7684\u5cf0\u503c\u5bf9\u5e94\u7269\u4f53\u4e2d\u5fc3\uff0c\u7136\u540e\u5728\u6bcf\u4e2a\u5cf0\u503c\u5904\u56de\u5f52\u5bbd\u5ea6\u548c\u9ad8\u5ea6\u3002\u68c0\u6d4b\u53d8\u6210\u4e86\u5173\u952e\u70b9\u4f30\u8ba1\u3002\u8fd9\u79cd\u65b9\u6cd5\u4f18\u96c5\u4e14\u65e0\u9700\u951a\u6846\uff0c\u4f46\u9700\u8981\u4ed4\u7ec6\u7684\u70ed\u529b\u56fe\u540e\u5904\u7406\u3002</p> </li> <li> <p>CornerNet\u5c06\u7269\u4f53\u68c0\u6d4b\u4e3a\u4e00\u5bf9\u89d2\u70b9\uff08\u5de6\u4e0a\u89d2\u548c\u53f3\u4e0b\u89d2\uff09\u3002\u5b83\u9884\u6d4b\u4e24\u4e2a\u70ed\u529b\u56fe\uff08\u6bcf\u4e2a\u89d2\u7c7b\u578b\u4e00\u4e2a\uff09\uff0c\u5e76\u4f7f\u7528\u5173\u8054\u5d4c\u5165\uff08associative embedding\uff09\u5c06\u5bf9\u5e94\u7684\u89d2\u70b9\u5339\u914d\u6210\u8fb9\u754c\u6846\u3002\u8fd9\u907f\u514d\u4e86\u5bf9\u951a\u6846\u7684\u9700\u6c42\uff0c\u5e76\u5904\u7406\u4e86\u4efb\u610f\u5f62\u72b6\u7684\u7269\u4f53\u3002</p> </li> <li> <p>\u8bed\u4e49\u5206\u5272\u4e3a\u56fe\u50cf\u4e2d\u7684\u6bcf\u4e2a\u50cf\u7d20\u5206\u914d\u4e00\u4e2a\u7c7b\u522b\u6807\u7b7e\u3002\u4e0e\u68c0\u6d4b\uff08\u8f93\u51fa\u8fb9\u754c\u6846\uff09\u4e0d\u540c\uff0c\u5206\u5272\u751f\u6210\u5bc6\u96c6\u7684\u50cf\u7d20\u7ea7\u6620\u5c04\u3002\u4e00\u6761\u8857\u666f\u53ef\u80fd\u4f1a\u5c06\u6bcf\u4e2a\u50cf\u7d20\u6807\u8bb0\u4e3a\u9053\u8def\u3001\u4eba\u884c\u9053\u3001\u6c7d\u8f66\u3001\u884c\u4eba\u3001\u5efa\u7b51\u3001\u5929\u7a7a\u7b49\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u5168\u5377\u79ef\u7f51\u7edc\uff08FCN\uff09\uff08Long \u7b49\u4eba\uff0c2015\u5e74\uff09\u901a\u8fc7\u5c06\u5168\u8fde\u63a5\u5c42\u66ff\u6362\u4e3a\u5377\u79ef\u5c42\uff0c\u4f7f\u5206\u7c7bCNN\u9002\u7528\u4e8e\u5206\u5272\u4efb\u52a1\uff0c\u4ece\u800c\u4f7f\u7f51\u7edc\u80fd\u591f\u8f93\u51fa\u7a7a\u95f4\u6620\u5c04\u800c\u975e\u5355\u4e2a\u7c7b\u522b\u3002\u4e0a\u91c7\u6837\uff08\u901a\u8fc7\u8f6c\u7f6e\u5377\u79ef\u6216\u53cc\u7ebf\u6027\u63d2\u503c\uff09\u5c06\u8f93\u51fa\u6062\u590d\u5230\u8f93\u5165\u5206\u8fa8\u7387\u3002\u6765\u81ea\u65e9\u671f\u5c42\u7684\u8df3\u8dc3\u8fde\u63a5\u6dfb\u52a0\u4e86\u5728\u4e0b\u91c7\u6837\u8fc7\u7a0b\u4e2d\u4e22\u5931\u7684\u7a7a\u95f4\u7ec6\u8282\u3002</p> </li> <li> <p>\u8f6c\u7f6e\u5377\u79ef\uff08\u6709\u65f6\u79f0\u4e3a\"\u53cd\u5377\u79ef\"\uff09\u662f\u5377\u79ef\u7684\u4e0a\u91c7\u6837\u5bf9\u5e94\u64cd\u4f5c\u3002\u6b65\u5e45\u5377\u79ef\u51cf\u5c11\u7a7a\u95f4\u7ef4\u5ea6\uff0c\u800c\u8f6c\u7f6e\u5377\u79ef\u589e\u52a0\u7a7a\u95f4\u7ef4\u5ea6\u3002\u5b83\u5728\u8f93\u5165\u5143\u7d20\u4e4b\u95f4\u63d2\u5165\u96f6\uff0c\u7136\u540e\u5e94\u7528\u6807\u51c6\u5377\u79ef\uff0c\u4ece\u800c\u6709\u6548\u5730\u5b66\u4e60\u5982\u4f55\u4e0a\u91c7\u6837\u3002</p> </li> <li> <p>U-Net\uff08Ronneberger \u7b49\u4eba\uff0c2015\u5e74\uff09\u5f15\u5165\u4e86\u4e00\u79cd\u5bf9\u79f0\u7684\u7f16\u7801\u5668-\u89e3\u7801\u5668\u67b6\u6784\uff0c\u5728\u6bcf\u4e00\u5c42\u90fd\u6709\u8df3\u8dc3\u8fde\u63a5\u3002\u7f16\u7801\u5668\uff08\u6536\u7f29\u8def\u5f84\uff09\u5728\u589e\u52a0\u901a\u9053\u6570\u7684\u540c\u65f6\u964d\u4f4e\u7a7a\u95f4\u5206\u8fa8\u7387\uff0c\u4e0e\u5206\u7c7bCNN\u5b8c\u5168\u76f8\u540c\u3002\u89e3\u7801\u5668\uff08\u6269\u5c55\u8def\u5f84\uff09\u5c06\u7ed3\u679c\u4e0a\u91c7\u6837\u56de\u5168\u5206\u8fa8\u7387\u3002\u8df3\u8dc3\u8fde\u63a5\u5728\u6bcf\u4e00\u5c42\u5c06\u7f16\u7801\u5668\u7279\u5f81\u56fe\u4e0e\u89e3\u7801\u5668\u7279\u5f81\u56fe\u62fc\u63a5\u8d77\u6765\uff0c\u4e3a\u89e3\u7801\u5668\u63d0\u4f9b\u7cbe\u7ec6\u7684\u7a7a\u95f4\u7ec6\u8282\u3002\u8fd9\u79cd\u9ad8\u5c42\u8bed\u4e49\u4e0e\u4f4e\u5c42\u7ec6\u8282\u7684\u7ed3\u5408\u4ea7\u751f\u4e86\u6e05\u6670\u3001\u51c6\u786e\u7684\u5206\u5272\u8fb9\u754c\u3002</p> </li> </ul> <p></p> <ul> <li> <p>U-Net\u6700\u521d\u662f\u4e3a\u751f\u7269\u533b\u5b66\u56fe\u50cf\u5206\u5272\u8bbe\u8ba1\u7684\uff08\u5176\u4e2d\u8bad\u7ec3\u6570\u636e\u7a00\u7f3a\uff09\uff0c\u5176\u67b6\u6784\u5df2\u6210\u4e3a\u8bb8\u591a\u540e\u7eed\u6a21\u578b\u7684\u57fa\u7840\uff0c\u5305\u62ec\u6f5c\u5728\u6269\u6563\u6a21\u578b\u4e2d\u7684U-Net\uff08\u6587\u4ef604\uff09\u3002</p> </li> <li> <p>DeepLab\uff08Chen \u7b49\u4eba\uff0c2014-2018\u5e74\uff09\u4e3a\u5206\u5272\u5f15\u5165\u4e86\u4e24\u4e2a\u5173\u952e\u521b\u65b0\uff1a</p> <ul> <li> <p>\u7a7a\u6d1e\uff08\u6269\u5f20\uff09\u5377\u79ef\uff1a\u5728\u6ee4\u6ce2\u5668\u5143\u7d20\u4e4b\u95f4\u63d2\u5165\u95f4\u9699\u7684\u6807\u51c6\u5377\u79ef\uff0c\u7531\u6269\u5f20\u7387 \\(r\\) \u63a7\u5236\u3002\u4e00\u4e2a\u6269\u5f20\u7387\u4e3a \\(r\\) \u76843x3\u6ee4\u6ce2\u5668\u7684\u611f\u53d7\u91ce\u4e3a \\((2r + 1) \\times (2r + 1)\\)\uff0c\u800c\u4ec5\u4f7f\u75289\u4e2a\u53c2\u6570\u3002\u8fd9\u5728\u4e0d\u8fdb\u884c\u4e0b\u91c7\u6837\u7684\u60c5\u51b5\u4e0b\u6355\u83b7\u591a\u5c3a\u5ea6\u4e0a\u4e0b\u6587\uff0c\u540c\u65f6\u4fdd\u6301\u7a7a\u95f4\u5206\u8fa8\u7387\u3002</p> </li> <li> <p>\u7a7a\u6d1e\u7a7a\u95f4\u91d1\u5b57\u5854\u6c60\u5316\uff08ASPP\uff09\uff1a\u5e76\u884c\u5e94\u7528\u591a\u4e2a\u5177\u6709\u4e0d\u540c\u6269\u5f20\u7387\u7684\u7a7a\u6d1e\u5377\u79ef\uff08\u4f8b\u5982\uff0c\u6269\u5f20\u73871\u30016\u300112\u300118\uff09\uff0c\u62fc\u63a5\u7ed3\u679c\uff0c\u5e76\u901a\u8fc71x1\u5377\u79ef\u878d\u5408\u3002ASPP\u540c\u65f6\u6355\u83b7\u591a\u4e2a\u5c3a\u5ea6\u7684\u4e0a\u4e0b\u6587\uff0c\u5176\u7cbe\u795e\u7c7b\u4f3c\u4e8eInception\u6a21\u5757\uff08\u6587\u4ef602\uff09\uff0c\u4f46\u4f7f\u7528\u6269\u5f20\u800c\u975e\u4e0d\u540c\u5927\u5c0f\u7684\u5377\u79ef\u6838\u3002</p> </li> </ul> </li> <li> <p>DeepLab\u8fd8\u4f7f\u7528\u6761\u4ef6\u968f\u673a\u573a\uff08CRF\uff09\uff08\u7b2c05\u7ae0\uff09\u4f5c\u4e3a\u540e\u5904\u7406\u6b65\u9aa4\uff0c\u901a\u8fc7\u9f13\u52b1\u7a7a\u95f4\u4e0a\u76f8\u90bb\u4e14\u989c\u8272\u76f8\u4f3c\u7684\u50cf\u7d20\u5171\u4eab\u76f8\u540c\u7684\u6807\u7b7e\u6765\u4f18\u5316\u5206\u5272\u8fb9\u754c\u3002</p> </li> <li> <p>\u5b9e\u4f8b\u5206\u5272\u7ed3\u5408\u4e86\u68c0\u6d4b\u548c\u5206\u5272\uff1a\u5b83\u8bc6\u522b\u6bcf\u4e2a\u5355\u72ec\u7684\u7269\u4f53\u5b9e\u4f8b\uff0c\u5e76\u4e3a\u6bcf\u4e2a\u5b9e\u4f8b\u751f\u6210\u50cf\u7d20\u7ea7\u63a9\u7801\u3002\u573a\u666f\u4e2d\u7684\u4e24\u8f86\u8f66\u4f1a\u5f97\u5230\u4e24\u4e2a\u72ec\u7acb\u7684\u63a9\u7801\uff0c\u800c\u4e0d\u4ec5\u4ec5\u662f\"\u8f66\"\u3002</p> </li> <li> <p>Mask R-CNN\uff08He \u7b49\u4eba\uff0c2017\u5e74\uff09\u901a\u8fc7\u6dfb\u52a0\u4e00\u4e2a\u5c0f\u578b\u5206\u5272\u5934\u6765\u6269\u5c55Faster R-CNN\uff0c\u8be5\u5206\u5272\u5934\u4e3a\u6bcf\u4e2a\u68c0\u6d4b\u5230\u7684\u7269\u4f53\u9884\u6d4b\u4e00\u4e2a\u4e8c\u503c\u63a9\u7801\u3002\u5176\u67b6\u6784\u4e3aFaster R-CNN\u52a0\u4e0a\u4e00\u4e2a\u63a9\u7801\u5206\u652f\uff1a\u63a9\u7801\u5206\u652f\u63a5\u6536RoI\u6c60\u5316\u540e\u7684\u7279\u5f81\uff0c\u5e76\u4e3a\u6bcf\u4e2a\u7c7b\u522b\u8f93\u51fa\u4e00\u4e2a \\(m \\times m\\) \u7684\u4e8c\u503c\u63a9\u7801\u3002\u5b83\u4f7f\u7528RoIAlign\u4ee3\u66ffRoI\u6c60\u5316\uff1a\u5728\u7cbe\u786e\u5b9a\u4f4d\u7684\u91c7\u6837\u70b9\u5904\u8fdb\u884c\u53cc\u7ebf\u6027\u63d2\u503c\uff0c\u800c\u975e\u5728\u91cf\u5316\u7684\u7f51\u683c\u5355\u5143\u683c\u5185\u8fdb\u884c\uff0c\u8fd9\u907f\u514d\u4e86\u91cf\u5316\u5f15\u8d77\u7684\u7a7a\u95f4\u9519\u4f4d\u3002\u8fd9\u4e00\u5c0f\u6539\u52a8\u663e\u8457\u63d0\u9ad8\u4e86\u63a9\u7801\u8d28\u91cf\u3002</p> </li> <li> <p>Mask R-CNN\u4f7f\u7528\u591a\u4efb\u52a1\u635f\u5931\u8fdb\u884c\u8bad\u7ec3\uff1a\u5206\u7c7b\u635f\u5931 + \u8fb9\u754c\u6846\u56de\u5f52\u635f\u5931 + \u63a9\u7801\u635f\u5931\uff08\u9010\u50cf\u7d20\u4e8c\u503c\u4ea4\u53c9\u71b5\uff09\u3002\u63a9\u7801\u5206\u652f\u72ec\u7acb\u5730\u4e3a\u6bcf\u4e2a\u7c7b\u522b\u9884\u6d4b\u4e00\u4e2a\u63a9\u7801\uff1b\u4ec5\u4f7f\u7528\u4e0e\u9884\u6d4b\u7c7b\u522b\u5bf9\u5e94\u7684\u63a9\u7801\uff0c\u8fd9\u4f7f\u63a9\u7801\u9884\u6d4b\u4e0e\u5206\u7c7b\u89e3\u8026\uff0c\u5e76\u540c\u65f6\u6539\u8fdb\u4e86\u4e24\u8005\u3002</p> </li> <li> <p>\u5168\u666f\u5206\u5272\u5c06\u8bed\u4e49\u5206\u5272\u548c\u5b9e\u4f8b\u5206\u5272\u7edf\u4e00\u4e3a\u5355\u4e2a\u4efb\u52a1\u3002\u6bcf\u4e2a\u50cf\u7d20\u540c\u65f6\u83b7\u5f97\u4e00\u4e2a\u7c7b\u522b\u6807\u7b7e\uff08\u8bed\u4e49\uff09\u548c\u4e00\u4e2a\u5b9e\u4f8bID\uff08\u7528\u4e8e\"\u7269\u4f53\"\u7c7b\u522b\uff0c\u5982\u6c7d\u8f66\u548c\u4eba\uff09\u3002\"\u80cc\u666f\"\u7c7b\u522b\uff08\u5929\u7a7a\u3001\u9053\u8def\u3001\u8349\u5730\uff09\u53ea\u83b7\u5f97\u8bed\u4e49\u6807\u7b7e\uff0c\u56e0\u4e3a\u5b83\u4eec\u662f\u65e0\u5f62\u533a\u57df\uff0c\u6ca1\u6709\u53ef\u8ba1\u6570\u7684\u5b9e\u4f8b\u3002</p> </li> <li> <p>\u5168\u666f\u8d28\u91cf\uff08PQ\uff09\u6307\u6807\u901a\u8fc7\u5206\u89e3\u4e3a\u5206\u5272\u8d28\u91cf\uff08\u5339\u914d\u7247\u6bb5\u7684\u5e73\u5747IoU\uff09\u548c\u8bc6\u522b\u8d28\u91cf\uff08\u5339\u914d\u7247\u6bb5\u7684F1\u5206\u6570\uff09\u6765\u8bc4\u4f30\uff1a</p> </li> </ul> \\[\\text{PQ} = \\underbrace{\\frac{\\sum_{(p,g) \\in \\text{TP}} \\text{IoU}(p,g)}{|\\text{TP}|}}_{\\text{SQ}} \\times \\underbrace{\\frac{|\\text{TP}|}{|\\text{TP}| + \\frac{1}{2}|\\text{FP}| + \\frac{1}{2}|\\text{FN}|}}_{\\text{RQ}}\\] <ul> <li> <p>\u5b9e\u65f6\u5206\u5272\u5bf9\u4e8e\u81ea\u52a8\u9a7e\u9a76\u548c\u589e\u5f3a\u73b0\u5b9e\u7b49\u5e94\u7528\u81f3\u5173\u91cd\u8981\uff0c\u8fd9\u4e9b\u5e94\u7528\u5bf9\u5ef6\u8fdf\u9884\u7b97\u8981\u6c42\u4e25\u683c\uff08\u901a\u5e38\u6bcf\u5e27\u4e0d\u8d85\u8fc730\u6beb\u79d2\uff09\u3002</p> </li> <li> <p>BiSeNet\uff08\u53cc\u8fb9\u5206\u5272\u7f51\u7edc\uff0cYu \u7b49\u4eba\uff0c2018\u5e74\uff09\u4f7f\u7528\u4e24\u6761\u5e76\u884c\u8def\u5f84\uff1a\u4e00\u6761\u7a7a\u95f4\u8def\u5f84\uff0c\u5177\u6709\u5bbd\u800c\u6d45\u7684\u5c42\u4ee5\u4fdd\u7559\u7a7a\u95f4\u7ec6\u8282\uff1b\u4e00\u6761\u4e0a\u4e0b\u6587\u8def\u5f84\uff0c\u5177\u6709\u6df1\u800c\u7a84\u7684\u5c42\u4ee5\u6355\u83b7\u8bed\u4e49\u4fe1\u606f\u3002\u8f93\u51fa\u88ab\u878d\u5408\uff0c\u517c\u987e\u901f\u5ea6\u548c\u51c6\u786e\u7387\u3002</p> </li> <li> <p>DDRNet\uff08\u6df1\u5ea6\u53cc\u5206\u8fa8\u7387\u7f51\u7edc\uff0cHong \u7b49\u4eba\uff0c2021\u5e74\uff09\u5728\u6574\u4e2a\u7f51\u7edc\u4e2d\u4ee5\u4e0d\u540c\u5206\u8fa8\u7387\u7ef4\u6301\u4e24\u4e2a\u5206\u652f\uff0c\u5e76\u5728\u5b83\u4eec\u4e4b\u95f4\u53cd\u590d\u4ea4\u6362\u4fe1\u606f\u3002\u9ad8\u5206\u8fa8\u7387\u5206\u652f\u4fdd\u7559\u7a7a\u95f4\u7ec6\u8282\uff0c\u800c\u4f4e\u5206\u8fa8\u7387\u5206\u652f\u6355\u83b7\u5168\u5c40\u4e0a\u4e0b\u6587\u3002\u591a\u4e2a\u53cc\u8fb9\u878d\u5408\u6a21\u5757\u5728\u4e24\u4e2a\u65b9\u5411\u4e0a\u5408\u5e76\u4fe1\u606f\u3002</p> </li> <li> <p>\u5b9e\u65f6\u5206\u5272\u7684\u603b\u4f53\u8d8b\u52bf\u662f\u907f\u514d\u6c89\u91cd\u7684\u7f16\u7801\u5668-\u89e3\u7801\u5668\u6a21\u5f0f\uff0c\u800c\u662f\u901a\u8fc7\u7f51\u7edc\u5168\u7a0b\u7ef4\u6301\u8db3\u591f\u7684\u7a7a\u95f4\u5206\u8fa8\u7387\uff0c\u4ee5\u4e00\u5b9a\u7684\u51c6\u786e\u7387\u4e3a\u4ee3\u4ef7\u6362\u53d6\u663e\u8457\u66f4\u4f4e\u7684\u5ef6\u8fdf\u3002</p> </li> </ul>"},{"location":"chapter%2008%3A%20computer%20vision/03.%20object%20detection%20and%20segmentation/#colabnotebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528CoLab\u6216notebook\uff09","text":"<ol> <li> <p>\u4ece\u5934\u5b9e\u73b0IoU\u8ba1\u7b97\u548c\u975e\u6781\u5927\u503c\u6291\u5236\u3002\u5bf9\u4e00\u7ec4\u91cd\u53e0\u7684\u8fb9\u754c\u6846\u5e94\u7528NMS\u5e76\u53ef\u89c6\u5316\u7ed3\u679c\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\nimport matplotlib.patches as patches\n\ndef compute_iou(box1, box2):\n    \"\"\"\u8ba1\u7b97\u4e24\u4e2a\u6846[x1, y1, x2, y2]\u4e4b\u95f4\u7684IoU\u3002\"\"\"\n    x1 = jnp.maximum(box1[0], box2[0])\n    y1 = jnp.maximum(box1[1], box2[1])\n    x2 = jnp.minimum(box1[2], box2[2])\n    y2 = jnp.minimum(box1[3], box2[3])\n\n    intersection = jnp.maximum(0, x2 - x1) * jnp.maximum(0, y2 - y1)\n    area1 = (box1[2] - box1[0]) * (box1[3] - box1[1])\n    area2 = (box2[2] - box2[0]) * (box2[3] - box2[1])\n    union = area1 + area2 - intersection\n\n    return intersection / (union + 1e-6)\n\ndef nms(boxes, scores, iou_threshold=0.5):\n    \"\"\"\u975e\u6781\u5927\u503c\u6291\u5236\u3002\"\"\"\n    order = jnp.argsort(-scores)  # \u6309\u7f6e\u4fe1\u5ea6\u964d\u5e8f\u6392\u5217\n    keep = []\n\n    remaining = list(range(len(scores)))\n    order_list = order.tolist()\n\n    while order_list:\n        idx = order_list[0]\n        keep.append(idx)\n        order_list = order_list[1:]\n\n        new_order = []\n        for j in order_list:\n            iou = compute_iou(boxes[idx], boxes[j])\n            if iou &lt; iou_threshold:\n                new_order.append(j)\n        order_list = new_order\n\n    return keep\n\n# \u793a\u4f8b\uff1a\u540c\u4e00\u7269\u4f53\u7684\u91cd\u53e0\u68c0\u6d4b\nboxes = jnp.array([\n    [50, 60, 150, 160],   # \u9ad8\u7f6e\u4fe1\u5ea6\n    [55, 65, 155, 165],   # \u91cd\u53e0\u7684\u91cd\u590d\u6846\n    [52, 58, 148, 158],   # \u91cd\u53e0\u7684\u91cd\u590d\u6846\n    [200, 100, 300, 200], # \u4e0d\u540c\u7269\u4f53\n    [205, 105, 305, 205], # \u91cd\u53e0\u7684\u91cd\u590d\u6846\n])\nscores = jnp.array([0.95, 0.80, 0.70, 0.90, 0.60])\n\nkeep = nms(boxes, scores, iou_threshold=0.5)\n\nfig, axes = plt.subplots(1, 2, figsize=(14, 5))\ncolors = ['#3498db', '#e74c3c', '#27ae60', '#9b59b6', '#f39c12']\n\nfor ax, title, indices in zip(axes, ['NMS\u4e4b\u524d', 'NMS\u4e4b\u540e'],\n                               [range(len(boxes)), keep]):\n    ax.set_xlim(0, 400); ax.set_ylim(0, 300)\n    ax.set_aspect('equal'); ax.invert_yaxis()\n    ax.set_title(title)\n    for i in indices:\n        b = boxes[i]\n        rect = patches.Rectangle((b[0], b[1]), b[2]-b[0], b[3]-b[1],\n                                  linewidth=2, edgecolor=colors[i],\n                                  facecolor='none')\n        ax.add_patch(rect)\n        ax.text(b[0], b[1]-5, f'{scores[i]:.2f}', color=colors[i], fontsize=10)\n\nplt.tight_layout(); plt.show()\nprint(f\"NMS\u540e\u4fdd\u7559\u4e86{len(keep)}\u4e2a\u6846\uff0c\u5171{len(boxes)}\u4e2a\")\n</code></pre></p> </li> <li> <p>\u5b9e\u73b0\u4e00\u4e2a\u7b80\u5316\u7684\u533a\u57df\u63d0\u8bae\u7f51\u7edc\uff08RPN\uff09\u3002\u7ed9\u5b9a\u4e00\u4e2a\u7279\u5f81\u56fe\uff0c\u751f\u6210\u5177\u6709\u591a\u79cd\u5c3a\u5ea6\u548c\u957f\u5bbd\u6bd4\u7684\u951a\u6846\uff0c\u5e76\u9884\u6d4b\u7269\u4f53\u6027\u5206\u6570\u548c\u8fb9\u754c\u6846\u504f\u79fb\u91cf\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\nimport matplotlib.patches as patches\n\ndef generate_anchors(feature_h, feature_w, stride, scales, ratios):\n    \"\"\"\u4e3a\u7279\u5f81\u56fe\u4e0a\u7684\u6bcf\u4e2a\u4f4d\u7f6e\u751f\u6210\u951a\u6846\u3002\"\"\"\n    anchors = []\n    for y in range(feature_h):\n        for x in range(feature_w):\n            cx = (x + 0.5) * stride\n            cy = (y + 0.5) * stride\n            for s in scales:\n                for r in ratios:\n                    w = s * jnp.sqrt(r)\n                    h = s / jnp.sqrt(r)\n                    anchors.append([cx - w/2, cy - h/2, cx + w/2, cy + h/2])\n    return jnp.array(anchors)\n\ndef rpn_forward(feature_map, params):\n    \"\"\"\u7b80\u5316\u7248RPN\uff1a\u9884\u6d4b\u6bcf\u4e2a\u951a\u6846\u7684\u7269\u4f53\u6027\u548c\u6846\u504f\u79fb\u91cf\u3002\"\"\"\n    H, W, C = feature_map.shape\n    n_anchors = params['cls_w'].shape[1]\n\n    # \u5728\u7279\u5f81\u56fe\u4e0a\u6ed1\u52a81x1\u5377\u79ef\uff08\u7b80\u5316\u7248\uff09\n    cls_scores = feature_map.reshape(-1, C) @ params['cls_w']  # (H*W, n_anchors)\n    box_offsets = feature_map.reshape(-1, C) @ params['reg_w']  # (H*W, n_anchors*4)\n\n    cls_scores = jax.nn.sigmoid(cls_scores)\n    return cls_scores.ravel(), box_offsets.reshape(-1, 4)\n\n# \u8bbe\u7f6e\nfeature_h, feature_w, channels = 4, 4, 16\nstride = 16  # \u6bcf\u4e2a\u7279\u5f81\u56fe\u5355\u5143\u683c\u8986\u76d616x16\u50cf\u7d20\nscales = [32, 64, 128]\nratios = [0.5, 1.0, 2.0]\nn_anchors_per_pos = len(scales) * len(ratios)\n\nkey = jax.random.PRNGKey(42)\nk1, k2, k3 = jax.random.split(key, 3)\n\nfeature_map = jax.random.normal(k1, (feature_h, feature_w, channels))\nparams = {\n    'cls_w': jax.random.normal(k2, (channels, n_anchors_per_pos)) * 0.01,\n    'reg_w': jax.random.normal(k3, (channels, n_anchors_per_pos * 4)) * 0.01,\n}\n\nanchors = generate_anchors(feature_h, feature_w, stride, scales, ratios)\nscores, offsets = rpn_forward(feature_map, params)\n\nprint(f\"\u7279\u5f81\u56fe\uff1a{feature_h}x{feature_w}\uff0c\u6b65\u5e45={stride}\")\nprint(f\"\u6bcf\u4e2a\u4f4d\u7f6e\u7684\u951a\u6846\u6570\uff1a{n_anchors_per_pos}\")\nprint(f\"\u951a\u6846\u603b\u6570\uff1a{len(anchors)}\")\nprint(f\"\u7269\u4f53\u6027\u5206\u6570\u5f62\u72b6\uff1a{scores.shape}\")\nprint(f\"\u8fb9\u754c\u6846\u504f\u79fb\u91cf\u5f62\u72b6\uff1a{offsets.shape}\")\n\n# \u53ef\u89c6\u5316\u4e00\u4e2a\u4f4d\u7f6e\u7684\u951a\u6846\nfig, ax = plt.subplots(figsize=(6, 6))\nimg_size = feature_h * stride\nax.set_xlim(0, img_size); ax.set_ylim(0, img_size)\nax.invert_yaxis(); ax.set_aspect('equal')\n\npos_idx = feature_h // 2 * feature_w + feature_w // 2  # \u4e2d\u5fc3\u4f4d\u7f6e\ncolors = ['#3498db', '#e74c3c', '#27ae60']\nfor i, s in enumerate(scales):\n    for j, r in enumerate(ratios):\n        idx = pos_idx * n_anchors_per_pos + i * len(ratios) + j\n        a = anchors[idx]\n        rect = patches.Rectangle((a[0], a[1]), a[2]-a[0], a[3]-a[1],\n                                  linewidth=1.5, edgecolor=colors[i],\n                                  facecolor='none', linestyle=['--', '-', ':'][j])\n        ax.add_patch(rect)\n\nax.scatter([img_size/2], [img_size/2], c='red', s=50, zorder=5)\nax.set_title(f'\u4e2d\u5fc3\u4f4d\u7f6e\u7684\u951a\u6846\\n3\u4e2a\u5c3a\u5ea6 \u00d7 3\u4e2a\u6bd4\u4f8b = {n_anchors_per_pos}')\nax.grid(True, alpha=0.3)\nplt.tight_layout(); plt.show()\n</code></pre></p> </li> <li> <p>\u5b9e\u73b0\u4e00\u4e2a\u7b80\u5316\u7248\u7684\u4e00\u7ef4U-Net\u7f16\u7801\u5668-\u89e3\u7801\u5668\uff0c\u5e26\u6709\u8df3\u8dc3\u8fde\u63a5\uff0c\u7528\u4e8e\u4e00\u7ef4\u5206\u5272\uff08\u4e00\u7ef4\u4fe1\u53f7\u7684\u4e8c\u503c\u6807\u6ce8\uff09\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef conv1d_same(x, kernel):\n    \"\"\"\u5177\u6709\u76f8\u540c\u586b\u5145\u7684\u4e00\u7ef4\u5377\u79ef\u3002\"\"\"\n    k = len(kernel)\n    pad = k // 2\n    x_pad = jnp.pad(x, pad, mode='edge')\n    n = len(x)\n    out = jnp.zeros(n)\n    for i in range(n):\n        out = out.at[i].set(jnp.sum(x_pad[i:i+k] * kernel))\n    return out\n\ndef downsample(x):\n    return x[::2]\n\ndef upsample(x, target_len):\n    return jnp.interp(jnp.linspace(0, 1, target_len), jnp.linspace(0, 1, len(x)), x)\n\ndef unet_1d(x, params):\n    \"\"\"\u7b80\u5316\u7248\u4e00\u7ef4U-Net\uff0c\u5305\u542b2\u4e2a\u7f16\u7801\u5668/\u89e3\u7801\u5668\u5c42\u7ea7\u3002\"\"\"\n    # \u7f16\u7801\u5668\n    e1 = jnp.maximum(0, conv1d_same(x, params['enc1']))\n    e1_down = downsample(e1)\n\n    e2 = jnp.maximum(0, conv1d_same(e1_down, params['enc2']))\n    e2_down = downsample(e2)\n\n    # \u74f6\u9888\u5c42\n    bottleneck = jnp.maximum(0, conv1d_same(e2_down, params['bottleneck']))\n\n    # \u5e26\u8df3\u8dc3\u8fde\u63a5\u7684\u89e3\u7801\u5668\n    d2_up = upsample(bottleneck, len(e2))\n    d2 = jnp.maximum(0, conv1d_same(d2_up + e2, params['dec2']))  # \u8df3\u8dc3\u8fde\u63a5\n\n    d1_up = upsample(d2, len(e1))\n    d1 = conv1d_same(d1_up + e1, params['dec1'])  # \u8df3\u8dc3\u8fde\u63a5\n\n    return jax.nn.sigmoid(d1)\n\n# \u521b\u5efa\u5e26\u6709\u6807\u6ce8\u533a\u57df\u7684\u4fe1\u53f7\nn = 128\nt = jnp.linspace(0, 4 * jnp.pi, n)\nsignal = jnp.sin(t) + 0.5 * jnp.sin(3 * t)\nlabels = (signal &gt; 0.5).astype(jnp.float32)  # \u4e8c\u503c\u5206\u5272\u76ee\u6807\n\nkey = jax.random.PRNGKey(42)\nkeys = jax.random.split(key, 5)\nparams = {\n    'enc1': jax.random.normal(keys[0], (5,)) * 0.3,\n    'enc2': jax.random.normal(keys[1], (5,)) * 0.3,\n    'bottleneck': jax.random.normal(keys[2], (3,)) * 0.3,\n    'dec2': jax.random.normal(keys[3], (5,)) * 0.3,\n    'dec1': jax.random.normal(keys[4], (5,)) * 0.3,\n}\n\ndef loss_fn(params, signal, labels):\n    pred = unet_1d(signal, params)\n    return -jnp.mean(labels * jnp.log(pred + 1e-7) + (1 - labels) * jnp.log(1 - pred + 1e-7))\n\ngrad_fn = jax.jit(jax.grad(loss_fn))\nlr = 0.05\n\nfor step in range(500):\n    grads = grad_fn(params, signal, labels)\n    params = {k: params[k] - lr * grads[k] for k in params}\n\npred = unet_1d(signal, params)\n\nfig, axes = plt.subplots(3, 1, figsize=(12, 7), sharex=True)\naxes[0].plot(t, signal, color='#3498db', linewidth=1.5)\naxes[0].set_title('\u8f93\u5165\u4fe1\u53f7'); axes[0].set_ylabel('\u503c')\n\naxes[1].fill_between(t, 0, labels, alpha=0.3, color='#27ae60')\naxes[1].set_title('\u771f\u5b9e\u6807\u6ce8'); axes[1].set_ylabel('\u6807\u7b7e')\n\naxes[2].plot(t, pred, color='#e74c3c', linewidth=1.5)\naxes[2].fill_between(t, 0, (pred &gt; 0.5).astype(float), alpha=0.2, color='#e74c3c')\naxes[2].set_title('U-Net\u9884\u6d4b'); axes[2].set_ylabel('\u6982\u7387')\naxes[2].set_xlabel('t')\n\nplt.tight_layout(); plt.show()\nprint(f\"\u6700\u7ec8\u635f\u5931\uff1a{loss_fn(params, signal, labels):.4f}\")\nprint(f\"\u50cf\u7d20\u51c6\u786e\u7387\uff1a{jnp.mean((pred &gt; 0.5) == labels):.2%}\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2008%3A%20computer%20vision/04.%20vision%20transformers%20and%20generation/","title":"\u89c6\u89c9Transformer\u4e0e\u751f\u6210\u6a21\u578b","text":"<p>\u89c6\u89c9Transformer\u5c06\u81ea\u6ce8\u610f\u529b\u5e94\u7528\u4e8e\u56fe\u50cf\u5757\uff0c\u901a\u8fc7\u6570\u636e\u9a71\u52a8\u7684\u7a7a\u95f4\u5b66\u4e60\u6311\u6218\u4e86CNN\u7684\u4e3b\u5bfc\u5730\u4f4d\u3002\u672c\u6587\u6db5\u76d6ViT\u3001DeiT\u3001Swin Transformer\u3001\u57fa\u4e8eGAN\u7684\u56fe\u50cf\u751f\u6210\uff08StyleGAN\uff09\u3001VAE\u548c\u6269\u6563\u6a21\u578b\uff08DDPM\u3001Stable Diffusion\uff09\uff0c\u4ee5\u53ca\u8d85\u5206\u8fa8\u7387\u548c\u795e\u7ecf\u98ce\u683c\u8fc1\u79fb\u3002</p> <ul> <li> <p>CNN\uff08\u6587\u4ef602\uff09\u5185\u7f6e\u4e86\u5f88\u5f3a\u7684\u7a7a\u95f4\u5f52\u7eb3\u504f\u7f6e\uff1a\u5c40\u90e8\u8fde\u63a5\u3001\u6743\u91cd\u5171\u4eab\u548c\u5e73\u79fb\u7b49\u53d8\u6027\u3002\u89c6\u89c9Transformer\uff08ViT\uff09\u63d0\u51fa\u4e86\u4e00\u4e2a\u542f\u53d1\u6027\u7684\u95ee\u9898\uff1a\u5982\u679c\u6211\u4eec\u5b8c\u5168\u629b\u5f03\u8fd9\u4e9b\u504f\u7f6e\uff0c\u4ec5\u4f7f\u7528\u7b2c06\u7ae0\u4e2d\u7684\u6ce8\u610f\u529b\u673a\u5236\uff0c\u8ba9\u6a21\u578b\u4ece\u6570\u636e\u4e2d\u5b66\u4e60\u7a7a\u95f4\u7ed3\u6784\uff0c\u7ed3\u679c\u4f1a\u600e\u6837\uff1f</p> </li> <li> <p>ViT\uff08Vision Transformer\uff0cDosovitskiy\u7b49\u4eba\uff0c2021\uff09\u5c06\u6807\u51c6\u7684Transformer\u7f16\u7801\u5668\u76f4\u63a5\u5e94\u7528\u4e8e\u56fe\u50cf\u3002\u5176\u6838\u5fc3\u601d\u60f3\u662f\u5c06\u56fe\u50cf\u89c6\u4e3a\u4e00\u4e2a\u56fe\u50cf\u5757\u5e8f\u5217\uff0c\u5c31\u50cfNLP\u5c06\u6587\u672c\u89c6\u4e3a\u4e00\u4e2a\u8bcd\u5143\u5e8f\u5217\u4e00\u6837\u3002</p> </li> <li> <p>\u5176\u5904\u7406\u6d41\u7a0b\u5982\u4e0b\uff1a</p> </li> <li>\u5c06\u56fe\u50cf\uff08\u9ad8\u5ea6\\(H\\)\uff0c\u5bbd\u5ea6\\(W\\)\uff0c\u901a\u9053\u6570\\(C\\)\uff09\u5206\u5272\u6210\\(P \\times P\\)\u5927\u5c0f\u7684\u4e0d\u91cd\u53e0\u56fe\u50cf\u5757\u7f51\u683c\u3002\u5f97\u5230\\(N = HW / P^2\\)\u4e2a\u56fe\u50cf\u5757\u3002</li> <li>\u5c06\u6bcf\u4e2a\u56fe\u50cf\u5757\u5c55\u5e73\u6210\u957f\u5ea6\u4e3a\\(P^2 \\cdot C\\)\u7684\u5411\u91cf\uff0c\u5e76\u901a\u8fc7\u4e00\u4e2a\u53ef\u5b66\u4e60\u7684\u7ebf\u6027\u5d4c\u5165\uff08\u5355\u4e2a\u77e9\u9635\u4e58\u6cd5\uff0c\u7b2c02\u7ae0\uff09\u5c06\u5176\u6295\u5f71\u5230\u6a21\u578b\u7ef4\u5ea6\\(D\\)\u3002</li> <li>\u5728\u524d\u9762\u6dfb\u52a0\u4e00\u4e2a\u53ef\u5b66\u4e60\u7684[CLS]\u6807\u8bb0\u5d4c\u5165\uff08\u7c7b\u4f3c\u4e8eBERT\u7684[CLS]\uff0c\u7b2c07\u7ae0\uff09\u3002\u8be5\u6807\u8bb0\u4f1a\u5173\u6ce8\u6240\u6709\u56fe\u50cf\u5757\uff0c\u5176\u6700\u7ec8\u8868\u793a\u7528\u4e8e\u5206\u7c7b\u3002</li> <li>\u6dfb\u52a0\u4f4d\u7f6e\u5d4c\u5165\uff08\u6bcf\u4e2a\u4f4d\u7f6e\u4e00\u4e2a\u53ef\u5b66\u4e60\u5411\u91cf\uff09\u4ee5\u63d0\u4f9b\u7a7a\u95f4\u4fe1\u606f\uff0c\u56e0\u4e3a\u6ce8\u610f\u529b\u662f\u7f6e\u6362\u7b49\u53d8\u7684\u3002</li> <li>\u5c06\\((N + 1)\\)\u4e2a\u6807\u8bb0\u5d4c\u5165\u5e8f\u5217\u901a\u8fc7\u6807\u51c6\u7684Transformer\u7f16\u7801\u5668\uff08\u591a\u5934\u81ea\u6ce8\u610f\u529b + FFN\uff0c\u7b2c06\u7ae0\uff09\u3002</li> <li>[CLS]\u6807\u8bb0\u7684\u6700\u7ec8\u8868\u793a\u901a\u8fc7\u4e00\u4e2a\u5206\u7c7b\u5934\uff08\u5c0f\u578bMLP\uff09\u8fdb\u884c\u5206\u7c7b\u3002</li> </ul> <p></p> <ul> <li> <p>\u56fe\u50cf\u5757\u5d4c\u5165\u7b49\u4ef7\u4e8e\u4e00\u4e2a\u5377\u79ef\u6838\u5927\u5c0f\u4e3a\\(P\\)\u3001\u6b65\u957f\u4e3a\\(P\\)\uff08\u4e0d\u91cd\u53e0\uff09\u7684\u5377\u79ef\u64cd\u4f5c\u3002ViT\u5c062D\u56fe\u50cf\u5b57\u9762\u5730\u8f6c\u6362\u4e3a1D\u5e8f\u5217\uff0c\u7136\u540e\u7528\u4e0e\u5904\u7406\u8bed\u8a00\u76f8\u540c\u7684\u67b6\u6784\u6765\u5904\u7406\u5b83\u3002</p> </li> <li> <p>ViT\u7684\u5f52\u7eb3\u504f\u7f6e\u6bd4CNN\u5c11\uff1a\u5b83\u4e0d\u5f3a\u5236\u5c40\u90e8\u8fde\u63a5\u6216\u5e73\u79fb\u7b49\u53d8\u6027\u3002\u8fd9\u610f\u5473\u7740\u5b83\u9700\u8981\u66f4\u591a\u7684\u8bad\u7ec3\u6570\u636e\u624d\u80fd\u4ece\u5934\u5b66\u4e60\u7a7a\u95f4\u7ed3\u6784\u3002\u5728\u5c0f\u578b\u6570\u636e\u96c6\u4e0a\uff0cCNN\u4f18\u4e8eViT\u3002\u4f46\u5728\u975e\u5e38\u5927\u7684\u6570\u636e\u96c6\uff08JFT-300M\uff0c3\u4ebf\u5f20\u56fe\u50cf\uff09\u4e0a\u8bad\u7ec3\u65f6\uff0cViT\u8fbe\u5230\u6216\u8d85\u8fc7\u4e86\u6700\u4f73CNN\u7684\u6027\u80fd\uff0c\u8fd9\u8868\u660eCNN\u7684\u5f52\u7eb3\u504f\u7f6e\u6709\u52a9\u4e8e\u6570\u636e\u6548\u7387\uff0c\u4f46\u5bf9\u4e8e\u6700\u7ec8\u6027\u80fd\u5e76\u975e\u5fc5\u9700\u3002</p> </li> <li> <p>ViT\u81ea\u6ce8\u610f\u529b\u7684\u590d\u6742\u5ea6\u4e3a\\(O(N^2)\\)\uff0c\u5176\u4e2dN\u662f\u56fe\u50cf\u5757\u6570\u91cf\u3002\u5bf9\u4e8e224x224\u7684\u56fe\u50cf\u548c16x16\u7684\u56fe\u50cf\u5757\uff0c\\(N = 196\\)\uff0c\u8fd9\u5728\u53ef\u63a7\u8303\u56f4\u5185\u3002\u4f46\u5bf9\u4e8e\u66f4\u9ad8\u5206\u8fa8\u7387\u7684\u56fe\u50cf\u6216\u66f4\u5c0f\u7684\u56fe\u50cf\u5757\uff0c\u4e8c\u6b21\u6210\u672c\u53d8\u5f97\u96be\u4ee5\u627f\u53d7\u3002</p> </li> <li> <p>DeiT\uff08\u6570\u636e\u9ad8\u6548\u7684\u56fe\u50cfTransformer\uff0cTouvron\u7b49\u4eba\uff0c2021\uff09\u8868\u660e\uff0c\u4ec5\u4f7f\u7528ImageNet\uff08\u65e0\u9700\u5e9e\u5927\u7684JFT\u6570\u636e\u96c6\uff09\u5e76\u501f\u52a9\u5f3a\u6570\u636e\u589e\u5f3a\u3001\u6b63\u5219\u5316\uff08\u968f\u673a\u6df1\u5ea6\u3001\u6807\u7b7e\u5e73\u6ed1\u3001dropout\uff09\u548c\u77e5\u8bc6\u84b8\u998f\uff0c\u5c31\u53ef\u4ee5\u6709\u6548\u8bad\u7ec3ViT\uff1a\u4e00\u4e2a\u9884\u8bad\u7ec3\u7684CNN\u6559\u5e08\u63d0\u4f9b\u8f6f\u6807\u7b7e\uff0cViT\u5b66\u751f\u5b66\u4e60\u5339\u914d\u8fd9\u4e9b\u6807\u7b7e\u3002DeiT\u5728[CLS]\u6807\u8bb0\u65c1\u8fb9\u6dfb\u52a0\u4e86\u4e00\u4e2a\u84b8\u998f\u6807\u8bb0\uff0c\u8bad\u7ec3\u7528\u4e8e\u9884\u6d4b\u6559\u5e08\u7684\u8f93\u51fa\u3002</p> </li> <li> <p>Swin Transformer\uff08Liu\u7b49\u4eba\uff0c2021\uff09\u89e3\u51b3\u4e86ViT\u7684\u4e24\u4e2a\u4e3b\u8981\u5c40\u9650\uff1a\u968f\u56fe\u50cf\u5927\u5c0f\u5448\u4e8c\u6b21\u589e\u957f\u7684\u8ba1\u7b97\u6210\u672c\uff0c\u4ee5\u53ca\u7f3a\u5c11\u5c42\u6b21\u5316\u7279\u5f81\u56fe\uff08\u68c0\u6d4b\u548c\u5206\u5272\u9700\u8981\u5c42\u6b21\u5316\u7279\u5f81\uff09\u3002</p> </li> <li> <p>Swin\u5f15\u5165\u4e86\u79fb\u52a8\u7a97\u53e3\uff1a\u4e0d\u518d\u5bf9\u6240\u6709\u56fe\u50cf\u5757\u8fdb\u884c\u5168\u5c40\u81ea\u6ce8\u610f\u529b\uff0c\u800c\u662f\u5728\u5c40\u90e8\u7a97\u53e3\u5185\uff08\u4f8b\u59827x7\u4e2a\u56fe\u50cf\u5757\uff09\u8ba1\u7b97\u6ce8\u610f\u529b\u3002\u8fd9\u4f7f\u5f97\u8ba1\u7b97\u6210\u672c\u4e0e\u56fe\u50cf\u5927\u5c0f\u5448\u7ebf\u6027\u5173\u7cfb\uff1a\\(O(N)\\)\u800c\u975e\\(O(N^2)\\)\u3002\u4f46\u4ec5\u9760\u5c40\u90e8\u7a97\u53e3\u4f1a\u963b\u6b62\u533a\u57df\u4e4b\u95f4\u7684\u4fe1\u606f\u6d41\u52a8\u3002</p> </li> <li> <p>\u7a97\u53e3\u79fb\u52a8\u89e3\u51b3\u4e86\u8fd9\u4e2a\u95ee\u9898\uff1a\u5728\u4ea4\u66ff\u5c42\u4e2d\uff0c\u7a97\u53e3\u5212\u5206\u4f1a\u504f\u79fb\u534a\u4e2a\u7a97\u53e3\u5927\u5c0f\u3002\u8fd9\u521b\u5efa\u4e86\u8de8\u7a97\u53e3\u8fde\u63a5\uff0c\u4f7f\u5f97\u4fe1\u606f\u53ef\u4ee5\u5728\u6240\u6709\u56fe\u50cf\u90e8\u5206\u4e4b\u95f4\u6d41\u52a8\uff0c\u800c\u65e0\u9700\u5168\u5c40\u6ce8\u610f\u529b\u7684\u6210\u672c\u3002</p> </li> </ul> <p></p> <ul> <li> <p>Swin\u8fd8\u901a\u8fc7\u8de8\u9636\u6bb5\u5408\u5e76\u56fe\u50cf\u5757\u6765\u6784\u5efa\u5c42\u6b21\u5316\u8868\u793a\u3002\u6bcf\u4e2a\u9636\u6bb5\u4e4b\u540e\uff0c\u76f8\u90bb\u76842x2\u56fe\u50cf\u5757\u88ab\u62fc\u63a5\u5e76\u6295\u5f71\uff0c\u4f7f\u901a\u9053\u7ef4\u5ea6\u52a0\u500d\u3001\u7a7a\u95f4\u5206\u8fa8\u7387\u51cf\u534a\u3002\u8fd9\u4ea7\u751f\u4e86\u591a\u5c3a\u5ea6\u7279\u5f81\u56fe\uff0c\u7c7b\u4f3c\u4e8eCNN\u548cFPN\uff08\u6587\u4ef603\uff09\u4e2d\u7684\u7279\u5f81\u56fe\uff0c\u4f7f\u5f97Swin\u53ef\u4ee5\u76f4\u63a5\u517c\u5bb9Faster R-CNN\u7b49\u68c0\u6d4b\u5934\u548cU-Net\u7b49\u5206\u5272\u5934\u3002</p> </li> <li> <p>PVT\uff08\u91d1\u5b57\u5854\u89c6\u89c9Transformer\uff09\u91c7\u7528\u4e86\u7c7b\u4f3c\u7684\u5c42\u6b21\u5316\u65b9\u6cd5\uff0c\u5177\u6709\u7a7a\u95f4\u7f29\u51cf\u6ce8\u610f\u529b\uff1a\u5728\u6bcf\u4e2a\u9636\u6bb5\uff0c\u952e\u548c\u503c\u5728\u8ba1\u7b97\u6ce8\u610f\u529b\u4e4b\u524d\u5148\u8fdb\u884c\u7a7a\u95f4\u4e0b\u91c7\u6837\uff0c\u4ece\u800c\u5728\u4fdd\u6301\u5168\u5c40\u611f\u53d7\u91ce\u7684\u540c\u65f6\u964d\u4f4e\u4e8c\u6b21\u6210\u672c\u3002</p> </li> <li> <p>\u81ea\u76d1\u7763\u89c6\u89c9\u5b66\u4e60\u4ece\u672a\u6807\u6ce8\u7684\u56fe\u50cf\u4e2d\u8bad\u7ec3\u8868\u793a\u3002\u6807\u6ce8\u6210\u672c\u9ad8\uff0c\u4f46\u56fe\u50cf\u8d44\u6e90\u4e30\u5bcc\u3002\u76ee\u6807\u662f\u5728\u6ca1\u6709\u4efb\u4f55\u4eba\u5de5\u6807\u6ce8\u7684\u60c5\u51b5\u4e0b\uff0c\u5b66\u4e60\u80fd\u5f88\u597d\u5730\u8fc1\u79fb\u5230\u4e0b\u6e38\u4efb\u52a1\u7684\u7279\u5f81\u3002</p> </li> <li> <p>\u5bf9\u6bd4\u5b66\u4e60\u8bad\u7ec3\u6a21\u578b\u8bc6\u522b\uff1a\u540c\u4e00\u5f20\u56fe\u50cf\u7684\u4e24\u4e2a\u589e\u5e7f\u89c6\u56fe\uff08\"\u6b63\u6837\u672c\u5bf9\"\uff09\u5e94\u5177\u6709\u76f8\u4f3c\u7684\u8868\u793a\uff0c\u800c\u4e0d\u540c\u56fe\u50cf\u7684\u89c6\u56fe\uff08\"\u8d1f\u6837\u672c\u5bf9\"\uff09\u5e94\u5177\u6709\u4e0d\u76f8\u4f3c\u7684\u8868\u793a\u3002</p> </li> <li> <p>SimCLR\uff08Chen\u7b49\u4eba\uff0c2020\uff09\u5bf9\u4e00\u4e2a\u6279\u6b21\u4e2d\u7684\u6bcf\u5f20\u56fe\u50cf\u521b\u5efa\u4e24\u4e2a\u589e\u5e7f\u89c6\u56fe\uff0c\u7528\u5171\u4eab\u4e3b\u5e72\u7f51\u7edc+\u6295\u5f71\u5934\u5bf9\u4e24\u8005\u8fdb\u884c\u7f16\u7801\uff0c\u5e76\u5e94\u7528NT-Xent\u635f\u5931\uff08\u5f52\u4e00\u5316\u6e29\u5ea6\u6807\u5ea6\u4ea4\u53c9\u71b5\uff09\uff1a</p> </li> </ul> \\[\\ell_{i,j} = -\\log \\frac{\\exp(\\text{sim}(z_i, z_j) / \\tau)}{\\sum_{k \\neq i} \\exp(\\text{sim}(z_i, z_k) / \\tau)}\\] <ul> <li> <p>\u5176\u4e2d\\(\\text{sim}\\)\u662f\u4f59\u5f26\u76f8\u4f3c\u5ea6\uff08\u7b2c01\u7ae0\uff09\uff0c\\(\\tau\\)\u662f\u6e29\u5ea6\u53c2\u6570\u3002\u5206\u5b50\u5c06\u6b63\u6837\u672c\u5bf9\u62c9\u8fd1\uff1b\u5206\u6bcd\u5c06\u8d1f\u6837\u672c\u5bf9\u63a8\u8fdc\u3002SimCLR\u9700\u8981\u5927\u6279\u91cf\u5927\u5c0f\uff084,096+\uff09\u6765\u63d0\u4f9b\u8db3\u591f\u7684\u8d1f\u6837\u672c\u3002</p> </li> <li> <p>MoCo\uff08\u52a8\u91cf\u5bf9\u6bd4\uff0cHe\u7b49\u4eba\uff0c2020\uff09\u901a\u8fc7\u7ef4\u62a4\u4e00\u4e2a\u52a8\u91cf\u66f4\u65b0\u7684\u8d1f\u5d4c\u5165\u961f\u5217\u6765\u89e3\u51b3\u5927\u6279\u91cf\u9700\u6c42\u3002\u67e5\u8be2\u7f16\u7801\u5668\u901a\u8fc7\u68af\u5ea6\u4e0b\u964d\u66f4\u65b0\uff1b\u952e\u7f16\u7801\u5668\u4f5c\u4e3a\u67e5\u8be2\u7f16\u7801\u5668\u7684\u6307\u6570\u79fb\u52a8\u5e73\u5747\uff08EMA\uff0c\u7b2c04\u7ae0\uff09\u8fdb\u884c\u66f4\u65b0\uff1a\\(\\theta_k \\leftarrow m \\theta_k + (1 - m) \\theta_q\\)\uff0c\u5176\u4e2d\\(m = 0.999\\)\u3002\u961f\u5217\u5b58\u50a8\u6700\u8fd1\u7684\u952e\u5d4c\u5165\uff0c\u63d0\u4f9b\u4e86\u5927\u91cf\u4e14\u4e00\u81f4\u7684\u8d1f\u6837\u672c\u96c6\uff0c\u65e0\u9700\u5de8\u5927\u7684\u6279\u6b21\u3002</p> </li> <li> <p>BYOL\uff08\u81ea\u4e3e\u4f60\u81ea\u5df1\u7684\u9690\u7a7a\u95f4\uff0cGrill\u7b49\u4eba\uff0c2020\uff09\u5b8c\u5168\u6d88\u9664\u4e86\u8d1f\u6837\u672c\u5bf9\u3002\u5b83\u4f7f\u7528\u4e24\u4e2a\u7f51\u7edc\uff1a\"\u5728\u7ebf\"\u7f51\u7edc\u548c\"\u76ee\u6807\"\u7f51\u7edc\uff08\u5728\u7ebf\u7684EMA\uff09\u3002\u5728\u7ebf\u7f51\u7edc\u9884\u6d4b\u76ee\u6807\u7f51\u7edc\u5bf9\u53e6\u4e00\u589e\u5e7f\u89c6\u56fe\u7684\u8868\u793a\u3002\u65e0\u9700\u8d1f\u6837\u672c\uff0cBYOL\u901a\u8fc7\u9884\u6d4b\u5934\u7684\u4e0d\u5bf9\u79f0\u6027\u548cEMA\u76ee\u6807\u907f\u514d\u4e86\u574d\u584c\u95ee\u9898\uff08\u6a21\u578b\u5bf9\u6240\u6709\u8f93\u5165\u8f93\u51fa\u76f8\u540c\u5411\u91cf\uff09\u3002</p> </li> <li> <p>DINO\uff08\u65e0\u6807\u7b7e\u81ea\u84b8\u998f\uff0cCaron\u7b49\u4eba\uff0c2021\uff09\u5c06\u81ea\u84b8\u998f\u5e94\u7528\u4e8eViT\u3002\u5b66\u751f\u7f51\u7edc\u9884\u6d4b\u6559\u5e08\u7f51\u7edc\uff08\u5b66\u751f\u7684EMA\uff09\u5728\u4e0d\u540c\u589e\u5e7f\u89c6\u56fe\u4e0b\u7684\u8f93\u51fa\u3002\u6559\u5e08\u4f7f\u7528\u66f4\u5927\u7684\u88c1\u526a\u533a\u57df\uff1b\u5b66\u751f\u4f7f\u7528\u66f4\u5c0f\u7684\u88c1\u526a\u533a\u57df\u3002DINO\u4ea7\u751f\u7684\u7279\u5f81\u5305\u542b\u5173\u4e8e\u573a\u666f\u5e03\u5c40\u7684\u663e\u5f0f\u4fe1\u606f\uff1aDINO\u8bad\u7ec3\u7684ViT\u7684\u81ea\u6ce8\u610f\u529b\u56fe\u81ea\u7136\u5730\u5bf9\u7269\u4f53\u8fdb\u884c\u5206\u5272\uff0c\u65e0\u9700\u4efb\u4f55\u5206\u5272\u76d1\u7763\u3002</p> </li> <li> <p>\u63a9\u7801\u56fe\u50cf\u5efa\u6a21\u662fBERT\u63a9\u7801\u8bed\u8a00\u5efa\u6a21\uff08\u7b2c07\u7ae0\uff09\u5728\u89c6\u89c9\u9886\u57df\u7684\u7c7b\u6bd4\u3002\u8f93\u5165\u56fe\u50cf\u5757\u7684\u4e00\u5927\u90e8\u5206\u88ab\u63a9\u7801\uff0c\u6a21\u578b\u5b66\u4e60\u91cd\u5efa\u5b83\u4eec\u3002</p> </li> <li> <p>MAE\uff08\u63a9\u7801\u81ea\u7f16\u7801\u5668\uff0cHe\u7b49\u4eba\uff0c2022\uff09\u63a9\u7801\u4e8675%\u7684\u56fe\u50cf\u5757\uff0c\u5e76\u8bad\u7ec3\u4e00\u4e2aViT\u7f16\u7801\u5668-\u89e3\u7801\u5668\u6765\u91cd\u5efa\u7f3a\u5931\u7684\u50cf\u7d20\u503c\u3002\u53ea\u6709\u672a\u63a9\u7801\u7684\u56fe\u50cf\u5757\u7531\u7f16\u7801\u5668\u5904\u7406\uff08\u5728\u9884\u8bad\u7ec3\u671f\u95f4\u8282\u77014\u500d\u8ba1\u7b97\u91cf\uff09\uff0c\u8f7b\u91cf\u7ea7\u89e3\u7801\u5668\u4ece\u7f16\u7801\u540e\u7684\u53ef\u89c1\u56fe\u50cf\u5757\u52a0\u4e0a\u53ef\u5b66\u4e60\u7684\u63a9\u7801\u6807\u8bb0\u91cd\u5efa\u5b8c\u6574\u56fe\u50cf\u3002</p> </li> <li> <p>BEiT\uff08\u56fe\u50cfTransformer\u7684BERT\u9884\u8bad\u7ec3\uff0cBao\u7b49\u4eba\uff0c2022\uff09\u63a9\u7801\u56fe\u50cf\u5757\u5e76\u9884\u6d4b\u79bb\u6563\u7684\u89c6\u89c9\u6807\u8bb0\uff08\u4ece\u9884\u8bad\u7ec3\u7684dVAE\u5206\u8bcd\u5668\u83b7\u5f97\uff09\uff0c\u800c\u4e0d\u662f\u539f\u59cb\u50cf\u7d20\u3002\u8fd9\u7c7b\u4f3c\u4e8eBERT\u9884\u6d4b\u79bb\u6563\u8bcd\u6807\u8bb0\uff0c\u907f\u514d\u4e86\u50cf\u7d20\u91cd\u5efa\u7684\u4f4e\u5c42\u7ec6\u8282\u3002</p> </li> <li> <p>\u56fe\u50cf\u751f\u6210\u65e8\u5728\u751f\u6210\u8bad\u7ec3\u96c6\u4e2d\u4e0d\u5b58\u5728\u7684\u65b0\u9896\u3001\u903c\u771f\u7684\u56fe\u50cf\u3002\u6838\u5fc3\u6311\u6218\u662f\u5bf9\u81ea\u7136\u56fe\u50cf\u7684\u9ad8\u7ef4\u6982\u7387\u5206\u5e03\u8fdb\u884c\u5efa\u6a21\u3002</p> </li> <li> <p>\u751f\u6210\u5bf9\u6297\u7f51\u7edc\uff08GAN\uff09\uff08Goodfellow\u7b49\u4eba\uff0c2014\uff09\u4f7f\u7528\u4e24\u4e2a\u76f8\u4e92\u7ade\u4e89\u7684\u7f51\u7edc\uff1a\u4e00\u4e2a\u751f\u6210\u5668\\(G\\)\u4ece\u968f\u673a\u566a\u58f0\u4e2d\u521b\u5efa\u5047\u56fe\u50cf\uff0c\u548c\u4e00\u4e2a\u5224\u522b\u5668\\(D\\)\u8bd5\u56fe\u533a\u5206\u771f\u5b9e\u56fe\u50cf\u548c\u5047\u56fe\u50cf\u3002\u5b83\u4eec\u901a\u8fc7\u5bf9\u6297\u6027\u8bad\u7ec3\uff1a\\(G\\)\u8bd5\u56fe\u6b3a\u9a97\\(D\\)\uff0c\u800c\\(D\\)\u8bd5\u56fe\u6293\u4f4f\\(G\\)\u3002</p> </li> </ul> \\[\\min_G \\max_D \\; \\mathbb{E}_{x \\sim p_{\\text{data}}}[\\log D(x)] + \\mathbb{E}_{z \\sim p(z)}[\\log(1 - D(G(z)))]\\] <ul> <li> <p>\u751f\u6210\u5668\u63a5\u6536\u968f\u673a\u9690\u5411\u91cf\\(z\\)\uff08\u4ece\u9ad8\u65af\u5206\u5e03\u7b49\u7b80\u5355\u5206\u5e03\u4e2d\u91c7\u6837\uff09\uff0c\u901a\u8fc7\u4e00\u7cfb\u5217\u8f6c\u7f6e\u5377\u79ef\u5c06\u5176\u6620\u5c04\u751f\u6210\u56fe\u50cf\u3002\u5224\u522b\u5668\u662f\u4e00\u4e2a\u6807\u51c6\u7684CNN\u5206\u7c7b\u5668\u3002\u5728\u5747\u8861\u72b6\u6001\u4e0b\uff0c\\(G\\)\u751f\u6210\u7684\u56fe\u50cf\u4e0e\u771f\u5b9e\u6570\u636e\u65e0\u6cd5\u533a\u5206\uff0c\\(D\\)\u5bf9\u6240\u6709\u8f93\u5165\u8f93\u51fa0.5\u3002</p> </li> <li> <p>\u6a21\u5f0f\u574d\u584c\u662fGAN\u7684\u4e3b\u8981\u5931\u8d25\u6a21\u5f0f\uff1a\u751f\u6210\u5668\u5b66\u4f1a\u53ea\u751f\u6210\u5c11\u6570\u51e0\u79cd\u80fd\u6b3a\u9a97\u5224\u522b\u5668\u7684\u56fe\u50cf\uff0c\u5ffd\u7565\u4e86\u8bad\u7ec3\u6570\u636e\u7684\u591a\u6837\u6027\u3002\u751f\u6210\u5668\u627e\u5230\u4e00\u5c0f\u90e8\u5206\"\u5b89\u5168\"\u8f93\u51fa\uff0c\u800c\u4e0d\u662f\u8986\u76d6\u5b8c\u6574\u7684\u6570\u636e\u5206\u5e03\u3002</p> </li> <li> <p>\u7a33\u5b9aGAN\u7684\u8bad\u7ec3\u6280\u5de7\u5305\u62ec\uff1a\u8c31\u5f52\u4e00\u5316\uff08\u7ea6\u675f\u5224\u522b\u5668\u7684Lipschitz\u5e38\u6570\uff09\u3001\u6e10\u8fdb\u5f0f\u589e\u957f\uff08\u5148\u5728\u4f4e\u5206\u8fa8\u7387\u8bad\u7ec3\uff0c\u7136\u540e\u9010\u6b65\u63d0\u9ad8\uff09\u3001\u7279\u5f81\u5339\u914d\uff08\u5339\u914d\u4e2d\u95f4\u5224\u522b\u5668\u7279\u5f81\u7684\u7edf\u8ba1\u91cf\u800c\u975e\u6700\u7ec8\u8f93\u51fa\uff09\uff0c\u4ee5\u53ca\u4f7f\u7528Wasserstein\u8ddd\u79bb\u66ff\u4ee3\u539f\u59cb\u7684JS\u6563\u5ea6\u76ee\u6807\u3002</p> </li> <li> <p>StyleGAN\uff08Karras\u7b49\u4eba\uff0c2019\uff09\u662f\u6700\u5177\u5f71\u54cd\u529b\u7684\u9ad8\u8d28\u91cf\u56fe\u50cf\u5408\u6210GAN\u67b6\u6784\u3002\u5176\u5173\u952e\u521b\u65b0\u662f\u57fa\u4e8e\u98ce\u683c\u7684\u751f\u6210\u5668\uff1a\u4e0d\u662f\u5c06\u9690\u5411\u91cf\\(z\\)\u76f4\u63a5\u8f93\u5165\u751f\u6210\u5668\uff0c\u800c\u662f\u5148\u901a\u8fc7\u4e00\u4e2a\u6620\u5c04\u7f51\u7edc\uff088\u5c42MLP\uff09\u751f\u6210\u98ce\u683c\u5411\u91cf\\(w\\)\u3002\u8be5\u98ce\u683c\u5411\u91cf\u901a\u8fc7\u81ea\u9002\u5e94\u5b9e\u4f8b\u5f52\u4e00\u5316\uff08AdaIN\uff09\u6ce8\u5165\u5230\u751f\u6210\u5668\u7684\u6bcf\u4e00\u5c42\uff0c\u8c03\u8282\u7279\u5f81\u56fe\u7684\u7edf\u8ba1\u91cf\uff1a</p> </li> </ul> \\[\\text{AdaIN}(x, y) = y_{s} \\cdot \\frac{x - \\mu(x)}{\\sigma(x)} + y_{b}\\] <ul> <li> <p>\u5176\u4e2d\\(y_s\\)\u548c\\(y_b\\)\u662f\u4ece\\(w\\)\u63a8\u5bfc\u51fa\u7684\u7f29\u653e\u548c\u504f\u7f6e\u3002\u4e0d\u540c\u5c42\u63a7\u5236\u4e0d\u540c\u65b9\u9762\uff1a\u65e9\u671f\u5c42\u63a7\u5236\u7c97\u7c92\u5ea6\u7279\u5f81\uff08\u59ff\u6001\u3001\u8138\u578b\uff09\uff0c\u4e2d\u95f4\u5c42\u63a7\u5236\u4e2d\u7c92\u5ea6\u7279\u5f81\uff08\u53d1\u578b\u3001\u773c\u775b\uff09\uff0c\u540e\u671f\u5c42\u63a7\u5236\u7ec6\u7c92\u5ea6\u7ec6\u8282\uff08\u96c0\u6591\u3001\u53d1\u8d28\u7eb9\u7406\uff09\u3002StyleGAN\u80fd\u4ee51024x1024\u5206\u8fa8\u7387\u751f\u6210\u7167\u7247\u7ea7\u903c\u771f\u7684\u4eba\u8138\u3002</p> </li> <li> <p>\u53d8\u5206\u81ea\u7f16\u7801\u5668\uff08VAE\uff09\uff08\u7b2c06\u7ae0\uff09\u63d0\u4f9b\u4e86\u53e6\u4e00\u79cd\u751f\u6210\u65b9\u6cd5\u3002\u4e0eGAN\u4e0d\u540c\uff0cVAE\u6709\u4e00\u4e2a\u539f\u5219\u6027\u7684\u6982\u7387\u6846\u67b6\uff0c\u5177\u6709\u6e05\u6670\u7684\u8bad\u7ec3\u76ee\u6807\uff08ELBO\uff09\u3002\u5b83\u4eec\u751f\u6210\u7684\u56fe\u50cf\u901a\u5e38\u6bd4GAN\u6a21\u7cca\uff0c\u4f46\u63d0\u4f9b\u4e86\u66f4\u5e73\u6ed1\u3001\u66f4\u7ed3\u6784\u5316\u7684\u9690\u7a7a\u95f4\u3002VAE\u662f\u9690\u6269\u6563\u6a21\u578b\u4e2d\u7528\u4e8e\u5c06\u56fe\u50cf\u538b\u7f29\u5230\u9690\u7a7a\u95f4\u548c\u4ece\u9690\u7a7a\u95f4\u91cd\u5efa\u7684\u7f16\u7801\u5668-\u89e3\u7801\u5668\u5bf9\u3002</p> </li> <li> <p>\u6269\u6563\u6a21\u578b\u5df2\u6210\u4e3a\u56fe\u50cf\u751f\u6210\u7684\u4e3b\u5bfc\u8303\u5f0f\uff0c\u5728\u8d28\u91cf\u548c\u591a\u6837\u6027\u4e0a\u90fd\u8d85\u8d8a\u4e86GAN\u3002\u5176\u601d\u60f3\u6982\u5ff5\u4e0a\u5f88\u7b80\u5355\uff1a\u9010\u6b65\u5411\u6570\u636e\u6dfb\u52a0\u566a\u58f0\u76f4\u5230\u53d8\u6210\u7eaf\u9ad8\u65af\u566a\u58f0\uff08\u524d\u5411\u8fc7\u7a0b\uff09\uff0c\u7136\u540e\u5b66\u4e60\u9010\u6b65\u9006\u8f6c\u8fd9\u4e00\u8fc7\u7a0b\uff08\u53cd\u5411\u8fc7\u7a0b\uff09\u3002</p> </li> <li> <p>\u524d\u5411\u8fc7\u7a0b\u5728\\(T\\)\u4e2a\u65f6\u95f4\u6b65\u4e2d\u6dfb\u52a0\u9ad8\u65af\u566a\u58f0\uff1a</p> </li> </ul> \\[q(x_t | x_{t-1}) = \\mathcal{N}(x_t; \\sqrt{1 - \\beta_t} \\, x_{t-1}, \\beta_t I)\\] <ul> <li>\u5176\u4e2d\\(\\beta_t\\)\u662f\u4e00\u4e2a\u968f\u65f6\u95f4\u9012\u589e\u7684\u566a\u58f0\u8c03\u5ea6\u3002\u7ecf\u8fc7\u8db3\u591f\u591a\u7684\u6b65\u9aa4\u540e\uff0c\u65e0\u8bba\u539f\u59cb\u56fe\u50cf\\(x_0\\)\u5982\u4f55\uff0c\\(x_T\\)\u90fd\u8fd1\u4f3c\u4e8e\u7eaf\u9ad8\u65af\u566a\u58f0\u3002\u5229\u7528\u91cd\u53c2\u6570\u5316\u6280\u5de7\uff08\u7b2c06\u7ae0\uff09\uff0c\u8bbe\\(\\alpha_t = 1 - \\beta_t\\)\uff0c\\(\\bar{\\alpha}_t = \\prod_{s=1}^{t} \\alpha_s\\)\uff0c\u6211\u4eec\u53ef\u4ee5\u76f4\u63a5\u4ece\\(x_0\\)\u91c7\u6837\\(x_t\\)\uff1a</li> </ul> \\[x_t = \\sqrt{\\bar{\\alpha}_t} \\, x_0 + \\sqrt{1 - \\bar{\\alpha}_t} \\, \\epsilon, \\quad \\epsilon \\sim \\mathcal{N}(0, I)\\] <ul> <li>\u53cd\u5411\u8fc7\u7a0b\u5b66\u4e60\u53bb\u566a\uff1a\u4ece\u7eaf\u566a\u58f0\\(x_T\\)\u5f00\u59cb\uff0c\u6a21\u578b\u9884\u6d4b\u6bcf\u4e00\u6b65\u6dfb\u52a0\u7684\u566a\u58f0\\(\\epsilon\\)\u5e76\u5c06\u5176\u51cf\u53bb\u4ee5\u6062\u590d\\(x_{t-1}\\)\u3002\u8fd9\u7531\u4e00\u4e2a\u795e\u7ecf\u7f51\u7edc\\(\\epsilon_\\theta\\)\uff08\u901a\u5e38\u662fU-Net\uff0c\u6765\u81ea\u6587\u4ef603\uff09\u53c2\u6570\u5316\uff0c\u4f7f\u7528\u7b80\u5355\u7684MSE\u635f\u5931\u8bad\u7ec3\uff1a</li> </ul> \\[\\mathcal{L} = \\mathbb{E}_{t, x_0, \\epsilon}\\left[\\|\\epsilon - \\epsilon_\\theta(x_t, t)\\|^2\\right]\\] <p></p> <ul> <li> <p>DDPM\uff08\u53bb\u566a\u6269\u6563\u6982\u7387\u6a21\u578b\uff0cHo\u7b49\u4eba\uff0c2020\uff09\u5efa\u7acb\u4e86\u8fd9\u4e2a\u6846\u67b6\u3002\u91c7\u6837\u9700\u8981\u8fed\u4ee3\u6240\u6709\\(T\\)\u6b65\uff08\u901a\u5e38\u4e3a1,000\u6b65\uff09\uff0c\u8fd9\u5f88\u6162\u3002DDIM\uff08\u53bb\u566a\u6269\u6563\u9690\u5f0f\u6a21\u578b\uff0cSong\u7b49\u4eba\uff0c2021\uff09\u5c06\u91c7\u6837\u8fc7\u7a0b\u91cd\u65b0\u8868\u8ff0\u4e3a\u786e\u5b9a\u6027\u6620\u5c04\uff0c\u5141\u8bb8\u5927\u8de8\u5ea6\u8df3\u8fc7\uff08\u4f8b\u598250\u6b65\u4ee3\u66ff1,000\u6b65\uff09\u4e14\u8d28\u91cf\u635f\u5931\u6781\u5c0f\u3002</p> </li> <li> <p>\u57fa\u4e8e\u5206\u6570\u7684\u6a21\u578b\uff08Song\u548cErmon\uff0c2019\uff09\u63d0\u4f9b\u4e86\u53e6\u4e00\u79cd\u89c6\u89d2\u3002\u8be5\u6a21\u578b\u4e0d\u662f\u9884\u6d4b\u566a\u58f0\\(\\epsilon\\)\uff0c\u800c\u662f\u4f30\u8ba1\u5206\u6570\u51fd\u6570\\(\\nabla_{x_t} \\log p(x_t)\\)\uff0c\u5373\u5bf9\u6570\u6982\u7387\u76f8\u5bf9\u4e8e\u542b\u566a\u56fe\u50cf\u7684\u68af\u5ea6\u3002\u8be5\u68af\u5ea6\u6307\u5411\u6570\u636e\u5206\u5e03\u4e2d\u66f4\u9ad8\u6982\u7387\uff08\u66f4\u5e72\u51c0\uff09\u7684\u533a\u57df\u3002\u91c7\u6837\u4f7f\u7528Langevin\u52a8\u529b\u5b66\u6cbf\u7740\u8be5\u68af\u5ea6\u8fdb\u884c\u3002\u57fa\u4e8e\u5206\u6570\u7684\u6a21\u578b\u548cDDPM\u5728\u968f\u673a\u5fae\u5206\u65b9\u7a0b\uff08SDE\uff09\u7684\u6846\u67b6\u4e0b\u88ab\u7edf\u4e00\uff1a\u524d\u5411\u8fc7\u7a0b\u662f\u6dfb\u52a0\u566a\u58f0\u7684SDE\uff0c\u53cd\u5411\u8fc7\u7a0b\u662f\u65f6\u95f4\u53cd\u8f6c\u7684SDE\u3002</p> </li> <li> <p>\u65e0\u5206\u7c7b\u5668\u5f15\u5bfc\uff08Ho\u548cSalimans\uff0c2022\uff09\u63a7\u5236\u6837\u672c\u8d28\u91cf\u548c\u591a\u6837\u6027\u4e4b\u95f4\u7684\u6743\u8861\u3002\u6a21\u578b\u540c\u65f6\u8fdb\u884c\u6761\u4ef6\u8bad\u7ec3\uff08\u4f7f\u7528\u6587\u672c\u63d0\u793a\u6216\u7c7b\u522b\u6807\u7b7e\uff09\u548c\u65e0\u6761\u4ef6\u8bad\u7ec3\uff08\u6761\u4ef6\u968f\u673a\u4e22\u5f03\uff09\u3002\u5728\u91c7\u6837\u65f6\uff0c\u9884\u6d4b\u662f\u52a0\u6743\u7ec4\u5408\uff1a</p> </li> </ul> \\[\\hat{\\epsilon} = \\epsilon_\\theta(x_t, \\varnothing) + s \\cdot (\\epsilon_\\theta(x_t, c) - \\epsilon_\\theta(x_t, \\varnothing))\\] <ul> <li> <p>\u5176\u4e2d\\(c\\)\u662f\u6761\u4ef6\uff0c\\(\\varnothing\\)\u662f\u7a7a\u6761\u4ef6\uff0c\\(s &gt; 1\\)\u662f\u5f15\u5bfc\u5c3a\u5ea6\u3002\\(s\\)\u8d8a\u9ad8\uff0c\u751f\u6210\u7684\u56fe\u50cf\u8d8a\u7b26\u5408\u6761\u4ef6\uff0c\u4f46\u591a\u6837\u6027\u8d8a\u4f4e\u3002\\(s = 1\\)\u662f\u65e0\u5f15\u5bfc\u6a21\u578b\uff1b\\(s = 7.5\\)\u662f\u5e38\u89c1\u7684\u9ed8\u8ba4\u503c\u3002</p> </li> <li> <p>\u9690\u6269\u6563\uff08Rombach\u7b49\u4eba\uff0c2022\uff1bStable Diffusion\uff09\u5c06\u6269\u6563\u8fc7\u7a0b\u4ece\u50cf\u7d20\u7a7a\u95f4\u8f6c\u79fb\u5230\u5b66\u4e60\u7684\u9690\u7a7a\u95f4\u4e2d\u3002\u4e00\u4e2a\u9884\u8bad\u7ec3\u7684VAE\u7f16\u7801\u5668\u5c06\u56fe\u50cf\u538b\u7f29\u4e3a\u8f83\u4f4e\u7ef4\u5ea6\u7684\u9690\u7a7a\u95f4\u8868\u793a\uff08\u901a\u5e38\u7a7a\u95f4\u4e0b\u91c7\u68374\u500d\u62168\u500d\uff09\uff0c\u6269\u6563\u5728\u8fd9\u4e2a\u538b\u7f29\u7a7a\u95f4\u4e2d\u8fdb\u884c\uff0cVAE\u89e3\u7801\u5668\u4ece\u53bb\u566a\u540e\u7684\u9690\u53d8\u91cf\u91cd\u5efa\u50cf\u7d20\u3002\u8fd9\u5927\u5927\u63d0\u9ad8\u4e86\u6548\u7387\uff1a\u5728\u50cf\u7d20\u7a7a\u95f4\u6269\u6563512x512\u56fe\u50cf\u9700\u8981\u5904\u7406\\(512 \\times 512 \\times 3\\)\u7684\u5f20\u91cf\uff0c\u4f46\u5728\u9690\u7a7a\u95f4\u4e2d\u4ec5\u9700\u5904\u7406\\(64 \\times 64 \\times 4\\)\u7684\u5f20\u91cf\u3002</p> </li> <li> <p>\u9690\u6269\u6563\u4e2d\u7684\u53bb\u566aU-Net\u63a5\u6536\u542b\u566a\u9690\u53d8\u91cf\u3001\u65f6\u95f4\u6b65\uff08\u7f16\u7801\u4e3a\u6b63\u5f26\u5d4c\u5165\uff0c\u7c7b\u4f3c\u4e8eTransformer\u4e2d\u7684\u4f4d\u7f6e\u7f16\u7801\uff09\u548c\u6761\u4ef6\u4fe1\u53f7\uff08\u6765\u81ea\u51bb\u7ed3\u7684CLIP\u6216T5\u6587\u672c\u7f16\u7801\u5668\u7684\u6587\u672c\u5d4c\u5165\uff09\u3002\u6587\u672c\u6761\u4ef6\u901a\u8fc7U-Net\u5185\u7684\u4ea4\u53c9\u6ce8\u610f\u529b\u5c42\u8fdb\u5165\uff1a\u6587\u672c\u5d4c\u5165\u4f5c\u4e3a\u952e\u548c\u503c\uff0c\u56fe\u50cf\u7279\u5f81\u4f5c\u4e3a\u67e5\u8be2\u3002\u8fd9\u4f7f\u5f97\u6a21\u578b\u5728\u6bcf\u4e2a\u7a7a\u95f4\u4f4d\u7f6e\u90fd\u80fd\u5173\u6ce8\u6587\u672c\u63d0\u793a\u7684\u76f8\u5173\u90e8\u5206\u3002</p> </li> <li> <p>\u6d41\u5339\u914d\u662f\u6269\u6563\u6a21\u578b\u7684\u4e00\u4e2a\u65b0\u5174\u66ff\u4ee3\u65b9\u6848\uff0c\u5b83\u5b66\u4e60\u566a\u58f0\u548c\u6570\u636e\u4e4b\u95f4\u7684\u76f4\u63a5\u4f20\u8f93\u8def\u5f84\uff0c\u800c\u4e0d\u662fDDPM\u7684\u8fed\u4ee3\u53bb\u566a\u3002</p> </li> <li> <p>\u8fde\u7eed\u5f52\u4e00\u5316\u6d41\uff08CNF\uff09\u5b9a\u4e49\u4e86\u4e00\u4e2a\u65f6\u95f4\u76f8\u5173\u7684\u901f\u5ea6\u573a\\(v_\\theta(x, t)\\)\uff0c\u6cbf\u7740\u5e73\u6ed1\u8f68\u8ff9\u5c06\u6837\u672c\u4ece\u7b80\u5355\u5206\u5e03\\(p_0\\)\uff08\u566a\u58f0\uff09\u63a8\u9001\u5230\u6570\u636e\u5206\u5e03\\(p_1\\)\u3002\u8be5\u53d8\u6362\u9075\u5faa\u4e00\u4e2a\u5e38\u5fae\u5206\u65b9\u7a0b\uff08ODE\uff09\uff1a</p> </li> </ul> \\[\\frac{dx}{dt} = v_\\theta(x, t), \\quad t \\in [0, 1]\\] <ul> <li> <p>\u4ece\\(x_0 \\sim \\mathcal{N}(0, I)\\)\u5f00\u59cb\uff0c\u5c06ODE\u5411\u524d\u79ef\u5206\u5230\\(t = 1\\)\u5373\u53ef\u5f97\u5230\u6570\u636e\u5206\u5e03\u4e2d\u7684\u6837\u672c\u3002\u901f\u5ea6\u573a\u7531\u795e\u7ecf\u7f51\u7edc\u53c2\u6570\u5316\uff0c\u8bad\u7ec3\u76ee\u6807\u662f\u5339\u914d\u76ee\u6807\u6761\u4ef6\u6d41\u3002</p> </li> <li> <p>\u6700\u4f18\u4f20\u8f93\uff08OT\uff09\u6d41\u5339\u914d\uff08Lipman\u7b49\u4eba\uff0c2023\uff09\u4f7f\u7528\u566a\u58f0\u548c\u6570\u636e\u4e4b\u95f4\u7684\u76f4\u7ebf\u8def\u5f84\u4f5c\u4e3a\u76ee\u6807\u6d41\uff1a\u4ece\u566a\u58f0\u6837\u672c\\(x_0\\)\u5230\u6570\u636e\u6837\u672c\\(x_1\\)\u7684\u6761\u4ef6\u8def\u5f84\u7b80\u5355\u5730\u662f\\(x_t = (1 - t) x_0 + t x_1\\)\uff0c\u76ee\u6807\u901f\u5ea6\u4e3a\\(v = x_1 - x_0\\)\u3002\u8bad\u7ec3\u635f\u5931\u53d8\u4e3a\uff1a</p> </li> </ul> \\[\\mathcal{L} = \\mathbb{E}_{t, x_0, x_1} \\left[\\|v_\\theta(x_t, t) - (x_1 - x_0)\\|^2\\right]\\] <ul> <li> <p>\u6574\u6d41\u6d41\uff08Liu\u7b49\u4eba\uff0c2022\uff09\u901a\u8fc7\u8fed\u4ee3\u65b9\u5f0f\u62c9\u76f4\u5b66\u4e60\u5230\u7684\u6d41\u8def\u5f84\u3002\u5728\u521d\u59cb\u8bad\u7ec3\u540e\uff0c\u6a21\u578b\u901a\u8fc7\u6a21\u62dfODE\u751f\u6210\uff08\u566a\u58f0\uff0c\u6570\u636e\uff09\u5bf9\u3002\u8fd9\u4e9b\u6bd4\u968f\u673a\u914d\u5bf9\u66f4\u7d27\u5bc6\u5bf9\u9f50\u7684\u5bf9\u7528\u4e8e\u91cd\u65b0\u8bad\u7ec3\u6a21\u578b\u3002\u91cd\u590d\u6b64\u8fc7\u7a0b\u4f1a\u4ea7\u751f\u8d8a\u6765\u8d8a\u76f4\u7684\u8def\u5f84\uff0c\u53ef\u4ee5\u901a\u8fc7\u66f4\u5c11\u7684ODE\u6b65\u9aa4\uff08\u751a\u81f3\u5355\u6b65\uff09\u6765\u904d\u5386\uff0c\u4ece\u800c\u5b9e\u73b0\u6781\u5feb\u901f\u7684\u751f\u6210\u3002</p> </li> <li> <p>\u6d41\u5339\u914d\u76f8\u6bd4\u6269\u6563\u6709\u51e0\u4e2a\u4f18\u52bf\uff1a\u8bad\u7ec3\u76ee\u6807\u66f4\u7b80\u5355\uff08\u76f4\u63a5\u7684\u901f\u5ea6\u56de\u5f52\uff0c\u65e0\u9700\u566a\u58f0\u8c03\u5ea6\uff09\uff0c\u91c7\u6837ODE\u66f4\u5e73\u6ed1\uff08\u9700\u8981\u7684\u79ef\u5206\u6b65\u9aa4\u66f4\u5c11\uff09\uff0c\u4e0e\u6700\u4f18\u4f20\u8f93\u7684\u8054\u7cfb\u63d0\u4f9b\u4e86\u7406\u8bba\u4f9d\u636e\u3002Stable Diffusion 3\u548cFlux\u4f7f\u7528\u6d41\u5339\u914d\u66ff\u4ee3\u4e86\u4f20\u7edf\u7684DDPM\u3002</p> </li> </ul>"},{"location":"chapter%2008%3A%20computer%20vision/04.%20vision%20transformers%20and%20generation/#colabnotebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528CoLab\u6216notebook\uff09","text":"<ol> <li> <p>\u4ece\u5934\u5b9e\u73b0ViT\u56fe\u50cf\u5757\u5d4c\u5165\u3002\u5c06\u56fe\u50cf\u5206\u5272\u6210\u56fe\u50cf\u5757\uff0c\u5c55\u5e73\uff0c\u6295\u5f71\u5230\u6a21\u578b\u7ef4\u5ea6\uff0c\u6dfb\u52a0\u4f4d\u7f6e\u5d4c\u5165\uff0c\u5e76\u524d\u7f6e[CLS]\u6807\u8bb0\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef create_patch_embedding(image, patch_size, d_model, params):\n    \"\"\"\u5c06\u56fe\u50cf\u8f6c\u6362\u4e3a\u56fe\u50cf\u5757\u5d4c\u5165\u5e8f\u5217\u3002\"\"\"\n    H, W, C = image.shape\n    n_patches_h = H // patch_size\n    n_patches_w = W // patch_size\n    n_patches = n_patches_h * n_patches_w\n\n    # \u63d0\u53d6\u56fe\u50cf\u5757\n    patches = []\n    for i in range(n_patches_h):\n        for j in range(n_patches_w):\n            patch = image[i*patch_size:(i+1)*patch_size,\n                          j*patch_size:(j+1)*patch_size, :]\n            patches.append(patch.ravel())\n    patches = jnp.stack(patches)  # (N, P*P*C)\n\n    # \u7ebf\u6027\u6295\u5f71\u5230d_model\n    embeddings = patches @ params['proj_w'] + params['proj_b']  # (N, d_model)\n\n    # \u524d\u7f6eCLS\u6807\u8bb0\n    cls_token = params['cls_token']  # (1, d_model)\n    embeddings = jnp.concatenate([cls_token, embeddings], axis=0)  # (N+1, d_model)\n\n    # \u6dfb\u52a0\u4f4d\u7f6e\u5d4c\u5165\n    embeddings = embeddings + params['pos_embed']  # (N+1, d_model)\n\n    return embeddings, patches\n\n# \u8bbe\u7f6e\nH, W, C = 32, 32, 3\npatch_size = 8\nd_model = 64\nn_patches = (H // patch_size) * (W // patch_size)  # 16\n\nkey = jax.random.PRNGKey(42)\nkeys = jax.random.split(key, 5)\n\n# \u521b\u5efa\u5177\u6709\u4e0d\u540c\u8c61\u9650\u7684\u5408\u6210\u56fe\u50cf\nimage = jnp.zeros((H, W, C))\nimage = image.at[:16, :16, 0].set(1.0)   # \u7ea2\u8272 \u5de6\u4e0a\nimage = image.at[:16, 16:, 1].set(1.0)   # \u7eff\u8272 \u53f3\u4e0a\nimage = image.at[16:, :16, 2].set(1.0)   # \u84dd\u8272 \u5de6\u4e0b\nimage = image.at[16:, 16:, :2].set(1.0)  # \u9ec4\u8272 \u53f3\u4e0b\n\nparams = {\n    'proj_w': jax.random.normal(keys[0], (patch_size**2 * C, d_model)) * 0.02,\n    'proj_b': jnp.zeros(d_model),\n    'cls_token': jax.random.normal(keys[1], (1, d_model)) * 0.02,\n    'pos_embed': jax.random.normal(keys[2], (n_patches + 1, d_model)) * 0.02,\n}\n\nembeddings, patches = create_patch_embedding(image, patch_size, d_model, params)\n\nprint(f\"\u56fe\u50cf\u5f62\u72b6: {image.shape}\")\nprint(f\"\u56fe\u50cf\u5757\u5927\u5c0f: {patch_size}x{patch_size}\")\nprint(f\"\u56fe\u50cf\u5757\u6570\u91cf: {n_patches}\")\nprint(f\"\u56fe\u50cf\u5757\u5411\u91cf\u957f\u5ea6: {patch_size**2 * C}\")\nprint(f\"\u5d4c\u5165\u5f62\u72b6: {embeddings.shape}  (CLS + {n_patches} \u4e2a\u56fe\u50cf\u5757)\")\n\n# \u53ef\u89c6\u5316\u56fe\u50cf\u5757\nfig, axes = plt.subplots(2, 5, figsize=(14, 6))\naxes[0, 0].imshow(image); axes[0, 0].set_title('\u5b8c\u6574\u56fe\u50cf'); axes[0, 0].axis('off')\nfor idx in range(min(9, n_patches)):\n    ax = axes[(idx+1) // 5, (idx+1) % 5]\n    patch_img = patches[idx].reshape(patch_size, patch_size, C)\n    ax.imshow(patch_img); ax.set_title(f'\u56fe\u50cf\u5757 {idx}'); ax.axis('off')\nplt.suptitle('ViT \u56fe\u50cf\u5757\u5206\u89e3')\nplt.tight_layout(); plt.show()\n</code></pre></p> </li> <li> <p>\u5b9e\u73b0\u4e00\u4e2a\u7b80\u5355\u7684GAN\u8bad\u7ec3\u5faa\u73af\u3002\u5728\u4e8c\u7ef4\u6570\u636e\u4e0a\u8bad\u7ec3\u751f\u6210\u5668\u548c\u5224\u522b\u5668\uff0c\u5e76\u53ef\u89c6\u5316\u751f\u6210\u5206\u5e03\u9010\u6e10\u6536\u655b\u5230\u771f\u5b9e\u5206\u5e03\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef generator(z, params):\n    h = jnp.tanh(z @ params['g_w1'] + params['g_b1'])\n    h = jnp.tanh(h @ params['g_w2'] + params['g_b2'])\n    return h @ params['g_w3'] + params['g_b3']\n\ndef discriminator(x, params):\n    h = jax.nn.leaky_relu(x @ params['d_w1'] + params['d_b1'], 0.2)\n    h = jax.nn.leaky_relu(h @ params['d_w2'] + params['d_b2'], 0.2)\n    return jax.nn.sigmoid(h @ params['d_w3'] + params['d_b3'])\n\ndef init_params(key):\n    keys = jax.random.split(key, 6)\n    z_dim, h_dim, data_dim = 2, 32, 2\n    scale = 0.1\n    return {\n        'g_w1': jax.random.normal(keys[0], (z_dim, h_dim)) * scale,\n        'g_b1': jnp.zeros(h_dim),\n        'g_w2': jax.random.normal(keys[1], (h_dim, h_dim)) * scale,\n        'g_b2': jnp.zeros(h_dim),\n        'g_w3': jax.random.normal(keys[2], (h_dim, data_dim)) * scale,\n        'g_b3': jnp.zeros(data_dim),\n        'd_w1': jax.random.normal(keys[3], (data_dim, h_dim)) * scale,\n        'd_b1': jnp.zeros(h_dim),\n        'd_w2': jax.random.normal(keys[4], (h_dim, h_dim)) * scale,\n        'd_b2': jnp.zeros(h_dim),\n        'd_w3': jax.random.normal(keys[5], (h_dim, 1)) * scale,\n        'd_b3': jnp.zeros(1),\n    }\n\ndef d_loss(params, real_data, fake_data):\n    real_score = discriminator(real_data, params)\n    fake_score = discriminator(fake_data, params)\n    return -jnp.mean(jnp.log(real_score + 1e-7) + jnp.log(1 - fake_score + 1e-7))\n\ndef g_loss(params, fake_data):\n    fake_score = discriminator(fake_data, params)\n    return -jnp.mean(jnp.log(fake_score + 1e-7))\n\n# \u771f\u5b9e\u6570\u636e\uff1a\u73af\u5f62\u5206\u5e03\nkey = jax.random.PRNGKey(42)\ntheta = jax.random.uniform(key, (512,)) * 2 * jnp.pi\nreal_data = jnp.stack([jnp.cos(theta), jnp.sin(theta)], axis=1)\nreal_data = real_data + jax.random.normal(key, real_data.shape) * 0.05\n\nparams = init_params(jax.random.PRNGKey(0))\nd_grad = jax.grad(d_loss)\ng_grad = jax.grad(g_loss)\nlr = 0.001\n\nsnapshots = []\nfor step in range(3000):\n    key, k1 = jax.random.split(key)\n    z = jax.random.normal(k1, (512, 2))\n    fake_data = generator(z, params)\n\n    # \u66f4\u65b0\u5224\u522b\u5668\n    grads = d_grad(params, real_data, fake_data)\n    for k in ['d_w1', 'd_b1', 'd_w2', 'd_b2', 'd_w3', 'd_b3']:\n        params[k] = params[k] - lr * grads[k]\n\n    # \u66f4\u65b0\u751f\u6210\u5668\n    fake_data = generator(z, params)\n    grads = g_grad(params, fake_data)\n    for k in ['g_w1', 'g_b1', 'g_w2', 'g_b2', 'g_w3', 'g_b3']:\n        params[k] = params[k] - lr * grads[k]\n\n    if step in [0, 500, 1500, 2999]:\n        snapshots.append((step, fake_data.copy()))\n\nfig, axes = plt.subplots(1, 4, figsize=(16, 4))\nfor ax, (step, fake) in zip(axes, snapshots):\n    ax.scatter(real_data[:, 0], real_data[:, 1], s=5, alpha=0.3, c='#3498db', label='\u771f\u5b9e')\n    ax.scatter(fake[:, 0], fake[:, 1], s=5, alpha=0.3, c='#e74c3c', label='\u751f\u6210')\n    ax.set_title(f'\u6b65\u9aa4 {step}'); ax.set_xlim(-2, 2); ax.set_ylim(-2, 2)\n    ax.set_aspect('equal'); ax.legend(markerscale=3)\nplt.suptitle('GAN\u8bad\u7ec3\uff1a\u751f\u6210\u5668\u5b66\u4e60\u73af\u5f62\u5206\u5e03')\nplt.tight_layout(); plt.show()\n</code></pre></p> </li> <li> <p>\u5b9e\u73b0\u6269\u6563\u524d\u5411\u8fc7\u7a0b\uff1a\u5728\u4e0d\u540c\u65f6\u95f4\u6b65\u5411\u56fe\u50cf\u6dfb\u52a0\u566a\u58f0\uff0c\u5e76\u53ef\u89c6\u5316\u9010\u6b65\u7834\u574f\u8fc7\u7a0b\u3002\u7136\u540e\u5b9e\u73b0\u5355\u6b65\u53bb\u566a\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef noise_schedule(T, beta_start=0.0001, beta_end=0.02):\n    \"\"\"\u7ebf\u6027\u566a\u58f0\u8c03\u5ea6\u3002\"\"\"\n    betas = jnp.linspace(beta_start, beta_end, T)\n    alphas = 1.0 - betas\n    alpha_bars = jnp.cumprod(alphas)\n    return betas, alphas, alpha_bars\n\ndef forward_diffusion(x0, t, alpha_bars, key):\n    \"\"\"\u5728\u65f6\u95f4\u6b65t\u5411x0\u6dfb\u52a0\u566a\u58f0\u3002\"\"\"\n    alpha_bar_t = alpha_bars[t]\n    noise = jax.random.normal(key, x0.shape)\n    xt = jnp.sqrt(alpha_bar_t) * x0 + jnp.sqrt(1 - alpha_bar_t) * noise\n    return xt, noise\n\n# \u521b\u5efa\u7b80\u5355\u76842D\"\u56fe\u50cf\"\uff08\u68cb\u76d8\u683c\uff09\nimg = jnp.zeros((32, 32))\nfor i in range(4):\n    for j in range(4):\n        if (i + j) % 2 == 0:\n            img = img.at[i*8:(i+1)*8, j*8:(j+1)*8].set(1.0)\n\nT = 1000\nbetas, alphas, alpha_bars = noise_schedule(T)\n\n# \u53ef\u89c6\u5316\u524d\u5411\u8fc7\u7a0b\ntimesteps = [0, 50, 200, 500, 999]\nkey = jax.random.PRNGKey(42)\n\nfig, axes = plt.subplots(1, len(timesteps), figsize=(16, 3.5))\nfor ax, t in zip(axes, timesteps):\n    key, subkey = jax.random.split(key)\n    xt, noise = forward_diffusion(img, t, alpha_bars, subkey)\n    ax.imshow(xt, cmap='gray', vmin=-2, vmax=2)\n    ax.set_title(f't={t}\\n$\\\\bar{{\\\\alpha}}$={alpha_bars[t]:.3f}')\n    ax.axis('off')\nplt.suptitle('\u6269\u6563\u524d\u5411\u8fc7\u7a0b\uff1a\u9010\u6b65\u6dfb\u52a0\u566a\u58f0')\nplt.tight_layout(); plt.show()\n\n# \u7b80\u5355\u53bb\u566a\uff1a\u8bad\u7ec3\u5c0f\u578b\u7f51\u7edc\u5728t=200\u65f6\u9884\u6d4b\u566a\u58f0\nt_denoise = 200\nkey, k1 = jax.random.split(key)\nxt, true_noise = forward_diffusion(img, t_denoise, alpha_bars, k1)\n\n# \u5c0f\u578b\"\u53bb\u566a\u5668\"\uff1a\u4ec5\u5b66\u4e60\u6052\u5b9a\u7684\u566a\u58f0\u4f30\u8ba1\uff08\u7528\u4e8e\u6f14\u793a\uff09\nnoise_estimate = jnp.zeros_like(img)\nlr = 0.01\nfor step in range(100):\n    residual = noise_estimate - true_noise\n    noise_estimate = noise_estimate - lr * residual\n\n# \u53cd\u5411\u4e00\u6b65\nalpha_bar_t = alpha_bars[t_denoise]\nx_denoised = (xt - jnp.sqrt(1 - alpha_bar_t) * noise_estimate) / jnp.sqrt(alpha_bar_t)\n\nfig, axes = plt.subplots(1, 3, figsize=(12, 4))\naxes[0].imshow(img, cmap='gray'); axes[0].set_title('\u539f\u59cb $x_0$'); axes[0].axis('off')\naxes[1].imshow(xt, cmap='gray', vmin=-2, vmax=2)\naxes[1].set_title(f'\u542b\u566a $x_{{200}}$'); axes[1].axis('off')\naxes[2].imshow(x_denoised, cmap='gray')\naxes[2].set_title('\u53bb\u566a\u540e\uff08\u5355\u6b65\uff09'); axes[2].axis('off')\nplt.tight_layout(); plt.show()\n\nmse = jnp.mean((x_denoised - img)**2)\nprint(f\"\u53bb\u566aMSE: {mse:.4f}\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2008%3A%20computer%20vision/05.%20video%20and%203D%20vision/","title":"\u89c6\u9891\u4e0e3D\u89c6\u89c9","text":"<p>\u89c6\u9891\u4e0e3D\u89c6\u89c9\u5c06\u56fe\u50cf\u7406\u89e3\u6269\u5c55\u5230\u65f6\u95f4\u57df\u548c\u7a7a\u95f4\u57df\u3002\u672c\u6587\u6db5\u76d6\u5149\u6d41\u3001\u89c6\u9891\u5206\u7c7b\uff083D\u5377\u79ef\u7f51\u7edc\u3001TimeSformer\uff09\u3001\u76ee\u6807\u8ddf\u8e2a\uff08SORT\u3001DeepSORT\uff09\u3001\u52a8\u4f5c\u8bc6\u522b\u3001\u6df1\u5ea6\u4f30\u8ba1\uff08\u5355\u76ee\u4e0e\u7acb\u4f53\uff09\u3001\u70b9\u4e91\u3001\u795e\u7ecf\u8f90\u5c04\u573a\uff08NeRF\uff09\u548c3D\u9ad8\u65af\u6cfc\u6e85\u3002</p> <ul> <li> <p>\u6587\u4ef601-04\u5c06\u56fe\u50cf\u89c6\u4e3a\u5b64\u7acb\u5feb\u7167\u3002\u4f46\u89c6\u89c9\u4e16\u754c\u662f\u8fde\u7eed\u7684\uff1a\u7269\u4f53\u5728\u8fd0\u52a8\uff0c\u573a\u666f\u5728\u53d8\u5316\uff0c\u6df1\u5ea6\u771f\u5b9e\u5b58\u5728\u3002\u672c\u6587\u5c06\u8ba1\u7b97\u673a\u89c6\u89c9\u6269\u5c55\u5230\u65f6\u95f4\u57df\uff08\u89c6\u9891\uff09\u548c\u7a7a\u95f4\u57df\uff083D\uff09\uff0c\u6db5\u76d6\u6a21\u578b\u5982\u4f55\u7406\u89e3\u8fd0\u52a8\u3001\u8ddf\u8e2a\u76ee\u6807\u3001\u4f30\u8ba1\u6df1\u5ea6\u548c\u91cd\u5efa\u573a\u666f\u3002</p> </li> <li> <p>\u89c6\u9891\u662f\u4e00\u7cfb\u5217\u968f\u65f6\u95f4\u6355\u83b7\u7684\u56fe\u50cf\uff08\u5e27\uff09\u3002\u4ee530\u5e27/\u79d2\u8ba1\u7b97\uff0c\u4e00\u6bb510\u79d2\u7684\u7247\u6bb5\u5305\u542b300\u5e27\u3002\u5173\u952e\u6311\u6218\u5728\u4e8e\u5efa\u6a21\u65f6\u95f4\u7ef4\u5ea6\uff1a\u7269\u4f53\u5982\u4f55\u8fd0\u52a8\uff0c\u573a\u666f\u5982\u4f55\u6f14\u53d8\uff0c\u4ee5\u53ca\u5982\u4f55\u8de8\u5e27\u5173\u8054\u4fe1\u606f\u3002</p> </li> <li> <p>\u5149\u6d41\u4f30\u8ba1\u4e24\u5e27\u8fde\u7eed\u56fe\u50cf\u4e4b\u95f4\u50cf\u7d20\u7684\u8868\u89c2\u8fd0\u52a8\u3002\u5bf9\u4e8e\u5e27\\(t\\)\u4e2d\u7684\u6bcf\u4e2a\u50cf\u7d20\uff0c\u5149\u6d41\u4ea7\u751f\u4e00\u4e2a\u4e8c\u7ef4\u4f4d\u79fb\u5411\u91cf\\((u, v)\\)\uff0c\u6307\u5411\u8be5\u50cf\u7d20\u5728\u5e27\\(t+1\\)\u4e2d\u7684\u4f4d\u7f6e\u3002\u7ed3\u679c\u662f\u4e00\u4e2a\u4e0e\u56fe\u50cf\u5927\u5c0f\u76f8\u540c\u7684\u7a20\u5bc6\u8fd0\u52a8\u573a\u3002</p> </li> </ul> <p></p> <ul> <li>\u5149\u6d41\u5728\u4eae\u5ea6\u6052\u5e38\u6027\u5047\u8bbe\u4e0b\u8ba1\u7b97\uff1a\u50cf\u7d20\u7684\u5f3a\u5ea6\u5728\u5176\u79fb\u52a8\u65f6\u4e0d\u53d8\u3002\u5982\u679c\u5e27\\(t\\)\u4e2d\u4f4d\u7f6e\\((x, y)\\)\u5904\u7684\u50cf\u7d20\u5f3a\u5ea6\u4e3a\\(I(x, y, t)\\)\uff0c\u5e76\u5728\u5c0f\u65f6\u95f4\u95f4\u9694\\(\\delta t\\)\u5185\u79fb\u52a8\u4e86\\((u, v)\\)\uff1a</li> </ul> \\[I(x + u\\delta t, \\, y + v\\delta t, \\, t + \\delta t) = I(x, y, t)\\] <ul> <li>\u8fdb\u884c\u4e00\u9636\u6cf0\u52d2\u5c55\u5f00\uff08\u89c1\u7b2c03\u7ae0\uff09\u5e76\u9664\u4ee5\\(\\delta t\\)\uff1a</li> </ul> \\[I_x u + I_y v + I_t = 0\\] <ul> <li> <p>\u5176\u4e2d\\(I_x, I_y\\)\u662f\u7a7a\u95f4\u68af\u5ea6\uff08Sobel\u7b97\u5b50\uff0c\u89c1\u6587\u4ef601\uff09\uff0c\\(I_t\\)\u662f\u65f6\u95f4\u68af\u5ea6\uff08\u76f8\u90bb\u5e27\u7684\u5dee\u503c\uff09\u3002\u8fd9\u5c31\u662f\u5149\u6d41\u7ea6\u675f\u65b9\u7a0b\u3002\u4e00\u4e2a\u65b9\u7a0b\uff0c\u4e24\u4e2a\u672a\u77e5\u6570\\((u, v)\\)\uff1a\u6211\u4eec\u9700\u8981\u989d\u5916\u7684\u7ea6\u675f\u6761\u4ef6\u3002</p> </li> <li> <p>Lucas-Kanade\u5047\u8bbe\u5149\u6d41\u5728\u4e00\u4e2a\u5c0f\u7a97\u53e3\u5185\uff08\u4f8b\u59825x5\u50cf\u7d20\uff09\u662f\u6052\u5b9a\u7684\u3002\u8fd9\u7ed9\u51fa\u4e86\u4e00\u4e2a\u8d85\u5b9a\u7cfb\u7edf\uff0825\u4e2a\u65b9\u7a0b\uff0c2\u4e2a\u672a\u77e5\u6570\uff09\uff0c\u901a\u8fc7\u6700\u5c0f\u4e8c\u4e58\u6cd5\u6c42\u89e3\uff08\u7b2c06\u7ae0\u7684\u6b63\u89c4\u65b9\u7a0b\uff09\uff1a</p> </li> </ul> \\[ \\begin{bmatrix} u \\\\ v \\end{bmatrix} = \\begin{bmatrix} \\sum I_x^2 &amp; \\sum I_x I_y \\\\ \\sum I_x I_y &amp; \\sum I_y^2 \\end{bmatrix}^{-1} \\begin{bmatrix} -\\sum I_x I_t \\\\ -\\sum I_y I_t \\end{bmatrix} \\] <ul> <li> <p>\u8fd9\u4e2a2x2\u77e9\u9635\u5c31\u662f\u6587\u4ef601\u4e2d\u7684\u7ed3\u6784\u5f20\u91cf\uff08\u4e0eHarris\u89d2\u70b9\u68c0\u6d4b\u4e2d\u4f7f\u7528\u7684\u77e9\u9635\u76f8\u540c\uff09\u3002Lucas-Kanade\u9002\u7528\u4e8e\u5c0f\u8fd0\u52a8\uff0c\u4f46\u5f53\u7269\u4f53\u5728\u5e27\u95f4\u79fb\u52a8\u8d85\u8fc7\u51e0\u4e2a\u50cf\u7d20\u65f6\u4f1a\u5931\u6548\u3002</p> </li> <li> <p>Farneback\u65b9\u6cd5\u5bf9\u6bcf\u4e2a\u50cf\u7d20\u90bb\u57df\u8fdb\u884c\u591a\u9879\u5f0f\u5c55\u5f00\uff0c\u5e76\u4f30\u8ba1\u6700\u80fd\u89e3\u91ca\u5e27\u95f4\u53d8\u5316\u7684\u4f4d\u79fb\u573a\u3002\u5b83\u4ea7\u751f\u7a20\u5bc6\u5149\u6d41\uff08\u6bcf\u4e2a\u50cf\u7d20\u4e00\u4e2a\u5411\u91cf\uff09\uff0c\u80fd\u5904\u7406\u6bd4Lucas-Kanade\u66f4\u5927\u7684\u8fd0\u52a8\u3002</p> </li> <li> <p>\u73b0\u4ee3\u6df1\u5ea6\u5b66\u4e60\u5149\u6d41\u65b9\u6cd5\uff08FlowNet\u3001RAFT\uff09\u5b66\u4e60\u4ece\u5e27\u5bf9\u7aef\u5230\u7aef\u9884\u6d4b\u5149\u6d41\u3002RAFT\uff08Recurrent All-Pairs Field Transforms\uff0cTeed\u548cDeng\uff0c2020\uff09\u8ba1\u7b97\u4e24\u5e27\u4e2d\u6240\u6709\u50cf\u7d20\u5bf9\u4e4b\u95f4\u76844D\u76f8\u5173\u4f53\uff0c\u5e76\u4f7f\u7528\u57fa\u4e8eGRU\u7684\u66f4\u65b0\u7b97\u5b50\u8fed\u4ee3\u4f18\u5316\u5149\u6d41\u4f30\u8ba1\u3002RAFT\u8fbe\u5230\u4e86\u6700\u5148\u8fdb\u7684\u7cbe\u5ea6\uff0c\u5e76\u5df2\u6210\u4e3a\u6807\u51c6\u7684\u5149\u6d41\u9aa8\u5e72\u7f51\u7edc\u3002</p> </li> <li> <p>\u53cc\u6d41\u7f51\u7edc\uff08Simonyan\u548cZisserman\uff0c2014\uff09\u662f\u89c6\u9891\u7406\u89e3\u7684\u65e9\u671f\u65b9\u6cd5\u3002\u4e00\u4e2a\u6d41\u5904\u7406\u5355\u5e27RGB\u56fe\u50cf\uff08\u5916\u89c2\uff09\uff0c\u53e6\u4e00\u4e2a\u6d41\u5904\u7406\u5149\u6d41\u5e27\u7684\u5806\u53e0\uff08\u8fd0\u52a8\uff09\u3002\u4e24\u4e2a\u6d41\u5728\u672b\u7aef\u878d\u5408\uff08\u901a\u8fc7\u5e73\u5747\u6216\u62fc\u63a5\uff09\u3002\u8fd9\u79cd\u67b6\u6784\u660e\u786e\u533a\u5206\u4e86\"\u4e8b\u7269\u770b\u8d77\u6765\u50cf\u4ec0\u4e48\"\u4e0e\"\u5b83\u4eec\u5982\u4f55\u8fd0\u52a8\"\u3002</p> </li> <li> <p>3D\u5377\u79ef\u7f51\u7edc\u5c062D\u5377\u79ef\u6269\u5c55\u5230\u65f6\u95f4\u7ef4\u5ea6\u30023D\u5377\u79ef\u4f7f\u7528\u5927\u5c0f\u4e3a\\(k \\times k \\times k_t\\)\u7684\u6ee4\u6ce2\u5668\uff0c\u540c\u65f6\u8de8\u8d8a\u7a7a\u95f4\u548c\u65f6\u95f4\u7ef4\u5ea6\uff0c\u76f4\u63a5\u5b66\u4e60\u65f6\u7a7a\u7279\u5f81\u3002</p> </li> <li> <p>C3D\uff08Tran\u7b49\u4eba\uff0c2015\uff09\u5806\u53e0\u4e863x3x3\u6ee4\u6ce2\u5668\u76843D\u5377\u79ef\uff0c\u5c55\u793a\u4e86\u65f6\u95f4\u5377\u79ef\u53ef\u4ee5\u5728\u6ca1\u6709\u663e\u5f0f\u5149\u6d41\u7684\u60c5\u51b5\u4e0b\u5b66\u4e60\u8fd0\u52a8\u7279\u5f81\u3002\u4ee3\u4ef7\u662f\u9ad8\u6602\u7684\uff1a3D\u5377\u79ef\u7684\u53c2\u6570\u548c\u8ba1\u7b97\u91cf\u662f\u51762D\u5bf9\u5e94\u7269\u7684\\(k_t\\)\u500d\u3002</p> </li> <li> <p>I3D\uff08Inflated 3D\uff0cCarreira\u548cZisserman\uff0c2017\uff09\u91c7\u7528\u4e86\u4e00\u79cd\u66f4\u5b9e\u7528\u7684\u65b9\u6cd5\uff1a\u4ece\u9884\u8bad\u7ec3\u76842D CNN\uff08\u5982Inception\u6216ResNet\uff09\u5f00\u59cb\uff0c\u5c06\u6240\u67092D\u6ee4\u6ce2\u5668\u6cbf\u65f6\u95f4\u7ef4\u5ea6\"\u81a8\u80c0\"\u4e3a3D\uff0c\u91cd\u590d\u6743\u91cd\u5e76\u9664\u4ee5\\(k_t\\)\u3002\u8fd9\u5c06ImageNet\u9884\u8bad\u7ec3\u8fc1\u79fb\u5230\u89c6\u9891\uff0c\u540c\u65f6\u589e\u52a0\u4e86\u65f6\u95f4\u5efa\u6a21\u80fd\u529b\u3002\u4e00\u4e2a2D\u7684\\(k \\times k\\)\u6ee4\u6ce2\u5668\u53d8\u4e3a\\(k \\times k \\times k_t\\)\u7684\u6ee4\u6ce2\u5668\uff0c\u521d\u59cb\u5316\u4e3a\\(W_{\\text{3D}}[:,:,j] = W_{\\text{2D}} / k_t\\)\uff0c\u5bf9\u6240\u6709\u65f6\u95f4\u4f4d\u7f6e\\(j\\)\u3002</p> </li> <li> <p>SlowFast\u7f51\u7edc\uff08Feichtenhofer\u7b49\u4eba\uff0c2019\uff09\u4f7f\u7528\u4e24\u6761\u5e76\u884c\u7684\u8def\u5f84\uff0c\u4ee5\u4e0d\u540c\u7684\u65f6\u95f4\u5206\u8fa8\u7387\u8fd0\u884c\uff1a</p> <ul> <li>Slow\u8def\u5f84\u4ee5\u4f4e\u5e27\u7387\uff08\u4f8b\u5982\u6bcf16\u5e27\uff09\u5904\u7406\u5e27\uff0c\u5177\u6709\u9ad8\u7a7a\u95f4\u5206\u8fa8\u7387\u548c\u66f4\u591a\u901a\u9053\uff0c\u6355\u83b7\u7cbe\u7ec6\u7684\u7a7a\u95f4\u7ec6\u8282\u3002</li> <li>Fast\u8def\u5f84\u4ee5\u9ad8\u5e27\u7387\uff08\u6bcf2\u5e27\uff09\u5904\u7406\u5e27\uff0c\u7a7a\u95f4\u5206\u8fa8\u7387\u964d\u4f4e\u4e14\u901a\u9053\u6570\u8f83\u5c11\uff08\u901a\u5e38\u4e3aSlow\u8def\u5f84\u7684\\(1/8\\)\uff09\uff0c\u6355\u83b7\u5feb\u901f\u7684\u65f6\u95f4\u53d8\u5316\u3002</li> <li>\u4fa7\u5411\u8fde\u63a5\u901a\u8fc7\u6b65\u957f\u5377\u79ef\u5c06\u4fe1\u606f\u4eceFast\u878d\u5408\u5230Slow\u3002</li> </ul> </li> <li> <p>\u5176\u6838\u5fc3\u6d1e\u89c1\u662f\uff1a\u7a7a\u95f4\u548c\u65f6\u95f4\u4fe1\u606f\u5177\u6709\u4e0d\u540c\u7684\u5e26\u5bbd\u9700\u6c42\u2014\u2014\u7269\u4f53\u5916\u89c2\u53d8\u5316\u7f13\u6162\uff0c\u4f46\u8fd0\u52a8\u53ef\u4ee5\u5f88\u8fc5\u901f\u3002SlowFast\u901a\u8fc7\u8bbe\u8ba1\u5339\u914d\u8fd9\u79cd\u975e\u5bf9\u79f0\u6027\u3002</p> </li> <li> <p>TimeSformer\uff08Bertasius\u7b49\u4eba\uff0c2021\uff09\u5c06Vision Transformer\u5e94\u7528\u4e8e\u89c6\u9891\u3002\u5b83\u5c06\u5b8c\u6574\u7684\u65f6\u7a7a\u6ce8\u610f\u529b\uff08\u4ee3\u4ef7\u8fc7\u9ad8\uff1a\\(O((T \\times N)^2)\\)\uff0c\u5176\u4e2d\\(T\\)\u4e3a\u5e27\u6570\uff0c\\(N\\)\u4e3a\u6bcf\u5e27\u7684\u5757\u6570\uff09\u5206\u89e3\u4e3a\u5206\u5757\u6ce8\u610f\u529b\uff1a\u6bcf\u4e2a\u5757\u5728\u65f6\u95f4\u6ce8\u610f\uff08\u6bcf\u4e2a\u5757\u5728\u76f8\u540c\u7a7a\u95f4\u4f4d\u7f6e\u8de8\u65f6\u95f4\u8fdb\u884c\u6ce8\u610f\u529b\uff09\u548c\u7a7a\u95f4\u6ce8\u610f\uff08\u6bcf\u4e2a\u5757\u5728\u540c\u4e00\u5e27\u5185\u8de8\u7a7a\u95f4\u8fdb\u884c\u6ce8\u610f\u529b\uff09\u4e4b\u95f4\u4ea4\u66ff\u3002\u8fd9\u4f7f\u4ee3\u4ef7\u4ece\\(O(T^2 N^2)\\)\u964d\u4f4e\u5230\\(O(T^2 + N^2)\\)\u3002</p> </li> <li> <p>VideoMAE\uff08Tong\u7b49\u4eba\uff0c2022\uff09\u5c06\u63a9\u7801\u81ea\u7f16\u7801\u5668\u601d\u60f3\uff08\u89c1\u6587\u4ef604\uff09\u6269\u5c55\u5230\u89c6\u9891\u3002\u4f7f\u7528\u6781\u9ad8\u7684\u63a9\u7801\u6bd4\u4f8b\uff0890-95%\uff09\uff0c\u56e0\u4e3a\u89c6\u9891\u5177\u6709\u9ad8\u5ea6\u7684\u65f6\u95f4\u5197\u4f59\u6027\uff1a\u76f8\u90bb\u5e27\u770b\u8d77\u6765\u51e0\u4e4e\u76f8\u540c\uff0c\u56e0\u6b64\u63a9\u7801\u5927\u90e8\u5206\u5757\u540e\u4ecd\u7136\u7559\u6709\u8db3\u591f\u7684\u4fe1\u606f\u8fdb\u884c\u91cd\u5efa\u3002VideoMAE\u5728\u65e0\u6807\u7b7e\u89c6\u9891\u4e0a\u9884\u8bad\u7ec3ViT\u9aa8\u5e72\u7f51\u7edc\uff0c\u5e76\u8fc1\u79fb\u5230\u4e0b\u6e38\u4efb\u52a1\u3002</p> </li> <li> <p>\u52a8\u4f5c\u8bc6\u522b\u5c06\u89c6\u9891\u7247\u6bb5\u5206\u7c7b\u4e3a\u591a\u79cd\u52a8\u4f5c\u7c7b\u522b\u4e4b\u4e00\uff08\u4f8b\u5982\"\u8dd1\u6b65\"\u3001\"\u70f9\u996a\"\u3001\"\u5f39\u5409\u4ed6\"\uff09\u3002\u5b83\u662f\u56fe\u50cf\u5206\u7c7b\u7684\u89c6\u9891\u5bf9\u5e94\u4efb\u52a1\u3002\u6807\u51c6\u57fa\u51c6\u6570\u636e\u96c6\u5305\u62ecKinetics-400\uff08400\u4e2a\u52a8\u4f5c\u7c7b\u522b\uff0c\u7ea630\u4e07\u4e2a\u7247\u6bb5\uff09\u3001Something-Something\uff08174\u4e2a\u9700\u8981\u65f6\u95f4\u63a8\u7406\u7684\u7ec6\u7c92\u5ea6\u52a8\u4f5c\uff09\u548cActivityNet\uff08200\u4e2a\u7c7b\u522b\uff0c\u5305\u542b\u957f\u65f6\u672a\u88c1\u526a\u89c6\u9891\uff09\u3002</p> </li> <li> <p>\u65f6\u95f4\u52a8\u4f5c\u68c0\u6d4b\u8d85\u8d8a\u4e86\u5206\u7c7b\uff1a\u7ed9\u5b9a\u4e00\u4e2a\u957f\u6bb5\u672a\u88c1\u526a\u7684\u89c6\u9891\uff0c\u627e\u5230\u6bcf\u4e2a\u52a8\u4f5c\u7684\u5f00\u59cb\u65f6\u95f4\u3001\u7ed3\u675f\u65f6\u95f4\u548c\u7c7b\u522b\u3002\u8fd9\u662f\u76ee\u6807\u68c0\u6d4b\u7684\u65f6\u95f4\u5bf9\u5e94\u4efb\u52a1\u3002ActionFormer\u7b49\u65b9\u6cd5\u4f7f\u7528Transformer\u5904\u7406\u65f6\u95f4\u7279\u5f81\u5e76\u9884\u6d4b\u52a8\u4f5c\u8fb9\u754c\u3002</p> </li> <li> <p>\u89c6\u9891\u76ee\u6807\u8ddf\u8e2a\u5728\u7b2c\u4e00\u5e27\u8bc6\u522b\u51fa\u7279\u5b9a\u76ee\u6807\u540e\uff0c\u8de8\u5e27\u8ddf\u8e2a\u8be5\u76ee\u6807\u3002</p> </li> <li> <p>SORT\uff08Simple Online and Realtime Tracking\uff0cBewley\u7b49\u4eba\uff0c2016\uff09\u5c06\u68c0\u6d4b\u6a21\u578b\uff08\u72ec\u7acb\u68c0\u6d4b\u6bcf\u5e27\u4e2d\u7684\u76ee\u6807\uff09\u4e0e\u5361\u5c14\u66fc\u6ee4\u6ce2\u5668\uff08\u7528\u4e8e\u8fd0\u52a8\u9884\u6d4b\uff09\u548c\u5308\u7259\u5229\u7b97\u6cd5\uff08\u7528\u4e8e\u5206\u914d\uff09\u76f8\u7ed3\u5408\u3002</p> </li> <li> <p>\u5361\u5c14\u66fc\u6ee4\u6ce2\u5668\u4e3a\u6bcf\u4e2a\u8ddf\u8e2a\u7684\u76ee\u6807\u7ef4\u62a4\u4e00\u4e2a\u72b6\u6001\u4f30\u8ba1\uff08\u4f4d\u7f6e\u3001\u901f\u5ea6\u3001\u5927\u5c0f\uff09\uff0c\u5e76\u4f7f\u7528\u7ebf\u6027\u8fd0\u52a8\u6a21\u578b\u9884\u6d4b\u5b83\u5728\u4e0b\u4e00\u5e27\u4e2d\u7684\u4f4d\u7f6e\u3002\u5f53\u65b0\u7684\u68c0\u6d4b\u7ed3\u679c\u5230\u8fbe\u65f6\uff0c\u5361\u5c14\u66fc\u6ee4\u6ce2\u5668\u901a\u8fc7\u7ed3\u5408\u9884\u6d4b\u503c\u548c\u89c2\u6d4b\u503c\uff08\u6309\u5404\u81ea\u7684\u4e0d\u786e\u5b9a\u6027\u52a0\u6743\uff09\u6765\u66f4\u65b0\u5176\u4f30\u8ba1\u3002\u8fd9\u662f\u8d1d\u53f6\u65af\u66f4\u65b0\uff08\u7b2c05\u7ae0\uff09\u5728\u8ddf\u8e2a\u4e2d\u7684\u5e94\u7528\u3002</p> </li> <li> <p>\u5308\u7259\u5229\u7b97\u6cd5\u89e3\u51b3\u53cc\u7ebf\u6027\u5206\u914d\u95ee\u9898\uff1a\u7ed9\u5b9a\\(M\\)\u4e2a\u5df2\u8ddf\u8e2a\u76ee\u6807\u548c\\(N\\)\u4e2a\u65b0\u68c0\u6d4b\u7ed3\u679c\uff0c\u627e\u5230\u4f7f\u603b\u4ee3\u4ef7\u6700\u5c0f\u5316\u7684\u6700\u4f18\u4e00\u5bf9\u4e00\u5339\u914d\uff08\u4f7f\u7528\u6587\u4ef603\u4e2d\u7684IoU\u8ddd\u79bb\uff09\u3002\u672a\u5339\u914d\u7684\u68c0\u6d4b\u7ed3\u679c\u5f00\u59cb\u65b0\u7684\u8f68\u8ff9\uff1b\u672a\u5339\u914d\u7684\u8f68\u8ff9\u5728\u5bbd\u9650\u671f\u540e\u88ab\u7ec8\u6b62\u3002</p> </li> <li> <p>DeepSORT\u901a\u8fc7\u6dfb\u52a0\u6df1\u5ea6\u5916\u89c2\u7279\u5f81\u6269\u5c55\u4e86SORT\uff1a\u6bcf\u4e2a\u68c0\u6d4b\u5230\u7684\u76ee\u6807\u7ecf\u8fc7\u4e00\u4e2a\u5c0f\u578bCNN\uff0c\u4ea7\u751f\u4e00\u4e2a\u5916\u89c2\u5d4c\u5165\uff08\u63cf\u8ff0\u5b50\u5411\u91cf\uff09\u3002\u5339\u914d\u4ee3\u4ef7\u7ed3\u5408\u4e86IoU\u8ddd\u79bb\u548c\u5d4c\u5165\u7a7a\u95f4\u4e2d\u7684\u4f59\u5f26\u8ddd\u79bb\uff08\u7b2c01\u7ae0\uff09\u3002\u8fd9\u5904\u7406\u4e86\u906e\u6321\u548c\u91cd\u8bc6\u522b\uff1a\u5373\u4f7f\u4e00\u4e2a\u76ee\u6807\u5728\u5176\u4ed6\u76ee\u6807\u540e\u6d88\u5931\u6570\u5e27\uff0c\u5176\u5916\u89c2\u5d4c\u5165\u5141\u8bb8\u5728\u91cd\u65b0\u51fa\u73b0\u65f6\u91cd\u65b0\u5339\u914d\u3002</p> </li> <li> <p>ByteTrack\uff08Zhang\u7b49\u4eba\uff0c2022\uff09\u901a\u8fc7\u4f7f\u7528\u6240\u6709\u68c0\u6d4b\u7ed3\u679c\uff08\u5305\u62ec\u4f4e\u7f6e\u4fe1\u5ea6\u7684\uff09\u6765\u6539\u8fdb\u8ddf\u8e2a\u3002\u5927\u591a\u6570\u8ddf\u8e2a\u5668\u4f1a\u4e22\u5f03\u4f4e\u4e8e\u7f6e\u4fe1\u5ea6\u9608\u503c\u7684\u68c0\u6d4b\u7ed3\u679c\u3002ByteTrack\u9996\u5148\u5c06\u9ad8\u7f6e\u4fe1\u5ea6\u68c0\u6d4b\u7ed3\u679c\u4e0e\u73b0\u6709\u8f68\u8ff9\u5339\u914d\uff0c\u7136\u540e\u5c06\u5269\u4f59\u7684\u4f4e\u7f6e\u4fe1\u5ea6\u68c0\u6d4b\u7ed3\u679c\u4e0e\u672a\u5339\u914d\u7684\u8f68\u8ff9\u5339\u914d\u3002\u8fd9\u6062\u590d\u4e86\u6682\u65f6\u88ab\u906e\u6321\u6216\u6a21\u7cca\uff08\u56e0\u6b64\u68c0\u6d4b\u7f6e\u4fe1\u5ea6\u4f4e\uff09\u7684\u76ee\u6807\u3002</p> </li> <li> <p>3D\u89c6\u89c9\u6062\u590d\u57282D\u56fe\u50cf\u6295\u5f71\u4e2d\u4e22\u5931\u7684\u7b2c\u4e09\u4e2a\u7a7a\u95f4\u7ef4\u5ea6\uff08\u89c1\u6587\u4ef601\uff09\u3002</p> </li> <li> <p>\u6df1\u5ea6\u4f30\u8ba1\u9884\u6d4b\u4ece\u76f8\u673a\u5230\u573a\u666f\u4e2d\u6bcf\u4e2a\u70b9\u7684\u8ddd\u79bb\u3002</p> </li> <li> <p>\u7acb\u4f53\u6df1\u5ea6\u4f7f\u7528\u4e24\u4e2a\u76f8\u8ddd\u57fa\u7ebf\u8ddd\u79bb\\(b\\)\u7684\u76f8\u673a\u3002\u540c\u4e00\u4e2a\u70b9\u5728\u5de6\u53f3\u56fe\u50cf\u4e2d\u51fa\u73b0\u5728\u4e0d\u540c\u7684\u6c34\u5e73\u4f4d\u7f6e\uff08\u8fd9\u4e2a\u504f\u79fb\u79f0\u4e3a\u89c6\u5dee\\(d\\)\uff09\u3002\u6df1\u5ea6\u4e0e\u89c6\u5dee\u6210\u53cd\u6bd4\uff1a</p> </li> </ul> \\[Z = \\frac{f \\cdot b}{d}\\] <ul> <li> <p>\u5176\u4e2d\\(f\\)\u662f\u7126\u8ddd\uff0c\\(b\\)\u662f\u57fa\u7ebf\u8ddd\u79bb\u3002\u8ba1\u7b97\u89c6\u5dee\u9700\u8981\u627e\u5230\u4e24\u4e2a\u56fe\u50cf\u4e4b\u95f4\u7684\u5bf9\u5e94\u70b9\uff08\u7acb\u4f53\u5339\u914d\uff09\uff0c\u8fd9\u662f\u6cbf\u6c34\u5e73\u626b\u63cf\u7ebf\u7684\u4e00\u7ef4\u641c\u7d22\uff08\u56e0\u4e3a\u76f8\u673a\u6c34\u5e73\u5bf9\u9f50\uff0c3D\u4e2d\u540c\u4e00\u9ad8\u5ea6\u7684\u70b9\u6295\u5f71\u5230\u4e24\u5e45\u56fe\u50cf\u7684\u540c\u4e00\u884c\uff09\u3002</p> </li> <li> <p>\u5355\u76ee\u6df1\u5ea6\u4f30\u8ba1\u4ece\u5355\u5f20\u56fe\u50cf\u9884\u6d4b\u6df1\u5ea6\uff0c\u8fd9\u672c\u8d28\u4e0a\u662f\u75c5\u6001\u95ee\u9898\uff08\u65e0\u9650\u591a\u4e2a3D\u573a\u666f\u53ef\u4ee5\u4ea7\u751f\u76f8\u540c\u76842D\u56fe\u50cf\uff09\u3002\u7136\u800c\uff0c\u4eba\u7c7b\u5229\u7528\u76f8\u5bf9\u5927\u5c0f\u3001\u7eb9\u7406\u68af\u5ea6\u3001\u906e\u6321\u548c\u5927\u6c14\u96fe\u973e\u7b49\u7ebf\u7d22\u6beb\u4e0d\u8d39\u529b\u5730\u505a\u5230\u8fd9\u4e00\u70b9\u3002\u6df1\u5ea6\u5b66\u4e60\u7f51\u7edc\u4ece\u8bad\u7ec3\u6570\u636e\u4e2d\u5b66\u4e60\u8fd9\u4e9b\u7ebf\u7d22\u3002</p> </li> <li> <p>MiDaS\u548cDepth Anything\u7b49\u6a21\u578b\u4ece\u5355\u5f20\u56fe\u50cf\u9884\u6d4b\u76f8\u5bf9\u6df1\u5ea6\u56fe\uff08\u6392\u5e8f\u54ea\u4e9b\u7269\u4f53\u66f4\u8fd1\uff09\u3002\u5b83\u4eec\u4f7f\u7528\u5c3a\u5ea6\u4e0d\u53d8\u635f\u5931\u5728\u5404\u79cd\u6570\u636e\u96c6\u4e0a\u8bad\u7ec3\uff0c\u5c3d\u7ba1\u7406\u8bba\u4e0a\u5b58\u5728\u6b67\u4e49\uff0c\u4f46\u4ecd\u80fd\u4ea7\u751f\u975e\u5e38\u51c6\u786e\u7684\u7ed3\u679c\u3002</p> </li> <li> <p>\u70b9\u4e91\u662f3D\u70b9\\((x, y, z)\\)\u7684\u96c6\u5408\uff0c\u53ef\u9009\u5730\u5e26\u6709\u989c\u8272\u6216\u5176\u4ed6\u5c5e\u6027\uff0c\u7531LiDAR\u4f20\u611f\u5668\u6216\u7acb\u4f53\u91cd\u5efa\u6355\u83b7\u3002\u4e0e\u56fe\u50cf\u4e0d\u540c\uff0c\u70b9\u4e91\u662f\u65e0\u5e8f\u4e14\u4e0d\u89c4\u5219\u95f4\u9694\u7684\u3002</p> </li> <li> <p>PointNet\uff08Qi\u7b49\u4eba\uff0c2017\uff09\u901a\u8fc7\u72ec\u7acb\u5730\u5bf9\u6bcf\u4e2a\u70b9\u5e94\u7528\u5171\u4eabMLP\uff0c\u7136\u540e\u4f7f\u7528\u6700\u5927\u6c60\u5316\u805a\u5408\uff08\u8fd9\u662f\u7f6e\u6362\u4e0d\u53d8\u7684\uff0c\u89e3\u51b3\u4e86\u6392\u5e8f\u95ee\u9898\uff09\uff0c\u76f4\u63a5\u5904\u7406\u70b9\u4e91\u3002PointNet++\u589e\u52a0\u4e86\u5c42\u6b21\u5316\u5206\u7ec4\uff0c\u4ee5\u6355\u83b7\u591a\u5c3a\u5ea6\u7684\u5c40\u90e8\u7ed3\u6784\u3002</p> </li> <li> <p>\u795e\u7ecf\u8f90\u5c04\u573a\uff08NeRF\uff09\uff08Mildenhall\u7b49\u4eba\uff0c2020\uff09\u5c063D\u573a\u666f\u8868\u793a\u4e3a\u4e00\u4e2a\u8fde\u7eed\u51fd\u6570\uff0c\u5c063D\u4f4d\u7f6e\\((x, y, z)\\)\u548c\u89c6\u89d2\u65b9\u5411\\((\\theta, \\phi)\\)\u6620\u5c04\u5230\u989c\u8272\\((r, g, b)\\)\u548c\u5bc6\u5ea6\\(\\sigma\\)\u3002\u8be5\u51fd\u6570\u7531\u4e00\u4e2aMLP\u53c2\u6570\u5316\uff1a</p> </li> </ul> \\[F_\\theta: (x, y, z, \\theta, \\phi) \\to (r, g, b, \\sigma)\\] <ul> <li>\u4e3a\u4e86\u6e32\u67d3\u4e00\u4e2a\u50cf\u7d20\uff0c\u4ece\u76f8\u673a\u7a7f\u8fc7\u8be5\u50cf\u7d20\u5411\u573a\u666f\u6295\u5c04\u4e00\u6761\u5c04\u7ebf\u3002\u6cbf\u5c04\u7ebf\u91c7\u6837\u70b9\uff0cMLP\u9884\u6d4b\u6bcf\u4e2a\u70b9\u7684\u989c\u8272\u548c\u5bc6\u5ea6\u3002\u50cf\u7d20\u989c\u8272\u901a\u8fc7\u4f53\u6e32\u67d3\u8ba1\u7b97\uff1a\u6cbf\u5c04\u7ebf\u6309\u5bc6\u5ea6\u52a0\u6743\u79ef\u5206\u989c\u8272\uff1a</li> </ul> \\[C(\\mathbf{r}) = \\int_{t_n}^{t_f} T(t) \\cdot \\sigma(\\mathbf{r}(t)) \\cdot \\mathbf{c}(\\mathbf{r}(t), \\mathbf{d}) \\, dt\\] <ul> <li>\u5176\u4e2d\\(T(t) = \\exp(-\\int_{t_n}^{t} \\sigma(\\mathbf{r}(s)) \\, ds)\\)\u662f\u7d2f\u79ef\u900f\u5c04\u7387\uff08\u5df2\u5438\u6536\u7684\u5149\u603b\u91cf\uff09\u3002\u5728\u5b9e\u9645\u4e2d\uff0c\u8be5\u79ef\u5206\u901a\u8fc7\u6cbf\u5c04\u7ebf\u91c7\u6837\\(N\\)\u4e2a\u70b9\u5e76\u6c42\u548c\u6765\u8fd1\u4f3c\uff1a</li> </ul> \\[\\hat{C} = \\sum_{i=1}^{N} T_i \\cdot (1 - \\exp(-\\sigma_i \\delta_i)) \\cdot c_i\\] <ul> <li> <p>NeRF\u901a\u8fc7\u6700\u5c0f\u5316\u6e32\u67d3\u50cf\u7d20\u4e0e\u4e00\u7ec4\u5e26\u4f4d\u59ff\u7167\u7247\u7684\u771f\u5b9e\u50cf\u7d20\u4e4b\u95f4\u7684MSE\u6765\u8bad\u7ec3\u3002\u8bad\u7ec3\u5b8c\u6210\u540e\uff0cNeRF\u53ef\u4ee5\u4ece\u4efb\u4f55\u76f8\u673a\u4f4d\u7f6e\u6e32\u67d3\u903c\u771f\u7684\u65b0\u89c6\u89d2\u3002\u5176\u5c40\u9650\u6027\u5728\u4e8e\u901f\u5ea6\uff1a\u6e32\u67d3\u9700\u8981\u5bf9MLP\u8fdb\u884c\u6570\u767e\u4e07\u6b21\u8bc4\u4f30\uff08\u6bcf\u4e2a\u50cf\u7d20\u6bcf\u4e2a\u91c7\u6837\u70b9\u4e00\u6b21\uff09\uff0c\u8fd9\u4f7f\u5f97\u5b9e\u65f6\u6e32\u67d3\u53d8\u5f97\u56f0\u96be\u3002</p> </li> <li> <p>3D\u9ad8\u65af\u6cfc\u6e85\uff08Kerbl\u7b49\u4eba\uff0c2023\uff09\u901a\u8fc7\u5c06\u573a\u666f\u8868\u793a\u4e3a3D\u9ad8\u65af\u539f\u8bed\u7684\u96c6\u5408\uff08\u800c\u975e\u8fde\u7eed\u7684\u4f53\u79ef\u51fd\u6570\uff09\u6765\u89e3\u51b3NeRF\u7684\u901f\u5ea6\u9650\u5236\u3002\u6bcf\u4e2a\u9ad8\u65af\u539f\u8bed\u6709\u4e00\u4e2a3D\u4f4d\u7f6e\uff08\u5747\u503c\uff09\u3001\u4e00\u4e2a3D\u534f\u65b9\u5dee\u77e9\u9635\uff08\u63a7\u5236\u5f62\u72b6\u548c\u671d\u5411\uff09\u3001\u4e0d\u900f\u660e\u5ea6\u53ca\u989c\u8272\uff08\u8868\u793a\u4e3a\u7403\u8c10\u51fd\u6570\u4ee5\u5b9e\u73b0\u89c6\u89d2\u76f8\u5173\u6548\u679c\uff09\u3002</p> </li> <li> <p>\u6e32\u67d3\u5c06\u6bcf\u4e2a3D\u9ad8\u65af\u6295\u5f71\u5230\u56fe\u50cf\u5e73\u9762\uff08\u4ea7\u751f\u4e00\u4e2a2D\u9ad8\u65af\"\u6cfc\u6e85\"\uff09\uff0c\u6309\u6df1\u5ea6\u6392\u5e8f\uff0c\u5e76\u4f7f\u7528alpha\u6df7\u5408\u4ece\u524d\u5f80\u540e\u5408\u6210\u3002\u8fd9\u662f\u4e00\u4e2a\u5728GPU\u4e0a\u5b9e\u65f6\u8fd0\u884c\u7684\u6805\u683c\u5316\u8fc7\u7a0b\uff08100+ FPS\uff09\uff0c\u6bd4NeRF\u7684\u5c04\u7ebf\u6b65\u8fdb\u5feb\u51e0\u4e2a\u6570\u91cf\u7ea7\u3002\u9ad8\u65af\u6cfc\u6e85\u8fbe\u5230\u6216\u8d85\u8fc7NeRF\u7684\u8d28\u91cf\uff0c\u540c\u65f6\u5b9e\u73b0\u5b9e\u65f6\u6e32\u67d3\u3002</p> </li> <li> <p>SLAM\uff08\u540c\u65f6\u5b9a\u4f4d\u4e0e\u5730\u56fe\u6784\u5efa\uff09\u662f\u5728\u672a\u77e5\u73af\u5883\u4e2d\u6784\u5efa\u5730\u56fe\u540c\u65f6\u8ddf\u8e2a\u76f8\u673a\u81ea\u8eab\u4f4d\u7f6e\u7684\u95ee\u9898\u3002\u8fd9\u662f\u673a\u5668\u4eba\u3001\u81ea\u52a8\u9a7e\u9a76\u548cAR\u7684\u57fa\u7840\u3002</p> </li> <li> <p>\u89c6\u89c9\u91cc\u7a0b\u8ba1\u901a\u8fc7\u8de8\u56fe\u50cf\u8ddf\u8e2a\u7279\u5f81\u6765\u4f30\u8ba1\u76f8\u673a\u4ece\u4e00\u5e27\u5230\u53e6\u4e00\u5e27\u7684\u8fd0\u52a8\u3002\u7279\u5f81\u70b9\uff08SIFT\u3001ORB\uff0c\u89c1\u6587\u4ef601\uff09\u5728\u8fde\u7eed\u5e27\u4e4b\u95f4\u5339\u914d\uff0c\u5e76\u5229\u7528\u8fd9\u4e9b\u5339\u914d\u5173\u7cfb\u901a\u8fc7\u672c\u8d28\u77e9\u9635\uff08\u7f16\u7801\u4e24\u89c6\u56fe\u4e4b\u95f4\u7684\u51e0\u4f55\u5173\u7cfb\uff0c\u7531\u6587\u4ef601\u7684\u5185\u53c2\u548c\u5916\u53c2\u63a8\u5bfc\uff09\u4f30\u8ba1\u76f8\u673a\u7684\u65cb\u8f6c\u548c\u5e73\u79fb\u3002</p> </li> <li> <p>\u57fa\u4e8e\u7279\u5f81\u7684SLAM\u901a\u8fc7\u7ef4\u62a4\u6301\u4e45\u5730\u56fe\u6765\u6269\u5c55\u89c6\u89c9\u91cc\u7a0b\u8ba1\u3002ORB-SLAM\uff08Mur-Artal\u7b49\u4eba\uff0c2015\uff09\u662f\u4f7f\u7528\u6700\u5e7f\u6cdb\u7684\u57fa\u4e8e\u7279\u5f81\u7684SLAM\u7cfb\u7edf\u3002\u5b83\u6709\u4e09\u4e2a\u5e76\u884c\u7ebf\u7a0b\uff1a</p> <ol> <li>\u8ddf\u8e2a\uff1a\u5c06\u6bcf\u5e27\u4e2d\u7684ORB\u7279\u5f81\u4e0e\u5730\u56fe\u5339\u914d\uff0c\u4f7f\u7528PnP\uff08Perspective-n-Point\uff09\u548cRANSAC\u4f30\u8ba1\u76f8\u673a\u4f4d\u59ff\u3002</li> <li>\u5c40\u90e8\u5efa\u56fe\uff1a\u4ece\u5339\u914d\u7684\u7279\u5f81\u4e09\u89d2\u5316\u65b0\u7684\u5730\u56fe\u70b9\uff0c\u901a\u8fc7\u5149\u675f\u6cd5\u5e73\u5dee\uff08\u6700\u5c0f\u5316\u6240\u6709\u89c2\u5bdf\u5230\u6bcf\u4e2a\u70b9\u7684\u89c6\u56fe\u7684\u91cd\u6295\u5f71\u8bef\u5dee\uff09\u4f18\u5316\u5176\u4f4d\u7f6e\u3002</li> <li>\u95ed\u73af\u68c0\u6d4b\uff1a\u68c0\u6d4b\u76f8\u673a\u4f55\u65f6\u91cd\u65b0\u8bbf\u95ee\u5148\u524d\u5efa\u56fe\u7684\u533a\u57df\uff08\u4f7f\u7528\u89c6\u89c9\u8bcd\u888b\uff09\uff0c\u7136\u540e\u901a\u8fc7\u5168\u5c40\u4f18\u5316\u5730\u56fe\u6765\u6821\u6b63\u7d2f\u79ef\u6f02\u79fb\u3002</li> </ol> </li> <li> <p>LiDAR SLAM\u4f7f\u7528\u6765\u81eaLiDAR\u4f20\u611f\u5668\u76843D\u70b9\u4e91\u66ff\u4ee3\uff08\u6216\u8865\u5145\uff09\u76f8\u673a\u56fe\u50cf\u3002LiDAR\u63d0\u4f9b\u76f4\u63a5\u7684\u6df1\u5ea6\u6d4b\u91cf\uff0c\u4f7f\u51e0\u4f55\u4f30\u8ba1\u66f4\u9c81\u68d2\uff0c\u4f46\u786c\u4ef6\u6210\u672c\u66f4\u9ad8\u3002LOAM\uff08LiDAR Odometry and Mapping\uff09\u7b49\u65b9\u6cd5\u4f7f\u7528\u8fed\u4ee3\u6700\u8fd1\u70b9\uff08ICP\uff09\u914d\u51c6\u6765\u5bf9\u9f50\u8fde\u7eed\u626b\u63cf\u4e4b\u95f4\u7684\u70b9\u4e91\u3002</p> </li> <li> <p>\u89c6\u89c9-\u60ef\u6027SLAM\u878d\u5408\u76f8\u673a\u6570\u636e\u4e0eIMU\uff08\u52a0\u901f\u5ea6\u8ba1+\u9640\u87ba\u4eea\uff09\u7684\u6d4b\u91cf\u7ed3\u679c\u3002IMU\u63d0\u4f9b\u9ad8\u9891\u7684\u65cb\u8f6c\u548c\u52a0\u901f\u5ea6\u4f30\u8ba1\uff0c\u5f25\u8865\u76f8\u673a\u5e27\u4e4b\u95f4\u7684\u95f4\u9699\uff0c\u5e76\u5904\u7406\u5feb\u901f\u8fd0\u52a8\u6216\u4e34\u65f6\u89c6\u89c9\u7279\u5f81\u4e22\u5931\u7684\u60c5\u51b5\u3002</p> </li> <li> <p>VR/AR\u5e94\u7528\u662f\u8ba1\u7b97\u673a\u89c6\u89c9\u6700\u82db\u523b\u7684\u6d88\u8d39\u8005\u4e4b\u4e00\u3002</p> </li> <li> <p>\u59ff\u6001\u4f30\u8ba1\u4ece\u56fe\u50cf\u4e2d\u786e\u5b9a\u4eba\u4f53\uff08\u6216\u9762\u90e8\u3001\u624b\u90e8\uff09\u7684\u4f4d\u7f6e\u548c\u671d\u5411\u3002\u8eab\u4f53\u59ff\u6001\u901a\u5e38\u8868\u793a\u4e3a\u4e00\u7ec42D\u62163D\u5173\u952e\u70b9\u4f4d\u7f6e\uff08\u5173\u8282\u70b9\uff1a\u80a9\u8180\u3001\u8098\u90e8\u3001\u624b\u8155\u3001\u9acb\u90e8\u3001\u819d\u76d6\u3001\u811a\u8e1d\uff09\u3002OpenPose\u548cMediaPipe\u7b49\u6a21\u578b\u4f7f\u7528\u70ed\u56fe\u56de\u5f52\u9884\u6d4b\u8fd9\u4e9b\u5173\u952e\u70b9\uff1a\u5bf9\u4e8e\u6bcf\u4e2a\u5173\u8282\u70b9\uff0c\u6a21\u578b\u8f93\u51fa\u4e00\u4e2a\u70ed\u56fe\uff0c\u5176\u4e2d\u5cf0\u503c\u6307\u793a\u5173\u8282\u70b9\u7684\u4f4d\u7f6e\u3002</p> </li> <li> <p>\u81ea\u4e0a\u800c\u4e0b\u7684\u65b9\u6cd5\u9996\u5148\u4f7f\u7528\u8fb9\u754c\u6846\u68c0\u6d4b\u5668\uff08\u89c1\u6587\u4ef603\uff09\u68c0\u6d4b\u4eba\u7269\uff0c\u7136\u540e\u5728\u6bcf\u4e2a\u6846\u5185\u4f30\u8ba1\u59ff\u6001\u3002\u81ea\u4e0b\u800c\u4e0a\u7684\u65b9\u6cd5\u9996\u5148\u68c0\u6d4b\u56fe\u50cf\u4e2d\u7684\u6240\u6709\u5173\u952e\u70b9\uff0c\u7136\u540e\u4f7f\u7528\u90e8\u4f4d\u4eb2\u548c\u573a\uff08\u7f16\u7801\u8fde\u63a5\u5173\u8282\u70b9\u4e4b\u95f4\u5173\u8054\u7684\u5411\u91cf\u573a\uff09\u5c06\u5b83\u4eec\u5206\u7ec4\u4e3a\u4e2a\u4f53\u3002</p> </li> <li> <p>\u573a\u666f\u91cd\u5efa\u4ece\u4f20\u611f\u5668\u6570\u636e\u6784\u5efa\u73af\u5883\u76843D\u6a21\u578b\u3002\u5728AR\u4e2d\uff0c\u8fd9\u4f7f\u5f97\u53ef\u4ee5\u5c06\u865a\u62df\u7269\u4f53\u653e\u7f6e\u5728\u771f\u5b9e\u8868\u9762\u4e0a\u3001\u906e\u6321\u771f\u5b9e\u7269\u4f53\u540e\u9762\u7684\u865a\u62df\u7269\u4f53\u4ee5\u53ca\u6295\u5c04\u865a\u62df\u9634\u5f71\u3002\u5b9e\u65f6\u573a\u666f\u91cd\u5efa\u65b9\u6cd5\uff08\u5982ARKit\u548cARCore\u4e2d\u57fa\u4e8e\u6df1\u5ea6\u4f20\u611f\u5668\u7684\u7cfb\u7edf\uff09\u6784\u5efa\u73af\u5883\u7684\u7a00\u758f\u7f51\u683c\uff0c\u5e76\u968f\u7740\u7528\u6237\u79fb\u52a8\u800c\u66f4\u65b0\u3002</p> </li> <li> <p>VR\u4e2d\u7684\u5b9e\u65f6\u6e32\u67d3\u7ea6\u675f\u6781\u4e3a\u82db\u523b\uff1a\u53cc\u773c\u9700\u8981\u72ec\u7acb\u6e32\u67d390+ FPS\uff08\u4ee5\u907f\u514d\u6655\u52a8\u75c7\uff09\uff0c\u4ece\u5934\u90e8\u4f4d\u79fb\u5230\u663e\u793a\u66f4\u65b0\u7684\u5ef6\u8fdf\u9700\u4f4e\u4e8e20\u6beb\u79d2\u3002\u6ce8\u89c6\u70b9\u6e32\u67d3\uff08\u4ec5\u6e32\u67d3\u7528\u6237\u6ce8\u89c6\u4f4d\u7f6e\u7684\u9ad8\u5206\u8fa8\u7387\uff0c\u4f7f\u7528\u773c\u52a8\u8ffd\u8e2a\uff09\u548c\u91cd\u6295\u5f71\uff08\u57fa\u4e8e\u65b0\u5934\u90e8\u4f4d\u59ff\u626d\u66f2\u4e0a\u4e00\u5e27\u4ee5\u586b\u8865\u4e0b\u4e00\u5e27\u6e32\u67d3\u95f4\u9699\uff09\u7b49\u6280\u672f\u5bf9\u4e8e\u6ee1\u8db3\u8fd9\u4e9b\u7ea6\u675f\u81f3\u5173\u91cd\u8981\u3002</p> </li> <li> <p>\u5b9e\u65f6\u795e\u7ecf\u6e32\u67d3\uff083D\u9ad8\u65af\u6cfc\u6e85\uff09\u3001\u9c81\u68d2\u8ddf\u8e2a\uff08\u89c6\u89c9-\u60ef\u6027SLAM\uff09\u548c\u9ad8\u6548\u59ff\u6001\u4f30\u8ba1\u7684\u878d\u5408\uff0c\u6b63\u4f7f\u903c\u771f\u7684\u4ea4\u4e92\u5f0fAR/VR\u4f53\u9a8c\u53d8\u5f97\u8d8a\u6765\u8d8a\u53ef\u884c\u3002</p> </li> </ul>"},{"location":"chapter%2008%3A%20computer%20vision/05.%20video%20and%203D%20vision/#colabnotebook","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216Notebook\uff09","text":"<ol> <li> <p>\u4ece\u5934\u5b9e\u73b0Lucas-Kanade\u5149\u6d41\u7b97\u6cd5\u3002\u8ba1\u7b97\u4e00\u4e2a\u65b9\u5757\u5411\u53f3\u79fb\u52a8\u7684\u4e24\u5e27\u5408\u6210\u56fe\u50cf\u4e4b\u95f4\u7684\u5149\u6d41\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef lucas_kanade(frame1, frame2, window_size=5):\n    \"\"\"Lucas-Kanade\u5149\u6d41\u3002\"\"\"\n    # \u8ba1\u7b97\u68af\u5ea6\n    Ix = jnp.zeros_like(frame1)\n    Iy = jnp.zeros_like(frame1)\n    It = frame2 - frame1\n\n    # Sobel\u98ce\u683c\u68af\u5ea6\n    Ix = Ix.at[1:-1, :].set((frame1[2:, :] - frame1[:-2, :]) / 2)\n    Iy = Iy.at[:, 1:-1].set((frame1[:, 2:] - frame1[:, :-2]) / 2)\n\n    H, W = frame1.shape\n    half_w = window_size // 2\n    u = jnp.zeros_like(frame1)\n    v = jnp.zeros_like(frame1)\n\n    for i in range(half_w, H - half_w):\n        for j in range(half_w, W - half_w):\n            Ix_win = Ix[i-half_w:i+half_w+1, j-half_w:j+half_w+1].ravel()\n            Iy_win = Iy[i-half_w:i+half_w+1, j-half_w:j+half_w+1].ravel()\n            It_win = It[i-half_w:i+half_w+1, j-half_w:j+half_w+1].ravel()\n\n            A = jnp.stack([Ix_win, Iy_win], axis=1)\n            ATA = A.T @ A\n            ATb = -A.T @ It_win\n\n            # \u68c0\u67e5\u7cfb\u7edf\u662f\u5426\u826f\u6001\n            det = ATA[0,0] * ATA[1,1] - ATA[0,1] * ATA[1,0]\n            if jnp.abs(det) &gt; 1e-6:\n                flow = jnp.linalg.solve(ATA, ATb)\n                u = u.at[i, j].set(flow[0])\n                v = v.at[i, j].set(flow[1])\n\n    return u, v\n\n# \u521b\u5efa\u4e24\u5e27\uff1a\u4e00\u4e2a\u5411\u53f3\u79fb\u52a8\u7684\u767d\u8272\u65b9\u5757\nframe1 = jnp.zeros((64, 64))\nframe1 = frame1.at[20:40, 15:35].set(1.0)\n\nframe2 = jnp.zeros((64, 64))\nframe2 = frame2.at[20:40, 20:40].set(1.0)  # \u5411\u53f3\u79fb\u52a85\u4e2a\u50cf\u7d20\n\nu, v = lucas_kanade(frame1, frame2, window_size=7)\n\n# \u53ef\u89c6\u5316\nfig, axes = plt.subplots(1, 3, figsize=(14, 4))\naxes[0].imshow(frame1, cmap='gray'); axes[0].set_title('\u5e271'); axes[0].axis('off')\naxes[1].imshow(frame2, cmap='gray'); axes[1].set_title('\u5e272'); axes[1].axis('off')\n\n# \u5149\u6d41\u7684\u7bad\u77e2\u56fe\uff08\u4e3a\u6e05\u6670\u8d77\u89c1\u964d\u91c7\u6837\uff09\nstep = 4\nY, X = jnp.mgrid[0:64:step, 0:64:step]\naxes[2].imshow(frame1, cmap='gray', alpha=0.5)\naxes[2].quiver(X, Y, u[::step, ::step], v[::step, ::step],\n               color='#e74c3c', scale=50, width=0.005)\naxes[2].set_title('\u5149\u6d41'); axes[2].axis('off')\n\nplt.tight_layout(); plt.show()\n\n# \u68c0\u67e5\u8fd0\u52a8\u533a\u57df\u7684\u5e73\u5747\u5149\u6d41\nregion_u = u[20:40, 15:35]\nprint(f\"\u7269\u4f53\u533a\u57df\u7684\u5e73\u5747\u6c34\u5e73\u5149\u6d41: {region_u[region_u != 0].mean():.2f} \u50cf\u7d20\")\n</code></pre></p> </li> <li> <p>\u5b9e\u73b0\u4e00\u4e2a\u7528\u4e8e2D\u76ee\u6807\u8ddf\u8e2a\u7684\u7b80\u5355\u5361\u5c14\u66fc\u6ee4\u6ce2\u5668\u3002\u6a21\u62df\u4e00\u4e2a\u5e26\u566a\u58f0\u7684\u8f68\u8ff9\uff0c\u5e76\u5c55\u793a\u5361\u5c14\u66fc\u6ee4\u6ce2\u5668\u5982\u4f55\u5e73\u6ed1\u4f30\u8ba1\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef kalman_predict(x, P, F, Q):\n    \"\"\"\u5361\u5c14\u66fc\u6ee4\u6ce2\u5668\u9884\u6d4b\u6b65\u9aa4\u3002\"\"\"\n    x_pred = F @ x\n    P_pred = F @ P @ F.T + Q\n    return x_pred, P_pred\n\ndef kalman_update(x_pred, P_pred, z, H, R):\n    \"\"\"\u5361\u5c14\u66fc\u6ee4\u6ce2\u5668\u66f4\u65b0\u6b65\u9aa4\u3002\"\"\"\n    y = z - H @ x_pred                        # \u521b\u65b0\n    S = H @ P_pred @ H.T + R                  # \u521b\u65b0\u534f\u65b9\u5dee\n    K = P_pred @ H.T @ jnp.linalg.inv(S)      # \u5361\u5c14\u66fc\u589e\u76ca\n    x_updated = x_pred + K @ y\n    P_updated = (jnp.eye(len(x_pred)) - K @ H) @ P_pred\n    return x_updated, P_updated\n\n# \u72b6\u6001: [x, y, vx, vy]\ndt = 1.0\nF = jnp.array([[1, 0, dt, 0],    # \u72b6\u6001\u8f6c\u79fb\n                [0, 1, 0, dt],\n                [0, 0, 1, 0],\n                [0, 0, 0, 1]])\nH = jnp.array([[1, 0, 0, 0],     # \u89c2\u6d4b\uff1a\u6d4b\u91cf x, y\n                [0, 1, 0, 0]])\nQ = jnp.eye(4) * 0.01            # \u8fc7\u7a0b\u566a\u58f0\nR = jnp.eye(2) * 4.0             # \u6d4b\u91cf\u566a\u58f0\uff08\u6709\u566a\u58f0\u7684\u68c0\u6d4b\u5668\uff09\n\n# \u6a21\u62df\u771f\u5b9e\u8f68\u8ff9\uff1a\u5706\u5468\u8fd0\u52a8\nn_steps = 50\nt = jnp.linspace(0, 2 * jnp.pi, n_steps)\ntrue_x = 10 * jnp.cos(t) + 20\ntrue_y = 10 * jnp.sin(t) + 20\n\n# \u5e26\u566a\u58f0\u7684\u89c2\u6d4b\nkey = jax.random.PRNGKey(42)\nnoise = jax.random.normal(key, (n_steps, 2)) * 2.0\nobs_x = true_x + noise[:, 0]\nobs_y = true_y + noise[:, 1]\n\n# \u8fd0\u884c\u5361\u5c14\u66fc\u6ee4\u6ce2\u5668\nx = jnp.array([obs_x[0], obs_y[0], 0.0, 0.0])  # \u521d\u59cb\u72b6\u6001\nP = jnp.eye(4) * 10.0                             # \u521d\u59cb\u4e0d\u786e\u5b9a\u6027\n\nkalman_x, kalman_y = [], []\nfor i in range(n_steps):\n    x, P = kalman_predict(x, P, F, Q)\n    z = jnp.array([obs_x[i], obs_y[i]])\n    x, P = kalman_update(x, P, z, H, R)\n    kalman_x.append(x[0])\n    kalman_y.append(x[1])\n\nkalman_x = jnp.array(kalman_x)\nkalman_y = jnp.array(kalman_y)\n\n# \u53ef\u89c6\u5316\nplt.figure(figsize=(8, 8))\nplt.plot(true_x, true_y, 'k-', linewidth=2, label='\u771f\u5b9e\u8f68\u8ff9')\nplt.scatter(obs_x, obs_y, c='#e74c3c', s=20, alpha=0.5, label='\u5e26\u566a\u58f0\u7684\u89c2\u6d4b')\nplt.plot(kalman_x, kalman_y, '#3498db', linewidth=2, label='\u5361\u5c14\u66fc\u6ee4\u6ce2')\nplt.legend(); plt.grid(alpha=0.3)\nplt.title('\u5361\u5c14\u66fc\u6ee4\u6ce2\u8ddf\u8e2a')\nplt.xlabel('x'); plt.ylabel('y')\nplt.axis('equal'); plt.show()\n\nobs_error = jnp.mean(jnp.sqrt((obs_x - true_x)**2 + (obs_y - true_y)**2))\nkalman_error = jnp.mean(jnp.sqrt((kalman_x - true_x)**2 + (kalman_y - true_y)**2))\nprint(f\"\u89c2\u6d4bRMSE: {obs_error:.2f}\")\nprint(f\"\u5361\u5c14\u66fc\u6ee4\u6ce2RMSE: {kalman_error:.2f}\")\nprint(f\"\u8bef\u5dee\u964d\u4f4e: {(1 - kalman_error/obs_error) * 100:.1f}%\")\n</code></pre></p> </li> <li> <p>\u5b9e\u73b0\u4e00\u4e2a\u7b80\u5316\u7684NeRF\u98ce\u683c\u4f53\u6e32\u67d3\u7ba1\u7ebf\u3002\u901a\u8fc7\u4e00\u4e2a\u7b80\u5355\u76843D\u573a\u666f\uff08\u5df2\u77e5\u989c\u8272\u548c\u5bc6\u5ea6\u7684\u7403\u4f53\uff09\u6295\u5c04\u5c04\u7ebf\uff0c\u5e76\u6cbf\u6bcf\u6761\u5c04\u7ebf\u79ef\u5206\u6765\u6e32\u67d3\u56fe\u50cf\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef render_ray(origin, direction, spheres, n_samples=64, t_near=1.0, t_far=6.0):\n    \"\"\"\u7a7f\u8fc7\u7403\u4f53\u573a\u666f\u5bf9\u5355\u6761\u5c04\u7ebf\u8fdb\u884c\u4f53\u6e32\u67d3\u3002\"\"\"\n    t_vals = jnp.linspace(t_near, t_far, n_samples)\n    deltas = jnp.concatenate([jnp.diff(t_vals), jnp.array([1e-3])])\n\n    colour = jnp.zeros(3)\n    transmittance = 1.0\n\n    for i in range(n_samples):\n        point = origin + t_vals[i] * direction\n\n        # \u8ba1\u7b97\u8be5\u70b9\u7684\u5bc6\u5ea6\u548c\u989c\u8272\n        density = 0.0\n        point_colour = jnp.zeros(3)\n\n        for center, radius, col, sigma in spheres:\n            dist = jnp.linalg.norm(point - center)\n            # \u8f6f\u7403\u4f53\uff1a\u5bc6\u5ea6\u968f\u8ddd\u8868\u9762\u7684\u8ddd\u79bb\u6307\u6570\u8870\u51cf\n            d = jnp.exp(-jnp.maximum(0, dist - radius) * sigma) * sigma\n            density += d\n            point_colour += d * jnp.array(col)\n\n        # \u6309\u603b\u5bc6\u5ea6\u5f52\u4e00\u5316\u989c\u8272\n        point_colour = jnp.where(density &gt; 1e-6, point_colour / density, point_colour)\n\n        # \u4f53\u6e32\u67d3\u65b9\u7a0b\n        alpha = 1.0 - jnp.exp(-density * deltas[i])\n        colour += transmittance * alpha * point_colour\n        transmittance *= (1.0 - alpha)\n\n    return colour\n\n# \u573a\u666f\uff1a\u4e09\u4e2a\u5f69\u8272\u7403\u4f53\nspheres = [\n    (jnp.array([0.0, 0.0, 4.0]), 0.8, [1.0, 0.2, 0.2], 5.0),   # \u7ea2\u8272\n    (jnp.array([1.5, 0.5, 5.0]), 0.6, [0.2, 1.0, 0.2], 5.0),   # \u7eff\u8272\n    (jnp.array([-1.0, -0.5, 3.5]), 0.5, [0.2, 0.2, 1.0], 5.0), # \u84dd\u8272\n]\n\n# \u76f8\u673a\u8bbe\u7f6e\nimg_h, img_w = 64, 64\nfocal = 60.0\norigin = jnp.array([0.0, 0.0, 0.0])\n\nimage = jnp.zeros((img_h, img_w, 3))\nfor i in range(img_h):\n    for j in range(img_w):\n        # \u8ba1\u7b97\u5c04\u7ebf\u65b9\u5411\n        px = (j - img_w / 2) / focal\n        py = -(i - img_h / 2) / focal\n        direction = jnp.array([px, py, 1.0])\n        direction = direction / jnp.linalg.norm(direction)\n\n        colour = render_ray(origin, direction, spheres)\n        image = image.at[i, j].set(jnp.clip(colour, 0, 1))\n\nplt.figure(figsize=(6, 6))\nplt.imshow(image)\nplt.title('NeRF\u98ce\u683c\u4f53\u6e32\u67d3\\n(3\u4e2a\u7403\u4f53)')\nplt.axis('off')\nplt.tight_layout(); plt.show()\nprint(f\"\u56fe\u50cf\u5f62\u72b6: {image.shape}\")\nprint(f\"\u6e32\u67d3\u4e86 {img_h * img_w} \u6761\u5c04\u7ebf\uff0c\u6bcf\u6761 {64} \u4e2a\u91c7\u6837\u70b9\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2009%3A%20audio%20and%20speech/01.%20digital%20signal%20processing/","title":"\u6570\u5b57\u4fe1\u53f7\u5904\u7406","text":"<p>\u6570\u5b57\u4fe1\u53f7\u5904\u7406\u5c06\u539f\u59cb\u97f3\u9891\u6ce2\u5f62\u8f6c\u6362\u4e3a\u7ed3\u6784\u5316\u8868\u793a\uff0c\u673a\u5668\u5b66\u4e60\u6a21\u578b\u53ef\u4ee5\u4ece\u4e2d\u5b66\u4e60\u3002\u672c\u6587\u6db5\u76d6\u58f0\u97f3\u7269\u7406\u5b66\u3001\u91c7\u6837\u4e0e\u91cf\u5316\u3001\u5085\u91cc\u53f6\u53d8\u6362\uff08DFT\u3001FFT\uff09\u3001\u8bed\u8c31\u56fe\u3001\u6885\u5c14\u6ee4\u6ce2\u5668\u7ec4\u3001MFCC \u548c\u52a0\u7a97\uff0c\u4ee5\u53ca\u6240\u6709\u8bed\u97f3\u548c\u97f3\u9891 AI \u6240\u9700\u7684\u7279\u5f81\u63d0\u53d6\u6d41\u6c34\u7ebf\u3002</p> <ul> <li> <p>\u58f0\u97f3\u662f\u4e00\u79cd\u901a\u8fc7\u4ecb\u8d28\uff08\u7a7a\u6c14\u3001\u6c34\u3001\u56fa\u4f53\uff09\u4f20\u64ad\u7684\u538b\u529b\u6ce2\u3002\u632f\u52a8\u7269\u4f53\uff08\u58f0\u5e26\u3001\u5409\u4ed6\u5f26\u3001\u626c\u58f0\u5668\u7eb8\u76c6\uff09\u63a8\u62c9\u7a7a\u6c14\u5206\u5b50\uff0c\u4ea7\u751f\u4ea4\u66ff\u7684\u9ad8\u538b\u533a\u57df\uff08\u538b\u7f29\uff09\u548c\u4f4e\u538b\u533a\u57df\uff08\u7a00\u758f\uff09\u3002</p> </li> <li> <p>\u8fd9\u4e9b\u538b\u529b\u53d8\u5316\u4ee5\u5927\u7ea6 343 m/s \u7684\u901f\u5ea6\u5728\u7a7a\u6c14\u4e2d\u5411\u5916\u4f20\u64ad\uff0c\u5230\u8fbe\u4f60\u7684\u8033\u6735\u540e\uff0c\u4f7f\u8033\u819c\u632f\u52a8\u5e76\u8f6c\u6362\u4e3a\u795e\u7ecf\u4fe1\u53f7\u3002</p> </li> <li> <p>\u53ef\u4ee5\u628a\u58f0\u97f3\u60f3\u8c61\u6210\u5411\u5e73\u9759\u7684\u6c34\u9762\u6295\u4e0b\u4e00\u5757\u77f3\u5934\uff1a\u77f3\u5934\u662f\u632f\u52a8\u6e90\uff0c\u6d9f\u6f2a\u662f\u538b\u529b\u6ce2\uff0c\u6c34\u9762\u6f02\u6d6e\u7684\u8f6f\u6728\u585e\u5c31\u662f\u9ea6\u514b\u98ce\u6216\u8033\u819c\uff0c\u5b83\u54cd\u5e94\u7740\u6ce2\u7684\u5230\u6765\u3002</p> </li> <li> <p>\u8f6f\u6728\u585e\u4e0a\u4e0b\u6d6e\u52a8\u7684\u5e45\u5ea6\u662f\u632f\u5e45\uff0c\u6bcf\u79d2\u6d6e\u52a8\u7684\u6b21\u6570\u662f\u9891\u7387\uff0c\u6ce2\u5230\u8fbe\u65f6\u8f6f\u6728\u585e\u662f\u5904\u4e8e\u6d6e\u52a8\u7684\u6700\u9ad8\u70b9\u8fd8\u662f\u6700\u4f4e\u70b9\u5219\u662f\u76f8\u4f4d\u3002</p> </li> <li> <p>\u6ce2\u5f62\u662f\u538b\u529b\uff08\u6216\u7535\u538b\uff0c\u5728\u9ea6\u514b\u98ce\u5c06\u58f0\u97f3\u8f6c\u6362\u4e3a\u7535\u4fe1\u53f7\u540e\uff09\u968f\u65f6\u95f4\u53d8\u5316\u7684\u66f2\u7ebf\u56fe\u3002\u6700\u7b80\u5355\u7684\u6ce2\u5f62\u662f\u7eaf\u97f3\uff0c\u5373\u5355\u4e00\u6b63\u5f26\u6ce2\uff1a</p> </li> </ul> \\[x(t) = A \\sin(2\\pi f t + \\phi)\\] <ul> <li> <p>\u5176\u4e2d\uff1a</p> <ul> <li>\\(A\\) \u662f\u632f\u5e45\uff08\u504f\u79bb\u96f6\u70b9\u7684\u6700\u5927\u504f\u5dee\uff0c\u51b3\u5b9a\u54cd\u5ea6\uff09\uff0c</li> <li>\\(f\\) \u662f\u4ee5 Hz \u4e3a\u5355\u4f4d\u7684\u9891\u7387\uff08\u6bcf\u79d2\u5468\u671f\u6570\uff0c\u51b3\u5b9a\u97f3\u9ad8\uff09\uff0c</li> <li>\\(\\phi\\) \u662f\u4ee5\u5f27\u5ea6\u4e3a\u5355\u4f4d\u7684\u76f8\u4f4d\uff08\u6ce2\u7684\u65f6\u95f4\u504f\u79fb\uff09\u3002</li> </ul> </li> <li> <p>\u5468\u671f \\(T = 1/f\\)\uff0c\u662f\u4e00\u4e2a\u5b8c\u6574\u5468\u671f\u6301\u7eed\u7684\u65f6\u957f\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u632f\u5e45\u51b3\u5b9a\u4e86\u611f\u77e5\u5230\u7684\u54cd\u5ea6\u3002\u632f\u5e45\u52a0\u500d\uff0c\u529f\u7387\u53d8\u4e3a\u56db\u500d\uff08\u56e0\u4e3a\u529f\u7387\u4e0e\u632f\u5e45\u7684\u5e73\u65b9\u6210\u6b63\u6bd4\uff09\u3002</p> </li> <li> <p>\u4eba\u8033\u7684\u542c\u89c9\u8303\u56f4\u8986\u76d6\u6781\u5927\u7684\u632f\u5e45\u8de8\u5ea6\uff0c\u56e0\u6b64\u6211\u4eec\u4f7f\u7528\u5bf9\u6570\u523b\u5ea6\uff1a\u5206\u8d1d\uff08dB\uff09\u3002\u58f0\u538b\u7ea7\u7684\u8ba1\u7b97\u65b9\u5f0f\u4e3a\uff1a</p> </li> </ul> \\[L = 20 \\log_{10}\\left(\\frac{A}{A_\\text{ref}}\\right) \\text{ dB}\\] <ul> <li> <p>\u5176\u4e2d \\(A_\\text{ref}\\) \u662f\u53c2\u8003\u632f\u5e45\uff08\u901a\u5e38\u53d6\u542c\u9608\uff0c\\(20 \\mu\\text{Pa}\\)\uff09\u3002\u8033\u8bed\u7ea6\u4e3a 30 dB\uff0c\u6b63\u5e38\u5bf9\u8bdd 60 dB\uff0c\u6447\u6eda\u97f3\u4e50\u4f1a 110 dB\u3002\u6bcf\u589e\u52a0 6 dB\uff0c\u632f\u5e45\u5927\u7ea6\u7ffb\u500d\uff1b\u6bcf\u589e\u52a0 10 dB\uff0c\u611f\u77e5\u54cd\u5ea6\u5927\u7ea6\u7ffb\u500d\u3002\u6b64\u5904\u7684\u5bf9\u6570\u4e0e\u7b2c 03 \u7ae0\u4e2d\u7684\u5bf9\u6570\u51fd\u6570\u76f8\u540c\u3002</p> </li> <li> <p>\u9891\u7387\u51b3\u5b9a\u97f3\u9ad8\u3002\u4f4e\u9891\uff0820\u2013250 Hz\uff09\u542c\u8d77\u6765\u4f4e\u6c89\uff1b\u9ad8\u9891\uff082000\u201320000 Hz\uff09\u542c\u8d77\u6765\u5c16\u9510\u3002\u4eba\u8033\u542c\u89c9\u8303\u56f4\u5927\u81f4\u4e3a 20 Hz \u5230 20 kHz\u3002\u97f3\u4e50\u4f1a\u6807\u51c6\u97f3 A \u4e3a 440 Hz\u3002\u9891\u7387\u52a0\u500d\uff0c\u97f3\u9ad8\u5347\u9ad8\u4e00\u4e2a\u516b\u5ea6\u3002</p> </li> <li> <p>\u5927\u591a\u6570\u81ea\u7136\u58f0\u97f3\u4e0d\u662f\u7eaf\u97f3\uff0c\u800c\u662f\u8bb8\u591a\u9891\u7387\u7684\u590d\u6742\u6df7\u5408\u2014\u2014\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48\u94a2\u7434\u548c\u5c0f\u63d0\u7434\u6f14\u594f\u540c\u4e00\u4e2a\u97f3\u7b26\u65f6\u542c\u8d77\u6765\u4e0d\u540c\uff1a\u5b83\u4eec\u5171\u4eab\u76f8\u540c\u7684\u57fa\u9891\uff0c\u4f46\u8c10\u6ce2\uff08\u57fa\u9891\u7684\u6574\u6570\u500d\uff09\u53ca\u5176\u76f8\u5bf9\u632f\u5e45\uff08\u97f3\u8272\uff09\u4e0d\u540c\u3002</p> </li> <li> <p>\u76f8\u4f4d\u51b3\u5b9a\u4e86\u6ce2\u4ece\u5176\u5468\u671f\u4e2d\u7684\u54ea\u4e2a\u8d77\u70b9\u5f00\u59cb\u3002\u4e24\u4e2a\u632f\u5e45\u548c\u9891\u7387\u76f8\u540c\u4f46\u76f8\u4f4d\u4e0d\u540c\u7684\u6ce2\u53ef\u4ee5\u53d1\u751f\u76f8\u957f\u5e72\u6d89\uff08\u76f8\u4f4d\u5bf9\u9f50\uff0c\u632f\u5e45\u76f8\u52a0\uff09\u6216\u76f8\u6d88\u5e72\u6d89\uff08\u76f8\u4f4d\u76f8\u53cd\uff0c\u632f\u5e45\u62b5\u6d88\uff09\u3002</p> </li> <li> <p>\u76f8\u4f4d\u5728\u7acb\u4f53\u58f0\u97f3\u9891\u548c\u6ce2\u675f\u6210\u5f62\u4e2d\u81f3\u5173\u91cd\u8981\uff0c\u4f46\u5728\u8bb8\u591a\u8bed\u97f3\u5904\u7406\u6d41\u6c34\u7ebf\u4e2d\u57fa\u672c\u4e0a\u88ab\u4e22\u5f03\uff0c\u56e0\u4e3a\u4eba\u7c7b\u5bf9\u97f3\u9ad8\u548c\u97f3\u8272\u7684\u611f\u77e5\u5927\u591a\u4e0e\u76f8\u4f4d\u65e0\u5173\u3002</p> </li> <li> <p>\u73b0\u5b9e\u4e16\u754c\u7684\u97f3\u9891\u4fe1\u53f7\u662f\u65f6\u95f4\u7684\u8fde\u7eed\u51fd\u6570\uff0c\u4f46\u8ba1\u7b97\u673a\u5904\u7406\u7684\u662f\u79bb\u6563\u6570\u503c\u3002\u91c7\u6837\u901a\u8fc7\u4ee5\u56fa\u5b9a\u95f4\u9694\u6d4b\u91cf\u4fe1\u53f7\u503c\uff0c\u5c06\u8fde\u7eed\u4fe1\u53f7\u8f6c\u6362\u4e3a\u79bb\u6563\u5e8f\u5217\u3002</p> </li> <li> <p>\u91c7\u6837\u7387 \\(f_s\\) \u662f\u6bcf\u79d2\u7684\u6d4b\u91cf\u6b21\u6570\u3002CD \u97f3\u9891\u4f7f\u7528 \\(f_s = 44{,}100\\) Hz\uff1b\u7535\u8bdd\u901a\u4fe1\u4f7f\u7528 8000 Hz\uff1b\u73b0\u4ee3\u8bed\u97f3\u6a21\u578b\u901a\u5e38\u4f7f\u7528 16000 Hz\u3002</p> </li> <li> <p>\u5948\u594e\u65af\u7279-\u9999\u519c\u91c7\u6837\u5b9a\u7406\u6307\u51fa\uff1a\u5f53\u4e14\u4ec5\u5f53\u91c7\u6837\u7387\u81f3\u5c11\u662f\u4fe1\u53f7\u4e2d\u6700\u9ad8\u9891\u7387\u7684\u4e24\u500d\u65f6\uff0c\u8fde\u7eed\u4fe1\u53f7\u624d\u80fd\u4ece\u5176\u6837\u672c\u4e2d\u5b8c\u7f8e\u91cd\u5efa\uff1a</p> </li> </ul> \\[f_s \\geq 2 f_\\text{max}\\] <ul> <li> <p>\u9891\u7387 \\(f_s / 2\\) \u79f0\u4e3a\u5948\u594e\u65af\u7279\u9891\u7387\u3002\u5982\u679c\u4fe1\u53f7\u4e2d\u5305\u542b\u9ad8\u4e8e\u5948\u594e\u65af\u7279\u9891\u7387\u7684\u9891\u7387\u6210\u5206\uff0c\u8fd9\u4e9b\u9891\u7387\u4f1a\u6298\u53e0\u56de\u6709\u6548\u8303\u56f4\u5185\uff0c\u8868\u73b0\u4e3a\u865a\u5047\u7684\u4f4e\u9891\u6210\u5206\u3002\u8fd9\u79cd\u73b0\u8c61\u79f0\u4e3a\u6df7\u53e0\u3002\u6df7\u53e0\u662f\u4e0d\u53ef\u9006\u7684\uff1a\u4e00\u65e6\u53d1\u751f\uff0c\u5c31\u65e0\u6cd5\u4ece\u6837\u672c\u4e2d\u6062\u590d\u539f\u59cb\u4fe1\u53f7\u3002</p> </li> <li> <p>\u6df7\u53e0\u7684\u65e5\u5e38\u7c7b\u6bd4\u662f\u7535\u5f71\u4e2d\u7684\u9a6c\u8f66\u8f6e\u6548\u5e94\uff1a\u8f66\u8f6e\u8f6c\u901f\u521a\u597d\u9ad8\u4e8e\u5e27\u7387\u65f6\uff0c\u770b\u8d77\u6765\u50cf\u662f\u5728\u7f13\u6162\u5730\u5012\u8f6c\uff0c\u56e0\u4e3a\u6444\u50cf\u673a\u5bf9\u65cb\u8f6c\u7684\u91c7\u6837\u4e0d\u8db3\u3002\u5728\u97f3\u9891\u4e2d\uff0c\u4e00\u4e2a 15 kHz \u7684\u97f3\u8c03\u4ee5 16 kHz \u91c7\u6837\uff08\\(f_\\text{\u5948\u594e\u65af\u7279} = 8\\) kHz\uff09\u65f6\uff0c\u4f1a\u6df7\u53e0\u4e3a \\(16 - 15 = 1\\) kHz\uff0c\u4e00\u4e2a\u5b8c\u5168\u4e0d\u540c\u7684\u97f3\u9ad8\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u4e3a\u9632\u6b62\u6df7\u53e0\uff0c\u6297\u6df7\u53e0\u6ee4\u6ce2\u5668\uff08\u4e00\u4e2a\u4f4e\u901a\u6ee4\u6ce2\u5668\uff09\u5728\u91c7\u6837\u524d\u6ee4\u9664\u6240\u6709\u9ad8\u4e8e \\(f_s/2\\) \u7684\u9891\u7387\u3002\u8fd9\u4e00\u6b65\u7531\u6a21\u6570\u8f6c\u6362\u5668\uff08ADC\uff09\u786c\u4ef6\u5728\u4fe1\u53f7\u6570\u5b57\u5316\u4e4b\u524d\u5b8c\u6210\u3002</p> </li> <li> <p>\u91cf\u5316\u5c06\u6bcf\u4e2a\u8fde\u7eed\u53d6\u503c\u7684\u6837\u672c\u6620\u5c04\u5230\u6709\u9650\u7535\u5e73\u96c6\u5408\u4e2d\u7684\u6700\u8fd1\u503c\u3002\u4e00\u4e2a \\(n\\) \u4f4d\u91cf\u5316\u5668\u6709 \\(2^n\\) \u4e2a\u7535\u5e73\u3002CD \u97f3\u9891\u4f7f\u7528 16 \u4f4d\u91cf\u5316\uff08\\(2^{16} = 65{,}536\\) \u4e2a\u7535\u5e73\uff09\uff1b\u7535\u8bdd\u901a\u4fe1\u901a\u5e38\u4f7f\u7528 8 \u4f4d\u914d\u5408 \\(\\mu\\) \u5f8b\u6216 A \u5f8b\u538b\u6269\uff08\u4e00\u79cd\u975e\u7ebf\u6027\u6620\u5c04\uff0c\u4e3a\u5c0f\u632f\u5e45\u5206\u914d\u66f4\u591a\u7535\u5e73\uff0c\u4ee5\u5339\u914d\u4eba\u7c7b\u611f\u77e5\uff09\u3002\u91cf\u5316\u4f1a\u5f15\u5165\u91cf\u5316\u566a\u58f0\uff0c\u8fd9\u662f\u4e00\u79cd\u820d\u5165\u8bef\u5dee\uff0c\u5176\u65b9\u5dee\u4e3a \\(\\Delta^2/12\\)\uff0c\u5176\u4e2d \\(\\Delta\\) \u662f\u76f8\u90bb\u7535\u5e73\u4e4b\u95f4\u7684\u6b65\u957f\u3002</p> </li> <li> <p>\u65f6\u57df\u5206\u6790\u76f4\u63a5\u4ece\u6ce2\u5f62\u4e2d\u63d0\u53d6\u7279\u5f81\uff0c\u65e0\u9700\u53d8\u6362\u5230\u5176\u4ed6\u57df\u3002\u8fd9\u4e9b\u7279\u5f81\u7b80\u5355\u3001\u8ba1\u7b97\u5feb\u901f\uff0c\u80fd\u591f\u6355\u6349\u4fe1\u53f7\u7684\u57fa\u672c\u6027\u8d28\u3002</p> </li> <li> <p>\u80fd\u91cf\u8861\u91cf\u4e00\u5e27\uff08\u5171 \\(N\\) \u4e2a\u6837\u672c\uff09\u7684\u6574\u4f53\u54cd\u5ea6\uff1a</p> </li> </ul> \\[E = \\sum_{n=0}^{N-1} x[n]^2\\] <ul> <li> <p>\u8bed\u97f3\u6bb5\u80fd\u91cf\u9ad8\uff1b\u9759\u97f3\u6bb5\u80fd\u91cf\u4f4e\u3002\u80fd\u91cf\u662f\u7b2c 01 \u7ae0\u4e2d\u5e73\u65b9 \\(\\ell_2\\) \u8303\u6570\u5728\u4fe1\u53f7\u5411\u91cf\u4e0a\u7684\u5e94\u7528\u3002</p> </li> <li> <p>\u8fc7\u96f6\u7387\uff08ZCR\uff09\u7edf\u8ba1\u4e00\u5e27\u5185\u4fe1\u53f7\u6539\u53d8\u7b26\u53f7\u7684\u6b21\u6570\uff1a</p> </li> </ul> \\[\\text{ZCR} = \\frac{1}{2(N-1)} \\sum_{n=1}^{N-1} |\\text{sign}(x[n]) - \\text{sign}(x[n-1])|\\] <ul> <li> <p>\u9ad8 ZCR \u8868\u660e\u9ad8\u9891\u6210\u5206\u6216\u566a\u58f0\uff1b\u4f4e ZCR \u8868\u660e\u4f4e\u9891\u6210\u5206\u6216\u6d4a\u97f3\uff08\u58f0\u5e26\u5468\u671f\u6027\u632f\u52a8\u65f6\uff09\u3002ZCR \u662f\u4e00\u79cd\u7c97\u7565\u7684\u9891\u7387\u4f30\u8ba1\u65b9\u6cd5\uff1a\u4e00\u4e2a \\(f\\) Hz \u7684\u7eaf\u97f3\u6bcf\u79d2\u8fc7\u96f6 \\(2f\\) \u6b21\u3002</p> </li> <li> <p>\u81ea\u76f8\u5173\u8861\u91cf\u4fe1\u53f7\u4e0e\u5176\u5ef6\u8fdf\u526f\u672c\u4e4b\u95f4\u7684\u76f8\u4f3c\u5ea6\uff1a</p> </li> </ul> \\[R[k] = \\sum_{n=0}^{N-1-k} x[n] \\cdot x[n+k]\\] <ul> <li> <p>\u5728\u5ef6\u8fdf \\(k = 0\\) \u5904\uff0c\u81ea\u76f8\u5173\u7b49\u4e8e\u80fd\u91cf\u3002\u5bf9\u4e8e\u5468\u671f\u4fe1\u53f7\uff0c\u81ea\u76f8\u5173\u5728\u7b49\u4e8e\u5468\u671f\u53ca\u5176\u6574\u6570\u500d\u7684\u5ef6\u8fdf\u5904\u51fa\u73b0\u5cf0\u503c\u3002\u8fd9\u662f\u57fa\u97f3\u68c0\u6d4b\u7684\u6807\u51c6\u6280\u672f\uff1a\u627e\u51fa \\(R[k]\\) \u5728 \\(k=0\\) \u4e4b\u540e\u7684\u7b2c\u4e00\u4e2a\u663e\u8457\u5cf0\u503c\uff0c\u5219\u57fa\u97f3\u9891\u7387\u4e3a \\(f_s / k_\\text{\u5cf0\u503c}\\)\u3002\u81ea\u76f8\u5173\u4e0e\u7b2c 01 \u7ae0\u7684\u70b9\u79ef\u76f8\u5173\uff1a\\(R[k]\\) \u662f\u4fe1\u53f7\u4e0e\u5176 \\(k\\) \u4f4d\u79fb\u7248\u672c\u7684\u70b9\u79ef\u3002</p> </li> <li> <p>\u9891\u57df\u5206\u6790\u63ed\u793a\u4fe1\u53f7\u7684\u9891\u8c31\u5185\u5bb9\uff0c\u8fd9\u4e9b\u4fe1\u606f\u5728\u6ce2\u5f62\u4e2d\u4e0d\u53ef\u89c1\u3002\u6838\u5fc3\u5de5\u5177\u662f\u79bb\u6563\u5085\u91cc\u53f6\u53d8\u6362\uff08DFT\uff09\uff0c\u5b83\u5c06 \\(N\\) \u4e2a\u6837\u672c\u7684\u4fe1\u53f7\u5206\u89e3\u4e3a \\(N\\) \u4e2a\u590d\u6570\u503c\u7684\u9891\u7387\u5206\u91cf\uff1a</p> </li> </ul> \\[X[k] = \\sum_{n=0}^{N-1} x[n] \\cdot e^{-j 2\\pi k n / N}, \\quad k = 0, 1, \\ldots, N-1\\] <ul> <li> <p>\u6bcf\u4e2a \\(X[k]\\) \u662f\u4e00\u4e2a\u590d\u6570\uff0c\u5176\u5e45\u5ea6 \\(|X[k]|\\) \u7ed9\u51fa\u9891\u7387 \\(f_k = k \\cdot f_s / N\\) Hz \u5904\u7684\u632f\u5e45\uff0c\u76f8\u4f4d \\(\\angle X[k]\\) \u7ed9\u51fa\u76f8\u4f4d\u504f\u79fb\u3002DFT \u662f\u4ece\u65f6\u57df\u57fa\uff08\u5355\u4f4d\u8109\u51b2\uff09\u5230\u9891\u57df\u57fa\uff08\u590d\u6307\u6570\uff09\u7684\u57fa\u53d8\u6362\uff0c\u8fd9\u662f\u7b2c 02 \u7ae0\u57fa\u6982\u5ff5\u7684\u76f4\u63a5\u5e94\u7528\u3002DFT \u53ef\u4ee5\u5199\u4e3a\u77e9\u9635\u4e58\u6cd5 \\(\\mathbf{X} = W \\mathbf{x}\\)\uff0c\u5176\u4e2d \\(W\\) \u662f \\(N \\times N\\) \u7684 DFT \u77e9\u9635\uff0c\u5176\u5143\u7d20\u4e3a \\(W_{kn} = e^{-j2\\pi kn/N}\\)\u3002</p> </li> <li> <p>\u5feb\u901f\u5085\u91cc\u53f6\u53d8\u6362\uff08FFT\uff09\u662f\u4e00\u79cd\u4ee5 \\(O(N \\log N)\\) \u6b21\u8fd0\u7b97\u8ba1\u7b97 DFT \u7684\u7b97\u6cd5\uff08\u800c\u975e\u6734\u7d20\u7684 \\(O(N^2)\\)\uff09\uff0c\u5176\u539f\u7406\u662f\u5c06\u95ee\u9898\u9012\u5f52\u5730\u62c6\u5206\u4e3a\u5076\u6570\u7d22\u5f15\u548c\u5947\u6570\u7d22\u5f15\u7684\u5b50\u95ee\u9898\uff08\u5e93\u5229-\u56fe\u57fa\u7b97\u6cd5\uff09\u3002\u8fd9\u79cd\u52a0\u901f\u4f7f\u5f97\u5b9e\u65f6\u9891\u8c31\u5206\u6790\u6210\u4e3a\u53ef\u80fd\u3002FFT \u662f\u6574\u4e2a\u8ba1\u7b97\u9886\u57df\u6700\u91cd\u8981\u7684\u7b97\u6cd5\u4e4b\u4e00\u3002</p> </li> <li> <p>\u529f\u7387\u8c31 \\(|X[k]|^2\\) \u663e\u793a\u80fd\u91cf\u5728\u5404\u9891\u7387\u4e0a\u7684\u5206\u5e03\u3002\u5e45\u5ea6\u8c31 \\(|X[k]|\\) \u663e\u793a\u632f\u5e45\u3002\u7ed8\u5236\u8fd9\u4e9b\u8c31\u56fe\u53ef\u4ee5\u63ed\u793a\u54ea\u4e9b\u9891\u7387\u4e3b\u5bfc\u4e86\u4fe1\u53f7\uff1a\u5143\u97f3\u5728\u57fa\u9891\u7684\u6574\u6570\u500d\u5904\u6709\u5f3a\u8c10\u6ce2\uff1b\u64e6\u97f3\uff08\u5982\"s\"\uff09\u5728\u5bbd\u9ad8\u9891\u8303\u56f4\u5185\u6709\u80fd\u91cf\u5206\u5e03\u3002</p> </li> <li> <p>\u8bed\u8c31\u56fe\u662f\u4fe1\u53f7\u9891\u7387\u5185\u5bb9\u968f\u65f6\u95f4\u53d8\u5316\u7684\u53ef\u89c6\u5316\u8868\u793a\u3002\u5b83\u662f\u5c06\u4fe1\u53f7\u5207\u5206\u6210\u77ed\u7684\u3001\u91cd\u53e0\u7684\u5e27\uff0c\u5bf9\u6bcf\u5e27\u8ba1\u7b97 FFT\uff0c\u7136\u540e\u5c06\u5f97\u5230\u7684\u5e45\u5ea6\u8c31\u5e76\u6392\u653e\u7f6e\u3002\u6a2a\u8f74\u662f\u65f6\u95f4\uff0c\u7eb5\u8f74\u662f\u9891\u7387\uff0c\u6bcf\u4e2a\u70b9\u7684\u989c\u8272\uff08\u6216\u4eae\u5ea6\uff09\u4ee3\u8868\u5e45\u5ea6\u3002\u8bed\u8c31\u56fe\u662f\u97f3\u9891\u5904\u7406\u4e2d\u6700\u91cd\u8981\u7684\u5355\u4e00\u53ef\u89c6\u5316\u5de5\u5177\u3002</p> </li> </ul> <p></p> <ul> <li>\u6885\u5c14\u523b\u5ea6\u662f\u4e00\u79cd\u611f\u77e5\u9891\u7387\u523b\u5ea6\uff0c\u53cd\u6620\u4eba\u7c7b\u5bf9\u97f3\u9ad8\u7684\u611f\u77e5\u65b9\u5f0f\u3002\u4eba\u7c7b\u5c06\u9891\u7387\u7684\u7b49\u6bd4\u7387\u611f\u77e5\u4e3a\u97f3\u9ad8\u7684\u7b49\u95f4\u9694\uff08\u6b63\u5982\u6211\u4eec\u5c06\u5f3a\u5ea6\u7684\u7b49\u6bd4\u7387\u611f\u77e5\u4e3a\u54cd\u5ea6\u7684\u7b49\u95f4\u9694\uff09\u3002\u5728\u7ea6 1000 Hz \u4ee5\u4e0b\uff0c\u6885\u5c14\u523b\u5ea6\u8fd1\u4f3c\u7ebf\u6027\uff1b\u5728 1000 Hz \u4ee5\u4e0a\uff0c\u5b83\u53d8\u4e3a\u8fd1\u4f3c\u5bf9\u6570\uff1a</li> </ul> \\[m = 2595 \\log_{10}\\left(1 + \\frac{f}{700}\\right)\\] <ul> <li> <p>\u5176\u9006\u53d8\u6362\u4e3a \\(f = 700(10^{m/2595} - 1)\\)\u3002\u6885\u5c14\u523b\u5ea6\u89e3\u91ca\u4e86\u4e3a\u4ec0\u4e48\u97f3\u4e50\u4e2d\u7684\u534a\u97f3\u5728\u5bf9\u6570\u9891\u7387\u8f74\u4e0a\u7b49\u95f4\u8ddd\u6392\u5217\uff1aA4\uff08440 Hz\uff09\u5230 A5\uff08880 Hz\uff09\u548c A5 \u5230 A6\uff081760 Hz\uff09\u542c\u8d77\u6765\u90fd\u662f\"\u5411\u4e0a\u4e00\u4e2a\u516b\u5ea6\"\uff0c\u5c3d\u7ba1\u4ee5 Hz \u4e3a\u5355\u4f4d\u7684\u95f4\u9694\u5206\u522b\u662f 440 \u548c 880\u3002</p> </li> <li> <p>\u6885\u5c14\u6ee4\u6ce2\u5668\u7ec4\u662f\u4e00\u7ec4\u5728\u6885\u5c14\u523b\u5ea6\u4e0a\u5747\u5300\u5206\u5e03\u7684\u4e09\u89d2\u5f62\u5e26\u901a\u6ee4\u6ce2\u5668\u3002\u6bcf\u4e2a\u6ee4\u6ce2\u5668\u8986\u76d6\u4e00\u4e2a\u9891\u5e26\uff0c\u5bf9\u8be5\u9891\u5e26\u5185\u7684\u9891\u8c31\u80fd\u91cf\u8fdb\u884c\u6c42\u548c\uff0c\u4ea7\u751f\u4e00\u4e2a\u6570\u503c\u3002\u5178\u578b\u7684\u8bed\u97f3\u7cfb\u7edf\u4f7f\u7528 40\u201380 \u4e2a\u6885\u5c14\u6ee4\u6ce2\u5668\u3002\u4f4e\u9891\u6ee4\u6ce2\u5668\u7a84\uff08\u5728\u4eba\u7c7b\u611f\u77e5\u654f\u611f\u7684\u9891\u7387\u5206\u8fa8\u7387\u9ad8\u7684\u533a\u57df\uff09\uff0c\u9ad8\u9891\u6ee4\u6ce2\u5668\u5bbd\uff08\u5728\u4eba\u7c7b\u4e0d\u654f\u611f\u7684\u4f4e\u5206\u8fa8\u7387\u533a\u57df\uff09\u3002\u8fd9\u6a21\u4eff\u4e86\u4eba\u8033\u8033\u8717\u7684\u9891\u7387\u5206\u8fa8\u7387\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u6885\u5c14\u9891\u7387\u5012\u8c31\u7cfb\u6570\uff08MFCC\uff09\u662f\u8bed\u97f3\u548c\u97f3\u9891\u7684\u7ecf\u5178\u7279\u5f81\u8868\u793a\u3002\u5b83\u4eec\u5c06\u6885\u5c14\u8c31\u538b\u7f29\u4e3a\u5c11\u91cf\u53bb\u76f8\u5173\u5316\u7684\u7cfb\u6570\uff0c\u6355\u6349\u8c31\u5305\u7edc\u7684\u5f62\u72b6\uff08\u7f16\u7801\u58f0\u9053\u914d\u7f6e\uff0c\u4ece\u800c\u7f16\u7801\u8bed\u97f3\u8eab\u4efd\uff09\uff0c\u540c\u65f6\u4e22\u5f03\u7cbe\u7ec6\u7684\u8c31\u7ec6\u8282\uff08\u7f16\u7801\u97f3\u9ad8\u548c\u76f8\u4f4d\uff09\u3002</p> </li> <li> <p>MFCC \u6d41\u6c34\u7ebf\uff1a</p> <ol> <li>\u9884\u52a0\u91cd\uff1a\u5e94\u7528\u4e00\u9636\u9ad8\u901a\u6ee4\u6ce2\u5668 \\(y[n] = x[n] - \\alpha x[n-1]\\)\uff08\u901a\u5e38 \\(\\alpha = 0.97\\)\uff09\u4ee5\u63d0\u5347\u88ab\u58f0\u9053\u8870\u51cf\u7684\u9ad8\u9891\u6210\u5206\u3002</li> <li>\u5206\u5e27\uff1a\u5c06\u4fe1\u53f7\u5207\u5206\u4e3a\u91cd\u53e0\u7684\u5e27\uff08\u901a\u5e38 25 ms \u957f\uff0c\u6b65\u8fdb 10 ms\uff09\u3002</li> <li>\u52a0\u7a97\uff1a\u5bf9\u6bcf\u5e27\u4e58\u4ee5\u7a97\u53e3\u51fd\u6570\uff08\u6c49\u660e\u7a97\uff09\u4ee5\u51cf\u5c11\u9891\u8c31\u6cc4\u6f0f\uff08\u89c1\u4e0b\u6587\uff09\u3002</li> <li>FFT\uff1a\u8ba1\u7b97\u6bcf\u5e27\u52a0\u7a97\u540e\u7684\u529f\u7387\u8c31\u3002</li> <li>\u6885\u5c14\u6ee4\u6ce2\u5668\u7ec4\uff1a\u5bf9\u529f\u7387\u8c31\u5e94\u7528\u4e09\u89d2\u5f62\u6885\u5c14\u6ee4\u6ce2\u5668\u7ec4\uff0c\u5f97\u5230\u6885\u5c14\u9891\u5e26\u80fd\u91cf\u3002</li> <li>\u5bf9\u6570\uff1a\u5bf9\u6885\u5c14\u9891\u5e26\u80fd\u91cf\u53d6\u5bf9\u6570\u3002\u5bf9\u6570\u538b\u7f29\u52a8\u6001\u8303\u56f4\uff0c\u5e76\u5c06\u4e58\u6cd5\uff08\u9891\u8c31\u5206\u91cf\u4e4b\u95f4\uff09\u8f6c\u6362\u4e3a\u52a0\u6cd5\uff0c\u5339\u914d\u4eba\u7c7b\u54cd\u5ea6\u611f\u77e5\u3002</li> <li>DCT\uff1a\u5bf9\u5bf9\u6570\u6885\u5c14\u80fd\u91cf\u5e94\u7528\u79bb\u6563\u4f59\u5f26\u53d8\u6362\u3002DCT \u5bf9\u6885\u5c14\u9891\u5e26\u8fdb\u884c\u53bb\u76f8\u5173\u5316\uff08\u56e0\u4e3a\u76f8\u90bb\u9891\u5e26\u9ad8\u5ea6\u76f8\u5173\uff09\u5e76\u5c06\u80fd\u91cf\u538b\u7f29\u5230\u524d\u51e0\u4e2a\u7cfb\u6570\u4e2d\u3002\u4fdd\u7559\u524d 13 \u4e2a\u7cfb\u6570\uff08MFCC-0 \u81f3 MFCC-12\uff09\u3002</li> </ol> </li> </ul> <p></p> <ul> <li> <p>\u7b2c 7 \u6b65\u4e2d\u7684 DCT \u672c\u8d28\u4e0a\u662f\"\u9891\u8c31\u7684\u5085\u91cc\u53f6\u53d8\u6362\"\uff08\u56e0\u6b64\u5f97\u540d\u5012\u8c31 cepstrum = spectrum \u7684\u5b57\u6bcd\u91cd\u6392\uff09\u3002\u4f4e\u9636\u5012\u8c31\u7cfb\u6570\u6355\u6349\u5bbd\u6cdb\u7684\u8c31\u5f62\u72b6\uff08\u58f0\u9053\u8c10\u632f\uff0c\u79f0\u4e3a\u5171\u632f\u5cf0\uff09\uff0c\u800c\u9ad8\u9636\u7cfb\u6570\u6355\u6349\u7cbe\u7ec6\u7684\u8c31\u7ec6\u8282\uff08\u97f3\u9ad8\u8c10\u6ce2\uff09\u3002\u901a\u8fc7\u53ea\u4fdd\u7559\u524d 13 \u4e2a\u7cfb\u6570\uff0c\u6211\u4eec\u4fdd\u7559\u4e86\u5171\u632f\u5cf0\u4fe1\u606f\u5e76\u4e22\u5f03\u4e86\u97f3\u9ad8\u7ec6\u8282\u3002</p> </li> <li> <p>Delta \u548c delta-delta MFCC\uff08MFCC \u7684\u4e00\u9636\u548c\u4e8c\u9636\u65f6\u95f4\u5bfc\u6570\uff0c\u901a\u8fc7\u76f8\u90bb\u5e27\u4e4b\u95f4\u7684\u6709\u9650\u5dee\u5206\u8ba1\u7b97\uff09\u6355\u6349\u8c31\u5f62\u72b6\u7684\u52a8\u6001\u53d8\u5316\uff0c\u589e\u52a0\u65f6\u95f4\u4e0a\u4e0b\u6587\u3002\u5b8c\u6574\u7684 MFCC \u7279\u5f81\u5411\u91cf\u901a\u5e38\u662f 39 \u7ef4\u7684\uff1a13 \u4e2a\u9759\u6001 + 13 \u4e2a delta + 13 \u4e2a delta-delta\u3002</p> </li> <li> <p>\u73b0\u4ee3\u795e\u7ecf\u7f51\u7edc\u6a21\u578b\uff08\u7b2c 06 \u7ae0\uff09\u5df2\u5728\u5f88\u5927\u7a0b\u5ea6\u4e0a\u7528\u5b66\u4e60\u5230\u7684\u7279\u5f81\u53d6\u4ee3\u4e86 MFCC\uff1a\u5bf9\u6570\u6885\u5c14\u8bed\u8c31\u56fe\uff08\u7b2c 6 \u6b65\u7684\u8f93\u51fa\uff0c\u8df3\u8fc7 DCT\uff09\u662f\u6df1\u5ea6\u5b66\u4e60 ASR \u548c\u97f3\u9891\u5206\u7c7b\u7684\u6807\u51c6\u8f93\u5165\u3002\u6a21\u578b\u5b66\u4e60\u81ea\u5df1\u7684\u53bb\u76f8\u5173\u5316\u3002\u5c3d\u7ba1\u5982\u6b64\uff0cMFCC \u5728\u4f4e\u8d44\u6e90\u573a\u666f\u3001\u7ecf\u5178 ML \u6d41\u6c34\u7ebf\u4ee5\u53ca\u7406\u89e3\u4fe1\u53f7\u5904\u7406\u57fa\u7840\u65b9\u9762\u4ecd\u7136\u5f88\u91cd\u8981\u3002</p> </li> <li> <p>\u52a0\u7a97\u662f\u5728\u8ba1\u7b97 FFT \u4e4b\u524d\u5bf9\u4fe1\u53f7\u5e27\u4e58\u4ee5\u5e73\u6ed1\u7a97\u53e3\u51fd\u6570\u7684\u8fc7\u7a0b\u3002\u4e0d\u52a0\u7a97\u65f6\uff0cFFT \u5047\u8bbe\u5e27\u65e0\u9650\u91cd\u590d\uff1b\u5e27\u7684\u7a81\u7136\u5f00\u59cb\u548c\u7ed3\u675f\u4f1a\u521b\u5efa\u4eba\u5de5\u7684\u4e0d\u8fde\u7eed\u6027\uff0c\u4f7f\u80fd\u91cf\u6269\u6563\u5230\u6240\u6709\u9891\u7387\uff0c\u8fd9\u79cd\u4f2a\u5f71\u79f0\u4e3a\u9891\u8c31\u6cc4\u6f0f\u3002</p> </li> <li> <p>\u77e9\u5f62\u7a97 \\(w[n] = 1\\) \u5bf9\u6240\u6709 \\(n\\)\uff1a\u65e0\u6e10\u51cf\uff0c\u6cc4\u6f0f\u6700\u5927\uff0c\u4f46\u4e3b\u74e3\u6700\u5bbd\uff08\u5728\u7ed9\u5b9a\u5e27\u957f\u4e0b\u9891\u7387\u5206\u8fa8\u7387\u6700\u4f73\uff09\u3002\u5b9e\u8df5\u4e2d\u5f88\u5c11\u4f7f\u7528\u3002</p> </li> <li> <p>\u6c49\u660e\u7a97\uff1a\\(w[n] = 0.54 - 0.46 \\cos(2\\pi n / (N-1))\\)\u3002\u5728\u8fb9\u7f18\u5904\u6e10\u51cf\u5230\u63a5\u8fd1\u96f6\uff0c\u5927\u5927\u51cf\u5c11\u6cc4\u6f0f\u3002\u662f\u8bed\u97f3\u5904\u7406\u7684\u6807\u51c6\u9009\u62e9\u3002</p> </li> <li> <p>\u6c49\u5b81\u7a97\uff08\u4e5f\u79f0\u4e3a Hanning \u7a97\uff09\uff1a\\(w[n] = 0.5 - 0.5 \\cos(2\\pi n / (N-1))\\)\u3002\u5728\u8fb9\u7f18\u5904\u7cbe\u786e\u6e10\u51cf\u5230\u96f6\u3002\u4e0e\u6c49\u660e\u7a97\u975e\u5e38\u76f8\u4f3c\uff0c\u4f46\u65c1\u74e3\u6291\u5236\u7565\u597d\u3002</p> </li> <li> <p>\u5e03\u83b1\u514b\u66fc\u7a97\uff1a\\(w[n] = 0.42 - 0.5 \\cos(2\\pi n / (N-1)) + 0.08 \\cos(4\\pi n / (N-1))\\)\u3002\u65c1\u74e3\u6291\u5236\u66f4\u597d\uff0c\u4f46\u4e3b\u74e3\u66f4\u5bbd\uff08\u9891\u7387\u5206\u8fa8\u7387\u66f4\u5dee\uff09\u3002\u5f53\u65c1\u74e3\u4f2a\u5f71\u7279\u522b\u4e25\u91cd\u65f6\u4f7f\u7528\u3002</p> </li> <li> <p>\u5b58\u5728\u4e00\u4e2a\u6839\u672c\u6027\u7684\u6743\u8861\uff1a\u6cc4\u6f0f\u8d8a\u5c11\u7684\u7a97\u53e3\uff0c\u4e3b\u74e3\u8d8a\u5bbd\uff0c\u610f\u5473\u7740\u5b83\u4eec\u65e0\u6cd5\u5206\u8fa8\u4e24\u4e2a\u95f4\u9694\u5f88\u8fd1\u7684\u9891\u7387\u3002\u8fd9\u5c31\u662f\u9891\u8c31\u5206\u8fa8\u7387\u4e0e\u6cc4\u6f0f\u7684\u6743\u8861\uff0c\u662f\u7b2c 03 \u7ae0\u4e0d\u786e\u5b9a\u539f\u7406\u7684\u7ed3\u679c\u3002</p> </li> <li> <p>\u91cd\u53e0\u76f8\u52a0\uff08OLA\uff09\u662f\u4e00\u79cd\u4ece\u52a0\u7a97\u3001\u5904\u7406\u540e\u7684\u5e27\u91cd\u5efa\u4fe1\u53f7\u7684\u6280\u672f\u3002\u5e27\u4e4b\u95f4\u6709\u91cd\u53e0\uff08\u901a\u5e38 50\u201375%\uff09\uff0c\u5904\u7406\u540e\u5c06\u52a0\u7a97\u540e\u7684\u8f93\u51fa\u76f8\u52a0\u3002\u5982\u679c\u7a97\u53e3\u548c\u91cd\u53e0\u9009\u62e9\u5f97\u5f53\uff08\u4f8b\u5982\uff0c\u6c49\u5b81\u7a97\u914d\u5408 50% \u91cd\u53e0\uff09\uff0c\u91cd\u53e0\u7684\u7a97\u53e3\u76f8\u52a0\u4e3a\u5e38\u6570\uff0c\u53ef\u5b9e\u73b0\u5b8c\u7f8e\u91cd\u5efa\u3002\u8fd9\u5bf9\u4efb\u4f55\u57fa\u4e8e\u5e27\u7684\u97f3\u9891\u4fee\u6539\uff08\u964d\u566a\u3001\u53d8\u8c03\u3001\u53d8\u901f\uff09\u90fd\u81f3\u5173\u91cd\u8981\u3002</p> </li> <li> <p>\u77ed\u65f6\u5085\u91cc\u53f6\u53d8\u6362\uff08STFT\uff09\u662f\u8bed\u8c31\u56fe\u80cc\u540e\u7684\u6b63\u5f0f\u6846\u67b6\u3002\u5b83\u5bf9\u4fe1\u53f7\u7684\u6bcf\u4e2a\u52a0\u7a97\u5e27\u5e94\u7528 DFT\uff1a</p> </li> </ul> \\[ \\text{STFT}\\{x[n]\\}(m, k) = \\sum_{n=0}^{N-1} x[n + mH] \\cdot w[n] \\cdot e^{-j 2\\pi k n / N} \\] <ul> <li> <p>\u5176\u4e2d \\(m\\) \u662f\u5e27\u7d22\u5f15\uff0c\\(H\\) \u662f\u6b65\u8fdb\u5927\u5c0f\uff08\u8fde\u7eed\u5e27\u4e4b\u95f4\u7684\u6837\u672c\u6570\uff09\uff0c\\(w[n]\\) \u662f\u7a97\u53e3\u51fd\u6570\uff0c\\(N\\) \u662f FFT \u5927\u5c0f\u3002\u8f93\u51fa\u662f\u4e00\u4e2a\u4e8c\u7ef4\u590d\u6570\u503c\u77e9\u9635\uff1a\u4fe1\u53f7\u7684\u65f6\u9891\u8868\u793a\u3002</p> </li> <li> <p>STFT \u4f53\u73b0\u4e86\u6839\u672c\u7684\u65f6\u9891\u6743\u8861\uff1a</p> <ul> <li>\u957f\u5e27\uff08\u5927 \\(N\\)\uff09\uff1a\u9891\u7387\u5206\u8fa8\u7387\u9ad8\uff08\u80fd\u533a\u5206\u95f4\u9694\u5f88\u8fd1\u7684\u9891\u7387\uff09\uff0c\u4f46\u65f6\u95f4\u5206\u8fa8\u7387\u5dee\uff08\u65e0\u6cd5\u7cbe\u786e\u5b9a\u4f4d\u9891\u7387\u4f55\u65f6\u53d8\u5316\uff09\u3002</li> <li>\u77ed\u5e27\uff08\u5c0f \\(N\\)\uff09\uff1a\u65f6\u95f4\u5206\u8fa8\u7387\u9ad8\uff0c\u4f46\u9891\u7387\u5206\u8fa8\u7387\u5dee\u3002</li> <li>\u65f6\u95f4\u5206\u8fa8\u7387\u548c\u9891\u7387\u5206\u8fa8\u7387\u7684\u4e58\u79ef\u6709\u4e0b\u754c\uff1a\\(\\Delta t \\cdot \\Delta f \\geq \\frac{1}{4\\pi}\\)\u3002\u8fd9\u662f\u52a0\u4f2f\u6781\u9650\uff0c\u662f\u7269\u7406\u4e2d\u6d77\u68ee\u5821\u4e0d\u786e\u5b9a\u539f\u7406\u5728\u4fe1\u53f7\u5904\u7406\u4e2d\u7684\u7c7b\u6bd4\u3002</li> </ul> </li> <li> <p>\u5178\u578b\u8bed\u97f3 STFT \u53c2\u6570\uff1a25 ms \u5e27\u957f\uff08\u5728 16 kHz \u4e0b \\(N = 400\\)\uff09\uff0c10 ms \u6b65\u8fdb\uff08\\(H = 160\\)\uff09\uff0c\u6c49\u660e\u7a97\uff0c512 \u70b9 FFT\uff08\u4ece 400 \u8fdb\u884c\u96f6\u586b\u5145\u4ee5\u63d0\u9ad8\u6548\u7387\u548c\u9891\u8c31\u63d2\u503c\u5e73\u6ed1\u5ea6\uff09\u3002</p> </li> <li> <p>\u6ee4\u6ce2\u901a\u8fc7\u653e\u5927\u67d0\u4e9b\u9891\u7387\u548c\u8870\u51cf\u5176\u4ed6\u9891\u7387\u6765\u4fee\u6539\u4fe1\u53f7\u7684\u9891\u7387\u5185\u5bb9\u3002\u6ee4\u6ce2\u5668\u662f\u4e00\u4e2a\u63a5\u53d7\u8f93\u5165\u4fe1\u53f7\u5e76\u4ea7\u751f\u8f93\u51fa\u4fe1\u53f7\u7684\u7cfb\u7edf\u3002\u6ee4\u6ce2\u5668\u7531\u5176\u9891\u7387\u54cd\u5e94 \\(H(f)\\) \u8868\u5f81\uff0c\u5b83\u63cf\u8ff0\u4e86\u6bcf\u4e2a\u9891\u7387\u4e0a\u6240\u65bd\u52a0\u7684\u589e\u76ca\u548c\u76f8\u4f4d\u504f\u79fb\u3002</p> </li> <li> <p>\u4f4e\u901a\u6ee4\u6ce2\u5668\uff1a\u901a\u8fc7\u4f4e\u4e8e\u622a\u6b62\u9891\u7387 \\(f_c\\) \u7684\u9891\u7387\uff0c\u8870\u51cf\u9ad8\u4e8e \\(f_c\\) \u7684\u9891\u7387\u3002\u7528\u4e8e\u53bb\u9664\u9ad8\u9891\u566a\u58f0\u548c\u7ec6\u8282\u3002\u91c7\u6837\u524d\u7684\u6297\u6df7\u53e0\u6ee4\u6ce2\u5668\u5c31\u662f\u4f4e\u901a\u6ee4\u6ce2\u5668\u3002</p> </li> <li> <p>\u9ad8\u901a\u6ee4\u6ce2\u5668\uff1a\u901a\u8fc7\u9ad8\u4e8e \\(f_c\\) \u7684\u9891\u7387\uff0c\u8870\u51cf\u4f4e\u4e8e \\(f_c\\) \u7684\u9891\u7387\u3002\u7528\u4e8e\u53bb\u9664\u4f4e\u9891\u9686\u9686\u58f0\u548c\u76f4\u6d41\u504f\u79fb\u3002MFCC \u63d0\u53d6\u4e2d\u7684\u9884\u52a0\u91cd\u6ee4\u6ce2\u5668\uff08\\(y[n] = x[n] - 0.97 x[n-1]\\)\uff09\u5c31\u662f\u4e00\u4e2a\u7b80\u5355\u7684\u9ad8\u901a\u6ee4\u6ce2\u5668\u3002</p> </li> <li> <p>\u5e26\u901a\u6ee4\u6ce2\u5668\uff1a\u901a\u8fc7\u8303\u56f4 \\([f_1, f_2]\\) \u5185\u7684\u9891\u7387\uff0c\u8870\u51cf\u8303\u56f4\u5916\u7684\u9891\u7387\u3002\u6885\u5c14\u6ee4\u6ce2\u5668\u7ec4\u4e2d\u7684\u6bcf\u4e2a\u4e09\u89d2\u5f62\u5c31\u662f\u4e00\u4e2a\u5e26\u901a\u6ee4\u6ce2\u5668\u3002</p> </li> <li> <p>\u5e26\u963b\uff08\u9677\u6ce2\uff09\u6ee4\u6ce2\u5668\uff1a\u8870\u51cf\u7279\u5b9a\u7684\u7a84\u9891\u8303\u56f4\u3002\u7528\u4e8e\u53bb\u9664\u7279\u5b9a\u5e72\u6270\uff08\u4f8b\u5982 50/60 Hz \u7684\u7535\u6e90\u7ebf\u55e1\u55e1\u58f0\uff09\u3002</p> </li> <li> <p>\u6709\u9650\u51b2\u6fc0\u54cd\u5e94\uff08FIR\uff09\u6ee4\u6ce2\u5668\u5c06\u6bcf\u4e2a\u8f93\u51fa\u6837\u672c\u8ba1\u7b97\u4e3a\u5f53\u524d\u548c\u8fc7\u53bb\u8f93\u5165\u6837\u672c\u7684\u52a0\u6743\u548c\uff1a</p> </li> </ul> \\[y[n] = \\sum_{k=0}^{M} b_k \\cdot x[n-k]\\] <ul> <li> <p>\u6743\u91cd \\(b_k\\) \u662f\u6ee4\u6ce2\u5668\u7cfb\u6570\uff08\u4e5f\u79f0\u4e3a\u62bd\u5934\uff09\u3002\u6ee4\u6ce2\u5668\u7684\u9636\u6570\u4e3a \\(M\\)\u3002FIR \u6ee4\u6ce2\u5668\u59cb\u7ec8\u7a33\u5b9a\uff08\u8f93\u51fa\u4e0d\u4f1a\u53d1\u6563\uff09\uff0c\u5e76\u4e14\u53ef\u4ee5\u8bbe\u8ba1\u4e3a\u5177\u6709\u5b8c\u7f8e\u7684\u7ebf\u6027\u76f8\u4f4d\uff08\u6240\u6709\u9891\u7387\u7684\u5ef6\u8fdf\u76f8\u540c\uff0c\u4ece\u800c\u4fdd\u6301\u6ce2\u5f62\u5f62\u72b6\uff09\u3002\u5176\u7f3a\u70b9\u662f\u5b9e\u73b0\u9661\u5ced\u7684\u622a\u6b62\u9700\u8981\u5927\u91cf\u62bd\u5934\uff08\u9ad8 \\(M\\)\uff09\uff0c\u589e\u52a0\u4e86\u8ba1\u7b97\u91cf\u3002\u8f93\u51fa\u662f\u8f93\u5165\u4e0e\u7cfb\u6570\u5411\u91cf\u7684\u5377\u79ef\uff0c\u6b63\u662f\u7b2c 06 \u7ae0\u4e2d\u7684\u4e00\u7ef4\u5377\u79ef\u8fd0\u7b97\u3002</p> </li> <li> <p>\u65e0\u9650\u51b2\u6fc0\u54cd\u5e94\uff08IIR\uff09\u6ee4\u6ce2\u5668\u4f7f\u7528\u53cd\u9988\uff1a\u8f93\u51fa\u65e2\u4f9d\u8d56\u4e8e\u8fc7\u53bb\u7684\u8f93\u5165\uff0c\u4e5f\u4f9d\u8d56\u4e8e\u8fc7\u53bb\u7684\u8f93\u51fa\uff1a</p> </li> </ul> \\[ y[n] = \\sum_{k=0}^{M} b_k \\cdot x[n-k] - \\sum_{k=1}^{L} a_k \\cdot y[n-k] \\] <ul> <li> <p>\u53cd\u9988\u9879 \\(a_k\\) \u521b\u5efa\u4e86\u4e00\u4e2a\u9012\u5f52\u7ed3\u6784\uff0c\u5176\u51b2\u6fc0\u54cd\u5e94\u7406\u8bba\u4e0a\u6301\u7eed\u65e0\u9650\u957f\u3002IIR \u6ee4\u6ce2\u5668\u53ef\u4ee5\u7528\u6bd4 FIR \u6ee4\u6ce2\u5668\u5c11\u5f97\u591a\u7684\u7cfb\u6570\u5b9e\u73b0\u9661\u5ced\u7684\u622a\u6b62\uff0c\u4f46\u53ef\u80fd\u4e0d\u7a33\u5b9a\uff08\u5982\u679c\u4f20\u9012\u51fd\u6570\u7684\u6781\u70b9\u4f4d\u4e8e\u5355\u4f4d\u5706\u4e4b\u5916\uff0c\u8f93\u51fa\u5c06\u65e0\u754c\u589e\u957f\u2014\u2014\u8fd9\u662f \\(z\\) \u53d8\u6362\u4e2d\u7684\u6982\u5ff5\uff09\u3002\u5b83\u4eec\u8fd8\u5177\u6709\u975e\u7ebf\u6027\u76f8\u4f4d\uff0c\u53ef\u80fd\u4f7f\u6ce2\u5f62\u5f62\u72b6\u5931\u771f\u3002\u7ecf\u5178\u6ee4\u6ce2\u5668\u8bbe\u8ba1\uff08\u5df4\u7279\u6c83\u65af\u3001\u5207\u6bd4\u96ea\u592b\u3001\u692d\u5706\u6ee4\u6ce2\u5668\uff09\u90fd\u662f IIR \u7684\u3002</p> </li> <li> <p>\u4f20\u9012\u51fd\u6570\u901a\u8fc7 \\(z\\) \u53d8\u6362\u83b7\u5f97\uff1a</p> </li> </ul> \\[H(z) = \\frac{\\sum_{k=0}^{M} b_k z^{-k}}{1 + \\sum_{k=1}^{L} a_k z^{-k}}\\] <ul> <li> <p>\u5206\u5b50\u7684\u6839\u79f0\u4e3a\u96f6\u70b9\uff0c\u5206\u6bcd\u7684\u6839\u79f0\u4e3a\u6781\u70b9\u3002\u6781\u96f6\u70b9\u56fe\u5b8c\u5168\u523b\u753b\u4e86\u6ee4\u6ce2\u5668\u7684\u884c\u4e3a\u3002\u5355\u4f4d\u5706\u9644\u8fd1\u7684\u6781\u70b9\u653e\u5927\u9644\u8fd1\u7684\u9891\u7387\uff1b\u5355\u4f4d\u5706\u9644\u8fd1\u7684\u96f6\u70b9\u8870\u51cf\u5b83\u4eec\u3002FIR \u6ee4\u6ce2\u5668\u53ea\u6709\u96f6\u70b9\uff08\u5206\u6bcd\u4e3a 1\uff09\u3002\u8fd9\u4e0e\u7b2c 02 \u7ae0\u548c\u7b2c 03 \u7ae0\u4e2d\u7684\u7279\u5f81\u503c\u548c\u6c42\u6839\u6982\u5ff5\u76f8\u8054\u7cfb\u3002</p> </li> <li> <p>\u5377\u79ef\u5b9a\u7406\uff1a\u65f6\u57df\u4e2d\u7684\u5377\u79ef\u7b49\u4e8e\u9891\u57df\u4e2d\u7684\u9010\u5143\u7d20\u4e58\u6cd5\u3002\u8fd9\u610f\u5473\u7740\u6ee4\u6ce2\u65e2\u53ef\u4ee5\u901a\u8fc7\u5c06\u4fe1\u53f7\u4e0e\u6ee4\u6ce2\u5668\u7684\u51b2\u6fc0\u54cd\u5e94\u76f4\u63a5\u5377\u79ef\u6765\u5b9e\u73b0\uff0c\u4e5f\u53ef\u4ee5\u901a\u8fc7\u5c06\u5b83\u4eec\u7684\u5085\u91cc\u53f6\u53d8\u6362\u76f8\u4e58\u518d\u9006\u53d8\u6362\u6765\u5b9e\u73b0\u3002\u5bf9\u4e8e\u957f\u6ee4\u6ce2\u5668\uff0c\u9891\u57df\u65b9\u6cd5\uff08\u4f7f\u7528 FFT\uff09\u66f4\u5feb\uff1a\\(O(N \\log N)\\) \u5bf9\u6bd4 \\(O(NM)\\)\u3002</p> </li> <li> <p>\u9006 STFT\uff08iSTFT\uff09\u4ece\u5176 STFT \u8868\u793a\u91cd\u5efa\u65f6\u57df\u4fe1\u53f7\u3002\u8fd9\u5bf9\u4e8e\u4efb\u4f55\u5728\u9891\u57df\u4e2d\u4fee\u6539\u97f3\u9891\u7684\u7cfb\u7edf\uff08\u964d\u566a\u3001\u6e90\u5206\u79bb\u3001\u8bed\u97f3\u8f6c\u6362\uff09\u90fd\u81f3\u5173\u91cd\u8981\u3002\u91cd\u5efa\u4f7f\u7528\u91cd\u53e0\u76f8\u52a0\uff1a</p> </li> </ul> \\[ x[n] = \\frac{\\sum_{m} w[n - mH] \\cdot \\text{IDFT}\\{X(m, k)\\}[n - mH]}{\\sum_{m} w[n - mH]^2} \\] <ul> <li> <p>\u5206\u6bcd\u5bf9\u7a97\u53e3\u91cd\u53e0\u8fdb\u884c\u5f52\u4e00\u5316\uff0c\u786e\u4fdd\u5f53\u5408\u6210\u7a97\u53e3\u4e0e\u5206\u6790\u7a97\u53e3\u5339\u914d\u4e14\u91cd\u53e0\u8db3\u591f\u65f6\u5b9e\u73b0\u5b8c\u7f8e\u91cd\u5efa\u3002</p> </li> <li> <p>\u8bed\u97f3 DSP \u6d41\u6c34\u7ebf\u603b\u7ed3\uff1a\u539f\u59cb\u97f3\u9891\u4ee5 16 kHz \u91c7\u6837\u3001\u9884\u52a0\u91cd\u3001\u5207\u5206\u4e3a 25 ms \u7684\u6c49\u660e\u7a97\u5e27\uff08\u6b65\u8fdb 10 ms\uff09\uff0c\u6bcf\u5e27\u8fdb\u884c FFT \u53d8\u6362\uff0c\u901a\u8fc7\u6885\u5c14\u6ee4\u6ce2\u5668\u7ec4\uff0c\u8fdb\u884c\u5bf9\u6570\u538b\u7f29\uff0c\u7136\u540e\u8981\u4e48\u4fdd\u7559\u4e3a\u5bf9\u6570\u6885\u5c14\u7279\u5f81\uff08\u7528\u4e8e\u795e\u7ecf\u7f51\u7edc\u6a21\u578b\uff09\uff0c\u8981\u4e48\u8fdb\u884c DCT \u53d8\u6362\u751f\u6210 MFCC\uff08\u7528\u4e8e\u7ecf\u5178\u6a21\u578b\uff09\u3002\u6574\u4e2a\u6d41\u6c34\u7ebf\u5c06\u4e00\u7ef4\u65f6\u57df\u4fe1\u53f7\u8f6c\u6362\u4e3a\u9002\u5408\u4e0b\u6e38\u673a\u5668\u5b66\u4e60\u7684\u4e8c\u7ef4\u65f6\u9891\u8868\u793a\uff0c\u8fd9\u5c06\u662f\u6587\u4ef6 02 \u7684\u4e3b\u9898\u3002</p> </li> </ul>"},{"location":"chapter%2009%3A%20audio%20and%20speech/01.%20digital%20signal%20processing/#colab-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u5728 CoLab \u6216 notebook \u4e2d\u5b8c\u6210\uff09","text":"<ol> <li> <p>\u751f\u6210\u4e00\u4e2a\u6b63\u5f26\u6ce2\uff0c\u4ee5\u4e0d\u540c\u91c7\u6837\u7387\u91c7\u6837\uff0c\u6f14\u793a\u6df7\u53e0\u73b0\u8c61\u3002\u7ed8\u5236\u8fde\u7eed\u4fe1\u53f7\u3001\u6b63\u786e\u91c7\u6837\u7248\u672c\u548c\u6b20\u91c7\u6837\uff08\u6df7\u53e0\uff09\u7248\u672c\u7684\u5bf9\u6bd4\u56fe\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u53c2\u6570\nf_signal = 5.0  # 5 Hz \u4fe1\u53f7\nduration = 1.0  # 1 \u79d2\n\n# \"\u8fde\u7eed\"\u4fe1\u53f7\uff08\u975e\u5e38\u9ad8\u7684\u91c7\u6837\u7387\uff09\nt_cont = jnp.linspace(0, duration, 10000)\nx_cont = jnp.sin(2 * jnp.pi * f_signal * t_cont)\n\n# \u6b63\u786e\u91c7\u6837\uff08fs = 50 Hz\uff0c\u8fdc\u9ad8\u4e8e\u5948\u594e\u65af\u7279\u9891\u7387 10 Hz\uff09\nfs_good = 50\nt_good = jnp.arange(0, duration, 1.0 / fs_good)\nx_good = jnp.sin(2 * jnp.pi * f_signal * t_good)\n\n# \u6b20\u91c7\u6837\uff08fs = 7 Hz\uff0c\u4f4e\u4e8e\u5948\u594e\u65af\u7279\u9891\u7387 10 Hz\uff09-&gt; \u6df7\u53e0\nfs_bad = 7\nt_bad = jnp.arange(0, duration, 1.0 / fs_bad)\nx_bad = jnp.sin(2 * jnp.pi * f_signal * t_bad)\n\n# \u6df7\u53e0\u540e\u7684\u9891\u7387\uff1a|f_signal - fs_bad| = |5 - 7| = 2 Hz\nf_alias = abs(f_signal - fs_bad)\nx_alias_cont = jnp.sin(2 * jnp.pi * f_alias * t_cont)\n\nfig, axes = plt.subplots(3, 1, figsize=(12, 9))\n\n# \u56fe 1\uff1a\u539f\u59cb\u4fe1\u53f7\naxes[0].plot(t_cont, x_cont, color='#3498db', linewidth=1.5, label=f'\u539f\u59cb {f_signal} Hz \u4fe1\u53f7')\naxes[0].set_title(f'\u539f\u59cb {f_signal} Hz \u4fe1\u53f7')\naxes[0].set_xlabel('\u65f6\u95f4 (s)'); axes[0].set_ylabel('\u632f\u5e45')\naxes[0].legend(); axes[0].grid(True, alpha=0.3)\n\n# \u56fe 2\uff1a\u6b63\u786e\u91c7\u6837\naxes[1].plot(t_cont, x_cont, color='#3498db', linewidth=1, alpha=0.4, label='\u539f\u59cb\u4fe1\u53f7')\naxes[1].stem(t_good, x_good, linefmt='#27ae60', markerfmt='o', basefmt='k-',\n             label=f'\u4ee5 {fs_good} Hz \u91c7\u6837\uff08\u9ad8\u4e8e\u5948\u594e\u65af\u7279\u9891\u7387\uff09')\naxes[1].set_title(f'\u6b63\u786e\u91c7\u6837\uff1afs = {fs_good} Hz &gt; 2 x {f_signal} Hz')\naxes[1].set_xlabel('\u65f6\u95f4 (s)'); axes[1].set_ylabel('\u632f\u5e45')\naxes[1].legend(); axes[1].grid(True, alpha=0.3)\n\n# \u56fe 3\uff1a\u6df7\u53e0\u91c7\u6837\naxes[2].plot(t_cont, x_cont, color='#3498db', linewidth=1, alpha=0.4, label='\u539f\u59cb\u4fe1\u53f7')\naxes[2].stem(t_bad, x_bad, linefmt='#e74c3c', markerfmt='o', basefmt='k-',\n             label=f'\u4ee5 {fs_bad} Hz \u91c7\u6837\uff08\u4f4e\u4e8e\u5948\u594e\u65af\u7279\u9891\u7387\uff09')\naxes[2].plot(t_cont, x_alias_cont, color='#f39c12', linewidth=1.5, linestyle='--',\n             label=f'\u6df7\u53e0\u4fe1\u53f7\u8868\u73b0\u4e3a {f_alias} Hz')\naxes[2].set_title(f'\u6df7\u53e0\u91c7\u6837\uff1afs = {fs_bad} Hz &lt; 2 x {f_signal} Hz')\naxes[2].set_xlabel('\u65f6\u95f4 (s)'); axes[2].set_ylabel('\u632f\u5e45')\naxes[2].legend(); axes[2].grid(True, alpha=0.3)\n\nplt.tight_layout(); plt.show()\n</code></pre></p> </li> <li> <p>\u8ba1\u7b97\u5e76\u53ef\u89c6\u5316\u7531\u591a\u4e2a\u6b63\u5f26\u6ce2\u7ec4\u6210\u7684\u4fe1\u53f7\u7684 FFT\u3002\u663e\u793a\u5e45\u5ea6\u8c31\u5e76\u8bc6\u522b\u7ec4\u6210\u9891\u7387\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u521b\u5efa\u590d\u5408\u4fe1\u53f7\uff1a220 Hz + 440 Hz + 880 Hz\uff08A3 + A4 + A5\uff09\nfs = 8000  # 8 kHz \u91c7\u6837\u7387\nduration = 0.1  # 100 ms\nt = jnp.arange(0, duration, 1.0 / fs)\nn_samples = len(t)\n\n# \u4e09\u4e2a\u9891\u7387\u5206\u91cf\uff0c\u4e0d\u540c\u632f\u5e45\nx = 1.0 * jnp.sin(2 * jnp.pi * 220 * t) + \\\n    0.6 * jnp.sin(2 * jnp.pi * 440 * t) + \\\n    0.3 * jnp.sin(2 * jnp.pi * 880 * t)\n\n# \u8ba1\u7b97 FFT\nX = jnp.fft.fft(x)\nfreqs = jnp.fft.fftfreq(n_samples, d=1.0 / fs)\nmagnitude = jnp.abs(X) / n_samples  # \u5f52\u4e00\u5316\n\n# \u53ea\u7ed8\u5236\u6b63\u9891\u7387\u90e8\u5206\npos_mask = freqs &gt;= 0\nfreqs_pos = freqs[pos_mask]\nmag_pos = magnitude[pos_mask] * 2  # \u7ffb\u500d\u4ee5\u8865\u507f\u8d1f\u9891\u7387\u7684\u80fd\u91cf\n\nfig, axes = plt.subplots(2, 1, figsize=(12, 7))\n\n# \u65f6\u57df\naxes[0].plot(t * 1000, x, color='#3498db', linewidth=1)\naxes[0].set_title('\u590d\u5408\u4fe1\u53f7\uff1a220 Hz + 440 Hz + 880 Hz')\naxes[0].set_xlabel('\u65f6\u95f4 (ms)'); axes[0].set_ylabel('\u632f\u5e45')\naxes[0].grid(True, alpha=0.3)\n\n# \u9891\u57df\naxes[1].plot(freqs_pos, mag_pos, color='#e74c3c', linewidth=1.5)\naxes[1].set_title('\u5e45\u5ea6\u8c31\uff08FFT\uff09')\naxes[1].set_xlabel('\u9891\u7387 (Hz)'); axes[1].set_ylabel('\u5e45\u5ea6')\naxes[1].set_xlim(0, 1500)\n# \u6807\u6ce8\u5cf0\u503c\nfor f_peak, amp in [(220, 1.0), (440, 0.6), (880, 0.3)]:\n    axes[1].annotate(f'{f_peak} Hz', xy=(f_peak, amp), fontsize=10,\n                     ha='center', va='bottom', color='#9b59b6',\n                     arrowprops=dict(arrowstyle='-&gt;', color='#9b59b6'))\naxes[1].grid(True, alpha=0.3)\n\nplt.tight_layout(); plt.show()\n</code></pre></p> </li> <li> <p>\u5728 JAX \u4e2d\u4ece\u5934\u6784\u5efa\u5b8c\u6574\u7684 MFCC \u6d41\u6c34\u7ebf\uff1a\u9884\u52a0\u91cd\u3001\u5206\u5e27\u3001\u52a0\u7a97\u3001FFT\u3001\u6885\u5c14\u6ee4\u6ce2\u5668\u7ec4\u3001\u5bf9\u6570\u3001DCT\u3002\u53ef\u89c6\u5316\u6885\u5c14\u6ee4\u6ce2\u5668\u7ec4\u548c\u751f\u6210\u7684 MFCC \u70ed\u529b\u56fe\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# --- \u751f\u6210\u4e00\u4e2a\u5408\u6210\u7c7b\u8bed\u97f3\u4fe1\u53f7 ---\nkey = jax.random.PRNGKey(42)\nfs = 16000\nduration = 1.0\nt = jnp.arange(0, duration, 1.0 / fs)\n\n# \u6a21\u62df\u6d4a\u97f3\u8bed\u97f3\uff1a\u57fa\u9891 + \u8c10\u6ce2\uff0c\u632f\u5e45\u8870\u51cf\nf0 = 150.0  # \u57fa\u9891\nx = sum(jnp.sin(2 * jnp.pi * f0 * k * t) / k for k in range(1, 8))\n# \u6dfb\u52a0\u4e00\u4e9b\u566a\u58f0\nx = x + 0.1 * jax.random.normal(key, t.shape)\nx = x / jnp.max(jnp.abs(x))  # \u5f52\u4e00\u5316\n\n# --- \u7b2c 1 \u6b65\uff1a\u9884\u52a0\u91cd ---\nalpha = 0.97\nx_pre = jnp.concatenate([x[:1], x[1:] - alpha * x[:-1]])\n\n# --- \u7b2c 2 \u6b65\uff1a\u5206\u5e27 ---\nframe_len = int(0.025 * fs)   # 25 ms = 400 \u4e2a\u6837\u672c\nhop_len = int(0.010 * fs)     # 10 ms = 160 \u4e2a\u6837\u672c\nn_frames = (len(x_pre) - frame_len) // hop_len + 1\nframes = jnp.stack([x_pre[i * hop_len : i * hop_len + frame_len]\n                     for i in range(n_frames)])\n\n# --- \u7b2c 3 \u6b65\uff1a\u6c49\u660e\u7a97 ---\nhamming = 0.54 - 0.46 * jnp.cos(2 * jnp.pi * jnp.arange(frame_len) / (frame_len - 1))\nwindowed = frames * hamming\n\n# --- \u7b2c 4 \u6b65\uff1aFFT ---\nn_fft = 512\nspectra = jnp.fft.rfft(windowed, n=n_fft)\npower_spectra = jnp.abs(spectra) ** 2 / n_fft\n\n# --- \u7b2c 5 \u6b65\uff1a\u6885\u5c14\u6ee4\u6ce2\u5668\u7ec4 ---\nn_mels = 40\nf_min, f_max = 0.0, fs / 2.0\n\ndef hz_to_mel(f):\n    return 2595 * jnp.log10(1 + f / 700)\n\ndef mel_to_hz(m):\n    return 700 * (10 ** (m / 2595) - 1)\n\nmel_min = hz_to_mel(f_min)\nmel_max = hz_to_mel(f_max)\nmel_points = jnp.linspace(mel_min, mel_max, n_mels + 2)\nhz_points = mel_to_hz(mel_points)\n\nfreq_bins = jnp.floor((n_fft + 1) * hz_points / fs).astype(jnp.int32)\nn_freqs = n_fft // 2 + 1\nfilterbank = jnp.zeros((n_mels, n_freqs))\n\nfor m in range(n_mels):\n    f_left = freq_bins[m]\n    f_center = freq_bins[m + 1]\n    f_right = freq_bins[m + 2]\n    # \u4e0a\u5347\u6cbf\n    for k in range(int(f_left), int(f_center)):\n        if f_center != f_left:\n            filterbank = filterbank.at[m, k].set((k - f_left) / (f_center - f_left))\n    # \u4e0b\u964d\u6cbf\n    for k in range(int(f_center), int(f_right)):\n        if f_right != f_center:\n            filterbank = filterbank.at[m, k].set((f_right - k) / (f_right - f_center))\n\n# \u5e94\u7528\u6ee4\u6ce2\u5668\u7ec4\nmel_spectra = jnp.dot(power_spectra, filterbank.T)\n\n# --- \u7b2c 6 \u6b65\uff1a\u5bf9\u6570 ---\nlog_mel = jnp.log(mel_spectra + 1e-10)\n\n# --- \u7b2c 7 \u6b65\uff1aDCT\uff08\u7b2c\u4e8c\u7c7b\uff09 ---\nn_mfcc = 13\nn_mel_channels = log_mel.shape[1]\ndct_matrix = jnp.zeros((n_mfcc, n_mel_channels))\nfor i in range(n_mfcc):\n    for j in range(n_mel_channels):\n        dct_matrix = dct_matrix.at[i, j].set(\n            jnp.cos(jnp.pi * i * (j + 0.5) / n_mel_channels)\n        )\nmfccs = jnp.dot(log_mel, dct_matrix.T)\n\n# --- \u53ef\u89c6\u5316 ---\nfig, axes = plt.subplots(3, 1, figsize=(14, 11))\n\n# \u6885\u5c14\u6ee4\u6ce2\u5668\u7ec4\nfreq_axis = jnp.linspace(0, fs / 2, n_freqs)\nfor m in range(n_mels):\n    color = '#3498db' if m % 2 == 0 else '#e74c3c'\n    axes[0].plot(freq_axis, filterbank[m], color=color, alpha=0.6, linewidth=0.8)\naxes[0].set_title(f'\u6885\u5c14\u6ee4\u6ce2\u5668\u7ec4\uff08{n_mels} \u4e2a\u6ee4\u6ce2\u5668\uff09')\naxes[0].set_xlabel('\u9891\u7387 (Hz)'); axes[0].set_ylabel('\u6743\u91cd')\naxes[0].grid(True, alpha=0.3)\n\n# \u5bf9\u6570\u6885\u5c14\u8bed\u8c31\u56fe\nim1 = axes[1].imshow(log_mel.T, aspect='auto', origin='lower',\n                      extent=[0, duration, 0, n_mels], cmap='viridis')\naxes[1].set_title('\u5bf9\u6570\u6885\u5c14\u8bed\u8c31\u56fe')\naxes[1].set_xlabel('\u65f6\u95f4 (s)'); axes[1].set_ylabel('\u6885\u5c14\u9891\u5e26')\nplt.colorbar(im1, ax=axes[1], label='\u5bf9\u6570\u80fd\u91cf')\n\n# MFCC\nim2 = axes[2].imshow(mfccs.T, aspect='auto', origin='lower',\n                      extent=[0, duration, 0, n_mfcc], cmap='coolwarm')\naxes[2].set_title(f'MFCC\uff08\u524d {n_mfcc} \u4e2a\u7cfb\u6570\uff09')\naxes[2].set_xlabel('\u65f6\u95f4 (s)'); axes[2].set_ylabel('MFCC \u7d22\u5f15')\nplt.colorbar(im2, ax=axes[2], label='\u7cfb\u6570\u503c')\n\nplt.tight_layout(); plt.show()\n</code></pre></p> </li> <li> <p>\u5b9e\u73b0 FIR \u4f4e\u901a\u548c\u9ad8\u901a\u6ee4\u6ce2\u5668\uff0c\u5e76\u53ef\u89c6\u5316\u5b83\u4eec\u5bf9\u5305\u542b\u4f4e\u9891\u548c\u9ad8\u9891\u5206\u91cf\u4fe1\u53f7\u7684\u5f71\u54cd\u3002\u540c\u65f6\u663e\u793a\u65f6\u57df\u548c\u9891\u57df\u7684\u89c6\u56fe\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u521b\u5efa\u5305\u542b\u4f4e\u9891\uff08100 Hz\uff09\u548c\u9ad8\u9891\uff082000 Hz\uff09\u5206\u91cf\u7684\u4fe1\u53f7\nfs = 8000\nduration = 0.05  # 50 ms\uff0c\u4fbf\u4e8e\u6e05\u6670\u663e\u793a\nt = jnp.arange(0, duration, 1.0 / fs)\n\nx_low = jnp.sin(2 * jnp.pi * 100 * t)\nx_high = 0.5 * jnp.sin(2 * jnp.pi * 2000 * t)\nx = x_low + x_high\n\n# \u4f7f\u7528\u7a97\u51fd\u6570\u6cd5\u8bbe\u8ba1\u7b80\u5355\u7684 FIR \u4f4e\u901a\u6ee4\u6ce2\u5668\ndef fir_lowpass(cutoff_hz, fs, n_taps=51):\n    \"\"\"\u4f7f\u7528\u7a97\u51fd\u6570\u6cd5\u8bbe\u8ba1 FIR \u4f4e\u901a\u6ee4\u6ce2\u5668\u3002\"\"\"\n    fc = cutoff_hz / fs  # \u5f52\u4e00\u5316\u622a\u6b62\u9891\u7387\n    n = jnp.arange(n_taps)\n    mid = (n_taps - 1) / 2.0\n    # Sinc \u51fd\u6570\uff08\u7406\u60f3\u4f4e\u901a\u51b2\u6fc0\u54cd\u5e94\uff09\n    h = jnp.where(n == mid, 2 * fc,\n                  jnp.sin(2 * jnp.pi * fc * (n - mid)) / (jnp.pi * (n - mid)))\n    # \u5e94\u7528\u6c49\u660e\u7a97\n    window = 0.54 - 0.46 * jnp.cos(2 * jnp.pi * n / (n_taps - 1))\n    h = h * window\n    h = h / jnp.sum(h)  # \u5f52\u4e00\u5316\u5230\u76f4\u6d41\u589e\u76ca\u4e3a 1\n    return h\n\ndef apply_filter(x, h):\n    \"\"\"\u901a\u8fc7\u5377\u79ef\u5e94\u7528 FIR \u6ee4\u6ce2\u5668\u3002\"\"\"\n    return jnp.convolve(x, h, mode='same')\n\n# 500 Hz \u4f4e\u901a\u6ee4\u6ce2\u5668\uff08\u901a\u8fc7 100 Hz\uff0c\u963b\u585e 2000 Hz\uff09\nh_lp = fir_lowpass(500, fs, n_taps=51)\nx_lp = apply_filter(x, h_lp)\n\n# \u9ad8\u901a = \u51b2\u6fc0 - \u4f4e\u901a\uff08\u9891\u8c31\u53cd\u8f6c\uff09\ndelta = jnp.zeros(51)\ndelta = delta.at[25].set(1.0)\nh_hp = delta - h_lp\nx_hp = apply_filter(x, h_hp)\n\n# \u8ba1\u7b97\u6240\u6709\u4fe1\u53f7\u7684\u9891\u8c31\ndef compute_spectrum(signal, fs):\n    X = jnp.fft.rfft(signal)\n    freqs = jnp.fft.rfftfreq(len(signal), d=1.0 / fs)\n    mag = jnp.abs(X) / len(signal) * 2\n    return freqs, mag\n\nfig, axes = plt.subplots(3, 2, figsize=(14, 10))\n\n# \u65f6\u57df\u56fe\nfor i, (sig, title, color) in enumerate([\n    (x, '\u539f\u59cb\u4fe1\u53f7\uff08100 Hz + 2000 Hz\uff09', '#3498db'),\n    (x_lp, '\u4f4e\u901a\u6ee4\u6ce2\u540e\uff08&lt; 500 Hz\uff09', '#27ae60'),\n    (x_hp, '\u9ad8\u901a\u6ee4\u6ce2\u540e\uff08&gt; 500 Hz\uff09', '#e74c3c')\n]):\n    axes[i, 0].plot(t * 1000, sig[:len(t)], color=color, linewidth=1)\n    axes[i, 0].set_title(f'\u65f6\u57df\uff1a{title}')\n    axes[i, 0].set_xlabel('\u65f6\u95f4 (ms)'); axes[i, 0].set_ylabel('\u632f\u5e45')\n    axes[i, 0].grid(True, alpha=0.3)\n\n# \u9891\u57df\u56fe\nfor i, (sig, title, color) in enumerate([\n    (x, '\u539f\u59cb\u4fe1\u53f7', '#3498db'),\n    (x_lp, '\u4f4e\u901a', '#27ae60'),\n    (x_hp, '\u9ad8\u901a', '#e74c3c')\n]):\n    freqs, mag = compute_spectrum(sig, fs)\n    axes[i, 1].plot(freqs, mag, color=color, linewidth=1.5)\n    axes[i, 1].set_title(f'\u9891\u8c31\uff1a{title}')\n    axes[i, 1].set_xlabel('\u9891\u7387 (Hz)'); axes[i, 1].set_ylabel('\u5e45\u5ea6')\n    axes[i, 1].set_xlim(0, 3000)\n    axes[i, 1].axvline(x=500, color='#f39c12', linestyle='--', alpha=0.7,\n                        label='\u622a\u6b62\u9891\u7387\uff08500 Hz\uff09')\n    axes[i, 1].legend(); axes[i, 1].grid(True, alpha=0.3)\n\nplt.tight_layout(); plt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2009%3A%20audio%20and%20speech/02.%20automatic%20speech%20recognition/","title":"\u81ea\u52a8\u8bed\u97f3\u8bc6\u522b","text":"<p>\u81ea\u52a8\u8bed\u97f3\u8bc6\u522b\u5c06\u53e3\u8bed\u97f3\u9891\u8f6c\u6362\u4e3a\u4e66\u9762\u6587\u672c\uff0c\u5f25\u5408\u4eba\u7c7b\u8bed\u97f3\u4e0e\u673a\u5668\u53ef\u8bfb\u8bed\u8a00\u4e4b\u95f4\u7684\u9e3f\u6c9f\u3002\u672c\u6587\u6db5\u76d6 GMM-HMM\u3001CTC \u635f\u5931\u3001RNN-\u8f6c\u5bfc\u5668\u3001\u57fa\u4e8e\u6ce8\u610f\u529b\u7684\u7f16\u7801\u5668-\u89e3\u7801\u5668\u6a21\u578b\uff08LAS\uff09\u3001Whisper \u4ee5\u53ca\u7aef\u5230\u7aef ASR\uff0c\u4ece\u7ecf\u5178\u6d41\u6c34\u7ebf\u5230\u73b0\u4ee3\u795e\u7ecf\u67b6\u6784\u3002</p> <ul> <li> <p>\u81ea\u52a8\u8bed\u97f3\u8bc6\u522b\uff08ASR\uff09\u662f\u5c06\u53e3\u8bed\u97f3\u9891\u8f6c\u6362\u4e3a\u4e66\u9762\u6587\u672c\u7684\u4efb\u52a1\u3002\u5b83\u662f AI \u9886\u57df\u6700\u53e4\u8001\u7684\u95ee\u9898\u4e4b\u4e00\uff0820 \u4e16\u7eaa 50 \u5e74\u4ee3\u7684\u7b2c\u4e00\u6279\u7cfb\u7edf\u5c31\u80fd\u8bc6\u522b\u5355\u4e2a\u6570\u5b57\uff09\uff0c\u4e5f\u662f\u5546\u4e1a\u90e8\u7f72\u6700\u5e7f\u6cdb\u7684\u4efb\u52a1\u4e4b\u4e00\uff08\u8bed\u97f3\u52a9\u624b\u3001\u8f6c\u5f55\u670d\u52a1\u3001\u5b57\u5e55\u751f\u6210\uff09\u3002</p> </li> <li> <p>\u96be\u70b9\u5728\u4e8e\u8bed\u97f3\u7684\u5de8\u5927\u53d8\u5f02\u6027\uff1a\u4e0d\u540c\u7684\u8bf4\u8bdd\u4eba\u3001\u53e3\u97f3\u3001\u8bed\u901f\u3001\u80cc\u666f\u566a\u58f0\u3001\u9ea6\u514b\u98ce\u7279\u6027\uff0c\u4ee5\u53ca\u5c06\u8fde\u7eed\u58f0\u5b66\u4fe1\u53f7\u6620\u5c04\u5230\u79bb\u6563\u5355\u8bcd\u8fd9\u4e00\u6839\u672c\u6027\u6b67\u4e49\u95ee\u9898\u3002</p> </li> <li> <p>\u53ef\u4ee5\u628a ASR \u60f3\u8c61\u6210\u6cd5\u5ead\u901f\u8bb0\u5458\u3002\u901f\u8bb0\u5458\u542c\u5230\u8fde\u7eed\u7684\u58f0\u97f3\u6d41\uff0c\u5728\u5fc3\u7406\u4e0a\u5c06\u5176\u5206\u5272\u6210\u5355\u8bcd\uff0c\u5229\u7528\u4e0a\u4e0b\u6587\u89e3\u51b3\u6b67\u4e49\uff08\u5982\"they're\" vs \"their\" vs \"there\"\uff09\uff0c\u7136\u540e\u6253\u51fa\u7ed3\u679c\u3002ASR \u7cfb\u7edf\u505a\u540c\u6837\u7684\u4e8b\u60c5\uff0c\u4f46\u5206\u9636\u6bb5\u8fdb\u884c\uff0c\u6bcf\u4e2a\u9636\u6bb5\u53ef\u4ee5\u72ec\u7acb\u6216\u8054\u5408\u4f18\u5316\u3002</p> </li> <li> <p>\u7ecf\u5178 ASR \u6d41\u6c34\u7ebf\u901a\u8fc7\u4e00\u7cfb\u5217\u4e0d\u540c\u9636\u6bb5\u5904\u7406\u97f3\u9891\uff1a\u539f\u59cb\u97f3\u9891\u88ab\u8f6c\u6362\u4e3a\u7279\u5f81\uff08MFCC \u6216\u5bf9\u6570\u6885\u5c14\u9891\u8c31\u56fe\uff0c\u89c1\u6587\u4ef6 01\uff09\uff0c\u58f0\u5b66\u6a21\u578b\u8bc4\u4f30\u6bcf\u4e2a\u7279\u5f81\u5e27\u4e0e\u6bcf\u4e2a\u8bed\u97f3\u5355\u5143\u7684\u5339\u914d\u7a0b\u5ea6\uff0c\u53d1\u97f3\u6a21\u578b\uff08\u8bcd\u5178\uff09\u5c06\u8bed\u97f3\u5355\u5143\u6620\u5c04\u4e3a\u5355\u8bcd\uff0c\u8bed\u8a00\u6a21\u578b\u8bc4\u4f30\u8bcd\u5e8f\u5217\u7684\u5408\u7406\u7a0b\u5ea6\uff0c\u89e3\u7801\u5668\u641c\u7d22\u4f7f\u8054\u5408\u5f97\u5206\u6700\u5927\u5316\u7684\u8bcd\u5e8f\u5217\u3002\u6bcf\u4e2a\u7ec4\u4ef6\u5206\u522b\u8bad\u7ec3\u548c\u8c03\u4f18\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u97f3\u7d20\u662f\u8bed\u8a00\u4e2d\u533a\u5206\u5355\u8bcd\u7684\u6700\u5c0f\u58f0\u97f3\u5355\u4f4d\u3002\u82f1\u8bed\u5927\u7ea6\u6709 39-44 \u4e2a\u97f3\u7d20\uff08\u5177\u4f53\u6570\u91cf\u53d6\u51b3\u4e8e\u65b9\u8a00\u548c\u6240\u7528\u97f3\u7d20\u5e93\uff09\u3002\u4f8b\u5982\uff0c\"bat\"\u548c\"pat\"\u76f8\u5dee\u4e00\u4e2a\u97f3\u7d20\uff08/b/ vs /p/\uff09\u3002\u5927\u591a\u6570 ASR \u7cfb\u7edf\u5efa\u6a21\u7684\u662f\u4e0a\u4e0b\u6587\u76f8\u5173\u97f3\u7d20\uff0c\u79f0\u4e3a\u4e09\u97f3\u7d20\uff1a\u7531\u5176\u5de6\u90bb\u548c\u53f3\u90bb\u5171\u540c\u5b9a\u4e49\u7684\u97f3\u7d20\uff08\u4f8b\u5982\uff0c\"b_t\"\u4e0a\u4e0b\u6587\u4e2d\u7684\"a\"\u4e0e\"c_t\"\u4e0a\u4e0b\u6587\u4e2d\u7684\"a\"\u662f\u4e0d\u540c\u7684\u5355\u5143\uff09\uff0c\u56e0\u4e3a\u97f3\u7d20\u7684\u58f0\u5b66\u5b9e\u73b0\u53d7\u5176\u90bb\u63a5\u97f3\u7d20\u7684\u5f3a\u70c8\u5f71\u54cd\uff08\u8fd9\u79f0\u4e3a\u534f\u540c\u53d1\u97f3\uff09\u3002</p> </li> <li> <p>\u53ef\u80fd\u7684\u4e09\u97f3\u7d20\u6570\u91cf\u5de8\u5927\uff0840 \u4e2a\u97f3\u7d20\u7684\u4e09\u6b21\u65b9 = 64,000\uff09\uff0c\u56e0\u6b64\u51b3\u7b56\u6811\u805a\u7c7b\u5c06\u58f0\u5b66\u4e0a\u76f8\u4f3c\u7684\u4e09\u97f3\u7d20\u5206\u7ec4\u4e3a\u58f0\u5b66\u72b6\u6001\uff08\u901a\u5e38\u4e3a 2000-10,000 \u4e2a\u7c7b\u522b\uff09\u3002\u6bcf\u4e2a\u58f0\u5b66\u72b6\u6001\u62e5\u6709\u81ea\u5df1\u7684\u58f0\u5b66\u6a21\u578b\u3002\u8fd9\u79cd\u805a\u7c7b\u662f\u7b2c 06 \u7ae0\u4e2d\u51b3\u7b56\u6811\u7b97\u6cd5\u7684\u4e00\u79cd\u5e94\u7528\u5f62\u5f0f\u3002</p> </li> <li> <p>GMM-HMM\uff08\u9ad8\u65af\u6df7\u5408\u6a21\u578b-\u9690\u9a6c\u5c14\u53ef\u592b\u6a21\u578b\uff09\u662f\u4ece 20 \u4e16\u7eaa 80 \u5e74\u4ee3\u5230 21 \u4e16\u7eaa\u521d\u4e3b\u5bfc\u7684\u58f0\u5b66\u5efa\u6a21\u65b9\u6cd5\u3002HMM\uff08\u89c1\u7b2c 05 \u7ae0\uff09\u5bf9\u8bed\u97f3\u7684\u65f6\u95f4\u7ed3\u6784\u8fdb\u884c\u5efa\u6a21\uff1a\u6bcf\u4e2a\u97f3\u7d20\u662f\u4e00\u4e2a\u4ece\u5de6\u5230\u53f3\u7684 HMM\uff0c\u6709 3-5 \u4e2a\u72b6\u6001\uff0c\u6bcf\u4e2a\u72b6\u6001\u4ee3\u8868\u4e00\u4e2a\u5b50\u97f3\u7d20\u6bb5\uff08\u8d77\u59cb\u3001\u4e2d\u95f4\u3001\u7ed3\u675f\uff09\u3002\u72b6\u6001\u95f4\u7684\u8f6c\u79fb\u9690\u5f0f\u5730\u5efa\u6a21\u65f6\u957f\u3002</p> </li> <li> <p>\u5728\u6bcf\u4e2a HMM \u72b6\u6001\uff0c\u53d1\u5c04\u6982\u7387\uff08\u7ed9\u5b9a\u72b6\u6001\u4e0b\u7279\u5b9a\u7279\u5f81\u5411\u91cf\u7684\u53ef\u80fd\u6027\uff09\u7531\u9ad8\u65af\u6df7\u5408\u6a21\u578b\uff08GMM\uff09\u5efa\u6a21\uff1a\u591a\u5143\u9ad8\u65af\u5206\u5e03\u7684\u52a0\u6743\u548c\uff08\u89c1\u7b2c 05 \u7ae0\uff09\uff1a</p> </li> </ul> \\[ p(\\mathbf{x} | s) = \\sum_{m=1}^{M} w_m \\cdot \\mathcal{N}(\\mathbf{x} ; \\boldsymbol{\\mu}_m, \\boldsymbol{\\Sigma}_m) \\] <ul> <li> <p>\u5176\u4e2d \\(\\mathbf{x}\\) \u662f\u7279\u5f81\u5411\u91cf\uff08\u4f8b\u5982 39 \u7ef4 MFCC\uff09\uff0c\\(s\\) \u662f HMM \u72b6\u6001\uff0c\\(M\\) \u662f\u6df7\u5408\u5206\u91cf\u6570\uff08\u901a\u5e38\u4e3a 8-64\uff09\uff0c\\(w_m\\) \u662f\u6df7\u5408\u6743\u91cd\uff0c\\(\\boldsymbol{\\mu}_m\\) \u548c \\(\\boldsymbol{\\Sigma}_m\\) \u662f\u6bcf\u4e2a\u9ad8\u65af\u5206\u91cf\u7684\u5747\u503c\u548c\u534f\u65b9\u5dee\u3002\u534f\u65b9\u5dee\u77e9\u9635\u901a\u5e38\u4f7f\u7528\u5bf9\u89d2\u5f62\u5f0f\u4ee5\u63d0\u9ad8\u8ba1\u7b97\u6548\u7387\uff08\u5047\u8bbe\u7279\u5f81\u7ef4\u5ea6\u72ec\u7acb\uff0c\u5bf9\u4e8e MFCC \u800c\u8a00\u7531\u4e8e DCT \u53bb\u76f8\u5173\u6027\uff0c\u8fd9\u4e00\u5047\u8bbe\u8fd1\u4f3c\u6210\u7acb\uff09\u3002</p> </li> <li> <p>\u8bad\u7ec3\u4f7f\u7528 Baum-Welch \u7b97\u6cd5\uff08EM \u7b97\u6cd5\u7684\u7279\u4f8b\uff0c\u89c1\u7b2c 05 \u7ae0\uff09\u4ece\u6709\u6807\u6ce8\u7684\u8bed\u97f3\u6570\u636e\u4e2d\u8fed\u4ee3\u4f30\u8ba1 GMM \u53c2\u6570\u548c HMM \u8f6c\u79fb\u6982\u7387\u3002\u89e3\u7801\uff08\u5bfb\u627e\u6700\u53ef\u80fd\u7684\u72b6\u6001\u5e8f\u5217\uff09\u4f7f\u7528 Viterbi \u7b97\u6cd5\uff08\u52a8\u6001\u89c4\u5212\uff0c\u89c1\u7b2c 05 \u7ae0\uff09\uff1a</p> </li> </ul> \\[ \\delta_t(j) = \\max_{i} \\left[ \\delta_{t-1}(i) \\cdot a_{ij} \\right] \\cdot b_j(\\mathbf{x}_t) \\] <ul> <li> <p>\u5176\u4e2d \\(\\delta_t(j)\\) \u662f\u5728\u65f6\u95f4 \\(t\\) \u4ee5\u72b6\u6001 \\(j\\) \u7ed3\u675f\u7684\u6700\u4f73\u8def\u5f84\u7684\u6982\u7387\uff0c\\(a_{ij}\\) \u662f\u4ece\u72b6\u6001 \\(i\\) \u5230\u72b6\u6001 \\(j\\) \u7684\u8f6c\u79fb\u6982\u7387\uff0c\\(b_j(\\mathbf{x}_t)\\) \u662f\u5728\u72b6\u6001 \\(j\\) \u4e0b\u7279\u5f81 \\(\\mathbf{x}_t\\) \u7684\u53d1\u5c04\u6982\u7387\u3002</p> </li> <li> <p>DNN-HMM\uff08Hinton \u7b49\u4eba\uff0c2012\uff09\u7528\u6df1\u5ea6\u795e\u7ecf\u7f51\u7edc\uff08DNN\uff0c\u89c1\u7b2c 06 \u7ae0\uff09\u53d6\u4ee3\u4e86 GMM \u53d1\u5c04\u6a21\u578b\uff0c\u4ece\u7279\u5f81\u5e27\u7a97\u53e3\u4e2d\u9884\u6d4b\u58f0\u5b66\u72b6\u6001\u540e\u9a8c\u6982\u7387 \\(p(s | \\mathbf{x})\\)\u3002HMM \u4ecd\u7136\u5904\u7406\u65f6\u95f4\u7ed3\u6784\u548c\u5e8f\u5217\u5316\uff0c\u4f46\u795e\u7ecf\u7f51\u7edc\u63d0\u4f9b\u4e86\u66f4\u5177\u5224\u522b\u529b\u7684\u53d1\u5c04\u5206\u6570\u3002\u8fd9\u79cd\u6df7\u5408\u65b9\u6cd5\u76f8\u5bf9\u4e8e GMM \u5c06\u8bcd\u9519\u8bef\u7387\u964d\u4f4e\u4e86 20-30%\uff0c\u5e76\u5728 2012-2016 \u5e74\u95f4\u5360\u636e\u4e3b\u5bfc\u5730\u4f4d\u3002</p> </li> <li> <p>WFST \u89e3\u7801\uff08\u52a0\u6743\u6709\u9650\u72b6\u6001\u6362\u5bfc\u5668\uff09\u662f\u4f20\u7edf ASR \u7684\u6807\u51c6\u89e3\u7801\u6846\u67b6\u3002\u6bcf\u4e2a\u7ec4\u4ef6\uff08HMM \u62d3\u6251 H\u3001\u4e0a\u4e0b\u6587\u4f9d\u8d56 C\u3001\u8bcd\u5178 L\u3001\u8bed\u6cd5/\u8bed\u8a00\u6a21\u578b G\uff09\u90fd\u8868\u793a\u4e3a\u52a0\u6743\u6709\u9650\u72b6\u6001\u6362\u5bfc\u5668\uff0c\u5b83\u4eec\u88ab\u7ec4\u5408\u6210\u5355\u4e2a\u641c\u7d22\u56fe \\(H \\circ C \\circ L \\circ G\\)\u3002\u7136\u540e Viterbi \u641c\u7d22\u5728\u6b64\u7ec4\u5408\u56fe\u4e2d\u5bfb\u627e\u6700\u4f4e\u6210\u672c\u8def\u5f84\u3002WFST \u5141\u8bb8\u77e5\u8bc6\u6e90\u7684\u6a21\u5757\u5316\u7ec4\u5408\u548c\u9ad8\u6548\u7684\u52a8\u6001\u89c4\u5212\u641c\u7d22\u3002\u5176\u6570\u5b66\u6846\u67b6\u6765\u81ea\u6709\u9650\u81ea\u52a8\u673a\u7406\u8bba\uff08\u4e0e\u7b2c 05 \u7ae0\u4e2d\u7684\u72b6\u6001\u673a\u76f8\u5173\uff09\u3002</p> </li> <li> <p>\u7aef\u5230\u7aef ASR \u6d88\u9664\u4e86\u72ec\u7acb\u7684\u7ec4\u4ef6\uff08\u53d1\u97f3\u6a21\u578b\u3001\u97f3\u7d20\u5e93\u3001WFST \u89e3\u7801\u5668\uff09\uff0c\u8bad\u7ec3\u4e00\u4e2a\u76f4\u63a5\u5c06\u97f3\u9891\u7279\u5f81\u6620\u5c04\u5230\u5b57\u7b26\u6216\u5b50\u8bcd\u7684\u5355\u4e00\u795e\u7ecf\u7f51\u7edc\u3002\u5173\u952e\u6311\u6218\u662f\u5bf9\u9f50\u95ee\u9898\uff1a\u8f93\u5165\uff08\u6bcf\u79d2\u6570\u767e\u4e2a\u7279\u5f81\u5e27\uff09\u548c\u8f93\u51fa\uff08\u6bcf\u79d2\u51e0\u4e2a\u5b57\u7b26\uff09\u7684\u957f\u5ea6\u76f8\u5dee\u5f88\u5927\uff0c\u4e14\u8bad\u7ec3\u65f6\u5b83\u4eec\u4e4b\u95f4\u7684\u5bf9\u9f50\u5173\u7cfb\u662f\u672a\u77e5\u7684\u3002</p> </li> <li> <p>\u8fde\u63a5\u4e3b\u4e49\u65f6\u5e8f\u5206\u7c7b\uff08CTC\uff09\uff08Graves \u7b49\u4eba\uff0c2006\uff09\u901a\u8fc7\u5f15\u5165\u4e00\u4e2a\u7279\u6b8a\u7684\u7a7a\u767d\u6807\u8bb0\u89e3\u51b3\u4e86\u5bf9\u9f50\u95ee\u9898\uff0c\u5141\u8bb8\u7f51\u7edc\u8f93\u51fa\u4efb\u610f\u957f\u5ea6\u7684\u5b57\u7b26\u548c\u7a7a\u767d\u5e8f\u5217\uff0c\u53ea\u8981\u901a\u8fc7\u5408\u5e76\u8fde\u7eed\u91cd\u590d\u548c\u79fb\u9664\u7a7a\u767d\u540e\u80fd\u5f97\u5230\u6b63\u786e\u7684\u8f6c\u5f55\u6587\u672c\u3002\u4f8b\u5982\uff0c\u8f6c\u5f55\u6587\u672c\"cat\"\u53ef\u4ee5\u7531\u8f93\u51fa\u5e8f\u5217\"--cc-aa-t--\"\u4ea7\u751f\uff08\u5176\u4e2d\"-\"\u662f\u7a7a\u767d\uff09\u3002</p> </li> <li> <p>\u5f62\u5f0f\u4e0a\uff0cCTC \u5b9a\u4e49\u4e86\u4e00\u4e2a\u591a\u5bf9\u4e00\u6620\u5c04 \\(\\mathcal{B}\\)\uff0c\u4ece\u6240\u6709\u957f\u5ea6\u4e3a \\(T\\) \u7684\u8f93\u51fa\u5e8f\u5217\uff08\u4f7f\u7528\u5b57\u6bcd\u8868\u52a0\u4e0a\u7a7a\u767d\uff09\u5230\u6807\u7b7e\u5e8f\u5217\u3002\u6807\u7b7e\u5e8f\u5217 \\(\\mathbf{y}\\) \u7684\u6982\u7387\u662f\u6240\u6709\u80fd\u7ea6\u7b80\u5230\u5b83\u7684\u5bf9\u9f50\u8def\u5f84\u7684\u6982\u7387\u4e4b\u548c\uff1a</p> </li> </ul> \\[P(\\mathbf{y} | \\mathbf{x}) = \\sum_{\\boldsymbol{\\pi} \\in \\mathcal{B}^{-1}(\\mathbf{y})} \\prod_{t=1}^{T} p(\\pi_t | \\mathbf{x})\\] <p></p> <ul> <li> <p>\u76f4\u63a5\u8ba1\u7b97\u6b64\u548c\u9700\u8981\u679a\u4e3e\u6307\u6570\u6570\u91cf\u7684\u5bf9\u9f50\u8def\u5f84\uff0c\u4f46 CTC \u524d\u5411-\u540e\u5411\u7b97\u6cd5\u4f7f\u7528\u52a8\u6001\u89c4\u5212\u5728 \\(O(T \\cdot |\\mathbf{y}|)\\) \u65f6\u95f4\u5185\u9ad8\u6548\u8ba1\u7b97\uff0c\u7c7b\u4f3c\u4e8e\u7b2c 05 \u7ae0\u4e2d\u7684 HMM \u524d\u5411-\u540e\u5411\u7b97\u6cd5\u3002</p> </li> <li> <p>CTC \u505a\u4e86\u4e00\u4e2a\u6761\u4ef6\u72ec\u7acb\u6027\u5047\u8bbe\uff1a\u7ed9\u5b9a\u8f93\u5165\uff0c\u6bcf\u4e2a\u65f6\u95f4\u6b65\u7684\u8f93\u51fa\u72ec\u7acb\u4e8e\u6240\u6709\u5176\u4ed6\u8f93\u51fa\u3002\u8fd9\u610f\u5473\u7740 CTC \u65e0\u6cd5\u5efa\u6a21\u8f93\u51fa\u4e4b\u95f4\u7684\u4f9d\u8d56\u5173\u7cfb\uff08\u4f8b\u5982\uff0c\u5b83\u65e0\u6cd5\u5b66\u4e60\u5230\"q\"\u51e0\u4e4e\u603b\u662f\u540e\u8ddf\"u\"\uff09\u3002\u5fc5\u987b\u4f7f\u7528\u5916\u90e8\u8bed\u8a00\u6a21\u578b\u6765\u5904\u7406\u6b64\u7c7b\u4f9d\u8d56\u5173\u7cfb\u3002</p> </li> <li> <p>CTC \u89e3\u7801\u9009\u9879\uff1a</p> <ul> <li>\u8d2a\u5a6a\u89e3\u7801\uff1a\u5728\u6bcf\u4e2a\u65f6\u95f4\u6b65\u53d6\u6700\u53ef\u80fd\u7684\u6807\u8bb0\uff0c\u7136\u540e\u5408\u5e76\u3002\u901f\u5ea6\u5feb\u4f46\u6548\u679c\u6b21\u4f18\u3002</li> <li>\u675f\u641c\u7d22\uff1a\u5728\u6bcf\u4e2a\u6b65\u9aa4\u7ef4\u62a4\u5f97\u5206\u6700\u9ad8\u7684 \\(k\\) \u4e2a\u90e8\u5206\u5047\u8bbe\uff0c\u5408\u5e76\u80fd\u7ea6\u7b80\u4e3a\u76f8\u540c\u524d\u7f00\u7684\u5047\u8bbe\u3002\u53ef\u4ee5\u7ed3\u5408\u8bed\u8a00\u6a21\u578b\u5f97\u5206\u3002</li> <li>\u524d\u7f00\u675f\u641c\u7d22\uff1a\u4e00\u79cd\u6539\u8fdb\u7684\u675f\u641c\u7d22\uff0c\u6b63\u786e\u5904\u7406 CTC \u7a7a\u767d\u5408\u5e76\uff0c\u786e\u4fdd\u5047\u8bbe\u5728\u5408\u5e76\u540e\u8fdb\u884c\u5bf9\u6bd4\u3002</li> </ul> </li> <li> <p>RNN-\u8f6c\u5bfc\u5668\uff08RNN-T\uff09\uff08Graves\uff0c2012\uff09\u901a\u8fc7\u6dfb\u52a0\u4e00\u4e2a\u663e\u5f0f\u7684\u9884\u6d4b\u7f51\u7edc\uff08\u7c7b\u8bed\u8a00\u6a21\u578b\u7684 RNN\uff09\u6269\u5c55\u4e86 CTC\uff0c\u4f7f\u6bcf\u4e2a\u8f93\u51fa\u4ee5\u4e4b\u524d\u7684\u8f93\u51fa\u4e3a\u6761\u4ef6\uff0c\u4ece\u800c\u6d88\u9664\u4e86\u6761\u4ef6\u72ec\u7acb\u6027\u5047\u8bbe\u3002RNN-T \u6709\u4e09\u4e2a\u7ec4\u4ef6\uff1a</p> <ul> <li>\u7f16\u7801\u5668\uff1a\u5904\u7406\u97f3\u9891\u7279\u5f81\uff0c\u751f\u6210\u9690\u85cf\u8868\u793a \\(\\mathbf{h}_t^\\text{enc}\\)\uff08\u901a\u5e38\u662f LSTM \u6216 Conformer \u5c42\u7684\u5806\u53e0\uff09\u3002</li> <li>\u9884\u6d4b\u7f51\u7edc\uff1a\u81ea\u56de\u5f52 RNN\uff0c\u6839\u636e\u4e4b\u524d\u53d1\u5c04\u7684\u6807\u7b7e\u751f\u6210\u9690\u85cf\u8868\u793a \\(\\mathbf{h}_u^\\text{pred}\\)\u3002</li> <li>\u8054\u5408\u7f51\u7edc\uff1a\u5728\u6bcf\u4e2a\uff08\u65f6\u95f4\uff0c\u6807\u7b7e\uff09\u4f4d\u7f6e\u7ec4\u5408\u7f16\u7801\u5668\u548c\u9884\u6d4b\u7f51\u7edc\u7684\u8f93\u51fa\uff0c\u4ea7\u751f\u4e0b\u4e00\u4e2a\u6807\u8bb0\uff08\u5305\u62ec\u7a7a\u767d\uff09\u7684\u5206\u5e03\uff1a</li> </ul> </li> </ul> \\[p(y | t, u) = \\text{softmax}(W \\cdot \\text{tanh}(W_\\text{enc} \\mathbf{h}_t^\\text{enc} + W_\\text{pred} \\mathbf{h}_u^\\text{pred} + b))\\] <ul> <li> <p>RNN-T \u53ef\u4ee5\u5728\u6bcf\u4e2a\u65f6\u95f4\u6b65\u53d1\u5c04\u96f6\u4e2a\u6216\u591a\u4e2a\u6807\u7b7e\uff08\u901a\u8fc7\u5148\u53d1\u5c04\u975e\u7a7a\u767d\u6807\u8bb0\u518d\u524d\u8fdb\u5230\u4e0b\u4e00\u4e2a\u65f6\u95f4\u6b65\uff0c\u6216\u53d1\u5c04\u7a7a\u767d\u524d\u8fdb\u4f46\u4e0d\u8f93\u51fa\uff09\u3002\u8bad\u7ec3\u4f7f\u7528\u4e8c\u7ef4\uff08\u65f6\u95f4\uff0c\u6807\u7b7e\uff09\u7f51\u683c\u4e0a\u7684\u524d\u5411-\u540e\u5411\u7b97\u6cd5\uff0c\u590d\u6742\u5ea6\u4e3a \\(O(T \\cdot U)\\)\uff0c\u5176\u4e2d \\(U\\) \u662f\u8f93\u51fa\u957f\u5ea6\u3002RNN-T \u662f\u8bbe\u5907\u7aef\u6d41\u5f0f ASR \u7684\u4e3b\u5bfc\u67b6\u6784\uff08\u7528\u4e8e Google Pixel \u624b\u673a\u548c\u7c7b\u4f3c\u4ea7\u54c1\uff09\uff0c\u56e0\u4e3a\u5b83\u5929\u7136\u652f\u6301\u6d41\u5f0f\u5904\u7406\uff1a\u7f16\u7801\u5668\u4ece\u5de6\u5230\u53f3\u5904\u7406\u97f3\u9891\uff0c\u9884\u6d4b\u7f51\u7edc\u589e\u91cf\u751f\u6210\u8f93\u51fa\u3002</p> </li> <li> <p>Listen, Attend and Spell\uff08LAS\uff09\uff08Chan \u7b49\u4eba\uff0c2016\uff09\u662f\u4e00\u79cd\u57fa\u4e8e\u6ce8\u610f\u529b\u7684\u7f16\u7801\u5668-\u89e3\u7801\u5668\u6a21\u578b\uff08\u5e8f\u5217\u5230\u5e8f\u5217\u67b6\u6784\uff0c\u89c1\u7b2c 06 \u7ae0\uff09\u3002\u5b83\u6709\u4e09\u4e2a\u7ec4\u4ef6\uff1a</p> <ul> <li>Listener\uff08\u7f16\u7801\u5668\uff09\uff1a\u91d1\u5b57\u5854\u5f62\u53cc\u5411 LSTM\uff0c\u5904\u7406\u5b8c\u6574\u7684\u8f93\u5165\u5e8f\u5217\u5e76\u4e0b\u91c7\u6837 8 \u500d\uff08\u901a\u8fc7\u5728\u6bcf\u5c42\u62fc\u63a5\u8fde\u7eed\u9690\u85cf\u72b6\u6001\u5bf9\uff09\uff0c\u751f\u6210\u8f83\u77ed\u7684\u7f16\u7801\u5668\u9690\u85cf\u72b6\u6001\u5e8f\u5217\u3002</li> <li>Attention\uff08\u6ce8\u610f\u529b\uff09\uff1a\u5728\u6bcf\u4e2a\u89e3\u7801\u6b65\u9aa4\u4e2d\uff0c\u8ba1\u7b97\u6240\u6709\u7f16\u7801\u5668\u72b6\u6001\u4e0a\u7684\u6ce8\u610f\u529b\u6743\u91cd\uff0c\u5f62\u6210\u4e0a\u4e0b\u6587\u5411\u91cf\uff08\u4e0e\u7b2c 07 \u7ae0\u4e2d\u76f8\u540c\u7684\u6ce8\u610f\u529b\u673a\u5236\uff09\u3002</li> <li>Speller\uff08\u89e3\u7801\u5668\uff09\uff1a\u81ea\u56de\u5f52 LSTM\uff0c\u5728\u4e0a\u4e0b\u6587\u5411\u91cf\u548c\u4e4b\u524d\u751f\u6210\u7684\u5b57\u7b26\u7684\u6761\u4ef6\u4e0b\u9010\u5b57\u7b26\u751f\u6210\u8f93\u51fa\u8f6c\u5f55\u6587\u672c\u3002</li> </ul> </li> <li> <p>LAS \u53d6\u5f97\u4e86\u5f88\u5f3a\u7684\u7ed3\u679c\uff0c\u4f46\u9700\u8981\u5b8c\u6574\u7684\u8bed\u97f3\u7247\u6bb5\u624d\u80fd\u5f00\u59cb\u89e3\u7801\uff08\u56e0\u4e3a\u6ce8\u610f\u529b\u9700\u8981\u5173\u6ce8\u6240\u6709\u7f16\u7801\u5668\u72b6\u6001\uff09\uff0c\u56e0\u6b64\u4e0d\u9002\u5408\u6d41\u5f0f\u5e94\u7528\u3002\u6b64\u5916\uff0c\u5b83\u5728\u5904\u7406\u8d85\u957f\u8bed\u97f3\u7247\u6bb5\u65f6\u8868\u73b0\u4e0d\u4f73\uff0c\u56e0\u4e3a\u957f\u5e8f\u5217\u4e0a\u7684\u6ce8\u610f\u529b\u4f1a\u53d8\u5f97\u5f25\u6563\u3002</p> </li> <li> <p>Conformer\uff08Gulati \u7b49\u4eba\uff0c2020\uff09\u5c06\u5377\u79ef\u7684\u5c40\u90e8\u6a21\u5f0f\u6355\u6349\u80fd\u529b\u4e0e\u81ea\u6ce8\u610f\u529b\u7684\u5168\u5c40\u4f9d\u8d56\u5efa\u6a21\u80fd\u529b\u76f8\u7ed3\u5408\u3002\u6bcf\u4e2a Conformer \u5757\u4ee5\u4e09\u660e\u6cbb\u7ed3\u6784\u5305\u542b\u56db\u4e2a\u6a21\u5757\uff1a</p> <ol> <li>\u524d\u9988\u6a21\u5757\uff08\u534a\u6b65\uff09\uff1a\u5e26\u6b8b\u5dee\u8fde\u63a5\u7684\u524d\u9988\u7f51\u7edc\uff0c\u4f7f\u7528\u4e00\u534a\u7684\u6b8b\u5dee\u6743\u91cd\u3002</li> <li>\u591a\u5934\u81ea\u6ce8\u610f\u529b\u6a21\u5757\uff1a\u6807\u51c6 Transformer \u81ea\u6ce8\u610f\u529b\uff08\u6765\u81ea\u7b2c 07 \u7ae0\uff09\uff0c\u4f7f\u7528\u76f8\u5bf9\u4f4d\u7f6e\u7f16\u7801\u3002</li> <li>\u5377\u79ef\u6a21\u5757\uff1a\u9010\u70b9\u5377\u79ef\u3001\u95e8\u63a7\u7ebf\u6027\u5355\u5143\uff08GLU\uff09\u3001\u4e00\u7ef4\u6df1\u5ea6\u53ef\u5206\u79bb\u5377\u79ef\u3001\u6279\u5f52\u4e00\u5316\u3001Swish \u6fc0\u6d3b\u51fd\u6570\u548c\u53e6\u4e00\u4e2a\u9010\u70b9\u5377\u79ef\u3002\u6df1\u5ea6\u53ef\u5206\u79bb\u5377\u79ef\u6355\u6349\u5c40\u90e8\u4e0a\u4e0b\u6587\uff08\u7c7b\u4f3c\u4e8e\u7279\u5f81\u5e8f\u5217\u4e0a\u7684 n-gram\uff09\u3002</li> <li>\u524d\u9988\u6a21\u5757\uff08\u534a\u6b65\uff09\uff1a\u4e0e\u6a21\u5757 1 \u76f8\u540c\u3002</li> </ol> </li> <li> <p>\u8f93\u51fa\u4e3a\uff1a\\(\\mathbf{y} = \\text{LayerNorm}(\\mathbf{x} + \\frac{1}{2}\\text{FFN}_1 + \\text{MHSA} + \\text{Conv} + \\frac{1}{2}\\text{FFN}_2)\\)\u3002\u5b9e\u9a8c\u8bc1\u660e\u8fd9\u79cd\u9a6c\u5361\u9f99\u5f0f\u7ed3\u6784\uff08FFN-\u6ce8\u610f\u529b-\u5377\u79ef-FFN\uff09\u914d\u5408\u534a\u6b65\u6b8b\u5dee\u4f18\u4e8e\u5176\u4ed6\u6392\u5e8f\u65b9\u5f0f\u3002Conformer \u5df2\u6210\u4e3a CTC \u548c RNN-T \u7cfb\u7edf\u7684\u9ed8\u8ba4\u7f16\u7801\u5668\uff0c\u6027\u80fd\u4f18\u4e8e\u7eaf Transformer \u548c\u7eaf LSTM \u7f16\u7801\u5668\u3002</p> </li> </ul> <p></p> <ul> <li> <p>Whisper\uff08Radford \u7b49\u4eba\uff0c2023\uff09\u662f OpenAI \u7684\u5927\u89c4\u6a21\u57fa\u4e8e\u6ce8\u610f\u529b\u7684 ASR \u6a21\u578b\u3002\u5b83\u4f7f\u7528\u6807\u51c6\u7684\u7f16\u7801\u5668-\u89e3\u7801\u5668 Transformer \u67b6\u6784\uff08\u6765\u81ea\u7b2c 07 \u7ae0\uff09\uff0c\u5728\u4ece\u4e92\u8054\u7f51\u6293\u53d6\u7684 68 \u4e07\u5c0f\u65f6\u5f31\u76d1\u7763\u6570\u636e\uff08\u97f3\u9891\u4e0e\u8fd1\u4f3c\u8f6c\u5f55\u6587\u672c\u914d\u5bf9\uff09\u4e0a\u8fdb\u884c\u8bad\u7ec3\u3002\u5173\u952e\u8bbe\u8ba1\u9009\u62e9\uff1a</p> <ul> <li>\u8f93\u5165\uff1a80 \u901a\u9053\u5bf9\u6570\u6885\u5c14\u9891\u8c31\u56fe\uff08\u6765\u81ea\u6587\u4ef6 01\uff09\uff0c\u4f7f\u7528 25 ms \u7a97\u53e3\u548c 10 ms \u6b65\u957f\uff0c\u5f52\u4e00\u5316\u4e3a\u96f6\u5747\u503c\u548c\u5355\u4f4d\u65b9\u5dee\u3002</li> <li>\u7f16\u7801\u5668\uff1a\u6807\u51c6 Transformer \u7f16\u7801\u5668\uff0c\u4f7f\u7528\u6b63\u5f26\u4f4d\u7f6e\u5d4c\u5165\u548c\u9884\u6fc0\u6d3b\u5c42\u5f52\u4e00\u5316\u3002</li> <li>\u89e3\u7801\u5668\uff1aTransformer \u89e3\u7801\u5668\uff0c\u4f7f\u7528\u5b57\u8282\u7ea7 BPE \u5206\u8bcd\u5668\uff08\u6765\u81ea\u7b2c 07 \u7ae0\uff09\u81ea\u56de\u5f52\u751f\u6210\u6807\u8bb0\u3002</li> <li>\u591a\u4efb\u52a1\uff1a\u5355\u4e2a\u6a21\u578b\u5904\u7406\u8f6c\u5f55\u3001\u7ffb\u8bd1\u3001\u8bed\u8a00\u8bc6\u522b\u548c\u65f6\u95f4\u6233\u9884\u6d4b\uff0c\u901a\u8fc7\u89e3\u7801\u5668\u63d0\u793a\u4e2d\u7684\u7279\u6b8a\u4efb\u52a1\u6807\u8bb0\u8fdb\u884c\u6761\u4ef6\u63a7\u5236\u3002</li> <li>\u8bad\u7ec3\u6570\u636e\u7684\u89c4\u6a21\uff08\u800c\u975e\u67b6\u6784\u521b\u65b0\uff09\u662f Whisper \u5728\u8de8\u9886\u57df\u3001\u8de8\u53e3\u97f3\u548c\u8de8\u8bed\u8a00\u4e0a\u5f3a\u6cdb\u5316\u80fd\u529b\u7684\u4e3b\u8981\u9a71\u52a8\u529b\u3002</li> </ul> </li> <li> <p>wav2vec 2.0\uff08Baevski \u7b49\u4eba\uff0c2020\uff09\u662f\u4e00\u79cd\u7528\u4e8e\u8bed\u97f3\u8868\u793a\u7684\u81ea\u76d1\u7763\u9884\u8bad\u7ec3\u6846\u67b6\u3002\u6838\u5fc3\u601d\u60f3\u662f\u4ece\u5927\u91cf\u672a\u6807\u6ce8\u7684\u97f3\u9891\u4e2d\u5b66\u4e60\u8bed\u97f3\u8868\u793a\uff0c\u7136\u540e\u7528\u5c11\u91cf\u6807\u6ce8\u6570\u636e\u8fdb\u884c\u5fae\u8c03\u3002\u8fd9\u9075\u5faa\u4e86\u4e0e BERT\uff08\u6765\u81ea\u7b2c 07 \u7ae0\uff09\u76f8\u540c\u7684\u81ea\u76d1\u7763\u8303\u5f0f\uff0c\u4f46\u9488\u5bf9\u8fde\u7eed\u97f3\u9891\u4fe1\u53f7\u8fdb\u884c\u4e86\u9002\u914d\u3002</p> </li> <li> <p>wav2vec 2.0 \u67b6\u6784\u5305\u542b\u4e09\u4e2a\u90e8\u5206\uff1a</p> <ul> <li>\u7279\u5f81\u7f16\u7801\u5668\uff1a\u591a\u5c42\u4e00\u7ef4 CNN\uff0c\u5904\u7406\u539f\u59cb\u6ce2\u5f62\u6837\u672c\uff0c\u4ee5 20 ms \u7684\u5e27\u7387\uff08\u5728 16 kHz \u4e0b\u6bcf 320 \u4e2a\u6837\u672c\u4e00\u4e2a\u5411\u91cf\uff09\u751f\u6210\u6f5c\u5728\u8868\u793a \\(\\mathbf{z}_t\\)\u3002</li> <li>\u91cf\u5316\u6a21\u5757\uff1a\u4f7f\u7528\u4e58\u79ef\u91cf\u5316\uff08\u5c06\u5411\u91cf\u5206\u6210\u7ec4\uff0c\u6bcf\u7ec4\u72ec\u7acb\u91cf\u5316\uff0c\u4ece \\(G\\) \u4e2a\u7801\u672c\u4e2d\u5404\u9009 \\(V\\) \u4e2a\u6761\u76ee\uff09\u5c06\u6f5c\u5728\u8868\u793a\u79bb\u6563\u5316\u4e3a\u6709\u9650\u7801\u672c\u3002\u8fd9\u4e3a\u5bf9\u6bd4\u5b66\u4e60\u76ee\u6807\u4ea7\u751f\u76ee\u6807 \\(\\mathbf{q}_t\\)\u3002</li> <li>\u4e0a\u4e0b\u6587\u7f51\u7edc\uff1aTransformer \u7f16\u7801\u5668\uff0c\u63a5\u6536\uff08\u90e8\u5206\u63a9\u7801\u7684\uff09\u6f5c\u5728\u8868\u793a\u5e76\u751f\u6210\u4e0a\u4e0b\u6587\u5316\u7684\u8868\u793a \\(\\mathbf{c}_t\\)\u3002</li> </ul> </li> </ul> <p></p> <ul> <li>\u5728\u9884\u8bad\u7ec3\u671f\u95f4\uff0c\u968f\u673a\u8de8\u5ea6\u5185\u7684\u6f5c\u5728\u8868\u793a\u88ab\u63a9\u7801\uff08\u66ff\u6362\u4e3a\u53ef\u5b66\u4e60\u7684\u63a9\u7801\u5d4c\u5165\uff09\uff0c\u6a21\u578b\u5fc5\u987b\u4ece\u4e00\u7ec4\u5e72\u6270\u9879\uff08\u4ece\u540c\u4e00\u8bed\u97f3\u7247\u6bb5\u7684\u5176\u4ed6\u4f4d\u7f6e\u91c7\u6837\u7684\u8d1f\u6837\u672c\uff09\u4e2d\u8bc6\u522b\u51fa\u63a9\u7801\u4f4d\u7f6e\u7684\u771f\u5b9e\u91cf\u5316\u8868\u793a\u3002\u5bf9\u6bd4\u635f\u5931\u4e3a\uff1a</li> </ul> \\[\\mathcal{L} = -\\log \\frac{\\exp(\\text{sim}(\\mathbf{c}_t, \\mathbf{q}_t) / \\kappa)}{\\sum_{\\tilde{\\mathbf{q}} \\in Q_t} \\exp(\\text{sim}(\\mathbf{c}_t, \\tilde{\\mathbf{q}}) / \\kappa)}\\] <ul> <li> <p>\u5176\u4e2d \\(\\text{sim}\\) \u662f\u4f59\u5f26\u76f8\u4f3c\u5ea6\uff0c\\(\\kappa\\) \u662f\u6e29\u5ea6\u53c2\u6570\uff0c\\(Q_t\\) \u5305\u62ec\u771f\u5b9e\u91cf\u5316\u76ee\u6807\u548c\u5e72\u6270\u9879\u3002\u989d\u5916\u7684\u591a\u6837\u6027\u635f\u5931\u9f13\u52b1\u5747\u8861\u4f7f\u7528\u6240\u6709\u7801\u672c\u6761\u76ee\u3002\u8be5\u635f\u5931\u672c\u8d28\u4e0a\u662f InfoNCE \u5bf9\u6bd4\u635f\u5931\uff0c\u4e0e\u89c6\u89c9\u81ea\u76d1\u7763\u5b66\u4e60\u4e2d\u4f7f\u7528\u7684\u5bf9\u6bd4\u76ee\u6807\u51fd\u6570\u5c5e\u4e8e\u540c\u4e00\u65cf\u3002</p> </li> <li> <p>\u9884\u8bad\u7ec3\u540e\uff0c\u5728\u5176\u4e0a\u6dfb\u52a0\u7ebf\u6027\u6295\u5f71\u548c CTC \u5934\u90e8\uff0c\u7136\u540e\u5728\u6807\u6ce8\u6570\u636e\u4e0a\u8fdb\u884c\u5fae\u8c03\u3002wav2vec 2.0 \u4ec5\u4f7f\u7528 10 \u5206\u949f\u6807\u6ce8\u6570\u636e\uff08\u4f7f\u7528 53,000 \u5c0f\u65f6\u672a\u6807\u6ce8\u97f3\u9891\u8fdb\u884c\u9884\u8bad\u7ec3\uff09\u5373\u8fbe\u5230\u4e86\u63a5\u8fd1\u6700\u4f18\u7684\u7ed3\u679c\uff0c\u5c55\u793a\u4e86\u81ea\u76d1\u7763\u5b66\u4e60\u5728\u4f4e\u8d44\u6e90\u8bed\u97f3\u8bc6\u522b\u4e2d\u7684\u5f3a\u5927\u80fd\u529b\u3002</p> </li> <li> <p>HuBERT\uff08Hsu \u7b49\u4eba\uff0c2021\uff09\u662f\u53e6\u4e00\u79cd\u81ea\u76d1\u7763\u65b9\u6cd5\uff0c\u7528\u63a9\u7801\u9884\u6d4b\u76ee\u6807\uff08\u9884\u6d4b\u63a9\u7801\u5e27\u7684\u79bb\u6563\u805a\u7c7b\u5206\u914d\uff09\u66ff\u4ee3\u5bf9\u6bd4\u76ee\u6807\u3002\u76ee\u6807\u7531\u79bb\u7ebf\u805a\u7c7b\u6b65\u9aa4\u4ea7\u751f\uff08\u7b2c\u4e00\u6b21\u8fed\u4ee3\u4f7f\u7528 MFCC \u7684 k-means\uff0c\u540e\u7eed\u8fed\u4ee3\u4f7f\u7528 HuBERT \u7279\u5f81\u7684 k-means\uff09\u3002\u4e0e wav2vec 2.0 \u76f8\u6bd4\uff0cHuBERT \u7b80\u5316\u4e86\u8bad\u7ec3\u6d41\u7a0b\uff08\u65e0\u9700\u91cf\u5316\u6a21\u5757\u6216\u5bf9\u6bd4\u91c7\u6837\uff09\uff0c\u4e14\u8fbe\u5230\u76f8\u5f53\u6216\u66f4\u597d\u7684\u7ed3\u679c\u3002</p> </li> <li> <p>Fast Conformer\uff08Rekesh \u7b49\u4eba\uff0c2023\uff0cNVIDIA NeMo\uff09\u7528\u4e0b\u91c7\u6837\u6ce8\u610f\u529b\u673a\u5236\u66ff\u4ee3\u6807\u51c6 Conformer \u4e2d\u7684\u4e8c\u6b21\u81ea\u6ce8\u610f\u529b\uff1a\u8f93\u5165\u5e8f\u5217\u5728\u8ba1\u7b97\u6ce8\u610f\u529b\u4e4b\u524d\u88ab\u538b\u7f29\uff08\u901a\u5e38\u901a\u8fc7\u6b65\u8fdb\u5377\u79ef\u5b9e\u73b0 8 \u500d\u538b\u7f29\uff09\uff0c\u7136\u540e\u518d\u6269\u5c55\u56de\u6765\u3002\u8fd9\u5c06\u6ce8\u610f\u529b\u6210\u672c\u4ece \\(O(T^2)\\) \u964d\u4f4e\u5230 \\(O(T^2/64)\\)\uff0c\u540c\u65f6\u4fdd\u7559\u5168\u5c40\u4e0a\u4e0b\u6587\uff0c\u4f7f\u8bad\u7ec3\u8d85\u957f\u8bed\u97f3\u7247\u6bb5\uff08\u957f\u8fbe\u51e0\u5206\u949f\uff09\u4e0d\u4f1a\u51fa\u73b0\u5185\u5b58\u95ee\u9898\u3002Fast Conformer \u662f NVIDIA NeMo \u5de5\u5177\u5305\u4e2d\u7684\u9ed8\u8ba4\u7f16\u7801\u5668\uff0c\u6784\u6210\u4e86\u5176\u751f\u4ea7\u7ea7\u6a21\u578b\u7684\u57fa\u7840\u67b6\u6784\u3002</p> </li> <li> <p>Parakeet\uff08NVIDIA\uff0c2024\uff09\u662f\u4e00\u7cfb\u5217\u57fa\u4e8e Fast Conformer \u7f16\u7801\u5668\u7684\u9ad8\u7cbe\u5ea6\u82f1\u6587 ASR \u6a21\u578b\uff0c\u914d\u5907 CTC \u548c RNN-T \u89e3\u7801\u5668\uff0c\u5728 64,000 \u5c0f\u65f6\u82f1\u8bed\u8bed\u97f3\u4e0a\u8bad\u7ec3\u3002Parakeet \u6a21\u578b\uff080.6B \u548c 1.1B \u53c2\u6570\uff09\u5728\u53d1\u5e03\u65f6\u4e8e\u6807\u51c6\u57fa\u51c6\u4e0a\u53d6\u5f97\u4e86\u6700\u4f4e\u7684\u8bcd\u9519\u8bef\u7387\uff0c\u5728\u5927\u591a\u6570\u82f1\u8bed\u6d4b\u8bd5\u96c6\u4e0a\u8d85\u8d8a\u4e86 Whisper large-v3\u3002\u5173\u952e\u8981\u7d20\u662f\u9ad8\u6548\u7684 Fast Conformer \u67b6\u6784\u3001\u6fc0\u8fdb\u7684\u6570\u636e\u589e\u5f3a\uff08SpecAugment\u3001\u901f\u5ea6\u6270\u52a8\u3001\u566a\u58f0\u6df7\u5408\uff09\u548c\u5927\u89c4\u6a21\u76d1\u7763\u8bad\u7ec3\u6570\u636e\u2014\u2014\u8fd9\u8868\u660e\u5bf9\u5df2\u77e5\u7ec4\u4ef6\u7684\u7cbe\u5fc3\u5de5\u7a0b\u5316\u4ecd\u80fd\u63a8\u52a8\u6280\u672f\u524d\u6cbf\u3002</p> </li> <li> <p>Canary\uff08NVIDIA\uff0c2024\uff09\u5c06 NeMo \u6846\u67b6\u6269\u5c55\u5230\u591a\u8bed\u8a00\u548c\u591a\u4efb\u52a1 ASR\u3002\u5b83\u4f7f\u7528 Fast Conformer \u7f16\u7801\u5668\u914d\u5408\u57fa\u4e8e\u6ce8\u610f\u529b\u7684\u89e3\u7801\u5668\uff08\u800c\u975e CTC \u6216 RNN-T\uff09\uff0c\u5728\u5355\u4e2a\u6a21\u578b\u4e2d\u5904\u7406\u591a\u79cd\u8bed\u8a00\u7684\u8f6c\u5f55\u548c\u7ffb\u8bd1\uff08\u7c7b\u4f3c\u4e8e Whisper \u7684\u591a\u4efb\u52a1\u8bbe\u8ba1\uff0c\u4f46\u4f7f\u7528\u66f4\u9ad8\u6548\u7684 Fast Conformer \u9aa8\u5e72\u7f51\u7edc\uff09\u3002Canary \u6a21\u578b\u652f\u6301\u82f1\u8bed\u3001\u5fb7\u8bed\u3001\u897f\u73ed\u7259\u8bed\u548c\u6cd5\u8bed\uff0c\u5177\u6709\u7ade\u4e89\u6027\u7684\u51c6\u786e\u7387\u3002</p> </li> <li> <p>Moonshine\uff08Useful Sensors\uff0c2024\uff09\u662f\u4e00\u7cfb\u5217\u9488\u5bf9\u8bbe\u5907\u7aef\u548c\u8fb9\u7f18\u90e8\u7f72\u4e13\u95e8\u4f18\u5316\u7684 ASR \u6a21\u578b\u3002\u7f16\u7801\u5668\u4f7f\u7528\u6df7\u5408\u67b6\u6784\uff0c\u5c06\u521d\u59cb\u7684 Transformer/Conformer \u5c42\u66ff\u6362\u4e3a\u5c0f\u578b CNN \u540e\u63a5\u5c11\u91cf Transformer \u5c42\uff0c\u5927\u5e45\u7f29\u5c0f\u4e86\u6a21\u578b\u4f53\u79ef\uff08\u57fa\u7840\u6a21\u578b\u4e0d\u5230 3000 \u4e07\u53c2\u6570\uff09\u3002Moonshine \u9762\u5411 CPU \u548c\u4f4e\u529f\u8017\u8bbe\u5907\u4e0a\u7684\u5b9e\u65f6\u6d41\u5f0f\u5904\u7406\uff0c\u5728\u8fd9\u4e9b\u573a\u666f\u4e0b Whisper \u8fc7\u5927\u8fc7\u6162\uff0cMoonshine \u4ee5\u5c11\u91cf\u7cbe\u5ea6\u6362\u53d6 5-10 \u500d\u7684\u66f4\u4f4e\u5ef6\u8fdf\u548c\u5185\u5b58\u5360\u7528\u3002</p> </li> <li> <p>Distil-Whisper\uff08Gandhi \u7b49\u4eba\uff0c2023\uff09\u5e94\u7528\u77e5\u8bc6\u84b8\u998f\uff08\u7b2c 06 \u7ae0\uff09\u5c06 Whisper \u538b\u7f29\u4e3a\u66f4\u5c0f\u66f4\u5feb\u7684\u6a21\u578b\u3002\u5b66\u751f\u6a21\u578b\u4ec5\u4f7f\u7528 2 \u4e2a\u89e3\u7801\u5668\u5c42\uff08\u76f8\u6bd4\u4e4b\u4e0b Whisper \u6709 32 \u5c42\uff09\uff0c\u540c\u65f6\u4fdd\u7559\u5b8c\u6574\u7684\u7f16\u7801\u5668\uff0c\u5e76\u8bad\u7ec3\u4ee5\u5339\u914d Whisper \u7684\u8f93\u51fa\u5206\u5e03\u3002Distil-Whisper \u5728 WER \u4e0a\u4e0e\u6559\u5e08\u6a21\u578b\u5dee\u8ddd\u5728 1% \u4ee5\u5185\uff0c\u540c\u65f6\u901f\u5ea6\u5feb\u4e86 6 \u500d\uff0c\u4f7f\u5176\u5728\u5168\u5c3a\u5bf8 Whisper \u6a21\u578b\u8fc7\u6162\u7684\u5b9e\u65f6\u5e94\u7528\u4e2d\u53d8\u5f97\u5b9e\u7528\u3002</p> </li> <li> <p>\u901a\u7528\u8bed\u97f3\u6a21\u578b\uff08USM\uff09\uff08Zhang \u7b49\u4eba\uff0c2023\uff0cGoogle\uff09\u5c06\u81ea\u76d1\u7763\u9884\u8bad\u7ec3\u6269\u5c55\u5230 1200 \u4e07\u5c0f\u65f6\u8de8 300 \u591a\u79cd\u8bed\u8a00\u7684\u672a\u6807\u6ce8\u97f3\u9891\uff0c\u968f\u540e\u8fdb\u884c\u76d1\u7763\u5fae\u8c03\u3002USM \u8bc1\u660e\u4e86 wav2vec 2.0 / \u81ea\u76d1\u7763\u8303\u5f0f\u53ef\u4ee5\u6269\u5c55\u5230\u771f\u6b63\u5927\u89c4\u6a21\u7684\u6570\u636e\u8303\u56f4\uff0c\u5728\u6807\u6ce8\u6570\u636e\u975e\u5e38\u6709\u9650\u7684\u4f4e\u8d44\u6e90\u8bed\u8a00\u4e0a\u53d6\u5f97\u4e86\u5f3a\u6027\u80fd\u3002</p> </li> <li> <p>\u5927\u89c4\u6a21\u591a\u8bed\u8a00\u8bed\u97f3\uff08MMS\uff09\uff08Pratap \u7b49\u4eba\uff0c2023\uff0cMeta\uff09\u5c06 wav2vec 2.0 \u9884\u8bad\u7ec3\u6269\u5c55\u5230\u8d85\u8fc7 1,100 \u79cd\u8bed\u8a00\uff0c\u5229\u7528\u5b97\u6559\u5f55\u97f3\u548c\u5176\u4ed6\u6765\u6e90\u7684\u591a\u8bed\u8a00\u97f3\u9891\u3002MMS \u8986\u76d6\u7684\u8bed\u8a00\u6570\u91cf\u8fdc\u8d85\u4e4b\u524d\u7684\u4efb\u4f55 ASR \u7cfb\u7edf\uff0c\u9996\u6b21\u4e3a\u8bb8\u591a\u8d44\u6e90\u532e\u4e4f\u7684\u8bed\u8a00\u63d0\u4f9b\u4e86\u8bed\u97f3\u8bc6\u522b\u80fd\u529b\u3002</p> </li> <li> <p>\u73b0\u4ee3 ASR \u7684\u683c\u5c40\u6b63\u8d8b\u4e8e\u51e0\u4e2a\u4e3b\u5bfc\u8303\u5f0f\uff1a\uff081\uff09Conformer \u65cf\u7f16\u7801\u5668\u914d\u5408 CTC \u6216 RNN-T \u7528\u4e8e\u6d41\u5f0f\u5904\u7406\uff0c\uff082\uff09\u7f16\u7801\u5668-\u89e3\u7801\u5668 Transformer \u7528\u4e8e\u79bb\u7ebf/\u591a\u4efb\u52a1\uff0c\uff083\uff09\u81ea\u76d1\u7763\u9884\u8bad\u7ec3\u7528\u4e8e\u4f4e\u8d44\u6e90\u573a\u666f\uff0c\uff084\uff09\u89c4\u6a21\u5316\u2014\u2014\u66f4\u591a\u7684\u6570\u636e\u548c\u66f4\u5927\u7684\u6a21\u578b\u6301\u7eed\u63d0\u5347\u51c6\u786e\u7387\u3002\u8fd9\u4e9b\u9009\u62e9\u53d6\u51b3\u4e8e\u90e8\u7f72\u7ea6\u675f\uff1a\u5ef6\u8fdf\u9884\u7b97\u3001\u53ef\u7528\u7b97\u529b\u3001\u8bed\u8a00\u6570\u91cf\uff0c\u4ee5\u53ca\u5e94\u7528\u662f\u6d41\u5f0f\u8fd8\u662f\u6279\u5904\u7406\u3002</p> </li> <li> <p>\u8bed\u8a00\u6a21\u578b\u96c6\u6210\u901a\u8fc7\u5f15\u5165\u58f0\u5b66\u6a21\u578b\u65e0\u6cd5\u6355\u6349\u7684\u8bed\u8a00\u77e5\u8bc6\u6765\u6539\u8fdb ASR\u3002\u57fa\u672c\u601d\u60f3\u662f\u5728\u89e3\u7801\u65f6\u5c06\u58f0\u5b66\u6a21\u578b\u5f97\u5206 \\(p(\\mathbf{x} | \\mathbf{y})\\)\uff08\u97f3\u9891\u4e0e\u8f6c\u5f55\u6587\u672c\u7684\u5339\u914d\u7a0b\u5ea6\uff09\u4e0e\u8bed\u8a00\u6a21\u578b\u5f97\u5206 \\(p(\\mathbf{y})\\)\uff08\u8f6c\u5f55\u6587\u672c\u4f5c\u4e3a\u53e5\u5b50\u7684\u5408\u7406\u6027\uff09\u76f8\u7ed3\u5408\u3002</p> </li> <li> <p>\u6d45\u878d\u5408\u5728\u675f\u641c\u7d22\u65f6\u7ed3\u5408\u5f97\u5206\uff1a</p> </li> </ul> \\[\\hat{\\mathbf{y}} = \\arg\\max_\\mathbf{y} \\left[ \\log p_\\text{AM}(\\mathbf{y} | \\mathbf{x}) + \\lambda \\log p_\\text{LM}(\\mathbf{y}) \\right]\\] <ul> <li> <p>\u5176\u4e2d \\(\\lambda\\) \u662f\u53ef\u8c03\u6743\u91cd\uff0c\\(p_\\text{LM}\\) \u662f\u5916\u90e8\u8bed\u8a00\u6a21\u578b\uff08\u901a\u5e38\u662f n-gram \u6216\u795e\u7ecf\u8bed\u8a00\u6a21\u578b\uff0c\u6765\u81ea\u7b2c 07 \u7ae0\uff09\u3002\u8fd9\u79cd\u65b9\u6cd5\u7b80\u5355\u6709\u6548\uff0c\u4f46\u8981\u6c42 LM \u4f7f\u7528\u4e0e ASR \u6a21\u578b\u76f8\u540c\u7684\u6807\u8bb0\u8bcd\u6c47\u8868\u3002</p> </li> <li> <p>\u6df1\u5ea6\u878d\u5408\uff08Gulcehre \u7b49\u4eba\uff0c2015\uff09\u5c06\u8bed\u8a00\u6a21\u578b\u96c6\u6210\u5230\u89e3\u7801\u5668\u7f51\u7edc\u5185\u90e8\uff1aLM \u9690\u85cf\u72b6\u6001\u4e0e\u89e3\u7801\u5668\u9690\u85cf\u72b6\u6001\u62fc\u63a5\uff0c\u901a\u8fc7\u95e8\u63a7\u673a\u5236\u540e\u8fdb\u5165\u8f93\u51fa\u6295\u5f71\u5c42\u3002\u6574\u4e2a\u7cfb\u7edf\uff08\u5305\u62ec\u9884\u8bad\u7ec3\u7684 LM\uff09\u88ab\u8054\u5408\u5fae\u8c03\u3002\u8fd9\u79cd\u65b9\u6cd5\u96c6\u6210\u66f4\u6df1\u5165\uff0c\u4f46\u8bad\u7ec3\u66f4\u590d\u6742\u3002</p> </li> <li> <p>\u51b7\u878d\u5408\uff08Sriram \u7b49\u4eba\uff0c2018\uff09\u4e0e\u6df1\u5ea6\u878d\u5408\u7c7b\u4f3c\uff0c\u4f46 ASR \u89e3\u7801\u5668\u4ece\u5934\u5f00\u59cb\u4e0e\u96c6\u6210\u8bed\u8a00\u6a21\u578b\u4e00\u8d77\u8bad\u7ec3\uff0c\u800c\u975e\u5fae\u8c03\u9884\u8bad\u7ec3\u7684\u89e3\u7801\u5668\u3002\u8fd9\u8feb\u4f7f\u58f0\u5b66\u6a21\u578b\u5b66\u4e60\u4e92\u8865\u4fe1\u606f\uff0c\u800c\u975e\u91cd\u590d LM \u5df2\u7ecf\u77e5\u9053\u7684\u5185\u5bb9\u3002</p> </li> <li> <p>\u91cd\u6253\u5206\uff08N-best \u91cd\u6253\u5206\uff09\u662f\u4e00\u79cd\u4e24\u904d\u65b9\u6cd5\uff1a\u9996\u5148\u4f7f\u7528\u675f\u641c\u7d22\u751f\u6210 \\(N\\) \u4e2a\u5019\u9009\u8f6c\u5f55\u6587\u672c\uff0c\u7136\u540e\u4f7f\u7528\u66f4\u5f3a\u5927\u7684\u8bed\u8a00\u6a21\u578b\uff08\u4f8b\u5982\uff0c\u5927\u578b Transformer LM\uff09\u5bf9\u5b83\u4eec\u91cd\u65b0\u6392\u5e8f\u3002\u8fd9\u79cd\u65b9\u6cd5\u5b9e\u73b0\u7b80\u5355\uff0c\u4e14\u5141\u8bb8\u4f7f\u7528\u5bf9\u7b2c\u4e00\u904d\u89e3\u7801\u6765\u8bf4\u592a\u6162\u7684\u975e\u5e38\u5927\u7684 LM\u3002</p> </li> <li> <p>\u5185\u90e8\u8bed\u8a00\u6a21\u578b\u4f30\u8ba1\uff08ILME\uff09\u89e3\u51b3\u4e86\u4e00\u4e2a\u5fae\u5999\u7684\u95ee\u9898\uff1a\u7aef\u5230\u7aef\u6a21\u578b\u4ece\u8bad\u7ec3\u8f6c\u5f55\u6587\u672c\u4e2d\u9690\u5f0f\u5b66\u4e60\u4e86\u4e00\u4e2a\u5185\u90e8 LM\uff0c\u8fd9\u5728\u6d45\u878d\u5408\u65f6\u53ef\u80fd\u4e0e\u5916\u90e8 LM \u51b2\u7a81\uff08\u672c\u8d28\u4e0a\u662f\u5bf9\u8bed\u8a00\u5148\u9a8c\u8fdb\u884c\u4e86\u53cc\u91cd\u8ba1\u6570\uff09\u3002ILME \u4f30\u8ba1\u5185\u90e8 LM \u5e76\u5728\u878d\u5408\u65f6\u51cf\u53bb\u5176\u5f97\u5206\uff1a</p> </li> </ul> \\[\\hat{\\mathbf{y}} = \\arg\\max_\\mathbf{y} \\left[ \\log p_\\text{E2E}(\\mathbf{y} | \\mathbf{x}) - \\beta \\log p_\\text{ILM}(\\mathbf{y}) + \\lambda \\log p_\\text{LM}(\\mathbf{y}) \\right]\\] <ul> <li> <p>\u6d41\u5f0f vs. \u79bb\u7ebf ASR \u662f\u4e00\u4e2a\u57fa\u672c\u7684\u67b6\u6784\u9009\u62e9\u3002\u79bb\u7ebf\uff08\u6216\u6279\u5904\u7406\uff09ASR \u5728\u5904\u7406\u5b8c\u6574\u4e2a\u8bed\u97f3\u7247\u6bb5\u540e\u624d\u4ea7\u751f\u8f93\u51fa\u3002\u6d41\u5f0f ASR \u5728\u97f3\u9891\u5230\u8fbe\u65f6\u589e\u91cf\u4ea7\u751f\u8f93\u51fa\uff0c\u5177\u6709\u6709\u754c\u5ef6\u8fdf\u3002</p> </li> <li> <p>\u6d41\u5f0f\u5904\u7406\u5bf9\u5b9e\u65f6\u5e94\u7528\u81f3\u5173\u91cd\u8981\uff1a\u5b9e\u65f6\u5b57\u5e55\u3001\u8bed\u97f3\u52a9\u624b\uff08\u7528\u6237\u5728\u8bf4\u5b8c\u4e4b\u524d\u5c31\u671f\u671b\u5f97\u5230\u54cd\u5e94\uff09\u3001\u7535\u8bdd\u901a\u8bdd\u8f6c\u5f55\u3002\u6311\u6218\u5728\u4e8e\u67d0\u4e9b\u672a\u6765\u4e0a\u4e0b\u6587\u6709\u52a9\u4e8e\u8bc6\u522b\uff08\u77e5\u9053\u4e0b\u4e00\u4e2a\u8bcd\u662f\"York\"\u6709\u52a9\u4e8e\u6d88\u6b67\"New\"\uff09\uff0c\u4f46\u6d41\u5f0f\u7cfb\u7edf\u4e0d\u80fd\u65e0\u9650\u7b49\u5f85\u672a\u6765\u7684\u4e0a\u4e0b\u6587\u3002</p> </li> <li> <p>\u5355\u5411\u7f16\u7801\u5668\uff08\u4ece\u5de6\u5230\u53f3 LSTM\u3001\u56e0\u679c\u5377\u79ef\u3001\u56e0\u679c Transformer\uff09\u5929\u7136\u652f\u6301\u6d41\u5f0f\u5904\u7406\uff0c\u56e0\u4e3a\u6bcf\u4e2a\u8f93\u51fa\u4ec5\u4f9d\u8d56\u4e8e\u8fc7\u53bb\u548c\u5f53\u524d\u7684\u8f93\u5165\u3002\u53cc\u5411\u7f16\u7801\u5668\uff08\u67e5\u770b\u672a\u6765\u4e0a\u4e0b\u6587\uff09\u4e0d\u80fd\u76f4\u63a5\u652f\u6301\u6d41\u5f0f\u5904\u7406\u3002</p> </li> <li> <p>\u5206\u5757\u6ce8\u610f\u529b\uff08\u4e5f\u79f0\u4e3a\u9010\u5757\u6216\u5206\u6bb5\u6ce8\u610f\u529b\uff09\u5c06\u8f93\u5165\u5212\u5206\u4e3a\u56fa\u5b9a\u957f\u5ea6\u7684\u5757\uff0c\u4ec5\u5728\u6bcf\u4e2a\u5757\u5185\uff08\u4ee5\u53ca\u53ef\u9009\u7684\u524d\u9762\u51e0\u4e2a\u5757\uff09\u5e94\u7528\u81ea\u6ce8\u610f\u529b\u3002\u8fd9\u5c06\u5ef6\u8fdf\u9650\u5236\u5728\u5757\u5927\u5c0f\u52a0\u4e0a\u5904\u7406\u65f6\u95f4\uff0c\u540c\u65f6\u5728\u6bcf\u4e2a\u5757\u5185\u4ecd\u5141\u8bb8\u4e00\u5b9a\u7684\u5c40\u90e8\u53cc\u5411\u4e0a\u4e0b\u6587\u3002\u5176\u6743\u8861\u662f\uff1a\u5757\u8d8a\u5c0f\uff0c\u51c6\u786e\u7387\u4e0b\u964d\u8d8a\u591a\u3002</p> </li> <li> <p>\u524d\u77bb\u5141\u8bb8\u6d41\u5f0f\u7f16\u7801\u5668\u5728\u5f53\u524d\u5e27\u4ea7\u751f\u8f93\u51fa\u4e4b\u524d\uff0c\u7aa5\u89c6\u5c11\u91cf\u7684\u672a\u6765\u5e27\uff08\u4f8b\u5982 300-900 ms\uff09\u3002\u8fd9\u662f\u901a\u8fc7\u5728\u5355\u5411\u8ba1\u7b97\u4e2d\u6dfb\u52a0\u5c11\u91cf\u53f3\u4e0a\u4e0b\u6587\u6765\u5b9e\u73b0\u7684\u3002\u524d\u77bb\u7a97\u53e3\u589e\u52a0\u4e86\u5ef6\u8fdf\uff0c\u4f46\u663e\u8457\u63d0\u5347\u4e86\u51c6\u786e\u7387\u3002</p> </li> <li> <p>\u6d41\u5f0f ASR \u4e2d\u7684\u5ef6\u8fdf\u5305\u542b\u51e0\u4e2a\u7ec4\u6210\u90e8\u5206\uff1a</p> <ul> <li>\u7b97\u6cd5\u5ef6\u8fdf\uff1a\u4ece\u97f3\u9891\u5230\u8fbe\u5230\u6a21\u578b\u80fd\u591f\u5904\u7406\u5b83\u7684\u5ef6\u8fdf\uff08\u7531\u5757\u5927\u5c0f\u3001\u524d\u77bb\u548c\u7279\u5f81\u63d0\u53d6\u51b3\u5b9a\uff09\u3002</li> <li>\u8ba1\u7b97\u5ef6\u8fdf\uff1a\u8fd0\u884c\u6a21\u578b\u524d\u5411\u4f20\u64ad\u6240\u9700\u7684\u65f6\u95f4\u3002</li> <li>\u7aef\u70b9\u68c0\u6d4b\u5ef6\u8fdf\uff1a\u68c0\u6d4b\u7528\u6237\u8bf4\u8bdd\u5b8c\u6bd5\u7684\u5ef6\u8fdf\u3002</li> <li>\u9996\u8bcd\u5ef6\u8fdf\uff1a\u7b2c\u4e00\u4e2a\u8bcd\u51fa\u73b0\u7684\u901f\u5ea6\u3002\u6700\u7ec8\u786e\u8ba4\u5ef6\u8fdf\uff1a\u6700\u7ec8\u8f93\u51fa\u88ab\u786e\u8ba4\u7684\u901f\u5ea6\uff08\u6d41\u5f0f\u7cfb\u7edf\u901a\u5e38\u4ea7\u751f\u6682\u5b9a\u8f93\u51fa\uff0c\u968f\u7740\u66f4\u591a\u97f3\u9891\u5230\u8fbe\u800c\u88ab\u4fee\u6b63\uff09\u3002</li> </ul> </li> <li> <p>ASR \u7684\u8bc4\u4f30\u6307\u6807\uff1a</p> </li> <li> <p>\u8bcd\u9519\u8bef\u7387\uff08WER\uff09\u662f\u4e3b\u8981\u6307\u6807\u3002\u901a\u8fc7\u5c06\u7cfb\u7edf\u8f93\u51fa\uff08\u5047\u8bbe\uff09\u4e0e\u53c2\u8003\u6587\u672c\uff08\u771f\u5b9e\u8f6c\u5f55\u6587\u672c\uff09\u8fdb\u884c\u5bf9\u9f50\u8ba1\u7b97\uff0c\u4f7f\u7528\u7f16\u8f91\u8ddd\u79bb\uff08\u5c06\u4e00\u4e2a\u8f6c\u6362\u4e3a\u53e6\u4e00\u4e2a\u6240\u9700\u7684\u6700\u5c11\u66ff\u6362\u3001\u63d2\u5165\u548c\u5220\u9664\u6b21\u6570\uff09\uff0c\u7136\u540e\uff1a</p> </li> </ul> \\[\\text{WER} = \\frac{S + D + I}{N}\\] <ul> <li> <p>\u5176\u4e2d \\(S\\) \u662f\u66ff\u6362\u6570\uff0c\\(D\\) \u662f\u5220\u9664\u6570\uff0c\\(I\\) \u662f\u63d2\u5165\u6570\uff0c\\(N\\) \u662f\u53c2\u8003\u6587\u672c\u4e2d\u7684\u603b\u8bcd\u6570\u3002\u5982\u679c\u63d2\u5165\u8fc7\u591a\uff0cWER \u53ef\u80fd\u8d85\u8fc7 100%\u30025% \u7684 WER \u88ab\u8ba4\u4e3a\u5927\u81f4\u76f8\u5f53\u4e8e\u4eba\u7c7b\u5728\u6e05\u6670\u6717\u8bfb\u8bed\u97f3\u4e0a\u7684\u6c34\u5e73\uff1b\u5bf9\u8bdd\u6216\u566a\u58f0\u73af\u5883\u4e0b\u7684\u8bed\u97f3\u5219\u56f0\u96be\u5f97\u591a\uff0810-20%+\uff09\u3002</p> </li> <li> <p>\u5b57\u7b26\u9519\u8bef\u7387\uff08CER\uff09\u662f\u76f8\u540c\u7684\u516c\u5f0f\u5e94\u7528\u4e8e\u5b57\u7b26\u7ea7\u522b\u800c\u975e\u8bcd\u7ea7\u522b\u3002CER \u5bf9\u4e8e\u6ca1\u6709\u660e\u786e\u8bcd\u8fb9\u754c\u7684\u8bed\u8a00\uff08\u5982\u4e2d\u6587\u3001\u65e5\u8bed\uff09\u4ee5\u53ca\u8bc4\u4f30\u8fd1\u4f3c\u6b63\u786e\u60c5\u51b5\u7684\u63a5\u8fd1\u7a0b\u5ea6\uff08\"cat\" vs \"bat\" \u662f 100% WER \u4f46 33% CER\uff09\u66f4\u6709\u53c2\u8003\u4ef7\u503c\u3002</p> </li> <li> <p>\u8bcd\u4fe1\u606f\u635f\u5931\uff08WIL\uff09\u548c\u8bcd\u4fe1\u606f\u4fdd\u7559\uff08WIP\uff09\u662f\u4fe1\u606f\u8bba\u66ff\u4ee3\u6307\u6807\uff0c\u6bd4 WER \u66f4\u7cbe\u786e\u5730\u8003\u8651\u4e86\u53c2\u8003\u6587\u672c\u4e0e\u5047\u8bbe\u4e4b\u95f4\u7684\u76f8\u5173\u6027\uff0c\u4f46\u4f7f\u7528\u8f83\u5c11\u3002</p> </li> <li> <p>\u5b9e\u65f6\u56e0\u5b50\uff08RTF\uff09\u8861\u91cf\u8ba1\u7b97\u6548\u7387\uff1a\u5904\u7406\u65f6\u95f4\u4e0e\u97f3\u9891\u65f6\u957f\u7684\u6bd4\u503c\u3002RTF &lt; 1 \u8868\u793a\u7cfb\u7edf\u8fd0\u884c\u901f\u5ea6\u5feb\u4e8e\u5b9e\u65f6\uff1bRTF &gt; 1 \u8868\u793a\u7cfb\u7edf\u65e0\u6cd5\u8ddf\u4e0a\u5b9e\u65f6\u97f3\u9891\u3002\u6d41\u5f0f\u7cfb\u7edf\u5fc5\u987b\u4fdd\u6301 RTF &lt; 1\u3002</p> </li> <li> <p>\u6570\u636e\u589e\u5f3a\u5bf9\u9c81\u68d2 ASR \u81f3\u5173\u91cd\u8981\u3002\u5e38\u89c1\u6280\u672f\uff1a</p> <ul> <li>\u901f\u5ea6\u6270\u52a8\uff1a\u4ee5 0.9 \u500d\u548c 1.1 \u500d\u901f\u5ea6\u5bf9\u97f3\u9891\u8fdb\u884c\u91cd\u91c7\u6837\uff08\u6539\u53d8\u97f3\u9ad8\u548c\u65f6\u957f\uff09\u3002</li> <li>SpecAugment\uff08Park \u7b49\u4eba\uff0c2019\uff09\uff1a\u63a9\u7801\u9891\u8c31\u56fe\u4e2d\u7684\u968f\u673a\u9891\u7387\u5e26\u548c\u65f6\u95f4\u6b65\u3002\u8fd9\u662f\u97f3\u9891\u9886\u57df\u7684 dropout \u7c7b\u6bd4\uff0c\u4e5f\u662f ASR \u4e2d\u6700\u6709\u6548\u7684\u6b63\u5219\u5316\u6280\u672f\u4e4b\u4e00\u3002\u65e0\u9700\u989d\u5916\u6570\u636e\u3002</li> <li>\u566a\u58f0\u589e\u5f3a\uff1a\u5c06\u5e72\u51c0\u8bed\u97f3\u4e0e\u5f55\u5236\u7684\u566a\u58f0\u4ee5\u5404\u79cd\u4fe1\u566a\u6bd4\u6df7\u5408\u3002</li> <li>\u623f\u95f4\u8109\u51b2\u54cd\u5e94\u6a21\u62df\uff1a\u5c06\u5e72\u51c0\u8bed\u97f3\u4e0e\u6a21\u62df\u7684\u623f\u95f4\u58f0\u5b66\u8fdb\u884c\u5377\u79ef\uff0c\u4ee5\u6a21\u62df\u6df7\u54cd\u73af\u5883\u3002</li> </ul> </li> <li> <p>ASR \u7684\u5206\u8bcd\u51b3\u5b9a\u4e86\u6a21\u578b\u7684\u8f93\u51fa\u8bcd\u6c47\u8868\u3002\u9009\u9879\u5305\u62ec\uff1a</p> <ul> <li>\u5b57\u7b26\uff1a\u7b80\u5355\uff0c\u8bcd\u6c47\u91cf\u5c0f\uff08\u82f1\u8bed\u7ea6 30 \u4e2a\uff09\uff0c\u4f46\u8f93\u51fa\u5e8f\u5217\u957f\u4e14\u65e0\u9690\u5f0f\u8bed\u8a00\u5efa\u6a21\u3002</li> <li>\u5b50\u8bcd / BPE\uff08\u6765\u81ea\u7b2c 07 \u7ae0\uff09\uff1a\u5728\u8bcd\u6c47\u8868\u5927\u5c0f\u548c\u5e8f\u5217\u957f\u5ea6\u4e4b\u95f4\u53d6\u5f97\u5e73\u8861\u7684\u5b50\u8bcd\u5355\u5143\u3002\u73b0\u4ee3\u7cfb\u7edf\u7684\u6807\u51c6\uff08Whisper \u4f7f\u7528\u5b57\u8282\u7ea7 BPE\uff0c\u7ea6 50,000 \u4e2a\u6807\u8bb0\uff09\u3002</li> <li>\u8bcd\uff1a\u8bcd\u6c47\u91cf\u5927\uff0850,000+\uff09\uff0c\u8f93\u51fa\u5e8f\u5217\u77ed\uff0c\u4f46\u65e0\u6cd5\u5904\u7406\u8bcd\u8868\u5916\u7684\u8bcd\u3002</li> <li>\u97f3\u7d20\uff1a\u8bed\u8a00\u4e0a\u5408\u7406\uff0c\u7d27\u51d1\uff0c\u4f46\u9700\u8981\u53d1\u97f3\u8bcd\u5178\u3002</li> </ul> </li> <li> <p>ASR \u7684\u6f14\u8fdb\u53ef\u4ee5\u6982\u62ec\u4e3a\uff1a\u4ece\u9ad8\u5ea6\u5de5\u7a0b\u5316\u7684\u6a21\u5757\u5316\u7cfb\u7edf\uff08GMM-HMM + WFST \u89e3\u7801\uff0c1990 \u5e74\u4ee3-2010 \u5e74\u4ee3\uff09\u5230\u6df7\u5408\u7cfb\u7edf\uff08DNN-HMM\uff0c2012-2016\uff09\uff0c\u518d\u5230\u5c06\u6d41\u6c34\u7ebf\u8d8a\u6765\u8d8a\u591a\u5730\u5438\u6536\u5230\u5355\u4e00\u795e\u7ecf\u7f51\u7edc\u4e2d\u7684\u7aef\u5230\u7aef\u7cfb\u7edf\uff08CTC\u3001RNN-T\u3001LAS\uff0c2016-2020\uff09\uff0c\u6700\u540e\u5230\u5229\u7528\u6d77\u91cf\u672a\u6807\u6ce8\u6216\u5f31\u6807\u6ce8\u6570\u636e\u7684\u5927\u578b\u9884\u8bad\u7ec3\u6a21\u578b\uff08wav2vec 2.0\u3001Whisper\uff0c2020 \u81f3\u4eca\uff09\u3002\u6bcf\u4e00\u6b21\u8f6c\u53d8\u90fd\u5728\u63d0\u5347\u51c6\u786e\u7387\u7684\u540c\u65f6\u7b80\u5316\u4e86\u5de5\u7a0b\u590d\u6742\u5ea6\uff0c\u9075\u5faa\u4e86\u673a\u5668\u5b66\u4e60\u4e2d\u4ece\u624b\u5de5\u8bbe\u8ba1\u7279\u5f81\u5230\u4ece\u6570\u636e\u4e2d\u5b66\u4e60\u8868\u793a\u7684\u66f4\u5e7f\u6cdb\u8d8b\u52bf\uff08\u7b2c 06 \u7ae0\u4e2d CNN \u66ff\u4ee3\u56fe\u50cf\u7279\u5f81\u3001\u7b2c 07 \u7ae0\u4e2d Transformer \u66ff\u4ee3 NLP \u7279\u5f81\u4e5f\u662f\u5982\u6b64\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2009%3A%20audio%20and%20speech/02.%20automatic%20speech%20recognition/#colab-notebook","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ol> <li> <p>\u5728 JAX \u4e2d\u4ece\u5934\u5b9e\u73b0 CTC \u635f\u5931\u3002\u521b\u5efa\u4e00\u4e2a\u5305\u542b\u77ed\u5e8f\u5217 logits \u548c\u76ee\u6807\u6807\u7b7e\u7684\u73a9\u5177\u793a\u4f8b\uff0c\u8ba1\u7b97 CTC \u524d\u5411\u7b97\u6cd5\u5f97\u5230\u603b\u6982\u7387\uff0c\u5e76\u8ba1\u7b97\u8d1f\u5bf9\u6570\u4f3c\u7136\u635f\u5931\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef ctc_forward(log_probs, targets):\n    \"\"\"\n    CTC \u524d\u5411\u7b97\u6cd5\uff08\u5bf9\u6570\u57df\uff0c\u6570\u503c\u7a33\u5b9a\u6027\uff09\u3002\n    log_probs: (T, V) \u8bcd\u6c47\u8868\u4e0a\u7684\u5bf9\u6570\u6982\u7387\uff08\u7d22\u5f15 0 = \u7a7a\u767d\uff09\n    targets: (U,) \u76ee\u6807\u6807\u7b7e\u7d22\u5f15\uff08\u4e0d\u542b\u7a7a\u767d\uff09\n    \u8fd4\u56de\uff1a\u76ee\u6807\u5e8f\u5217\u5728 CTC \u4e0b\u7684\u5bf9\u6570\u6982\u7387\u3002\n    \"\"\"\n    T, V = log_probs.shape\n    U = len(targets)\n\n    # \u6784\u5efa\u5e26\u6709\u7a7a\u767d\u7684\u6269\u5c55\u6807\u7b7e\u5e8f\u5217\uff1a[blank, y1, blank, y2, ..., yU, blank]\n    S = 2 * U + 1\n    labels = jnp.zeros(S, dtype=jnp.int32)  # \u5168\u90e8\u4e3a\u7a7a\u767d\n    for i in range(U):\n        labels = labels.at[2 * i + 1].set(targets[i])\n\n    # \u521d\u59cb\u5316 alpha\uff08\u5bf9\u6570\u57df\uff09\n    NEG_INF = -1e30\n    alpha = jnp.full((T, S), NEG_INF)\n    alpha = alpha.at[0, 0].set(log_probs[0, labels[0]])        # \u4ee5\u7a7a\u767d\u5f00\u59cb\n    alpha = alpha.at[0, 1].set(log_probs[0, labels[1]])        # \u6216\u7b2c\u4e00\u4e2a\u6807\u7b7e\n\n    # \u524d\u5411\u586b\u5145\n    for t in range(1, T):\n        for s in range(S):\n            # \u540c\u4e00\u72b6\u6001\n            a = alpha[t - 1, s]\n            # \u4ece\u524d\u4e00\u72b6\u6001\u6765\n            if s &gt; 0:\n                a = jnp.logaddexp(a, alpha[t - 1, s - 1])\n            # \u8df3\u8fc7\u7a7a\u767d\uff08\u5982\u679c\u5f53\u524d\u6807\u7b7e\u4e0e\u4e24\u6b65\u524d\u7684\u6807\u7b7e\u4e0d\u540c\uff09\n            if s &gt; 1 and labels[s] != 0 and labels[s] != labels[s - 2]:\n                a = jnp.logaddexp(a, alpha[t - 1, s - 2])\n            alpha = alpha.at[t, s].set(a + log_probs[t, labels[s]])\n\n    # \u603b\u5bf9\u6570\u6982\u7387\uff1a\u6700\u540e\u65f6\u95f4\u6b65\u7684\u6700\u540e\u4e24\u4e2a\u72b6\u6001\u4e4b\u548c\n    log_prob = jnp.logaddexp(alpha[T - 1, S - 1], alpha[T - 1, S - 2])\n    return log_prob, alpha\n\n# --- \u73a9\u5177\u793a\u4f8b ---\nT = 12   # \u8f93\u5165\u957f\u5ea6\uff08\u65f6\u95f4\u6b65\uff09\nV = 5    # \u8bcd\u6c47\u8868\u5927\u5c0f\uff080=\u7a7a\u767d\uff0c1='c'\uff0c2='a'\uff0c3='t'\uff0c4='x'\uff09\ntargets = jnp.array([1, 2, 3])  # \"c\", \"a\", \"t\"\n\n# \u521b\u5efa\u968f\u673a logits \u5e76\u8f6c\u6362\u4e3a\u5bf9\u6570\u6982\u7387\nkey = jax.random.PRNGKey(42)\nlogits = jax.random.normal(key, (T, V))\nlog_probs = jax.nn.log_softmax(logits, axis=-1)\n\nlog_prob, alpha = ctc_forward(log_probs, targets)\nctc_loss = -log_prob\n\nprint(f\"\u76ee\u6807\u5e8f\u5217: {targets.tolist()} ('c', 'a', 't')\")\nprint(f\"\u8f93\u5165\u957f\u5ea6 T={T}, \u8bcd\u6c47\u8868\u5927\u5c0f V={V}\")\nprint(f\"CTC \u5bf9\u6570\u6982\u7387: {log_prob:.4f}\")\nprint(f\"CTC \u635f\u5931\uff08\u8d1f\u5bf9\u6570\u6982\u7387\uff09: {ctc_loss:.4f}\")\n\n# \u53ef\u89c6\u5316\u524d\u5411\u53d8\u91cf\uff08alpha\uff09\u7f51\u683c\nfig, ax = plt.subplots(figsize=(12, 5))\n# \u5c06\u5bf9\u6570\u8f6c\u6362\u4e3a\u7ebf\u6027\u4ee5\u4fbf\u53ef\u89c6\u5316\nalpha_linear = jnp.exp(alpha - jnp.max(alpha))  # \u5f52\u4e00\u5316\u4ee5\u4fbf\u89c2\u5bdf\nim = ax.imshow(alpha_linear.T, aspect='auto', origin='lower', cmap='viridis')\nax.set_xlabel('\u65f6\u95f4\u6b65 (t)')\nax.set_ylabel('\u6269\u5c55\u6807\u7b7e\u7d22\u5f15 (s)')\n\nlabel_names = ['_', 'c', '_', 'a', '_', 't', '_']  # _ = \u7a7a\u767d\nax.set_yticks(range(len(label_names)))\nax.set_yticklabels(label_names)\nax.set_title(f'CTC \u524d\u5411\u53d8\u91cf\uff08alpha \u7f51\u683c\uff09| \u635f\u5931 = {ctc_loss:.2f}')\nplt.colorbar(im, ax=ax, label='\u5f52\u4e00\u5316\u6982\u7387')\nplt.tight_layout(); plt.show()\n</code></pre></p> </li> <li> <p>\u5728 JAX \u4e2d\u6784\u5efa\u4e00\u4e2a\u7b80\u5355\u7684\u7f16\u7801\u5668-\u89e3\u7801\u5668\u57fa\u4e8e\u6ce8\u610f\u529b\u7684 ASR \u6a21\u578b\uff08\u6700\u5c0f\u5316\u7684 LAS \u7c7b\u67b6\u6784\uff09\u3002\u4f7f\u7528\u4e00\u7ef4\u5377\u79ef\u7f16\u7801\u5668\u548c\u5e26\u6709\u70b9\u79ef\u6ce8\u610f\u529b\u7684\u5355\u5c42\u89e3\u7801\u5668\u3002\u5728\u5408\u6210\u6570\u636e\u4e0a\u8fd0\u884c\u5e76\u53ef\u89c6\u5316\u6ce8\u610f\u529b\u6743\u91cd\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# --- \u6700\u5c0f\u5316\u7684\u57fa\u4e8e\u6ce8\u610f\u529b\u7684\u7f16\u7801\u5668-\u89e3\u7801\u5668 ASR \u6a21\u578b ---\n\ndef init_params(key, input_dim, hidden_dim, vocab_size):\n    \"\"\"\u521d\u59cb\u5316\u5c0f\u578b LAS \u7c7b\u6a21\u578b\u7684\u53c2\u6570\u3002\"\"\"\n    keys = jax.random.split(key, 8)\n    scale = 0.1\n    params = {\n        # \u7f16\u7801\u5668\uff1a\u7b80\u5355\u7684\u7ebf\u6027\u6295\u5f71\uff08\u6a21\u62df\u5377\u79ef\u8f93\u51fa\uff09\n        'enc_w': jax.random.normal(keys[0], (input_dim, hidden_dim)) * scale,\n        'enc_b': jnp.zeros(hidden_dim),\n        # \u6ce8\u610f\u529b\uff1a\u67e5\u8be2\u3001\u952e\u3001\u503c\u6295\u5f71\n        'attn_q': jax.random.normal(keys[1], (hidden_dim, hidden_dim)) * scale,\n        'attn_k': jax.random.normal(keys[2], (hidden_dim, hidden_dim)) * scale,\n        'attn_v': jax.random.normal(keys[3], (hidden_dim, hidden_dim)) * scale,\n        # \u89e3\u7801\u5668 RNN\uff08\u4e3a\u6f14\u793a\u4f7f\u7528\u7b80\u5355 Elman RNN\uff09\n        'dec_wh': jax.random.normal(keys[4], (hidden_dim, hidden_dim)) * scale,\n        'dec_wx': jax.random.normal(keys[5], (vocab_size, hidden_dim)) * scale,\n        'dec_wc': jax.random.normal(keys[6], (hidden_dim, hidden_dim)) * scale,\n        'dec_b': jnp.zeros(hidden_dim),\n        # \u8f93\u51fa\u6295\u5f71\n        'out_w': jax.random.normal(keys[7], (hidden_dim, vocab_size)) * scale,\n        'out_b': jnp.zeros(vocab_size),\n    }\n    return params\n\ndef encode(params, x):\n    \"\"\"\u7f16\u7801\u5668\uff1a\u7ebf\u6027\u6295\u5f71\uff08\u5360\u4f4d\u7b26\uff0c\u4ee3\u8868\u5377\u79ef/LSTM \u5806\u53e0\uff09\u3002\"\"\"\n    return jnp.tanh(x @ params['enc_w'] + params['enc_b'])\n\ndef attend(params, query, enc_out):\n    \"\"\"\u5728\u7f16\u7801\u5668\u8f93\u51fa\u4e0a\u7684\u70b9\u79ef\u6ce8\u610f\u529b\u3002\"\"\"\n    q = query @ params['attn_q']                   # (hidden,)\n    k = enc_out @ params['attn_k']                 # (T_enc, hidden)\n    v = enc_out @ params['attn_v']                 # (T_enc, hidden)\n    d_k = q.shape[-1]\n    scores = (k @ q) / jnp.sqrt(d_k)              # (T_enc,)\n    weights = jax.nn.softmax(scores)               # (T_enc,)\n    context = weights @ v                          # (hidden,)\n    return context, weights\n\ndef decode_step(params, h_prev, y_prev_onehot, enc_out):\n    \"\"\"\u5355\u6b65\u89e3\u7801\uff1aRNN + \u6ce8\u610f\u529b\u3002\"\"\"\n    # \u5d4c\u5165\u524d\u4e00\u4e2a\u6807\u8bb0\n    y_emb = y_prev_onehot @ params['dec_wx']       # (hidden,)\n    # \u6ce8\u610f\u529b\u5230\u7f16\u7801\u5668\n    context, attn_w = attend(params, h_prev, enc_out)\n    # RNN \u66f4\u65b0\n    h = jnp.tanh(h_prev @ params['dec_wh'] + y_emb + context @ params['dec_wc']\n                  + params['dec_b'])\n    # \u8f93\u51fa logits\n    logits = h @ params['out_w'] + params['out_b']\n    return h, logits, attn_w\n\n# --- \u8bbe\u7f6e ---\nkey = jax.random.PRNGKey(0)\ninput_dim = 40       # \u4f8b\u5982 40 \u4e2a\u6885\u5c14\u9891\u5e26\nhidden_dim = 64\nvocab_size = 10      # \u7528\u4e8e\u6f14\u793a\u7684\u5c0f\u8bcd\u6c47\u8868\nT_enc = 30           # \u7f16\u7801\u5668\u65f6\u95f4\u6b65\nT_dec = 8            # \u89e3\u7801\u5668\u6b65\u6570\n\nparams = init_params(key, input_dim, hidden_dim, vocab_size)\n\n# \u5408\u6210\u8f93\u5165\uff1a\u968f\u673a\u6885\u5c14\u7c7b\u7279\u5f81\nkey, subkey = jax.random.split(key)\nx = jax.random.normal(subkey, (T_enc, input_dim))\n\n# \u7f16\u7801\nenc_out = encode(params, x)\n\n# \u89e3\u7801\uff08\u4f7f\u7528\u968f\u673a\u76ee\u6807\u7684\u6559\u5e08\u5f3a\u5236\uff09\nkey, subkey = jax.random.split(key)\ntargets = jax.random.randint(subkey, (T_dec,), 0, vocab_size)\n\nh = jnp.zeros(hidden_dim)\nall_logits = []\nall_attn = []\n\nfor t in range(T_dec):\n    y_prev = jax.nn.one_hot(targets[t] if t &gt; 0 else 0, vocab_size)\n    h, logits, attn_w = decode_step(params, h, y_prev, enc_out)\n    all_logits.append(logits)\n    all_attn.append(attn_w)\n\nall_attn = jnp.stack(all_attn)  # (T_dec, T_enc)\nall_logits = jnp.stack(all_logits)  # (T_dec, vocab_size)\n\n# --- \u53ef\u89c6\u5316\u6ce8\u610f\u529b\u6743\u91cd ---\nfig, axes = plt.subplots(1, 2, figsize=(14, 5))\n\nim = axes[0].imshow(all_attn, aspect='auto', cmap='Blues', origin='lower')\naxes[0].set_xlabel('\u7f16\u7801\u5668\u65f6\u95f4\u6b65')\naxes[0].set_ylabel('\u89e3\u7801\u5668\u6b65')\naxes[0].set_title('\u6ce8\u610f\u529b\u6743\u91cd\uff08\u89e3\u7801\u5668 -&gt; \u7f16\u7801\u5668\uff09')\nplt.colorbar(im, ax=axes[0])\n\n# \u663e\u793a\u6bcf\u4e2a\u89e3\u7801\u6b65\u7684\u9884\u6d4b\u6807\u8bb0\u5206\u5e03\nim2 = axes[1].imshow(jax.nn.softmax(all_logits, axis=-1), aspect='auto',\n                      cmap='Oranges', origin='lower')\naxes[1].set_xlabel('\u8bcd\u6c47\u8868\u7d22\u5f15')\naxes[1].set_ylabel('\u89e3\u7801\u5668\u6b65')\naxes[1].set_title('\u8f93\u51fa\u6807\u8bb0\u6982\u7387')\nplt.colorbar(im2, ax=axes[1])\n\nplt.suptitle('\u6700\u5c0f\u5316\u7684\u57fa\u4e8e\u6ce8\u610f\u529b\u7684 ASR \u6a21\u578b\uff08\u672a\u8bad\u7ec3\uff09')\nplt.tight_layout(); plt.show()\n</code></pre></p> </li> <li> <p>\u4f7f\u7528\u52a8\u6001\u89c4\u5212\uff08\u7f16\u8f91\u8ddd\u79bb\uff09\u4ece\u5934\u8ba1\u7b97\u8bcd\u9519\u8bef\u7387\uff08WER\uff09\uff0c\u5e76\u9488\u5bf9\u4e00\u4e2a\u53c2\u8003\u6587\u672c\u8bc4\u4f30\u591a\u4e2a\u5047\u8bbe\u3002\u53ef\u89c6\u5316\u7f16\u8f91\u8ddd\u79bb\u77e9\u9635\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\nimport numpy as np\n\ndef compute_wer(reference, hypothesis):\n    \"\"\"\n    \u4f7f\u7528\u52a8\u6001\u89c4\u5212\uff08\u8bcd\u7ea7\u522b\u7684 Levenshtein \u8ddd\u79bb\uff09\u8ba1\u7b97 WER\u3002\n    \u8fd4\u56de WER\u3001\u66ff\u6362\u6570\u3001\u5220\u9664\u6570\u3001\u63d2\u5165\u6570\u548c DP \u77e9\u9635\u3002\n    \"\"\"\n    ref_words = reference.split()\n    hyp_words = hypothesis.split()\n    N = len(ref_words)\n    M = len(hyp_words)\n\n    # DP \u77e9\u9635\uff1ad[i][j] = ref[:i] \u548c hyp[:j] \u4e4b\u95f4\u7684\u7f16\u8f91\u8ddd\u79bb\n    d = np.zeros((N + 1, M + 1), dtype=np.int32)\n    # \u56de\u6eaf\u77e9\u9635\u7528\u4e8e\u7edf\u8ba1 S, D, I\n    ops = np.zeros((N + 1, M + 1, 3), dtype=np.int32)  # [sub, del, ins]\n\n    for i in range(N + 1):\n        d[i][0] = i  # \u5168\u90e8\u5220\u9664\n    for j in range(M + 1):\n        d[0][j] = j  # \u5168\u90e8\u63d2\u5165\n\n    for i in range(1, N + 1):\n        for j in range(1, M + 1):\n            if ref_words[i - 1] == hyp_words[j - 1]:\n                sub_cost = d[i - 1][j - 1]  # \u5339\u914d\uff0c\u65e0\u9700\u7f16\u8f91\n            else:\n                sub_cost = d[i - 1][j - 1] + 1  # \u66ff\u6362\n            del_cost = d[i - 1][j] + 1      # \u5220\u9664\n            ins_cost = d[i][j - 1] + 1      # \u63d2\u5165\n\n            d[i][j] = min(sub_cost, del_cost, ins_cost)\n\n    # \u56de\u6eaf\u7edf\u8ba1\u64cd\u4f5c\u6b21\u6570\n    i, j = N, M\n    S, D, I = 0, 0, 0\n    while i &gt; 0 or j &gt; 0:\n        if i &gt; 0 and j &gt; 0 and d[i][j] == d[i-1][j-1] and ref_words[i-1] == hyp_words[j-1]:\n            i -= 1; j -= 1  # \u6b63\u786e\n        elif i &gt; 0 and j &gt; 0 and d[i][j] == d[i-1][j-1] + 1:\n            S += 1; i -= 1; j -= 1  # \u66ff\u6362\n        elif i &gt; 0 and d[i][j] == d[i-1][j] + 1:\n            D += 1; i -= 1  # \u5220\u9664\n        elif j &gt; 0 and d[i][j] == d[i][j-1] + 1:\n            I += 1; j -= 1  # \u63d2\u5165\n        else:\n            break\n\n    wer = (S + D + I) / N if N &gt; 0 else 0.0\n    return wer, S, D, I, d\n\n# --- \u6d4b\u8bd5\u7528\u4f8b ---\nreference = \"the cat sat on the mat\"\nhypotheses = [\n    \"the cat sat on the mat\",          # \u5b8c\u7f8e\n    \"the cat sit on the mat\",          # 1 \u6b21\u66ff\u6362\n    \"the cat on the mat\",              # 1 \u6b21\u5220\u9664\n    \"the big cat sat on the mat\",      # 1 \u6b21\u63d2\u5165\n    \"a dog sat in a rug\",              # \u591a\u5904\u9519\u8bef\n]\n\nprint(f\"\u53c2\u8003\u6587\u672c: '{reference}'\\n\")\nprint(f\"{'\u5047\u8bbe':&lt;40s} {'WER':&gt;6s} {'S':&gt;3s} {'D':&gt;3s} {'I':&gt;3s}\")\nprint(\"-\" * 60)\nresults = []\nfor hyp in hypotheses:\n    wer, S, D, I, dp = compute_wer(reference, hyp)\n    results.append((hyp, wer, S, D, I, dp))\n    print(f\"'{hyp}':&lt;40s} {wer:&gt;6.1%} {S:&gt;3d} {D:&gt;3d} {I:&gt;3d}\")\n\n# \u53ef\u89c6\u5316\u6700\u5dee\u60c5\u51b5\u7684 DP \u77e9\u9635\nworst = results[-1]\nhyp_words = worst[0].split()\nref_words = reference.split()\ndp_matrix = worst[5]\n\nfig, axes = plt.subplots(1, 2, figsize=(14, 5))\n\n# DP \u77e9\u9635\nim = axes[0].imshow(dp_matrix, cmap='YlOrRd', origin='upper')\naxes[0].set_xticks(range(len(hyp_words) + 1))\naxes[0].set_xticklabels([''] + hyp_words, rotation=45, ha='right', fontsize=9)\naxes[0].set_yticks(range(len(ref_words) + 1))\naxes[0].set_yticklabels([''] + ref_words, fontsize=9)\naxes[0].set_xlabel('\u5047\u8bbe\u8bcd')\naxes[0].set_ylabel('\u53c2\u8003\u8bcd')\naxes[0].set_title(f'\u7f16\u8f91\u8ddd\u79bb\u77e9\u9635\\nWER = {worst[1]:.1%}')\nfor i in range(dp_matrix.shape[0]):\n    for j in range(dp_matrix.shape[1]):\n        axes[0].text(j, i, str(dp_matrix[i, j]), ha='center', va='center', fontsize=8)\nplt.colorbar(im, ax=axes[0])\n\n# WER \u6bd4\u8f83\u67f1\u72b6\u56fe\nnames = [f'Hyp {i+1}' for i in range(len(results))]\nwers = [r[1] * 100 for r in results]\ncolors = ['#27ae60' if w == 0 else '#f39c12' if w &lt; 30 else '#e74c3c' for w in wers]\naxes[1].barh(names, wers, color=colors)\naxes[1].set_xlabel('WER (%)')\naxes[1].set_title('\u8bcd\u9519\u8bef\u7387\u6bd4\u8f83')\nfor i, (w, r) in enumerate(zip(wers, results)):\n    axes[1].text(w + 1, i, f'{w:.0f}% (S={r[2]}, D={r[3]}, I={r[4]})',\n                 va='center', fontsize=9)\naxes[1].set_xlim(0, max(wers) * 1.4)\n\nplt.tight_layout(); plt.show()\n</code></pre></p> </li> <li> <p>\u5728\u5bf9\u6570\u6885\u5c14\u9891\u8c31\u56fe\u4e0a\u5b9e\u73b0 SpecAugment\uff08\u9891\u7387\u63a9\u7801\u548c\u65f6\u95f4\u63a9\u7801\uff09\uff0c\u5e76\u53ef\u89c6\u5316\u539f\u59cb\u7248\u672c\u4e0e\u589e\u5f3a\u7248\u672c\u3002\u4ece\u5408\u6210\u4fe1\u53f7\u751f\u6210\u9891\u8c31\u56fe\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# --- \u751f\u6210\u5408\u6210\u5bf9\u6570\u6885\u5c14\u9891\u8c31\u56fe ---\nkey = jax.random.PRNGKey(42)\nfs = 16000\nduration = 2.0\nt = jnp.arange(0, duration, 1.0 / fs)\n\n# \u6a21\u62df\u8bed\u97f3\uff1a\u5e26\u8c10\u6ce2\u7684\u5541\u557e\u4fe1\u53f7\nf0 = 120.0\nx = sum(jnp.sin(2 * jnp.pi * f0 * k * t * (1 + 0.1 * t)) / k for k in range(1, 10))\nkey, subkey = jax.random.split(key)\nx = x + 0.05 * jax.random.normal(subkey, t.shape)\n\n# \u8ba1\u7b97\u5bf9\u6570\u6885\u5c14\u9891\u8c31\u56fe\uff08\u7b80\u5316\u7248\uff09\nframe_len = 400  # 25 ms\nhop_len = 160    # 10 ms\nn_fft = 512\nn_mels = 80\n\nn_frames = (len(x) - frame_len) // hop_len + 1\nhamming = 0.54 - 0.46 * jnp.cos(2 * jnp.pi * jnp.arange(frame_len) / (frame_len - 1))\n\nframes = jnp.stack([x[i * hop_len : i * hop_len + frame_len] for i in range(n_frames)])\nwindowed = frames * hamming\nspectra = jnp.abs(jnp.fft.rfft(windowed, n=n_fft)) ** 2\n\n# \u7b80\u5355\u7684\u6885\u5c14\u6ee4\u6ce2\u5668\u7ec4\ndef hz_to_mel(f): return 2595 * jnp.log10(1 + f / 700)\ndef mel_to_hz(m): return 700 * (10 ** (m / 2595) - 1)\n\nmel_points = jnp.linspace(hz_to_mel(0), hz_to_mel(fs / 2), n_mels + 2)\nhz_pts = mel_to_hz(mel_points)\nbins = jnp.floor((n_fft + 1) * hz_pts / fs).astype(jnp.int32)\n\nn_freqs = n_fft // 2 + 1\nfb = jnp.zeros((n_mels, n_freqs))\nfor m in range(n_mels):\n    lo, mid, hi = int(bins[m]), int(bins[m+1]), int(bins[m+2])\n    for k in range(lo, mid):\n        if mid != lo:\n            fb = fb.at[m, k].set((k - lo) / (mid - lo))\n    for k in range(mid, hi):\n        if hi != mid:\n            fb = fb.at[m, k].set((hi - k) / (hi - mid))\n\nlog_mel = jnp.log(spectra @ fb.T + 1e-10)\n\n# --- SpecAugment ---\ndef spec_augment(spec, key, n_freq_masks=2, freq_mask_width=15,\n                 n_time_masks=2, time_mask_width=25):\n    \"\"\"\u5e94\u7528 SpecAugment\uff1a\u9891\u7387\u63a9\u7801\u548c\u65f6\u95f4\u63a9\u7801\u3002\"\"\"\n    augmented = spec.copy()\n    T, F = spec.shape\n\n    # \u9891\u7387\u63a9\u7801\n    for _ in range(n_freq_masks):\n        key, k1, k2 = jax.random.split(key, 3)\n        f_width = jax.random.randint(k1, (), 1, freq_mask_width + 1)\n        f_start = jax.random.randint(k2, (), 0, max(1, F - freq_mask_width))\n        mask = (jnp.arange(F) &gt;= f_start) &amp; (jnp.arange(F) &lt; f_start + f_width)\n        augmented = jnp.where(mask[None, :], 0.0, augmented)\n\n    # \u65f6\u95f4\u63a9\u7801\n    for _ in range(n_time_masks):\n        key, k1, k2 = jax.random.split(key, 3)\n        t_width = jax.random.randint(k1, (), 1, time_mask_width + 1)\n        t_start = jax.random.randint(k2, (), 0, max(1, T - time_mask_width))\n        mask = (jnp.arange(T) &gt;= t_start) &amp; (jnp.arange(T) &lt; t_start + t_width)\n        augmented = jnp.where(mask[:, None], 0.0, augmented)\n\n    return augmented\n\nkey, subkey = jax.random.split(key)\nlog_mel_aug = spec_augment(log_mel, subkey)\n\n# --- \u53ef\u89c6\u5316 ---\nfig, axes = plt.subplots(2, 1, figsize=(14, 8))\n\nim0 = axes[0].imshow(log_mel.T, aspect='auto', origin='lower', cmap='inferno',\n                       extent=[0, duration, 0, n_mels])\naxes[0].set_title('\u539f\u59cb\u5bf9\u6570\u6885\u5c14\u9891\u8c31\u56fe')\naxes[0].set_xlabel('\u65f6\u95f4 (s)'); axes[0].set_ylabel('\u6885\u5c14\u9891\u5e26')\nplt.colorbar(im0, ax=axes[0], label='\u5bf9\u6570\u80fd\u91cf')\n\nim1 = axes[1].imshow(log_mel_aug.T, aspect='auto', origin='lower', cmap='inferno',\n                       extent=[0, duration, 0, n_mels])\naxes[1].set_title('SpecAugment \u540e\uff08\u9891\u7387 + \u65f6\u95f4\u63a9\u7801\uff09')\naxes[1].set_xlabel('\u65f6\u95f4 (s)'); axes[1].set_ylabel('\u6885\u5c14\u9891\u5e26')\nplt.colorbar(im1, ax=axes[1], label='\u5bf9\u6570\u80fd\u91cf')\n\nplt.tight_layout(); plt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2009%3A%20audio%20and%20speech/03.%20text%20to%20speech%20and%20voice/","title":"\u8bed\u97f3\u5408\u6210\u4e0e\u58f0\u97f3","text":"<p>\u8bed\u97f3\u5408\u6210\uff08Text-to-Speech Synthesis\uff09\u9006\u5411\u6267\u884c ASR \u6d41\u6c34\u7ebf\uff0c\u4ece\u4e66\u9762\u6587\u672c\u751f\u6210\u81ea\u7136\u542c\u611f\u7684\u97f3\u9891\u3002\u672c\u6587\u6db5\u76d6 TTS \u6d41\u6c34\u7ebf\uff08\u6587\u672c\u89c4\u8303\u5316\u3001G2P\u3001\u58f0\u5b66\u6a21\u578b\u3001\u58f0\u7801\u5668\uff09\u3001Tacotron\u3001WaveNet\u3001HiFi-GAN\u3001\u58f0\u97f3\u514b\u9686\u3001\u58f0\u97f3\u8f6c\u6362\u4ee5\u53ca\u8bed\u97f3\u6d3b\u52a8\u68c0\u6d4b\uff08VAD\uff09\u3002</p> <ul> <li> <p>\u5728\u6587\u4ef6 01 \u4e2d\uff0c\u6211\u4eec\u6784\u5efa\u4e86\u4fe1\u53f7\u5904\u7406\u5de5\u5177\u5305\uff1a\u6ce2\u5f62\u3001\u8bed\u8c31\u56fe\u3001\u6885\u5c14\u6ee4\u6ce2\u5668\u7ec4\u548c MFCC\u3002\u5728\u6587\u4ef6 02 \u4e2d\uff0c\u6211\u4eec\u5c06\u8bed\u97f3\u8f6c\u6362\u4e3a\u6587\u672c\u3002\u73b0\u5728\u6211\u4eec\u53cd\u65b9\u5411\u64cd\u4f5c\uff1a\u7ed9\u5b9a\u6587\u672c\uff0c\u5408\u6210\u81ea\u7136\u542c\u611f\u7684\u8bed\u97f3\u3002\u8fd9\u5c31\u662f\u8bed\u97f3\u5408\u6210\uff08TTS\uff09\uff0c\u4e00\u4e2a\u540c\u6837\u901a\u5411\u58f0\u97f3\u8f6c\u6362\u3001\u58f0\u97f3\u514b\u9686\u548c\u8bed\u97f3\u6d3b\u52a8\u68c0\u6d4b\u7684\u95ee\u9898\u3002</p> </li> <li> <p>\u5c06 TTS \u60f3\u8c61\u6210\u4e00\u573a\u821e\u53f0\u8868\u6f14\u3002\u5267\u672c\u5c31\u662f\u6587\u672c\u8f93\u5165\u3002\u5bfc\u6f14\uff08\u58f0\u5b66\u6a21\u578b\uff09\u51b3\u5b9a\u6bcf\u53e5\u53f0\u8bcd\u5e94\u8be5\u5982\u4f55\u53d1\u97f3\u2014\u2014\u97f3\u9ad8\u3001\u65f6\u957f\u3001\u91cd\u97f3\u3002\u7ba1\u5f26\u4e50\u961f\uff08\u58f0\u7801\u5668\uff09\u968f\u540e\u6f14\u594f\u4e50\u8c31\uff0c\u4ea7\u751f\u542c\u4f17\u5b9e\u9645\u542c\u5230\u7684\u58f0\u6ce2\u3002\u73b0\u4ee3\u795e\u7ecf TTS \u7528\u5ab2\u7f8e\u4eba\u7c7b\u8bf4\u8bdd\u8005\u7684\u6f14\u7ece\uff0c\u53d6\u4ee3\u4e86\u57fa\u4e8e\u89c4\u5219\u7cfb\u7edf\u90a3\u79cd\u50f5\u786c\u3001\u673a\u68b0\u7684\u53d1\u97f3\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u8bed\u97f3\u5408\u6210\u6d41\u6c34\u7ebf \u6807\u51c6 TTS \u6d41\u6c34\u7ebf\u5305\u542b\u56db\u4e2a\u9636\u6bb5\uff1a(1) \u6587\u672c\u89c4\u8303\u5316\uff0c(2) \u97f3\u7d20\u8f6c\u6362\uff0c(3) \u58f0\u5b66\u6a21\u578b\uff0c(4) \u58f0\u7801\u5668\u3002\u4e00\u4e9b\u73b0\u4ee3\u7cfb\u7edf\u5c06\u9636\u6bb5 3 \u548c 4 \u5408\u5e76\u4e3a\u4e00\u4e2a\u7aef\u5230\u7aef\u6a21\u578b\uff0c\u4f46\u8fd9\u79cd\u6982\u5ff5\u5206\u89e3\u4ecd\u7136\u6709\u7528\u3002</p> </li> <li> <p>\u6587\u672c\u89c4\u8303\u5316 \u5c06\u539f\u59cb\u6587\u672c\u8f6c\u6362\u4e3a\u53ef\u53d1\u97f3\u7684\u5f62\u5f0f\u3002\u7f29\u5199\u5c55\u5f00\uff08\"Dr.\"\u53d8\u4e3a\"Doctor\"\uff09\u3001\u6570\u5b57\u53d8\u4e3a\u8bcd\u8bed\uff08\"1984\"\u53d8\u4e3a\"nineteen eighty-four\"\uff09\u3001\u8d27\u5e01\u7b26\u53f7\u88ab\u53e3\u5934\u53d1\u97f3\uff08\"$5\"\u53d8\u4e3a\"five dollars\"\uff09\uff0c\u4ee5\u53ca\u5904\u7406 URL \u6216\u7279\u6b8a\u5b57\u7b26\u3002\u8fd9\u4e00\u9636\u6bb5\u901a\u5e38\u57fa\u4e8e\u89c4\u5219\u548c\u8bed\u8a00\u7279\u5b9a\u6587\u6cd5\uff0c\u4e0d\u8fc7\u4e5f\u5b58\u5728\u795e\u7ecf\u89c4\u8303\u5316\u6a21\u578b\u3002\u6b64\u5904\u7684\u9519\u8bef\u4f1a\u4f20\u64ad\u5230\u6240\u6709\u4e0b\u6e38\u9636\u6bb5\uff1a\u5982\u679c\"St.\"\u88ab\u8bfb\u4f5c\"saint\"\u800c\u4e0d\u662f\"street\"\uff0c\u6574\u4e2a\u53d1\u97f3\u5c31\u9519\u4e86\u3002</p> </li> <li> <p>\u5b57\u7d20\u5230\u97f3\u7d20\uff08G2P\uff09\u8f6c\u6362 \u5c06\u89c4\u8303\u5316\u6587\u672c\u6620\u5c04\u4e3a\u97f3\u7d20\u5e8f\u5217\u3002\u82f1\u8bed\u5c24\u5176\u4e0d\u89c4\u5219\uff08\"though\"\u3001\"through\"\u3001\"tough\"\u4e2d\u7684\"ough\"\u53d1\u97f3\u5404\u4e0d\u76f8\u540c\uff09\uff0c\u56e0\u6b64\u8bcd\u5178\u67e5\u627e\uff08CMU \u53d1\u97f3\u8bcd\u5178\uff09\u5904\u7406\u5e38\u89c1\u8bcd\u8bed\uff0c\u800c\u795e\u7ecf\u5e8f\u5217\u5230\u5e8f\u5217\u6a21\u578b\uff08\u7b2c 06 \u7ae0\u7684\u7f16\u7801\u5668-\u89e3\u7801\u5668\u6216\u7b2c 07 \u7ae0\u7684 Transformer\uff09\u5904\u7406\u8bcd\u6c47\u8868\u5916\u7684\u8bcd\u8bed\u3002\u6d45\u5c42\u6b63\u5b57\u6cd5\u8bed\u8a00\uff08\u897f\u73ed\u7259\u8bed\u3001\u82ac\u5170\u8bed\uff09\u9700\u8981\u66f4\u7b80\u5355\u7684 G2P\u3002\u8f93\u51fa\u901a\u5e38\u662f IPA\uff08\u56fd\u9645\u97f3\u6807\uff09\u5e8f\u5217\u6216\u7b49\u6548\u7684\u5185\u90e8\u97f3\u7d20\u96c6\u5408\u3002</p> </li> <li> <p>\u58f0\u5b66\u6a21\u578b \u63a5\u6536\u97f3\u7d20\u5e8f\u5217\u5e76\u4ea7\u751f\u4e2d\u95f4\u58f0\u5b66\u8868\u793a\uff0c\u51e0\u4e4e\u603b\u662f\u6885\u5c14\u8bed\u8c31\u56fe\uff08\u6587\u4ef6 01\uff09\u3002\u6885\u5c14\u8bed\u8c31\u56fe\u6355\u83b7\u6bcf\u4e2a\u65f6\u95f4\u5e27\u7684\u9891\u8c31\u5305\u7edc\uff0c\u7f16\u7801\u4e86\u58f0\u7801\u5668\u91cd\u6784\u6ce2\u5f62\u6240\u9700\u7684\u611f\u77e5\u76f8\u5173\u4fe1\u606f\u3002\u58f0\u5b66\u6a21\u578b\u5fc5\u987b\u51b3\u5b9a\u65f6\u957f\uff08\u6bcf\u4e2a\u97f3\u7d20\u6301\u7eed\u591a\u4e45\uff09\u3001\u97f3\u9ad8\uff08\u57fa\u9891 \\(F_0\\)\uff09\u548c\u80fd\u91cf\uff08\u54cd\u5ea6\uff09\u3002</p> </li> <li> <p>\u58f0\u7801\u5668 \u63a5\u6536\u6885\u5c14\u8bed\u8c31\u56fe\u5e76\u4ea7\u751f\u539f\u59cb\u97f3\u9891\u6ce2\u5f62\u3002\u8fd9\u662f\u4e00\u4e2a\u4e0d\u9002\u5b9a\u7684\u53cd\u6f14\u95ee\u9898\uff1a\u7531\u4e8e\u76f8\u4f4d\u4fe1\u606f\u5df2\u88ab\u4e22\u5f03\uff0c\u8bb8\u591a\u6ce2\u5f62\u53ef\u4ee5\u4ea7\u751f\u76f8\u540c\u7684\u8bed\u8c31\u56fe\u3002\u7ecf\u5178\u58f0\u7801\u5668\uff08Griffin-Lim\u3001WORLD\uff09\u4f7f\u7528\u8fed\u4ee3\u6216\u4fe1\u53f7\u6a21\u578b\u65b9\u6cd5\uff0c\u4f46\u795e\u7ecf\u58f0\u7801\u5668\u73b0\u5728\u5728\u8d28\u91cf\u4e0a\u5360\u4e3b\u5bfc\u5730\u4f4d\u3002</p> </li> <li> <p>\u58f0\u7801\u5668\uff1aWaveNet\uff08van den Oord \u7b49\u4eba\uff0c2016\uff09\u662f\u7b2c\u4e00\u4e2a\u751f\u6210\u51e0\u4e4e\u4e0e\u4eba\u7c7b\u5f55\u97f3\u65e0\u6cd5\u533a\u5206\u7684\u8bed\u97f3\u7684\u795e\u7ecf\u58f0\u7801\u5668\u3002\u5b83\u81ea\u56de\u5f52\u5730\u5bf9\u6ce2\u5f62\u5efa\u6a21\uff0c\u9884\u6d4b\u6bcf\u4e2a\u6837\u672c \\(x_t\\) \u7684\u6761\u4ef6\u6982\u7387\u4f9d\u8d56\u4e8e\u6240\u6709\u5148\u524d\u6837\u672c\uff1a</p> </li> </ul> \\[P(x) = \\prod_{t=1}^{T} P(x_t \\mid x_1, \\ldots, x_{t-1}, c)\\] <ul> <li> <p>\u5176\u4e2d \\(c\\) \u662f\u6761\u4ef6\u4fe1\u53f7\uff08\u6885\u5c14\u8bed\u8c31\u56fe\uff09\u3002\u6bcf\u4e2a\u6837\u672c\u662f 16 \u4f4d\uff0c\u56e0\u6b64\u5bf9 65536 \u4e2a\u503c\u8fdb\u884c\u6734\u7d20 softmax \u662f\u4e0d\u5207\u5b9e\u9645\u7684\u3002WaveNet \u4f7f\u7528 \u03bc-law \u538b\u6269 \u51cf\u5c11\u5230 256 \u4e2a\u91cf\u5316\u7ea7\u522b\uff0c\u6216\u8005\u540e\u6765\u7684\u53d8\u4f53\u4f7f\u7528 logistics \u6df7\u5408\u5206\u5e03\u3002</p> </li> <li> <p>WaveNet \u7684\u6838\u5fc3\u6784\u5efa\u6a21\u5757\u662f\u6269\u5f20\u56e0\u679c\u5377\u79ef\u3002\u56e0\u679c\u610f\u5473\u7740\u6ee4\u6ce2\u5668\u6743\u91cd\u53ea\u770b\u8fc7\u53bb\u6837\u672c\uff08\u65e0\u672a\u6765\u6cc4\u9732\uff09\u3002\u6269\u5f20\u610f\u5473\u7740\u6ee4\u6ce2\u5668\u4ee5\u6307\u6570\u589e\u957f\u7684\u95f4\u9694\u8df3\u8fc7\u6837\u672c\uff1a\u6269\u5f20\u56e0\u5b50 \\(1, 2, 4, 8, \\ldots, 512\\)\u3002\u8fd9\u63d0\u4f9b\u4e86\u6307\u6570\u7ea7\u5927\u7684\u611f\u53d7\u91ce\uff0c\u540c\u65f6\u4fdd\u6301\u53c2\u6570\u91cf\u7ebf\u6027\u589e\u957f\u3002</p> </li> <li> <p>\u6bcf\u5c42\u7684\u95e8\u63a7\u6fc0\u6d3b\u51fd\u6570\u4e3a\uff1a</p> </li> </ul> \\[z = \\tanh(W_{f} \\ast x) \\odot \\sigma(W_{g} \\ast x)\\] <ul> <li> <p>\u5176\u4e2d \\(W_f\\) \u548c \\(W_g\\) \u662f\u6ee4\u6ce2\u5668\u548c\u95e8\u63a7\u5377\u79ef\u6743\u91cd\uff0c\\(\\ast\\) \u8868\u793a\u6269\u5f20\u56e0\u679c\u5377\u79ef\uff0c\\(\\odot\\) \u662f\u9010\u5143\u7d20\u4e58\u6cd5\u3002\u8fd9\u79cd\u95e8\u63a7\u673a\u5236\uff08\u6765\u81ea\u7b2c 06 \u7ae0\u7684 LSTM\uff09\u5141\u8bb8\u7f51\u7edc\u63a7\u5236\u4fe1\u606f\u6d41\u3002</p> </li> <li> <p>WaveNet \u4ea7\u751f\u5353\u8d8a\u7684\u8d28\u91cf\uff0c\u4f46\u63a8\u7406\u901f\u5ea6\u6781\u6162\uff1a\u751f\u6210\u4e00\u79d2 24 kHz \u97f3\u9891\u9700\u8981 24000 \u6b21\u987a\u5e8f\u524d\u5411\u4f20\u64ad\u3002\u8fd9\u63a8\u52a8\u4e86\u6240\u6709\u540e\u7eed\u58f0\u7801\u5668\u7814\u7a76\u3002</p> </li> <li> <p>WaveRNN\uff08Kalchbrenner \u7b49\u4eba\uff0c2018\uff09\u7528\u5355\u5c42\u5faa\u73af\u7f51\u7edc\u53d6\u4ee3\u4e86 WaveNet \u7684\u6df1\u5c42\u5377\u79ef\u5806\u53e0\u3002\u5b83\u5c06\u6bcf\u4e2a 16 \u4f4d\u6837\u672c\u62c6\u5206\u4e3a\u7c97\uff08\u9ad8 8 \u4f4d\uff09\u548c\u7ec6\uff08\u4f4e 8 \u4f4d\uff09\u5206\u91cf\uff0c\u4f7f\u7528 GRU\uff08\u7b2c 06 \u7ae0\uff09\u9884\u6d4b\u6bcf\u4e2a\u5206\u91cf\u3002\u8fd9\u79cd\u53cc softmax \u65b9\u6cd5\u663e\u8457\u51cf\u5c11\u4e86\u8ba1\u7b97\u91cf\uff0c\u540c\u65f6\u4fdd\u6301\u4e86\u9ad8\u8d28\u91cf\u3002\u7ecf\u8fc7\u7cbe\u5fc3\u5185\u6838\u4f18\u5316\u540e\uff0cWaveRNN \u5728\u79fb\u52a8 CPU \u4e0a\u8db3\u4ee5\u5b9e\u73b0\u5b9e\u65f6\u8fd0\u884c\u3002</p> </li> <li> <p>WaveGlow\uff08Prenger \u7b49\u4eba\uff0c2019\uff09\u662f\u4e00\u79cd\u57fa\u4e8e\u6d41\u7684\u58f0\u7801\u5668\uff0c\u5b8c\u5168\u907f\u514d\u4e86\u81ea\u56de\u5f52\u751f\u6210\u3002\u5b83\u4f7f\u7528\u4e00\u7cfb\u5217\u53ef\u9006\u53d8\u6362\uff08\u4eff\u5c04\u8026\u5408\u5c42\uff0c\u7b2c 06 \u7ae0\u7684\u6b63\u5219\u5316\u6d41\uff09\u5c06\u7b80\u5355\u9ad8\u65af\u5206\u5e03\u6620\u5c04\u5230\u6ce2\u5f62\u5206\u5e03\u3002\u8bad\u7ec3\u4f7f\u7528\u53d8\u91cf\u53d8\u6362\u516c\u5f0f\u6700\u5927\u5316\u7cbe\u786e\u5bf9\u6570\u4f3c\u7136\uff1a</p> </li> </ul> \\[\\log P(x) = \\log P(z) + \\sum_{i} \\log \\left| \\det \\frac{\\partial f_i}{\\partial f_{i-1}} \\right|\\] <ul> <li> <p>\u5176\u4e2d \\(z = f(x)\\) \u662f\u901a\u8fc7\u5c06 \\(x\\) \u4f20\u9012\u7ecf\u6d41\u5f97\u5230\u7684\u6f5c\u5728\u53d8\u91cf\u3002\u63a8\u7406\u65f6\uff0c\u62bd\u53d6\u6837\u672c \\(z \\sim \\mathcal{N}(0, I)\\) \u5e76\u901a\u8fc7\u9006\u6d41\u4ee5\u5355\u6b21\u5e76\u884c\u524d\u5411\u4f20\u64ad\u63a8\u51fa\u3002WaveGlow \u7528\u6a21\u578b\u5927\u5c0f\uff08\u8026\u5408\u5c42\u7684\u5927\u7f51\u7edc\uff09\u6362\u53d6\u751f\u6210\u901f\u5ea6\u3002</p> </li> <li> <p>HiFi-GAN\uff08Kong \u7b49\u4eba\uff0c2020\uff09\u4f7f\u7528\u751f\u6210\u5bf9\u6297\u7f51\u7edc\u4ece\u6885\u5c14\u8bed\u8c31\u56fe\u5408\u6210\u6ce2\u5f62\u3002\u751f\u6210\u5668\u901a\u8fc7\u4e00\u7cfb\u5217\u8f6c\u7f6e\u5377\u79ef\u5bf9\u6885\u5c14\u8bed\u8c31\u56fe\u8fdb\u884c\u4e0a\u91c7\u6837\uff0c\u6bcf\u4e2a\u5377\u79ef\u540e\u8ddf\u4e00\u4e2a\u591a\u611f\u53d7\u91ce\u878d\u5408\uff08MRF\uff09\u6a21\u5757\u3002MRF \u6a21\u5757\u5e76\u884c\u5e94\u7528\u591a\u4e2a\u5177\u6709\u4e0d\u540c\u6838\u5927\u5c0f\u548c\u6269\u5f20\u7387\u7684\u6b8b\u5dee\u5757\uff0c\u7136\u540e\u5c06\u5b83\u4eec\u7684\u8f93\u51fa\u6c42\u548c\u3002\u8fd9\u4f7f\u5f97\u751f\u6210\u5668\u80fd\u591f\u540c\u65f6\u6355\u83b7\u591a\u4e2a\u65f6\u95f4\u5c3a\u5ea6\u7684\u6a21\u5f0f\u3002</p> </li> </ul> <p></p> <ul> <li> <p>HiFi-GAN \u4f7f\u7528\u4e24\u79cd\u9274\u522b\u5668\u7c7b\u578b\u3002\u591a\u5468\u671f\u9274\u522b\u5668\uff08MPD\uff09\u901a\u8fc7\u4ee5\u4e0d\u540c\u5468\u671f\uff082\u30013\u30015\u30017\u300111\uff09\u6298\u53e0\u4e00\u7ef4\u6ce2\u5f62\uff0c\u5c06\u5176\u91cd\u5851\u4e3a\u4e8c\u7ef4\uff0c\u7136\u540e\u5e94\u7528\u4e8c\u7ef4\u5377\u79ef\u3002\u8fd9\u6355\u83b7\u4e86\u4e0d\u540c\u57fa\u9891\u4e0b\u7684\u5468\u671f\u7ed3\u6784\u3002\u591a\u5c3a\u5ea6\u9274\u522b\u5668\uff08MSD\uff09\u5728\u539f\u59cb\u6ce2\u5f62\u30012 \u500d\u964d\u91c7\u6837\u548c 4 \u500d\u964d\u91c7\u6837\u7248\u672c\u4e0a\u64cd\u4f5c\uff0c\u6355\u83b7\u4e0d\u540c\u65f6\u95f4\u5206\u8fa8\u7387\u4e0b\u7684\u6a21\u5f0f\u3002</p> </li> <li> <p>\u8bad\u7ec3\u76ee\u6807\u7ed3\u5408\u4e86\u5bf9\u6297\u635f\u5931\u3001\u6885\u5c14\u8bed\u8c31\u56fe\u91cd\u6784\u635f\u5931\uff08\u5408\u6210\u97f3\u9891\u4e0e\u771f\u5b9e\u97f3\u9891\u7684\u6885\u5c14\u8bed\u8c31\u56fe\u4e4b\u95f4\u7684 L1 \u8ddd\u79bb\uff09\u548c\u7279\u5f81\u5339\u914d\u635f\u5931\uff08\u4e2d\u95f4\u9274\u522b\u5668\u7279\u5f81\u4e4b\u95f4\u7684 L1 \u8ddd\u79bb\uff09\uff1a</p> </li> </ul> \\[\\mathcal{L}_G = \\mathcal{L}_{\\text{adv}}(G) + \\lambda_{\\text{mel}} \\mathcal{L}_{\\text{mel}}(G) + \\lambda_{\\text{fm}} \\mathcal{L}_{\\text{fm}}(G)\\] <ul> <li> <p>HiFi-GAN \u5b9e\u73b0\u4e86\u4e0e WaveNet \u76f8\u5f53\u7684\u5408\u6210\u8d28\u91cf\uff0c\u540c\u65f6\u901f\u5ea6\u63d0\u5347\u8d85\u8fc7 1000 \u500d\uff0c\u53ef\u5728\u5355\u4e2a GPU \u4e0a\u5b9e\u73b0\u5b9e\u65f6\u751f\u6210\u3002</p> </li> <li> <p>\u795e\u7ecf\u6e90-\u6ee4\u6ce2\u5668\uff08NSF\uff09\u6a21\u578b\u5c06\u4f20\u7edf\u4fe1\u53f7\u5904\u7406\u4e0e\u795e\u7ecf\u7f51\u7edc\u76f8\u7ed3\u5408\u3002\u5728\u7ecf\u5178\u6e90-\u6ee4\u6ce2\u5668\u6a21\u578b\u4e2d\uff0c\u6d4a\u97f3\u7531\u58f0\u6e90\u6fc0\u52b1\uff08\u57fa\u9891 \\(F_0\\) \u5904\u7684\u5468\u671f\u8109\u51b2\u5e8f\u5217\uff09\u901a\u8fc7\u58f0\u9053\u6ee4\u6ce2\u5668\uff08\u9891\u8c31\u5305\u7edc\uff09\u4ea7\u751f\u3002NSF \u6a21\u578b\u7528\u795e\u7ecf\u7f51\u7edc\u66ff\u4ee3\u624b\u5de5\u8bbe\u8ba1\u7684\u6ee4\u6ce2\u5668\uff0c\u540c\u65f6\u4fdd\u7559\u663e\u5f0f\u6e90\u4fe1\u53f7\u3002\u8f93\u5165\u7684 \\(F_0\\) \u8f6e\u5ed3\u63d0\u4f9b\u4e86\u7eaf\u6570\u636e\u9a71\u52a8\u58f0\u7801\u5668\u6709\u65f6\u96be\u4ee5\u5904\u7406\u7684\u7cbe\u7ec6\u97f3\u9ad8\u63a7\u5236\u3002</p> </li> <li> <p>\u58f0\u5b66\u6a21\u578b\uff1aTacotron\uff08Wang \u7b49\u4eba\uff0c2017\uff09\u662f\u7b2c\u4e00\u4e2a\u76f4\u63a5\u5c06\u5b57\u7b26\u5e8f\u5217\u8f6c\u6362\u4e3a\u6885\u5c14\u8bed\u8c31\u56fe\u7684\u7aef\u5230\u7aef\u795e\u7ecf TTS \u7cfb\u7edf\u3002\u5b83\u4f7f\u7528\u5e26\u6ce8\u610f\u529b\u673a\u5236\u7684\u7f16\u7801\u5668-\u89e3\u7801\u5668\u67b6\u6784\uff08\u7b2c 07 \u7ae0\uff09\u3002\u7f16\u7801\u5668\u4f7f\u7528\u5377\u79ef\u5e93\u3001\u9ad8\u901f\u7f51\u7edc\u548c\u53cc\u5411 GRU \u5904\u7406\u5b57\u7b26/\u97f3\u7d20\u5e8f\u5217\u3002\u89e3\u7801\u5668\u662f\u4e00\u4e2a\u81ea\u56de\u5f52 GRU\uff0c\u9010\u4e2a\u9884\u6d4b\u6885\u5c14\u5e27\uff0c\u4f7f\u7528\u524d\u4e00\u5e27\u548c\u6ce8\u610f\u529b\u4e0a\u4e0b\u6587\u4f5c\u4e3a\u8f93\u5165\u3002</p> </li> <li> <p>Tacotron 2\uff08Shen \u7b49\u4eba\uff0c2018\uff09\u663e\u8457\u6539\u8fdb\u4e86\u67b6\u6784\u3002\u7f16\u7801\u5668\u662f\u4e00\u4e2a 3 \u5c42\u4e00\u7ef4\u5377\u79ef\u5806\u53e0\u540e\u8ddf\u53cc\u5411 LSTM\uff08\u7b2c 06 \u7ae0\uff09\u3002\u89e3\u7801\u5668\u662f\u4e00\u4e2a 2 \u5c42 LSTM\uff0c\u5e26\u4f4d\u7f6e\u654f\u611f\u6ce8\u610f\u529b\uff0c\u8be5\u6ce8\u610f\u529b\u673a\u5236\u4e0d\u4ec5\u57fa\u4e8e\u7f16\u7801\u5668\u8f93\u51fa\u548c\u89e3\u7801\u5668\u72b6\u6001\uff0c\u8fd8\u57fa\u4e8e\u5148\u524d\u6b65\u9aa4\u7d2f\u79ef\u7684\u6ce8\u610f\u529b\u6743\u91cd\u6765\u6761\u4ef6\u5316\u3002\u8fd9\u9632\u6b62\u4e86\u6ce8\u610f\u529b\u8df3\u8fc7\u6216\u91cd\u590d\u8bcd\u8bed\u7684\u5e38\u89c1\u5931\u8d25\u6a21\u5f0f\u3002</p> </li> </ul> <p></p> <ul> <li>\u89e3\u7801\u5668\u6b65\u9aa4 \\(i\\) \u4e0b\u7f16\u7801\u5668\u4f4d\u7f6e \\(j\\) \u7684\u4f4d\u7f6e\u654f\u611f\u6ce8\u610f\u529b\u80fd\u91cf\u4e3a\uff1a</li> </ul> \\[e_{i,j} = w^T \\tanh(W_s s_{i-1} + W_h h_j + W_f f_{i,j} + b)\\] <ul> <li> <p>\u5176\u4e2d \\(s_{i-1}\\) \u662f\u524d\u4e00\u4e2a\u89e3\u7801\u5668\u72b6\u6001\uff0c\\(h_j\\) \u662f\u4f4d\u7f6e \\(j\\) \u5904\u7684\u7f16\u7801\u5668\u8f93\u51fa\uff0c\\(f_{i,j}\\) \u662f\u901a\u8fc7\u5c06\u7d2f\u79ef\u6ce8\u610f\u529b\u6743\u91cd \\(\\sum_{k&lt;i} \\alpha_{k,j}\\) \u4e0e\u4e00\u7ef4\u5377\u79ef\u6ee4\u6ce2\u5668\u5377\u79ef\u5f97\u5230\u7684\u4f4d\u7f6e\u7279\u5f81\u3002\u6ce8\u610f\u529b\u6743\u91cd\u4e3a \\(\\alpha_{i,j} = \\text{softmax}(e_{i,j})\\)\u3002</p> </li> <li> <p>Tacotron 2 \u7684\u89e3\u7801\u5668\u8fd8\u5728\u6bcf\u4e2a\u6b65\u9aa4\u9884\u6d4b\u4e00\u4e2a\u505c\u6b62\u6807\u8bb0\u6982\u7387\uff0c\u6307\u793a\u6885\u5c14\u8bed\u8c31\u56fe\u4f55\u65f6\u5b8c\u6210\u3002\u8f93\u51fa\u7684\u6885\u5c14\u8bed\u8c31\u56fe\u968f\u540e\u4f20\u9012\u7ed9\u58f0\u7801\u5668\uff08\u6700\u521d\u662f WaveNet\uff0c\u540e\u6765\u88ab HiFi-GAN \u6216\u7c7b\u4f3c\u6a21\u578b\u53d6\u4ee3\uff09\u3002</p> </li> <li> <p>Tacotron 2 \u7684\u81ea\u56de\u5f52\u7279\u6027\u610f\u5473\u7740\u5408\u6210\u901f\u5ea6\u53d7\u9650\u4e8e\u6885\u5c14\u5e27\u7684\u6570\u91cf\u3002\u5bf9\u4e8e\u5178\u578b\u7684\u6bcf\u79d2 80 \u5e27\u7684\u6885\u5c14\u8bed\u8c31\u56fe\uff0c\u4e00\u4e2a 5 \u79d2\u7684\u53d1\u97f3\u9700\u8981 400 \u4e2a\u987a\u5e8f\u89e3\u7801\u6b65\u9aa4\u3002</p> </li> <li> <p>FastSpeech\uff08Ren \u7b49\u4eba\uff0c2019\uff09\u4f7f\u7528\u975e\u81ea\u56de\u5f52\u58f0\u5b66\u6a21\u578b\u89e3\u51b3\u4e86\u901f\u5ea6\u95ee\u9898\u3002FastSpeech \u4e0d\u662f\u987a\u5e8f\u751f\u6210\u6885\u5c14\u5e27\uff0c\u800c\u662f\u5e76\u884c\u751f\u6210\u6240\u6709\u5e27\u3002\u5173\u952e\u6311\u6218\u5728\u4e8e\u786e\u5b9a\u6bcf\u4e2a\u97f3\u7d20\u5e94\u8be5\u4ea7\u751f\u591a\u5c11\u6885\u5c14\u5e27\uff0cFastSpeech \u901a\u8fc7\u65f6\u957f\u9884\u6d4b\u5668\u6765\u5904\u7406\u3002</p> </li> <li> <p>\u65f6\u957f\u9884\u6d4b\u5668\u662f\u4e00\u4e2a\u5c0f\u578b\u5377\u79ef\u7f51\u7edc\uff0c\u9884\u6d4b\u6bcf\u4e2a\u97f3\u7d20\u7684\u6574\u6570\u65f6\u957f\uff08\u6885\u5c14\u5e27\u6570\uff09\u3002\u8bad\u7ec3\u671f\u95f4\uff0c\u771f\u5b9e\u65f6\u957f\u4f7f\u7528\u5176\u6ce8\u610f\u529b\u5bf9\u9f50\u4ece\u9884\u8bad\u7ec3\u7684\u81ea\u56de\u5f52\u6559\u5e08\u6a21\u578b\uff08Tacotron 2\uff09\u4e2d\u63d0\u53d6\u3002\u63a8\u7406\u671f\u95f4\uff0c\u4f7f\u7528\u9884\u6d4b\u65f6\u957f\u901a\u8fc7\u957f\u5ea6\u8c03\u8282\u5668\u5c06\u97f3\u7d20\u7ea7\u9690\u85cf\u5e8f\u5217\u6269\u5c55\u5230\u5e27\u7ea7\uff0c\u8be5\u8c03\u8282\u5668\u7b80\u5355\u5730\u5c06\u6bcf\u4e2a\u97f3\u7d20\u7684\u9690\u85cf\u8868\u793a\u91cd\u590d\u9884\u6d4b\u7684\u5e27\u6570\u3002</p> </li> <li> <p>FastSpeech 2\uff08Ren \u7b49\u4eba\uff0c2021\uff09\u901a\u8fc7\u79fb\u9664\u6559\u5e08-\u5b66\u751f\u84b8\u998f\u6539\u8fdb\u4e86 FastSpeech\u3002\u5b83\u76f4\u63a5\u4f7f\u7528\u5f3a\u5236\u5bf9\u9f50\uff08\u6765\u81ea\u6587\u4ef6 02 \u7684\u58f0\u5b66\u6a21\u578b\u6846\u67b6\uff09\u63d0\u53d6\u771f\u5b9e\u65f6\u957f\uff0c\u5e76\u5728\u65f6\u957f\u4e4b\u5916\u6dfb\u52a0\u4e86\u663e\u5f0f\u7684\u97f3\u9ad8\uff08\\(F_0\\)\uff09\u548c\u80fd\u91cf\u65b9\u5dee\u9002\u914d\u5668\u3002\u6bcf\u4e2a\u9002\u914d\u5668\u662f\u4e00\u4e2a\u5c0f\u578b\u5377\u79ef\u9884\u6d4b\u5668\uff0c\u5176\u8f93\u51fa\u6761\u4ef6\u5316\u89e3\u7801\u5668\uff1a</p> </li> </ul> \\[ \\begin{aligned} \\hat{d}_i &amp;= \\text{DurationPredictor}(h_i) \\\\ \\hat{p}_i &amp;= \\text{PitchPredictor}(h_i) \\\\ \\hat{e}_i &amp;= \\text{EnergyPredictor}(h_i) \\end{aligned} \\] <ul> <li> <p>\u5176\u4e2d \\(h_i\\) \u662f\u97f3\u7d20 \\(i\\) \u7684\u7f16\u7801\u5668\u9690\u85cf\u72b6\u6001\u3002\u8bad\u7ec3\u65f6\u4f7f\u7528\u771f\u5b9e\u503c\uff1b\u63a8\u7406\u65f6\uff0c\u9884\u6d4b\u503c\u63d0\u4f9b\u5bf9\u97f5\u5f8b\u7684\u663e\u5f0f\u63a7\u5236\u3002\u8fd9\u79cd\u53ef\u63a7\u6027\u662f FastSpeech 2 \u7684\u4e3b\u8981\u4f18\u52bf\uff1a\u8c03\u6574\u97f3\u9ad8\u3001\u901f\u5ea6\u6216\u80fd\u91cf\u5c31\u50cf\u7f29\u653e\u9884\u6d4b\u5668\u8f93\u51fa\u4e00\u6837\u7b80\u5355\u3002</p> </li> <li> <p>FastSpeech 2 \u5728\u63a8\u7406\u65f6\u901a\u5e38\u6bd4 Tacotron 2 \u5feb 10-20 \u500d\uff0c\u5e76\u907f\u514d\u4e86\u5e38\u89c1\u7684\u81ea\u56de\u5f52\u5931\u8d25\u6a21\u5f0f\uff0c\u5982\u8bcd\u8bed\u8df3\u8fc7\u3001\u91cd\u590d\u548c\u6ce8\u610f\u529b\u5d29\u584c\u3002</p> </li> <li> <p>VITS\uff08Kim \u7b49\u4eba\uff0c2021\uff09\u662f\u4e00\u4e2a\u7aef\u5230\u7aef TTS \u6a21\u578b\uff0c\u76f4\u63a5\u4ece\u6587\u672c\u751f\u6210\u6ce2\u5f62\uff0c\u6d88\u9664\u4e86\u72ec\u7acb\u7684\u58f0\u7801\u5668\u9636\u6bb5\u3002VITS \u7ed3\u5408\u4e86\u6761\u4ef6\u53d8\u5206\u81ea\u7f16\u7801\u5668\uff08\u7b2c 06 \u7ae0\uff09\u3001\u6b63\u5219\u5316\u6d41\u548c\u5bf9\u6297\u8bad\u7ec3\u3002\u540e\u9a8c\u7f16\u7801\u5668\u5c06\u771f\u5b9e\u6885\u5c14\u8bed\u8c31\u56fe\u6620\u5c04\u5230\u6f5c\u5728\u7a7a\u95f4\uff0c\u5148\u9a8c\u7f16\u7801\u5668\u5c06\u97f3\u7d20\uff08\u901a\u8fc7\u57fa\u4e8e Transformer \u7684\u6587\u672c\u7f16\u7801\u5668\u548c\u65f6\u957f\u9884\u6d4b\u5668\uff09\u6620\u5c04\u5230\u540c\u4e00\u6f5c\u5728\u7a7a\u95f4\uff0c\u89e3\u7801\u5668\uff08\u57fa\u4e8e HiFi-GAN\uff09\u4ece\u6f5c\u5728\u6837\u672c\u751f\u6210\u6ce2\u5f62\u3002</p> </li> <li> <p>VITS \u7684\u8bad\u7ec3\u76ee\u6807\u7ed3\u5408\u4e86\uff1a</p> <ul> <li>\u91cd\u6784\u635f\u5931\uff1aVAE \u8feb\u4f7f\u6f5c\u5728\u5206\u5e03\u7f16\u7801\u58f0\u5b66\u4fe1\u606f</li> <li>KL \u6563\u5ea6\uff1a\u5bf9\u9f50\u6587\u672c\u6761\u4ef6\u5316\u7684\u5148\u9a8c\u4e0e\u97f3\u9891\u6761\u4ef6\u5316\u7684\u540e\u9a8c</li> <li>\u5bf9\u6297\u635f\u5931\uff1a\u9274\u522b\u5668\u786e\u4fdd\u6ce2\u5f62\u8d28\u91cf</li> <li>\u65f6\u957f\u635f\u5931\uff1a\u8bad\u7ec3\u968f\u673a\u65f6\u957f\u9884\u6d4b\u5668</li> </ul> </li> <li> <p>VITS \u6bd4\u4e24\u9636\u6bb5\u7cfb\u7edf\uff08FastSpeech 2 + HiFi-GAN\uff09\u4ea7\u751f\u66f4\u9ad8\u8d28\u91cf\uff0c\u56e0\u4e3a\u58f0\u5b66\u6a21\u578b\u548c\u58f0\u7801\u5668\u88ab\u8054\u5408\u4f18\u5316\uff0c\u907f\u514d\u4e86\u9884\u6d4b\u6885\u5c14\u8bed\u8c31\u56fe\u4e0e\u771f\u5b9e\u6885\u5c14\u8bed\u8c31\u56fe\u4e4b\u95f4\u7684\u4e0d\u5339\u914d\uff0c\u8fd9\u79cd\u4e0d\u5339\u914d\u4f1a\u964d\u4f4e\u4e24\u9636\u6bb5\u7cfb\u7edf\u7684\u6027\u80fd\u3002</p> </li> <li> <p>VALL-E\uff08Wang \u7b49\u4eba\uff0c2023\uff09\u4ece\u6839\u672c\u4e0a\u5c06 TTS \u91cd\u6784\u4e3a\u79bb\u6563\u97f3\u9891\u4ee4\u724c\u4e0a\u7684\u8bed\u8a00\u5efa\u6a21\u95ee\u9898\u3002\u5b83\u4f7f\u7528\u795e\u7ecf\u97f3\u9891\u7f16\u89e3\u7801\u5668\uff08EnCodec\uff09\u5c06\u8bed\u97f3\u8868\u793a\u4e3a\u6765\u81ea\u591a\u4e2a\u7801\u672c\u7ea7\u7684\u4e00\u7cfb\u5217\u79bb\u6563\u7801\u3002\u7ed9\u5b9a\u6587\u672c\u63d0\u793a\u548c\u4e00\u4e2a 3 \u79d2\u7684\u6ce8\u518c\u8bdd\u8bed\uff08\u4e5f\u7f16\u7801\u4e3a\u79bb\u6563\u4ee4\u724c\uff09\uff0cVALL-E \u4f7f\u7528 Transformer \u8bed\u8a00\u6a21\u578b\u81ea\u56de\u5f52\u5730\u9884\u6d4b\u97f3\u9891\u4ee4\u724c\u3002</p> </li> <li> <p>VALL-E \u4f7f\u7528\u4e24\u4e2a\u6a21\u578b\uff1a\u4e00\u4e2a\u81ea\u56de\u5f52\uff08AR\uff09\u6a21\u578b\u9010\u4e2a\u4ee4\u724c\u5730\u751f\u6210\u7b2c\u4e00\u4e2a\u7801\u672c\u7ea7\uff0c\u4ee5\u53ca\u4e00\u4e2a\u975e\u81ea\u56de\u5f52\uff08NAR\uff09\u6a21\u578b\u5e76\u884c\u9884\u6d4b\u5269\u4f59\u7684\u7801\u672c\u7ea7\uff0c\u4ee5\u7b2c\u4e00\u4e2a\u7ea7\u522b\u548c\u5f7c\u6b64\u4e3a\u6761\u4ef6\u3002\u8fd9\u79cd\u7f16\u89e3\u7801\u5668\u8bed\u8a00\u6a21\u578b\u65b9\u6cd5\u5b9e\u73b0\u4e86\u5353\u8d8a\u7684\u96f6\u6837\u672c\u58f0\u97f3\u514b\u9686\uff1a3 \u79d2\u6837\u672c\u8db3\u4ee5\u91cd\u73b0\u8bf4\u8bdd\u4eba\u7684\u58f0\u97f3\u3001\u97f3\u8272\uff0c\u751a\u81f3\u60c5\u611f\u57fa\u8c03\u3002</p> </li> <li> <p>StyleTTS\uff08Li \u7b49\u4eba\uff0c2022\uff09\u548c StyleTTS 2 \u5c06\u8bed\u97f3\u89e3\u8026\u4e3a\u5185\u5bb9\u548c\u98ce\u683c\u7ec4\u4ef6\u3002\u98ce\u683c\u7f16\u7801\u5668\u4ece\u53c2\u8003\u97f3\u9891\u4e2d\u63d0\u53d6\u98ce\u683c\u5411\u91cf\uff0c\u6355\u83b7\u8bf4\u8bdd\u4eba\u8eab\u4efd\u3001\u97f5\u5f8b\u548c\u5f55\u97f3\u6761\u4ef6\u3002\u63a8\u7406\u65f6\uff0c\u98ce\u683c\u53ef\u4ee5\u4ece\u5b66\u4e60\u7684\u5148\u9a8c\u5206\u5e03\u4e2d\u91c7\u6837\uff0c\u6216\u4ece\u53c2\u8003\u8bdd\u8bed\u4e2d\u8fc1\u79fb\u3002StyleTTS 2 \u4f7f\u7528\u6269\u6563\u6a21\u578b\uff08\u7b2c 08 \u7ae0\uff09\u4f5c\u4e3a\u98ce\u683c\u5148\u9a8c\uff0c\u751f\u6210\u591a\u6837\u5316\u4e14\u81ea\u7136\u7684\u97f5\u5f8b\u3002</p> </li> <li> <p>Kokoro\uff082024\uff09\u662f\u4e00\u4e2a\u8f7b\u91cf\u7ea7\u3001\u9ad8\u8d28\u91cf\u7684\u5f00\u653e\u6e90\u7801 TTS \u6a21\u578b\uff0c\u4ee5\u5176\u5c0f\u5de7\u7684\u89c4\u6a21\uff08\u7ea6 82M \u53c2\u6570\uff09\u548c\u4ee4\u4eba\u5370\u8c61\u6df1\u523b\u7684\u81ea\u70ed\u5ea6\u800c\u8457\u79f0\u3002\u5b83\u91c7\u7528\u53d7 StyleTTS 2 \u542f\u53d1\u7684\u67b6\u6784\uff0c\u5305\u542b\u57fa\u4e8e\u6269\u6563\u7684\u98ce\u683c\u5148\u9a8c\u548c\u5fae\u8c03\u7684 ISTFTNet \u58f0\u7801\u5668\uff0c\u8be5\u58f0\u7801\u5668\u76f4\u63a5\u9884\u6d4b STFT \u7cfb\u6570\uff08\u6765\u81ea\u6587\u4ef6 01\uff09\u800c\u4e0d\u662f\u539f\u59cb\u6ce2\u5f62\u6837\u672c\u3002\u5c3d\u7ba1\u6a21\u578b\u5927\u5c0f\u4ec5\u4e3a VALL-E \u7b49\u6a21\u578b\u7684\u4e00\u5c0f\u90e8\u5206\uff0cKokoro \u5728\u82f1\u8bed\u3001\u65e5\u8bed\u3001\u6cd5\u8bed\u3001\u97e9\u8bed\u548c\u4e2d\u6587\u4e0a\u5b9e\u73b0\u4e86\u63a5\u8fd1\u4eba\u7c7b\u7684\u81ea\u7136\u5ea6\uff0c\u8bc1\u660e\u4e86\u7cbe\u5fc3\u7b56\u5212\u7684\u8bad\u7ec3\u6570\u636e\u548c\u9ad8\u6548\u67b6\u6784\u8bbe\u8ba1\u53ef\u4ee5\u4e0e\u66b4\u529b\u89c4\u6a21\u76f8\u6297\u8861\u3002Kokoro \u7684\u5c0f\u4f53\u79ef\u4f7f\u5176\u975e\u5e38\u9002\u5408\u672c\u5730\u548c\u8fb9\u7f18\u90e8\u7f72\u3002</p> </li> <li> <p>Orpheus\uff08Canopy Labs\uff0c2025\uff09\u662f\u4e00\u4e2a\u5f00\u653e\u6e90\u7801 TTS \u6a21\u578b\u7cfb\u5217\uff081B \u548c 3B \u53c2\u6570\uff09\uff0c\u6784\u5efa\u5728 VALL-E \u5f00\u521b\u7684\u7f16\u89e3\u7801\u5668\u8bed\u8a00\u6a21\u578b\u8303\u5f0f\u4e4b\u4e0a\u3002Orpheus \u66f4\u8fdb\u4e00\u6b65\uff0c\u4f7f\u7528 LLM \u9aa8\u5e72\u7f51\u7edc\uff08\u5fae\u8c03\u7684 Llama 3\uff09\u76f4\u63a5\u751f\u6210 SNAC \u97f3\u9891\u7f16\u89e3\u7801\u5668\u4ee4\u724c\u3002\u5176\u7a81\u51fa\u7279\u70b9\u662f\u7c7b\u4f3c\u4eba\u7c7b\u7684\u60c5\u611f\u8868\u8fbe\u80fd\u529b\uff1a\u5b83\u80fd\u591f\u4ee5\u5353\u8d8a\u7684\u81ea\u7136\u5ea6\u5904\u7406\u7b11\u58f0\u3001\u53f9\u606f\u3001\u72b9\u8c6b\u548c\u60c5\u611f\u97f5\u5f8b\u3002Orpheus \u53ef\u4ee5\u901a\u8fc7\u5728\u8f93\u5165\u6587\u672c\u4e2d\u4f7f\u7528 <code>[laugh]</code> \u6216 <code>[sigh]</code> \u7b49\u6807\u7b7e\u8fdb\u884c\u63d0\u793a\uff0c\u4ece\u800c\u5bf9\u526f\u8bed\u8a00\u8868\u8fbe\u8fdb\u884c\u7ec6\u7c92\u5ea6\u63a7\u5236\u3002</p> </li> <li> <p>Dia\uff08Nari Labs\uff0c2025\uff09\u662f\u4e00\u4e2a\u5f00\u653e\u6e90\u7801\u5bf9\u8bdd TTS \u6a21\u578b\uff0c\u4ece\u5355\u4e2a\u6587\u672c\u8f6c\u5f55\u751f\u6210\u903c\u771f\u7684\u591a\u8bf4\u8bdd\u4eba\u5bf9\u8bdd\u3002Dia \u6784\u5efa\u5728 1.6B \u53c2\u6570\u7684\u7f16\u7801\u5668-\u89e3\u7801\u5668 Transformer \u4e4b\u4e0a\uff0c\u5904\u7406\u5bf9\u8bdd\u4e2d\u7684\u8bdd\u8f6e\u8f6c\u6362\u3001\u8bf4\u8bdd\u4eba\u7279\u5b9a\u58f0\u97f3\u548c\u975e\u8bed\u8a00\u7ebf\u7d22\uff08\u7b11\u58f0\u3001\u505c\u987f\uff09\u3002\u5b83\u8fd8\u652f\u6301\u4ece\u7b80\u77ed\u97f3\u9891\u63d0\u793a\u8fdb\u884c\u58f0\u97f3\u514b\u9686\uff0c\u4ece\u800c\u5728\u5bf9\u8bdd\u4e0a\u4e0b\u6587\u4e2d\u5b9e\u73b0\u96f6\u6837\u672c\u8bf4\u8bdd\u4eba\u751f\u6210\u3002</p> </li> <li> <p>Sesame CSM\uff08\u4f1a\u8bdd\u8bed\u97f3\u6a21\u578b\uff0c2025\uff09\u4e13\u6ce8\u4e8e\u81ea\u7136\u7684\u591a\u4eba\u8f6e\u6362\u4f1a\u8bdd\u8bed\u97f3\u3002Sesame \u4e0d\u662f\u4e3a\u4e86\u4f18\u5316\u6717\u8bfb\u5f0f TTS\uff0c\u800c\u662f\u5bf9\u771f\u5b9e\u5bf9\u8bdd\u7684\u52a8\u6001\u8fdb\u884c\u5efa\u6a21\uff1a\u53cd\u9988\u8bcd\uff08\"\u55ef\u54fc\"\uff09\u3001\u6253\u65ad\u3001\u8bf4\u8bdd\u4eba\u4e4b\u95f4\u7684\u8282\u594f\u53d8\u5316\u548c\u60c5\u611f\u54cd\u5e94\u3002\u8be5\u6a21\u578b\u4f7f\u7528\u4ee5\u5bf9\u8bdd\u4e0a\u4e0b\u6587\uff08\u6587\u672c\u548c\u97f3\u9891\u5386\u53f2\uff09\u4e3a\u6761\u4ef6\u7684 Transformer \u9aa8\u5e72\u7f51\u7edc\uff0c\u751f\u6210\u7684\u8bed\u97f3\u98ce\u683c\u80fd\u9002\u5e94\u5bf9\u8bdd\u7684\u6d41\u7a0b\u3002</p> </li> <li> <p>Fish Speech\uff08Fish Audio\uff0c2024\uff09\u662f\u4e00\u4e2a\u5f00\u653e\u6e90\u7801 TTS \u7cfb\u7edf\uff0c\u4f7f\u7528\u53cc\u81ea\u56de\u5f52\u67b6\u6784\uff1a\u4e00\u4e2a\u5927\u8bed\u8a00\u6a21\u578b\u4ece\u6587\u672c\u751f\u6210\u8bed\u4e49\u4ee4\u724c\uff0c\u4e00\u4e2a\u8f83\u5c0f\u6a21\u578b\u5c06\u8fd9\u4e9b\u8f6c\u6362\u4e3a VQGAN \u58f0\u5b66\u4ee4\u724c\uff0c\u518d\u7531\u58f0\u7801\u5668\u89e3\u7801\u4e3a\u6ce2\u5f62\u3002Fish Speech \u652f\u6301\u4ece 10-15 \u79d2\u53c2\u8003\u97f3\u9891\u8fdb\u884c\u96f6\u6837\u672c\u58f0\u97f3\u514b\u9686\uff0c\u5e76\u5b9e\u73b0\u9002\u5408\u5b9e\u65f6\u5e94\u7528\u7684\u4f4e\u5ef6\u8fdf\u3002\u5176\u6a21\u5757\u5316\u8bbe\u8ba1\u5141\u8bb8\u72ec\u7acb\u66ff\u6362\u7ec4\u4ef6\uff08\u4f8b\u5982\uff0c\u4e0d\u540c\u7684\u58f0\u7801\u5668\uff09\u3002</p> </li> <li> <p>ChatTTS\uff082024\uff09\u662f\u4e00\u4e2a\u5f00\u653e\u6e90\u7801\u4f1a\u8bdd TTS \u6a21\u578b\uff0c\u4e13\u4e3a\u804a\u5929\u673a\u5668\u4eba\u548c\u865a\u62df\u52a9\u624b\u7b49\u5bf9\u8bdd\u5e94\u7528\u8bbe\u8ba1\u3002\u5b83\u901a\u8fc7\u5728\u6587\u672c\u8f93\u5165\u4e2d\u5d4c\u5165\u7279\u6b8a\u4ee4\u724c\uff0c\u751f\u6210\u81ea\u7136\u3001\u4f1a\u8bdd\u98ce\u683c\u7684\u8bed\u97f3\uff0c\u5e76\u5bf9\u97f5\u5f8b\u7279\u5f81\uff08\u7b11\u58f0\u3001\u505c\u987f\u3001\u586b\u5145\u8bcd\uff09\u8fdb\u884c\u7ec6\u7c92\u5ea6\u63a7\u5236\u3002ChatTTS \u652f\u6301\u4e2d\u82f1\u6df7\u5408\u5408\u6210\u548c\u591a\u8bf4\u8bdd\u4eba\u751f\u6210\u3002</p> </li> <li> <p>Bark\uff08Suno\uff0c2023\uff09\u662f\u4e00\u4e2a\u57fa\u4e8e Transformer \u7684\u5f00\u653e\u6e90\u7801\u6a21\u578b\uff0c\u4ece\u6587\u672c\u63d0\u793a\u751f\u6210\u8bed\u97f3\u3001\u97f3\u4e50\u548c\u97f3\u6548\u3002\u5b83\u4f7f\u7528\u4e09\u4e2a\u9636\u6bb5\u7684 Transformer \u6a21\u578b\u6d41\u6c34\u7ebf\uff08\u6587\u672c \u2192 \u8bed\u4e49\u4ee4\u724c \u2192 \u7c97\u58f0\u5b66\u4ee4\u724c \u2192 \u7ec6\u58f0\u5b66\u4ee4\u724c\uff09\uff0c\u5e76\u652f\u6301\u58f0\u97f3\u514b\u9686\u3001\u591a\u8bed\u8a00\u5408\u6210\u4ee5\u53ca\u97f3\u4e50\u548c\u73af\u5883\u97f3\u7b49\u975e\u8bed\u97f3\u97f3\u9891\u3002Bark \u7684\u901a\u7528\u6027\u4ee5\u53ef\u63a7\u6027\u4e3a\u4ee3\u4ef7\u2014\u2014\u5b83\u4e0d\u5982\u4e13\u7528 TTS \u7cfb\u7edf\u7cbe\u786e\uff0c\u4f46\u66f4\u7075\u6d3b\u3002</p> </li> <li> <p>Parler-TTS\uff08Hugging Face\uff0c2024\uff09\u91c7\u7528\u81ea\u7136\u8bed\u8a00\u63cf\u8ff0\u65b9\u5f0f\u8fdb\u884c\u58f0\u97f3\u63a7\u5236\uff1a\u7528\u6237\u65e0\u9700\u63d0\u4f9b\u53c2\u8003\u97f3\u9891\u7247\u6bb5\u6765\u63a7\u5236\u98ce\u683c\uff0c\u800c\u662f\u63d0\u4f9b\u6587\u672c\u63cf\u8ff0\uff0c\u4f8b\u5982\"\u4e00\u4f4d\u5973\u6027\u8bf4\u8bdd\u8005\uff0c\u58f0\u97f3\u6e29\u6696\u3001\u5bcc\u6709\u8868\u73b0\u529b\uff0c\u5728\u5b89\u9759\u7684\u623f\u95f4\u4e2d\u3002\"Parler-TTS \u5728\u5e26\u6ce8\u91ca\u7684\u8bed\u97f3\u6570\u636e\u4e0a\u8bad\u7ec3\uff0c\u5176\u4e2d\u6bcf\u4e2a\u8bdd\u8bed\u90fd\u914d\u6709\u4e00\u4e2a\u63cf\u8ff0\u8bf4\u8bdd\u98ce\u683c\u7684\u81ea\u7136\u8bed\u8a00\u63cf\u8ff0\uff0c\u4ece\u800c\u65e0\u9700\u4efb\u4f55\u53c2\u8003\u97f3\u9891\u5373\u53ef\u5b9e\u73b0\u76f4\u89c2\u63a7\u5236\u3002</p> </li> <li> <p>Neuphonic \u662f\u4e00\u4e2a\u57fa\u4e8e API \u7684 TTS \u5e73\u53f0\uff0c\u9488\u5bf9\u8d85\u4f4e\u5ef6\u8fdf\u8bed\u97f3\u5408\u6210\u8fdb\u884c\u4e86\u4f18\u5316\uff0c\u9762\u5411\u5b9e\u65f6\u8bed\u97f3\u4ee3\u7406\u548c\u4f1a\u8bdd AI \u5e94\u7528\u3002\u5b83\u901a\u8fc7\u6d41\u5f0f\u67b6\u6784\u5b9e\u73b0\u4f4e\u4e8e 100 \u6beb\u79d2\u7684\u9996\u97f3\u65f6\u95f4\uff0c\u5728\u5b8c\u6574\u8f93\u5165\u6587\u672c\u53ef\u7528\u4e4b\u524d\u5c31\u5f00\u59cb\u751f\u6210\u97f3\u9891\u3002Neuphonic \u4e13\u6ce8\u4e8e\u90e8\u7f72\u548c\u5ef6\u8fdf\u4f18\u5316\u5c42\u9762\uff0c\u800c\u4e0d\u662f\u65b0\u9896\u7684\u6a21\u578b\u67b6\u6784\uff0c\u56f4\u7ed5\u73b0\u4ee3\u795e\u7ecf TTS \u63d0\u4f9b\u751f\u4ea7\u7ea7\u57fa\u7840\u8bbe\u65bd\u3002</p> </li> <li> <p>KittenTTS \u662f\u4e00\u4e2a\u7d27\u51d1\u3001\u5feb\u901f\u7684 TTS \u6a21\u578b\uff0c\u4e13\u4e3a\u6548\u7387\u4f4e\u8d44\u6e90\u90e8\u7f72\u8bbe\u8ba1\u3002\u5b83\u4f18\u5148\u8003\u8651\u6700\u5c0f\u5ef6\u8fdf\u548c\u5c0f\u6a21\u578b\u5927\u5c0f\uff0c\u9002\u7528\u4e8e\u8fb9\u7f18\u548c\u5d4c\u5165\u5f0f\u5e94\u7528\uff0c\u4ee5\u727a\u7272\u4e00\u5b9a\u81ea\u7136\u5ea6\u6362\u53d6\u5728 CPU \u548c\u79fb\u52a8\u8bbe\u5907\u4e0a\u7684\u5b9e\u65f6\u6027\u80fd\u3002</p> </li> <li> <p>\u73b0\u4ee3 TTS \u683c\u5c40\u6b63\u5728\u5206\u5316\u4e3a\u4e24\u79cd\u8303\u5f0f\uff1a(1) \u7f16\u89e3\u7801\u5668\u8bed\u8a00\u6a21\u578b\uff08VALL-E\u3001Orpheus\u3001Fish Speech\uff09\uff0c\u5c06\u8bed\u97f3\u751f\u6210\u89c6\u4e3a\u79bb\u6563\u97f3\u9891\u7801\u4e0a\u7684\u4e0b\u4e00\u4e2a\u4ee4\u724c\u9884\u6d4b\uff0c\u5229\u7528 LLM \u7684\u6269\u5c55\u89c4\u5f8b\uff1b\u4ee5\u53ca (2) \u6d41/\u6269\u6563\u6a21\u578b\uff08VITS\u3001StyleTTS 2\u3001Kokoro\uff09\uff0c\u901a\u8fc7\u8fed\u4ee3\u7ec6\u5316\u751f\u6210\u8fde\u7eed\u6885\u5c14\u8bed\u8c31\u56fe\u6216\u6ce2\u5f62\u3002\u7f16\u89e3\u7801\u5668\u8bed\u8a00\u6a21\u578b\u5728\u96f6\u6837\u672c\u514b\u9686\u548c\u8868\u73b0\u529b\u65b9\u9762\u8868\u73b0\u51fa\u8272\uff1b\u6d41/\u6269\u6563\u6a21\u578b\u901a\u5e38\u66f4\u5c0f\u3001\u66f4\u5feb\u3002\u4e24\u8005\u90fd\u5728\u5feb\u901f\u5411\u4eba\u7c7b\u7ea7\u522b\u7684\u81ea\u7136\u5ea6\u6536\u655b\u3002</p> </li> <li> <p>\u97f5\u5f8b\u5efa\u6a21\u63a7\u5236\u8bed\u97f3\u7684\"\u97f3\u4e50\"\uff1a\u97f3\u9ad8\u3001\u65f6\u957f\u3001\u80fd\u91cf\u3001\u8282\u594f\u548c\u8bed\u8c03\u3002\u6ca1\u6709\u826f\u597d\u7684\u97f5\u5f8b\uff0c\u5373\u4f7f\u5355\u4e2a\u97f3\u7d20\u6e05\u6670\uff0c\u5408\u6210\u8bed\u97f3\u542c\u8d77\u6765\u4e5f\u5e73\u6de1\u4e14\u673a\u68b0\u3002\u53ef\u4ee5\u628a\u97f5\u5f8b\u60f3\u8c61\u6210\u5355\u8c03\u7684 GPS \u8bed\u97f3\u4e0e\u5bcc\u6709\u8868\u73b0\u529b\u7684\u6709\u58f0\u8bfb\u7269\u65c1\u767d\u4e4b\u95f4\u7684\u533a\u522b\u3002</p> </li> <li> <p>\u97f3\u9ad8\uff08\u57fa\u9891 \\(F_0\\)\uff09\u662f\u8bed\u97f3\u611f\u77e5\u7684\u9ad8\u4f4e\u7a0b\u5ea6\u3002\u5b83\u5728\u95ee\u53e5\u672b\u5c3e\u4e0a\u5347\uff0c\u5728\u9648\u8ff0\u53e5\u672b\u5c3e\u4e0b\u964d\uff0c\u5e76\u5728\u60c5\u611f\u6027\u8bed\u97f3\u4e2d\u8fde\u7eed\u53d8\u5316\u3002\\(F_0\\) \u4f7f\u7528 CREPE\uff08\u4e00\u79cd\u795e\u7ecf\u97f3\u9ad8\u8ffd\u8e2a\u5668\uff09\u6216 YIN\uff08\u57fa\u4e8e\u81ea\u76f8\u5173\uff0c\u6765\u81ea\u6587\u4ef6 01\uff09\u7b49\u7b97\u6cd5\u4ece\u97f3\u9891\u4e2d\u63d0\u53d6\u3002\u5728 TTS \u4e2d\uff0c\u97f3\u9ad8\u7531\u58f0\u5b66\u6a21\u578b\u9884\u6d4b\uff08FastSpeech 2 \u7684\u97f3\u9ad8\u9884\u6d4b\u5668\uff09\u6216\u9690\u5f0f\u5b66\u4e60\uff08Tacotron 2\uff09\u3002</p> </li> <li> <p>\u65f6\u957f\u51b3\u5b9a\u4e86\u8bed\u901f\u548c\u8282\u594f\u3002\u91cd\u8bfb\u97f3\u8282\u66f4\u957f\uff0c\u529f\u80fd\u8bcd\u7f29\u77ed\uff0c\u505c\u987f\u6807\u8bb0\u77ed\u8bed\u8fb9\u754c\u3002\u65f6\u957f\u5efa\u6a21\u5728\u975e\u81ea\u56de\u5f52\u6a21\u578b\uff08FastSpeech\uff09\u4e2d\u662f\u663e\u5f0f\u7684\uff0c\u5728\u81ea\u56de\u5f52\u6a21\u578b\uff08Tacotron \u7684\u6ce8\u610f\u529b\u5bf9\u9f50\u51b3\u5b9a\u65f6\u957f\uff09\u4e2d\u662f\u9690\u5f0f\u7684\u3002</p> </li> <li> <p>\u80fd\u91cf\uff08\u54cd\u5ea6\uff09\u627f\u8f7d\u7740\u91cd\u97f3\u3002\"\u6211\u6ca1\u8bf4\u4ed6\u5077\u4e86\" vs \"\u6211\u6ca1\u8bf4\u4ed6\u5077\u4e86\"\u5177\u6709\u5b8c\u5168\u4e0d\u540c\u7684\u542b\u4e49\uff0c\u5b8c\u5168\u901a\u8fc7\u80fd\u91cf\u6a21\u5f0f\u4f20\u8fbe\u3002</p> </li> <li> <p>\u98ce\u683c\u5d4c\u5165\u6355\u83b7\u66f4\u9ad8\u7ea7\u7684\u97f5\u5f8b\u6a21\u5f0f\u3002\u5168\u5c40\u98ce\u683c\u4ee4\u724c\uff08GST\uff09\u6846\u67b6\uff08Wang \u7b49\u4eba\uff0c2018\uff09\u5b66\u4e60\u4e00\u4e2a\u98ce\u683c\u4ee4\u724c\u5e93\uff08\u5bf9\u4e00\u7ec4\u5b66\u4e60\u5230\u7684\u5d4c\u5165\u8fdb\u884c\u8f6f\u6ce8\u610f\u529b\uff09\uff0c\u6355\u83b7\"\u5174\u594b\"\u3001\"\u60b2\u4f24\"\u6216\"\u4f4e\u8bed\"\u7b49\u8bf4\u8bdd\u98ce\u683c\u3002\u98ce\u683c\u5d4c\u5165\u4ece\u53c2\u8003\u8bdd\u8bed\u4e2d\u63d0\u53d6\u5e76\u6dfb\u52a0\u5230\u7f16\u7801\u5668\u8f93\u51fa\u4e2d\uff0c\u5141\u8bb8\u5728\u63a8\u7406\u65f6\u8fdb\u884c\u98ce\u683c\u8fc1\u79fb\u3002</p> </li> <li> <p>\u58f0\u97f3\u8f6c\u6362\uff08VC\uff09\u6539\u53d8\u8bdd\u8bed\u7684\u8bf4\u8bdd\u4eba\u8eab\u4efd\uff0c\u540c\u65f6\u4fdd\u7559\u8bed\u8a00\u5185\u5bb9\u3002\u60f3\u8c61\u4e00\u4e0b\u5f55\u4e0b\u81ea\u5df1\u7684\u58f0\u97f3\uff0c\u7136\u540e\u8ba9\u8f93\u51fa\u542c\u8d77\u6765\u50cf\u67d0\u4e2a\u7279\u5b9a\u7684\u76ee\u6807\u8bf4\u8bdd\u4eba\u3002VC \u9700\u8981\u5c06\u8bf4\u8bdd\u4eba\u8eab\u4efd\u4e0e\u5185\u5bb9\u89e3\u8026\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u8bf4\u8bdd\u4eba\u5d4c\u5165\uff08\u5728\u6587\u4ef6 04 \u4e2d\u8fdb\u4e00\u6b65\u8be6\u8ff0\uff09\u5c06\u8bf4\u8bdd\u4eba\u8eab\u4efd\u7f16\u7801\u4e3a\u56fa\u5b9a\u7ef4\u5ea6\u7684\u5411\u91cf\u3002\u8fd9\u4e9b\u53ef\u4ee5\u6765\u81ea\u9884\u8bad\u7ec3\u7684\u8bf4\u8bdd\u4eba\u9a8c\u8bc1\u6a21\u578b\uff08x-vectors\u3001ECAPA-TDNN\uff09\u3002\u5728 VC \u4e2d\uff0c\u6e90\u8bed\u97f3\u88ab\u7f16\u7801\u4e3a\u4e0e\u8bf4\u8bdd\u4eba\u65e0\u5173\u7684\u5185\u5bb9\u8868\u793a\uff0c\u7136\u540e\u4f7f\u7528\u76ee\u6807\u8bf4\u8bdd\u4eba\u5d4c\u5165\u8fdb\u884c\u89e3\u7801\u3002</p> </li> <li> <p>\u89e3\u8026\u8868\u793a\u5c06\u8bed\u97f3\u5206\u79bb\u4e3a\u72ec\u7acb\u56e0\u7d20\uff1a\u5185\u5bb9\uff08\u97f3\u7d20\uff09\u3001\u8bf4\u8bdd\u4eba\u8eab\u4efd\u3001\u97f3\u9ad8\u548c\u8282\u594f\u3002\u65b9\u6cd5\u5305\u62ec\uff1a</p> <ul> <li>\u4fe1\u606f\u74f6\u9888\uff1a\u538b\u7f29\u5185\u5bb9\u8868\u793a\uff0c\u4f7f\u5176\u7d27\u5bc6\u5230\u4e22\u5931\u8bf4\u8bdd\u4eba\u4fe1\u606f\uff08AutoVC\uff09</li> <li>\u5bf9\u6297\u8bad\u7ec3\uff1a\u5728\u5185\u5bb9\u8868\u793a\u4e0a\u8bad\u7ec3\u8bf4\u8bdd\u4eba\u5206\u7c7b\u5668\uff0c\u5e76\u4f7f\u7528\u68af\u5ea6\u53cd\u8f6c\u53bb\u9664\u8bf4\u8bdd\u4eba\u4fe1\u606f</li> <li>\u5411\u91cf\u91cf\u5316\uff1aVQ-VAE \u8feb\u4f7f\u5185\u5bb9\u901a\u8fc7\u79bb\u6563\u74f6\u9888\uff0c\u8fd9\u81ea\u7136\u5265\u79bb\u4e86\u8bf4\u8bdd\u4eba\u8eab\u4efd\uff08\u56e0\u4e3a\u7801\u672c\u6761\u76ee\u8868\u793a\u97f3\u7d20\u7c7b\u522b\uff0c\u800c\u975e\u8bf4\u8bdd\u4eba\u7279\u5f81\uff09</li> </ul> </li> <li> <p>\u58f0\u97f3\u514b\u9686\u4ee5\u76ee\u6807\u8bf4\u8bdd\u4eba\u7684\u58f0\u97f3\u5408\u6210\u8bed\u97f3\u3002\u591a\u8bf4\u8bdd\u4eba TTS\u5728\u6765\u81ea\u8bb8\u591a\u8bf4\u8bdd\u4eba\u7684\u6570\u636e\u4e0a\u8bad\u7ec3\uff0c\u4ee5\u8bf4\u8bdd\u4eba\u5d4c\u5165\u6761\u4ef6\u5316\u6a21\u578b\u3002\u63a8\u7406\u65f6\uff0c\u4ece\u6ce8\u518c\u97f3\u9891\u4e2d\u63d0\u53d6\u65b0\u8bf4\u8bdd\u4eba\u7684\u5d4c\u5165\uff0c\u5e76\u7528\u4e8e\u6761\u4ef6\u5316\u751f\u6210\u3002</p> </li> <li> <p>\u5c11\u6837\u672c\u58f0\u97f3\u514b\u9686\u4f7f\u7528\u5c11\u91cf\u6570\u636e\uff08\u51e0\u5206\u949f\uff09\u9002\u5e94\u65b0\u8bf4\u8bdd\u4eba\u3002\u8bf4\u8bdd\u4eba\u7f16\u7801\u5668\u4ece\u6ce8\u518c\u97f3\u9891\u4e2d\u63d0\u53d6\u5d4c\u5165\uff0cTTS \u6a21\u578b\u4ee5\u6b64\u5d4c\u5165\u4e3a\u6761\u4ef6\u751f\u6210\u8bed\u97f3\u3002\u8fd9\u662f SV2TTS\uff08Jia \u7b49\u4eba\uff0c2018\uff09\u4e2d\u4f7f\u7528\u7684\u65b9\u6cd5\uff1a\u4e00\u4e2a\u5355\u72ec\u8bad\u7ec3\u7684\u8bf4\u8bdd\u4eba\u7f16\u7801\u5668\u3001\u4e00\u4e2a\u4ee5\u8bf4\u8bdd\u4eba\u5d4c\u5165\u4e3a\u6761\u4ef6\u7684 Tacotron 2 \u5408\u6210\u5668\uff0c\u4ee5\u53ca\u4e00\u4e2a WaveRNN \u58f0\u7801\u5668\u3002</p> </li> <li> <p>\u96f6\u6837\u672c\u58f0\u97f3\u514b\u9686\u5b8c\u5168\u4e0d\u9700\u8981\u9002\u5e94\uff1a\u4e00\u4e2a\u7b80\u77ed\u7684\u8bdd\u8bed\uff083-30 \u79d2\uff09\u5c31\u8db3\u591f\u4e86\u3002VALL-E \u901a\u8fc7\u5c06\u6ce8\u518c\u97f3\u9891\u4f5c\u4e3a\u8bed\u8a00\u6a21\u578b\u7684\u63d0\u793a\u6765\u5b9e\u73b0\u8fd9\u4e00\u70b9\u3002\u8be5\u6a21\u578b\u5b66\u4f1a\u4ee5\u76f8\u540c\u7684\u58f0\u97f3\u7ee7\u7eed\u751f\u6210\uff0c\u56e0\u4e3a\u5b83\u662f\u5728\u5927\u89c4\u6a21\u591a\u8bf4\u8bdd\u4eba\u6570\u636e\u4e0a\u8bad\u7ec3\u7684\uff0c\u5176\u4e2d\u8bdd\u8bed\u5185\u58f0\u97f3\u4e00\u81f4\u6027\u662f\u7edf\u8ba1\u4e0a\u7684\u5e38\u6001\u3002</p> </li> <li> <p>\u8bed\u97f3\u6d3b\u52a8\u68c0\u6d4b\uff08VAD\uff09\u5728\u6bcf\u4e2a\u65f6\u95f4\u5e27\u56de\u7b54\u4e00\u4e2a\u7b80\u5355\u7684\u4e8c\u503c\u95ee\u9898\uff1a\u662f\u5426\u6709\u4eba\u5728\u8bf4\u8bdd\uff1f\u5c3d\u7ba1\u7b80\u5355\uff0cVAD \u662f ASR\uff08\u6587\u4ef6 02\uff09\u3001\u8bf4\u8bdd\u4eba\u65e5\u5fd7\uff08\u6587\u4ef6 04\uff09\u548c\u964d\u566a\uff08\u6587\u4ef6 05\uff09\u7684\u5173\u952e\u9884\u5904\u7406\u6b65\u9aa4\u3002\u597d\u7684 VAD \u901a\u8fc7\u8df3\u8fc7\u9759\u97f3\u51cf\u5c11\u8ba1\u7b97\u91cf\uff0c\u5e76\u901a\u8fc7\u9632\u6b62\u566a\u58f0\u88ab\u4f5c\u4e3a\u8bed\u97f3\u5904\u7406\u6765\u63d0\u9ad8\u51c6\u786e\u6027\u3002</p> </li> <li> <p>\u7ecf\u5178 VAD \u4f7f\u7528\u80fd\u91cf\u9608\u503c\u6cd5\uff08\u8bed\u97f3\u6bd4\u9759\u97f3\u54cd\u4eae\uff09\u3001\u8fc7\u96f6\u7387\uff08\u8bed\u97f3\u5177\u6709\u7279\u5f81\u6027\u7684\u8fc7\u96f6\u6a21\u5f0f\uff09\u548c\u9891\u8c31\u7279\u5f81\u3002\u8fd9\u4e9b\u5728\u4fe1\u566a\u6bd4\u8f83\u4f4e\u7684\u5608\u6742\u73af\u5883\u4e2d\u4f1a\u5931\u6548\u3002</p> </li> <li> <p>\u795e\u7ecf VAD\u6a21\u578b\u5c06\u95ee\u9898\u89c6\u4e3a\u5e27\u7ea7\u4e8c\u5206\u7c7b\u3002\u5c0f\u578b RNN \u6216 CNN \u63a5\u6536\u58f0\u5b66\u7279\u5f81\uff08\u6765\u81ea\u6587\u4ef6 01 \u7684\u5bf9\u6570\u6885\u5c14\u80fd\u91cf\uff09\u5e76\u9884\u6d4b\u8bed\u97f3/\u975e\u8bed\u97f3\u6982\u7387\u3002</p> </li> <li> <p>WebRTC VAD\uff08Google\uff09\u662f\u4e00\u4e2a\u7ecf\u5178\u8f7b\u91cf\u7ea7 VAD\uff0c\u4f7f\u7528\u57fa\u4e8e GMM \u7684\u5206\u7c7b\u5668\u5bf9\u7b80\u5355\u7684\u9891\u8c31\u7279\u5f81\u8fdb\u884c\u5206\u7c7b\u3002\u5b83\u4ee5\u56db\u4e2a\u6fc0\u8fdb\u7ea7\u522b\uff080-3\uff09\u8fd0\u884c\uff0c\u901f\u5ea6\u6781\u5feb\uff0c\u4f46\u5728\u97f3\u4e50\u3001\u975e\u8bed\u97f3\u53d1\u58f0\u548c\u4f4e SNR \u73af\u5883\u4e2d\u8868\u73b0\u4e0d\u4f73\u3002\u7531\u4e8e\u5176\u96f6\u4f9d\u8d56\u7684\u7b80\u5355\u6027\uff0c\u5b83\u4ecd\u7136\u88ab\u5e7f\u6cdb\u7528\u4f5c\u57fa\u7ebf\u3002</p> </li> <li> <p>Silero VAD\uff08Silero Team\uff0c2021\uff09\u662f\u751f\u4ea7\u73af\u5883\u4e2d\u7684\u4e8b\u5b9e\u6807\u51c6\u795e\u7ecf VAD\u3002\u5176\u67b6\u6784\u662f\u4e00\u4e2a\u5c0f\u578b\u6df1\u5ea6\u53ef\u5206\u79bb\u4e00\u7ef4\u5377\u79ef\u5806\u53e0\uff08\u7b2c 08 \u7ae0\u7684 MobileNet \u601d\u8def\u5e94\u7528\u4e8e\u97f3\u9891\uff09\uff0c\u540e\u8ddf\u4e00\u4e2a\u7528\u4e8e\u65f6\u95f4\u4e0a\u4e0b\u6587\u7684\u5355\u5c42 LSTM\uff0c\u6700\u540e\u662f\u4e00\u4e2a\u7ebf\u6027\u5934\u4ea7\u751f\u6bcf\u5e27\u7684\u8bed\u97f3\u6982\u7387\u3002\u6574\u4e2a\u6a21\u578b\u5c0f\u4e8e 2MB\uff08\u7ea6 1M \u53c2\u6570\uff09\uff0c\u4ee5 30-100 ms \u5757\u5904\u7406\u97f3\u9891\u3002</p> <ul> <li>\u8f93\u5165\uff1a\u539f\u59cb 16 kHz \u97f3\u9891\uff08\u65e0\u9700\u624b\u52a8\u7279\u5f81\u63d0\u53d6\u2014\u2014\u5377\u79ef\u524d\u7aef\u76f4\u63a5\u4ece\u6ce2\u5f62\u4e2d\u5b66\u4e60\u81ea\u5df1\u7684\u7279\u5f81\uff09\u3002</li> <li>\u7a97\u53e3\u5316\u6709\u72b6\u6001\u63a8\u7406\uff1aLSTM \u9690\u85cf\u72b6\u6001\u5728\u5757\u4e4b\u95f4\u4f20\u9012\uff0c\u56e0\u6b64\u6a21\u578b\u5904\u7406\u6d41\u5f0f\u97f3\u9891\u800c\u65e0\u9700\u91cd\u65b0\u5904\u7406\u5b8c\u6574\u5386\u53f2\u3002\u6bcf\u6b21\u8c03\u7528\u5904\u7406\u4e00\u4e2a 30\u300160 \u6216 100 ms \u7684\u5757\uff0c\u5e76\u8fd4\u56de \\([0, 1]\\) \u8303\u56f4\u5185\u7684\u8bed\u97f3\u6982\u7387\u3002</li> <li>\u81ea\u9002\u5e94\u9608\u503c\uff1aSilero VAD \u4f7f\u7528\u72ec\u7acb\u7684\u5f00\u59cb\u548c\u7ed3\u675f\u9608\u503c\uff0c\u800c\u4e0d\u662f\u5355\u4e2a\u56fa\u5b9a\u9608\u503c\uff0c\u5e76\u8bbe\u6709\u6700\u5c0f\u8bed\u97f3/\u9759\u97f3\u6301\u7eed\u65f6\u95f4\uff0c\u9632\u6b62\u5728\u566a\u58f0\u8fb9\u754c\u4e0a\u5feb\u901f\u5207\u6362\u3002\u8bed\u97f3\u6bb5\u5fc5\u987b\u8d85\u8fc7\u5f00\u59cb\u9608\u503c\u5e76\u6301\u7eed\u6700\u5c0f\u65f6\u957f\u624d\u88ab\u786e\u8ba4\uff0c\u9759\u97f3\u5fc5\u987b\u4f4e\u4e8e\u7ed3\u675f\u9608\u503c\u6301\u7eed\u4e00\u6bb5\u65f6\u95f4\u540e\u6bb5\u624d\u5173\u95ed\u3002</li> <li>\u6027\u80fd\uff1aSilero VAD \u5728 CPU \u4e0a\u4ee5 1-2% \u7684\u5b9e\u65f6\u56e0\u5b50\u8fd0\u884c\uff08\u5904\u7406 1 \u79d2\u97f3\u9891\u7ea6\u9700 10-20 ms\uff09\uff0c\u4f7f\u5176\u9002\u7528\u4e8e\u8fb9\u7f18\u8bbe\u5907\u3001\u624b\u673a\u548c\u5b9e\u65f6\u6d41\u6c34\u7ebf\u3002\u5b83\u5728\u5608\u6742\u548c\u97f3\u4e50\u4e30\u5bcc\u7684\u97f3\u9891\u4e0a\u663e\u8457\u4f18\u4e8e WebRTC VAD\uff0c\u540c\u65f6\u4fdd\u6301\u8db3\u591f\u5c0f\u4ee5\u4fbf\u4e8e\u8bbe\u5907\u7aef\u90e8\u7f72\u3002</li> <li>Silero VAD \u901a\u5e38\u7528\u4f5c Whisper\uff08\u6587\u4ef6 02\uff09\u7684\u524d\u7aef\uff0c\u5c06\u957f\u97f3\u9891\u5728\u8f6c\u5f55\u524d\u5206\u5272\u6210\u8bdd\u8bed\u7ea7\u5757\uff0c\u4e5f\u7528\u4e8e\u8bf4\u8bdd\u4eba\u65e5\u5fd7\u6d41\u6c34\u7ebf\uff08\u6587\u4ef6 04\uff09\uff0c\u5728\u63d0\u53d6\u8bf4\u8bdd\u4eba\u5d4c\u5165\u4e4b\u524d\u8bc6\u522b\u8bed\u97f3\u533a\u57df\u3002</li> </ul> </li> <li> <p>\u58f0\u5b66\u6d3b\u52a8\u68c0\u6d4b\uff08AAD\uff09\u5c06 VAD \u6cdb\u5316\u4e3a\u68c0\u6d4b\u4efb\u4f55\u58f0\u5b66\u6d3b\u52a8\uff0c\u800c\u4e0d\u4ec5\u4ec5\u662f\u8bed\u97f3\u3002\u8fd9\u5728\u667a\u80fd\u5bb6\u5c45\u8bbe\u5907\u3001\u5b89\u9632\u7cfb\u7edf\u548c\u91ce\u751f\u52a8\u7269\u76d1\u6d4b\u4e2d\u5f88\u6709\u7528\u3002AAD \u6a21\u578b\u68c0\u6d4b\u8bf8\u5982\u73bb\u7483\u7834\u788e\u3001\u72d7\u53eb\u6216\u8b66\u62a5\u7b49\u4e8b\u4ef6\uff0c\u901a\u5e38\u4f7f\u7528\u6587\u4ef6 04 \u4e2d\u63cf\u8ff0\u7684\u97f3\u9891\u5206\u7c7b\u6846\u67b6\u3002</p> </li> <li> <p>TTS \u8bc4\u4f30\u6307\u6807\u8861\u91cf\u5ba2\u89c2\u8d28\u91cf\u548c\u4e3b\u89c2\u81ea\u7136\u5ea6\uff1a</p> <ul> <li>\u5e73\u5747\u610f\u89c1\u5f97\u5206\uff08MOS\uff09\uff1a\u4eba\u7c7b\u542c\u8005\u5728 1-5 \u91cf\u8868\u4e0a\u5bf9\u81ea\u7136\u5ea6\u8fdb\u884c\u8bc4\u5206\u3002\u9ec4\u91d1\u6807\u51c6\uff0c\u4f46\u6602\u8d35\u4e14\u7f13\u6162\u3002</li> <li>\u6885\u5c14\u5012\u8c31\u5931\u771f\uff08MCD\uff09\uff1a\u6d4b\u91cf\u5408\u6210\u4e0e\u53c2\u8003\u6885\u5c14\u5012\u8c31\u4e4b\u95f4\u7684\u8ddd\u79bb\u3002\u8d8a\u4f4e\u8d8a\u597d\uff0c\u4f46\u5e76\u4e0d\u603b\u662f\u4e0e\u611f\u77e5\u76f8\u5173\u3002</li> <li>PESQ / POLQA\uff1a\u6700\u521d\u4e3a\u7535\u8bdd\u8bed\u97f3\u8bbe\u8ba1\u7684\u6807\u51c6\u5316\u611f\u77e5\u8bc4\u4f30\u6307\u6807\u3002</li> <li>\u8bf4\u8bdd\u4eba\u76f8\u4f3c\u5ea6\uff1a\u5408\u6210\u4e0e\u53c2\u8003\u97f3\u9891\u7684\u8bf4\u8bdd\u4eba\u5d4c\u5165\u4e4b\u95f4\u7684\u4f59\u5f26\u76f8\u4f3c\u5ea6\uff08\u4e0e\u58f0\u97f3\u514b\u9686\u76f8\u5173\uff09\u3002</li> <li>\u53ef\u61c2\u5ea6\uff1a\u5c06\u5408\u6210\u97f3\u9891\u8f93\u5165 ASR \u7cfb\u7edf\uff08\u6587\u4ef6 02\uff09\u5e76\u8ba1\u7b97\u8bcd\u9519\u8bef\u7387\uff08WER\uff09\u6765\u8861\u91cf\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2009%3A%20audio%20and%20speech/03.%20text%20to%20speech%20and%20voice/#colab-notebook","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ul> <li>\u4efb\u52a1 1\uff1a\u57fa\u4e8e\u6885\u5c14\u8bed\u8c31\u56fe\u7684 Griffin-Lim \u58f0\u7801\u5668\u3002 \u5b9e\u73b0 Griffin-Lim \u8fed\u4ee3\u76f8\u4f4d\u91cd\u6784\u7b97\u6cd5\uff0c\u5c06\u6885\u5c14\u8bed\u8c31\u56fe\u8f6c\u6362\u56de\u6ce2\u5f62\u3002\u8fd9\u6f14\u793a\u4e86\u58f0\u7801\u5668\u95ee\u9898\u4ee5\u53ca\u4e3a\u4f55\u9700\u8981\u795e\u7ecf\u58f0\u7801\u5668\u3002</li> </ul> <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u751f\u6210\u5408\u6210\u6ce2\u5f62\uff08\u6a21\u62df\u5143\u97f3\u7684\u8c10\u6ce2\u4e4b\u548c\uff09\nsr = 16000\nduration = 1.0\nt = jnp.linspace(0, duration, int(sr * duration))\nf0 = 220.0  # \u57fa\u9891\nwaveform = (\n    0.6 * jnp.sin(2 * jnp.pi * f0 * t) +\n    0.3 * jnp.sin(2 * jnp.pi * 2 * f0 * t) +\n    0.1 * jnp.sin(2 * jnp.pi * 3 * f0 * t)\n)\n\n# \u8ba1\u7b97 STFT\nn_fft = 1024\nhop_length = 256\nwindow = jnp.hanning(n_fft)\n\ndef stft(signal, n_fft, hop_length, window):\n    \"\"\"\u8ba1\u7b97\u77ed\u65f6\u5085\u91cc\u53f6\u53d8\u6362\u3002\"\"\"\n    n_frames = 1 + (len(signal) - n_fft) // hop_length\n    frames = jnp.stack([\n        signal[i * hop_length : i * hop_length + n_fft] * window\n        for i in range(n_frames)\n    ])\n    return jnp.fft.rfft(frames, n=n_fft)\n\ndef istft(stft_matrix, hop_length, window, length):\n    \"\"\"\u4f7f\u7528\u91cd\u53e0\u76f8\u52a0\u6cd5\u8ba1\u7b97\u9006 STFT\u3002\"\"\"\n    n_fft = (stft_matrix.shape[1] - 1) * 2\n    n_frames = stft_matrix.shape[0]\n    frames = jnp.fft.irfft(stft_matrix, n=n_fft)\n    frames = frames * window[None, :]\n    output = jnp.zeros(length)\n    for i in range(n_frames):\n        start = i * hop_length\n        end = start + n_fft\n        if end &lt;= length:\n            output = output.at[start:end].add(frames[i])\n    return output\n\n# \u6b63\u5411 STFT\nS = stft(waveform, n_fft, hop_length, window)\nmagnitude = jnp.abs(S)\n\n# \u6885\u5c14\u6ee4\u6ce2\u5668\u7ec4\nn_mels = 80\nmel_low = 0.0\nmel_high = 2595 * jnp.log10(1 + (sr / 2) / 700)\nmel_points = jnp.linspace(mel_low, mel_high, n_mels + 2)\nhz_points = 700 * (10 ** (mel_points / 2595) - 1)\nfreq_bins = jnp.floor((n_fft + 1) * hz_points / sr).astype(int)\n\nmel_filterbank = jnp.zeros((n_mels, n_fft // 2 + 1))\nfor m in range(n_mels):\n    f_left = freq_bins[m]\n    f_center = freq_bins[m + 1]\n    f_right = freq_bins[m + 2]\n    for k in range(f_left, f_center):\n        mel_filterbank = mel_filterbank.at[m, k].set(\n            (k - f_left) / max(f_center - f_left, 1)\n        )\n    for k in range(f_center, f_right):\n        mel_filterbank = mel_filterbank.at[m, k].set(\n            (f_right - k) / max(f_right - f_center, 1)\n        )\n\n# \u8f6c\u5230\u6885\u5c14\u5e76\u8fd4\u56de\uff08\u4f2a\u9006\uff09\nmel_spec = magnitude @ mel_filterbank.T\nmagnitude_reconstructed = mel_spec @ jnp.linalg.pinv(mel_filterbank.T)\nmagnitude_reconstructed = jnp.maximum(magnitude_reconstructed, 1e-7)\n\n# Griffin-Lim \u7b97\u6cd5\ndef griffin_lim(magnitude, n_iter, hop_length, window, signal_length):\n    \"\"\"\u8fed\u4ee3\u76f8\u4f4d\u91cd\u6784\u3002\"\"\"\n    n_fft = (magnitude.shape[1] - 1) * 2\n    key = jax.random.PRNGKey(42)\n    phase = jax.random.uniform(key, magnitude.shape, minval=-jnp.pi, maxval=jnp.pi)\n\n    for _ in range(n_iter):\n        complex_spec = magnitude * jnp.exp(1j * phase)\n        signal = istft(complex_spec, hop_length, window, signal_length)\n        reanalysis = stft(signal, n_fft, hop_length, window)\n        phase = jnp.angle(reanalysis)\n\n    complex_spec = magnitude * jnp.exp(1j * phase)\n    return istft(complex_spec, hop_length, window, signal_length)\n\nreconstructed = griffin_lim(magnitude_reconstructed, n_iter=60, hop_length=hop_length,\n                            window=window, signal_length=len(waveform))\n\n# \u7ed8\u5236\u5bf9\u6bd4\u56fe\nfig, axes = plt.subplots(3, 1, figsize=(12, 8))\n\naxes[0].plot(t[:1000], waveform[:1000], color='#3498db', linewidth=0.8)\naxes[0].set_title('\u539f\u59cb\u6ce2\u5f62')\naxes[0].set_ylabel('\u632f\u5e45')\n\naxes[1].imshow(jnp.log1p(mel_spec.T), aspect='auto', origin='lower', cmap='magma')\naxes[1].set_title('\u6885\u5c14\u8bed\u8c31\u56fe\uff08\u4e2d\u95f4\u8868\u793a\uff09')\naxes[1].set_ylabel('\u6885\u5c14\u9891\u5e26')\n\naxes[2].plot(t[:1000], reconstructed[:1000], color='#e74c3c', linewidth=0.8)\naxes[2].set_title('Griffin-Lim \u91cd\u6784\u6ce2\u5f62\uff0860 \u6b21\u8fed\u4ee3\uff09')\naxes[2].set_xlabel('\u65f6\u95f4 (\u79d2)')\naxes[2].set_ylabel('\u632f\u5e45')\n\nplt.tight_layout()\nplt.show()\n\n# \u6d4b\u91cf\u91cd\u6784\u8bef\u5dee\nmse = jnp.mean((waveform[:len(reconstructed)] - reconstructed[:len(waveform)]) ** 2)\nprint(f\"\u539f\u59cb\u4e0e\u91cd\u6784\u4e4b\u95f4\u7684 MSE\uff1a{mse:.6f}\")\nprint(\"\u6ce8\u610f\uff1a\u901a\u8fc7\u6885\u5c14\u53cd\u6f14\u5bfc\u81f4\u7684\u76f8\u4f4d\u4fe1\u606f\u4e22\u5931\u4f1a\u5f15\u8d77\u4f2a\u5f71\u3002\")\n</code></pre> <ul> <li>\u4efb\u52a1 2\uff1a\u65f6\u957f\u9884\u6d4b\u5668\uff08FastSpeech \u98ce\u683c\uff09\u3002 \u8bad\u7ec3\u4e00\u4e2a\u5c0f\u578b\u5377\u79ef\u65f6\u957f\u9884\u6d4b\u5668\uff0c\u5c06\u97f3\u7d20\u5d4c\u5165\u6620\u5c04\u5230\u65f6\u957f\u3002\u8fd9\u662f\u5b9e\u73b0\u975e\u81ea\u56de\u5f52 TTS \u7684\u6838\u5fc3\u7ec4\u4ef6\u3002</li> </ul> <pre><code>import jax\nimport jax.numpy as jnp\nimport jax.random as jr\nimport matplotlib.pyplot as plt\n\n# \u6a21\u62df\u5e26\u771f\u5b9e\u65f6\u957f\u7684\u97f3\u7d20\u5e8f\u5217\n# \u5728\u771f\u5b9e TTS \u4e2d\uff0c\u65f6\u957f\u6765\u81ea\u5f3a\u5236\u5bf9\u9f50\u6216\u6559\u5e08\u6ce8\u610f\u529b\ndef generate_synthetic_data(key, n_samples=200, max_phonemes=30, embed_dim=64):\n    \"\"\"\u751f\u6210\u5408\u6210\u97f3\u7d20\u5d4c\u5165\u548c\u65f6\u957f\u3002\"\"\"\n    keys = jr.split(key, 4)\n    lengths = jr.randint(keys[0], (n_samples,), 5, max_phonemes)\n\n    all_embeddings = []\n    all_durations = []\n    all_masks = []\n\n    for i in range(n_samples):\n        L = int(lengths[i])\n        emb = jr.normal(keys[1], (max_phonemes, embed_dim))\n        # \u65f6\u957f\uff1a\u5143\u97f3\uff08\u5076\u6570\u7d22\u5f15\uff09\u8f83\u957f\uff0c\u8f85\u97f3\u8f83\u77ed\n        base_dur = jnp.where(jnp.arange(max_phonemes) % 2 == 0, 8.0, 4.0)\n        noise = jr.normal(jr.fold_in(keys[2], i), (max_phonemes,)) * 1.5\n        dur = jnp.clip(base_dur + noise, 1.0, 20.0).astype(jnp.float32)\n        mask = (jnp.arange(max_phonemes) &lt; L).astype(jnp.float32)\n\n        all_embeddings.append(emb)\n        all_durations.append(dur * mask)\n        all_masks.append(mask)\n\n    return (jnp.stack(all_embeddings), jnp.stack(all_durations),\n            jnp.stack(all_masks))\n\nkey = jr.PRNGKey(42)\nembeddings, durations, masks = generate_synthetic_data(key)\n\n# \u65f6\u957f\u9884\u6d4b\u5668\uff1a2 \u5c42\u4e00\u7ef4\u5377\u79ef + \u7ebf\u6027\u6295\u5f71\ndef init_duration_predictor(key, embed_dim=64, hidden_dim=128, kernel_size=3):\n    \"\"\"\u521d\u59cb\u5316\u65f6\u957f\u9884\u6d4b\u5668\u6743\u91cd\u3002\"\"\"\n    keys = jr.split(key, 4)\n    scale1 = jnp.sqrt(2.0 / (embed_dim * kernel_size))\n    scale2 = jnp.sqrt(2.0 / (hidden_dim * kernel_size))\n    params = {\n        'conv1_w': jr.normal(keys[0], (kernel_size, embed_dim, hidden_dim)) * scale1,\n        'conv1_b': jnp.zeros(hidden_dim),\n        'conv2_w': jr.normal(keys[1], (kernel_size, hidden_dim, hidden_dim)) * scale2,\n        'conv2_b': jnp.zeros(hidden_dim),\n        'linear_w': jr.normal(keys[2], (hidden_dim, 1)) * jnp.sqrt(2.0 / hidden_dim),\n        'linear_b': jnp.zeros(1),\n    }\n    return params\n\ndef duration_predictor(params, x):\n    \"\"\"\u4ece\u97f3\u7d20\u5d4c\u5165\u9884\u6d4b\u5bf9\u6570\u65f6\u957f\u3002x: (batch, seq, embed)\u3002\"\"\"\n    # \u5377\u79ef\u5c42 1 \u52a0 ReLU\n    h = jax.lax.conv_general_dilated(\n        x.transpose(0, 2, 1),  # (batch, embed, seq)\n        params['conv1_w'].transpose(2, 1, 0),  # (out, in, kernel)\n        window_strides=(1,), padding='SAME'\n    ).transpose(0, 2, 1) + params['conv1_b']  # \u56de\u5230 (batch, seq, hidden)\n    h = jax.nn.relu(h)\n\n    # \u5377\u79ef\u5c42 2 \u52a0 ReLU\n    h = jax.lax.conv_general_dilated(\n        h.transpose(0, 2, 1),\n        params['conv2_w'].transpose(2, 1, 0),\n        window_strides=(1,), padding='SAME'\n    ).transpose(0, 2, 1) + params['conv2_b']\n    h = jax.nn.relu(h)\n\n    # \u7ebf\u6027\u6295\u5f71\u5230\u6807\u91cf\n    log_dur = (h @ params['linear_w'] + params['linear_b']).squeeze(-1)\n    return log_dur\n\n# \u635f\u5931\uff1a\u5bf9\u6570\u65f6\u957f\u7684 MSE\uff08FastSpeech \u4e2d\u7684\u6807\u51c6\u505a\u6cd5\uff09\ndef loss_fn(params, embeddings, durations, masks):\n    log_dur_pred = duration_predictor(params, embeddings)\n    log_dur_true = jnp.log(jnp.clip(durations, 1.0, None))\n    sq_err = (log_dur_pred - log_dur_true) ** 2 * masks\n    return jnp.sum(sq_err) / jnp.sum(masks)\n\ngrad_fn = jax.jit(jax.value_and_grad(loss_fn))\n\n# \u8bad\u7ec3\u5faa\u73af\nparams = init_duration_predictor(jr.PRNGKey(0))\nlr = 1e-3\nlosses = []\n\nfor epoch in range(300):\n    loss_val, grads = grad_fn(params, embeddings, durations, masks)\n    params = jax.tree.map(lambda p, g: p - lr * g, params, grads)\n    losses.append(float(loss_val))\n\n# \u5728\u4e00\u4e2a\u6837\u672c\u4e0a\u8bc4\u4f30\nlog_dur_pred = duration_predictor(params, embeddings[:1])\ndur_pred = jnp.exp(log_dur_pred[0])\ndur_true = durations[0]\nmask = masks[0]\nvalid_len = int(jnp.sum(mask))\n\nfig, axes = plt.subplots(1, 2, figsize=(14, 5))\n\naxes[0].plot(losses, color='#3498db', linewidth=1.5)\naxes[0].set_xlabel('\u8f6e\u6b21')\naxes[0].set_ylabel('MSE \u635f\u5931\uff08\u5bf9\u6570\u65f6\u957f\uff09')\naxes[0].set_title('\u65f6\u957f\u9884\u6d4b\u5668\u8bad\u7ec3')\naxes[0].set_yscale('log')\n\nx_pos = jnp.arange(valid_len)\nwidth = 0.35\naxes[1].bar(x_pos - width/2, dur_true[:valid_len], width, color='#27ae60',\n            label='\u771f\u5b9e\u503c', alpha=0.8)\naxes[1].bar(x_pos + width/2, dur_pred[:valid_len], width, color='#e74c3c',\n            label='\u9884\u6d4b\u503c', alpha=0.8)\naxes[1].set_xlabel('\u97f3\u7d20\u7d22\u5f15')\naxes[1].set_ylabel('\u65f6\u957f\uff08\u5e27\uff09')\naxes[1].set_title('\u65f6\u957f\u9884\u6d4b\u4e0e\u771f\u5b9e\u503c\u5bf9\u6bd4')\naxes[1].legend()\n\nplt.tight_layout()\nplt.show()\n</code></pre> <ul> <li>\u4efb\u52a1 3\uff1a\u4f7f\u7528\u4e0a\u91c7\u6837\u5377\u79ef\u7684\u7b80\u5355\u795e\u7ecf\u58f0\u7801\u5668\u3002 \u6784\u5efa\u4e00\u4e2a\u6700\u5c0f\u5316\u7684 HiFi-GAN \u98ce\u683c\u751f\u6210\u5668\uff0c\u4f7f\u7528\u8f6c\u7f6e\u5377\u79ef\u548c\u6b8b\u5dee\u5757\u5c06\u6885\u5c14\u8bed\u8c31\u56fe\u4e0a\u91c7\u6837\u4e3a\u6ce2\u5f62\u3002</li> </ul> <pre><code>import jax\nimport jax.numpy as jnp\nimport jax.random as jr\nimport matplotlib.pyplot as plt\n\ndef init_residual_block(key, channels, kernel_size, dilation):\n    \"\"\"\u521d\u59cb\u5316\u6269\u5f20\u6b8b\u5dee\u5377\u79ef\u5757\u3002\"\"\"\n    k1, k2 = jr.split(key)\n    scale = jnp.sqrt(2.0 / (channels * kernel_size))\n    return {\n        'conv1_w': jr.normal(k1, (kernel_size, channels, channels)) * scale,\n        'conv1_b': jnp.zeros(channels),\n        'conv2_w': jr.normal(k2, (kernel_size, channels, channels)) * scale,\n        'conv2_b': jnp.zeros(channels),\n        'dilation': dilation\n    }\n\ndef residual_block(params, x):\n    \"\"\"x: (batch, time, channels)\u3002\u5e26 LeakyReLU \u7684\u6269\u5f20\u5377\u79ef\u6b8b\u5dee\u5757\u3002\"\"\"\n    h = jax.nn.leaky_relu(x, negative_slope=0.1)\n    # \u7b80\u5316\uff1a\u4f7f\u7528\u6807\u51c6\u5377\u79ef\uff08\u6269\u5f20\u5728\u6982\u5ff5\u4e0a\u5904\u7406\uff09\n    h = jax.lax.conv_general_dilated(\n        h.transpose(0, 2, 1),\n        params['conv1_w'].transpose(2, 1, 0),\n        window_strides=(1,),\n        padding='SAME',\n        rhs_dilation=(params['dilation'],)\n    ).transpose(0, 2, 1) + params['conv1_b']\n    h = jax.nn.leaky_relu(h, negative_slope=0.1)\n    h = jax.lax.conv_general_dilated(\n        h.transpose(0, 2, 1),\n        params['conv2_w'].transpose(2, 1, 0),\n        window_strides=(1,),\n        padding='SAME'\n    ).transpose(0, 2, 1) + params['conv2_b']\n    return x + h\n\ndef init_generator(key, n_mels=80, upsample_rates=(8, 8, 4),\n                   channels=128):\n    \"\"\"\u521d\u59cb\u5316\u6700\u5c0f\u5316\u7684 HiFi-GAN \u98ce\u683c\u751f\u6210\u5668\u3002\"\"\"\n    keys = jr.split(key, 10)\n    params = {}\n\n    # \u8f93\u5165\u6295\u5f71\uff1a\u6885\u5c14\u9891\u5e26 -&gt; \u901a\u9053\n    params['input_w'] = jr.normal(keys[0], (7, n_mels, channels)) * 0.02\n    params['input_b'] = jnp.zeros(channels)\n\n    # \u4e0a\u91c7\u6837\u5757\uff08\u8f6c\u7f6e\u5377\u79ef\uff09\n    in_ch = channels\n    for i, rate in enumerate(upsample_rates):\n        k_size = rate * 2\n        scale = jnp.sqrt(2.0 / (in_ch * k_size))\n        out_ch = in_ch // 2\n        params[f'up{i}_w'] = jr.normal(keys[i+1], (k_size, in_ch, out_ch)) * scale\n        params[f'up{i}_b'] = jnp.zeros(out_ch)\n        # \u6bcf\u4e2a\u5c3a\u5ea6\u4e0b\u7684\u6b8b\u5dee\u5757\n        params[f'res{i}_0'] = init_residual_block(jr.fold_in(keys[i+4], 0),\n                                                    out_ch, 3, 1)\n        params[f'res{i}_1'] = init_residual_block(jr.fold_in(keys[i+4], 1),\n                                                    out_ch, 3, 3)\n        in_ch = out_ch\n\n    # \u8f93\u51fa\u6295\u5f71\u5230\u5355\u58f0\u9053\u6ce2\u5f62\n    params['output_w'] = jr.normal(keys[8], (7, in_ch, 1)) * 0.02\n    params['output_b'] = jnp.zeros(1)\n    params['upsample_rates'] = upsample_rates\n\n    return params\n\ndef generator_forward(params, mel):\n    \"\"\"mel: (batch, time, n_mels) -&gt; waveform: (batch, time * prod(rates), 1)\u3002\"\"\"\n    # \u8f93\u5165\u6295\u5f71\n    h = jax.lax.conv_general_dilated(\n        mel.transpose(0, 2, 1),\n        params['input_w'].transpose(2, 1, 0),\n        window_strides=(1,), padding='SAME'\n    ).transpose(0, 2, 1) + params['input_b']\n\n    for i, rate in enumerate(params['upsample_rates']):\n        h = jax.nn.leaky_relu(h, negative_slope=0.1)\n        # \u901a\u8fc7\u8f6c\u7f6e\u5377\u79ef\u4e0a\u91c7\u6837\n        k_size = rate * 2\n        h = jax.lax.conv_transpose(\n            h.transpose(0, 2, 1),\n            params[f'up{i}_w'].transpose(2, 1, 0),\n            strides=(rate,),\n            padding='SAME'\n        ).transpose(0, 2, 1) + params[f'up{i}_b']\n        # \u6b8b\u5dee\u5757\n        h = residual_block(params[f'res{i}_0'], h)\n        h = residual_block(params[f'res{i}_1'], h)\n\n    h = jax.nn.leaky_relu(h, negative_slope=0.1)\n    out = jax.lax.conv_general_dilated(\n        h.transpose(0, 2, 1),\n        params['output_w'].transpose(2, 1, 0),\n        window_strides=(1,), padding='SAME'\n    ).transpose(0, 2, 1) + params['output_b']\n\n    return jnp.tanh(out)\n\n# \u521b\u5efa\u4e00\u4e2a\u5408\u6210\u6885\u5c14\u8bed\u8c31\u56fe\uff08\u6a21\u62df\u5143\u97f3\uff09\nn_mels = 80\nn_frames = 50\nmel = jnp.zeros((1, n_frames, n_mels))\n# \u5728\u4f4e\u9891\u6885\u5c14\u9891\u5e26\u4e2d\u6dfb\u52a0\u80fd\u91cf\uff08\u6a21\u62df\u5171\u632f\u5cf0\uff09\nmel = mel.at[:, :, 5:15].set(1.0)\nmel = mel.at[:, :, 20:25].set(0.6)\n\n# \u521d\u59cb\u5316\u5e76\u8fd0\u884c\u751f\u6210\u5668\nkey = jr.PRNGKey(42)\nparams = init_generator(key, n_mels=n_mels, upsample_rates=(8, 8, 4),\n                         channels=128)\nwaveform = generator_forward(params, mel)\n\nprint(f\"\u8f93\u5165\u6885\u5c14\u5f62\u72b6\uff1a{mel.shape}\")\nprint(f\"\u8f93\u51fa\u6ce2\u5f62\u5f62\u72b6\uff1a{waveform.shape}\")\nprint(f\"\u4e0a\u91c7\u6837\u56e0\u5b50\uff1a{8 * 8 * 4} = {8*8*4}x\")\n\nfig, axes = plt.subplots(2, 1, figsize=(12, 6))\n\naxes[0].imshow(mel[0].T, aspect='auto', origin='lower', cmap='magma')\naxes[0].set_title('\u8f93\u5165\u6885\u5c14\u8bed\u8c31\u56fe')\naxes[0].set_ylabel('\u6885\u5c14\u9891\u5e26')\naxes[0].set_xlabel('\u5e27')\n\nwaveform_np = waveform[0, :, 0]\naxes[1].plot(waveform_np[:2000], color='#9b59b6', linewidth=0.5)\naxes[1].set_title('\u751f\u6210\u5668\u8f93\u51fa\u6ce2\u5f62\uff08\u672a\u7ecf\u8bad\u7ec3 - \u968f\u673a\u566a\u58f0\uff09')\naxes[1].set_ylabel('\u632f\u5e45')\naxes[1].set_xlabel('\u6837\u672c')\n\nplt.tight_layout()\nplt.show()\nprint(\"\u6ce8\u610f\uff1a\u8f93\u51fa\u662f\u566a\u58f0\uff0c\u56e0\u4e3a\u751f\u6210\u5668\u672a\u7ecf\u8bad\u7ec3\u3002\")\nprint(\"\u5728\u5b9e\u8df5\u4e2d\uff0c\u5bf9\u6297\u635f\u5931 + \u6885\u5c14\u635f\u5931\u8bad\u7ec3\u4f1a\u5c06\u5176\u5851\u9020\u6210\u8bed\u97f3\u3002\")\n</code></pre> <ul> <li>\u4efb\u52a1 4\uff1a\u4f7f\u7528\u7b80\u5355 RNN \u7684\u8bed\u97f3\u6d3b\u52a8\u68c0\u6d4b\u3002 \u5728\u5408\u6210\u97f3\u9891\u7279\u5f81\u4e0a\u8bad\u7ec3\u4e00\u4e2a\u57fa\u4e8e\u5c0f\u578b GRU \u7684 VAD \u6a21\u578b\uff0c\u5bf9\u5e27\u8fdb\u884c\u8bed\u97f3\u6216\u9759\u97f3\u5206\u7c7b\u3002</li> </ul> <pre><code>import jax\nimport jax.numpy as jnp\nimport jax.random as jr\nimport matplotlib.pyplot as plt\n\n# \u751f\u6210\u5408\u6210\u5bf9\u6570\u6885\u5c14\u80fd\u91cf\u7279\u5f81\u53ca\u8bed\u97f3/\u9759\u97f3\u6807\u7b7e\ndef generate_vad_data(key, n_sequences=100, n_frames=200, n_features=40):\n    \"\"\"\u6a21\u62df\u5bf9\u6570\u6885\u5c14\u7279\u5f81\uff1a\u8bed\u97f3\u533a\u57df\u80fd\u91cf\u66f4\u9ad8\u4e14\u5177\u6709\u7ed3\u6784\u3002\"\"\"\n    keys = jr.split(key, 5)\n    all_features = []\n    all_labels = []\n\n    for i in range(n_sequences):\n        k = jr.fold_in(keys[0], i)\n        k1, k2, k3 = jr.split(k, 3)\n\n        # \u968f\u673a\u8bed\u97f3/\u9759\u97f3\u6a21\u5f0f\n        label = jnp.zeros(n_frames)\n        n_segments = jr.randint(k1, (), 2, 6)\n        for seg in range(int(n_segments)):\n            start = jr.randint(jr.fold_in(k2, seg), (), 0, n_frames - 20)\n            length = jr.randint(jr.fold_in(k3, seg), (), 10, 50)\n            end = jnp.minimum(start + length, n_frames)\n            label = label.at[int(start):int(end)].set(1.0)\n\n        # \u7279\u5f81\uff1a\u8bed\u97f3\u5e27\u5177\u6709\u66f4\u9ad8\u80fd\u91cf + \u9891\u8c31\u7ed3\u6784\n        noise = jr.normal(jr.fold_in(keys[1], i), (n_frames, n_features)) * 0.3\n        speech_pattern = jnp.outer(label, jnp.exp(-jnp.arange(n_features) / 15.0))\n        features = speech_pattern * 2.0 + noise + 0.1\n\n        all_features.append(features)\n        all_labels.append(label)\n\n    return jnp.stack(all_features), jnp.stack(all_labels)\n\nkey = jr.PRNGKey(123)\nfeatures, labels = generate_vad_data(key)\ntrain_features, train_labels = features[:80], labels[:80]\ntest_features, test_labels = features[80:], labels[80:]\n\n# \u57fa\u4e8e GRU \u7684\u7b80\u5355 VAD \u6a21\u578b\ndef init_vad_model(key, input_dim=40, hidden_dim=64):\n    keys = jr.split(key, 6)\n    scale_ih = jnp.sqrt(2.0 / input_dim)\n    scale_hh = jnp.sqrt(2.0 / hidden_dim)\n    return {\n        'W_z': jr.normal(keys[0], (input_dim, hidden_dim)) * scale_ih,\n        'U_z': jr.normal(keys[1], (hidden_dim, hidden_dim)) * scale_hh,\n        'b_z': jnp.zeros(hidden_dim),\n        'W_r': jr.normal(keys[2], (input_dim, hidden_dim)) * scale_ih,\n        'U_r': jr.normal(keys[3], (hidden_dim, hidden_dim)) * scale_hh,\n        'b_r': jnp.zeros(hidden_dim),\n        'W_h': jr.normal(keys[4], (input_dim, hidden_dim)) * scale_ih,\n        'U_h': jr.normal(keys[5], (hidden_dim, hidden_dim)) * scale_hh,\n        'b_h': jnp.zeros(hidden_dim),\n        'W_out': jr.normal(jr.fold_in(keys[0], 99), (hidden_dim, 1)) * 0.1,\n        'b_out': jnp.zeros(1),\n    }\n\ndef gru_step(params, h, x):\n    \"\"\"\u5355\u6b65 GRU\u3002\"\"\"\n    z = jax.nn.sigmoid(x @ params['W_z'] + h @ params['U_z'] + params['b_z'])\n    r = jax.nn.sigmoid(x @ params['W_r'] + h @ params['U_r'] + params['b_r'])\n    h_tilde = jnp.tanh(x @ params['W_h'] + (r * h) @ params['U_h'] + params['b_h'])\n    h_new = (1 - z) * h + z * h_tilde\n    return h_new\n\ndef vad_forward(params, x):\n    \"\"\"x: (batch, time, features) -&gt; logits: (batch, time)\u3002\"\"\"\n    batch_size, n_frames, _ = x.shape\n    hidden_dim = params['W_z'].shape[1]\n    h = jnp.zeros((batch_size, hidden_dim))\n\n    outputs = []\n    for t in range(n_frames):\n        h = gru_step(params, h, x[:, t, :])\n        logit = (h @ params['W_out'] + params['b_out']).squeeze(-1)\n        outputs.append(logit)\n\n    return jnp.stack(outputs, axis=1)\n\ndef bce_loss(params, features, labels):\n    \"\"\"VAD \u7684\u4e8c\u5143\u4ea4\u53c9\u71b5\u635f\u5931\u3002\"\"\"\n    logits = vad_forward(params, features)\n    probs = jax.nn.sigmoid(logits)\n    probs = jnp.clip(probs, 1e-7, 1 - 1e-7)\n    loss = -(labels * jnp.log(probs) + (1 - labels) * jnp.log(1 - probs))\n    return jnp.mean(loss)\n\ngrad_fn = jax.jit(jax.value_and_grad(bce_loss))\n\n# \u8bad\u7ec3\nparams = init_vad_model(jr.PRNGKey(0))\nlr = 5e-3\nlosses = []\n\nfor epoch in range(200):\n    loss_val, grads = grad_fn(params, train_features, train_labels)\n    params = jax.tree.map(lambda p, g: p - lr * g, params, grads)\n    losses.append(float(loss_val))\n    if epoch % 50 == 0:\n        print(f\"\u8f6e\u6b21 {epoch}\uff1a\u635f\u5931 = {loss_val:.4f}\")\n\n# \u5728\u6d4b\u8bd5\u96c6\u4e0a\u8bc4\u4f30\ntest_logits = vad_forward(params, test_features)\ntest_preds = (jax.nn.sigmoid(test_logits) &gt; 0.5).astype(jnp.float32)\naccuracy = jnp.mean(test_preds == test_labels)\nprint(f\"\\n\u6d4b\u8bd5\u51c6\u786e\u7387\uff1a{accuracy:.4f}\")\n\n# \u53ef\u89c6\u5316\u4e00\u4e2a\u6d4b\u8bd5\u793a\u4f8b\nidx = 0\nfig, axes = plt.subplots(3, 1, figsize=(14, 7))\n\naxes[0].imshow(test_features[idx].T, aspect='auto', origin='lower', cmap='magma')\naxes[0].set_title('\u5bf9\u6570\u6885\u5c14\u80fd\u91cf\u7279\u5f81')\naxes[0].set_ylabel('\u6885\u5c14\u9891\u5e26')\n\naxes[1].fill_between(range(200), test_labels[idx], alpha=0.4, color='#27ae60',\n                     label='\u771f\u5b9e\u503c')\naxes[1].plot(jax.nn.sigmoid(test_logits[idx]), color='#e74c3c',\n             linewidth=1.5, label='\u9884\u6d4b\u6982\u7387')\naxes[1].axhline(0.5, color='gray', linestyle='--', linewidth=0.8)\naxes[1].set_ylabel('\u8bed\u97f3\u6982\u7387')\naxes[1].legend()\naxes[1].set_title('VAD \u9884\u6d4b')\n\naxes[2].fill_between(range(200), test_labels[idx], alpha=0.4, color='#27ae60',\n                     label='\u771f\u5b9e\u503c')\naxes[2].fill_between(range(200), test_preds[idx], alpha=0.4, color='#f39c12',\n                     label='\u9884\u6d4b\uff08\u9608\u503c=0.5\uff09')\naxes[2].set_ylabel('\u8bed\u97f3 / \u9759\u97f3')\naxes[2].set_xlabel('\u5e27')\naxes[2].legend()\naxes[2].set_title('VAD \u4e8c\u503c\u51b3\u7b56')\n\nplt.tight_layout()\nplt.show()\n</code></pre>"},{"location":"chapter%2009%3A%20audio%20and%20speech/04.%20speaker%20and%20audio%20analysis/","title":"\u8bf4\u8bdd\u4eba\u4e0e\u97f3\u9891\u5206\u6790","text":"<p>\u8bf4\u8bdd\u4eba\u4e0e\u97f3\u9891\u5206\u6790\u8bc6\u522b\u8c01\u5728\u8bf4\u8bdd\u3001\u4f55\u65f6\u8bf4\u8bdd\u4ee5\u53ca\u5b58\u5728\u54ea\u4e9b\u975e\u8bed\u8a00\u58f0\u97f3\u3002\u672c\u6587\u6db5\u76d6\u8bf4\u8bdd\u4eba\u786e\u8ba4\u4e0e\u8bc6\u522b\u3001i\u5411\u91cf\u3001d\u5411\u91cf\u3001x\u5411\u91cf\u3001\u8bf4\u8bdd\u4eba\u65e5\u5fd7\u3001\u97f3\u9891\u4e8b\u4ef6\u5206\u7c7b\u3001\u97f3\u4e50\u4fe1\u606f\u68c0\u7d22\u4ee5\u53ca\u8bed\u97f3\u60c5\u611f\u8bc6\u522b\u3002</p> <ul> <li> <p>\u5728\u6587\u4ef6 01 \u4e2d\uff0c\u6211\u4eec\u6784\u5efa\u4e86\u4fe1\u53f7\u5904\u7406\u57fa\u7840\uff1a\u8bed\u8c31\u56fe\u3001MFCC \u548c\u6885\u5c14\u6ee4\u6ce2\u5668\u7ec4\u3002\u5728\u6587\u4ef6 02 \u4e2d\uff0c\u6211\u4eec\u8bc6\u522b\u4e86\u6240\u8bf4\u7684\u5185\u5bb9\u3002\u73b0\u5728\u6211\u4eec\u8981\u95ee\uff1a\u662f\u8c01\u8bf4\u7684\u3001\u4f55\u65f6\u8bf4\u7684\u3001\u4ee5\u53ca\u97f3\u9891\u4e2d\u8fd8\u5728\u53d1\u751f\u4ec0\u4e48\u3002\u8bf4\u8bdd\u4eba\u8bc6\u522b\u3001\u8bf4\u8bdd\u4eba\u65e5\u5fd7\u3001\u97f3\u9891\u5206\u7c7b\u548c\u97f3\u4e50\u5206\u6790\u90fd\u5171\u4eab\u4e00\u6761\u4e3b\u7ebf\uff1a\u5b66\u4e60\u80fd\u591f\u4e3a\u5f53\u524d\u4efb\u52a1\u6355\u6349\u6b63\u786e\u4e0d\u53d8\u6027\u7684\u7d27\u51d1\u5d4c\u5165\uff0c\u8fd9\u4e0e\u7b2c 06 \u7ae0\u4e2d\u7684\u5d4c\u5165\u601d\u60f3\u4e00\u8109\u76f8\u627f\u3002</p> </li> <li> <p>\u53ef\u4ee5\u628a\u8bf4\u8bdd\u4eba\u8bc6\u522b\u60f3\u8c61\u6210\u5728\u7535\u8bdd\u4e2d\u8fa8\u8ba4\u670b\u53cb\u7684\u58f0\u97f3\u3002\u4f60\u4e0d\u9700\u8981\u7406\u89e3\u8bcd\u6c47\uff1b\u67d0\u79cd\u5173\u4e8e\u97f3\u8272\u3001\u8bed\u901f\u548c\u55d3\u97f3\u7279\u8d28\u7684\u4e1c\u897f\u5bf9\u8fd9\u4e2a\u4eba\u6765\u8bf4\u662f\u72ec\u4e00\u65e0\u4e8c\u7684\u3002\u8bf4\u8bdd\u4eba\u8bc6\u522b\u7cfb\u7edf\u5b66\u4f1a\u4ece\u539f\u59cb\u97f3\u9891\u4e2d\u63d0\u53d6\u8fd9\u79cd\"\u58f0\u7eb9\"\uff0c\u5ffd\u7565\u8bf4\u7684\u662f\u4ec0\u4e48\uff0c\u4e13\u6ce8\u4e8e\u600e\u4e48\u8bf4\u7684\u3002</p> </li> <li> <p>\u8bf4\u8bdd\u4eba\u8bc6\u522b\u662f\u4e24\u7c7b\u76f8\u5173\u4efb\u52a1\u7684\u603b\u79f0\uff1a</p> <ul> <li>\u8bf4\u8bdd\u4eba\u786e\u8ba4\uff08SV\uff09\uff1a\u7ed9\u5b9a\u4e00\u4e2a\u58f0\u660e\u7684\u8eab\u4efd\u548c\u4e00\u6bb5\u97f3\u9891\u7247\u6bb5\uff0c\u5224\u65ad\u8bf4\u8bdd\u4eba\u662f\u5426\u4e0e\u5176\u58f0\u79f0\u7684\u8eab\u4efd\u4e00\u81f4\u3002\u8fd9\u662f\u4e00\u4e2a\u4e8c\u5143\u51b3\u7b56\uff08\u63a5\u53d7\u6216\u62d2\u7edd\uff09\uff0c\u662f\u57fa\u4e8e\u8bed\u97f3\u7684\u8eab\u4efd\u9a8c\u8bc1\u6280\u672f\uff08\"\u563f Siri\uff0c\u8fd9\u662f\u6211\u7684\u58f0\u97f3\u5417\uff1f\"\uff09\u80cc\u540e\u7684\u6838\u5fc3\u539f\u7406\u3002</li> <li>\u8bf4\u8bdd\u4eba\u8bc6\u522b\uff08SI\uff09\uff1a\u7ed9\u5b9a\u4e00\u6bb5\u97f3\u9891\u7247\u6bb5\u548c\u4e00\u4e2a\u5df2\u77e5\u8bf4\u8bdd\u4eba\u5e93\uff0c\u5224\u65ad\u8be5\u7247\u6bb5\u7531\u54ea\u4e2a\u8bf4\u8bdd\u4eba\u4ea7\u751f\u3002\u8fd9\u662f\u4e00\u4e2a\u591a\u5206\u7c7b\u95ee\u9898\u3002</li> </ul> </li> </ul> <p></p> <ul> <li> <p>\u4e24\u79cd\u4efb\u52a1\u5171\u4eab\u76f8\u540c\u7684\u5e95\u5c42\u8868\u793a\uff1a\u4e00\u4e2a\u56fa\u5b9a\u7ef4\u5ea6\u7684\u8bf4\u8bdd\u4eba\u5d4c\u5165\uff0c\u5b83\u6355\u6349\u8bf4\u8bdd\u4eba\u7684\u8eab\u4efd\u7279\u5f81\u800c\u4e0e\u6240\u8bf4\u5185\u5bb9\u65e0\u5173\u3002\u533a\u522b\u4ec5\u5728\u4e8e\u51b3\u7b56\u9636\u6bb5\uff1a\u786e\u8ba4\u6bd4\u8f83\u4e24\u4e2a\u5d4c\u5165\uff0c\u8bc6\u522b\u5219\u5728\u5019\u9009\u5d4c\u5165\u4e2d\u627e\u5230\u6700\u8fd1\u90bb\u3002</p> </li> <li> <p>\u4f59\u5f26\u76f8\u4f3c\u5ea6\u662f\u6bd4\u8f83\u8bf4\u8bdd\u4eba\u5d4c\u5165\u7684\u6807\u51c6\u5ea6\u91cf\u3002\u7ed9\u5b9a\u6ce8\u518c\u5d4c\u5165 \\(e\\) \u548c\u6d4b\u8bd5\u5d4c\u5165 \\(t\\)\uff1a</p> </li> </ul> \\[s = \\frac{e \\cdot t}{\\|e\\| \\, \\|t\\|}\\] <ul> <li> <p>\u9608\u503c \\(\\theta\\) \u51b3\u5b9a\u63a5\u53d7/\u62d2\u7edd\u51b3\u7b56\uff1a\u82e5 \\(s &gt; \\theta\\)\uff0c\u5219\u63a5\u53d7\u3002\u9608\u503c\u5728\u9519\u8bef\u63a5\u53d7\u7387\uff08FAR\uff09\u548c\u9519\u8bef\u62d2\u7edd\u7387\uff08FRR\uff09\u4e4b\u95f4\u6743\u8861\u3002\u7b49\u9519\u8bef\u7387\uff08EER\uff09\uff0c\u5373 FAR = FRR \u65f6\u7684\u503c\uff0c\u662f\u6807\u51c6\u8bc4\u4f30\u6307\u6807\u3002EER \u8d8a\u4f4e\u8868\u793a\u6027\u80fd\u8d8a\u597d\u3002\u6700\u5148\u8fdb\u7684\u7cfb\u7edf\u5728\u6807\u51c6\u57fa\u51c6\uff08VoxCeleb\uff09\u4e0a\u53ef\u5b9e\u73b0\u4f4e\u4e8e 1% \u7684 EER\u3002</p> </li> <li> <p>i\u5411\u91cf\uff08Dehak \u7b49\u4eba\uff0c2010\uff09\u662f\u6df1\u5ea6\u5b66\u4e60\u4e4b\u524d\u4e3b\u5bfc\u6027\u7684\u8bf4\u8bdd\u4eba\u5d4c\u5165\u65b9\u6cd5\u3002\u5176\u601d\u60f3\u6e90\u4e8e\u56e0\u5b50\u5206\u6790\uff08\u7b2c 02 \u7ae0\u7684\u77e9\u9635\u5206\u89e3\u548c\u7b2c 04 \u7ae0\u7684\u964d\u7ef4\uff09\u3002\u4e00\u4e2a\u901a\u7528\u80cc\u666f\u6a21\u578b\uff08UBM\uff09\u2014\u2014\u57fa\u4e8e\u591a\u6837\u672c\u8bf4\u8bdd\u4eba\u8bad\u7ec3\u7684\u5927\u578b GMM\u2014\u2014\u5b9a\u4e49\u4e86\u4e00\u4e2a\u8d85\u5411\u91cf\u7a7a\u95f4\u3002\u6bcf\u6761\u8bed\u97f3\u7684 GMM \u8d85\u5411\u91cf\u88ab\u6295\u5f71\u5230\u4f4e\u7ef4\u7684\u5168\u53ef\u53d8\u6027\u7a7a\u95f4\uff1a</p> </li> </ul> \\[M = m + Tw\\] <ul> <li> <p>\u5176\u4e2d \\(M\\) \u662f\u8be5\u8bed\u97f3\u7684 GMM \u8d85\u5411\u91cf\uff0c\\(m\\) \u662f UBM \u5747\u503c\u8d85\u5411\u91cf\uff0c\\(T\\) \u662f\u5168\u53ef\u53d8\u6027\u77e9\u9635\uff08\u4ece\u6570\u636e\u4e2d\u5b66\u4e60\u5f97\u5230\uff09\uff0c\\(w\\) \u662f i \u5411\u91cf\uff0c\u4e00\u4e2a\u4f4e\u7ef4\uff08\u901a\u5e38\u4e3a 400-600 \u7ef4\uff09\u8868\u793a\uff0c\u540c\u65f6\u6355\u6349\u8bf4\u8bdd\u4eba\u53d8\u5f02\u548c\u4fe1\u9053\u53d8\u5f02\u3002</p> </li> <li> <p>\u4e3a\u4e86\u4ece i \u5411\u91cf\u4e2d\u53bb\u9664\u4fe1\u9053\u53d8\u5f02\uff0c\u6982\u7387\u7ebf\u6027\u5224\u522b\u5206\u6790\uff08PLDA\uff09\u5c06 i \u5411\u91cf\u5efa\u6a21\u4e3a\u8bf4\u8bdd\u4eba\u7279\u5b9a\u6f5c\u53d8\u91cf\u548c\u4fe1\u9053\u7279\u5b9a\u6f5c\u53d8\u91cf\u4e4b\u548c\u3002PLDA \u4e3a\u786e\u8ba4\u4efb\u52a1\u63d0\u4f9b\u4e86\u4e00\u4e2a\u6709\u539f\u5219\u7684\u5bf9\u6570\u4f3c\u7136\u6bd4\u5206\u6570\uff1a</p> </li> </ul> \\[\\text{score}(w_1, w_2) = \\log \\frac{P(w_1, w_2 \\mid \\text{\u540c\u4e00\u8bf4\u8bdd\u4eba})}{P(w_1 \\mid \\text{\u8bf4\u8bdd\u4eba}_1) \\, P(w_2 \\mid \\text{\u8bf4\u8bdd\u4eba}_2)}\\] <ul> <li> <p>d\u5411\u91cf\uff08Variani \u7b49\u4eba\uff0c2014\uff09\u662f\u7b2c\u4e00\u4e2a\u795e\u7ecf\u8bf4\u8bdd\u4eba\u5d4c\u5165\u3002\u4e00\u4e2a\u4e3a\u8bf4\u8bdd\u4eba\u5206\u7c7b\u8bad\u7ec3\u7684 DNN \u5904\u7406\u5e27\u7ea7\u7279\u5f81\uff0c\u901a\u8fc7\u5bf9\u6574\u6761\u8bed\u97f3\u4e2d\u6700\u540e\u4e00\u5c42\u9690\u85cf\u5c42\u6fc0\u6d3b\u503c\u6c42\u5e73\u5747\uff0c\u63d0\u53d6\u51fa\u56fa\u5b9a\u7ef4\u5ea6\u7684\u8868\u793a\u3002\u867d\u7136\u7b80\u5355\u4f46\u6709\u6548\uff0cd\u5411\u91cf\u8bc1\u660e\u4e86\u795e\u7ecf\u7f51\u7edc\u53ef\u4ee5\u5728\u6ca1\u6709 i \u5411\u91cf\u590d\u6742\u7edf\u8ba1\u673a\u5236\u7684\u60c5\u51b5\u4e0b\u5b66\u4e60\u5230\u8bf4\u8bdd\u4eba\u5224\u522b\u6027\u7279\u5f81\u3002</p> </li> <li> <p>x\u5411\u91cf\uff08Snyder \u7b49\u4eba\uff0c2018\uff09\u4f7f\u7528\u65f6\u5ef6\u795e\u7ecf\u7f51\u7edc\uff08TDNN\uff09\u67b6\u6784\u663e\u8457\u63a8\u8fdb\u4e86\u795e\u7ecf\u8bf4\u8bdd\u4eba\u5d4c\u5165\u3002TDNN \u662f\u5177\u6709\u7279\u5b9a\u4e0a\u4e0b\u6587\u7a97\u53e3\u7684 1D \u5377\u79ef\uff0c\u4e0e\u6587\u4ef6 03 \u4e2d WaveNet \u7684\u6269\u5f20\u5377\u79ef\u6709\u5173\uff0c\u4f46\u5e94\u7528\u4e8e\u5e27\u7ea7\u7279\u5f81\u800c\u975e\u539f\u59cb\u6ce2\u5f62\u6837\u672c\u3002</p> </li> </ul> <p></p> <ul> <li>x\u5411\u91cf\u67b6\u6784\u5305\u542b\u4e09\u4e2a\u9636\u6bb5\uff1a<ul> <li>\u5e27\u7ea7\u5c42\uff1a\u4e00\u7ec4 TDNN \u5c42\u5904\u7406 MFCC\uff08\u6765\u81ea\u6587\u4ef6 01\uff09\uff0c\u65f6\u95f4\u4e0a\u4e0b\u6587\u9010\u6b65\u6269\u5927\u3002\u6bcf\u4e00\u5c42\u90fd\u6709\u4e00\u4e2a\u56fa\u5b9a\u7684\u4e0a\u4e0b\u6587\u7a97\u53e3\uff08\u4f8b\u5982\u7b2c\u4e00\u5c42\u4e3a \\(\\{t-2, t-1, t, t+1, t+2\\}\\)\uff0c\u540e\u7eed\u5c42\u7a97\u53e3\u66f4\u5bbd\uff09\u3002</li> <li>\u7edf\u8ba1\u6c60\u5316\uff1a\u5728\u5e27\u7ea7\u5c42\u4e4b\u540e\uff0c\u8ba1\u7b97\u5e27\u7ea7\u8f93\u51fa\u5728\u6574\u4e2a\u8bed\u97f3\u4e0a\u7684\u5747\u503c\u548c\u6807\u51c6\u5dee\uff0c\u4ea7\u751f\u4e00\u4e2a\u4e0e\u8bed\u97f3\u65f6\u957f\u65e0\u5173\u7684\u56fa\u5b9a\u7ef4\u5ea6\u5411\u91cf\uff1a</li> </ul> </li> </ul> \\[ \\begin{aligned} \\mu &amp;= \\frac{1}{T} \\sum_{t=1}^{T} h_t \\\\ \\sigma &amp;= \\sqrt{\\frac{1}{T} \\sum_{t=1}^{T} (h_t - \\mu)^2} \\end{aligned} \\] <ul> <li> <p>\u5176\u4e2d \\(h_t\\) \u662f\u65f6\u95f4 \\(t\\) \u7684\u5e27\u7ea7\u8f93\u51fa\u3002\u62fc\u63a5 \\([\\mu; \\sigma]\\) \u5373\u4e3a\u6c60\u5316\u540e\u7684\u8868\u793a\u3002</p> <ul> <li>\u6bb5\u7ea7\u5c42\uff1a\u5168\u8fde\u63a5\u5c42\u5904\u7406\u6c60\u5316\u540e\u7684\u8868\u793a\u3002\u7b2c\u4e00\u4e2a\u6bb5\u7ea7\u5c42\u7684\u8f93\u51fa\uff08softmax \u4e4b\u524d\uff09\u5373\u4e3a x \u5411\u91cf\u5d4c\u5165\u3002</li> </ul> </li> <li> <p>x\u5411\u91cf\u4f7f\u7528\u8bf4\u8bdd\u4eba\u8eab\u4efd\u4e0a\u7684\u6807\u51c6\u4ea4\u53c9\u71b5\u635f\u5931\u8fdb\u884c\u8bad\u7ec3\u3002\u5c3d\u7ba1\u662f\u4e3a\u5206\u7c7b\u4efb\u52a1\u8bad\u7ec3\u7684\uff0c\u4f46\u5b66\u4e60\u5230\u7684\u4e2d\u95f4\u8868\u793a\uff08x\u5411\u91cf\uff09\u80fd\u5f88\u597d\u5730\u6cdb\u5316\u5230\u672a\u89c1\u8fc7\u7684\u8bf4\u8bdd\u4eba\uff0c\u56e0\u4e3a\u7f51\u7edc\u5b66\u4e60\u7684\u662f\u63d0\u53d6\u8bf4\u8bdd\u4eba\u5224\u522b\u6027\u7279\u5f81\uff0c\u800c\u975e\u8bb0\u5fc6\u7279\u5b9a\u8bf4\u8bdd\u4eba\u3002</p> </li> <li> <p>ECAPA-TDNN\uff08Desplanques \u7b49\u4eba\uff0c2020\uff09\u662f\u76ee\u524d\u6700\u5148\u8fdb\u7684\u57fa\u4e8e TDNN \u7684\u8bf4\u8bdd\u4eba\u8bc6\u522b\u67b6\u6784\u3002\u5b83\u5728 x \u5411\u91cf\u57fa\u7840\u4e0a\u5f15\u5165\u4e86\u4e09\u9879\u6539\u8fdb\uff1a</p> <ul> <li>\u538b\u7f29\u6fc0\u52b1\uff08SE\uff09\u6a21\u5757\uff1a\u901a\u9053\u6ce8\u610f\u529b\uff08\u6765\u81ea\u7b2c 08 \u7ae0\u7684 SENet\uff09\uff0c\u6839\u636e\u5168\u5c40\u4e0a\u4e0b\u6587\u91cd\u65b0\u52a0\u6743\u7279\u5f81\u901a\u9053\uff0c\u4f7f\u6a21\u578b\u80fd\u591f\u5f3a\u8c03\u4e0e\u8bf4\u8bdd\u4eba\u76f8\u5173\u7684\u901a\u9053\u3002</li> <li>Res2Net \u98ce\u683c\u7684\u591a\u5c3a\u5ea6\u7279\u5f81\uff1a\u5728\u6bcf\u4e2a TDNN \u6a21\u5757\u5185\uff0c\u901a\u9053\u88ab\u5206\u6210\u82e5\u5e72\u7ec4\uff0c\u4ee5\u5c42\u7ea7\u65b9\u5f0f\u5904\u7406\uff0c\u5728\u591a\u4e2a\u65f6\u95f4\u5206\u8fa8\u7387\u4e0a\u521b\u5efa\u7279\u5f81\uff08\u7c7b\u4f3c\u4e8e\u7b2c 08 \u7ae0\u7684\u591a\u5c3a\u5ea6\u7279\u5f81\u63d0\u53d6\uff09\u3002</li> <li>\u6ce8\u610f\u529b\u7edf\u8ba1\u6c60\u5316\uff1a\u4e0d\u518d\u4f7f\u7528\u7b49\u6743\u5e73\u5747\uff0c\u800c\u662f\u901a\u8fc7\u6ce8\u610f\u529b\u673a\u5236\u4e3a\u6bcf\u4e00\u5e27\u5bf9\u6c60\u5316\u7edf\u8ba1\u91cf\u7684\u8d21\u732e\u5206\u914d\u6743\u91cd\u3002\u5305\u542b\u66f4\u591a\u8bf4\u8bdd\u4eba\u5224\u522b\u6027\u5185\u5bb9\u7684\u5e27\uff08\u5982\u5143\u97f3\uff0c\u627f\u8f7d\u66f4\u591a\u8bf4\u8bdd\u4eba\u4fe1\u606f\uff09\u83b7\u5f97\u66f4\u9ad8\u7684\u6ce8\u610f\u529b\u6743\u91cd\uff1a</li> </ul> </li> </ul> \\[\\alpha_t = \\frac{\\exp(v^T f(h_t))}{\\sum_{\\tau} \\exp(v^T f(h_\\tau))}\\] <ul> <li> <p>\u5176\u4e2d \\(f\\) \u662f\u4e00\u4e2a\u5c0f\u578b\u795e\u7ecf\u7f51\u7edc\uff0c\\(v\\) \u662f\u4e00\u4e2a\u5b66\u4e60\u5230\u7684\u6ce8\u610f\u529b\u5411\u91cf\u3002\u6ce8\u610f\u529b\u52a0\u6743\u7684\u5747\u503c\u548c\u6807\u51c6\u5dee\u53d8\u4e3a \\(\\tilde{\\mu} = \\sum_t \\alpha_t h_t\\) \u548c \\(\\tilde{\\sigma} = \\sqrt{\\sum_t \\alpha_t (h_t - \\tilde{\\mu})^2}\\)\u3002</p> </li> <li> <p>ECAPA-TDNN \u901a\u5e38\u4f7f\u7528 AAM-Softmax\uff08\u9644\u52a0\u89d2\u5ea6\u95f4\u9694 Softmax\uff09\u8fdb\u884c\u8bad\u7ec3\uff0c\u5b83\u5728\u5206\u7c7b\u635f\u5931\u4e2d\u6dfb\u52a0\u4e86\u89d2\u5ea6\u95f4\u9694\u60e9\u7f5a\uff0c\u5c06\u540c\u4e00\u8bf4\u8bdd\u4eba\u7684\u5d4c\u5165\u63a8\u5f97\u66f4\u8fd1\uff0c\u4e0d\u540c\u8bf4\u8bdd\u4eba\u7684\u5d4c\u5165\u5728\u8d85\u7403\u9762\u4e0a\u63a8\u5f97\u66f4\u8fdc\uff1a</p> </li> </ul> \\[L = -\\log \\frac{e^{s \\cos(\\theta_{y_i} + m)}}{e^{s \\cos(\\theta_{y_i} + m)} + \\sum_{j \\neq y_i} e^{s \\cos \\theta_j}}\\] <ul> <li> <p>\u5176\u4e2d \\(\\theta_{y_i}\\) \u662f\u5d4c\u5165\u4e0e\u771f\u5b9e\u7c7b\u522b\u6743\u91cd\u5411\u91cf\u4e4b\u95f4\u7684\u5939\u89d2\uff0c\\(m\\) \u662f\u95f4\u9694\uff08\u901a\u5e38\u4e3a 0.2\uff09\uff0c\\(s\\) \u662f\u7f29\u653e\u56e0\u5b50\uff08\u901a\u5e38\u4e3a 30\uff09\u3002\u8be5\u635f\u5931\u51fd\u6570\u6765\u81ea\u4eba\u8138\u8bc6\u522b\uff08\u7b2c 08 \u7ae0\u7684 ArcFace\uff09\uff0c\u5728\u8bf4\u8bdd\u4eba\u786e\u8ba4\u4e2d\u975e\u5e38\u6709\u6548\u3002</p> </li> <li> <p>\u8bf4\u8bdd\u4eba\u65e5\u5fd7\u56de\u7b54\u4e86\u591a\u65b9\u5f55\u97f3\u4e2d\"\u8c01\u5728\u4ec0\u4e48\u65f6\u5019\u8bf4\u8bdd\"\u7684\u95ee\u9898\u3002\u53ef\u4ee5\u628a\u8fd9\u60f3\u8c61\u6210\u7ed9\u65f6\u95f4\u7ebf\u4e0a\u8272\uff1a\u6bcf\u79cd\u989c\u8272\u4ee3\u8868\u4e00\u4e2a\u4e0d\u540c\u7684\u8bf4\u8bdd\u4eba\uff0c\u7cfb\u7edf\u5fc5\u987b\u786e\u5b9a\u6bcf\u4e2a\u8bf4\u8bdd\u4eba\u4f55\u65f6\u6d3b\u8dc3\uff0c\u5305\u62ec\u91cd\u53e0\u8bed\u97f3\u7684\u60c5\u51b5\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u57fa\u4e8e\u805a\u7c7b\u7684\u8bf4\u8bdd\u4eba\u65e5\u5fd7\u662f\u4f20\u7edf\u7684\u6d41\u6c34\u7ebf\u65b9\u6cd5\uff1a</p> <ul> <li>\u5206\u5272\uff1a\u5c06\u97f3\u9891\u5212\u5206\u4e3a\u77ed\u6bb5\uff08\u901a\u5e38\u4e3a 1-2 \u79d2\uff09\uff0c\u4f7f\u7528\u6ed1\u52a8\u7a97\u53e3\u6216\u8bf4\u8bdd\u4eba\u53d8\u5316\u68c0\u6d4b\u3002</li> <li>\u5d4c\u5165\u63d0\u53d6\uff1a\u4e3a\u6bcf\u4e2a\u7247\u6bb5\u63d0\u53d6\u8bf4\u8bdd\u4eba\u5d4c\u5165\uff08x\u5411\u91cf\u3001ECAPA-TDNN\uff09\u3002</li> <li>\u805a\u7c7b\uff1a\u6309\u8bf4\u8bdd\u4eba\u5bf9\u7247\u6bb5\u8fdb\u884c\u5206\u7ec4\u3002\u51dd\u805a\u5c42\u6b21\u805a\u7c7b\uff08AHC\uff09\u662f\u6807\u51c6\u65b9\u6cd5\uff1a\u5f00\u59cb\u65f6\u6bcf\u4e2a\u7247\u6bb5\u81ea\u6210\u4e00\u7c7b\uff0c\u7136\u540e\u8fed\u4ee3\u5408\u5e76\u4e24\u4e2a\u6700\u76f8\u4f3c\u7684\u7c7b\uff0c\u76f4\u5230\u6ee1\u8db3\u505c\u6b62\u6761\u4ef6\uff08\u57fa\u4e8e\u8ddd\u79bb\u9608\u503c\u6216\u76ee\u6807\u8bf4\u8bdd\u4eba\u6570\uff09\u3002</li> <li>\u91cd\u5206\u5272\uff1a\u4f7f\u7528\u57fa\u4e8e\u7ef4\u7279\u6bd4\u7b97\u6cd5\u7684\u91cd\u5bf9\u9f50\u6765\u4f18\u5316\u8fb9\u754c\u3002</li> </ul> </li> <li> <p>\u8bf4\u8bdd\u4eba\u6570\u91cf\u901a\u5e38\u4e8b\u5148\u672a\u77e5\uff0c\u8fd9\u4f7f\u5f97\u8be5\u95ee\u9898\u6bd4\u6807\u51c6\u805a\u7c7b\u66f4\u56f0\u96be\u3002\u4f7f\u7528\u57fa\u4e8e\u7279\u5f81\u503c\u9608\u503c\u786e\u5b9a \\(k\\) \u7684\u8c31\u805a\u7c7b\u662f\u53e6\u4e00\u79cd\u5e38\u89c1\u65b9\u6cd5\u3002</p> </li> <li> <p>\u7aef\u5230\u7aef\u795e\u7ecf\u8bf4\u8bdd\u4eba\u65e5\u5fd7\uff08EEND\uff09\uff08Fujita \u7b49\u4eba\uff0c2019\uff09\u5c06\u8bf4\u8bdd\u4eba\u65e5\u5fd7\u6846\u67b6\u5316\u4e3a\u4e00\u4e2a\u591a\u6807\u7b7e\u5206\u7c7b\u95ee\u9898\u3002\u4e00\u4e2a\u795e\u7ecf\u7f51\u7edc\uff08\u901a\u5e38\u662f\u57fa\u4e8e\u81ea\u6ce8\u610f\u529b\u7684\u6a21\u578b\uff0c\u7b2c 07 \u7ae0\u7684 transformer\uff09\u5c06\u6574\u6bb5\u5f55\u97f3\u4f5c\u4e3a\u8f93\u5165\uff0c\u4e3a\u6bcf\u4e00\u5e27\u8f93\u51fa\u6bcf\u4e2a\u8bf4\u8bdd\u4eba\u7684\u4e8c\u5143\u6d3b\u52a8\u6807\u7b7e\u3002\u8fd9\u76f4\u63a5\u5904\u7406\u4e86\u91cd\u53e0\u8bed\u97f3\uff0c\u800c\u8fd9\u662f\u57fa\u4e8e\u805a\u7c7b\u65b9\u6cd5\u7684\u4e3b\u8981\u5f31\u70b9\u3002</p> </li> <li> <p>EEND \u5bf9 \\(S\\) \u4e2a\u8bf4\u8bdd\u4eba\u5728\u5e27 \\(t\\) \u7684\u8f93\u51fa\u4e3a\uff1a</p> </li> </ul> \\[\\hat{y}_{t,s} = \\sigma(f_s(h_t))\\] <ul> <li> <p>\u5176\u4e2d \\(h_t\\) \u662f\u5e27 \\(t\\) \u5904\u7684 transformer \u8f93\u51fa\uff0c\\(f_s\\) \u662f\u8bf4\u8bdd\u4eba \\(s\\) \u7684\u7ebf\u6027\u6295\u5f71\u3002\u8bad\u7ec3\u635f\u5931\u662f\u5728\u8bf4\u8bdd\u4eba\u548c\u5e27\u4e0a\u6c42\u548c\u5f97\u5230\u7684\u4e8c\u5143\u4ea4\u53c9\u71b5\u3002\u4e00\u4e2a\u5173\u952e\u6311\u6218\u662f\u8bf4\u8bdd\u4eba\u6570\u91cf\u5fc5\u987b\u56fa\u5b9a\uff0c\u6216\u8005\u4f7f\u7528\u53ef\u53d8\u8f93\u51fa\u67b6\u6784\uff08EEND-EDA \u4f7f\u7528\u5e26\u5438\u5f15\u5b50\u7684\u7f16\u7801\u5668-\u89e3\u7801\u5668\uff09\u6765\u5904\u7406\u3002</p> </li> <li> <p>\u7f6e\u6362\u4e0d\u53d8\u8bad\u7ec3\uff08PIT\uff09\u7528\u4e8e\u5904\u7406\u8bf4\u8bdd\u4eba\u65e5\u5fd7\u4e2d\u7684\u6807\u7b7e\u6b67\u4e49\u95ee\u9898\uff1a\u7531\u4e8e\u8bf4\u8bdd\u4eba\u6ca1\u6709\u56fa\u6709\u987a\u5e8f\uff0c\u9700\u8981\u5bf9\u6240\u6709\u53ef\u80fd\u7684\u8bf4\u8bdd\u4eba\u5230\u8f93\u51fa\u5206\u914d\u8ba1\u7b97\u635f\u5931\uff0c\u5e76\u53d6\u6700\u5c0f\u503c\uff08\u8fd9\u4e0e\u6587\u4ef6 05 \u4e2d\u6e90\u5206\u79bb\u4f7f\u7528\u7684 PIT \u76f8\u540c\uff09\u3002</p> </li> <li> <p>\u97f3\u9891\u5206\u7c7b\u4e3a\u6574\u6bb5\u97f3\u9891\u7247\u6bb5\u5206\u914d\u4e00\u4e2a\u6807\u7b7e\u3002\u4e0e\u8f6c\u5f55\u8bed\u97f3\u7684 ASR\uff08\u6587\u4ef6 02\uff09\u4e0d\u540c\uff0c\u97f3\u9891\u5206\u7c7b\u6db5\u76d6\u66f4\u5e7f\u7684\u8303\u56f4\uff1a\u73af\u5883\u58f0\u97f3\uff08\u8b66\u7b1b\u3001\u96e8\u58f0\u3001\u72d7\u5420\uff09\u3001\u97f3\u4e50\u6d41\u6d3e\uff08\u6447\u6eda\u3001\u7235\u58eb\u3001\u53e4\u5178\uff09\u4ee5\u53ca\u4e00\u822c\u97f3\u9891\u4e8b\u4ef6\u3002</p> </li> <li> <p>\u6807\u51c6\u65b9\u6cd5\u9075\u5faa\u7b2c 08 \u7ae0\u7684\u56fe\u50cf\u5206\u7c7b\u8303\u5f0f\uff1a\u5c06\u97f3\u9891\u8868\u793a\u4e3a\u8bed\u8c31\u56fe\uff08\u4e00\u4e2a\u4e8c\u7ef4\u65f6\u95f4-\u9891\u7387\u56fe\u50cf\uff09\uff0c\u7136\u540e\u5e94\u7528 CNN \u6216 transformer \u5206\u7c7b\u5668\u3002\u8fd9\u79cd\u8c31\u56fe-\u56fe\u50cf\u65b9\u6cd5\u5229\u7528\u4e86\u8ba1\u7b97\u673a\u89c6\u89c9\u51e0\u5341\u5e74\u6765\u7684\u8fdb\u5c55\u3002</p> </li> <li> <p>\u73af\u5883\u58f0\u97f3\u5206\u7c7b\uff08ESC\uff09\u4f7f\u7528 ESC-50\uff0850 \u7c7b\uff0c2000 \u4e2a\u7247\u6bb5\uff09\u548c UrbanSound8K \u7b49\u6570\u636e\u96c6\u3002\u5178\u578b\u67b6\u6784\u662f\u5e94\u7528\u4e8e\u5bf9\u6570\u6885\u5c14\u8bed\u8c31\u56fe\u7684 CNN\uff08\u7b2c 06 \u7ae0\uff09\u3002\u6570\u636e\u589e\u5f3a\u81f3\u5173\u91cd\u8981\uff1a\u65f6\u95f4\u62c9\u4f38\u3001\u97f3\u9ad8\u504f\u79fb\u3001\u6dfb\u52a0\u80cc\u666f\u566a\u58f0\u4ee5\u53ca SpecAugment\uff08\u6587\u4ef6 02 \u7684\u63a9\u7801\u65b9\u6cd5\u5e94\u7528\u4e8e\u8bed\u8c31\u56fe\uff09\u90fd\u80fd\u63d0\u5347\u6cdb\u5316\u80fd\u529b\u3002</p> </li> <li> <p>\u97f3\u9891\u4e8b\u4ef6\u68c0\u6d4b\uff08\u58f0\u97f3\u4e8b\u4ef6\u68c0\u6d4b\uff0cSED\uff09\u662f\u5206\u7c7b\u7684\u65f6\u95f4\u7ef4\u5ea6\u5bf9\u5e94\u4efb\u52a1\uff1a\u4e0d\u4ec5\u4ec5\u8981\u77e5\u9053\u5b58\u5728\u54ea\u4e9b\u4e8b\u4ef6\uff0c\u8fd8\u8981\u77e5\u9053\u5b83\u4eec\u4f55\u65f6\u5f00\u59cb\u548c\u7ed3\u675f\u3002AudioSet\uff08Gemmeke \u7b49\u4eba\uff0c2017\uff09\u662f\u5927\u89c4\u6a21\u57fa\u51c6\uff0c\u5305\u542b 527 \u4e2a\u4e8b\u4ef6\u7c7b\u522b\u548c\u8d85\u8fc7 200 \u4e07\u4e2a\u6765\u81ea YouTube \u7684 10 \u79d2\u7247\u6bb5\uff0c\u6bcf\u4e2a\u7247\u6bb5\u90fd\u6709\u5f31\u6807\u6ce8\uff08\u7247\u6bb5\u7ea7\u6807\u7b7e\uff0c\u800c\u975e\u5e27\u7ea7\uff09\u3002</p> </li> <li> <p>\u5f31\u76d1\u7763 SED \u5fc5\u987b\u4ece\u7247\u6bb5\u7ea7\u6807\u7b7e\u5b66\u4e60\u5e27\u7ea7\u9884\u6d4b\u3002\u6807\u51c6\u65b9\u6cd5\u4f7f\u7528 CNN \u4ea7\u751f\u5e27\u7ea7\u7c7b\u522b\u6982\u7387\uff0c\u7136\u540e\u901a\u8fc7\u6ce8\u610f\u529b\u6c60\u5316\u805a\u5408\u6210\u7247\u6bb5\u7ea7\u9884\u6d4b\uff1a</p> </li> </ul> \\[\\hat{Y}_c = \\sigma\\left(\\sum_t \\alpha_{t,c} \\cdot f_{t,c}\\right)\\] <ul> <li> <p>\u5176\u4e2d \\(f_{t,c}\\) \u662f\u7c7b\u522b \\(c\\) \u5728\u65f6\u95f4 \\(t\\) \u7684\u5e27\u7ea7 logit\uff0c\\(\\alpha_{t,c}\\) \u662f\u6ce8\u610f\u529b\u6743\u91cd\u3002\u7247\u6bb5\u7ea7\u9884\u6d4b \\(\\hat{Y}_c\\) \u6839\u636e\u7247\u6bb5\u7ea7\u6807\u7b7e\u8fdb\u884c\u8bad\u7ec3\u3002</p> </li> <li> <p>\u58f0\u5b66\u573a\u666f\u5206\u7c7b\uff08ASC\uff09\u5bf9\u6574\u4f53\u73af\u5883\u8fdb\u884c\u5206\u7c7b\uff1a\"\u673a\u573a\"\u3001\"\u516c\u56ed\"\u3001\"\u5730\u94c1\u7ad9\"\u3001\"\u529e\u516c\u5ba4\"\u3002\u8fd9\u662f\u4e00\u4e2a\u6574\u4f53\u6027\u4efb\u52a1\uff1a\u6a21\u578b\u5fc5\u987b\u6355\u6349\u4e00\u822c\u7684\u58f0\u5b66\u7eb9\u7406\u800c\u975e\u7279\u5b9a\u4e8b\u4ef6\u3002DCASE \u6311\u6218\u7cfb\u5217\u6bcf\u5e74\u5bf9 ASC \u8fdb\u884c\u57fa\u51c6\u6d4b\u8bd5\uff0c\u83b7\u5956\u7cfb\u7edf\u901a\u5e38\u4f7f\u7528\u591a\u5206\u8fa8\u7387\u8bed\u8c31\u56fe\u4e0a\u7684 CNN \u96c6\u6210\u3002</p> </li> <li> <p>\u97f3\u9891\u5d4c\u5165\u662f\u4ece\u5927\u89c4\u6a21\u97f3\u9891\u6570\u636e\u4e2d\u5b66\u4e60\u5230\u7684\u901a\u7528\u8868\u793a\uff0c\u7c7b\u4f3c\u4e8e\u53ef\u8fc1\u79fb\u5230\u4e0b\u6e38\u4efb\u52a1\u7684\u8bcd\u5d4c\u5165\uff08\u7b2c 07 \u7ae0\uff09\u6216\u56fe\u50cf\u7279\u5f81\uff08\u7b2c 08 \u7ae0\uff09\u3002</p> </li> <li> <p>VGGish\uff08Hershey \u7b49\u4eba\uff0c2017\uff09\u5c06 VGG \u56fe\u50cf\u5206\u7c7b\u7f51\u7edc\uff08\u7b2c 08 \u7ae0\uff09\u9002\u914d\u5230\u97f3\u9891\u9886\u57df\u3002\u5b83\u901a\u8fc7\u4e00\u4e2a\u5728 AudioSet \u4e0a\u9884\u8bad\u7ec3\u7684\u7c7b VGG CNN \u5904\u7406 0.96 \u79d2\u7684\u5bf9\u6570\u6885\u5c14\u8bed\u8c31\u56fe\u5757\uff0c\u6bcf\u5757\u4ea7\u751f\u4e00\u4e2a 128 \u7ef4\u5d4c\u5165\u3002VGGish \u5d4c\u5165\u53ef\u4f5c\u4e3a\u4e0b\u6e38\u4efb\u52a1\u7684\u901a\u7528\u97f3\u9891\u7279\u5f81\uff0c\u7c7b\u4f3c\u4e8e ImageNet \u9884\u8bad\u7ec3 CNN \u63d0\u4f9b\u89c6\u89c9\u7279\u5f81\u7684\u65b9\u5f0f\u3002</p> </li> <li> <p>PANNs\uff08\u9884\u8bad\u7ec3\u97f3\u9891\u795e\u7ecf\u7f51\u7edc\uff0cKong \u7b49\u4eba\uff0c2020\uff09\u662f\u4e00\u7cfb\u5217 CNN \u67b6\u6784\uff08CNN6\u3001CNN10\u3001CNN14\uff09\uff0c\u5728\u5b8c\u6574\u7684 AudioSet \u4e0a\u4e3a\u97f3\u9891\u6807\u8bb0\u4efb\u52a1\u8bad\u7ec3\u3002CNN14 \u4f7f\u7528\u6700\u5e7f\u6cdb\uff0c\u662f\u4e00\u4e2a 14 \u5c42 CNN\uff0c\u5c06\u5bf9\u6570\u6885\u5c14\u8bed\u8c31\u56fe\u4f5c\u4e3a\u8f93\u5165\uff0c\u4f7f\u7528 \\(3 \\times 3\\) \u5377\u79ef\u3002PANNs \u4ea7\u751f 2048 \u7ef4\u5d4c\u5165\uff0c\u5728\u591a\u79cd\u97f3\u9891\u4efb\u52a1\u4e0a\u5b9e\u73b0\u4e86\u6700\u5148\u8fdb\u7684\u8fc1\u79fb\u5b66\u4e60\u6027\u80fd\u3002</p> </li> <li> <p>\u97f3\u9891\u8bed\u8c31\u56fe Transformer\uff08AST\uff09\uff08Gong \u7b49\u4eba\uff0c2021\uff09\u5c06\u89c6\u89c9 Transformer\uff08ViT\uff0c\u7b2c 08 \u7ae0\uff09\u67b6\u6784\u76f4\u63a5\u5e94\u7528\u4e8e\u97f3\u9891\u8bed\u8c31\u56fe\u3002\u8bed\u8c31\u56fe\u88ab\u5206\u5272\u6210 \\(16 \\times 16\\) \u7684\u5757\uff08\u5c31\u50cf ViT \u5206\u5272\u56fe\u50cf\u4e00\u6837\uff09\uff0c\u6bcf\u4e2a\u5757\u88ab\u7ebf\u6027\u6295\u5f71\u4e3a\u4ee4\u724c\u5d4c\u5165\uff0c\u6dfb\u52a0\u4f4d\u7f6e\u5d4c\u5165\uff0c\u7136\u540e\u7531\u6807\u51c6 Transformer \u7f16\u7801\u5668\uff08\u7b2c 07 \u7ae0\uff09\u5904\u7406\u5e8f\u5217\u3002[CLS] \u4ee4\u724c\u7684\u8f93\u51fa\u7528\u4e8e\u5206\u7c7b\u3002</p> </li> </ul> <p></p> <ul> <li> <p>AST \u53d7\u76ca\u4e8e ImageNet \u9884\u8bad\u7ec3\uff1a\u7531\u4e8e\u8bed\u8c31\u56fe\u662f 2D \u56fe\u50cf\uff0cAST \u4ece ImageNet \u56fe\u50cf\u4e0a\u9884\u8bad\u7ec3\u7684 ViT \u521d\u59cb\u5316\uff0c\u7136\u540e\u5728\u97f3\u9891\u4e0a\u5fae\u8c03\u3002\u8fd9\u79cd\u8de8\u6a21\u6001\u8fc1\u79fb\u51fa\u5947\u5730\u6709\u6548\uff0c\u56e0\u4e3a\u4e24\u4e2a\u57df\u5171\u4eab\u4f4e\u7ea7\u7279\u5f81\uff08\u8fb9\u7f18\u3001\u7eb9\u7406\uff09\uff0c\u5e76\u4e14\u4f4d\u7f6e\u5d4c\u5165\u53ef\u4ee5\u63d2\u503c\u4ee5\u5904\u7406\u4e0d\u540c\u5927\u5c0f\u7684\u8bed\u8c31\u56fe\u3002</p> </li> <li> <p>HTS-AT\uff08Chen \u7b49\u4eba\uff0c2022\uff09\u4f7f\u7528\u5206\u5c42 Swin Transformer \u67b6\u6784\uff08\u7b2c 08 \u7ae0\u7684\u79fb\u4f4d\u7a97\u53e3\u6ce8\u610f\u529b\uff09\u6539\u8fdb\u4e86 AST\uff0c\u5728\u964d\u4f4e\u8ba1\u7b97\u6210\u672c\u7684\u540c\u65f6\u901a\u8fc7\u591a\u5c3a\u5ea6\u7279\u5f81\u63d0\u53d6\u63d0\u5347\u4e86\u6027\u80fd\u3002</p> </li> <li> <p>BEATs\uff08Chen \u7b49\u4eba\uff0c2023\uff09\u4f7f\u7528\u4e86\u4e00\u79cd\u97f3\u9891\u7279\u5b9a\u7684\u9884\u8bad\u7ec3\u7b56\u7565\uff1a\u4f7f\u7528\u79bb\u6563\u6807\u8bb0\u5668\u8fdb\u884c\u8fed\u4ee3\u63a9\u7801\u9884\u6d4b\uff08\u7c7b\u4f3c\u4e8e\u6587\u4ef6 02 \u4e2d wav2vec 2.0 \u7684\u65b9\u6cd5\uff0c\u4f46\u5e94\u7528\u4e8e\u901a\u7528\u97f3\u9891\uff09\u3002\u6807\u8bb0\u5668\u9010\u6b65\u7ec6\u5316\uff0c\u521b\u5efa\u8d8a\u6765\u8d8a\u5177\u6709\u8bed\u4e49\u610f\u4e49\u7684\u79bb\u6563\u97f3\u9891\u4ee4\u724c\u3002</p> </li> <li> <p>\u57fa\u4e8e\u5d4c\u5165\u7684\u8bf4\u8bdd\u4eba\u65e5\u5fd7\u7ed3\u5408\u4e86\u8bf4\u8bdd\u4eba\u5d4c\u5165\u4e0e\u65f6\u5e8f\u5efa\u6a21\u3002\u50cf Pyannote.audio \u8fd9\u6837\u7684\u73b0\u4ee3\u7cfb\u7edf\u4f7f\u7528\u4e09\u9636\u6bb5\u6d41\u6c34\u7ebf\uff1a(1) \u68c0\u6d4b\u8bf4\u8bdd\u4eba\u5207\u6362\u548c\u91cd\u53e0\u8bed\u97f3\u7684\u795e\u7ecf\u5206\u5272\u6a21\u578b\uff0c(2) \u5e94\u7528\u4e8e\u6bcf\u4e2a\u68c0\u6d4b\u5230\u7684\u7247\u6bb5\u7684\u5d4c\u5165\u63d0\u53d6\u9636\u6bb5\uff08ECAPA-TDNN\uff09\uff0c\u4ee5\u53ca (3) \u805a\u7c7b\u4ee5\u5728\u6574\u4e2a\u5f55\u97f3\u4e2d\u5206\u914d\u8bf4\u8bdd\u4eba\u8eab\u4efd\u3002</p> </li> <li> <p>\u97f3\u4e50\u4fe1\u606f\u68c0\u7d22\uff08MIR\uff09\u5c06\u97f3\u9891\u5206\u6790\u5e94\u7528\u4e8e\u97f3\u4e50\u3002\u6587\u4ef6 01 \u4e2d\u7684\u8c31\u56fe\u8868\u793a\u5728\u8fd9\u91cc\u5c24\u5176\u6709\u7528\uff0c\u56e0\u4e3a\u97f3\u4e50\u5177\u6709\u4e30\u5bcc\u7684\u548c\u58f0\u7ed3\u6784\u3002</p> </li> <li> <p>\u8282\u62cd\u8ddf\u8e2a\u68c0\u6d4b\u97f3\u4e50\u7684\u8282\u594f\u8109\u51b2\u3002\u6807\u51c6\u65b9\u6cd5\u4ece\u8bed\u8c31\u56fe\u8ba1\u7b97\u8d77\u59cb\u5f3a\u5ea6\u5305\u7edc\uff08\u68c0\u6d4b\u8868\u793a\u97f3\u7b26\u8d77\u59cb\u7684\u80fd\u91cf\u589e\u52a0\uff09\uff0c\u7136\u540e\u4f7f\u7528\u81ea\u76f8\u5173\u6216\u8282\u62cd\u56fe\u8c31\u627e\u5230\u8282\u594f\uff0c\u6700\u540e\u4f7f\u7528\u52a8\u6001\u89c4\u5212\u8ddf\u8e2a\u5355\u4e2a\u8282\u62cd\u4f4d\u7f6e\uff0c\u627e\u5230\u6700\u80fd\u5339\u914d\u8d77\u59cb\u5305\u7edc\u540c\u65f6\u4fdd\u6301\u7a33\u5b9a\u8282\u594f\u7684\u8282\u62cd\u65f6\u95f4\u5e8f\u5217\u3002</p> </li> <li> <p>\u548c\u5f26\u8bc6\u522b\u8bc6\u522b\u968f\u65f6\u95f4\u53d8\u5316\u7684\u548c\u58f0\u5185\u5bb9\u3002\u8f93\u5165\u901a\u5e38\u662f\u8272\u5ea6\u56fe\uff08\u4e5f\u79f0\u4e3a\u97f3\u9ad8\u7c7b\u522b\u5206\u5e03\u56fe\uff09\uff1a\u4e00\u4e2a 12 \u7ef4\u8868\u793a\uff0c\u5c06\u6240\u6709\u516b\u5ea6\u6298\u53e0\u5728\u4e00\u8d77\uff0c\u663e\u793a 12 \u4e2a\u97f3\u9ad8\u7c7b\u522b\uff08C\u3001C#\u3001D\u3001\u2026\u3001B\uff09\u4e2d\u6bcf\u4e2a\u7c7b\u522b\u7684\u80fd\u91cf\u3002CNN \u6216 RNN\uff08\u7b2c 06 \u7ae0\uff09\u5c06\u6bcf\u4e2a\u65f6\u95f4\u5e27\u5206\u7c7b\u5230\u6807\u51c6\u548c\u5f26\u6807\u7b7e\u4e4b\u4e00\uff08C \u5927\u8c03\u3001A \u5c0f\u8c03\u3001G7 \u7b49\uff09\u3002</p> </li> <li> <p>\u8272\u5ea6\u56fe\u901a\u8fc7\u5c06\u6bcf\u4e2a\u9891\u7387\u533a\u95f4\u6620\u5c04\u5230\u5176\u97f3\u9ad8\u7c7b\u522b\uff0c\u4ece STFT\uff08\u6587\u4ef6 01\uff09\u8ba1\u7b97\u5f97\u5230\uff1a</p> </li> </ul> \\[\\text{chroma}(p) = \\sum_{k : \\text{pitch}(k) \\bmod 12 = p} |X(k)|^2\\] <ul> <li> <p>\u5176\u4e2d \\(p \\in \\{0, 1, \\ldots, 11\\}\\) \u662f\u97f3\u9ad8\u7c7b\u522b\uff0c\\(\\text{pitch}(k)\\) \u5c06\u9891\u7387\u533a\u95f4 \\(k\\) \u6620\u5c04\u5230\u5176 MIDI \u97f3\u7b26\u7f16\u53f7\u3002</p> </li> <li> <p>\u6e90\u5206\u79bb\u57fa\u7840\uff08\u8be6\u89c1\u6587\u4ef6 05\uff09\u5c06\u97f3\u4e50\u5f55\u97f3\u5206\u79bb\u4e3a\u5355\u72ec\u7684\u4e50\u5668\uff08\u4eba\u58f0\u3001\u9f13\u3001\u8d1d\u65af\u3001\u5176\u4ed6\uff09\u3002\u8fd9\u662f\u6df7\u97f3\u3001\u5361\u62c9 OK \u548c\u97f3\u4e50\u8f6c\u5f55\u7b49 MIR \u5e94\u7528\u7684\u6838\u5fc3\u3002\u50cf Demucs\uff08\u6587\u4ef6 05\uff09\u8fd9\u6837\u7684\u6a21\u578b\u5728\u6807\u51c6 MUSDB18 \u57fa\u51c6\u4e0a\u8fbe\u5230\u4e86\u975e\u5e38\u597d\u7684\u5206\u79bb\u8d28\u91cf\u3002</p> </li> <li> <p>\u97f3\u4e50\u6807\u8bb0\u4e3a\u6b4c\u66f2\u5206\u914d\u6807\u7b7e\uff08\u6d41\u6d3e\u3001\u60c5\u611f\u3001\u4e50\u5668\u3001\u65f6\u4ee3\uff09\u3002\u5b83\u672c\u8d28\u4e0a\u662f\u5e94\u7528\u4e8e\u97f3\u4e50\u7684\u97f3\u9891\u5206\u7c7b\uff0c\u4f7f\u7528\u76f8\u540c\u7684 CNN-\u8bed\u8c31\u56fe\u65b9\u6cd5\u3002Million Song Dataset \u548c MagnaTagATune \u662f\u6807\u51c6\u57fa\u51c6\u3002</p> </li> <li> <p>\u97f3\u9891\u6307\u7eb9\u4ece\u77ed\u7247\u6bb5\u4e2d\u8bc6\u522b\u7279\u5b9a\u5f55\u97f3\uff0c\u5373\u4f7f\u5b58\u5728\u566a\u58f0\u3001\u6df7\u54cd\u6216\u538b\u7f29\u4f2a\u5f71\u3002\u7ecf\u5178\u7cfb\u7edf\u662f Shazam\uff0c\u5b83\u5bf9\u661f\u5ea7\u56fe\uff08\u8bed\u8c31\u56fe\u4e2d\u7684\u663e\u8457\u5cf0\u503c\uff09\u8fdb\u884c\u54c8\u5e0c\u5904\u7406\u3002\u795e\u7ecf\u65b9\u6cd5\u5b66\u4e60\u5bf9\u58f0\u5b66\u9000\u5316\u5177\u6709\u4e0d\u53d8\u6027\u3001\u540c\u65f6\u5bf9\u4e0d\u540c\u5f55\u97f3\u4fdd\u6301\u5224\u522b\u6027\u7684\u9c81\u68d2\u5d4c\u5165\uff0c\u8fd9\u4e0e\u7b2c 06 \u7ae0\u548c\u7b2c 08 \u7ae0\u4e2d\u7684\u4e0d\u53d8\u7279\u5f81\u5b66\u4e60\u4e00\u8109\u76f8\u627f\u3002</p> </li> </ul>"},{"location":"chapter%2009%3A%20audio%20and%20speech/04.%20speaker%20and%20audio%20analysis/#colab","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528 Colab \u6216\u7b14\u8bb0\u672c\uff09","text":"<ul> <li>\u4efb\u52a1 1\uff1a\u5e26\u7edf\u8ba1\u6c60\u5316\u7684\u8bf4\u8bdd\u4eba\u5d4c\u5165\u63d0\u53d6\u3002 \u6784\u5efa\u4e00\u4e2a\u7b80\u5355\u7684 x\u5411\u91cf\u98ce\u683c\u6a21\u578b\uff0c\u901a\u8fc7 TDNN \u5c42\u548c\u7edf\u8ba1\u6c60\u5316\u5904\u7406\u5e27\u7ea7\u7279\u5f81\u4ee5\u4ea7\u751f\u8bf4\u8bdd\u4eba\u5d4c\u5165\u3002</li> </ul> <pre><code>import jax\nimport jax.numpy as jnp\nimport jax.random as jr\nimport matplotlib.pyplot as plt\n\n# Simulate frame-level MFCC features for multiple speakers\ndef generate_speaker_data(key, n_speakers=5, utterances_per_speaker=20,\n                          n_frames=100, n_features=40):\n    \"\"\"Generate synthetic speaker data with speaker-dependent patterns.\"\"\"\n    keys = jr.split(key, 3)\n    all_features = []\n    all_labels = []\n\n    # Each speaker has a characteristic spectral pattern\n    speaker_patterns = jr.normal(keys[0], (n_speakers, n_features)) * 0.5\n\n    for spk in range(n_speakers):\n        for utt in range(utterances_per_speaker):\n            k = jr.fold_in(keys[1], spk * utterances_per_speaker + utt)\n            noise = jr.normal(k, (n_frames, n_features)) * 0.3\n            features = speaker_patterns[spk][None, :] + noise\n            all_features.append(features)\n            all_labels.append(spk)\n\n    perm = jr.permutation(keys[2], len(all_features))\n    features = jnp.stack(all_features)[perm]\n    labels = jnp.array(all_labels)[perm]\n    return features, labels\n\nkey = jr.PRNGKey(42)\nfeatures, labels = generate_speaker_data(key)\nn_speakers = 5\nn_features = 40\n\n# x-vector-style model\ndef init_xvector(key, n_features=40, hidden=128, embed_dim=64, n_speakers=5):\n    keys = jr.split(key, 8)\n    params = {\n        # TDNN layer 1: context [-2, 2]\n        'tdnn1_w': jr.normal(keys[0], (5, n_features, hidden)) * jnp.sqrt(2.0 / (5 * n_features)),\n        'tdnn1_b': jnp.zeros(hidden),\n        # TDNN layer 2: context [-2, 2]\n        'tdnn2_w': jr.normal(keys[1], (5, hidden, hidden)) * jnp.sqrt(2.0 / (5 * hidden)),\n        'tdnn2_b': jnp.zeros(hidden),\n        # TDNN layer 3: context [-3, 3]\n        'tdnn3_w': jr.normal(keys[2], (7, hidden, hidden)) * jnp.sqrt(2.0 / (7 * hidden)),\n        'tdnn3_b': jnp.zeros(hidden),\n        # Segment-level layers (after pooling: 2*hidden -&gt; embed_dim)\n        'seg1_w': jr.normal(keys[3], (2 * hidden, embed_dim)) * jnp.sqrt(2.0 / (2 * hidden)),\n        'seg1_b': jnp.zeros(embed_dim),\n        # Classification head\n        'cls_w': jr.normal(keys[4], (embed_dim, n_speakers)) * jnp.sqrt(2.0 / embed_dim),\n        'cls_b': jnp.zeros(n_speakers),\n    }\n    return params\n\ndef xvector_forward(params, x, return_embedding=False):\n    \"\"\"x: (batch, frames, features) -&gt; logits or embeddings.\"\"\"\n    # TDNN layers (1D convolutions)\n    h = jax.lax.conv_general_dilated(\n        x.transpose(0, 2, 1), params['tdnn1_w'].transpose(2, 1, 0),\n        window_strides=(1,), padding='SAME'\n    ).transpose(0, 2, 1) + params['tdnn1_b']\n    h = jax.nn.relu(h)\n\n    h = jax.lax.conv_general_dilated(\n        h.transpose(0, 2, 1), params['tdnn2_w'].transpose(2, 1, 0),\n        window_strides=(1,), padding='SAME'\n    ).transpose(0, 2, 1) + params['tdnn2_b']\n    h = jax.nn.relu(h)\n\n    h = jax.lax.conv_general_dilated(\n        h.transpose(0, 2, 1), params['tdnn3_w'].transpose(2, 1, 0),\n        window_strides=(1,), padding='SAME'\n    ).transpose(0, 2, 1) + params['tdnn3_b']\n    h = jax.nn.relu(h)\n\n    # Statistics pooling: mean and std over time\n    mu = jnp.mean(h, axis=1)\n    sigma = jnp.std(h, axis=1)\n    pooled = jnp.concatenate([mu, sigma], axis=-1)\n\n    # Segment-level layer -&gt; embedding\n    embedding = jax.nn.relu(pooled @ params['seg1_w'] + params['seg1_b'])\n\n    if return_embedding:\n        return embedding\n\n    # Classification\n    logits = embedding @ params['cls_w'] + params['cls_b']\n    return logits\n\ndef cross_entropy_loss(params, features, labels):\n    logits = xvector_forward(params, features)\n    one_hot = jax.nn.one_hot(labels, n_speakers)\n    log_probs = jax.nn.log_softmax(logits)\n    return -jnp.mean(jnp.sum(one_hot * log_probs, axis=-1))\n\ngrad_fn = jax.jit(jax.value_and_grad(cross_entropy_loss))\n\n# Train\nparams = init_xvector(jr.PRNGKey(0))\nlr = 1e-3\nlosses = []\n\nfor epoch in range(300):\n    loss_val, grads = grad_fn(params, features, labels)\n    params = jax.tree.map(lambda p, g: p - lr * g, params, grads)\n    losses.append(float(loss_val))\n\n# Extract embeddings and visualise with t-SNE-style 2D projection (using PCA)\nembeddings = xvector_forward(params, features, return_embedding=True)\n\n# Simple PCA to 2D\nemb_centered = embeddings - jnp.mean(embeddings, axis=0)\n_, _, Vt = jnp.linalg.svd(emb_centered, full_matrices=False)\nproj_2d = emb_centered @ Vt[:2].T\n\nfig, axes = plt.subplots(1, 2, figsize=(14, 5))\n\naxes[0].plot(losses, color='#3498db', linewidth=1.5)\naxes[0].set_xlabel('Epoch')\naxes[0].set_ylabel('Cross-Entropy Loss')\naxes[0].set_title('Speaker Classification Training')\naxes[0].set_yscale('log')\n\ncolors = ['#3498db', '#e74c3c', '#27ae60', '#f39c12', '#9b59b6']\nfor spk in range(n_speakers):\n    mask = labels == spk\n    axes[1].scatter(proj_2d[mask, 0], proj_2d[mask, 1], c=colors[spk],\n                    label=f'Speaker {spk}', alpha=0.7, s=30)\naxes[1].set_xlabel('PC 1')\naxes[1].set_ylabel('PC 2')\naxes[1].set_title('Speaker Embeddings (PCA projection)')\naxes[1].legend()\n\nplt.tight_layout()\nplt.show()\n\n# Verification demo: cosine similarity\nemb_norm = embeddings / jnp.linalg.norm(embeddings, axis=-1, keepdims=True)\nsim_matrix = emb_norm @ emb_norm.T\nprint(f\"Embedding shape: {embeddings.shape}\")\nprint(f\"Avg same-speaker similarity: {jnp.mean(sim_matrix[labels[:, None] == labels[None, :]]):.4f}\")\nprint(f\"Avg diff-speaker similarity: {jnp.mean(sim_matrix[labels[:, None] != labels[None, :]]):.4f}\")\n</code></pre> <ul> <li>\u4efb\u52a1 2\uff1a\u57fa\u4e8e\u4f59\u5f26\u76f8\u4f3c\u5ea6\u8bc4\u5206\u7684\u8bf4\u8bdd\u4eba\u786e\u8ba4\u3002 \u7ed9\u5b9a\u9884\u8ba1\u7b97\u7684\u8bf4\u8bdd\u4eba\u5d4c\u5165\uff0c\u5b9e\u73b0\u4e00\u4e2a\u8ba1\u7b97 EER\uff08\u7b49\u9519\u8bef\u7387\uff09\u5e76\u7ed8\u5236 DET \u66f2\u7ebf\u7684\u786e\u8ba4\u7cfb\u7edf\u3002</li> </ul> <pre><code>import jax\nimport jax.numpy as jnp\nimport jax.random as jr\nimport matplotlib.pyplot as plt\n\ndef generate_verification_pairs(key, n_speakers=20, dim=64, n_pairs=2000):\n    \"\"\"Generate speaker embeddings and verification trial pairs.\"\"\"\n    keys = jr.split(key, 5)\n\n    # Speaker centroids with some variance\n    centroids = jr.normal(keys[0], (n_speakers, dim))\n    centroids = centroids / jnp.linalg.norm(centroids, axis=-1, keepdims=True)\n\n    # Generate enrollment and test embeddings with intra-speaker variance\n    enroll_embs = []\n    test_embs = []\n    trial_labels = []  # 1 = same speaker (target), 0 = different (impostor)\n\n    for i in range(n_pairs):\n        k1, k2, k3 = jr.split(jr.fold_in(keys[1], i), 3)\n        is_target = jr.bernoulli(k1).astype(int)\n\n        spk1 = jr.randint(k2, (), 0, n_speakers)\n        emb1 = centroids[spk1] + jr.normal(jr.fold_in(k3, 0), (dim,)) * 0.15\n\n        if is_target:\n            spk2 = spk1\n        else:\n            spk2 = (spk1 + jr.randint(jr.fold_in(k3, 1), (), 1, n_speakers)) % n_speakers\n\n        emb2 = centroids[spk2] + jr.normal(jr.fold_in(k3, 2), (dim,)) * 0.15\n\n        enroll_embs.append(emb1)\n        test_embs.append(emb2)\n        trial_labels.append(int(is_target))\n\n    return (jnp.stack(enroll_embs), jnp.stack(test_embs),\n            jnp.array(trial_labels))\n\nkey = jr.PRNGKey(42)\nenroll, test, labels = generate_verification_pairs(key)\n\n# Compute cosine similarity scores\nenroll_norm = enroll / jnp.linalg.norm(enroll, axis=-1, keepdims=True)\ntest_norm = test / jnp.linalg.norm(test, axis=-1, keepdims=True)\nscores = jnp.sum(enroll_norm * test_norm, axis=-1)\n\n# Compute FAR and FRR at various thresholds\nthresholds = jnp.linspace(-1.0, 1.0, 500)\n\ntarget_scores = scores[labels == 1]\nimpostor_scores = scores[labels == 0]\n\nfars = []\nfrrs = []\nfor thresh in thresholds:\n    far = jnp.mean(impostor_scores &gt;= thresh)  # false accepts\n    frr = jnp.mean(target_scores &lt; thresh)     # false rejects\n    fars.append(float(far))\n    frrs.append(float(frr))\n\nfars = jnp.array(fars)\nfrrs = jnp.array(frrs)\n\n# Find EER: where FAR \u2248 FRR\neer_idx = jnp.argmin(jnp.abs(fars - frrs))\neer = float((fars[eer_idx] + frrs[eer_idx]) / 2)\neer_threshold = float(thresholds[eer_idx])\n\nprint(f\"Equal Error Rate (EER): {eer:.4f} ({eer*100:.2f}%)\")\nprint(f\"EER threshold: {eer_threshold:.4f}\")\n\nfig, axes = plt.subplots(1, 3, figsize=(18, 5))\n\n# Score distributions\nbins = jnp.linspace(-0.5, 1.0, 60)\naxes[0].hist(target_scores, bins=bins, alpha=0.6, color='#27ae60',\n             label='Target (same speaker)', density=True)\naxes[0].hist(impostor_scores, bins=bins, alpha=0.6, color='#e74c3c',\n             label='Impostor (different speaker)', density=True)\naxes[0].axvline(eer_threshold, color='#f39c12', linestyle='--', linewidth=2,\n                label=f'EER threshold = {eer_threshold:.3f}')\naxes[0].set_xlabel('Cosine Similarity Score')\naxes[0].set_ylabel('Density')\naxes[0].set_title('Score Distributions')\naxes[0].legend()\n\n# FAR vs FRR\naxes[1].plot(thresholds, fars, color='#e74c3c', linewidth=2, label='FAR')\naxes[1].plot(thresholds, frrs, color='#3498db', linewidth=2, label='FRR')\naxes[1].axvline(eer_threshold, color='#f39c12', linestyle='--', linewidth=1.5)\naxes[1].scatter([eer_threshold], [eer], color='#f39c12', s=100, zorder=5,\n                label=f'EER = {eer:.4f}')\naxes[1].set_xlabel('Threshold')\naxes[1].set_ylabel('Error Rate')\naxes[1].set_title('FAR and FRR vs Threshold')\naxes[1].legend()\n\n# DET curve (FAR vs FRR)\naxes[2].plot(fars, frrs, color='#9b59b6', linewidth=2)\naxes[2].plot([0, 1], [0, 1], 'k--', alpha=0.3)\naxes[2].scatter([eer], [eer], color='#f39c12', s=100, zorder=5,\n                label=f'EER = {eer:.4f}')\naxes[2].set_xlabel('False Acceptance Rate')\naxes[2].set_ylabel('False Rejection Rate')\naxes[2].set_title('DET Curve')\naxes[2].set_xlim([0, 0.5])\naxes[2].set_ylim([0, 0.5])\naxes[2].legend()\naxes[2].set_aspect('equal')\n\nplt.tight_layout()\nplt.show()\n</code></pre> <ul> <li>\u4efb\u52a1 3\uff1a\u97f3\u9891\u8bed\u8c31\u56fe\u5757\u5d4c\u5165\uff08AST \u98ce\u683c\uff09\u3002 \u5b9e\u73b0\u97f3\u9891\u8bed\u8c31\u56fe Transformer \u7684\u5757\u63d0\u53d6\u548c\u5d4c\u5165\u5c42\uff0c\u53ef\u89c6\u5316\u8bed\u8c31\u56fe\u5982\u4f55\u88ab\u4ee4\u724c\u5316\u3002</li> </ul> <pre><code>import jax\nimport jax.numpy as jnp\nimport jax.random as jr\nimport matplotlib.pyplot as plt\n\n# Generate a synthetic spectrogram (harmonic structure + noise)\ndef generate_spectrogram(key, n_time=128, n_freq=128):\n    \"\"\"Create a synthetic spectrogram with harmonic patterns.\"\"\"\n    k1, k2 = jr.split(key)\n    spec = jr.normal(k1, (n_time, n_freq)) * 0.1\n\n    # Add harmonic bands (simulating speech formants)\n    for f0 in [15, 30, 45, 70]:\n        width = 3\n        envelope = jnp.exp(-0.5 * ((jnp.arange(n_freq) - f0) / width) ** 2)\n        time_mod = 0.5 + 0.5 * jnp.sin(2 * jnp.pi * jnp.arange(n_time) / 40)\n        spec += jnp.outer(time_mod, envelope)\n\n    return jnp.clip(spec, 0, None)\n\nkey = jr.PRNGKey(42)\nspectrogram = generate_spectrogram(key)\nn_time, n_freq = spectrogram.shape\n\n# Patch extraction parameters\npatch_h = 16  # time\npatch_w = 16  # frequency\nstride_h = 16\nstride_w = 16\nembed_dim = 192  # ViT-Small dimension\n\nn_patches_h = n_time // stride_h\nn_patches_w = n_freq // stride_w\nn_patches = n_patches_h * n_patches_w\n\nprint(f\"Spectrogram: {n_time} x {n_freq}\")\nprint(f\"Patch size: {patch_h} x {patch_w}\")\nprint(f\"Number of patches: {n_patches_h} x {n_patches_w} = {n_patches}\")\n\n# Extract patches\ndef extract_patches(spec, patch_h, patch_w, stride_h, stride_w):\n    \"\"\"Extract non-overlapping patches from spectrogram.\"\"\"\n    patches = []\n    positions = []\n    for i in range(0, spec.shape[0] - patch_h + 1, stride_h):\n        for j in range(0, spec.shape[1] - patch_w + 1, stride_w):\n            patch = spec[i:i+patch_h, j:j+patch_w]\n            patches.append(patch.flatten())\n            positions.append((i, j))\n    return jnp.stack(patches), positions\n\npatches, positions = extract_patches(spectrogram, patch_h, patch_w, stride_h, stride_w)\nprint(f\"Patches shape: {patches.shape}\")  # (n_patches, patch_h * patch_w)\n\n# Linear projection (patch embedding)\npatch_dim = patch_h * patch_w\nk1, k2 = jr.split(jr.PRNGKey(0))\nW_embed = jr.normal(k1, (patch_dim, embed_dim)) * jnp.sqrt(2.0 / patch_dim)\nb_embed = jnp.zeros(embed_dim)\n\n# Learnable positional embeddings\npos_embed = jr.normal(k2, (n_patches + 1, embed_dim)) * 0.02  # +1 for CLS\n\n# CLS token\ncls_token = jnp.zeros((1, embed_dim))\n\n# Forward pass\npatch_tokens = patches @ W_embed + b_embed  # (n_patches, embed_dim)\ntokens = jnp.concatenate([cls_token, patch_tokens], axis=0)  # (n_patches+1, embed_dim)\ntokens = tokens + pos_embed  # Add positional embeddings\n\nprint(f\"Token sequence shape: {tokens.shape}\")\nprint(f\"Each token has dimension: {embed_dim}\")\n\n# Visualisation\nfig, axes = plt.subplots(2, 2, figsize=(14, 10))\n\n# Original spectrogram with patch grid\naxes[0, 0].imshow(spectrogram.T, aspect='auto', origin='lower', cmap='magma')\nfor i in range(0, n_time + 1, stride_h):\n    axes[0, 0].axvline(i - 0.5, color='white', linewidth=0.5, alpha=0.5)\nfor j in range(0, n_freq + 1, stride_w):\n    axes[0, 0].axhline(j - 0.5, color='white', linewidth=0.5, alpha=0.5)\naxes[0, 0].set_title(f'Spectrogram with {patch_h}x{patch_w} Patch Grid')\naxes[0, 0].set_xlabel('Time frame')\naxes[0, 0].set_ylabel('Frequency bin')\n\n# Individual patches visualised\nn_show = min(16, n_patches)\npatch_grid = patches[:n_show].reshape(n_show, patch_h, patch_w)\ncombined = jnp.concatenate([patch_grid[i] for i in range(min(8, n_show))], axis=1)\naxes[0, 1].imshow(combined.T, aspect='auto', origin='lower', cmap='magma')\naxes[0, 1].set_title(f'First {min(8, n_show)} Patches (concatenated)')\naxes[0, 1].set_xlabel('Patch index (horizontal)')\naxes[0, 1].set_ylabel('Frequency within patch')\n\n# Token embeddings similarity matrix\ntoken_norms = tokens / jnp.linalg.norm(tokens, axis=-1, keepdims=True)\nsim = token_norms @ token_norms.T\nim = axes[1, 0].imshow(sim, cmap='RdBu_r', vmin=-1, vmax=1)\naxes[1, 0].set_title('Token Similarity Matrix (cosine)')\naxes[1, 0].set_xlabel('Token index')\naxes[1, 0].set_ylabel('Token index')\nplt.colorbar(im, ax=axes[1, 0], fraction=0.046)\n\n# Positional embedding similarity\npos_norms = pos_embed / jnp.linalg.norm(pos_embed, axis=-1, keepdims=True)\npos_sim = pos_norms @ pos_norms.T\nim2 = axes[1, 1].imshow(pos_sim, cmap='RdBu_r', vmin=-1, vmax=1)\naxes[1, 1].set_title('Positional Embedding Similarity')\naxes[1, 1].set_xlabel('Position index')\naxes[1, 1].set_ylabel('Position index')\nplt.colorbar(im2, ax=axes[1, 1], fraction=0.046)\n\nplt.tight_layout()\nplt.show()\n</code></pre> <ul> <li>\u4efb\u52a1 4\uff1a\u7528\u4e8e\u548c\u5f26\u5206\u6790\u7684\u7b80\u5355\u8272\u5ea6\u56fe\u8ba1\u7b97\u3002 \u4ece\u5408\u6210\u548c\u58f0\u4fe1\u53f7\u8ba1\u7b97\u5e76\u53ef\u89c6\u5316\u8272\u5ea6\u56fe\uff0c\u5c55\u793a\u97f3\u4e50\u4fe1\u606f\u68c0\u7d22\u4e2d\u4f7f\u7528\u7684\u97f3\u9ad8\u7c7b\u522b\u6298\u53e0\u65b9\u6cd5\u3002</li> </ul> <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# Generate a synthetic musical signal: C major chord -&gt; G major chord\nsr = 16000\nduration = 2.0\nt = jnp.linspace(0, duration, int(sr * duration))\n\n# C major (C4=261.6, E4=329.6, G4=392.0) for first half\n# G major (G3=196.0, B3=246.9, D4=293.7) for second half\nhalf = len(t) // 2\n\nc_major = (0.5 * jnp.sin(2 * jnp.pi * 261.63 * t[:half]) +\n           0.4 * jnp.sin(2 * jnp.pi * 329.63 * t[:half]) +\n           0.3 * jnp.sin(2 * jnp.pi * 392.00 * t[:half]))\n\ng_major = (0.5 * jnp.sin(2 * jnp.pi * 196.00 * t[:half]) +\n           0.4 * jnp.sin(2 * jnp.pi * 246.94 * t[:half]) +\n           0.3 * jnp.sin(2 * jnp.pi * 293.66 * t[:half]))\n\nsignal = jnp.concatenate([c_major, g_major])\n\n# Compute STFT\nn_fft = 4096  # high resolution for pitch accuracy\nhop_length = 512\nwindow = jnp.hanning(n_fft)\n\ndef stft(signal, n_fft, hop_length, window):\n    n_frames = 1 + (len(signal) - n_fft) // hop_length\n    frames = jnp.stack([\n        signal[i * hop_length : i * hop_length + n_fft] * window\n        for i in range(n_frames)\n    ])\n    return jnp.fft.rfft(frames, n=n_fft)\n\nS = stft(signal, n_fft, hop_length, window)\npower_spec = jnp.abs(S) ** 2\nfreqs = jnp.fft.rfftfreq(n_fft, 1.0 / sr)\n\n# Compute chromagram by mapping frequency bins to pitch classes\n# MIDI note number from frequency: 69 + 12 * log2(f / 440)\nnote_names = ['C', 'C#', 'D', 'D#', 'E', 'F', 'F#', 'G', 'G#', 'A', 'A#', 'B']\n\ndef freq_to_chroma(freq):\n    \"\"\"Map frequency to pitch class (0-11). Returns -1 for freq &lt;= 0.\"\"\"\n    midi = 69 + 12 * jnp.log2(jnp.clip(freq, 1e-10, None) / 440.0)\n    return jnp.round(midi).astype(int) % 12\n\n# Build chromagram: sum power spectrum energy for each pitch class\nchromagram = jnp.zeros((power_spec.shape[0], 12))\nvalid_freqs = freqs[1:]  # skip DC\nvalid_power = power_spec[:, 1:]\n\nfor p in range(12):\n    # Find frequency bins belonging to this pitch class\n    chroma_bins = freq_to_chroma(valid_freqs)\n    mask = (chroma_bins == p).astype(jnp.float32)\n    chromagram = chromagram.at[:, p].set(\n        jnp.sum(valid_power * mask[None, :], axis=1)\n    )\n\n# Normalise each frame\nchromagram = chromagram / (jnp.max(chromagram, axis=1, keepdims=True) + 1e-8)\n\n# Visualisation\nfig, axes = plt.subplots(3, 1, figsize=(14, 10))\n\n# Waveform\naxes[0].plot(t[:3000], signal[:3000], color='#3498db', linewidth=0.5,\n             label='C major')\naxes[0].plot(t[half:half+3000], signal[half:half+3000], color='#e74c3c',\n             linewidth=0.5, label='G major')\naxes[0].set_title('Waveform: C major \u2192 G major')\naxes[0].set_ylabel('Amplitude')\naxes[0].set_xlabel('Time (s)')\naxes[0].legend()\n\n# Spectrogram (log scale)\ntime_axis = jnp.arange(power_spec.shape[0]) * hop_length / sr\naxes[1].imshow(jnp.log1p(power_spec[:, :500].T), aspect='auto', origin='lower',\n               cmap='magma', extent=[0, time_axis[-1], 0, freqs[500]])\naxes[1].set_title('Power Spectrogram')\naxes[1].set_ylabel('Frequency (Hz)')\naxes[1].set_xlabel('Time (s)')\n\n# Chromagram\nim = axes[2].imshow(chromagram.T, aspect='auto', origin='lower', cmap='YlOrRd',\n                     extent=[0, time_axis[-1], -0.5, 11.5])\naxes[2].set_yticks(range(12))\naxes[2].set_yticklabels(note_names)\naxes[2].set_title('Chromagram (pitch class energy over time)')\naxes[2].set_ylabel('Pitch class')\naxes[2].set_xlabel('Time (s)')\nplt.colorbar(im, ax=axes[2], fraction=0.046, label='Normalised energy')\n\n# Mark expected active pitch classes\nmid_frame = chromagram.shape[0] // 2\nprint(f\"C major region - expected: C, E, G\")\nprint(f\"  Chroma values: {dict(zip(note_names, [f'{v:.2f}' for v in chromagram[mid_frame//2]]))}\")\nprint(f\"G major region - expected: G, B, D\")\nprint(f\"  Chroma values: {dict(zip(note_names, [f'{v:.2f}' for v in chromagram[mid_frame + mid_frame//2]]))}\")\n\nplt.tight_layout()\nplt.show()\n</code></pre>"},{"location":"chapter%2009%3A%20audio%20and%20speech/05.%20source%20separation%20and%20noise/","title":"\u6e90\u5206\u79bb\u4e0e\u964d\u566a","text":"<p>\u6e90\u5206\u79bb\u4e0e\u964d\u566a\u4ece\u6df7\u5408\u97f3\u9891\u4e2d\u6062\u590d\u5355\u4e2a\u4fe1\u53f7\uff1b\u5373\u8ba1\u7b97\u5c42\u9762\u7684\"\u9e21\u5c3e\u9152\u4f1a\u95ee\u9898\"\u3002\u672c\u6587\u6db5\u76d6ICA\u3001NMF\u3001\u65f6\u9891\u63a9\u853d\u3001\u6ce2\u675f\u6210\u5f62\u3001\u6df1\u5ea6\u5b66\u4e60\u5206\u79bb\u7f51\u7edc\uff08Conv-TasNet\u3001SepFormer\uff09\u3001\u8bed\u97f3\u589e\u5f3a\u4ee5\u53ca\u81ea\u9002\u5e94\u964d\u566a\u3002</p> <ul> <li> <p>\u60f3\u8c61\u4e00\u4e0b\u4f60\u7ad9\u5728\u4e00\u4e2a\u62e5\u6324\u7684\u9e21\u5c3e\u9152\u4f1a\u4e0a\u3002\u6570\u5341\u4eba\u540c\u65f6\u5728\u4ea4\u8c08\uff0c\u97f3\u4e50\u5728\u64ad\u653e\uff0c\u9152\u676f\u5728\u78b0\u649e\uff0c\u4f46\u4f60\u5374\u80fd\u4e13\u6ce8\u4e8e\u4e00\u6bb5\u5bf9\u8bdd\u5e76\u6e05\u6670\u5730\u8ddf\u4e0a\u5b83\u3002\u8fd9\u79cd\u975e\u51e1\u7684\u80fd\u529b\u88ab\u79f0\u4e3a\u9e21\u5c3e\u9152\u4f1a\u95ee\u9898\uff08Cherry, 1953\uff09\uff0c\u4eba\u7c7b\u542c\u89c9\u7cfb\u7edf\u53ef\u4ee5\u6beb\u4e0d\u8d39\u529b\u5730\u505a\u5230\uff0c\u4f46\u673a\u5668\u5374\u89c9\u5f97\u5f02\u5e38\u56f0\u96be\u3002\u672c\u6587\u6db5\u76d6\u4e86\u5c1d\u8bd5\u89e3\u51b3\u8fd9\u4e00\u95ee\u9898\u7684\u7b97\u6cd5\uff1a\u5206\u79bb\u6df7\u5408\u97f3\u9891\u6e90\u3001\u6d88\u9664\u4e0d\u5fc5\u8981\u7684\u566a\u58f0\u4ee5\u53ca\u5728\u4e0d\u5229\u6761\u4ef6\u4e0b\u589e\u5f3a\u8bed\u97f3\u3002</p> </li> <li> <p>\u6587\u4ef601\u4e2d\u7684\u4fe1\u53f7\u5904\u7406\u57fa\u7840\uff08STFT\u3001\u8bed\u8c31\u56fe\u3001\u6ee4\u6ce2\u5668\u7ec4\uff09\u652f\u6491\u4e86\u8fd9\u91cc\u7684\u6bcf\u4e00\u79cd\u65b9\u6cd5\u3002\u7b2c02\u7ae0\u4e2d\u7684\u77e9\u9635\u5206\u89e3\u6280\u672f\uff08NMF\u3001ICA\u3001SVD\uff09\u63d0\u4f9b\u4e86\u7ecf\u5178\u5de5\u5177\u96c6\u3002\u7b2c06\u7ae0\u4e2d\u7684\u6df1\u5ea6\u5b66\u4e60\u67b6\u6784\uff08CNN\u3001RNN\u3001\u6ce8\u610f\u529b\u673a\u5236\uff09\u4ee5\u53ca\u7b2c04/05\u7ae0\u4e2d\u7684\u6982\u7387\u8bba\u5219\u4e3a\u73b0\u4ee3\u65b9\u6cd5\u63d0\u4f9b\u4e86\u7406\u8bba\u57fa\u7840\u3002</p> </li> </ul> <p></p> <ul> <li>\u95ee\u9898\u5f62\u5f0f\u5316\uff1a\u5728\u4e00\u4e2a\u6216\u591a\u4e2a\u9ea6\u514b\u98ce\u5904\u89c2\u6d4b\u5230\u6df7\u5408\u4fe1\u53f7 \\(x(t)\\)\u3002\u5728\u6700\u7b80\u5355\u7684\u60c5\u51b5\u4e0b\uff0c\u6df7\u5408\u4fe1\u53f7\u662f \\(C\\) \u4e2a\u6e90\u4fe1\u53f7\u7684\u548c\uff1a</li> </ul> \\[x(t) = \\sum_{c=1}^{C} s_c(t) + n(t)\\] <ul> <li> <p>\u5176\u4e2d \\(s_c(t)\\) \u662f\u7b2c \\(c\\) \u4e2a\u6e90\u4fe1\u53f7\uff0c\\(n(t)\\) \u662f\u80cc\u666f\u566a\u58f0\u3002\u76ee\u6807\u662f\u4ece \\(x(t)\\) \u4e2d\u6062\u590d\u51fa\u5404\u4e2a \\(s_c(t)\\)\u3002\u5728\u5355\u9ea6\u514b\u98ce\u60c5\u51b5\u4e0b\uff0c\u8fd9\u662f\u4e00\u4e2a\u4e25\u91cd\u6b20\u5b9a\u7684\u95ee\u9898\uff1a\u4e00\u4e2a\u65b9\u7a0b\uff0c\\(C\\) \u4e2a\u672a\u77e5\u6570\u3002\u9700\u8981\u989d\u5916\u7684\u5047\u8bbe\uff08\u7edf\u8ba1\u72ec\u7acb\u6027\u3001\u9891\u8c31\u7ed3\u6784\u3001\u5b66\u4e60\u5148\u9a8c\uff09\u624d\u80fd\u4f7f\u95ee\u9898\u53d8\u5f97\u53ef\u89e3\u3002</p> </li> <li> <p>\u5728\u9891\u57df\u4e2d\uff08\u901a\u8fc7\u6587\u4ef601\u4e2d\u7684STFT\uff09\uff0c\u6df7\u5408\u4fe1\u53f7\u53d8\u4e3a\uff1a</p> </li> </ul> \\[X(t, f) = \\sum_{c=1}^{C} S_c(t, f) + N(t, f)\\] <ul> <li>\u8bb8\u591a\u5206\u79bb\u65b9\u6cd5\u5728\u65f6\u9891\u57df\u4e2d\u901a\u8fc7\u4e3a\u6bcf\u4e2a\u6e90\u4f30\u8ba1\u4e00\u4e2a\u63a9\u853d \\(M_c(t, f) \\in [0, 1]\\) \u6765\u5de5\u4f5c\uff0c\u7136\u540e\u901a\u8fc7 \\(\\hat{S}_c(t, f) = M_c(t, f) \\cdot X(t, f)\\) \u6062\u590d\u6e90\u4fe1\u53f7\u3002\u7406\u60f3\u4e8c\u503c\u63a9\u853d\uff08IBM\uff09 \u8bbe\u7f6e \\(M_c(t, f) = 1\\) \u5982\u679c\u6e90 \\(c\\) \u5728\u8be5\u65f6\u9891\u5355\u5143\u4e2d\u5360\u4e3b\u5bfc\uff0c\u5426\u5219\u4e3a0\u3002\u7406\u60f3\u6bd4\u7387\u63a9\u853d\uff08IRM\uff09 \u662f\u5176\u8f6f\u7248\u672c\uff1a</li> </ul> \\[\\text{IRM}_c(t, f) = \\frac{|S_c(t, f)|^2}{\\sum_{j=1}^{C} |S_j(t, f)|^2}\\] <ul> <li> <p>\u72ec\u7acb\u6210\u5206\u5206\u6790\uff08ICA\uff09 \u662f\u9ea6\u514b\u98ce\u6570\u91cf\u7b49\u4e8e\u6216\u8d85\u8fc7\u6e90\u6570\u91cf\u65f6\u7684\u7ecf\u5178\u65b9\u6cd5\u3002ICA\uff08\u7b2c02\u7ae0\uff09\u5bfb\u627e\u4e00\u4e2a\u7ebf\u6027\u89e3\u6df7\u77e9\u9635 \\(W\\)\uff0c\u4f7f\u5f97 \\(\\hat{s} = Wx\\)\uff0c\u5176\u4e2d\u6062\u590d\u7684\u6e90 \\(\\hat{s}\\) \u5728\u7edf\u8ba1\u4e0a\u6700\u5927\u9650\u5ea6\u5730\u72ec\u7acb\u3002\u5173\u952e\u5047\u8bbe\u662f\u6e90\u4fe1\u53f7\u662f\u975e\u9ad8\u65af\u4e14\u72ec\u7acb\u7684\uff0c\u8fd9\u5bf9\u4e8e\u8bed\u97f3\u548c\u97f3\u4e50\u901a\u5e38\u662f\u6210\u7acb\u7684\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u591a\u9ea6\u514b\u98ce\u77ac\u65f6\u6df7\u53e0\u6a21\u578b \\(x = As\\)\uff08\u5176\u4e2d \\(A\\) \u662f\u6df7\u53e0\u77e9\u9635\uff09\uff0cICA \u901a\u8fc7\u6700\u5927\u5316\u8f93\u51fa\u7684\u975e\u9ad8\u65af\u6027\uff08FastICA \u4f7f\u7528\u8d1f\u71b5\uff09\u6216\u6700\u5c0f\u5316\u4e92\u4fe1\u606f\u6765\u6062\u590d \\(W \\approx A^{-1}\\)\u3002ICA \u5728\u53d7\u63a7\u73af\u5883\u4e2d\u8868\u73b0\u826f\u597d\uff0c\u4f46\u5f53\u6df7\u53e0\u6d89\u53ca\u5377\u79ef\uff08\u623f\u95f4\u6df7\u54cd\uff09\u3001\u6e90\u6570\u91cf\u8d85\u8fc7\u9ea6\u514b\u98ce\u6570\u91cf\u6216\u72ec\u7acb\u6027\u5047\u8bbe\u88ab\u8fdd\u53cd\u65f6\u5219\u4f1a\u5931\u8d25\u3002</p> </li> <li> <p>\u975e\u8d1f\u77e9\u9635\u5206\u89e3\uff08NMF\uff09 \u5c06\u5e45\u5ea6\u8bed\u8c31\u56fe \\(V \\in \\mathbb{R}_+^{F \\times T}\\) \u5206\u89e3\u4e3a\u4e24\u4e2a\u975e\u8d1f\u77e9\u9635\u7684\u4e58\u79ef\uff08\u7b2c02\u7ae0\uff09\uff1a</p> </li> </ul> \\[V \\approx WH\\] <ul> <li> <p>\u5176\u4e2d \\(W \\in \\mathbb{R}_+^{F \\times K}\\) \u662f\u5305\u542b \\(K\\) \u4e2a\u9891\u8c31\u57fa\u5411\u91cf\u7684\u5b57\u5178\uff0c\\(H \\in \\mathbb{R}_+^{K \\times T}\\) \u5305\u542b\u968f\u65f6\u95f4\u53d8\u5316\u7684\u6fc0\u6d3b\u7cfb\u6570\u3002\u975e\u8d1f\u7ea6\u675f\u5177\u6709\u7269\u7406\u52a8\u673a\uff1a\u5e45\u5ea6\u662f\u975e\u8d1f\u7684\uff0c\u4e14\u58f0\u97f3\u662f\u52a0\u6027\u7ec4\u5408\u7684\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u6e90\u5206\u79bb\uff0cNMF \u4e3a\u6bcf\u4e2a\u6e90\u5b66\u4e60\u72ec\u7acb\u7684\u5b57\u5178\uff1a\\(W_{\\text{\u8bed\u97f3}}\\) \u6355\u6349\u8bed\u97f3\u7684\u9891\u8c31\u6a21\u5f0f\uff08\u5171\u632f\u5cf0\u7ed3\u6784\uff09\uff0c\u800c \\(W_{\\text{\u566a\u58f0}}\\) \u6355\u6349\u566a\u58f0\u6a21\u5f0f\u3002\u6df7\u5408\u4fe1\u53f7\u88ab\u5206\u89e3\u4e3a \\(V \\approx W_{\\text{\u8bed\u97f3}} H_{\\text{\u8bed\u97f3}} + W_{\\text{\u566a\u58f0}} H_{\\text{\u566a\u58f0}}\\)\uff0c\u6bcf\u4e2a\u6e90\u901a\u8fc7\u63a9\u853d\u6765\u6062\u590d\u3002NMF \u4f7f\u7528\u4e58\u6cd5\u66f4\u65b0\u89c4\u5219\u8fdb\u884c\u6700\u5c0f\u5316\uff0c\u4ee3\u4ef7\u51fd\u6570\u53ef\u4ee5\u662f Frobenius \u8303\u6570\u6216 KL \u6563\u5ea6\uff1a</p> </li> </ul> \\[ \\begin{aligned} \\text{Frobenius:} \\quad D_F(V \\| WH) &amp;= \\|V - WH\\|_F^2 \\\\ \\text{KL:} \\quad D_{KL}(V \\| WH) &amp;= \\sum_{f,t} \\left[ V_{ft} \\log \\frac{V_{ft}}{(WH)_{ft}} - V_{ft} + (WH)_{ft} \\right] \\end{aligned} \\] <ul> <li>\u6ce2\u675f\u6210\u5f62\u5229\u7528\u9ea6\u514b\u98ce\u9635\u5217\u7684\u7a7a\u95f4\u4fe1\u606f\u3002\u5f53\u4e00\u4e2a\u6e90\u4fe1\u53f7\u4ee5\u4e0d\u540c\u7684\u5ef6\u8fdf\u5230\u8fbe\u4e0d\u540c\u7684\u9ea6\u514b\u98ce\uff08\u7531\u4e8e\u7a7a\u95f4\u6392\u5217\uff09\u65f6\uff0c\u8fd9\u4e9b\u5ef6\u8fdf\u53ef\u4ee5\u7528\u6765\u589e\u5f3a\u6765\u81ea\u67d0\u4e2a\u65b9\u5411\u7684\u4fe1\u53f7\uff0c\u540c\u65f6\u6291\u5236\u5176\u4ed6\u65b9\u5411\u7684\u4fe1\u53f7\u3002</li> </ul> <p></p> <ul> <li>\u5ef6\u8fdf\u6c42\u548c\u6ce2\u675f\u6210\u5f62\u662f\u6700\u7b80\u5355\u7684\u65b9\u6cd5\u3002\u5982\u679c\u76ee\u6807\u6e90\u76f8\u5bf9\u4e8e\u9635\u5217\u7684\u89d2\u5ea6\u4e3a \\(\\theta\\)\uff0c\u5219\u5728\u9ea6\u514b\u98ce \\(m\\) \u5904\u7684\u65f6\u95f4\u5ef6\u8fdf\u4e3a \\(\\tau_m(\\theta) = d_m \\sin \\theta / c\\)\uff0c\u5176\u4e2d \\(d_m\\) \u662f\u9ea6\u514b\u98ce\u4f4d\u7f6e\uff0c\\(c\\) \u662f\u58f0\u901f\u3002\u6ce2\u675f\u6210\u5f62\u5668\u8f93\u51fa\u5c06\u9ea6\u514b\u98ce\u4fe1\u53f7\u5bf9\u9f50\u5e76\u6c42\u548c\uff1a</li> </ul> \\[y(t) = \\frac{1}{M} \\sum_{m=1}^{M} x_m(t - \\tau_m(\\theta))\\] <ul> <li> <p>\u6765\u81ea\u76ee\u6807\u65b9\u5411\u7684\u4fe1\u53f7\u76f8\u5e72\u76f8\u52a0\uff0c\u800c\u6765\u81ea\u5176\u4ed6\u65b9\u5411\u7684\u4fe1\u53f7\u975e\u76f8\u5e72\u76f8\u52a0\uff0c\u4ece\u800c\u5b9e\u73b0\u7a7a\u95f4\u6ee4\u6ce2\u3002\u9635\u5217\u7684\u51e0\u4f55\u5f62\u72b6\u51b3\u5b9a\u4e86\u7a7a\u95f4\u5206\u8fa8\u7387\uff1a\u66f4\u5927\u7684\u9635\u5217\u4ea7\u751f\u66f4\u7a84\u7684\u6ce2\u675f\u3002</p> </li> <li> <p>\u6700\u5c0f\u65b9\u5dee\u65e0\u5931\u771f\u54cd\u5e94\uff08MVDR\uff09 \u6ce2\u675f\u6210\u5f62\u4f18\u5316\u6743\u91cd\uff0c\u4ee5\u6700\u5c0f\u5316\u603b\u8f93\u51fa\u529f\u7387\uff0c\u540c\u65f6\u4fdd\u8bc1\u76ee\u6807\u65b9\u5411\u65e0\u5931\u771f\u5730\u901a\u8fc7\uff1a</p> </li> </ul> \\[ \\begin{aligned} \\min_{\\mathbf{w}} \\quad &amp; \\mathbf{w}^H \\Phi_{nn} \\mathbf{w} \\\\ \\text{subject to} \\quad &amp; \\mathbf{w}^H \\mathbf{d}(\\theta) = 1 \\end{aligned} \\] <ul> <li>\u5176\u4e2d \\(\\Phi_{nn}\\) \u662f\u566a\u58f0\u7a7a\u95f4\u534f\u65b9\u5dee\u77e9\u9635\uff0c\\(\\mathbf{d}(\\theta)\\) \u662f\u65b9\u5411 \\(\\theta\\) \u7684\u5bfc\u5411\u5411\u91cf\u3002\u95ed\u5f0f\u89e3\u4e3a\uff1a</li> </ul> \\[\\mathbf{w}_{\\text{MVDR}} = \\frac{\\Phi_{nn}^{-1} \\mathbf{d}(\\theta)}{\\mathbf{d}(\\theta)^H \\Phi_{nn}^{-1} \\mathbf{d}(\\theta)}\\] <ul> <li> <p>MVDR \u901a\u8fc7\u4f7f\u7528\u4f30\u8ba1\u7684\u566a\u58f0\u534f\u65b9\u5dee\u81ea\u9002\u5e94\u5730\u9002\u5e94\u566a\u58f0\u73af\u5883\uff0c\u6bd4\u5ef6\u8fdf\u6c42\u548c\u63d0\u4f9b\u66f4\u597d\u7684\u5e72\u6270\u6291\u5236\u80fd\u529b\u3002\u5b83\u5e7f\u6cdb\u7528\u4e8e\u52a9\u542c\u5668\u3001\u667a\u80fd\u97f3\u7bb1\u548c\u8fdc\u7a0b\u4f1a\u8bae\u7cfb\u7edf\u3002</p> </li> <li> <p>\u6df1\u5ea6\u5b66\u4e60\u7528\u4e8e\u6e90\u5206\u79bb\u663e\u8457\u63d0\u5347\u4e86\u6027\u80fd\uff0c\u7279\u522b\u662f\u5728\u7ecf\u5178\u65b9\u6cd5\u96be\u4ee5\u5904\u7406\u7684\u5355\u9ea6\u514b\u98ce\u60c5\u51b5\u4e0b\u3002\u4e00\u822c\u8303\u5f0f\u662f\uff1a\u7f16\u7801\u6df7\u5408\u4fe1\u53f7\uff0c\u901a\u8fc7\u795e\u7ecf\u7f51\u7edc\u4f30\u8ba1\u63a9\u853d\u6216\u6e90\u8868\u793a\uff0c\u7136\u540e\u89e3\u7801\u4ee5\u6062\u590d\u5404\u4e2a\u6e90\u3002</p> </li> <li> <p>\u6df1\u5ea6\u805a\u7c7b\uff08Hershey \u7b49\uff0c2016\uff09\u5c06\u6bcf\u4e2a\u65f6\u9891\u5355\u5143\u5d4c\u5165\u5230\u4e00\u4e2a\u9ad8\u7ef4\u7a7a\u95f4\u4e2d\uff0c\u4f7f\u5f97\u5c5e\u4e8e\u540c\u4e00\u6e90\u7684\u5355\u5143\u5f7c\u6b64\u9760\u8fd1\uff0c\u800c\u6765\u81ea\u4e0d\u540c\u6e90\u7684\u5355\u5143\u5219\u8fdc\u79bb\u3002\u4e00\u4e2a\u53cc\u5411 LSTM\uff08\u7b2c06\u7ae0\uff09\u5c06\u6bcf\u4e2a\u65f6\u9891\u5355\u5143 \\((t, f)\\) \u6620\u5c04\u4e3a\u4e00\u4e2a\u5d4c\u5165\u5411\u91cf \\(v_{t,f} \\in \\mathbb{R}^D\\)\u3002\u8bad\u7ec3\u76ee\u6807\u4e3a\uff1a</p> </li> </ul> \\[\\mathcal{L} = \\|VV^T - YY^T\\|_F^2\\] <ul> <li> <p>\u5176\u4e2d \\(V\\) \u662f\u5d4c\u5165\u77e9\u9635\uff0c\\(Y\\) \u662f\u6e90\u5206\u914d\u7684\u5355\u70ed\u77e9\u9635\u3002\u4e58\u79ef \\(VV^T\\) \u662f\u4e00\u4e2a\u4eb2\u548c\u77e9\u9635\uff08\u4e24\u4e2a\u5355\u5143\u7684\u5d4c\u5165\u6709\u591a\u76f8\u4f3c\uff09\uff0c\u800c \\(YY^T\\) \u662f\u7406\u60f3\u7684\u4eb2\u548c\u5ea6\uff08\u82e5\u5c5e\u4e8e\u540c\u4e00\u6e90\u5219\u4e3a1\uff0c\u5426\u5219\u4e3a0\uff09\u3002\u63a8\u7406\u65f6\uff0c\u5bf9\u5d4c\u5165\u8fdb\u884c K-means \u805a\u7c7b\u4ea7\u751f\u4e8c\u503c\u63a9\u853d\u3002</p> </li> <li> <p>Conv-TasNet\uff08Luo \u548c Mesgarani\uff0c2019\uff09\u5b8c\u5168\u5728\u65f6\u57df\u4e2d\u64cd\u4f5c\uff0c\u7ed5\u8fc7\u4e86 STFT\u3002\u5b83\u5305\u542b\u4e09\u4e2a\u7ec4\u4ef6\uff1a</p> </li> </ul> <p></p> <ul> <li> <p>\u7f16\u7801\u5668\uff1a\u4e00\u4e2a\u4e00\u7ef4\u5377\u79ef\u5c06\u6df7\u5408\u6ce2\u5f62\u7684\u77ed\u7247\u6bb5\u6620\u5c04\u4e3a\u6f5c\u5728\u8868\u793a\u3002\u5bf9\u4e8e\u6df7\u5408\u4fe1\u53f7 \\(x \\in \\mathbb{R}^T\\)\uff0c\u7f16\u7801\u5668\u8f93\u51fa\u4e3a \\(w = \\text{ReLU}(U \\ast x) \\in \\mathbb{R}^{N \\times L}\\)\uff0c\u5176\u4e2d \\(U\\) \u662f\u4e00\u4e2a\u53ef\u5b66\u4e60\u7684\u57fa\uff08\u7c7b\u4f3c\u4e8e STFT \u57fa\u4f46\u4ece\u6570\u636e\u4e2d\u5b66\u4e60\uff09\uff0c\\(N\\) \u662f\u57fa\u51fd\u6570\u7684\u6570\u91cf\uff0c\\(L\\) \u662f\u7247\u6bb5\u6570\u3002\u7f16\u7801\u5668\u6838\u5927\u5c0f\u548c\u6b65\u957f\uff08\u901a\u5e38\u4e3a2ms\u548c1ms\uff09\u51b3\u5b9a\u4e86\u65f6\u95f4\u5206\u8fa8\u7387\u3002</p> </li> <li> <p>\u5206\u79bb\u5668\uff1a\u4e00\u4e2a\u65f6\u57df\u5377\u79ef\u7f51\u7edc\uff08TCN\uff09\u5904\u7406\u7f16\u7801\u540e\u7684\u6df7\u5408\u4fe1\u53f7\u5e76\u8f93\u51fa \\(C\\) \u4e2a\u63a9\u853d\u3002TCN \u5806\u53e0\u4e86\u6269\u5f20\u4e00\u7ef4\u6df1\u5ea6\u53ef\u5206\u79bb\u5377\u79ef\uff08\u6765\u81ea\u7b2c08\u7ae0\u7684\u9ad8\u6548\u5377\u79ef\uff09\uff0c\u8fd9\u4e9b\u5377\u79ef\u4ee5\u6307\u6570\u589e\u957f\u7684\u6269\u5f20\u56e0\u5b50 \\(1, 2, 4, \\ldots, 2^{B-1}\\) \u6392\u5217\u6210\u5757\uff0c\u91cd\u590d \\(R\\) \u6b21\u3002\u8fd9\u63d0\u4f9b\u4e86\u975e\u5e38\u5927\u7684\u611f\u53d7\u91ce\uff0c\u540c\u65f6\u4fdd\u6301\u8ba1\u7b97\u9ad8\u6548\u3002</p> </li> <li> <p>\u89e3\u7801\u5668\uff1a\u4e00\u4e2a\u8f6c\u7f6e\u4e00\u7ef4\u5377\u79ef\uff08\u4f7f\u7528\u53ef\u5b66\u4e60\u57fa \\(V\\)\uff09\u5c06\u6bcf\u4e2a\u63a9\u853d\u540e\u7684\u8868\u793a\u8f6c\u6362\u56de\u65f6\u57df\uff1a\\(\\hat{s}_c = V^T (M_c \\odot w)\\)\u3002</p> </li> <li> <p>Conv-TasNet \u663e\u8457\u4f18\u4e8e\u57fa\u4e8e\u8bed\u8c31\u56fe\u7684\u65b9\u6cd5\uff0c\u56e0\u4e3a\u5b66\u4e60\u5230\u7684\u7f16\u7801\u5668-\u89e3\u7801\u5668\u57fa\u53ef\u4ee5\u6355\u6349 STFT \u5e45\u5ea6\u6240\u4e22\u5f03\u7684\u4fe1\u606f\uff08\u7279\u522b\u662f\u76f8\u4f4d\uff09\u3002</p> </li> <li> <p>\u53cc\u8def\u5f84 RNN\uff08DPRNN\uff09\uff08Luo \u7b49\uff0c2020\uff09\u89e3\u51b3\u4e86\u5206\u79bb\u4e2d\u7684\u957f\u5e8f\u5217\u5efa\u6a21\u95ee\u9898\u3002DPRNN \u4e0d\u662f\u7528\u5355\u4e2a RNN \u6216 TCN \u5904\u7406\u6574\u4e2a\u7f16\u7801\u5e8f\u5217\uff0c\u800c\u662f\u5c06\u5e8f\u5217\u5206\u5272\u6210\u91cd\u53e0\u7684\u5757\uff0c\u5e76\u6cbf\u7740\u4e24\u6761\u8def\u5f84\u5e94\u7528 RNN\uff1a\u5757\u5185\u8def\u5f84\uff08\u5bf9\u6bcf\u4e2a\u5757\u5185\u7684\u5c40\u90e8\u6a21\u5f0f\u5efa\u6a21\uff09\u548c\u5757\u95f4\u8def\u5f84\uff08\u5bf9\u8de8\u5757\u7684\u5168\u5c40\u6a21\u5f0f\u5efa\u6a21\uff09\u3002\u8fd9\u4f7f RNN \u5e8f\u5217\u957f\u5ea6\u4ece \\(L\\) \u964d\u4f4e\u5230\u6bcf\u4e2a\u7ef4\u5ea6\u4e0a\u7684 \\(\\sqrt{L}\\)\uff1a</p> </li> </ul> \\[ \\begin{aligned} \\text{\u5757\u5185:} \\quad &amp; h_{k,n}^{\\text{\u5757\u5185}} = \\text{BiLSTM}_{\\text{\u5757\u5185}}(z_{k,n}) \\\\ \\text{\u5757\u95f4:} \\quad &amp; h_{k,n}^{\\text{\u5757\u95f4}} = \\text{BiLSTM}_{\\text{\u5757\u95f4}}(h_{k,n}^{\\text{\u5757\u5185}}) \\end{aligned} \\] <ul> <li> <p>\u5176\u4e2d \\(k\\) \u7d22\u5f15\u5757\uff0c\\(n\\) \u7d22\u5f15\u5757\u5185\u7684\u4f4d\u7f6e\u3002\u5757\u5185 LSTM \u5bf9\u56fa\u5b9a \\(k\\) \u7684\u5404 \\(n\\) \u5904\u7406\uff1b\u5757\u95f4 LSTM \u5bf9\u56fa\u5b9a \\(n\\) \u7684\u5404 \\(k\\) \u5904\u7406\u3002</p> </li> <li> <p>SepFormer\uff08Subakan \u7b49\uff0c2021\uff09\u7528 Transformer\uff08\u7b2c07\u7ae0\uff09\u66ff\u6362\u4e86\u53cc\u8def\u5f84\u6846\u67b6\u4e2d\u7684 RNN\u3002\u5757\u5185 Transformer \u901a\u8fc7\u81ea\u6ce8\u610f\u529b\u6355\u6349\u5c40\u90e8\u4f9d\u8d56\u5173\u7cfb\uff0c\u5757\u95f4 Transformer \u6355\u6349\u5168\u5c40\u4f9d\u8d56\u5173\u7cfb\u3002\u591a\u5934\u6ce8\u610f\u529b\u80fd\u591f\u5efa\u6a21\u957f\u7a0b\u4f9d\u8d56\u5173\u7cfb\u800c\u4e0d\u4f1a\u51fa\u73b0\u68af\u5ea6\u6d88\u5931\u95ee\u9898\uff08\u7b2c06\u7ae0\uff09\uff0c\u8fd9\u4f7f\u5f97 SepFormer \u5bf9\u4e8e\u957f\u5f55\u97f3\u7279\u522b\u6709\u6548\u3002SepFormer \u5728 WSJ0-2mix \u57fa\u51c6\u4e0a\u8fbe\u5230\u4e86\u6700\u5148\u8fdb\u7684\u7ed3\u679c\u3002</p> </li> <li> <p>\u7f6e\u6362\u4e0d\u53d8\u8bad\u7ec3\uff08PIT\uff09 \u89e3\u51b3\u4e86\u76d1\u7763\u5f0f\u6e90\u5206\u79bb\u4e2d\u7684\u4e00\u4e2a\u57fa\u672c\u95ee\u9898\uff1a\u6807\u7b7e\u5206\u914d\u6b67\u4e49\u3002\u5982\u679c\u7f51\u7edc\u6709\u4e24\u4e2a\u8f93\u51fa\uff08\u5bf9\u5e94\u4e24\u4e2a\u8bf4\u8bdd\u4eba\uff09\uff0c\u54ea\u4e2a\u8f93\u51fa\u5e94\u8be5\u5bf9\u5e94\u54ea\u4e2a\u8bf4\u8bdd\u4eba\uff1f\u6ca1\u6709\u81ea\u7136\u7684\u6392\u5e8f\u3002PIT \u8ba1\u7b97\u6240\u6709\u53ef\u80fd\u5206\u914d\u7684\u635f\u5931\u5e76\u53d6\u6700\u5c0f\u503c\uff1a</p> </li> </ul> \\[\\mathcal{L}_{\\text{PIT}} = \\min_{\\pi \\in \\mathcal{P}} \\sum_{c=1}^{C} \\ell(\\hat{s}_{\\pi(c)}, s_c)\\] <ul> <li> <p>\u5176\u4e2d \\(\\mathcal{P}\\) \u662f \\(\\{1, \\ldots, C\\}\\) \u7684\u6240\u6709\u6392\u5217\u96c6\u5408\uff0c\\(\\ell\\) \u662f\u6bcf\u4e2a\u6e90\u7684\u635f\u5931\uff08\u901a\u5e38\u662f\u5c3a\u5ea6\u4e0d\u53d8\u4fe1\u53f7\u5931\u771f\u6bd4 SI-SDR\uff09\u3002\u5bf9\u4e8e \\(C = 2\\) \u4e2a\u6e90\u53ea\u67092\u79cd\u6392\u5217\uff1b\u5bf9\u4e8e \\(C = 3\\) \u67096\u79cd\u3002\u5bf9\u4e8e\u66f4\u5927\u7684 \\(C\\)\uff0c\u53ef\u4ee5\u4f7f\u7528\u5308\u7259\u5229\u7b97\u6cd5\u9ad8\u6548\u8ba1\u7b97\u3002</p> </li> <li> <p>\u5c3a\u5ea6\u4e0d\u53d8\u4fe1\u53f7\u5931\u771f\u6bd4\uff08SI-SDR\uff09 \u662f\u6e90\u5206\u79bb\u7684\u6807\u51c6\u8bc4\u4f30\u6307\u6807\uff1a</p> </li> </ul> \\[ \\begin{aligned} s_{\\text{target}} &amp;= \\frac{\\langle \\hat{s}, s \\rangle}{\\|s\\|^2} s \\\\ e_{\\text{noise}} &amp;= \\hat{s} - s_{\\text{target}} \\\\ \\text{SI-SDR} &amp;= 10 \\log_{10} \\frac{\\|s_{\\text{target}}\\|^2}{\\|e_{\\text{noise}}\\|^2} \\end{aligned} \\] <ul> <li> <p>\u5176\u4e2d \\(\\hat{s}\\) \u662f\u4f30\u8ba1\u7684\u6e90\uff0c\\(s\\) \u662f\u771f\u5b9e\u503c\u3002SI-SDR \u5bf9\u4f30\u8ba1\u7684\u603b\u4f53\u5c3a\u5ea6\u4e0d\u53d8\uff0c\u8fd9\u662f\u671f\u671b\u7684\u7279\u6027\uff0c\u56e0\u4e3a\u7edd\u5bf9\u97f3\u91cf\u4e0d\u5982\u5206\u79bb\u8d28\u91cf\u91cd\u8981\u3002\u8f83\u9ad8\u7684 SI-SDR\uff08\u4ee5 dB \u4e3a\u5355\u4f4d\uff09\u66f4\u597d\u3002\u6700\u5148\u8fdb\u7684\u7cfb\u7edf\u5728 WSJ0-2mix \u4e0a\u5b9e\u73b0\u4e86\u7ea6 20-22 dB \u7684 SI-SDR \u6539\u8fdb\u3002</p> </li> <li> <p>\u97f3\u4e50\u6e90\u5206\u79bb\u5c06\u97f3\u4e50\u5f55\u97f3\u5206\u79bb\u6210\u58f0\u90e8\uff1a\u4eba\u58f0\u3001\u9f13\u3001\u8d1d\u65af\u548c\u5176\u4ed6\u4e50\u5668\u3002\u8fd9\u5b9e\u73b0\u4e86\u5361\u62c9OK\uff08\u53bb\u9664\u4eba\u58f0\uff09\u3001\u91cd\u65b0\u6df7\u97f3\uff08\u8c03\u6574\u4e50\u5668\u7535\u5e73\uff09\u548c\u8f6c\u5f55\uff08\u4e00\u6b21\u5206\u6790\u4e00\u79cd\u4e50\u5668\uff09\u7b49\u5e94\u7528\u3002</p> </li> <li> <p>Open-Unmix\uff08Stoter \u7b49\uff0c2019\uff09\u662f\u4e00\u4e2a\u53c2\u8003\u57fa\u7ebf\uff0c\u4f7f\u7528\u4e09\u5c42\u53cc\u5411 LSTM \u5728\u5e45\u5ea6 STFT \u57df\u4e2d\u4e3a\u6bcf\u4e2a\u6e90\u9884\u6d4b\u8f6f\u63a9\u853d\u3002\u5b83\u4f7f\u7528\u4e13\u7528\u6a21\u578b\u72ec\u7acb\u5904\u7406\u6bcf\u4e2a\u6e90\u3002Open-Unmix \u867d\u7b80\u5355\u4f46\u6709\u6548\uff0c\u5728 MUSDB18 \u4e0a\u5efa\u7acb\u4e86\u53ef\u91cd\u590d\u7684\u57fa\u51c6\u3002</p> </li> <li> <p>Demucs\uff08Defossez \u7b49\uff0c2019\uff1b2021\u5e74\u66f4\u65b0\u4e3a Hybrid Demucs\uff09\u4f7f\u7528\u76f4\u63a5\u5728\u6ce2\u5f62\u4e0a\u64cd\u4f5c\u7684 U-Net \u67b6\u6784\uff08\u7b2c08\u7ae0\uff09\u3002\u7f16\u7801\u5668\u901a\u8fc7\u6b65\u957f\u5377\u79ef\u538b\u7f29\u6df7\u5408\u4fe1\u53f7\uff0c\u89e3\u7801\u5668\u901a\u8fc7\u8f6c\u7f6e\u5377\u79ef\u548c\u8df3\u8dc3\u8fde\u63a5\u5c06\u5176\u6269\u5c55\u56de\u6765\uff0c\u6bcf\u4e2a\u6e90\u6709\u5404\u81ea\u7684\u89e3\u7801\u5668\u5934\u3002Hybrid Demucs \u7ed3\u5408\u4e86\u65f6\u57df\u548c\u9891\u57df\u5904\u7406\uff1a\u7f16\u7801\u5668\u5177\u6709\u5e76\u884c\u7684\u65f6\u57df\u548c STFT \u5206\u652f\uff0c\u5176\u7279\u5f81\u5728\u89e3\u7801\u5668\u4e4b\u524d\u878d\u5408\u3002\u8fd9\u540c\u65f6\u6355\u6349\u4e86\u7cbe\u7ec6\u7684\u65f6\u95f4\u7ec6\u8282\u548c\u9891\u8c31\u7ed3\u6784\u3002</p> </li> <li> <p>Demucs \u5728 MUSDB18 \u4e0a\u8fbe\u5230\u4e86\u6700\u5148\u8fdb\u7684\u5206\u79bb\u8d28\u91cf\uff0c\u7279\u522b\u662f\u4eba\u58f0\u5206\u79bb\u65b9\u9762\u3002\u5176 U-Net \u67b6\u6784\u8ba9\u4eba\u8054\u60f3\u5230\u7b2c08\u7ae0\u4e2d\u7684\u56fe\u50cf\u5206\u5272\u67b6\u6784\uff0c\u5c06\u5206\u79bb\u95ee\u9898\u89c6\u4e3a\u4e00\u79cd\"\u97f3\u9891\u5206\u5272\"\u5f62\u5f0f\u3002</p> </li> <li> <p>\u4e3b\u52a8\u964d\u566a\uff08ANC\uff09 \u901a\u8fc7\u751f\u6210\u4e00\u4e2a\u4e0e\u566a\u58f0\u76f8\u6d88\u5e72\u6d89\u7684\u53cd\u566a\u58f0\u4fe1\u53f7\u6765\u51cf\u5c11\u4e0d\u9700\u8981\u7684\u58f0\u97f3\u3002\u60f3\u8c61\u4e00\u4e0b\u964d\u566a\u8033\u673a\uff1a\u9ea6\u514b\u98ce\u62fe\u53d6\u73af\u5883\u566a\u58f0\uff0cANC \u7cfb\u7edf\u751f\u6210\u4e00\u4e2a\u53cd\u76f8\u7248\u672c\uff0c\u6df7\u5408\u4fe1\u53f7\uff08\u566a\u58f0 + \u53cd\u566a\u58f0\uff09\u7406\u60f3\u60c5\u51b5\u4e0b\u62b5\u6d88\u4e3a\u9759\u97f3\u3002</p> </li> <li> <p>\u7269\u7406\u539f\u7406\u5f88\u7b80\u5355\uff1a\u5982\u679c\u566a\u58f0\u662f \\(n(t)\\)\uff0c\u5728\u7a7a\u95f4\u540c\u4e00\u70b9\u751f\u6210 \\(-n(t)\\) \u5219\u4ea7\u751f\u9759\u97f3\uff1a\\(n(t) + (-n(t)) = 0\\)\u3002\u6311\u6218\u5728\u4e8e\u53cd\u566a\u58f0\u5fc5\u987b\u5728\u65f6\u95f4\u3001\u5e45\u5ea6\u548c\u76f8\u4f4d\u4e0a\u7cbe\u786e\u5bf9\u9f50\u3002\u5373\u4f7f\u5f88\u5c0f\u7684\u8bef\u5dee\u4e5f\u4f1a\u4ea7\u751f\u6b8b\u7559\u566a\u58f0\u6216\u4f2a\u5f71\u3002</p> </li> <li> <p>\u524d\u9988\u5f0f ANC \u4f7f\u7528\u4e00\u4e2a\u53c2\u8003\u9ea6\u514b\u98ce\uff0c\u5728\u566a\u58f0\u5230\u8fbe\u542c\u8005\u4e4b\u524d\u62fe\u53d6\u566a\u58f0\u3002\u7cfb\u7edf\u6709\u65f6\u95f4\u5904\u7406\u566a\u58f0\u5e76\u751f\u6210\u53cd\u566a\u58f0\u3002\u53c2\u8003\u4fe1\u53f7\u901a\u8fc7\u4e00\u4e2a\u81ea\u9002\u5e94\u6ee4\u6ce2\u5668\uff0c\u5176\u8f93\u51fa\u5728\u8bef\u5dee\u9ea6\u514b\u98ce\uff08\u9760\u8fd1\u542c\u8005\uff09\u5904\u4ece\u566a\u58f0\u4e2d\u51cf\u53bb\u3002\u8fd9\u9002\u7528\u4e8e\u53ef\u9884\u6d4b\u7684\u5bbd\u5e26\u566a\u58f0\uff08\u5f15\u64ce\u55e1\u55e1\u58f0\u3001\u98ce\u6247\u566a\u58f0\uff09\u3002</p> </li> <li> <p>\u53cd\u9988\u5f0f ANC \u4ec5\u4f7f\u7528\u542c\u8005\u8033\u8fb9\u7684\u8bef\u5dee\u9ea6\u514b\u98ce\u3002\u7cfb\u7edf\u4ece\u6b8b\u4f59\u4fe1\u53f7\uff08\u542c\u8005\u5b9e\u9645\u542c\u5230\u7684\uff09\u4e2d\u4f30\u8ba1\u566a\u58f0\u5e76\u8c03\u6574\u53cd\u566a\u58f0\u3002\u53cd\u9988\u5f0f ANC \u66f4\u7b80\u5355\uff08\u4e0d\u9700\u8981\u53c2\u8003\u9ea6\u514b\u98ce\uff09\uff0c\u4f46\u5e26\u5bbd\u6709\u9650\u4e14\u53ef\u80fd\u53d8\u5f97\u4e0d\u7a33\u5b9a\u3002</p> </li> <li> <p>\u81ea\u9002\u5e94\u6ee4\u6ce2\u662f ANC \u80cc\u540e\u7684\u6570\u5b66\u5f15\u64ce\u3002\u6ee4\u6ce2\u5668\u7cfb\u6570\u5fc5\u987b\u4e0d\u65ad\u9002\u5e94\u53d8\u5316\u7684\u566a\u58f0\u73af\u5883\u3002\u6700\u5e38\u7528\u7684\u7b97\u6cd5\u662f\u6700\u5c0f\u5747\u65b9\uff08LMS\uff09\u6ee4\u6ce2\u5668\u3002</p> </li> </ul> <p></p> <ul> <li>LMS \u7b97\u6cd5\uff1a\u4e00\u4e2a\u5177\u6709\u7cfb\u6570 \\(\\mathbf{w} = [w_0, w_1, \\ldots, w_{L-1}]^T\\) \u7684 FIR \u6ee4\u6ce2\u5668\u5904\u7406\u53c2\u8003\u4fe1\u53f7 \\(\\mathbf{x}(n) = [x(n), x(n-1), \\ldots, x(n-L+1)]^T\\)\u3002\u8f93\u51fa\u4e3a \\(y(n) = \\mathbf{w}^T \\mathbf{x}(n)\\)\uff0c\u8bef\u5dee\u4e3a \\(e(n) = d(n) - y(n)\\)\uff08\u5176\u4e2d \\(d(n)\\) \u662f\u671f\u671b/\u4e3b\u4fe1\u53f7\uff09\uff0c\u6743\u91cd\u66f4\u65b0\u4e3a\uff1a</li> </ul> \\[\\mathbf{w}(n+1) = \\mathbf{w}(n) + \\mu \\, e(n) \\, \\mathbf{x}(n)\\] <ul> <li> <p>\u5176\u4e2d \\(\\mu\\) \u662f\u6b65\u957f\uff08\u5b66\u4e60\u7387\uff09\u3002\u8fd9\u662f\u5bf9\u5747\u65b9\u8bef\u5dee \\(E[e^2(n)]\\) \u7684\u4e00\u4e2a\u968f\u673a\u68af\u5ea6\u4e0b\u964d\u6b65\u9aa4\uff0c\u4f7f\u7528\u77ac\u65f6\u68af\u5ea6\u4f30\u8ba1 \\(-2 e(n) \\mathbf{x}(n)\\) \u4ee3\u66ff\u771f\u5b9e\u68af\u5ea6\uff08\u7b2c03\u7ae0\u7684\u68af\u5ea6\u4e0b\u964d\u548c\u7b2c06\u7ae0\u7684 SGD\uff09\u3002</p> </li> <li> <p>\u6b65\u957f \\(\\mu\\) \u63a7\u5236\u6536\u655b\u901f\u5ea6\u4e0e\u7a33\u6001\u8bef\u5dee\u4e4b\u95f4\u7684\u6743\u8861\u3002\u8fc7\u5927\u5219\u6ee4\u6ce2\u5668\u632f\u8361\u6216\u53d1\u6563\uff1b\u8fc7\u5c0f\u5219\u81ea\u9002\u5e94\u901f\u5ea6\u8fdf\u7f13\u3002\u7a33\u5b9a\u6761\u4ef6\u4e3a \\(0 &lt; \\mu &lt; 2 / (\\lambda_{\\max})\\)\uff0c\u5176\u4e2d \\(\\lambda_{\\max}\\) \u662f\u8f93\u5165\u81ea\u76f8\u5173\u77e9\u9635 \\(R = E[\\mathbf{x}\\mathbf{x}^T]\\) \u7684\u6700\u5927\u7279\u5f81\u503c\u3002</p> </li> <li> <p>\u5f52\u4e00\u5316 LMS\uff08NLMS\uff09 \u901a\u8fc7\u8f93\u5165\u529f\u7387\u5bf9\u6b65\u957f\u8fdb\u884c\u5f52\u4e00\u5316\uff0c\u4f7f\u6536\u655b\u4e0e\u4fe1\u53f7\u7535\u5e73\u65e0\u5173\uff1a</p> </li> </ul> \\[\\mathbf{w}(n+1) = \\mathbf{w}(n) + \\frac{\\mu}{\\|\\mathbf{x}(n)\\|^2 + \\epsilon} \\, e(n) \\, \\mathbf{x}(n)\\] <ul> <li> <p>\u5176\u4e2d \\(\\epsilon\\) \u662f\u4e00\u4e2a\u5c0f\u7684\u6b63\u5219\u5316\u5e38\u6570\uff0c\u4ee5\u9632\u6b62\u9664\u96f6\u3002NLMS \u6bd4 LMS \u66f4\u53ef\u9760\u5730\u6536\u655b\uff0c\u56e0\u4e3a\u6709\u6548\u6b65\u957f\u81ea\u9002\u5e94\u5730\u9002\u5e94\u8f93\u5165\u529f\u7387\u3002</p> </li> <li> <p>\u9012\u5f52\u6700\u5c0f\u4e8c\u4e58\uff08RLS\uff09 \u662f\u4e00\u79cd\u6536\u655b\u66f4\u5feb\u7684\u66ff\u4ee3\u65b9\u6cd5\uff0c\u5b83\u6700\u5c0f\u5316\u52a0\u6743\u6700\u5c0f\u4e8c\u4e58\u4ee3\u4ef7 \\(\\sum_{k=1}^{n} \\lambda^{n-k} e^2(k)\\)\uff0c\u5176\u4e2d \\(\\lambda \\in (0, 1]\\) \u662f\u9057\u5fd8\u56e0\u5b50\u3002RLS \u7ef4\u62a4\u9006\u81ea\u76f8\u5173\u77e9\u9635\u7684\u4f30\u8ba1\u5e76\u9012\u5f52\u66f4\u65b0\uff0c\u4ee5\u6bcf\u4e2a\u6837\u672c \\(O(L^2)\\) \u7684\u8ba1\u7b97\u6210\u672c\uff08\u76f8\u5bf9\u4e8e LMS \u7684 \\(O(L)\\)\uff09\u5b9e\u73b0\u6700\u4f18\u6536\u655b\u3002</p> </li> <li> <p>\u964d\u566a\u4e0e\u8bed\u97f3\u589e\u5f3a\u65e8\u5728\u63d0\u9ad8\u5608\u6742\u5f55\u97f3\u4e2d\u7684\u8bed\u97f3\u8d28\u91cf\u548c\u53ef\u61c2\u5ea6\u3002\u4e0e\u6e90\u5206\u79bb\uff08\u5206\u79bb\u4e0d\u540c\u7684\u6e90\uff09\u4e0d\u540c\uff0c\u8bed\u97f3\u589e\u5f3a\u4e13\u95e8\u9488\u5bf9\u8bed\u97f3\u52a0\u566a\u58f0\u7684\u60c5\u51b5\uff0c\u4ece\u5e26\u566a\u89c2\u6d4b\u4e2d\u6062\u590d\u5e72\u51c0\u7684\u8bed\u97f3\u3002</p> </li> <li> <p>\u8c31\u51cf\u6cd5\u662f\u6700\u7b80\u5355\u7684\u65b9\u6cd5\u3002\u5728\u7eaf\u566a\u58f0\u5e27\uff08\u7531\u6587\u4ef603\u4e2d\u7684 VAD \u68c0\u6d4b\uff09\u671f\u95f4\uff0c\u4f30\u8ba1\u566a\u58f0\u9891\u8c31 \\(|\\hat{N}(f)|^2\\)\u3002\u7136\u540e\u5c06\u5176\u4ece\u6bcf\u4e2a\u5e27\u4e2d\u51cf\u53bb\uff1a</p> </li> </ul> \\[|\\hat{S}(f)|^2 = \\max(|X(f)|^2 - \\alpha |\\hat{N}(f)|^2, \\beta |X(f)|^2)\\] <ul> <li> <p>\u5176\u4e2d \\(\\alpha\\) \u662f\u8fc7\u51cf\u56e0\u5b50\uff08\u901a\u5e38\u4e3a1-4\uff0c\u6fc0\u8fdb\u7684\u51cf\u6cd5\u53bb\u9664\u66f4\u591a\u566a\u58f0\u4f46\u5f15\u5165\u66f4\u591a\u4f2a\u5f71\uff09\uff0c\\(\\beta\\) \u662f\u9891\u8c31\u5730\u677f\uff0c\u9632\u6b62\u51fa\u73b0\u8d1f\u503c\u5e76\u51cf\u5c11\"\u97f3\u4e50\u566a\u58f0\"\u4f2a\u5f71\uff08\u542c\u8d77\u6765\u50cf\u968f\u673a\u97f3\u7b26\u7684\u5b64\u7acb\u97f3\u8c03\u6b8b\u7559\uff09\u3002</p> </li> <li> <p>\u7ef4\u7eb3\u6ee4\u6ce2\u63d0\u4f9b\u4e86\u5e72\u51c0\u8bed\u97f3\u9891\u8c31\u7684\u6700\u5c0f\u5747\u65b9\u8bef\u5dee\u4f30\u8ba1\uff1a</p> </li> </ul> \\[\\hat{S}(t, f) = \\frac{|S(t,f)|^2}{|S(t,f)|^2 + |N(t,f)|^2} \\cdot X(t, f) = G(t, f) \\cdot X(t, f)\\] <ul> <li> <p>\u7ef4\u7eb3\u589e\u76ca \\(G(t, f) = \\text{SNR}(t, f) / (1 + \\text{SNR}(t, f))\\) \u7684\u8303\u56f4\u4ece0\uff08\u7eaf\u566a\u58f0\uff09\u52301\uff08\u7eaf\u8bed\u97f3\uff09\uff0c\u4f5c\u4e3a\u4e00\u4e2a\u8f6f\u63a9\u853d\u3002\u6311\u6218\u5728\u4e8e\u4f30\u8ba1\u8bed\u97f3\u548c\u566a\u58f0\u7684\u529f\u7387\u8c31\u3002\u5148\u9a8c SNR \\(\\xi(t, f) = |S(t,f)|^2 / |N(t,f)|^2\\) \u4f7f\u7528\"\u51b3\u7b56\u5bfc\u5411\"\u65b9\u6cd5\u4f30\u8ba1\uff1a\u5f53\u524d\u5e27\u4f30\u8ba1\u4e0e\u524d\u4e00\u5e27\u7ef4\u7eb3\u6ee4\u6ce2\u8f93\u51fa\u7684\u5e73\u6ed1\u7ec4\u5408\u3002</p> </li> <li> <p>\u795e\u7ecf\u8bed\u97f3\u589e\u5f3a\u4f7f\u7528\u6df1\u5ea6\u5b66\u4e60\u6765\u4f30\u8ba1\u63a9\u853d\uff08\u5982\u7ef4\u7eb3\u589e\u76ca\uff09\u6216\u76f4\u63a5\u4f30\u8ba1\u5e72\u51c0\u8bed\u8c31\u56fe\u3002\u67b6\u6784\u4ece\u7b80\u5355\u7684\u524d\u9988\u7f51\u7edc\u5230 U-Net\uff08\u7b2c08\u7ae0\uff09\u3001CRN\uff08\u5377\u79ef\u9012\u5f52\u7f51\u7edc\uff09\u548c Transformer\u3002</p> </li> <li> <p>DCCRN\uff08\u6df1\u5ea6\u590d\u6570\u5377\u79ef\u9012\u5f52\u7f51\u7edc\uff09\u5728\u590d\u6570 STFT\uff08\u5e45\u5ea6\u548c\u76f8\u4f4d\uff09\u4e0a\u64cd\u4f5c\uff0c\u4f7f\u7528\u81ea\u7136\u5904\u7406\u5b9e\u90e8\u548c\u865a\u90e8\u7684\u590d\u6570\u503c\u5377\u79ef\u3002\u8fd9\u907f\u514d\u4e86\u4ec5\u5e45\u5ea6\u65b9\u6cd5\u6240\u56f0\u6270\u7684\u76f8\u4f4d\u4f30\u8ba1\u95ee\u9898\u3002</p> </li> <li> <p>FullSubNet \u4f7f\u7528\u53cc\u8def\u5f84\u67b6\u6784\uff0c\u5305\u542b\u4e00\u4e2a\u5168\u9891\u5e26\u6a21\u578b\uff08\u6355\u6349\u5168\u5c40\u9891\u8c31\u6a21\u5f0f\uff09\u548c\u4e00\u4e2a\u5b50\u9891\u5e26\u6a21\u578b\uff08\u6355\u6349\u5c40\u90e8\u8c10\u6ce2\u7ec6\u8282\uff09\u3002\u5168\u9891\u5e26\u6a21\u578b\u5904\u7406\u6574\u4e2a\u9891\u8c31\uff0c\u800c\u5b50\u9891\u5e26\u6a21\u578b\u5904\u7406\u4ee5\u6bcf\u4e2a\u9891\u7387\u5355\u5143\u4e3a\u4e2d\u5fc3\u7684\u7a84\u9891\u5e26\u3002\u5b83\u4eec\u7684\u8f93\u51fa\u88ab\u7ec4\u5408\u7528\u4e8e\u6700\u7ec8\u7684\u63a9\u853d\u4f30\u8ba1\u3002</p> </li> <li> <p>DNS\uff08\u6df1\u5ea6\u566a\u58f0\u6291\u5236\uff09\u6311\u6218\u8d5b\u7531\u5fae\u8f6f\u6bcf\u5e74\u4e3e\u529e\uff0c\u5bf9\u8bed\u97f3\u589e\u5f3a\u7cfb\u7edf\u8fdb\u884c\u57fa\u51c6\u6d4b\u8bd5\u3002\u83b7\u80dc\u8005\u901a\u5e38\u4f7f\u7528\u5927\u89c4\u6a21\u8bad\u7ec3\uff0c\u5305\u542b\u591a\u79cd\u566a\u58f0\u7c7b\u578b\u3001\u6570\u636e\u589e\u5f3a\uff08\u4ee5\u5404\u79cd SNR \u6dfb\u52a0\u566a\u58f0\u3001\u6df7\u54cd\u3001\u7f16\u89e3\u7801\u5668\u4f2a\u5f71\uff09\u4ee5\u53ca\u652f\u6301\u5b9e\u65f6\u5904\u7406\u7684\u67b6\u6784\u3002</p> </li> <li> <p>\u56de\u58f0\u6d88\u9664\u5728\u53cc\u5411\u901a\u4fe1\u4e2d\u53bb\u9664\u58f0\u5b66\u56de\u58f0\u3002\u5f53\u4f60\u5728\u7535\u8bdd\u901a\u8bdd\u4e2d\u65f6\uff0c\u8fdc\u7aef\u8bf4\u8bdd\u4eba\u7684\u58f0\u97f3\u901a\u8fc7\u4f60\u7684\u626c\u58f0\u5668\u64ad\u653e\uff0c\u5728\u623f\u95f4\u5185\u53cd\u5f39\uff0c\u5e76\u88ab\u4f60\u7684\u9ea6\u514b\u98ce\u62fe\u53d6\uff0c\u4ea7\u751f\u8fdc\u7aef\u8bf4\u8bdd\u4eba\u542c\u5230\u7684\u56de\u58f0\u3002\u58f0\u5b66\u56de\u58f0\u6d88\u9664\uff08AEC\uff09 \u5bf9\u4ece\u626c\u58f0\u5668\u5230\u9ea6\u514b\u98ce\u7684\u58f0\u5b66\u8def\u5f84\u8fdb\u884c\u5efa\u6a21\u5e76\u51cf\u53bb\u9884\u6d4b\u7684\u56de\u58f0\u3002</p> </li> <li> <p>\u58f0\u5b66\u8def\u5f84\u88ab\u5efa\u6a21\u4e3a\u4e00\u4e2a\u81ea\u9002\u5e94 FIR \u6ee4\u6ce2\u5668\uff08\u4f7f\u7528 LMS \u6216 NLMS\uff09\uff0c\u4ee5\u8fdc\u7aef\u4fe1\u53f7\u4e3a\u8f93\u5165\u3002\u6ee4\u6ce2\u5668\u5bf9\u623f\u95f4\u8109\u51b2\u54cd\u5e94\u8fdb\u884c\u5efa\u6a21\uff0c\u5305\u62ec\u76f4\u8fbe\u8def\u5f84\u3001\u65e9\u671f\u53cd\u5c04\u548c\u665a\u671f\u6df7\u54cd\u3002\u623f\u95f4\u8109\u51b2\u54cd\u5e94\u53ef\u80fd\u957f\u8fbe\u6570\u767e\u6beb\u79d2\uff0c\u9700\u8981\u6570\u5343\u4e2a\u62bd\u5934\u7684\u6ee4\u6ce2\u5668\u3002</p> </li> <li> <p>\u53cc\u8bb2\u68c0\u6d4b\u5bf9 AEC \u81f3\u5173\u91cd\u8981\uff1a\u5f53\u8fd1\u7aef\u548c\u8fdc\u7aef\u8bf4\u8bdd\u4eba\u540c\u65f6\u8bf4\u8bdd\u65f6\uff0c\u81ea\u9002\u5e94\u6ee4\u6ce2\u5668\u5fc5\u987b\u51bb\u7ed3\uff08\u505c\u6b62\u66f4\u65b0\uff09\uff0c\u4ee5\u9632\u6b62\u5176\u62b5\u6d88\u8fd1\u7aef\u8bf4\u8bdd\u4eba\u7684\u58f0\u97f3\u3002\u53cc\u8bb2\u68c0\u6d4b\u5668\u5c06\u8bef\u5dee\u4fe1\u53f7\u7684\u80fd\u91cf\u4e0e\u8fdc\u7aef\u4fe1\u53f7\u80fd\u91cf\u8fdb\u884c\u6bd4\u8f83\uff1b\u65e0\u6cd5\u7528\u8fdc\u7aef\u4fe1\u53f7\u89e3\u91ca\u7684\u8bef\u5dee\u80fd\u91cf\u7a81\u7136\u589e\u52a0\u8868\u660e\u5b58\u5728\u8fd1\u7aef\u8bed\u97f3\u3002</p> </li> <li> <p>\u8fdc\u7aef\u4fe1\u53f7 \\(x(n)\\) \u4e0e\u9ea6\u514b\u98ce\u4fe1\u53f7 \\(d(n)\\) \u4e4b\u95f4\u7684\u5f52\u4e00\u5316\u4e92\u76f8\u5173\u63d0\u4f9b\u4e86\u4e00\u4e2a\u53cc\u8bb2\u6307\u793a\u7b26\uff1a</p> </li> </ul> \\[\\xi(n) = \\frac{|\\sum_{k=0}^{L-1} x(n-k) d(n-k)|}{\\sqrt{\\sum_{k} x^2(n-k)} \\sqrt{\\sum_{k} d^2(n-k)}}\\] <ul> <li> <p>\u5728\u5355\u8bb2\u671f\u95f4\uff08\u4ec5\u8fdc\u7aef\uff09\uff0c\\(\\xi\\) \u8f83\u9ad8\uff0c\u56e0\u4e3a \\(d\\) \u4e3b\u8981\u662f \\(x\\) \u7684\u56de\u58f0\u3002\u5728\u53cc\u8bb2\u671f\u95f4\uff0c\\(\\xi\\) \u4e0b\u964d\uff0c\u56e0\u4e3a\u8fd1\u7aef\u8bed\u97f3\u4e0e \\(x\\) \u4e0d\u76f8\u5173\u3002</p> </li> <li> <p>\u73b0\u4ee3 AEC \u7cfb\u7edf\u5c06\u81ea\u9002\u5e94\u6ee4\u6ce2\u4e0e\u795e\u7ecf\u7f51\u7edc\u76f8\u7ed3\u5408\uff1a\u81ea\u9002\u5e94\u6ee4\u6ce2\u5668\u63d0\u4f9b\u521d\u59cb\u56de\u58f0\u4f30\u8ba1\uff0c\u795e\u7ecf\u7f51\u7edc\uff08\u7c7b\u4f3c\u4e8e\u4e0a\u8ff0\u8bed\u97f3\u589e\u5f3a\u6a21\u578b\uff09\u6e05\u7406\u6b8b\u4f59\u56de\u58f0\u5e76\u5904\u7406\u7ebf\u6027\u6ee4\u6ce2\u5668\u65e0\u6cd5\u6355\u6349\u7684\u975e\u7ebf\u6027\uff08\u626c\u58f0\u5668\u5931\u771f\uff09\u3002</p> </li> <li> <p>\u5206\u79bb\u4e0e\u589e\u5f3a\u7684\u8bc4\u4f30\u6307\u6807\uff1a</p> <ul> <li>SI-SDR\uff08\u5982\u4e0a\u5b9a\u4e49\uff09\uff1a\u6e90\u5206\u79bb\u7684\u6807\u51c6\u6307\u6807\u3002</li> <li>SDR\uff08\u4fe1\u53f7\u5931\u771f\u6bd4\uff09\uff1a\u6765\u81ea BSS Eval\uff0c\u8861\u91cf\u5305\u62ec\u4f2a\u5f71\u548c\u5e72\u6270\u5728\u5185\u7684\u6574\u4f53\u5206\u79bb\u8d28\u91cf\u3002</li> <li>PESQ\uff08\u8bed\u97f3\u8d28\u91cf\u611f\u77e5\u8bc4\u4f30\uff09\uff1aITU \u6807\u51c6\uff0c\u9884\u6d4b\u4e3b\u89c2\u8d28\u91cf\u5206\u6570\u3002\u8303\u56f4\uff1a-0.5 \u81f3 4.5\u3002</li> <li>STOI\uff08\u77ed\u65f6\u5ba2\u89c2\u53ef\u61c2\u5ea6\uff09\uff1a\u9884\u6d4b\u8bed\u97f3\u53ef\u61c2\u5ea6\u3002\u8303\u56f4\uff1a0 \u81f3 1\u3002</li> <li>DNSMOS\uff1a\u5fae\u8f6f\u7684\u6df1\u5ea6\u566a\u58f0\u6291\u5236 MOS \u9884\u6d4b\u5668\uff0c\u4e00\u4e2a\u8bad\u7ec3\u7528\u4e8e\u9884\u6d4b\u4eba\u7c7b MOS \u5206\u6570\u7684\u795e\u7ecf\u7f51\u7edc\uff0c\u65e0\u9700\u5e72\u51c0\u7684\u53c2\u8003\u97f3\u9891\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2009%3A%20audio%20and%20speech/05.%20source%20separation%20and%20noise/#colab-notebook","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ul> <li>\u4efb\u52a1 1\uff1a\u7528\u4e8e\u6e90\u5206\u79bb\u7684\u72ec\u7acb\u6210\u5206\u5206\u6790\u3002 \u5b9e\u73b0 FastICA \u6765\u5206\u79bb\u4e24\u4e2a\u6df7\u5408\u97f3\u9891\u6e90\uff0c\u6f14\u793a\u786e\u5b9a\u60c5\u51b5\uff08\u6e90\u4e0e\u9ea6\u514b\u98ce\u6570\u91cf\u76f8\u7b49\uff09\u4e0b\u7684\u7ecf\u5178\u9e21\u5c3e\u9152\u4f1a\u89e3\u51b3\u65b9\u6848\u3002</li> </ul> <pre><code>import jax\nimport jax.numpy as jnp\nimport jax.random as jr\nimport matplotlib.pyplot as plt\n\n# \u751f\u6210\u4e24\u4e2a\u6e90\u4fe1\u53f7\nsr = 8000\nduration = 1.0\nt = jnp.linspace(0, duration, int(sr * duration))\n\n# \u6e90 1\uff1a\u6b63\u5f26\u6ce2\uff08\u7c7b\u4f3c\u97f3\u8c03\uff09\ns1 = jnp.sin(2 * jnp.pi * 440 * t) + 0.3 * jnp.sin(2 * jnp.pi * 880 * t)\n\n# \u6e90 2\uff1a\u952f\u9f7f\u6ce2\uff08\u4e30\u5bcc\u7684\u8c10\u6ce2\uff09\ns2 = 2 * (t * 200 % 1) - 1  # 200 Hz \u952f\u9f7f\u6ce2\n\n# \u5f52\u4e00\u5316\u6e90\u4fe1\u53f7\ns1 = s1 / jnp.max(jnp.abs(s1))\ns2 = s2 / jnp.max(jnp.abs(s2))\nsources = jnp.stack([s1, s2])  # (2, T)\n\n# \u6df7\u53e0\u77e9\u9635\uff08\u7b97\u6cd5\u672a\u77e5\uff09\nA = jnp.array([[0.8, 0.4],\n               [0.3, 0.9]])\nmixtures = A @ sources  # (2, T)\n\n# FastICA \u5b9e\u73b0\ndef whiten(X):\n    \"\"\"\u6570\u636e\u4e2d\u5fc3\u5316\u4e0e\u767d\u5316\u3002\"\"\"\n    X_centered = X - jnp.mean(X, axis=1, keepdims=True)\n    cov = (X_centered @ X_centered.T) / X_centered.shape[1]\n    eigvals, eigvecs = jnp.linalg.eigh(cov)\n    D_inv_sqrt = jnp.diag(1.0 / jnp.sqrt(eigvals + 1e-8))\n    whitening = D_inv_sqrt @ eigvecs.T\n    return whitening @ X_centered, whitening\n\ndef fastica(X, n_components=2, max_iter=200, tol=1e-6):\n    \"\"\"\u4f7f\u7528 tanh \u975e\u7ebf\u6027\u7684 FastICA\uff08\u8d1f\u71b5\u8fd1\u4f3c\uff09\u3002\"\"\"\n    X_white, whitening = whiten(X)\n    n, T = X_white.shape\n\n    key = jr.PRNGKey(42)\n    W = jr.normal(key, (n_components, n))\n    # \u6b63\u4ea4\u5316 W\n    U, _, Vt = jnp.linalg.svd(W, full_matrices=False)\n    W = U @ Vt\n\n    for iteration in range(max_iter):\n        W_old = W.copy()\n\n        # \u5bf9\u6bcf\u4e2a\u5206\u91cf\n        for i in range(n_components):\n            w = W[i]\n            # w^T X_white: (T,)\n            wx = w @ X_white  # (T,)\n\n            # g(u) = tanh(u), g'(u) = 1 - tanh^2(u)\n            g_wx = jnp.tanh(wx)\n            g_prime_wx = 1 - g_wx ** 2\n\n            # Newton \u66f4\u65b0: w_new = E[X * g(w^T X)] - E[g'(w^T X)] * w\n            w_new = jnp.mean(X_white * g_wx[None, :], axis=1) - \\\n                    jnp.mean(g_prime_wx) * w\n\n            # \u4e0e\u4e4b\u524d\u7684\u5206\u91cf\u53bb\u76f8\u5173\uff08\u6d88\u53bb\u6cd5\uff09\n            for j in range(i):\n                w_new = w_new - jnp.dot(w_new, W[j]) * W[j]\n\n            w_new = w_new / jnp.linalg.norm(w_new)\n            W = W.at[i].set(w_new)\n\n        # \u68c0\u67e5\u6536\u655b\n        convergence = jnp.min(jnp.abs(jnp.diag(W @ W_old.T)))\n        if convergence &gt; 1 - tol:\n            print(f\"FastICA \u5728 {iteration + 1} \u6b21\u8fed\u4ee3\u540e\u6536\u655b\")\n            break\n\n    # \u89e3\u6df7\u77e9\u9635\n    unmixing = W @ whitening\n    recovered = unmixing @ X\n    return recovered, unmixing\n\nrecovered, W_unmix = fastica(mixtures)\n\n# \u4fee\u590d\u7b26\u53f7\u6b67\u4e49\uff08ICA \u53ef\u80fd\u7ffb\u8f6c\u7b26\u53f7\uff09\nfor i in range(2):\n    if jnp.corrcoef(recovered[i], sources[i])[0, 1] &lt; -0.5:\n        recovered = recovered.at[i].set(-recovered[i])\n\n# \u5982\u679c\u6e90\u88ab\u4ea4\u6362\uff0c\u4fee\u590d\u6392\u5217\ncorr_00 = jnp.abs(jnp.corrcoef(recovered[0], sources[0])[0, 1])\ncorr_01 = jnp.abs(jnp.corrcoef(recovered[0], sources[1])[0, 1])\nif corr_01 &gt; corr_00:\n    recovered = recovered[::-1]\n\n# \u5f52\u4e00\u5316\u4ee5\u4fbf\u663e\u793a\nrecovered = recovered / jnp.max(jnp.abs(recovered), axis=1, keepdims=True)\n\nfig, axes = plt.subplots(3, 2, figsize=(14, 9))\n\naxes[0, 0].plot(t[:1000], s1[:1000], color='#3498db', linewidth=0.8)\naxes[0, 0].set_title('\u6e90\u4fe1\u53f7 1\uff08\u539f\u59cb\uff09')\naxes[0, 0].set_ylabel('\u5e45\u5ea6')\n\naxes[0, 1].plot(t[:1000], s2[:1000], color='#e74c3c', linewidth=0.8)\naxes[0, 1].set_title('\u6e90\u4fe1\u53f7 2\uff08\u539f\u59cb\uff09')\n\naxes[1, 0].plot(t[:1000], mixtures[0, :1000], color='#9b59b6', linewidth=0.8)\naxes[1, 0].set_title('\u6df7\u5408\u4fe1\u53f7 1\uff08\u9ea6\u514b\u98ce 1\uff09')\naxes[1, 0].set_ylabel('\u5e45\u5ea6')\n\naxes[1, 1].plot(t[:1000], mixtures[1, :1000], color='#9b59b6', linewidth=0.8)\naxes[1, 1].set_title('\u6df7\u5408\u4fe1\u53f7 2\uff08\u9ea6\u514b\u98ce 2\uff09')\n\naxes[2, 0].plot(t[:1000], recovered[0, :1000], color='#27ae60', linewidth=0.8)\naxes[2, 0].set_title('\u6062\u590d\u7684\u6e90\u4fe1\u53f7 1\uff08FastICA\uff09')\naxes[2, 0].set_ylabel('\u5e45\u5ea6')\naxes[2, 0].set_xlabel('\u65f6\u95f4 (s)')\n\naxes[2, 1].plot(t[:1000], recovered[1, :1000], color='#f39c12', linewidth=0.8)\naxes[2, 1].set_title('\u6062\u590d\u7684\u6e90\u4fe1\u53f7 2\uff08FastICA\uff09')\naxes[2, 1].set_xlabel('\u65f6\u95f4 (s)')\n\nplt.tight_layout()\nplt.show()\n\n# \u62a5\u544a\u4e0e\u539f\u59cb\u4fe1\u53f7\u7684\u76f8\u5173\u6027\nfor i in range(2):\n    corr = jnp.corrcoef(recovered[i], sources[i])[0, 1]\n    print(f\"\u6e90 {i+1} \u6062\u590d\u76f8\u5173\u6027: {corr:.4f}\")\n</code></pre> <ul> <li>\u4efb\u52a1 2\uff1a\u57fa\u4e8e NMF \u7684\u8bed\u8c31\u56fe\u6e90\u5206\u79bb\u3002 \u4f7f\u7528\u975e\u8d1f\u77e9\u9635\u5206\u89e3\uff08\u7b2c02\u7ae0\uff09\u5c06\u8bed\u8c31\u56fe\u5206\u79bb\u4e3a\u4e24\u4e2a\u5206\u91cf\uff0c\u6f14\u793a NMF \u5982\u4f55\u4e3a\u6bcf\u4e2a\u6e90\u5b66\u4e60\u9891\u8c31\u5b57\u5178\u3002</li> </ul> <pre><code>import jax\nimport jax.numpy as jnp\nimport jax.random as jr\nimport matplotlib.pyplot as plt\n\n# \u751f\u6210\u4e24\u4e2a\u5177\u6709\u4e0d\u540c\u9891\u8c31\u7279\u5f81\u7684\u4fe1\u53f7\nsr = 8000\nduration = 1.0\nt = jnp.linspace(0, duration, int(sr * duration))\n\n# \u6e90 1\uff1a\u4f4e\u9891\u8c10\u6ce2\uff08\u6a21\u62df\u8d1d\u65af\uff09\nsrc1 = (jnp.sin(2 * jnp.pi * 100 * t) +\n        0.5 * jnp.sin(2 * jnp.pi * 200 * t) +\n        0.3 * jnp.sin(2 * jnp.pi * 300 * t))\n\n# \u6e90 2\uff1a\u9ad8\u9891\u8c10\u6ce2\uff08\u6a21\u62df\u957f\u7b1b\uff09\nsrc2 = (jnp.sin(2 * jnp.pi * 800 * t) +\n        0.4 * jnp.sin(2 * jnp.pi * 1600 * t))\n\n# \u65f6\u53d8\u5e45\u5ea6\uff08\u6e90\u5728\u4e0d\u540c\u65f6\u95f4\u6fc0\u6d3b\uff09\nenv1 = jnp.where(t &lt; 0.5, 1.0, 0.3)\nenv2 = jnp.where(t &gt; 0.3, 1.0, 0.2)\nsrc1 = src1 * env1\nsrc2 = src2 * env2\n\nmixture = src1 + src2\n\n# \u8ba1\u7b97\u5e45\u5ea6\u8bed\u8c31\u56fe\uff08STFT\uff09\nn_fft = 512\nhop = 128\nwindow = jnp.hanning(n_fft)\n\ndef compute_stft(signal, n_fft, hop, window):\n    n_frames = 1 + (len(signal) - n_fft) // hop\n    frames = jnp.stack([\n        signal[i * hop : i * hop + n_fft] * window\n        for i in range(n_frames)\n    ])\n    return jnp.fft.rfft(frames, n=n_fft)\n\nS_mix = compute_stft(mixture, n_fft, hop, window)\nV = jnp.abs(S_mix).T  # (F, T) - \u9891\u7387 x \u65f6\u95f4\nphase = jnp.angle(S_mix).T\n\nF, T = V.shape\nprint(f\"\u8bed\u8c31\u56fe\u5f62\u72b6: {F} \u4e2a\u9891\u7387 bin x {T} \u4e2a\u65f6\u95f4\u5e27\")\n\n# NMF: V \u2248 WH \u4f7f\u7528\u4e58\u6cd5\u66f4\u65b0\u89c4\u5219\ndef nmf(V, K, n_iter=200, key=jr.PRNGKey(0)):\n    \"\"\"\u4f7f\u7528 Frobenius \u8303\u6570\u7684\u975e\u8d1f\u77e9\u9635\u5206\u89e3\u3002\"\"\"\n    k1, k2 = jr.split(key)\n    W = jnp.abs(jr.normal(k1, (F, K))) * 0.1 + 0.01  # (F, K)\n    H = jnp.abs(jr.normal(k2, (K, T))) * 0.1 + 0.01  # (K, T)\n\n    costs = []\n    for i in range(n_iter):\n        # H \u7684\u4e58\u6cd5\u66f4\u65b0\n        WtV = W.T @ V\n        WtWH = W.T @ W @ H + 1e-8\n        H = H * (WtV / WtWH)\n\n        # W \u7684\u4e58\u6cd5\u66f4\u65b0\n        VHt = V @ H.T\n        WHHt = W @ H @ H.T + 1e-8\n        W = W * (VHt / WHHt)\n\n        cost = jnp.sum((V - W @ H) ** 2)\n        costs.append(float(cost))\n\n    return W, H, costs\n\n# \u8fd0\u884c K=2 \u4e2a\u5206\u91cf\u7684 NMF\nK = 2\nW, H, costs = nmf(V, K, n_iter=300)\n\n# \u4f7f\u7528\u8f6f\u63a9\u853d\u91cd\u5efa\u6bcf\u4e2a\u6e90\nV_hat = W @ H\nmask1 = (W[:, 0:1] @ H[0:1, :]) / (V_hat + 1e-8)\nmask2 = (W[:, 1:2] @ H[1:2, :]) / (V_hat + 1e-8)\n\nV_src1 = mask1 * V\nV_src2 = mask2 * V\n\n# \u53ef\u89c6\u5316\nfig, axes = plt.subplots(3, 2, figsize=(14, 10))\n\n# \u6df7\u5408\u4fe1\u53f7\u8bed\u8c31\u56fe\naxes[0, 0].imshow(jnp.log1p(V), aspect='auto', origin='lower', cmap='magma')\naxes[0, 0].set_title('\u6df7\u5408\u4fe1\u53f7\u8bed\u8c31\u56fe |X|')\naxes[0, 0].set_ylabel('\u9891\u7387 bin')\n\n# NMF \u6536\u655b\naxes[0, 1].plot(costs, color='#3498db', linewidth=1.5)\naxes[0, 1].set_title('NMF \u6536\u655b\u66f2\u7ebf')\naxes[0, 1].set_xlabel('\u8fed\u4ee3\u6b21\u6570')\naxes[0, 1].set_ylabel('Frobenius \u4ee3\u4ef7')\naxes[0, 1].set_yscale('log')\n\n# \u9891\u8c31\u57fa\u5411\u91cf W\nfreq_hz = jnp.arange(F) * sr / n_fft\naxes[1, 0].plot(freq_hz, W[:, 0], color='#27ae60', linewidth=1.5,\n                label='\u57fa 1\uff08\u4f4e\u9891\uff09')\naxes[1, 0].plot(freq_hz, W[:, 1], color='#e74c3c', linewidth=1.5,\n                label='\u57fa 2\uff08\u9ad8\u9891\uff09')\naxes[1, 0].set_title('\u5b66\u4e60\u5230\u7684\u9891\u8c31\u57fa W')\naxes[1, 0].set_xlabel('\u9891\u7387 (Hz)')\naxes[1, 0].set_ylabel('\u5e45\u5ea6')\naxes[1, 0].legend()\n\n# \u65f6\u57df\u6fc0\u6d3b H\ntime_s = jnp.arange(T) * hop / sr\naxes[1, 1].plot(time_s, H[0], color='#27ae60', linewidth=1.5,\n                label='\u6fc0\u6d3b 1')\naxes[1, 1].plot(time_s, H[1], color='#e74c3c', linewidth=1.5,\n                label='\u6fc0\u6d3b 2')\naxes[1, 1].set_title('\u65f6\u57df\u6fc0\u6d3b H')\naxes[1, 1].set_xlabel('\u65f6\u95f4 (s)')\naxes[1, 1].set_ylabel('\u6fc0\u6d3b\u503c')\naxes[1, 1].legend()\n\n# \u5206\u79bb\u540e\u7684\u8bed\u8c31\u56fe\naxes[2, 0].imshow(jnp.log1p(V_src1), aspect='auto', origin='lower', cmap='magma')\naxes[2, 0].set_title('\u5206\u79bb\u540e\u7684\u6e90\u4fe1\u53f7 1\uff08\u4f4e\u9891\uff09')\naxes[2, 0].set_ylabel('\u9891\u7387 bin')\naxes[2, 0].set_xlabel('\u65f6\u95f4\u5e27')\n\naxes[2, 1].imshow(jnp.log1p(V_src2), aspect='auto', origin='lower', cmap='magma')\naxes[2, 1].set_title('\u5206\u79bb\u540e\u7684\u6e90\u4fe1\u53f7 2\uff08\u9ad8\u9891\uff09')\naxes[2, 1].set_xlabel('\u65f6\u95f4\u5e27')\n\nplt.tight_layout()\nplt.show()\n\nprint(f\"\u91cd\u5efa\u8bef\u5dee: {jnp.sum((V - W @ H)**2):.2f}\")\nprint(f\"NMF \u5b66\u4e60\u5230\u7684\u9891\u8c31\u57fa\u80fd\u591f\u6355\u6349\u6bcf\u4e2a\u6e90\u7684\u9891\u7387\u7279\u5f81\u3002\")\n</code></pre> <ul> <li>\u4efb\u52a1 3\uff1a\u7528\u4e8e\u964d\u566a\u7684 LMS \u81ea\u9002\u5e94\u6ee4\u6ce2\u5668\u3002 \u5b9e\u73b0 LMS \u548c NLMS \u7b97\u6cd5\u7528\u4e8e\u56de\u58f0/\u964d\u566a\uff0c\u5c55\u793a\u6536\u655b\u884c\u4e3a\u53ca\u6b65\u957f\u7684\u5f71\u54cd\u3002</li> </ul> <pre><code>import jax\nimport jax.numpy as jnp\nimport jax.random as jr\nimport matplotlib.pyplot as plt\n\n# \u6a21\u62df\u56de\u58f0\u6d88\u9664\u573a\u666f\n# \u8fdc\u7aef\u4fe1\u53f7 -&gt; \u623f\u95f4\u8109\u51b2\u54cd\u5e94 -&gt; \u9ea6\u514b\u98ce\u5904\u7684\u56de\u58f0\n# \u8fd1\u7aef\u8bed\u97f3\u662f\u6211\u4eec\u5e0c\u671b\u4fdd\u7559\u7684\u76ee\u6807\u4fe1\u53f7\n\nsr = 8000\nduration = 2.0\nn_samples = int(sr * duration)\nkey = jr.PRNGKey(42)\nkeys = jr.split(key, 5)\n\n# \u8fdc\u7aef\u4fe1\u53f7\uff08\u53c2\u8003\uff09\uff1a\u968f\u673a\u7684\u7c7b\u8bed\u97f3\u4fe1\u53f7\nfar_end = jr.normal(keys[0], (n_samples,)) * 0.5\n\n# \u623f\u95f4\u8109\u51b2\u54cd\u5e94\uff08\u7b97\u6cd5\u672a\u77e5\uff09\nrir_length = 64\nrir = jnp.zeros(rir_length)\nrir = rir.at[0].set(0.8)   # \u76f4\u8fbe\u8def\u5f84\nrir = rir.at[5].set(0.3)   # \u65e9\u671f\u53cd\u5c04\nrir = rir.at[12].set(-0.2) # \u53cd\u5c04\nrir = rir.at[25].set(0.1)  # \u665a\u671f\u53cd\u5c04\nrir = rir.at[40].set(-0.05)\n\n# \u56de\u58f0\uff1a\u8fdc\u7aef\u4fe1\u53f7\u4e0e RIR \u7684\u5377\u79ef\necho = jnp.convolve(far_end, rir)[:n_samples]\n\n# \u8fd1\u7aef\u8bed\u97f3\uff08\u5728\u4fe1\u53f7\u7684\u4e00\u90e8\u5206\u4e2d\u6d3b\u8dc3\uff09\nnear_end = jnp.zeros(n_samples)\nstart, end = n_samples // 3, 2 * n_samples // 3\nnear_speech = 0.3 * jnp.sin(\n    2 * jnp.pi * 300 * jnp.linspace(0, (end - start) / sr, end - start)\n)\nnear_end = near_end.at[start:end].set(near_speech)\n\n# \u9ea6\u514b\u98ce\u4fe1\u53f7\uff1a\u56de\u58f0 + \u8fd1\u7aef + \u566a\u58f0\nnoise = jr.normal(keys[1], (n_samples,)) * 0.01\nmic_signal = echo + near_end + noise\n\n# LMS \u81ea\u9002\u5e94\u6ee4\u6ce2\u5668\ndef lms_filter(reference, desired, filter_length, mu):\n    \"\"\"\u6807\u51c6 LMS \u81ea\u9002\u5e94\u6ee4\u6ce2\u5668\u3002\"\"\"\n    n = len(reference)\n    w = jnp.zeros(filter_length)\n    output = jnp.zeros(n)\n    error = jnp.zeros(n)\n    w_history = []\n\n    for i in range(filter_length, n):\n        x = reference[max(0, i-filter_length+1):i+1][::-1]\n\n        y = jnp.dot(w, x)\n        e = desired[i] - y\n        w = w + mu * e * x\n\n        output = output.at[i].set(y)\n        error = error.at[i].set(e)\n\n        if i % 500 == 0:\n            w_history.append(w.copy())\n\n    return output, error, w_history\n\n# NLMS \u81ea\u9002\u5e94\u6ee4\u6ce2\u5668\ndef nlms_filter(reference, desired, filter_length, mu, eps=1e-6):\n    \"\"\"\u5f52\u4e00\u5316 LMS \u81ea\u9002\u5e94\u6ee4\u6ce2\u5668\u3002\"\"\"\n    n = len(reference)\n    w = jnp.zeros(filter_length)\n    output = jnp.zeros(n)\n    error = jnp.zeros(n)\n\n    for i in range(filter_length, n):\n        x = reference[max(0, i-filter_length+1):i+1][::-1]\n\n        y = jnp.dot(w, x)\n        e = desired[i] - y\n        norm_factor = jnp.dot(x, x) + eps\n        w = w + (mu / norm_factor) * e * x\n\n        output = output.at[i].set(y)\n        error = error.at[i].set(e)\n\n    return output, error\n\n# \u4f7f\u7528\u4e0d\u540c\u6b65\u957f\u8fd0\u884c LMS\nfilter_len = 64\nmu_values = [0.001, 0.01, 0.05]\ncolors_mu = ['#3498db', '#e74c3c', '#27ae60']\n\nfig, axes = plt.subplots(2, 2, figsize=(14, 10))\n\n# \u539f\u59cb\u4fe1\u53f7\nt = jnp.arange(n_samples) / sr\naxes[0, 0].plot(t, mic_signal, color='#9b59b6', linewidth=0.5, alpha=0.7,\n                label='\u9ea6\u514b\u98ce\uff08\u56de\u58f0 + \u8fd1\u7aef\uff09')\naxes[0, 0].plot(t, echo, color='#e74c3c', linewidth=0.5, alpha=0.7,\n                label='\u56de\u58f0\uff08\u5f85\u6d88\u9664\uff09')\naxes[0, 0].plot(t, near_end, color='#27ae60', linewidth=0.8,\n                label='\u8fd1\u7aef\u8bed\u97f3\uff08\u9700\u4fdd\u7559\uff09')\naxes[0, 0].set_title('\u4fe1\u53f7\u5206\u91cf')\naxes[0, 0].set_xlabel('\u65f6\u95f4 (s)')\naxes[0, 0].set_ylabel('\u5e45\u5ea6')\naxes[0, 0].legend(fontsize=8)\n\n# \u4e0d\u540c\u6b65\u957f\u4e0b\u7684 LMS \u6536\u655b\nfor mu, color in zip(mu_values, colors_mu):\n    _, err, _ = lms_filter(far_end, mic_signal, filter_len, mu)\n    # \u5e73\u6ed1\u540e\u7684\u5e73\u65b9\u8bef\u5dee\n    sq_err = err ** 2\n    window_size = 200\n    smoothed = jnp.convolve(sq_err, jnp.ones(window_size)/window_size,\n                             mode='valid')\n    axes[0, 1].plot(smoothed, color=color, linewidth=1.2,\n                    label=f'mu={mu}')\n\naxes[0, 1].set_title('LMS \u6536\u655b\u66f2\u7ebf\uff08\u5e73\u6ed1 MSE\uff09')\naxes[0, 1].set_xlabel('\u6837\u672c')\naxes[0, 1].set_ylabel('\u5e73\u65b9\u8bef\u5dee')\naxes[0, 1].set_yscale('log')\naxes[0, 1].legend()\n\n# \u6700\u4f73 LMS \u7ed3\u679c\n_, err_lms, w_hist = lms_filter(far_end, mic_signal, filter_len, 0.01)\naxes[1, 0].plot(t, mic_signal, color='#9b59b6', linewidth=0.5, alpha=0.4,\n                label='\u6d88\u9664\u524d')\naxes[1, 0].plot(t, err_lms, color='#3498db', linewidth=0.5, alpha=0.8,\n                label='LMS \u6d88\u9664\u540e')\naxes[1, 0].plot(t, near_end, color='#27ae60', linewidth=0.8, alpha=0.5,\n                label='\u771f\u5b9e\u8fd1\u7aef')\naxes[1, 0].set_title('LMS \u56de\u58f0\u6d88\u9664\u7ed3\u679c (mu=0.01)')\naxes[1, 0].set_xlabel('\u65f6\u95f4 (s)')\naxes[1, 0].set_ylabel('\u5e45\u5ea6')\naxes[1, 0].legend(fontsize=8)\n\n# NLMS \u7ed3\u679c\n_, err_nlms = nlms_filter(far_end, mic_signal, filter_len, 0.5)\naxes[1, 1].plot(t, mic_signal, color='#9b59b6', linewidth=0.5, alpha=0.4,\n                label='\u6d88\u9664\u524d')\naxes[1, 1].plot(t, err_nlms, color='#f39c12', linewidth=0.5, alpha=0.8,\n                label='NLMS \u6d88\u9664\u540e')\naxes[1, 1].plot(t, near_end, color='#27ae60', linewidth=0.8, alpha=0.5,\n                label='\u771f\u5b9e\u8fd1\u7aef')\naxes[1, 1].set_title('NLMS \u56de\u58f0\u6d88\u9664\u7ed3\u679c (mu=0.5)')\naxes[1, 1].set_xlabel('\u65f6\u95f4 (s)')\naxes[1, 1].set_ylabel('\u5e45\u5ea6')\naxes[1, 1].legend(fontsize=8)\n\nplt.tight_layout()\nplt.show()\n\n# \u6d4b\u91cf\u56de\u58f0\u8870\u51cf\necho_power = jnp.mean(echo ** 2)\nlms_residual = jnp.mean(err_lms[n_samples//2:] ** 2)  # \u6536\u655b\u540e\nnlms_residual = jnp.mean(err_nlms[n_samples//2:] ** 2)\nprint(f\"\u56de\u58f0\u529f\u7387: {10*jnp.log10(echo_power):.1f} dB\")\nprint(f\"LMS \u6b8b\u5dee: {10*jnp.log10(lms_residual):.1f} dB \"\n      f\"(ERLE: {10*jnp.log10(echo_power/lms_residual):.1f} dB)\")\nprint(f\"NLMS \u6b8b\u5dee: {10*jnp.log10(nlms_residual):.1f} dB \"\n      f\"(ERLE: {10*jnp.log10(echo_power/nlms_residual):.1f} dB)\")\n</code></pre> <ul> <li>\u4efb\u52a1 4\uff1a\u7528\u4e8e\u8bed\u97f3\u589e\u5f3a\u7684\u65f6\u9891\u63a9\u853d\u3002 \u5b9e\u73b0\u4e00\u4e2a\u7b80\u5355\u7684\u9891\u8c31\u63a9\u853d\u65b9\u6cd5\uff08\u7406\u60f3\u6bd4\u7387\u63a9\u853d\uff09\uff0c\u5e76\u5c06\u5176\u4e0e\u8c31\u51cf\u6cd5\u8fdb\u884c\u6bd4\u8f83\uff0c\u5728\u5408\u6210\u7684\u5e26\u566a\u8bed\u97f3\u4fe1\u53f7\u4e0a\u53ef\u89c6\u5316\u5206\u79bb\u8d28\u91cf\u3002</li> </ul> <pre><code>import jax\nimport jax.numpy as jnp\nimport jax.random as jr\nimport matplotlib.pyplot as plt\n\n# \u521b\u5efa\u5408\u6210\u7684\"\u8bed\u97f3\"\u548c\"\u566a\u58f0\"\u4fe1\u53f7\nsr = 8000\nduration = 2.0\nt = jnp.linspace(0, duration, int(sr * duration))\n\n# \u8bed\u97f3\uff1a\u5177\u6709\u65f6\u53d8\u5e45\u5ea6\u7684\u8c10\u6ce2\u5e8f\u5217\uff08\u6a21\u62df\u8bed\u97f3\uff09\nspeech = jnp.zeros_like(t)\nfor f0 in [150, 300, 450, 600, 900]:\n    amp_env = 0.5 + 0.5 * jnp.sin(2 * jnp.pi * 2.0 * t)  # 2 Hz \u8c03\u5236\n    speech = speech + (0.5 / (f0/150)) * amp_env * jnp.sin(2 * jnp.pi * f0 * t)\nspeech = speech / jnp.max(jnp.abs(speech))\n\n# \u566a\u58f0\uff1a\u9650\u5e26\u566a\u58f0\nkey = jr.PRNGKey(42)\nnoise_raw = jr.normal(key, t.shape) * 0.4\n\n# \u5728\u7ed9\u5b9a SNR \u4e0b\u6df7\u5408\nsnr_db = 5.0\nspeech_power = jnp.mean(speech ** 2)\nnoise_power = jnp.mean(noise_raw ** 2)\nnoise_scale = jnp.sqrt(speech_power / (noise_power * 10 ** (snr_db / 10)))\nnoise = noise_raw * noise_scale\nmixture = speech + noise\n\n# STFT\nn_fft = 512\nhop = 128\nwindow = jnp.hanning(n_fft)\n\ndef stft(signal, n_fft, hop, window):\n    n_frames = 1 + (len(signal) - n_fft) // hop\n    frames = jnp.stack([\n        signal[i * hop : i * hop + n_fft] * window\n        for i in range(n_frames)\n    ])\n    return jnp.fft.rfft(frames, n=n_fft)\n\ndef istft(S, hop, window, length):\n    n_fft = (S.shape[1] - 1) * 2\n    n_frames = S.shape[0]\n    frames = jnp.fft.irfft(S, n=n_fft) * window[None, :]\n    output = jnp.zeros(length)\n    window_sum = jnp.zeros(length)\n    for i in range(n_frames):\n        start = i * hop\n        end = start + n_fft\n        if end &lt;= length:\n            output = output.at[start:end].add(frames[i])\n            window_sum = window_sum.at[start:end].add(window ** 2)\n    window_sum = jnp.maximum(window_sum, 1e-8)\n    return output / window_sum\n\nS_speech = stft(speech, n_fft, hop, window)\nS_noise = stft(noise, n_fft, hop, window)\nS_mix = stft(mixture, n_fft, hop, window)\n\nmag_speech = jnp.abs(S_speech)\nmag_noise = jnp.abs(S_noise)\nmag_mix = jnp.abs(S_mix)\nphase_mix = jnp.angle(S_mix)\n\n# \u65b9\u6cd5 1\uff1a\u7406\u60f3\u6bd4\u7387\u63a9\u853d\uff08oracle - \u7406\u8bba\u4e0a\u9650\uff09\nirm = mag_speech ** 2 / (mag_speech ** 2 + mag_noise ** 2 + 1e-8)\nS_irm = (irm * mag_mix) * jnp.exp(1j * phase_mix)\nenhanced_irm = istft(S_irm, hop, window, len(mixture))\n\n# \u65b9\u6cd5 2\uff1a\u8c31\u51cf\u6cd5\n# \u4ece\u524d 0.2s \u4f30\u8ba1\u566a\u58f0\uff08\u5047\u8bbe\u4e3a\u9759\u97f3\u6bb5\uff09\nnoise_frames = int(0.2 * sr / hop)\nnoise_est = jnp.mean(mag_mix[:noise_frames] ** 2, axis=0, keepdims=True)\nalpha = 2.0  # \u8fc7\u51cf\u56e0\u5b50\nbeta = 0.02  # \u9891\u8c31\u5730\u677f\nmag_sub = jnp.maximum(mag_mix ** 2 - alpha * noise_est, beta * mag_mix ** 2)\nmag_sub = jnp.sqrt(mag_sub)\nS_sub = mag_sub * jnp.exp(1j * phase_mix)\nenhanced_sub = istft(S_sub, hop, window, len(mixture))\n\n# \u65b9\u6cd5 3\uff1a\u7ef4\u7eb3\u6ee4\u6ce2\u5668\nsnr_est = mag_mix ** 2 / (noise_est + 1e-8)\nwiener_gain = snr_est / (1 + snr_est)\nS_wiener = (wiener_gain * mag_mix) * jnp.exp(1j * phase_mix)\nenhanced_wiener = istft(S_wiener, hop, window, len(mixture))\n\n# \u8ba1\u7b97\u6bcf\u79cd\u65b9\u6cd5\u7684 SI-SDR\ndef si_sdr(estimate, reference):\n    \"\"\"\u5c3a\u5ea6\u4e0d\u53d8\u4fe1\u53f7\u5931\u771f\u6bd4\u3002\"\"\"\n    ref = reference[:len(estimate)]\n    est = estimate[:len(reference)]\n    s_target = (jnp.dot(est, ref) / (jnp.dot(ref, ref) + 1e-8)) * ref\n    e_noise = est - s_target\n    return 10 * jnp.log10(jnp.dot(s_target, s_target) /\n                           (jnp.dot(e_noise, e_noise) + 1e-8))\n\nsi_sdr_mix = si_sdr(mixture, speech)\nsi_sdr_irm_val = si_sdr(enhanced_irm, speech)\nsi_sdr_sub_val = si_sdr(enhanced_sub, speech)\nsi_sdr_wiener_val = si_sdr(enhanced_wiener, speech)\n\n# \u53ef\u89c6\u5316\nfig, axes = plt.subplots(3, 2, figsize=(14, 12))\n\n# \u8bed\u8c31\u56fe\naxes[0, 0].imshow(jnp.log1p(mag_speech.T), aspect='auto', origin='lower',\n                   cmap='magma')\naxes[0, 0].set_title('\u5e72\u51c0\u8bed\u97f3\u8bed\u8c31\u56fe')\naxes[0, 0].set_ylabel('\u9891\u7387 bin')\n\naxes[0, 1].imshow(jnp.log1p(mag_mix.T), aspect='auto', origin='lower',\n                   cmap='magma')\naxes[0, 1].set_title(f'\u5e26\u566a\u6df7\u5408 ({snr_db:.0f} dB SNR)')\n\n# \u63a9\u853d\naxes[1, 0].imshow(irm.T, aspect='auto', origin='lower', cmap='RdYlGn')\naxes[1, 0].set_title('\u7406\u60f3\u6bd4\u7387\u63a9\u853d\uff08Oracle\uff09')\naxes[1, 0].set_ylabel('\u9891\u7387 bin')\n\naxes[1, 1].imshow(wiener_gain.T, aspect='auto', origin='lower', cmap='RdYlGn',\n                   vmin=0, vmax=1)\naxes[1, 1].set_title('\u4f30\u8ba1\u7684\u7ef4\u7eb3\u589e\u76ca')\n\n# \u589e\u5f3a\u540e\u7684\u6ce2\u5f62\u5bf9\u6bd4\nn_show = 3000\naxes[2, 0].plot(t[:n_show], speech[:n_show], color='#27ae60', linewidth=0.8,\n                alpha=0.5, label='\u5e72\u51c0')\naxes[2, 0].plot(t[:n_show], mixture[:n_show], color='#e74c3c', linewidth=0.5,\n                alpha=0.4, label='\u5e26\u566a')\naxes[2, 0].plot(t[:n_show], enhanced_irm[:n_show], color='#3498db',\n                linewidth=0.8, label='IRM \u589e\u5f3a')\naxes[2, 0].set_title('\u6ce2\u5f62\u5bf9\u6bd4\uff08IRM\uff09')\naxes[2, 0].set_xlabel('\u65f6\u95f4 (s)')\naxes[2, 0].set_ylabel('\u5e45\u5ea6')\naxes[2, 0].legend(fontsize=8)\n\n# SI-SDR \u67f1\u72b6\u56fe\nmethods = ['\u6df7\u5408\u4fe1\u53f7', '\u8c31\u51cf\u6cd5', '\u7ef4\u7eb3\u6ee4\u6ce2\u5668', '\u7406\u60f3\u6bd4\u7387\u63a9\u853d']\nsdr_values = [float(si_sdr_mix), float(si_sdr_sub_val),\n              float(si_sdr_wiener_val), float(si_sdr_irm_val)]\nbar_colors = ['#e74c3c', '#f39c12', '#9b59b6', '#27ae60']\nbars = axes[2, 1].bar(methods, sdr_values, color=bar_colors, alpha=0.8)\naxes[2, 1].set_ylabel('SI-SDR (dB)')\naxes[2, 1].set_title('\u589e\u5f3a\u8d28\u91cf\u5bf9\u6bd4')\nfor bar, val in zip(bars, sdr_values):\n    axes[2, 1].text(bar.get_x() + bar.get_width()/2., bar.get_height() + 0.3,\n                    f'{val:.1f}', ha='center', fontsize=10)\naxes[2, 1].axhline(0, color='gray', linestyle='--', linewidth=0.8)\n\nplt.tight_layout()\nplt.show()\n\nprint(f\"SI-SDR\uff08\u5e26\u566a\u6df7\u5408\uff09:        {si_sdr_mix:.2f} dB\")\nprint(f\"SI-SDR\uff08\u8c31\u51cf\u6cd5\uff09:          {si_sdr_sub_val:.2f} dB\")\nprint(f\"SI-SDR\uff08\u7ef4\u7eb3\u6ee4\u6ce2\u5668\uff09:      {si_sdr_wiener_val:.2f} dB\")\nprint(f\"SI-SDR\uff08\u7406\u60f3\u6bd4\u7387\u63a9\u853d\uff09:    {si_sdr_irm_val:.2f} dB\uff08oracle \u7406\u8bba\u4e0a\u9650\uff09\")\n</code></pre>"},{"location":"chapter%2010%3A%20multimodal%20learning/01.%20multimodal%20representations/","title":"\u591a\u6a21\u6001\u8868\u5f81","text":"<p>\u591a\u6a21\u6001\u8868\u5f81\u5c06\u89c6\u89c9\u3001\u8bed\u8a00\u548c\u97f3\u9891\u6865\u63a5\u5230\u5171\u4eab\u5d4c\u5165\u7a7a\u95f4\u4e2d\u3002\u672c\u6587\u4ef6\u6db5\u76d6\u878d\u5408\u7b56\u7565\u3001CLIP\u3001ALIGN\u3001SigLIP\u3001\u5bf9\u6bd4\u635f\u5931\u51fd\u6570\uff08InfoNCE\u3001NT-Xent\uff09\u3001\u96f6\u6837\u672c\u5206\u7c7b\u548c\u68c0\u7d22\u8bc4\u4f30\u3002</p> <ul> <li> <p>\u60f3\u8c61\u4f60\u5750\u5728\u4e00\u5bb6\u5496\u5561\u9986\u91cc\u3002\u4f60\u770b\u5230\u684c\u4e0a\u5192\u70ed\u6c14\u7684\u6c34\u676f\uff0c\u542c\u5230\u9676\u74f7\u7684\u53ee\u5f53\u58f0\uff0c\u95fb\u5230\u70d8\u7119\u5496\u5561\u8c46\u7684\u9999\u6c14\uff0c\u611f\u53d7\u5230\u4ece\u9a6c\u514b\u676f\u4f20\u6765\u7684\u6696\u610f\u3002\u6ca1\u6709\u54ea\u4e00\u79cd\u611f\u5b98\u80fd\u544a\u8bc9\u4f60\u4e00\u5207\uff1a\u4f60\u7684\u5927\u8111\u5c06\u8fd9\u4e9b\u4fe1\u53f7\u878d\u5408\u6210\u4e00\u4e2a\u7edf\u4e00\u7684\u611f\u77e5\u2014\u2014\"\u70ed\u5496\u5561\"\u3002\u591a\u6a21\u6001\u5b66\u4e60 \u5bf9\u673a\u5668\u505a\u4e86\u540c\u6837\u7684\u4e8b\uff1a\u5b83\u7ed3\u5408\u6765\u81ea\u591a\u79cd\u6a21\u6001\uff08\u89c6\u89c9\u3001\u8bed\u8a00\u3001\u97f3\u9891\u7b49\uff09\u7684\u4fe1\u606f\uff0c\u6784\u5efa\u51fa\u6bd4\u4efb\u4f55\u5355\u4e00\u6a21\u6001\u5355\u72ec\u63d0\u4f9b\u7684\u8868\u5f81\u66f4\u4e30\u5bcc\u3001\u66f4\u9c81\u68d2\u7684\u8868\u5f81\u3002</p> </li> <li> <p>\u6a21\u6001\uff08modality\uff09 \u662f\u4e00\u79cd\u72ec\u7279\u7684\u4fe1\u606f\u901a\u9053\u3002\u5728\u673a\u5668\u5b66\u4e60\u4e2d\uff0c\u6700\u5e38\u89c1\u7684\u6a21\u6001\u5305\u62ec\u56fe\u50cf\uff08\u50cf\u7d20\u7f51\u683c\uff09\u3001\u6587\u672c\uff08\u8bcd\u5143\u5e8f\u5217\uff09\u3001\u97f3\u9891\uff08\u6ce2\u5f62\u6216\u8bed\u8c31\u56fe\uff0c\u5982\u7b2c9\u7ae0\u6240\u8ff0\uff09\u3001\u89c6\u9891\uff08\u5e27\u5e8f\u5217\uff09\u548c\u7ed3\u6784\u5316\u6570\u636e\uff08\u8868\u683c\u3001\u56fe\uff09\u3002\u6bcf\u79cd\u6a21\u6001\u90fd\u6709\u5176\u81ea\u8eab\u7684\u7edf\u8ba1\u7ed3\u6784\uff1a\u56fe\u50cf\u5177\u6709\u7a7a\u95f4\u8fde\u8d2f\u6027\uff0c\u6587\u672c\u662f\u5e8f\u5217\u5316\u548c\u79bb\u6563\u7684\uff0c\u97f3\u9891\u662f\u65f6\u95f4\u6027\u7684\u548c\u8fde\u7eed\u7684\u3002\u591a\u6a21\u6001\u5b66\u4e60\u7684\u6311\u6218\u5728\u4e8e\u6865\u63a5\u8fd9\u4e9b\u6839\u672c\u4e0d\u540c\u7684\u6570\u636e\u7c7b\u578b\u3002</p> </li> <li> <p>\u4e3a\u4ec0\u4e48\u8981\u8d39\u5fc3\u7ed3\u5408\u591a\u79cd\u6a21\u6001\uff1f\u56e0\u4e3a\u5b83\u4eec\u63d0\u4f9b\u4e92\u8865\u7684\u4fe1\u606f\u3002\u4e00\u5f20\u72d7\u7684\u7167\u7247\u544a\u8bc9\u4f60\u5b83\u7684\u54c1\u79cd\u548c\u989c\u8272\uff0c\u4f46\u4e0d\u4f1a\u544a\u8bc9\u4f60\u540d\u5b57\u3002\u50cf\"\u6211\u7684\u91d1\u6bdb\u72ac Max\"\u8fd9\u6837\u7684\u63cf\u8ff0\u544a\u8bc9\u4f60\u540d\u5b57\u548c\u54c1\u79cd\uff0c\u4f46\u4e0d\u4f1a\u544a\u8bc9\u4f60\u786e\u5207\u59ff\u6001\u3002\u56fe\u50cf\u548c\u6587\u672c\u7ed3\u5408\u8d77\u6765\uff0c\u6bd4\u4efb\u4f55\u5355\u72ec\u4e00\u4e2a\u7ed9\u51fa\u7684\u753b\u9762\u90fd\u66f4\u5b8c\u6574\u3002\u8fd9\u79cd\u4e92\u8865\u6027\u662f\u5176\u6838\u5fc3\u52a8\u673a\uff1a\u591a\u6a21\u6001\u6a21\u578b\u53ef\u4ee5\u56de\u7b54\u90a3\u4e9b\u5355\u6a21\u6001\u6a21\u578b\u65e0\u6cd5\u56de\u7b54\u7684\u95ee\u9898\u3001\u751f\u6210\u5185\u5bb9\u5e76\u505a\u51fa\u51b3\u7b56\u3002</p> </li> </ul> <p></p>"},{"location":"chapter%2010%3A%20multimodal%20learning/01.%20multimodal%20representations/#_2","title":"\u878d\u5408\u7b56\u7565","text":"<ul> <li> <p>\u60f3\u8c61\u4e00\u4e2a\u5c0f\u7ec4\u9879\u76ee\u3002\u4f60\u6709\u4e24\u79cd\u7ec4\u5408\u60f3\u6cd5\u7684\u65b9\u5f0f\uff1a\u6bcf\u4e2a\u4eba\u4ece\u4e00\u5f00\u59cb\u5c31\u5728\u540c\u4e00\u4e2a\u623f\u95f4\u91cc\u4e00\u8d77\u5de5\u4f5c\uff08\u5171\u4eab\u539f\u59cb\u7b14\u8bb0\u548c\u8349\u7a3f\uff09\uff0c\u6216\u8005\u6bcf\u4e2a\u4eba\u72ec\u7acb\u64b0\u5199\u81ea\u5df1\u7684\u90e8\u5206\uff0c\u6700\u540e\u5408\u5e76\u6700\u7ec8\u6587\u6863\u3002\u8fd9\u5206\u522b\u5bf9\u5e94\u4e8e\u591a\u6a21\u6001\u5b66\u4e60\u4e2d\u7684\u65e9\u671f\u878d\u5408\uff08early fusion\uff09 \u548c\u665a\u671f\u878d\u5408\uff08late fusion\uff09\u3002</p> </li> <li> <p>\u65e9\u671f\u878d\u5408\uff08\u4e5f\u79f0\u4e3a\u7279\u5f81\u7ea7\u878d\u5408\uff09\u5728\u4efb\u4f55\u9ad8\u7ea7\u5904\u7406\u4e4b\u524d\uff0c\u5bf9\u6765\u81ea\u4e0d\u540c\u6a21\u6001\u7684\u539f\u59cb\u6216\u4f4e\u7ea7\u7279\u5f81\u8fdb\u884c\u62fc\u63a5\u6216\u6df7\u5408\u3002\u4f8b\u5982\uff0c\u4f60\u53ef\u4ee5\u5c06\u56fe\u50cf\u7684\u50cf\u7d20\u7279\u5f81\u4e0e\u6587\u672c\u7684\u8bcd\u5143\u5d4c\u5165\u62fc\u63a5\u8d77\u6765\uff0c\u5c06\u7ec4\u5408\u540e\u7684\u5e8f\u5217\u8f93\u5165\u5230\u4e00\u4e2a\u5355\u4e00\u7684 Transformer \u4e2d\u3002\u6a21\u578b\u53ef\u4ee5\u4ece\u4e00\u5f00\u59cb\u5c31\u5b66\u4e60\u7ec6\u7c92\u5ea6\u7684\u8de8\u6a21\u6001\u4ea4\u4e92\uff0c\u4f46\u8f93\u5165\u7a7a\u95f4\u5f88\u5927\uff0c\u4e14\u6a21\u578b\u5fc5\u987b\u5b66\u4f1a\u540c\u65f6\u5904\u7406\u622a\u7136\u4e0d\u540c\u7684\u6570\u636e\u7c7b\u578b\u3002</p> </li> <li> <p>\u5f62\u5f0f\u5316\u5730\uff0c\u7ed9\u5b9a\u6765\u81ea\u4e24\u79cd\u6a21\u6001\u7684\u7279\u5f81\u5411\u91cf \\(x_{\\\\text{img}} \\\\in \\\\mathbb{R}^{d_1}\\) \u548c \\(x_{\\\\text{txt}} \\\\in \\\\mathbb{R}^{d_2}\\)\uff0c\u65e9\u671f\u878d\u5408\u7b80\u5355\u5730\u62fc\u63a5\u5b83\u4eec\uff1a</p> </li> </ul> \\[x_{\\\\text{fused}} = [x_{\\\\text{img}}; x_{\\\\text{txt}}] \\\\in \\\\mathbb{R}^{d_1 + d_2}\\] <ul> <li> <p>\u8fd9\u4e2a\u62fc\u63a5\u540e\u7684\u5411\u91cf\u7531\u5171\u4eab\u7f51\u7edc\u5904\u7406\u3002\u5176\u4f18\u52bf\u5728\u4e8e\u6a21\u578b\u53ef\u4ee5\u5728\u6bcf\u4e00\u5c42\u53d1\u73b0\u8de8\u6a21\u6001\u76f8\u5173\u6027\u3002\u7f3a\u70b9\u662f\u8ba1\u7b97\u6210\u672c\u9ad8\uff0c\u4e14\u96be\u4ee5\u5bf9\u9f50\u975e\u5e38\u4e0d\u540c\u7684\u7279\u5f81\u7c7b\u578b\uff08\u5bc6\u96c6\u7684\u50cf\u7d20\u503c\u4e0e\u7a00\u758f\u7684\u8bcd\u5143\u7d22\u5f15\uff09\u3002</p> </li> <li> <p>\u665a\u671f\u878d\u5408\uff08\u4e5f\u79f0\u4e3a\u51b3\u7b56\u7ea7\u878d\u5408\uff09\u901a\u8fc7\u5404\u81ea\u7684\u7f16\u7801\u5668\u72ec\u7acb\u5904\u7406\u6bcf\u79cd\u6a21\u6001\uff0c\u4e3a\u6bcf\u79cd\u6a21\u6001\u751f\u6210\u4e00\u4e2a\u9ad8\u5c42\u8868\u5f81\u751a\u81f3\u6700\u7ec8\u7684\u9884\u6d4b\u7ed3\u679c\u3002\u8fd9\u4e9b\u8f93\u51fa\u968f\u540e\u88ab\u7ec4\u5408\uff0c\u901a\u5e38\u901a\u8fc7\u5e73\u5747\u5206\u6570\u3001\u6295\u7968\u6216\u4e00\u4e2a\u53ef\u5b66\u4e60\u7684\u7ec4\u5408\u5c42\u3002\u665a\u671f\u878d\u5408\u66f4\u7b80\u5355\uff0c\u4e14\u5141\u8bb8\u4f60\u76f4\u63a5\u590d\u7528\u9884\u8bad\u7ec3\u7684\u5355\u6a21\u6001\u6a21\u578b\uff0c\u4f46\u5b83\u65e0\u6cd5\u6355\u6349\u4f4e\u5c42\u7684\u8de8\u6a21\u6001\u4ea4\u4e92\uff0c\u56e0\u4e3a\u5404\u6a21\u6001\u4ece\u672a\"\u770b\u5230\"\u5f7c\u6b64\u7684\u539f\u59cb\u7279\u5f81\u3002</p> </li> <li> <p>\u7ed9\u5b9a\u6a21\u6001\u7279\u5b9a\u7684\u9884\u6d4b\u503c \\(\\hat{y}_1\\) \u548c \\(\\hat{y}_2\\)\uff0c\u4e00\u4e2a\u7b80\u5355\u7684\u665a\u671f\u878d\u5408\u89c4\u5219\u662f\uff1a</p> </li> </ul> \\[\\hat{y} = \\\\alpha \\\\hat{y}_1 + (1 - \\\\alpha) \\\\hat{y}_2\\] <ul> <li> <p>\u5176\u4e2d \\(\\\\alpha \\\\in [0, 1]\\) \u662f\u4e00\u4e2a\u53ef\u5b66\u4e60\u6216\u624b\u52a8\u8c03\u8282\u7684\u6df7\u5408\u6743\u91cd\u3002</p> </li> <li> <p>\u4e2d\u95f4\u878d\u5408\uff08middle fusion\uff09\uff08\u4e5f\u79f0\u4e3a\u4e2d\u95f4\u878d\u5408 intermediate fusion\uff09\u662f\u5927\u591a\u6570\u73b0\u4ee3\u7cfb\u7edf\u4f7f\u7528\u7684\u5b9e\u7528\u6298\u4e2d\u65b9\u6848\u3002\u6bcf\u79cd\u6a21\u6001\u5148\u7531\u5176\u81ea\u8eab\u7684\u7f16\u7801\u5668\u5904\u7406\uff08\u63d0\u53d6\u6a21\u6001\u7279\u5b9a\u7684\u7279\u5f81\uff09\uff0c\u7136\u540e\u5728\u7f51\u7edc\u4e2d\u95f4\u90e8\u5206\u901a\u8fc7\u8de8\u6ce8\u610f\u529b\u5c42\u7b49\u65b9\u5f0f\u7ec4\u5408\u7f16\u7801\u540e\u7684\u8868\u5f81\u3002\u8fd9\u4f7f\u5f97\u6bcf\u4e2a\u7f16\u7801\u5668\u53ef\u4ee5\u4e13\u6ce8\u4e8e\u81ea\u8eab\u7684\u6a21\u6001\uff0c\u540c\u65f6\u4ecd\u80fd\u5b9e\u73b0\u4e30\u5bcc\u7684\u8de8\u6a21\u6001\u4ea4\u4e92\u3002Flamingo\u3001LLaVA \u548c\u5927\u591a\u6570\u89c6\u89c9-\u8bed\u8a00\u6a21\u578b\uff08\u6587\u4ef6 02\uff09\u90fd\u4f7f\u7528\u4e2d\u95f4\u878d\u5408\u3002</p> </li> </ul> <p></p> <ul> <li>\u878d\u5408\u7b56\u7565\u7684\u9009\u62e9\u53d6\u51b3\u4e8e\u6570\u636e\u53ef\u7528\u6027\u3001\u8ba1\u7b97\u9884\u7b97\u548c\u4efb\u52a1\u3002\u65e9\u671f\u878d\u5408\u529f\u80fd\u5f3a\u5927\u4f46\u6570\u636e\u9700\u6c42\u9ad8\u3002\u665a\u671f\u878d\u5408\u5ec9\u4ef7\u4f46\u53d7\u9650\u3002\u5e26\u6709\u8de8\u6ce8\u610f\u529b\u7684\u4e2d\u95f4\u878d\u5408\u5df2\u6210\u4e3a\u5927\u89c4\u6a21\u591a\u6a21\u6001\u6a21\u578b\u7684\u4e3b\u6d41\u505a\u6cd5\uff0c\u56e0\u4e3a\u5b83\u5728\u8868\u8fbe\u80fd\u529b\u4e0e\u6a21\u5757\u5316\u4e4b\u95f4\u53d6\u5f97\u4e86\u5e73\u8861\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/01.%20multimodal%20representations/#_3","title":"\u8054\u5408\u5d4c\u5165\u7a7a\u95f4","text":"<ul> <li> <p>\u60f3\u8c61\u4e00\u4e2a\u901a\u7528\u7ffb\u8bd1\u5668\uff0c\u5b83\u53ef\u4ee5\u5c06\u4efb\u4f55\u8bed\u8a00\u7684\u4efb\u4f55\u53e5\u5b50\u6620\u5c04\u5230\u540c\u4e00\u4e2a\u5171\u4eab\"\u610f\u4e49\u7a7a\u95f4\"\u4e2d\u7684\u540c\u4e00\u70b9\u3002\u7528\u82f1\u8bed\u3001\u6cd5\u8bed\u6216\u65e5\u8bed\u8bf4\u7684\"a dog on a beach\"\u90fd\u4f1a\u843d\u5728\u540c\u4e00\u4e2a\u5750\u6807\u4e0a\u3002\u8054\u5408\u5d4c\u5165\u7a7a\u95f4 \u8de8\u6a21\u6001\u505a\u4e86\u5b8c\u5168\u76f8\u540c\u7684\u4e8b\uff1a\u4e00\u5f20\u6c99\u6ee9\u4e0a\u7684\u72d7\u7684\u56fe\u50cf\u548c\u6587\u672c\"a dog on a beach\"\u5e94\u8be5\u6620\u5c04\u5230\u540c\u4e00\u5411\u91cf\u7a7a\u95f4\u4e2d\u7684\u90bb\u8fd1\u70b9\u3002</p> </li> <li> <p>\u5f62\u5f0f\u5316\u5730\uff0c\u6211\u4eec\u5b66\u4e60\u4e24\u4e2a\u7f16\u7801\u5668\u51fd\u6570\uff1a\u6a21\u6001 1\uff08\u5982\u56fe\u50cf\uff09\u7684 \\(f_\\\\theta : \\\\mathcal{X}_1 \\\\to \\\\mathbb{R}^d\\) \u548c\u6a21\u6001 2\uff08\u5982\u6587\u672c\uff09\u7684 \\(g_\\\\phi : \\\\mathcal{X}_2 \\\\to \\\\mathbb{R}^d\\)\u3002\u4e24\u8005\u90fd\u5c06\u8f93\u5165\u6620\u5c04\u5230\u76f8\u540c\u7684 \\(d\\) \u7ef4\u7a7a\u95f4\u3002\u8bad\u7ec3\u76ee\u6807\u786e\u4fdd\u8bed\u4e49\u5339\u914d\u7684\u5bf9 \\((x_1, x_2)\\) \u7684\u5d4c\u5165 \\(f_\\\\theta(x_1)\\) \u548c \\(g_\\\\phi(x_2)\\) \u5f7c\u6b64\u63a5\u8fd1\uff08\u9ad8\u4f59\u5f26\u76f8\u4f3c\u5ea6\uff09\uff0c\u800c\u4e0d\u5339\u914d\u7684\u5bf9\u5219\u76f8\u8ddd\u5f88\u8fdc\u3002</p> </li> <li> <p>\u8fd9\u662f\u7b2c 7 \u7ae0\u4e2d\u8bcd\u5d4c\u5165\u7a7a\u95f4\u7684\u76f4\u63a5\u63a8\u5e7f\u3002\u56de\u5fc6\u4e00\u4e0b\uff0cWord2Vec \u548c GloVe \u5c06\u8bed\u4e49\u76f8\u4f3c\u7684\u8bcd\u653e\u7f6e\u5728\u5411\u91cf\u7a7a\u95f4\u4e2d\u5f7c\u6b64\u9760\u8fd1\u3002\u8054\u5408\u5d4c\u5165\u7a7a\u95f4\u5c06\u8fd9\u4e00\u601d\u60f3\u6269\u5c55\u5230\u8de8\u6a21\u6001\uff1a\u4e0d\u662f\u8861\u91cf\u8bcd\u4e0e\u8bcd\u7684\u76f8\u4f3c\u6027\uff0c\u800c\u662f\u8861\u91cf\u56fe\u50cf\u5230\u6587\u672c\u7684\u76f8\u4f3c\u6027\u3001\u97f3\u9891\u5230\u6587\u672c\u7684\u76f8\u4f3c\u6027\uff0c\u751a\u81f3\u56fe\u50cf\u5230\u97f3\u9891\u7684\u76f8\u4f3c\u6027\u3002</p> </li> <li> <p>\u76f8\u4f3c\u5ea6\u5ea6\u91cf\u51e0\u4e4e\u603b\u662f\u4f59\u5f26\u76f8\u4f3c\u5ea6\uff08\u7b2c 1 \u7ae0\uff09\uff1a</p> </li> </ul> \\[\\\\text{sim}(u, v) = \\\\frac{u \\\\cdot v}{\\\\|u\\\\| \\\\|v\\\\|}\\] <ul> <li>\u901a\u8fc7\u5c06\u6240\u6709\u5d4c\u5165 \\(L_2\\) \u5f52\u4e00\u5316\u5230\u5355\u4f4d\u8d85\u7403\u9762\u4e0a\uff0c\u4f59\u5f26\u76f8\u4f3c\u5ea6\u7b80\u5316\u4e3a\u7b80\u5355\u7684\u70b9\u79ef \\(u \\\\cdot v\\)\uff0c\u8ba1\u7b97\u6548\u7387\u6781\u9ad8\uff0c\u5e76\u4e14\u53ef\u4ee5\u4f7f\u7528\u8fd1\u4f3c\u6700\u8fd1\u90bb\u5e93\u8fdb\u884c\u52a0\u901f\u3002</li> </ul> <p></p> <ul> <li>\u8054\u5408\u5d4c\u5165\u7a7a\u95f4\u7684\u5f3a\u5927\u4e4b\u5904\u5728\u4e8e\u5b83\u5b9e\u73b0\u4e86\u96f6\u6837\u672c\u8fc1\u79fb\u3002\u4e00\u65e6\u4f60\u5bf9\u9f50\u4e86\u56fe\u50cf\u548c\u6587\u672c\u5d4c\u5165\uff0c\u4f60\u5c31\u53ef\u4ee5\u5c06\u4ece\u672a\u8bad\u7ec3\u8fc7\u7684\u7c7b\u522b\u56fe\u50cf\u5206\u7c7b\uff1a\u53ea\u9700\u5c06\u7c7b\u522b\u540d\u79f0\u4f5c\u4e3a\u6587\u672c\u5d4c\u5165\uff0c\u7136\u540e\u627e\u51fa\u4e0e\u56fe\u50cf\u5d4c\u5165\u6700\u63a5\u8fd1\u7684\u6587\u672c\u5d4c\u5165\u5373\u53ef\u3002\u65e0\u9700\u7279\u5b9a\u4efb\u52a1\u7684\u5fae\u8c03\u3002\u8fd9\u662f CLIP \u53ca\u5176\u540e\u7ee7\u6a21\u578b\u80cc\u540e\u7684\u5173\u952e\u6d1e\u5bdf\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/01.%20multimodal%20representations/#_4","title":"\u7528\u4e8e\u591a\u6a21\u6001\u5bf9\u9f50\u7684\u5bf9\u6bd4\u5b66\u4e60","text":"<ul> <li> <p>\u60f3\u8c61\u4e00\u4e2a\u8bfe\u5802\u7ec3\u4e60\uff1a\u5b66\u751f\u4eec\u62ff\u5230\u6253\u4e71\u7684\u7167\u7247\u548c\u63cf\u8ff0\u5bf9\uff0c\u9700\u8981\u5c06\u6bcf\u5f20\u7167\u7247\u4e0e\u5176\u6b63\u786e\u7684\u63cf\u8ff0\u914d\u5bf9\u3002\u8981\u51fa\u8272\u5730\u5b8c\u6210\u8fd9\u9879\u4efb\u52a1\uff0c\u4f60\u9700\u8981\u540c\u65f6\u7406\u89e3\u89c6\u89c9\u5185\u5bb9\u4e0e\u8bed\u8a00\uff0c\u5e76\u77e5\u9053\u5b83\u4eec\u5982\u4f55\u5173\u8054\u3002\u5bf9\u6bd4\u5b66\u4e60 \u6b63\u662f\u4ee5\u8fd9\u79cd\u65b9\u5f0f\u8bad\u7ec3\u6a21\u578b\uff1a\u7ed9\u5b9a\u4e00\u6279 (\u56fe\u50cf, \u6587\u672c) \u5bf9\uff0c\u6a21\u578b\u5fc5\u987b\u627e\u51fa\u54ea\u5f20\u56fe\u50cf\u5bf9\u5e94\u54ea\u6bb5\u6587\u672c\u3002</p> </li> <li> <p>\u6b63\u5982\u6211\u4eec\u5728\u7b2c 8 \u7ae0\uff08\u6587\u4ef6 04\uff09\u4e2d\u770b\u5230\u7684\uff0c\u5355\u6a21\u6001\u73af\u5883\u4e0b\u7684\u5bf9\u6bd4\u5b66\u4e60\uff08SimCLR\u3001MoCo\uff09\u5c06\u540c\u4e00\u56fe\u50cf\u7684\u4e0d\u540c\u589e\u5e7f\u89c6\u56fe\u62c9\u8fd1\uff0c\u5c06\u4e0d\u540c\u56fe\u50cf\u7684\u89c6\u56fe\u63a8\u8fdc\u3002\u591a\u6a21\u6001\u5bf9\u6bd4\u5b66\u4e60\u5c06\"\u589e\u5e7f\u89c6\u56fe\"\u66ff\u6362\u4e3a\"\u5339\u914d\u7684\u6a21\u6001\"\uff1a\u56fe\u50cf\u53ca\u5176\u63cf\u8ff0\u6784\u6210\u6b63\u6837\u672c\u5bf9\uff1b\u8be5\u56fe\u50cf\u4e0e\u6279\u6b21\u4e2d\u4efb\u4f55\u5176\u4ed6\u63cf\u8ff0\u7684\u914d\u5bf9\u6784\u6210\u8d1f\u6837\u672c\u5bf9\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/01.%20multimodal%20representations/#clip","title":"CLIP","text":"<ul> <li> <p>CLIP\uff08Contrastive Language-Image Pre-training\uff0c\u5bf9\u6bd4\u8bed\u8a00-\u56fe\u50cf\u9884\u8bad\u7ec3\uff0cRadford \u7b49\uff0c2021\uff09\u662f\u591a\u6a21\u6001\u5bf9\u6bd4\u5b66\u4e60\u7684\u57fa\u7840\u6a21\u578b\u3002\u5b83\u5728\u4ece\u4e92\u8054\u7f51\u4e0a\u6293\u53d6\u7684 4 \u4ebf\u4e2a (\u56fe\u50cf, \u6587\u672c) \u5bf9\u4e0a\u8054\u5408\u8bad\u7ec3\u4e00\u4e2a\u56fe\u50cf\u7f16\u7801\u5668\uff08ViT \u6216 ResNet\uff0c\u7b2c 8 \u7ae0\uff09\u548c\u4e00\u4e2a\u6587\u672c\u7f16\u7801\u5668\uff08Transformer\uff0c\u7b2c 7 \u7ae0\uff09\u3002</p> </li> <li> <p>\u7ed9\u5b9a\u4e00\u6279 \\(N\\) \u4e2a\u56fe\u50cf-\u6587\u672c\u5bf9\uff0cCLIP \u8ba1\u7b97\u6240\u6709\u56fe\u50cf\u5d4c\u5165\u4e0e\u6240\u6709\u6587\u672c\u5d4c\u5165\u4e4b\u95f4\u7684 \\(N \\\\times N\\) \u4f59\u5f26\u76f8\u4f3c\u5ea6\u77e9\u9635\u3002\u5bf9\u89d2\u7ebf\u4e0a\u7684\u6761\u76ee\u662f\u5339\u914d\u7684\u5bf9\uff08\u6b63\u6837\u672c\uff09\uff1b\u6240\u6709\u975e\u5bf9\u89d2\u7ebf\u6761\u76ee\u662f\u4e0d\u5339\u914d\u7684\uff08\u8d1f\u6837\u672c\uff09\u3002\u8bad\u7ec3\u635f\u5931\u4fc3\u4f7f\u5bf9\u89d2\u7ebf\u6761\u76ee\u5347\u9ad8\uff0c\u975e\u5bf9\u89d2\u7ebf\u6761\u76ee\u964d\u4f4e\u3002</p> </li> <li> <p>\u8be5\u635f\u5931\u662f\u5bf9\u79f0\u4ea4\u53c9\u71b5\u3002\u5bf9\u4e8e\u56fe\u50cf \\(i\\) \u4e0e\u6587\u672c \\(j = i\\) \u7684\u914d\u5bf9\uff0c\u56fe\u50cf\u5230\u6587\u672c\u7684\u635f\u5931\u4e3a\uff1a</p> </li> </ul> \\[\\\\mathcal{L}_{i \\\\to t} = -\\\\frac{1}{N} \\\\sum_{i=1}^{N} \\\\log \\\\frac{\\\\exp(\\\\text{sim}(z_i^{\\\\text{img}}, z_i^{\\\\text{txt}}) / \\\\tau)}{\\\\sum_{k=1}^{N} \\\\exp(\\\\text{sim}(z_i^{\\\\text{img}}, z_k^{\\\\text{txt}}) / \\\\tau)}\\] <ul> <li>\u6587\u672c\u5230\u56fe\u50cf\u7684\u635f\u5931\u4e0e\u4e4b\u76f8\u540c\uff0c\u53ea\u662f\u4ea4\u6362\u4e86\u89d2\u8272\uff1a</li> </ul> \\[\\\\mathcal{L}_{t \\\\to i} = -\\\\frac{1}{N} \\\\sum_{i=1}^{N} \\\\log \\\\frac{\\\\exp(\\\\text{sim}(z_i^{\\\\text{txt}}, z_i^{\\\\text{img}}) / \\\\tau)}{\\\\sum_{k=1}^{N} \\\\exp(\\\\text{sim}(z_i^{\\\\text{txt}}, z_k^{\\\\text{img}}) / \\\\tau)}\\] <ul> <li>\u603b\u7684 CLIP \u635f\u5931\u662f\u5e73\u5747\u503c\uff1a</li> </ul> \\[\\\\mathcal{L}_{\\\\text{CLIP}} = \\\\frac{1}{2}(\\\\mathcal{L}_{i \\\\to t} + \\\\mathcal{L}_{t \\\\to i})\\] <ul> <li>\u8fd9\u91cc \\(\\\\tau\\) \u662f\u4e00\u4e2a\u53ef\u5b66\u4e60\u7684\u6e29\u5ea6\u53c2\u6570\uff08\u521d\u59cb\u5316\u4e3a \\(\\\\tau = 0.07\\)\uff09\u3002\u6e29\u5ea6\u63a7\u5236 softmax \u5206\u5e03\u7684\u5c16\u9510\u7a0b\u5ea6\uff1a\u8f83\u4f4e\u7684 \\(\\\\tau\\) \u4f7f\u6a21\u578b\u66f4\u4e13\u6ce8\u4e8e\u6700\u63a5\u8fd1\u7684\u5339\u914d\uff0c\u8f83\u9ad8\u7684 \\(\\\\tau\\) \u5219\u66f4\u5747\u5300\u5730\u5206\u5e03\u6982\u7387\u3002CLIP \u5c06 \\(\\\\tau\\) \u4e0e\u6a21\u578b\u6743\u91cd\u4e00\u8d77\u8054\u5408\u5b66\u4e60\uff0c\u800c\u4e0d\u662f\u5c06\u5176\u89c6\u4e3a\u56fa\u5b9a\u7684\u8d85\u53c2\u6570\u3002</li> </ul> <p></p> <ul> <li> <p>CLIP \u7684\u56fe\u50cf\u7f16\u7801\u5668\u901a\u5e38\u662f ViT-L/14\uff08\u5927\u578b Vision Transformer\uff0c14x14 \u5757\uff0c\u7b2c 8 \u7ae0\u6587\u4ef6 04\uff09\u3002\u6587\u672c\u7f16\u7801\u5668\u662f\u4e00\u4e2a 12 \u5c42\u5e26\u6709\u56e0\u679c\u63a9\u7801\u7684 Transformer\uff08\u7c7b\u4f3c GPT\uff0c\u7b2c 7 \u7ae0\u6587\u4ef6 04\uff09\u3002\u4e24\u4e2a\u7f16\u7801\u5668\u90fd\u901a\u8fc7\u4e00\u4e2a\u53ef\u5b66\u4e60\u7684\u7ebf\u6027\u6295\u5f71\u5c06\u5176\u8f93\u51fa\u6620\u5c04\u5230\u5171\u4eab\u7684 512 \u6216 768 \u7ef4\u7a7a\u95f4\uff0c\u968f\u540e\u8fdb\u884c \\(L_2\\) \u5f52\u4e00\u5316\u3002</p> </li> <li> <p>CLIP \u6700\u5f15\u4eba\u6ce8\u76ee\u7684\u7279\u6027\u662f\u96f6\u6837\u672c\u56fe\u50cf\u5206\u7c7b\u3002\u8981\u5c06\u56fe\u50cf\u5206\u7c7b\u5230 \\(K\\) \u4e2a\u7c7b\u522b\u4e4b\u4e00\uff0c\u4f60\u521b\u5efa \\(K\\) \u4e2a\u6587\u672c\u63d0\u793a\uff0c\u5982\"a photo of a {class name}\"\uff0c\u7528\u6587\u672c\u7f16\u7801\u5668\u5d4c\u5165\u6bcf\u4e2a\u63d0\u793a\uff0c\u7528\u56fe\u50cf\u7f16\u7801\u5668\u5d4c\u5165\u56fe\u50cf\uff0c\u7136\u540e\u9009\u62e9\u6587\u672c\u5d4c\u5165\u4e0e\u56fe\u50cf\u5d4c\u5165\u4f59\u5f26\u76f8\u4f3c\u5ea6\u6700\u9ad8\u7684\u7c7b\u522b\u3002\u5728 ImageNet \u4e0a\uff0cCLIP \u5728\u4ece\u672a\u89c1\u8fc7\u4efb\u4f55 ImageNet \u8bad\u7ec3\u6837\u672c\u7684\u60c5\u51b5\u4e0b\u53d6\u5f97\u4e86\u5177\u6709\u7ade\u4e89\u529b\u7684\u51c6\u786e\u7387\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/01.%20multimodal%20representations/#align","title":"ALIGN","text":"<ul> <li>ALIGN\uff08Jia \u7b49\uff0c2021\uff09\u5c06 CLIP \u7684\u65b9\u6cd5\u6269\u5c55\u5230\u66f4\u5927\u3001\u66f4\u5608\u6742\u7684\u6570\u636e\u96c6\uff1a18 \u4ebf\u4e2a\u56fe\u50cf-\u6587\u672c\u5bf9\uff0c\u4ec5\u6781\u5c11\u91cf\u8fc7\u6ee4\u3002CLIP \u7cbe\u5fc3\u7b5b\u9009\u5176\u6570\u636e\uff0c\u800c ALIGN \u8868\u660e\u89c4\u6a21\u53ef\u4ee5\u5f25\u8865\u566a\u58f0\u3002ALIGN \u4f7f\u7528 EfficientNet \u56fe\u50cf\u7f16\u7801\u5668\u548c BERT \u6587\u672c\u7f16\u7801\u5668\uff0c\u5e76\u4f7f\u7528\u76f8\u540c\u7684\u5bf9\u6bd4\u635f\u5931\u8fdb\u884c\u8bad\u7ec3\u3002\u5173\u952e\u53d1\u73b0\u662f\uff0c\u53ea\u8981\u6709\u8db3\u591f\u7684\u6570\u636e\uff0c\u5c31\u4e0d\u9700\u8981\u6602\u8d35\u7684\u6570\u636e\u6e05\u6d17\uff1a\u5bf9\u6bd4\u76ee\u6807\u4f1a\u81ea\u7136\u5730\u964d\u4f4e\u566a\u58f0\u5bf9\u7684\u6743\u91cd\uff0c\u56e0\u4e3a\u5b83\u4eec\u4ea7\u751f\u4e0d\u4e00\u81f4\u7684\u68af\u5ea6\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/01.%20multimodal%20representations/#siglip","title":"SigLIP","text":"<ul> <li> <p>SigLIP\uff08Sigmoid Loss for Language-Image Pre-training\uff0cSigmoid \u635f\u5931\u8bed\u8a00-\u56fe\u50cf\u9884\u8bad\u7ec3\uff0cZhai \u7b49\uff0c2023\uff09\u7528\u66f4\u7b80\u5355\u7684 sigmoid \u635f\u5931\u53d6\u4ee3\u4e86 CLIP \u57fa\u4e8e softmax \u7684\u5bf9\u6bd4\u635f\u5931\u3002SigLIP \u4e0d\u5c06 \\(N \\\\times N\\) \u76f8\u4f3c\u5ea6\u77e9\u9635\u89c6\u4e3a\u5206\u7c7b\u95ee\u9898\uff08\u6bcf\u884c\u662f\u4e00\u4e2a\u5217\u4e0a\u7684 softmax\uff09\uff0c\u800c\u662f\u5c06\u6bcf\u4e2a\u6761\u76ee\u72ec\u7acb\u89c6\u4e3a\u4e8c\u5206\u7c7b\u95ee\u9898\uff1a\u8fd9\u4e2a (\u56fe\u50cf, \u6587\u672c) \u5bf9\u662f\u5426\u5339\u914d\uff1f</p> </li> <li> <p>\u5355\u4e2a\u5bf9 \\((i, j)\\) \u7684 SigLIP \u635f\u5931\u662f\uff1a</p> </li> </ul> \\[\\\\mathcal{L}_{ij} = -y_{ij} \\\\log \\\\sigma(z_i^{\\\\text{img}} \\\\cdot z_j^{\\\\text{txt}} / \\\\tau) - (1 - y_{ij}) \\\\log(1 - \\\\sigma(z_i^{\\\\text{img}} \\\\cdot z_j^{\\\\text{txt}} / \\\\tau))\\] <ul> <li> <p>\u5176\u4e2d \\(y_{ij} = 1\\) \u5982\u679c \\(i = j\\)\uff08\u5339\u914d\uff09\uff0c\u5426\u5219 \\(y_{ij} = 0\\)\uff0c\\(\\\\sigma\\) \u662f sigmoid \u51fd\u6570\u3002</p> </li> <li> <p>SigLIP \u7684\u5173\u952e\u4f18\u52bf\u5728\u4e8e\u5b83\u6d88\u9664\u4e86\u8de8\u6574\u4e2a\u6279\u6b21\u8fdb\u884c\u5168\u5c40 softmax \u5f52\u4e00\u5316\u7684\u9700\u8981\u3002\u5728 CLIP \u4e2d\uff0csoftmax \u5206\u6bcd\u9700\u8981\u6536\u96c6\u6240\u6709\u8bbe\u5907\u4e0a\u7684\u6240\u6709\u5d4c\u5165\uff0c\u8fd9\u5728\u5206\u5e03\u5f0f\u8bad\u7ec3\u4e2d\u662f\u4e00\u4e2a\u901a\u4fe1\u74f6\u9888\u3002SigLIP \u7684\u9010\u5bf9 sigmoid \u635f\u5931\u53ef\u4ee5\u5728\u672c\u5730\u8ba1\u7b97\uff0c\u4ece\u800c\u80fd\u591f\u66f4\u9ad8\u6548\u5730\u6269\u5c55\u5230\u975e\u5e38\u5927\u7684\u6279\u6b21\u3002SigLIP \u4ee5\u66f4\u4f4e\u7684\u8bad\u7ec3\u6210\u672c\u8fbe\u5230\u4e86\u4e0e CLIP \u76f8\u5f53\u7684\u8d28\u91cf\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/01.%20multimodal%20representations/#_5","title":"\u5bf9\u6bd4\u635f\u5931\u51fd\u6570\u8be6\u89e3","text":"<ul> <li>\u5bf9\u6bd4\u5b66\u4e60\u4e2d\u4f7f\u7528\u7684\u635f\u5931\u51fd\u6570\u5171\u4eab\u4e00\u4e2a\u5171\u540c\u7684\u7ed3\u6784\uff1a\u5b83\u4eec\u90fd\u8bd5\u56fe\u4f7f\u6b63\u6837\u672c\u5bf9\u7684\u76f8\u4f3c\u5ea6\u5f97\u5206\u9ad8\u4e8e\u8d1f\u6837\u672c\u5bf9\u7684\u76f8\u4f3c\u5ea6\u5f97\u5206\uff0c\u540c\u65f6\u901a\u8fc7\u67d0\u79cd\"\u95f4\u9694\"\u6216\"\u6e29\u5ea6\"\u63a7\u5236\u6a21\u578b\u65bd\u52a0\u7684\u529b\u5ea6\u3002\u8ba9\u6211\u4eec\u5f62\u5f0f\u5316\u5173\u952e\u53d8\u4f53\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/01.%20multimodal%20representations/#infonce","title":"InfoNCE","text":"<ul> <li>InfoNCE\uff08\u566a\u58f0\u5bf9\u6bd4\u4f30\u8ba1\uff0cvan den Oord \u7b49\uff0c2018\uff09\u662f CLIP \u635f\u5931\u80cc\u540e\u7684\u7406\u8bba\u57fa\u7840\u3002\u7ed9\u5b9a\u4e00\u4e2a\u67e5\u8be2 \\(q\\)\u3001\u4e00\u4e2a\u6b63\u6837\u672c\u952e \\(k^+\\) \u548c \\(K\\) \u4e2a\u8d1f\u6837\u672c\u952e \\(\\\\{k_1^-, \\\\ldots, k_K^-\\\\}\\)\uff0c\u635f\u5931\u4e3a\uff1a</li> </ul> \\[\\\\mathcal{L}_{\\\\text{InfoNCE}} = -\\\\log \\\\frac{\\\\exp(q \\\\cdot k^+ / \\\\tau)}{\\\\exp(q \\\\cdot k^+ / \\\\tau) + \\\\sum_{j=1}^{K} \\\\exp(q \\\\cdot k_j^- / \\\\tau)}\\] <ul> <li>\u8fd9\u662f\u4e00\u4e2a \\((K+1)\\) \u7c7b\u5206\u7c7b\u95ee\u9898\uff1a\u4ece \\(K+1\\) \u4e2a\u5019\u9009\u4e2d\u8bc6\u522b\u51fa\u6b63\u6837\u672c\u3002InfoNCE \u662f\u67e5\u8be2\u4e0e\u6b63\u6837\u672c\u952e\u4e4b\u95f4\u4e92\u4fe1\u606f\u7684\u4e0b\u754c\uff0c\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48\u6700\u5927\u5316\u5b83\u80fd\u591f\u5bf9\u9f50\u8bed\u4e49\u5339\u914d\u8f93\u5165\u7684\u8868\u5f81\u3002\u968f\u7740\u8d1f\u6837\u672c\u6570\u91cf \\(K\\) \u7684\u589e\u52a0\uff0c\u4e0b\u754c\u66f4\u52a0\u7d27\u81f4\uff0c\u8fd9\u89e3\u91ca\u4e86\u4e3a\u4ec0\u4e48\u5bf9\u6bd4\u65b9\u6cd5\u53d7\u76ca\u4e8e\u5927\u6279\u91cf\u5927\u5c0f\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/01.%20multimodal%20representations/#nt-xent","title":"NT-Xent","text":"<ul> <li>NT-Xent\uff08\u5f52\u4e00\u5316\u6e29\u5ea6\u6807\u5ea6\u4ea4\u53c9\u71b5\uff0cChen \u7b49\uff0c2020\uff09\u662f SimCLR\uff08\u7b2c 8 \u7ae0\u6587\u4ef6 04\uff09\u4e2d\u4f7f\u7528\u7684\u635f\u5931\uff0c\u672c\u8d28\u4e0a\u662f\u5728\u6279\u6b21\u5185\u5bf9\u79f0\u5e94\u7528\u7684 InfoNCE\u3002\u5bf9\u4e8e\u4e00\u6279 \\(N\\) \u4e2a\u5bf9\uff0c\\(2N\\) \u4e2a\u589e\u5e7f\u89c6\u56fe\u4e3a\u6bcf\u4e2a\u951a\u70b9\u4ea7\u751f \\(2N - 2\\) \u4e2a\u8d1f\u6837\u672c\uff08\u9664\u81ea\u8eab\u53ca\u5176\u6b63\u6837\u672c\u5916\u7684\u6240\u6709\u89c6\u56fe\uff09\u3002\u6b63\u6837\u672c\u5bf9 \\((i, j)\\) \u7684\u635f\u5931\u4e3a\uff1a</li> </ul> \\[\\\\ell_{i,j} = -\\\\log \\\\frac{\\\\exp(\\\\text{sim}(z_i, z_j) / \\\\tau)}{\\\\sum_{k=1}^{2N} \\\\mathbf{1}_{[k \\\\neq i]} \\\\exp(\\\\text{sim}(z_i, z_k) / \\\\tau)}\\] <ul> <li>NT-Xent \u548c InfoNCE \u662f\u76f8\u540c\u7684\u6570\u5b66\u516c\u5f0f\uff1b\u540d\u79f0\u4e0d\u540c\u53ea\u662f\u56e0\u4e3a\u5b83\u4eec\u662f\u5728\u4e0d\u540c\u7684\u4e0a\u4e0b\u6587\uff08\u81ea\u76d1\u7763\u89c6\u89c9 vs. \u8868\u5f81\u5b66\u4e60\u7406\u8bba\uff09\u4e2d\u5f15\u5165\u7684\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/01.%20multimodal%20representations/#_6","title":"\u6e29\u5ea6\u7684\u4f5c\u7528","text":"<ul> <li> <p>\u6e29\u5ea6 \\(\\\\tau\\) \u662f\u5bf9\u6bd4\u5b66\u4e60\u4e2d\u6700\u91cd\u8981\u7684\u8d85\u53c2\u6570\u4e4b\u4e00\u3002\u4e3a\u4e86\u5efa\u7acb\u76f4\u89c9\uff0c\u53ef\u4ee5\u4ece\u7269\u7406\u610f\u4e49\u4e0a\u8003\u8651\u6e29\u5ea6\uff1a\u5728\u9ad8\u6e29\u4e0b\uff0c\u5206\u5b50\u968f\u673a\u8fd0\u52a8\uff08softmax \u662f\u5e73\u5766\u7684\uff0c\u6240\u6709\u8d1f\u6837\u672c\u770b\u8d77\u6765\u4e00\u6837\u5dee\uff09\uff1b\u5728\u4f4e\u6e29\u4e0b\uff0c\u5206\u5b50\u6c89\u964d\u4e3a\u521a\u6027\u7ed3\u6784\uff08softmax \u662f\u5c16\u9510\u7684\uff0c\u53ea\u6709\u6700\u96be\u7684\u8d1f\u6837\u672c\u624d\u91cd\u8981\uff09\u3002</p> </li> <li> <p>\u5f62\u5f0f\u5316\u5730\uff0c\u5f53 \\(\\\\tau \\\\to 0\\) \u65f6\uff0csoftmax \u8d8b\u8fd1\u4e8e\u786c argmax\uff0c\u53ea\u9009\u62e9\u6700\u5355\u4e00\u7684\u56f0\u96be\u8d1f\u6837\u672c\u3002\u5f53 \\(\\\\tau \\\\to \\\\infty\\) \u65f6\uff0c\u6240\u6709\u8d1f\u6837\u672c\u7684\u8d21\u732e\u76f8\u7b49\u3002\u5728\u5b9e\u8df5\u4e2d\uff0c\\(\\\\tau \\\\in [0.01, 0.1]\\) \u5bf9\u5f52\u4e00\u5316\u5d4c\u5165\u6548\u679c\u826f\u597d\u3002\u6e29\u5ea6\u8fc7\u4f4e\u4f1a\u5bfc\u81f4\u8bad\u7ec3\u4e0d\u7a33\u5b9a\uff08\u56f0\u96be\u8d1f\u6837\u672c\u7684\u68af\u5ea6\u53d8\u5f97\u975e\u5e38\u5927\uff09\uff1b\u6e29\u5ea6\u8fc7\u9ad8\u4f1a\u4f7f\u635f\u5931\u5bf9\u8fdd\u53cd\u60c5\u51b5\u4e0d\u654f\u611f\u3002</p> </li> <li> <p>CLIP \u521d\u59cb\u5316 \\(\\\\tau = 0.07\\) \u5e76\u5c06\u5176\u4f5c\u4e3a\u5bf9\u6570\u53c2\u6570\u5316\u7684\u6807\u91cf \\(\\\\tau = \\\\exp(t)\\) \u5b66\u4e60\uff0c\u5176\u4e2d \\(t\\) \u4e0e\u6a21\u578b\u6743\u91cd\u4e00\u8d77\u901a\u8fc7\u68af\u5ea6\u4e0b\u964d\u66f4\u65b0\u3002\u8fd9\u4f7f\u5f97\u6a21\u578b\u80fd\u591f\u5728\u8bad\u7ec3\u8fc7\u7a0b\u4e2d\u81ea\u52a8\u8c03\u6574\u5bf9\u6bd4\u4efb\u52a1\u7684\u96be\u5ea6\u3002</p> </li> </ul> <p></p>"},{"location":"chapter%2010%3A%20multimodal%20learning/01.%20multimodal%20representations/#_7","title":"\u4e09\u5143\u7ec4\u635f\u5931\u548c\u57fa\u4e8e\u95f4\u9694\u7684\u66ff\u4ee3\u65b9\u6848","text":"<ul> <li>\u5728 InfoNCE \u4e3b\u5bfc\u4e4b\u524d\uff0c\u4e09\u5143\u7ec4\u635f\u5931\uff08triplet loss\uff09 \u662f\u5ea6\u91cf\u5b66\u4e60\u7684\u6807\u51c6\u3002\u7ed9\u5b9a\u4e00\u4e2a\u951a\u70b9 \\(a\\)\u3001\u4e00\u4e2a\u6b63\u6837\u672c \\(p\\) \u548c\u4e00\u4e2a\u8d1f\u6837\u672c \\(n\\)\uff1a</li> </ul> \\[\\\\mathcal{L}_{\\\\text{triplet}} = \\\\max(0, \\\\|a - p\\\\|^2 - \\\\|a - n\\\\|^2 + m)\\] <ul> <li> <p>\u5176\u4e2d \\(m\\) \u662f\u4e00\u4e2a\u95f4\u9694\uff0c\u786e\u4fdd\u6b63\u6837\u672c\u81f3\u5c11\u6bd4\u8d1f\u6837\u672c\u8fd1 \\(m\\)\u3002\u4e09\u5143\u7ec4\u635f\u5931\u64cd\u4f5c\u5728\u5355\u4e2a\u4e09\u5143\u7ec4\u4e0a\u800c\u975e\u6279\u6b21\u4e0a\uff0c\u56e0\u6b64\u6837\u672c\u6548\u7387\u4f4e\u4e8e InfoNCE\u3002\u5b83\u8fd8\u5bf9\u6316\u6398\u7b56\u7565\u654f\u611f\uff1a\u968f\u673a\u8d1f\u6837\u672c\u901a\u5e38\u8fc7\u4e8e\u7b80\u5355\uff08\u635f\u5931\u4e3a\u96f6\uff09\uff0c\u56e0\u6b64\u56f0\u96be\u8d1f\u6837\u672c\u6316\u6398\uff08hard negative mining\uff0c\u9009\u62e9\u6700\u63a5\u8fd1\u7684\u4e0d\u6b63\u786e\u5339\u914d\uff09\u6216\u534a\u56f0\u96be\u6316\u6398\uff08semi-hard mining\uff0c\u9009\u62e9\u95f4\u9694\u5185\u7684\u8d1f\u6837\u672c\uff09\u81f3\u5173\u91cd\u8981\u3002</p> </li> <li> <p>InfoNCE \u5728\u6574\u4e2a\u6279\u6b21\u4e2d\u9690\u5f0f\u5730\u6267\u884c\u56f0\u96be\u8d1f\u6837\u672c\u6316\u6398\uff0c\u8fd9\u662f\u5b83\u5728\u89c4\u6a21\u4e0a\u4f18\u4e8e\u4e09\u5143\u7ec4\u635f\u5931\u7684\u539f\u56e0\u4e4b\u4e00\u3002InfoNCE \u4e2d\u7684 softmax \u5f52\u4e00\u5316\u81ea\u52a8\u63d0\u9ad8\u56f0\u96be\u8d1f\u6837\u672c\uff08\u4e0e\u951a\u70b9\u76f8\u4f3c\u5ea6\u9ad8\u7684\u8d1f\u6837\u672c\uff09\u7684\u6743\u91cd\uff0c\u5728\u65e0\u9700\u663e\u5f0f\u6316\u6398\u7684\u60c5\u51b5\u4e0b\u63d0\u4f9b\u4e86\u81ea\u7136\u7684\u8bfe\u7a0b\u5b66\u4e60\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/01.%20multimodal%20representations/#-","title":"\u56fe\u50cf-\u6587\u672c\u68c0\u7d22\u4e0e\u96f6\u6837\u672c\u5206\u7c7b","text":"<ul> <li> <p>\u4e00\u65e6\u4f60\u6709\u4e86\u8bad\u7ec3\u597d\u7684\u8054\u5408\u5d4c\u5165\u7a7a\u95f4\uff0c\u5c31\u53ef\u4ee5\u6267\u884c\u56fe\u50cf-\u6587\u672c\u68c0\u7d22\uff1a\u7ed9\u5b9a\u4e00\u4e2a\u56fe\u50cf\u67e5\u8be2\uff0c\u4ece\u6570\u636e\u5e93\u4e2d\u627e\u51fa\u6700\u76f8\u5173\u7684\u6587\u672c\uff08\u56fe\u50cf\u5230\u6587\u672c\u68c0\u7d22\uff09\uff0c\u6216\u8005\u7ed9\u5b9a\u4e00\u4e2a\u6587\u672c\u67e5\u8be2\uff0c\u627e\u51fa\u6700\u76f8\u5173\u7684\u56fe\u50cf\uff08\u6587\u672c\u5230\u56fe\u50cf\u68c0\u7d22\uff09\u3002\u8fd9\u4ec5\u4ec5\u662f\u5171\u4eab\u5d4c\u5165\u7a7a\u95f4\u4e2d\u7684\u6700\u8fd1\u90bb\u641c\u7d22\u3002</p> </li> <li> <p>\u60f3\u8c61\u4e00\u4e2a\u56fe\u4e66\u7ba1\u7406\u5458\uff0c\u53ef\u4ee5\u5373\u65f6\u6bd4\u8f83\u4e00\u767e\u4e07\u6761\u76ee\u5f55\u4e2d\u7684\u4efb\u4f55\u7167\u7247\u4e0e\u4efb\u4f55\u63cf\u8ff0\u3002\u4ed6\u4eec\u4e0d\u9700\u8981\u4e8b\u5148\u7406\u89e3\u6bcf\u4e00\u4e2a\u53ef\u80fd\u7684\u7c7b\u522b\uff1b\u53ea\u9700\u6d4b\u91cf\u6bcf\u5f20\u7167\u7247\u4e0e\u6bcf\u6761\u63cf\u8ff0\u6709\u591a\"\u63a5\u8fd1\"\u3002\u8fd9\u5c31\u662f CLIP \u98ce\u683c\u7684\u6a21\u578b\u6267\u884c\u68c0\u7d22\u548c\u96f6\u6837\u672c\u5206\u7c7b\u7684\u65b9\u5f0f\u3002</p> </li> <li> <p>\u96f6\u6837\u672c\u5206\u7c7b\u662f\u6587\u672c\u5230\u56fe\u50cf\u68c0\u7d22\u7684\u4e00\u4e2a\u7279\u4f8b\u3002\u7ed9\u5b9a \\(K\\) \u4e2a\u7c7b\u522b\u540d\u79f0\uff0c\u4f60\u6784\u5efa\u6587\u672c\u63d0\u793a \\(\\\\{t_1, \\\\ldots, t_K\\\\}\\)\uff08\u4f8b\u5982\uff0c\"a photo of a cat\"\u3001\"a photo of a dog\"\uff09\u5e76\u5bf9\u5176\u8fdb\u884c\u5d4c\u5165\u3002\u5bf9\u4e8e\u4e00\u5f20\u65b0\u56fe\u50cf \\(x\\)\uff0c\u9884\u6d4b\u7684\u7c7b\u522b\u4e3a\uff1a</p> </li> </ul> \\[\\\\hat{y} = \\\\arg\\\\max_{k} \\\\; \\\\text{sim}(f_\\\\theta(x), g_\\\\phi(t_k))\\] <ul> <li> <p>\u5173\u952e\u6d1e\u5bdf\u5728\u4e8e\uff0c\u6587\u672c\u7f16\u7801\u5668\u5145\u5f53\u4e86\u4e00\u4e2a\u7075\u6d3b\u7684\u5206\u7c7b\u5668\u5934\u3002\u4f60\u4e0d\u9700\u8981\u4e3a\u6bcf\u4e2a\u4e0b\u6e38\u4efb\u52a1\u8bad\u7ec3\u65b0\u7684\u7ebf\u6027\u5c42\uff0c\u53ea\u9700\u7528\u81ea\u7136\u8bed\u8a00\u63cf\u8ff0\u4efb\u52a1\u3002\u8fd9\u5c31\u662f CLIP \u6cdb\u5316\u80fd\u529b\u5982\u6b64\u4e4b\u5f3a\u7684\u539f\u56e0\uff1a\u6587\u672c\u7f16\u7801\u5668\u5728\u9884\u8bad\u7ec3\u671f\u95f4\u89c1\u8fc7\u6570\u767e\u4e07\u79cd\u4e0d\u540c\u7684\u63cf\u8ff0\u3002</p> </li> <li> <p>\u63d0\u793a\u5de5\u7a0b\uff08prompt engineering\uff09 \u5f88\u91cd\u8981\u3002CLIP \u5728 ImageNet \u4e0a\u7684\u96f6\u6837\u672c\u51c6\u786e\u7387\u4ece 63.2% \u63d0\u5347\u5230 68.4%\uff0c\u4ec5\u4ec5\u662f\u5c06\u63d0\u793a\u6a21\u677f\u4ece \"{class name}\" \u6539\u4e3a \"a photo of a {class name}.\" \u66f4\u597d\u7684\u662f\uff0c\u63d0\u793a\u96c6\u6210\uff08prompt ensembling\uff09 \u901a\u8fc7\u5e73\u5747\u591a\u4e2a\u6a21\u677f\u7684\u6587\u672c\u5d4c\u5165\uff08\u4f8b\u5982\uff0c\"a photo of a {class name}\"\u3001\"a good photo of a {class name}\"\u3001\"a drawing of a {class name}\"\uff09\u6765\u4ea7\u751f\u66f4\u9c81\u68d2\u7684\u6587\u672c\u8868\u5f81\u3002</p> </li> </ul> <p></p>"},{"location":"chapter%2010%3A%20multimodal%20learning/01.%20multimodal%20representations/#_8","title":"\u97f3\u89c6\u9891\u5bf9\u5e94","text":"<ul> <li> <p>\u95ed\u4e0a\u773c\u775b\uff0c\u542c\u67d0\u4eba\u62cd\u7bee\u7403\u3002\u4f60\u80fd\u4ece\u8282\u594f\u6027\u7684\u7830\u7830\u58f0\u4e2d\u5224\u65ad\u7403\u4f55\u65f6\u843d\u5730\u3002\u73b0\u5728\u7741\u5f00\u773c\u775b\uff1a\u89c6\u89c9\u4e0a\u7684\u5f39\u8df3\u4e0e\u6bcf\u6b21\u7830\u58f0\u5b8c\u7f8e\u5bf9\u9f50\u3002\u8fd9\u79cd\u97f3\u9891\u4e0e\u89c6\u89c9\u4e8b\u4ef6\u4e4b\u95f4\u7684\u7d27\u5bc6\u5bf9\u5e94\u5173\u7cfb\u662f\u4e00\u79cd\u673a\u5668\u53ef\u4ee5\u5b66\u4e60\u7684\u514d\u8d39\u76d1\u7763\u4fe1\u53f7\u3002\u97f3\u89c6\u9891\u5bf9\u5e94\u5b66\u4e60\uff08audio-visual correspondence learning\uff09 \u8bad\u7ec3\u6a21\u578b\u5c06\u58f0\u97f3\u4e0e\u5176\u89c6\u89c9\u6765\u6e90\u5173\u8054\u8d77\u6765\uff0c\u65e0\u9700\u4efb\u4f55\u4eba\u5de5\u6807\u6ce8\u3002</p> </li> <li> <p>\u8fd9\u4e2a\u60f3\u6cd5\u4e0e CLIP \u60ca\u4eba\u5730\u76f8\u4f3c\uff0c\u53ea\u662f\u5c06\u6587\u672c\u66ff\u6362\u4e3a\u97f3\u9891\u3002\u7ed9\u5b9a\u914d\u5bf9\u7684\u89c6\u9891\u5e27\u548c\u97f3\u9891\u7247\u6bb5\uff0c\u6a21\u578b\u5b66\u4e60\u4e00\u4e2a\u5d4c\u5165\u7a7a\u95f4\uff0c\u5176\u4e2d\u65f6\u95f4\u4e0a\u5bf9\u9f50\u7684\u97f3\u89c6\u9891\u5bf9\u5f7c\u6b64\u63a5\u8fd1\uff0c\u800c\u9519\u4f4d\u7684\u5bf9\u5219\u76f8\u8ddd\u5f88\u8fdc\u3002</p> </li> <li> <p>\u97f3\u89c6\u9891\u5d4c\u5165\uff08Audio-Visual Embedding, AVE\uff09 \u65b9\u6cd5\uff08Arandjelovic \u548c Zisserman\uff0c2017\uff09\u4f7f\u7528\u5bf9\u6bd4\u635f\u5931\u5728\u89c6\u9891\u6570\u636e\u4e0a\u8bad\u7ec3\u4e00\u4e2a\u89c6\u89c9\u7f16\u7801\u5668 \\(f\\) \u548c\u4e00\u4e2a\u97f3\u9891\u7f16\u7801\u5668 \\(g\\)\u3002\u6b63\u6837\u672c\u5bf9\u662f\uff08\u89c6\u9891\u5e27\uff0c\u6765\u81ea\u540c\u4e00\u65f6\u523b\u7684\u97f3\u9891\u7247\u6bb5\uff09\uff0c\u8d1f\u6837\u672c\u662f\u6765\u81ea\u4e0d\u540c\u89c6\u9891\u6216\u4e0d\u540c\u65f6\u523b\u7684\u97f3\u9891\u7247\u6bb5\u3002\u6a21\u578b\u5b66\u4f1a\u72d7\u53eb\u58f0\u5bf9\u5e94\u72d7\u7684\u56fe\u50cf\uff0c\u5409\u4ed6\u58f0\u5bf9\u5e94\u5409\u4ed6\u7684\u56fe\u50cf\uff0c\u6240\u6709\u8fd9\u4e9b\u90fd\u4e0d\u9700\u8981\u6807\u7b7e\u3002</p> </li> <li> <p>\u97f3\u9891\u7f16\u7801\u5668\u901a\u5e38\u4f7f\u7528 CNN \u6216\u97f3\u9891 Transformer \u5904\u7406\u5bf9\u6570\u6885\u5c14\u8bed\u8c31\u56fe\uff08log-mel spectrograms\uff09\uff08\u7b2c 9 \u7ae0\u6587\u4ef6 01\uff09\uff0c\u751f\u6210\u56fa\u5b9a\u5927\u5c0f\u7684\u5d4c\u5165\u3002\u89c6\u89c9\u7f16\u7801\u5668\u4f7f\u7528\u6807\u51c6\u56fe\u50cf\u9aa8\u5e72\u7f51\u7edc\uff08ResNet\u3001ViT\uff09\u5904\u7406\u89c6\u9891\u5e27\u3002\u4e24\u8005\u90fd\u6295\u5f71\u5230\u5171\u4eab\u7684 \\(d\\) \u7ef4\u7a7a\u95f4\uff0c\u8bad\u7ec3\u4f7f\u7528\u4e0e CLIP \u76f8\u540c\u7684 InfoNCE \u635f\u5931\uff1a</p> </li> </ul> \\[\\\\mathcal{L}_{\\\\text{AV}} = -\\\\log \\\\frac{\\\\exp(\\\\text{sim}(z^{\\\\text{vis}}, z^{\\\\text{aud}}) / \\\\tau)}{\\\\sum_{k=1}^{N} \\\\exp(\\\\text{sim}(z^{\\\\text{vis}}, z_k^{\\\\text{aud}}) / \\\\tau)}\\] <p></p> <ul> <li> <p>\u97f3\u89c6\u9891\u5b66\u4e60\u7684\u5e94\u7528\u5305\u62ec\uff1a\u58f0\u6e90\u5b9a\u4f4d\uff08\u56fe\u50cf\u4e2d\u58f0\u97f3\u6765\u81ea\u4f55\u5904\uff1f\uff09\u3001\u97f3\u89c6\u9891\u8bed\u97f3\u8bc6\u522b\uff08\u7ed3\u5408\u5634\u5507\u8fd0\u52a8\u548c\u97f3\u9891\uff0c\u5982\u7b2c 9 \u7ae0\u6587\u4ef6 02\uff09\u3001\u97f3\u89c6\u9891\u6e90\u5206\u79bb\uff08\u901a\u8fc7\u770b\u7740\u5bf9\u65b9\u7684\u8138\u6765\u9694\u79bb\u4e00\u4e2a\u4eba\u7684\u58f0\u97f3\u2014\u2014\u7b2c 9 \u7ae0\u6587\u4ef6 05 \u4e2d\u7684\"\u9e21\u5c3e\u9152\u4f1a\"\u95ee\u9898\uff09\uff0c\u4ee5\u53ca\u57fa\u4e8e\u97f3\u9891\u7684\u89c6\u9891\u751f\u6210\u3002</p> </li> <li> <p>ImageBind\uff08Girdhar \u7b49\uff0c2023\uff09\u5c06\u5176\u6269\u5c55\u5230\u516d\u79cd\u6a21\u6001\uff1a\u56fe\u50cf\u3001\u6587\u672c\u3001\u97f3\u9891\u3001\u6df1\u5ea6\u3001\u70ed\u6210\u50cf\u548c IMU \u6570\u636e\u3002\u5173\u952e\u6d1e\u5bdf\u5728\u4e8e\uff0c\u4f60\u4e0d\u9700\u8981\u6bcf\u4e2a\u7ec4\u5408\u90fd\u6709\u914d\u5bf9\u6570\u636e\u3002\u901a\u8fc7\u5c06\u6bcf\u79cd\u6a21\u6001\u4e0e\u56fe\u50cf\u5bf9\u9f50\uff08\u6587\u672c\u901a\u8fc7\u56fe\u50cf-\u6587\u672c\u5bf9\uff0c\u97f3\u9891\u901a\u8fc7\u56fe\u50cf-\u97f3\u9891\u5bf9\u7b49\uff09\uff0c\u6240\u6709\u6a21\u6001\u901a\u8fc7\u5171\u4eab\u7684\u56fe\u50cf\u5d4c\u5165\u7a7a\u95f4\u9690\u5f0f\u5bf9\u9f50\u3002\u8fd9\u79cd\u901a\u8fc7\u516c\u5171\u951a\u70b9\u6a21\u6001\u7684\"\u7ed1\u5b9a\"\u4ea7\u751f\u4e86\u6d8c\u73b0\u5f0f\u5bf9\u9f50\uff1a\u97f3\u9891\u548c\u6587\u672c\u53d8\u5f97\u76f8\u4f3c\uff0c\u5373\u4f7f\u5b83\u4eec\u4ece\u672a\u88ab\u76f4\u63a5\u4e00\u8d77\u8bad\u7ec3\u8fc7\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/01.%20multimodal%20representations/#_9","title":"\u8bc4\u4f30","text":"<ul> <li>\u8bc4\u4f30\u591a\u6a21\u6001\u6a21\u578b\u9700\u8981\u80fd\u591f\u6355\u6349\u8de8\u6a21\u6001\u7406\u89e3\u7684\u5ea6\u91cf\u6307\u6807\u3002\u4e24\u79cd\u4e3b\u6d41\u7684\u8bc4\u4f30\u8303\u5f0f\u662f\u96f6\u6837\u672c\u57fa\u51c6\u6d4b\u8bd5\u548c\u68c0\u7d22\u5ea6\u91cf\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/01.%20multimodal%20representations/#_10","title":"\u96f6\u6837\u672c\u57fa\u51c6\u6d4b\u8bd5","text":"<ul> <li> <p>\u96f6\u6837\u672c\u8bc4\u4f30\u8861\u91cf\u6a21\u578b\u662f\u5426\u80fd\u591f\u6267\u884c\u4ece\u672a\u88ab\u660e\u786e\u8bad\u7ec3\u8fc7\u7684\u4efb\u52a1\u3002\u6700\u5e38\u7528\u7684\u57fa\u51c6\u662fImageNet \u96f6\u6837\u672c\u51c6\u786e\u7387\uff1a\u5c06\u6240\u6709 1,000 \u4e2a ImageNet \u7c7b\u522b\u540d\u79f0\u4f5c\u4e3a\u6587\u672c\u5d4c\u5165\uff0c\u5d4c\u5165\u6bcf\u4e2a\u6d4b\u8bd5\u56fe\u50cf\uff0c\u6839\u636e\u4f59\u5f26\u76f8\u4f3c\u5ea6\u6d4b\u91cf top-1 \u548c top-5 \u5206\u7c7b\u51c6\u786e\u7387\u3002CLIP ViT-L/14 \u5728\u96f6\u6837\u672c\u4e0b\u8fbe\u5230 75.5% \u7684 top-1 \u51c6\u786e\u7387\uff0c\u4e0e\u5728 ImageNet \u4e0a\u8bad\u7ec3\u7684\u76d1\u7763\u5f0f ResNet-50 \u76f8\u5f53\u3002</p> </li> <li> <p>\u5176\u4ed6\u96f6\u6837\u672c\u57fa\u51c6\u5305\u62ec\uff1aCIFAR-10/100\u3001STL-10\u3001Food-101\u3001Oxford Pets \u548c Flowers-102\u3002\u5728\u591a\u4e2a\u6570\u636e\u96c6\u4e0a\u8bc4\u4f30\u53ef\u4ee5\u6d4b\u8bd5\u6a21\u578b\u662f\u5426\u771f\u6b63\u5177\u6709\u901a\u7528\u7684\u89c6\u89c9\u7406\u89e3\u80fd\u529b\uff0c\u8fd8\u662f\u4ec5\u4ec5\u662f\u8bb0\u4f4f\u4e86\u9884\u8bad\u7ec3\u6570\u636e\u4e2d\u7684\u6a21\u5f0f\u3002</p> </li> <li> <p>\u7ebf\u6027\u63a2\u6d4b\uff08linear probe\uff09 \u8bc4\u4f30\u662f\u4e00\u79cd\u4e92\u8865\u7684\u6d4b\u8bd5\u3002\u4f60\u51bb\u7ed3\u9884\u8bad\u7ec3\u7684\u56fe\u50cf\u7f16\u7801\u5668\uff0c\u4e3a\u6807\u6ce8\u6570\u636e\u96c6\u63d0\u53d6\u7279\u5f81\uff0c\u7136\u540e\u5728\u5176\u4e0a\u8bad\u7ec3\u4e00\u4e2a\u7b80\u5355\u7684\u7ebf\u6027\u5206\u7c7b\u5668\u3002\u8fd9\u72ec\u7acb\u4e8e\u96f6\u6837\u672c\u68c0\u7d22\u673a\u5236\u6765\u5ea6\u91cf\u5b66\u4e60\u5230\u7684\u8868\u5f81\u7684\u8d28\u91cf\u3002CLIP \u7684\u7279\u5f81\u662f\u6781\u597d\u7684\u7ebf\u6027\u63a2\u6d4b\u7279\u5f81\uff0c\u901a\u5e38\u8fbe\u5230\u6216\u8d85\u8fc7\u76d1\u7763\u9884\u8bad\u7ec3\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/01.%20multimodal%20representations/#_11","title":"\u68c0\u7d22\u5ea6\u91cf","text":"<ul> <li> <p>\u5bf9\u4e8e\u68c0\u7d22\u4efb\u52a1\uff08\u56fe\u50cf\u5230\u6587\u672c\u548c\u6587\u672c\u5230\u56fe\u50cf\uff09\uff0c\u6807\u51c6\u5ea6\u91cf\u662f Recall@K\uff08R@K\uff09\uff1a\u6b63\u786e\u5339\u914d\u51fa\u73b0\u5728\u524d \\(K\\) \u4e2a\u68c0\u7d22\u7ed3\u679c\u4e2d\u7684\u67e5\u8be2\u6bd4\u4f8b\u3002\u5e38\u7528\u7684\u53d6\u503c\u4e3a R@1\u3001R@5 \u548c R@10\u3002</p> </li> <li> <p>\u5f62\u5f0f\u5316\u5730\uff0c\u5bf9\u4e8e\u4e00\u7ec4 \\(Q\\) \u4e2a\u67e5\u8be2\uff1a</p> </li> </ul> \\[\\\\text{R@}K = \\\\frac{1}{Q} \\\\sum_{q=1}^{Q} \\\\mathbf{1}[\\\\text{rank}(q) \\\\leq K]\\] <ul> <li> <p>\u5176\u4e2d \\(\\\\text{rank}(q)\\) \u662f\u67e5\u8be2 \\(q\\) \u7684\u6392\u5e8f\u68c0\u7d22\u5217\u8868\u4e2d\u6b63\u786e\u5339\u914d\u7684\u4f4d\u7f6e\u3002</p> </li> <li> <p>\u6807\u51c6\u7684\u68c0\u7d22\u57fa\u51c6\u5305\u62ec Flickr30K\uff0831,000 \u5f20\u56fe\u50cf\uff0c\u6bcf\u5f20 5 \u6761\u63cf\u8ff0\uff09\u548c MS-COCO\uff08123,000 \u5f20\u56fe\u50cf\uff0c\u6bcf\u5f20 5 \u6761\u63cf\u8ff0\uff09\u3002\u5728\u6d4b\u8bd5\u96c6\u4e0a\u8bc4\u4f30\uff1a\u7ed9\u5b9a\u4e00\u5f20\u56fe\u50cf\uff0c\u4ece\u5168\u90e8\u6d4b\u8bd5\u96c6\u4e2d\u68c0\u7d22\u6b63\u786e\u7684\u63cf\u8ff0\uff0c\u53cd\u4e4b\u4ea6\u7136\u3002</p> </li> <li> <p>\u4e2d\u4f4d\u6570\u6392\u540d\uff08Median Rank, MedR\uff09 \u662f\u4e00\u79cd\u8865\u5145\u5ea6\u91cf\uff1a\u6240\u6709\u67e5\u8be2\u4e2d\u6b63\u786e\u5339\u914d\u7684\u4e2d\u4f4d\u6570\u4f4d\u7f6e\u3002\u5b8c\u7f8e\u6a21\u578b\u7684 MedR = 1\u3002\u6570\u503c\u8d8a\u5c0f\u8d8a\u597d\u3002</p> </li> <li> <p>\u9664\u4e86\u68c0\u7d22\uff0c\u591a\u6a21\u6001\u6a21\u578b\u8fd8\u5728\u7ec4\u5408\u7406\u89e3\u57fa\u51c6\u4e0a\u8fdb\u884c\u8bc4\u4f30\uff0c\u5982 Winoground\uff08\u6d4b\u8bd5\u6a21\u578b\u80fd\u5426\u533a\u5206\"a mug in a dog\"\u548c\"a dog in a mug\"\uff09\u548c ARO\uff08\u5c5e\u6027\u3001\u5173\u7cfb\u3001\u987a\u5e8f\uff09\uff0c\u8fd9\u4e9b\u57fa\u51c6\u6d4b\u8bd5\u6a21\u578b\u662f\u5426\u771f\u6b63\u7406\u89e3\u8bed\u8a00\u7684\u7ed3\u6784\uff0c\u800c\u4e0d\u4ec5\u4ec5\u662f\u5339\u914d\u8bcd\u888b\u3002CLIP \u98ce\u683c\u7684\u6a21\u578b\u901a\u5e38\u5728\u8fd9\u4e9b\u4efb\u52a1\u4e0a\u8868\u73b0\u4e0d\u4f73\uff0c\u8fd9\u63ed\u793a\u4e86\u4e00\u4e2a\u57fa\u672c\u7684\u5c40\u9650\uff1a\u5bf9\u6bd4\u9884\u8bad\u7ec3\u5bf9\u9f50\u4e86\u5168\u5c40\u8bed\u4e49\uff0c\u4f46\u53ef\u80fd\u65e0\u6cd5\u6355\u6349\u7ec6\u7c92\u5ea6\u7684\u7ec4\u5408\u7ed3\u6784\u3002</p> </li> </ul> <p></p>"},{"location":"chapter%2010%3A%20multimodal%20learning/01.%20multimodal%20representations/#_12","title":"\u603b\u7ed3","text":"<ul> <li> <p>\u672c\u6587\u4ef6\u6db5\u76d6\u7684\u591a\u6a21\u6001\u8868\u5f81\u6784\u6210\u4e86\u672c\u7ae0\u540e\u7eed\u6240\u6709\u5185\u5bb9\u7684\u57fa\u7840\u3002CLIP \u53ca\u5176\u540e\u7ee7\u6a21\u578b\u8bad\u7ec3\u7684\u8054\u5408\u5d4c\u5165\u7a7a\u95f4\u662f\u8fde\u63a5\u89c6\u89c9\u548c\u8bed\u8a00\u7684\"\u80f6\u6c34\"\u3002\u6587\u4ef6 02 \u5728\u6b64\u57fa\u7840\u4e4b\u4e0a\uff0c\u6784\u5efa\u4e86\u8d85\u8d8a\u68c0\u7d22\u3001\u80fd\u591f\u751f\u6210\u5173\u4e8e\u56fe\u50cf\u6587\u672c\u7684\u89c6\u89c9-\u8bed\u8a00\u6a21\u578b\u3002\u6587\u4ef6 03 \u63a2\u8ba8\u4e86\u5982\u4f55\u5728\u5e8f\u5217\u6a21\u578b\u4e2d\u5bf9\u56fe\u50cf\u548c\u89c6\u9891\u8fdb\u884c\u5206\u8bcd\u3002\u6587\u4ef6 04 \u6db5\u76d6\u8de8\u6a21\u6001\u751f\u6210\uff08\u6587\u672c\u5230\u56fe\u50cf\u3001\u6587\u672c\u5230\u89c6\u9891\uff09\u3002\u6587\u4ef6 05 \u7814\u7a76\u4e86\u5728\u5355\u4e00\u6a21\u578b\u4e2d\u5904\u7406\u591a\u79cd\u6a21\u6001\u7684\u7edf\u4e00\u67b6\u6784\u3002</p> </li> <li> <p>\u6838\u5fc3\u8981\u70b9\uff1a\u5728\u914d\u5bf9\u6570\u636e\u4e0a\u8fdb\u884c\u5bf9\u6bd4\u5b66\u4e60\u4ea7\u751f\u4e86\u5d4c\u5165\u7a7a\u95f4\uff0c\u4f7f\u5f97\u4e0d\u540c\u6a21\u6001\u4e4b\u95f4\u53ef\u4ee5\u4e92\u6362\u3002\u56fe\u50cf\u5d4c\u5165\u548c\u6587\u672c\u5d4c\u5165\u53d8\u6210\u4e86\"\u540c\u4e00\u79cd\u4e1c\u897f\"\uff0c\u4ece\u800c\u5b9e\u73b0\u96f6\u6837\u672c\u5206\u7c7b\u3001\u68c0\u7d22\u4ee5\u53ca\u65e0\u7f1d\u96c6\u6210\u5230\u66f4\u5927\u7684\u7cfb\u7edf\u4e2d\u3002\u8fd9\u4e2a\u60f3\u6cd5\u2014\u2014\u5c06\u5339\u914d\u7684\u5bf9\u62c9\u8fd1\u3001\u4e0d\u5339\u914d\u7684\u5bf9\u63a8\u8fdc\u2014\u2014\u7684\u7b80\u5355\u6027\u63a9\u76d6\u4e86\u5176\u975e\u51e1\u7684\u6709\u6548\u6027\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/01.%20multimodal%20representations/#colab-notebook","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ol> <li> <p>\u4ece\u5934\u5b9e\u73b0 CLIP \u5bf9\u6bd4\u635f\u5931\u3002\u521b\u5efa\u968f\u673a\u56fe\u50cf\u548c\u6587\u672c\u5d4c\u5165\uff0c\u8ba1\u7b97\u76f8\u4f3c\u5ea6\u77e9\u9635\uff0c\u5e76\u8ba1\u7b97\u5bf9\u79f0\u4ea4\u53c9\u71b5\u635f\u5931\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef clip_loss(image_embeds, text_embeds, temperature=0.07):\n    \"\"\"\u8ba1\u7b97\u5bf9\u79f0 CLIP \u5bf9\u6bd4\u635f\u5931\u3002\"\"\"\n    # L2 \u5f52\u4e00\u5316\u5d4c\u5165\n    image_embeds = image_embeds / jnp.linalg.norm(image_embeds, axis=1, keepdims=True)\n    text_embeds = text_embeds / jnp.linalg.norm(text_embeds, axis=1, keepdims=True)\n\n    # \u8ba1\u7b97\u4f59\u5f26\u76f8\u4f3c\u5ea6\u77e9\u9635 (N x N)\n    logits = image_embeds @ text_embeds.T / temperature  # (N, N)\n\n    # \u6807\u7b7e\uff1a\u5bf9\u89d2\u7ebf\uff08\u7b2c i \u5f20\u56fe\u50cf\u5339\u914d\u7b2c i \u6bb5\u6587\u672c\uff09\n    N = logits.shape[0]\n    labels = jnp.arange(N)\n\n    # \u5bf9\u79f0\u4ea4\u53c9\u71b5\uff1a\u56fe\u50cf\u5230\u6587\u672c + \u6587\u672c\u5230\u56fe\u50cf\n    loss_i2t = -jnp.mean(jax.nn.log_softmax(logits, axis=1)[jnp.arange(N), labels])\n    loss_t2i = -jnp.mean(jax.nn.log_softmax(logits, axis=0)[labels, jnp.arange(N)])\n    return (loss_i2t + loss_t2i) / 2, logits * temperature\n\n# \u6a21\u62df\u4e00\u6279 8 \u4e2a\u56fe\u50cf-\u6587\u672c\u5bf9\uff0c64 \u7ef4\u7a7a\u95f4\nkey = jax.random.PRNGKey(42)\nk1, k2 = jax.random.split(key)\nN, D = 8, 64\nimage_embeds = jax.random.normal(k1, (N, D))\ntext_embeds = jax.random.normal(k2, (N, D))\n\nloss, sim_matrix = clip_loss(image_embeds, text_embeds)\nprint(f\"CLIP loss (random embeddings): {loss:.4f}\")\n\n# \u53ef\u89c6\u5316\u76f8\u4f3c\u5ea6\u77e9\u9635\nfig, ax = plt.subplots(figsize=(6, 5))\nim = ax.imshow(sim_matrix, cmap='coolwarm', vmin=-1, vmax=1)\nax.set_xlabel(\"Text index\"); ax.set_ylabel(\"Image index\")\nax.set_title(f\"Cosine Similarity Matrix (loss={loss:.3f})\")\nplt.colorbar(im); plt.tight_layout(); plt.show()\n# \u5c1d\u8bd5\u6539\u53d8\u6e29\u5ea6 (0.01, 0.1, 1.0) \u5e76\u89c2\u5bdf\u635f\u5931\u5982\u4f55\u53d8\u5316\n# \u5c1d\u8bd5\u4f7f\u5339\u914d\u5bf9\u76f8\u4f3c\uff1a\u5c06 text_embeds \u8bbe\u7f6e\u4e3a image_embeds + \u5c0f\u566a\u58f0\n</code></pre></p> </li> <li> <p>\u6784\u5efa\u4e00\u4e2a\u73a9\u5177\u8054\u5408\u5d4c\u5165\u6a21\u578b\uff0c\u5b66\u4e60\u4f7f\u7528 InfoNCE \u635f\u5931\u548c\u68af\u5ea6\u4e0b\u964d\u6765\u5bf9\u9f50 2D\"\u56fe\u50cf\"\uff08\u968f\u673a\u5411\u91cf\uff09\u4e0e\"\u63cf\u8ff0\"\uff08\u4e0d\u540c\u7684\u968f\u673a\u5411\u91cf\uff09\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef info_nce_loss(img_enc, txt_enc, img_data, txt_data, tau=0.1):\n    \"\"\"\u5728\u4e00\u6279\u914d\u5bf9\u7684 (\u56fe\u50cf, \u6587\u672c) \u6570\u636e\u4e0a\u8ba1\u7b97 InfoNCE\u3002\"\"\"\n    z_img = img_data @ img_enc  # (N, D)\n    z_txt = txt_data @ txt_enc  # (N, D)\n    # L2 \u5f52\u4e00\u5316\n    z_img = z_img / jnp.linalg.norm(z_img, axis=1, keepdims=True)\n    z_txt = z_txt / jnp.linalg.norm(z_txt, axis=1, keepdims=True)\n    logits = z_img @ z_txt.T / tau\n    labels = jnp.arange(logits.shape[0])\n    return -jnp.mean(jax.nn.log_softmax(logits, axis=1)[jnp.arange(len(labels)), labels])\n\n# \u521b\u5efa 32 \u4e2a\u914d\u5bf9\u6837\u672c\uff1a\u56fe\u50cf\u5728 R^8 \u4e2d\uff0c\u6587\u672c\u5728 R^6 \u4e2d\uff0c\u5d4c\u5165\u5230 R^4\nkey = jax.random.PRNGKey(0)\nk1, k2, k3, k4 = jax.random.split(key, 4)\nN, d_img, d_txt, d_embed = 32, 8, 6, 4\n\nimg_data = jax.random.normal(k1, (N, d_img))\ntxt_data = jax.random.normal(k2, (N, d_txt))\n\n# \u53ef\u5b66\u4e60\u7684\u6295\u5f71\u77e9\u9635\nimg_enc = jax.random.normal(k3, (d_img, d_embed)) * 0.1\ntxt_enc = jax.random.normal(k4, (d_txt, d_embed)) * 0.1\n\ngrad_fn = jax.jit(jax.grad(info_nce_loss, argnums=(0, 1)))\nlr = 0.05\nlosses = []\n\nfor step in range(300):\n    loss = info_nce_loss(img_enc, txt_enc, img_data, txt_data)\n    losses.append(float(loss))\n    g_img, g_txt = grad_fn(img_enc, txt_enc, img_data, txt_data)\n    img_enc = img_enc - lr * g_img\n    txt_enc = txt_enc - lr * g_txt\n\nprint(f\"Initial loss: {losses[0]:.3f}, Final loss: {losses[-1]:.3f}\")\nprint(f\"Random baseline (log N): {jnp.log(N):.3f}\")\n\nplt.figure(figsize=(8, 4))\nplt.plot(losses, color='#2c3e50')\nplt.axhline(y=0, color='green', linestyle='--', alpha=0.5, label='Perfect alignment')\nplt.axhline(y=float(jnp.log(N)), color='red', linestyle='--', alpha=0.5, label='Random (log N)')\nplt.xlabel(\"Step\"); plt.ylabel(\"InfoNCE Loss\")\nplt.title(\"Learning a Joint Embedding Space\")\nplt.legend(); plt.grid(alpha=0.3); plt.tight_layout(); plt.show()\n# \u4fee\u6539 d_embed\uff08\u5c1d\u8bd5 2, 4, 16\uff09\u89c2\u5bdf\u5d4c\u5165\u7ef4\u5ea6\u5982\u4f55\u5f71\u54cd\u5bf9\u9f50\n</code></pre></p> </li> <li> <p>\u4f7f\u7528\u9884\u8ba1\u7b97\u7684\u5d4c\u5165\u5b9e\u73b0\u96f6\u6837\u672c\u5206\u7c7b\u3002\u6a21\u62df\u7c7b\"\u539f\u578b\"\u4f5c\u4e3a\u6587\u672c\u5d4c\u5165\uff0c\u901a\u8fc7\u6700\u8fd1\u90bb\u67e5\u627e\u5bf9\u65b0\u56fe\u50cf\u8fdb\u884c\u5206\u7c7b\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u6a21\u62df 5 \u4e2a\u7c7b\uff0c\u6bcf\u4e2a\u7c7b\u6709\u4e00\u4e2a\u539f\u578b\u6587\u672c\u5d4c\u5165\u5728 R^32 \u4e2d\nkey = jax.random.PRNGKey(42)\nn_classes, d = 5, 32\nclass_names = [\"cat\", \"dog\", \"car\", \"plane\", \"ship\"]\n\n# \u7c7b\u539f\u578b\uff08\u60f3\u8c61\u8fd9\u4e9b\u6765\u81ea\u6587\u672c\u7f16\u7801\u5668\uff09\nk1, k2 = jax.random.split(key)\nclass_prototypes = jax.random.normal(k1, (n_classes, d))\nclass_prototypes = class_prototypes / jnp.linalg.norm(class_prototypes, axis=1, keepdims=True)\n\n# \u751f\u6210 200 \u4e2a\u6d4b\u8bd5\"\u56fe\u50cf\"\uff08\u5728\u5176\u7c7b\u539f\u578b\u9644\u8fd1\u52a0\u4e0a\u566a\u58f0\u7684\u5d4c\u5165\uff09\nn_per_class = 40\ntrue_labels = jnp.repeat(jnp.arange(n_classes), n_per_class)\nkeys = jax.random.split(k2, n_classes * n_per_class)\n\nimage_embeds = []\nfor i in range(n_classes):\n    noise = jax.random.normal(keys[i], (n_per_class, d)) * 0.5\n    cluster = class_prototypes[i] + noise\n    image_embeds.append(cluster)\nimage_embeds = jnp.concatenate(image_embeds, axis=0)\nimage_embeds = image_embeds / jnp.linalg.norm(image_embeds, axis=1, keepdims=True)\n\n# \u96f6\u6837\u672c\u5206\u7c7b\uff1a\u4e0e\u6bcf\u4e2a\u539f\u578b\u7684\u4f59\u5f26\u76f8\u4f3c\u5ea6\nsimilarities = image_embeds @ class_prototypes.T  # (200, 5)\npredicted_labels = jnp.argmax(similarities, axis=1)\naccuracy = jnp.mean(predicted_labels == true_labels)\nprint(f\"Zero-shot accuracy: {accuracy:.1%}\")\n\n# \u6df7\u6dc6\u77e9\u9635\nconf = jnp.zeros((n_classes, n_classes), dtype=jnp.int32)\nfor true, pred in zip(true_labels, predicted_labels):\n    conf = conf.at[true, pred].add(1)\n\nfig, ax = plt.subplots(figsize=(6, 5))\nim = ax.imshow(conf, cmap='Blues')\nax.set_xticks(range(n_classes)); ax.set_xticklabels(class_names, rotation=45)\nax.set_yticks(range(n_classes)); ax.set_yticklabels(class_names)\nax.set_xlabel(\"Predicted\"); ax.set_ylabel(\"True\")\nfor i in range(n_classes):\n    for j in range(n_classes):\n        ax.text(j, i, int(conf[i, j]), ha='center', va='center', fontsize=11)\nax.set_title(f\"Zero-Shot Confusion Matrix (acc={accuracy:.1%})\")\nplt.colorbar(im); plt.tight_layout(); plt.show()\n# \u5c1d\u8bd5\u589e\u52a0\u566a\u58f0\uff080.5 -&gt; 1.0 -&gt; 2.0\uff09\u89c2\u5bdf\u51c6\u786e\u7387\u4e0b\u964d\n# \u5c1d\u8bd5\u63d0\u793a\u96c6\u6210\uff1a\u5e73\u5747\u6bcf\u4e2a\u539f\u578b\u7684 3 \u4e2a\u566a\u58f0\u526f\u672c\n</code></pre></p> </li> </ol>"},{"location":"chapter%2010%3A%20multimodal%20learning/02.%20vision%20language%20models/","title":"\u89c6\u89c9\u8bed\u8a00\u6a21\u578b","text":"<p>\u89c6\u89c9\u8bed\u8a00\u6a21\u578b\u5171\u540c\u7406\u89e3\u56fe\u50cf\u548c\u6587\u672c\uff0c\u5b9e\u73b0\u89c6\u89c9\u95ee\u7b54\u3001\u56fe\u50cf\u63cf\u8ff0\u548c\u89c6\u89c9\u63a8\u7406\u3002\u672c\u6587\u4ef6\u6db5\u76d6 VQA\u3001\u56fe\u50cf\u63cf\u8ff0\u3001\u89c6\u89c9\u5b9a\u4f4d\uff0c\u4ee5\u53ca VisualBERT\u3001BLIP\u3001LLaVA\u3001Flamingo\u3001PaLI \u548c Qwen-VL \u7b49\u5c06\u89c6\u89c9\u7f16\u7801\u5668\u4e0e\u5927\u578b\u8bed\u8a00\u6a21\u578b\u878d\u5408\u7684\u67b6\u6784\u3002</p> <ul> <li> <p>\u60f3\u8c61\u4e00\u4f4d\u535a\u7269\u9986\u5bfc\u89c8\u5458\uff0c\u4ed6\u80fd\u770b\u7740\u4e00\u5e45\u753b\u5e76\u6e05\u6670\u63cf\u8ff0\u753b\u4e2d\u7684\u4e00\u5207\uff1a\u6709\u54ea\u4e9b\u7269\u4f53\u3001\u8bb2\u8ff0\u4e86\u4ec0\u4e48\u6545\u4e8b\u3001\u4f20\u8fbe\u4e86\u600e\u6837\u7684\u60c5\u611f\uff0c\u8fd8\u80fd\u56de\u7b54\u53c2\u89c2\u8005\u7684\u4efb\u4f55\u95ee\u9898\u3002\u89c6\u89c9\u8bed\u8a00\u6a21\u578b\uff08VLM\uff09 \u5c31\u662f\u8ba1\u7b97\u9886\u57df\u7684\u7b49\u4ef7\u7269\u2014\u2014\u4e00\u4e2a\u80fd\u540c\u65f6\u7406\u89e3\u56fe\u50cf\u548c\u6587\u672c\u7684\u7cfb\u7edf\uff0c\u80fd\u591f\u63cf\u8ff0\u89c6\u89c9\u573a\u666f\u3001\u56de\u7b54\u76f8\u5173\u95ee\u9898\u3001\u6267\u884c\u89c6\u89c9\u6307\u4ee4\uff0c\u751a\u81f3\u6839\u636e\u81ea\u7136\u8bed\u8a00\u67e5\u8be2\u5728\u56fe\u50cf\u4e2d\u5b9a\u4f4d\u7279\u5b9a\u7269\u4f53\u3002</p> </li> <li> <p>VLM \u4f4d\u4e8e\u4f60\u5728\u7b2c 8 \u7ae0\u5b66\u5230\u7684\u89c6\u89c9\u7f16\u7801\u5668\u548c\u7b2c 7 \u7ae0\u7684\u8bed\u8a00\u6a21\u578b\u7684\u4ea4\u6c47\u70b9\u3002\u6838\u5fc3\u5de5\u7a0b\u6311\u6218\u5728\u4e8e\u6865\u63a5\u4e24\u4e2a\u622a\u7136\u4e0d\u540c\u7684\u8868\u5f81\u4e16\u754c\uff1a\u89c6\u89c9\u9aa8\u5e72\u7f51\u7edc\u4ea7\u751f\u7684\u7a7a\u95f4\u5316\u3001\u8fde\u7eed\u7684 feature map\uff0c\u4e0e\u8bed\u8a00\u6a21\u578b\u4ea7\u751f\u7684\u5e8f\u5217\u5316\u3001\u79bb\u6563\u7684 token \u5d4c\u5165\u3002\u672c\u6587\u4ef6\u4e2d\u7684\u6bcf\u4e00\u79cd\u67b6\u6784\uff0c\u672c\u8d28\u4e0a\u90fd\u662f\u5bf9\u540c\u4e00\u4e2a\u95ee\u9898\u7684\u4e0d\u540c\u56de\u7b54\uff1a\u5982\u4f55\u878d\u5408\u89c6\u89c9\u548c\u8bed\u8a00\uff1f</p> </li> </ul> <p></p>"},{"location":"chapter%2010%3A%20multimodal%20learning/02.%20vision%20language%20models/#_2","title":"\u89c6\u89c9\u95ee\u7b54","text":"<ul> <li> <p>\u60f3\u8c61\u6709\u4eba\u5411\u4f60\u5c55\u793a\u4e00\u5f20\u7167\u7247\u5e76\u95ee\uff1a\"\u516c\u56ed\u91cc\u6709\u51e0\u53ea\u72d7\uff1f\"\u4f60\u6beb\u4e0d\u8d39\u529b\u5730\u89e3\u6790\u56fe\u50cf\u3001\u5b9a\u4f4d\u72d7\u3001\u6570\u51fa\u6570\u91cf\u5e76\u7ed9\u51fa\u7b54\u6848\u3002\u89c6\u89c9\u95ee\u7b54\uff08VQA\uff09 \u5c06\u8fd9\u4e00\u8fc7\u7a0b\u5f62\u5f0f\u5316\uff1a\u7ed9\u5b9a\u4e00\u5f20\u56fe\u50cf \\(I\\) \u548c\u4e00\u4e2a\u81ea\u7136\u8bed\u8a00\u95ee\u9898 \\(q\\)\uff0c\u9884\u6d4b\u7b54\u6848 \\(a\\)\u3002</p> </li> <li> <p>\u8be5\u4efb\u52a1\u53ef\u4ee5\u6709\u591a\u79cd\u5b9a\u4e49\u65b9\u5f0f\u3002\u6700\u5e38\u89c1\u7684\u65b9\u5f0f\u5c06 VQA \u89c6\u4e3a\u5f00\u653e\u5f0f\u5206\u7c7b\uff1a\u6a21\u578b\u4ece\u6700\u5e38\u89c1\u7684\u7b54\u6848\u6784\u6210\u7684\u56fa\u5b9a\u8bcd\u6c47\u8868\u4e2d\u9009\u62e9\uff08\u4f8b\u5982 VQA v2 \u4e2d\u6392\u540d\u524d 3,129 \u7684\u7b54\u6848\uff09\u3002\u53e6\u4e00\u79cd\u65b9\u5f0f\u662f\u751f\u6210\u5f0f\u56de\u7b54\uff0c\u6a21\u578b\u751f\u6210\u81ea\u7531\u5f62\u5f0f\u7684\u6587\u672c\u5b57\u7b26\u4e32\u2014\u2014\u8fd9\u662f\u73b0\u4ee3 VLM \u91c7\u7528\u7684\u65b9\u6cd5\u3002</p> </li> <li> <p>\u5f62\u5f0f\u4e0a\uff0c\u4f60\u9700\u8981\u5b66\u4e60\u4e00\u4e2a\u6700\u5927\u5316\u6b63\u786e\u7b54\u6848\u4f3c\u7136\u7684\u51fd\u6570 \\(f(I, q) \\to a\\)\u3002\u5728\u5206\u7c7b\u8bbe\u7f6e\u4e2d\uff0c\u8fd9\u53d8\u4e3a\uff1a</p> </li> </ul> \\[p(a \\mid I, q) = \\text{softmax}(W \\cdot g(v, h))\\] <ul> <li> <p>\u5176\u4e2d \\(v\\) \u662f\u89c6\u89c9\u7279\u5f81\u5411\u91cf\uff08\u6765\u81ea CNN \u6216 ViT\uff09\uff0c\\(h\\) \u662f\u95ee\u9898\u7f16\u7801\uff08\u6765\u81ea LSTM \u6216 Transformer\uff09\uff0c\\(g\\) \u662f\u878d\u5408\u51fd\u6570\u3002\\(g\\) \u7684\u8bbe\u8ba1\u6b63\u662f\u771f\u6b63\u7684\u67b6\u6784\u521b\u9020\u529b\u6240\u5728\u3002</p> </li> <li> <p>VQA v1\uff08Antol \u7b49\u4eba\uff0c2015\uff09\u5f15\u5165\u4e86\u8be5\u57fa\u51c6\uff0c\u5305\u542b\u6765\u81ea MS COCO \u7684 204,000 \u5f20\u56fe\u50cf\u4e0a\u7684 614,000 \u4e2a\u95ee\u9898\u3002\u7814\u7a76\u4eba\u5458\u5f88\u5feb\u53d1\u73b0\uff0c\u6a21\u578b\u53ef\u4ee5\u901a\u8fc7\u5229\u7528\u8bed\u8a00\u5148\u9a8c\u8fbe\u5230\u60ca\u4eba\u9ad8\u7684\u51c6\u786e\u7387\u2014\u2014\u5bf9\"\u591a\u5c11\u4e2a\"\u95ee\u9898\u56de\u7b54\"2\"\uff0c\u5bf9\"\u6709\u6ca1\u6709\"\u95ee\u9898\u56de\u7b54\"\u662f\"\uff0c\u751a\u81f3\u4e0d\u9700\u8981\u770b\u56fe\u50cf\u3002</p> </li> <li> <p>VQA v2\uff08Goyal \u7b49\u4eba\uff0c2017\uff09\u901a\u8fc7\u4e3a\u6bcf\u4e2a\u95ee\u9898\u914d\u5bf9\u4e0d\u540c\u7b54\u6848\u7684\u4e24\u5f20\u76f8\u4f3c\u56fe\u50cf\u6765\u89e3\u51b3\u8fd9\u4e2a\u95ee\u9898\u3002\u8fd9\u8feb\u4f7f\u6a21\u578b\u771f\u6b63\u5c06\u5176\u63a8\u7406\u5efa\u7acb\u5728\u89c6\u89c9\u5185\u5bb9\u4e4b\u4e0a\u3002\u5e73\u8861\u914d\u5bf9\u8bbe\u7f6e\u4f7f\u6570\u636e\u96c6\u89c4\u6a21\u5927\u7ea6\u7ffb\u500d\uff0c\u5e76\u4f7f\u7eaf\u8bed\u8a00\u6377\u5f84\u7684\u6548\u679c\u5927\u6253\u6298\u6263\u3002</p> </li> <li> <p>\u5176\u4ed6\u91cd\u8981\u7684 VQA \u6570\u636e\u96c6\u5305\u62ec GQA\uff08Hudson &amp; Manning\uff0c2019\uff09\uff0c\u5305\u542b\u9700\u8981\u591a\u6b65\u63a8\u7406\u7684\u7ec4\u5408\u6027\u95ee\u9898\uff1bOK-VQA\uff08Marino \u7b49\u4eba\uff0c2019\uff09\uff0c\u9700\u8981\u8d85\u51fa\u56fe\u50cf\u8303\u56f4\u7684\u5916\u90e8\u77e5\u8bc6\uff1b\u4ee5\u53ca TextVQA\uff08Singh \u7b49\u4eba\uff0c2019\uff09\uff0c\u7b54\u6848\u4f9d\u8d56\u4e8e\u8bfb\u53d6\u56fe\u50cf\u4e2d\u7684\u6587\u5b57\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u65e9\u671f\u7684 VQA \u6a21\u578b\u4f7f\u7528\u7b80\u5355\u7b56\u7565\uff1a\u4ece\u9884\u8bad\u7ec3 CNN \u4e2d\u63d0\u53d6\u56fe\u50cf\u7279\u5f81\uff08\u901a\u5e38\u662f\u7b2c 8 \u7ae0\u4e2d ResNet \u6216 VGGNet \u7684\u5012\u6570\u7b2c\u4e8c\u5c42\uff09\uff0c\u7528 LSTM\uff08\u7b2c 6 \u7ae0\uff09\u5bf9\u95ee\u9898\u8fdb\u884c\u7f16\u7801\uff0c\u7136\u540e\u5c06\u5b83\u4eec\u7ec4\u5408\u3002\u7ec4\u5408\u51fd\u6570 \\(g\\) \u6f14\u53d8\u8fc5\u901f\uff1a\u4ece\u7b80\u5355\u7684\u9010\u5143\u7d20\u4e58\u6cd5\uff0c\u5230\u53cc\u7ebf\u6027\u6c60\u5316\uff0c\u518d\u5230\u591a\u6a21\u6001 Tucker \u5206\u89e3\u3002\u53cc\u7ebf\u6027\u6ce8\u610f\u529b\u8ba1\u7b97 \\(v^T W h\\)\uff0c\u5176\u4e2d \\(W\\) \u662f\u53ef\u5b66\u4e60\u7684\u4ea4\u4e92\u77e9\u9635\uff0c\u4f46\u5b8c\u6574\u7684\u53cc\u7ebf\u6027\u5f62\u5f0f\u6709 \\(O(d_v \\times d_h)\\) \u4e2a\u53c2\u6570\uff0c\u89c4\u6a21\u8fc7\u5927\u3002MLB\uff08\u591a\u6a21\u6001\u4f4e\u79e9\u53cc\u7ebf\u6027\u6c60\u5316\uff09\u5c06\u5176\u5206\u89e3\u4e3a\u4e24\u4e2a\u4f4e\u79e9\u6295\u5f71\uff0c\u4f7f\u5176\u53d8\u5f97\u53ef\u884c\u3002</p> </li> <li> <p>VQA \u7684\u7a81\u7834\u662f\u6ce8\u610f\u529b\u673a\u5236\u3002\u5806\u53e0\u6ce8\u610f\u529b\u7f51\u7edc\uff08Yang \u7b49\u4eba\uff0c2016\uff09\u4f7f\u7528\u95ee\u9898\u7f16\u7801\u5728\u7a7a\u95f4\u56fe\u50cf\u533a\u57df\u4e0a\u65bd\u52a0\u6ce8\u610f\u529b\uff0c\u8fed\u4ee3\u5f0f\u5730\u7cbe\u70bc\u9700\u8981\u5173\u6ce8\u7684\u56fe\u50cf\u90e8\u5206\u3002\u8fd9\u4e2a\u601d\u60f3\u2014\u2014\u8ba9\u95ee\u9898\"\u5173\u6ce8\"\u76f8\u5173\u56fe\u50cf\u533a\u57df\u2014\u2014\u6210\u4e3a\u4e86\u6807\u51c6\u505a\u6cd5\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/02.%20vision%20language%20models/#_3","title":"\u56fe\u50cf\u63cf\u8ff0","text":"<ul> <li> <p>\u60f3\u8c61\u4e00\u4f4d\u670b\u53cb\u770b\u7740\u4f60\u7684\u5ea6\u5047\u7167\u7247\u5e76\u53d9\u8ff0\u4ed6\u4eec\u6240\u770b\u5230\u7684\uff1a\"\u4e00\u53ea\u91d1\u6bdb\u730e\u72ac\u5728\u9633\u5149\u660e\u5a9a\u7684\u6c99\u6ee9\u4e0a\u63a5\u98de\u76d8\u3002\"\u56fe\u50cf\u63cf\u8ff0\u662f\u751f\u6210\u56fe\u50cf\u7684\u81ea\u7136\u8bed\u8a00\u63cf\u8ff0\u7684\u4efb\u52a1\u3002\u4e0e VQA \u4e0d\u540c\uff0c\u8fd9\u91cc\u6ca1\u6709\u63d0\u95ee\u2014\u2014\u6a21\u578b\u5fc5\u987b\u81ea\u884c\u51b3\u5b9a\u54ea\u4e9b\u5185\u5bb9\u503c\u5f97\u63cf\u8ff0\u3002</p> </li> <li> <p>Show and Tell\uff08Vinyals \u7b49\u4eba\uff0c2015\uff09\u5efa\u7acb\u4e86\u63cf\u8ff0\u4efb\u52a1\u7684\u6807\u51c6\u7f16\u7801\u5668-\u89e3\u7801\u5668\u67b6\u6784\u3002CNN \u7f16\u7801\u5668\uff08\u5982 Inception \u6216 ResNet\uff09\u751f\u6210\u4e00\u4e2a\u5355\u4e00\u56fe\u50cf\u7279\u5f81\u5411\u91cf \\(v\\)\u3002\u8be5\u5411\u91cf\u88ab\u7528\u4f5c LSTM \u89e3\u7801\u5668\u7684\u521d\u59cb\u9690\u85cf\u72b6\u6001\uff0c\u7136\u540e\u9010\u8bcd\u81ea\u56de\u5f52\u5730\u751f\u6210\u63cf\u8ff0\uff1a</p> </li> </ul> \\[p(w_t \\mid w_{1:t-1}, I) = \\text{LSTM}(w_{t-1}, h_{t-1})\\] <ul> <li> <p>\u6574\u4e2a\u6a21\u578b\u901a\u8fc7\u6700\u5927\u5316\u771f\u5b9e\u63cf\u8ff0\u7684\u5bf9\u6570\u4f3c\u7136\u8fdb\u884c\u7aef\u5230\u7aef\u8bad\u7ec3\u3002\u63a8\u7406\u65f6\u4f7f\u7528\u675f\u641c\u7d22\uff08\u7b2c 7 \u7ae0\uff09\u6765\u627e\u5230\u9ad8\u6982\u7387\u7684\u63cf\u8ff0\u3002</p> </li> <li> <p>Show and Tell \u7684\u95ee\u9898\u5728\u4e8e\u6574\u5f20\u56fe\u50cf\u88ab\u538b\u7f29\u6210\u4e00\u4e2a\u5355\u4e00\u5411\u91cf\u3002\u5bf9\u4e8e\u590d\u6742\u573a\u666f\uff0c\u5355\u4e00\u5411\u91cf\u65e0\u6cd5\u6355\u6349\u6240\u6709\u76f8\u5173\u7ec6\u8282\u3002\u4f60\u4f1a\u4e22\u5931\u7a7a\u95f4\u4fe1\u606f\u2014\u2014\u6a21\u578b\u5728\u751f\u6210\u4e0d\u540c\u8bcd\u8bed\u65f6\u65e0\u6cd5\"\u56de\u770b\"\u56fe\u50cf\u7684\u7279\u5b9a\u533a\u57df\u3002</p> </li> <li> <p>Show, Attend and Tell\uff08Xu \u7b49\u4eba\uff0c2015\uff09\u901a\u8fc7\u5f15\u5165\u56fe\u50cf\u533a\u57df\u4e0a\u7684\u6ce8\u610f\u529b\u89e3\u51b3\u4e86\u8fd9\u4e2a\u95ee\u9898\u3002\u6a21\u578b\u4e0d\u662f\u5c06\u56fe\u50cf\u7f16\u7801\u4e3a\u4e00\u4e2a\u5411\u91cf\uff0c\u800c\u662f\u7531 CNN \u4ea7\u751f\u4e00\u4e2a\u7a7a\u95f4\u7279\u5f81\u7f51\u683c\uff08\u4f8b\u5982\u6765\u81ea VGGNet \u6700\u540e\u4e00\u4e2a\u5377\u79ef\u5c42\u7684 \\(14 \\times 14 \\times 512\\)\uff09\u3002\u5728\u6bcf\u4e2a\u89e3\u7801\u6b65\u9aa4\uff0c\u6a21\u578b\u8ba1\u7b97\u8fd9\u4e9b\u7a7a\u95f4\u4f4d\u7f6e\u4e0a\u7684\u6ce8\u610f\u529b\u6743\u91cd\uff0c\u751f\u6210\u4e00\u4e2a\u7a81\u51fa\u5f53\u524d\u8bcd\u8bed\u6700\u76f8\u5173\u533a\u57df\u7684\u4e0a\u4e0b\u6587\u5411\u91cf\u3002</p> </li> <li> <p>\u56de\u987e\u7b2c 6 \u7ae0\u7684\u6ce8\u610f\u529b\u673a\u5236\uff1a\u89e3\u7801\u5668\u9690\u85cf\u72b6\u6001\u5145\u5f53\u67e5\u8be2\uff0c\u7a7a\u95f4\u7279\u5f81\u5145\u5f53\u952e\u548c\u503c\uff0c\u6ce8\u610f\u529b\u6743\u91cd\u544a\u8bc9\u6a21\u578b\u5e94\u8be5\u770b\u54ea\u91cc\u3002\u4f5c\u8005\u63d0\u51fa\u4e86\u4e24\u79cd\u53d8\u4f53\uff1a\u8f6f\u6ce8\u610f\u529b\uff08\u53ef\u5fae\u5206\uff0c\u6240\u6709\u533a\u57df\u7684\u52a0\u6743\u5e73\u5747\uff09\u548c\u786c\u6ce8\u610f\u529b\uff08\u5bf9\u5355\u4e2a\u533a\u57df\u8fdb\u884c\u968f\u673a\u91c7\u6837\uff0c\u4f7f\u7528 REINFORCE \u8bad\u7ec3\uff09\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u8fd9\u4e9b\u6a21\u578b\u4ea7\u751f\u7684\u6ce8\u610f\u529b\u56fe\u5177\u6709\u663e\u8457\u7684\u53ef\u89e3\u91ca\u6027\uff1a\u751f\u6210\"\u72d7\"\u65f6\uff0c\u6ce8\u610f\u529b\u96c6\u4e2d\u5728\u72d7\u7684\u533a\u57df\uff1b\u751f\u6210\"\u6d77\u6ee9\"\u65f6\uff0c\u6ce8\u610f\u529b\u8f6c\u79fb\u5230\u6c99\u5b50\u548c\u6c34\u9762\u3002\u8fd9\u662f\u6ce8\u610f\u529b\u673a\u5236\u63d0\u4f9b\u5185\u7f6e\u53ef\u89e3\u91ca\u6027\u7684\u6700\u65e9\u4ee4\u4eba\u4fe1\u670d\u7684\u6f14\u793a\u4e4b\u4e00\u3002</p> </li> <li> <p>CIDEr\uff08Vedantam \u7b49\u4eba\uff0c2015\uff09\u3001METEOR\u3001BLEU \u548c SPICE \u662f\u6807\u51c6\u63cf\u8ff0\u8bc4\u4f30\u6307\u6807\u3002CIDEr \u8ba1\u7b97\u751f\u6210\u63cf\u8ff0\u4e0e\u53c2\u8003\u63cf\u8ff0\u4e4b\u95f4\u7684 TF-IDF \u52a0\u6743 n-gram \u76f8\u4f3c\u5ea6\uff0c\u4e13\u95e8\u4e3a\u63cf\u8ff0\u8bc4\u4f30\u8bbe\u8ba1\u3002\u73b0\u4ee3 VLM \u901a\u5e38\u5728 MS COCO Captions \u548c NoCaps \u7b49\u63cf\u8ff0\u57fa\u51c6\u4e0a\u7528 CIDEr \u8fdb\u884c\u8bc4\u4f30\u3002</p> </li> <li> <p>\u540e\u6765\u7684\u63cf\u8ff0\u6a21\u578b\u5f15\u5165\u4e86\u81ea\u5e95\u5411\u4e0a\u6ce8\u610f\u529b\uff08Anderson \u7b49\u4eba\uff0c2018\uff09\uff0c\u5176\u4e2d\u76ee\u6807\u68c0\u6d4b\u5668\uff08Faster R-CNN\uff0c\u7b2c 8 \u7ae0\uff09\u9996\u5148\u63d0\u51fa\u663e\u8457\u7684\u56fe\u50cf\u533a\u57df\uff0c\u7136\u540e\u63cf\u8ff0\u6a21\u578b\u5728\u8fd9\u4e9b\u533a\u57df\u7279\u5f81\u800c\u975e\u5747\u5300\u7f51\u683c\u4e0a\u65bd\u52a0\u6ce8\u610f\u529b\u3002\u5728\u57fa\u4e8e ViT \u7684\u7f16\u7801\u5668\u63a5\u7ba1\u4e4b\u524d\uff0c\u8fd9\u662f\u4e3b\u5bfc\u65b9\u6cd5\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/02.%20vision%20language%20models/#_4","title":"\u67b6\u6784\u6a21\u5f0f","text":"<ul> <li>\u6bcf\u4e2a VLM \u90fd\u5fc5\u987b\u56de\u7b54\u4e00\u4e2a\u57fa\u672c\u8bbe\u8ba1\u95ee\u9898\uff1a\u89c6\u89c9\u548c\u8bed\u8a00\u5728\u54ea\u4e2a\u8282\u70b9\u4ea4\u4e92\uff1f\u7b54\u6848\u51b3\u5b9a\u4e86\u6a21\u578b\u7684\u67b6\u6784\u5bb6\u65cf\u3002\u6709\u4e09\u79cd\u4e3b\u8981\u6a21\u5f0f\uff0c\u5404\u81ea\u5177\u6709\u4e0d\u540c\u7684\u6743\u8861\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/02.%20vision%20language%20models/#_5","title":"\u53cc\u7f16\u7801\u5668","text":"<ul> <li> <p>\u60f3\u8c61\u4e24\u4f4d\u72ec\u7acb\u5de5\u4f5c\u7684\u8bd1\u8005\u2014\u2014\u4e00\u4f4d\u8bfb\u6cd5\u8bed\u6587\u4ef6\uff0c\u53e6\u4e00\u4f4d\u8bfb\u82f1\u8bed\u6587\u4ef6\u2014\u2014\u4ed6\u4eec\u5404\u81ea\u7528\u4e00\u79cd\u5171\u4eab\u7684\"\u901a\u7528\u8bed\u8a00\"\u751f\u6210\u6458\u8981\u3002\u4ed6\u4eec\u5728\u7ffb\u8bd1\u8fc7\u7a0b\u4e2d\u4ece\u4e0d\u4ea4\u6d41\uff0c\u4f46\u4ed6\u4eec\u7684\u6458\u8981\u53ef\u4ee5\u76f4\u63a5\u6bd4\u8f83\u3002\u8fd9\u5c31\u662f\u53cc\u7f16\u7801\u5668\u6a21\u5f0f\u3002</p> </li> <li> <p>\u89c6\u89c9\u7f16\u7801\u5668 \\(f_v\\) \u548c\u6587\u672c\u7f16\u7801\u5668 \\(f_t\\) \u72ec\u7acb\u5730\u5c06\u5404\u81ea\u7684\u8f93\u5165\u6620\u5c04\u5230\u4e00\u4e2a\u7ef4\u5ea6\u4e3a \\(d\\) \u7684\u5171\u4eab\u5d4c\u5165\u7a7a\u95f4\u3002\u56fe\u50cf\u5d4c\u5165\u4e3a \\(v = f_v(I) \\in \\mathbb{R}^d\\)\uff0c\u6587\u672c\u5d4c\u5165\u4e3a \\(t = f_t(q) \\in \\mathbb{R}^d\\)\u3002\u76f8\u4f3c\u5ea6\u901a\u8fc7\u70b9\u79ef\u6216\u4f59\u5f26\u76f8\u4f3c\u5ea6\u8ba1\u7b97\uff1a\\(\\text{sim}(I, q) = v^T t / (\\|v\\| \\|t\\|)\\)\u3002</p> </li> <li> <p>CLIP\uff08Radford \u7b49\u4eba\uff0c2021\uff09\uff0c\u5728\u524d\u4e00\u7bc7\u5173\u4e8e\u591a\u6a21\u6001\u8868\u793a\u7684\u6587\u4ef6\u4e2d\u5df2\u4ecb\u7ecd\uff0c\u662f\u5178\u578b\u7684\u53cc\u7f16\u7801\u5668\u3002\u5b83\u5728\u4ece\u4e92\u8054\u7f51\u6293\u53d6\u7684 4 \u4ebf\u56fe\u50cf-\u6587\u672c\u5bf9\u4e0a\u4f7f\u7528\u5bf9\u6bd4\u76ee\u6807\u51fd\u6570\uff08InfoNCE\uff09\u8fdb\u884c\u8bad\u7ec3\u3002\u7531\u4e8e\u7f16\u7801\u5668\u76f8\u4e92\u72ec\u7acb\uff0c\u4f60\u53ef\u4ee5\u9884\u8ba1\u7b97\u5e76\u7f13\u5b58\u6240\u6709\u56fe\u50cf\u5d4c\u5165\uff0c\u4f7f\u68c0\u7d22\u6781\u5176\u9ad8\u6548\u2014\u2014\u641c\u7d22\u65f6\u53ea\u9700\u5bf9\u67e5\u8be2\u6587\u672c\u8fdb\u884c\u7f16\u7801\u3002</p> </li> <li> <p>\u53cc\u7f16\u7801\u5668\u7684\u7f3a\u70b9\u5728\u4e8e\u89c6\u89c9\u548c\u8bed\u8a00\u4ece\u672a\u5728\u7279\u5f81\u5c42\u9762\u8fdb\u884c\u4ea4\u4e92\u3002\u6a21\u578b\u65e0\u6cd5\u8fdb\u884c\u7ec6\u7c92\u5ea6\u7684\u8de8\u6a21\u6001\u63a8\u7406\uff1a\u4f8b\u5982\uff0c\u5b83\u65e0\u6cd5\u786e\u5b9a\u63cf\u8ff0\u4e2d\u7684\u7279\u5b9a\u8bcd\u662f\u5426\u5bf9\u5e94\u56fe\u50cf\u4e2d\u7684\u7279\u5b9a\u533a\u57df\u3002\u8fd9\u9650\u5236\u4e86\u5b83\u5728 VQA \u6216 grounded \u63cf\u8ff0\u7b49\u4efb\u52a1\u4e2d\u7684\u5b9e\u7528\u6027\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/02.%20vision%20language%20models/#_6","title":"\u878d\u5408\u7f16\u7801\u5668","text":"<ul> <li> <p>\u73b0\u5728\u60f3\u8c61\u4e24\u4f4d\u8bd1\u8005\u5171\u5904\u4e00\u5ba4\uff0c\u79ef\u6781\u8ba8\u8bba\u4e24\u7bc7\u6587\u4ef6\u3002\u4ed6\u4eec\u53ef\u4ee5\u6307\u5411\u7279\u5b9a\u6bb5\u843d\u3001\u4e92\u76f8\u63d0\u95ee\uff0c\u5e76\u5efa\u7acb\u5171\u540c\u7684\u7406\u89e3\u3002\u8fd9\u5c31\u662f\u878d\u5408\u7f16\u7801\u5668\u6a21\u5f0f\u3002</p> </li> <li> <p>\u4e24\u79cd\u6a21\u6001\u90fd\u88ab\u7f16\u7801\uff0c\u7136\u540e\u901a\u8fc7\u4ea4\u53c9\u6ce8\u610f\u529b\u5c42\u8fdb\u884c\u878d\u5408\uff0c\u5176\u4e2d\u4e00\u79cd\u6a21\u6001\u7684 token \u5173\u6ce8\u53e6\u4e00\u79cd\u6a21\u6001\u7684 token\u3002\u56fe\u50cf\u9996\u5148\u7531\u89c6\u89c9\u7f16\u7801\u5668\u5904\u7406\u4e3a\u4e00\u7cfb\u5217 patch \u6216\u533a\u57df token \\(V = [v_1, \\ldots, v_N]\\)\u3002\u6587\u672c\u88ab\u5206\u8bcd\u5316\u4e3a \\(T = [t_1, \\ldots, t_M]\\)\u3002\u5728\u878d\u5408\u5c42\u4e2d\uff0c\u6587\u672c token \u901a\u8fc7\u4ea4\u53c9\u6ce8\u610f\u529b\u5173\u6ce8\u56fe\u50cf token\uff1a</p> </li> </ul> \\[\\text{CrossAttn}(T, V) = \\text{softmax}\\!\\left(\\frac{(TW_Q)(VW_K)^T}{\\sqrt{d_k}}\\right)(VW_V)\\] <ul> <li>\u8fd9\u5b9e\u73b0\u4e86\u7ec6\u7c92\u5ea6\u7684\u4ea4\u4e92\uff1a\u6bcf\u4e2a\u6587\u672c token \u90fd\u53ef\u4ee5\u5173\u6ce8\u5176\u6240\u9700\u7684\u7279\u5b9a\u56fe\u50cf\u533a\u57df\u3002VisualBERT\u3001VilBERT \u548c UNITER \u7b49\u6a21\u578b\u4f7f\u7528\u8fd9\u79cd\u6a21\u5f0f\u3002\u4ee3\u4ef7\u662f\u4f60\u65e0\u6cd5\u4e3a\u68c0\u7d22\u9884\u8ba1\u7b97\u72ec\u7acb\u7684\u5d4c\u5165\u2014\u2014\u6bcf\u4e2a\u56fe\u50cf-\u6587\u672c\u5bf9\u90fd\u9700\u8981\u901a\u8fc7\u878d\u5408\u5c42\u8fdb\u884c\u5b8c\u6574\u7684\u524d\u5411\u4f20\u64ad\u3002</li> </ul> <p></p>"},{"location":"chapter%2010%3A%20multimodal%20learning/02.%20vision%20language%20models/#-","title":"\u7f16\u7801\u5668-\u89e3\u7801\u5668","text":"<ul> <li> <p>\u7f16\u7801\u5668-\u89e3\u7801\u5668\u6a21\u5f0f\u5c06\u89c6\u89c9\u7f16\u7801\u5668\u4e0e\u81ea\u56de\u5f52\u751f\u6210\u8f93\u51fa token \u7684\u6587\u672c\u89e3\u7801\u5668\u76f8\u7ed3\u5408\uff0c\u7c7b\u4f3c\u4e8e\u7b2c 7 \u7ae0\u4e2d\u7684 seq2seq \u6a21\u578b\u3002\u89c6\u89c9\u7f16\u7801\u5668\u4ea7\u751f\u4e0a\u4e0b\u6587\u56fe\u50cf\u8868\u5f81\uff0c\u6587\u672c\u89e3\u7801\u5668\u5728\u751f\u6210\u8f93\u51fa\u6587\u672c\u65f6\u5bf9\u5176\u6267\u884c\u4ea4\u53c9\u6ce8\u610f\u529b\u3002</p> </li> <li> <p>\u8fd9\u79cd\u6a21\u5f0f\u5929\u7136\u652f\u6301\u751f\u6210\u5f0f\u4efb\u52a1\uff1a\u56fe\u50cf\u63cf\u8ff0\u3001\u81ea\u7531\u5f62\u5f0f\u7b54\u6848\u7684 VQA \u4ee5\u53ca\u89c6\u89c9\u5bf9\u8bdd\u3002GIT\uff08Generative Image-to-text Transformer\uff0cWang \u7b49\u4eba\uff0c2022\uff09\u3001CoCa\uff08Contrastive Captioner\uff0cYu \u7b49\u4eba\uff0c2022\uff09\u548c PaLI \u4f7f\u7528\u8fd9\u79cd\u67b6\u6784\u3002CoCa \u5de7\u5999\u5730\u5c06\u53cc\u7f16\u7801\u5668\u548c\u7f16\u7801\u5668-\u89e3\u7801\u5668\u6a21\u5f0f\u7ed3\u5408\u8d77\u6765\uff1a\u6587\u672c\u89e3\u7801\u5668\u7684\u524d\u534a\u90e8\u5206\u4f5c\u4e3a\u5355\u6a21\u6001\u6587\u672c\u7f16\u7801\u5668\uff08\u7528\u4e8e\u5bf9\u6bd4\u5b66\u4e60\uff09\uff0c\u800c\u540e\u534a\u90e8\u5206\u5bf9\u56fe\u50cf\u7279\u5f81\u6267\u884c\u4ea4\u53c9\u6ce8\u610f\u529b\uff08\u7528\u4e8e\u751f\u6210\u5f0f\u63cf\u8ff0\uff09\uff0c\u517c\u5f97\u4e24\u8005\u4e4b\u4f18\u52bf\u3002</p> </li> <li> <p>\u8fd9\u4e09\u79cd\u6a21\u5f0f\u7684\u9009\u62e9\u53d6\u51b3\u4e8e\u76ee\u6807\u4efb\u52a1\u3002\u53cc\u7f16\u7801\u5668\u6700\u9002\u5408\u5927\u89c4\u6a21\u68c0\u7d22\u3002\u878d\u5408\u7f16\u7801\u5668\u6700\u9002\u5408\u7ec6\u7c92\u5ea6\u7406\u89e3\u4efb\u52a1\u3002\u7f16\u7801\u5668-\u89e3\u7801\u5668\u5bf9\u4e8e\u751f\u6210\u4efb\u52a1\u6700\u4e3a\u901a\u7528\u3002\u73b0\u4ee3\u6700\u5148\u8fdb\u7684 VLM \u8d8a\u6765\u8d8a\u591a\u5730\u91c7\u7528\u7f16\u7801\u5668-\u89e3\u7801\u5668\u6216\u4ec5\u89e3\u7801\u5668\u8303\u5f0f\uff0c\u5c06\u6bcf\u9879\u89c6\u89c9\u8bed\u8a00\u4efb\u52a1\u90fd\u89c6\u4e3a\u6587\u672c\u751f\u6210\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/02.%20vision%20language%20models/#flamingo","title":"Flamingo\uff1a\u5c11\u6837\u672c\u591a\u6a21\u6001\u5b66\u4e60","text":"<ul> <li> <p>\u60f3\u8c61\u4e00\u4f4d\u7ecf\u9a8c\u4e30\u5bcc\u7684\u4e13\u5bb6\uff0c\u7ecf\u8fc7\u591a\u5e74\u5bf9\u827a\u672f\u548c\u6587\u5b66\u7684\u7814\u7a76\uff0c\u53ea\u9700\u8981\u770b\u4e00\u4e24\u4e2a\u4f8b\u5b50\u5c31\u80fd\u4f18\u96c5\u5730\u63cf\u8ff0\u4e00\u79cd\u5168\u65b0\u7684\u7ed8\u753b\u98ce\u683c\u3002Flamingo\uff08Alonso \u7b49\u4eba\uff0c2022\uff0cDeepMind\uff09\u57fa\u4e8e\u76f8\u540c\u539f\u7406\u6784\u5efa\uff1a\u5b83\u5229\u7528\u5f3a\u5927\u7684\u9884\u8bad\u7ec3\u8bed\u8a00\u6a21\u578b\u548c\u9884\u8bad\u7ec3\u89c6\u89c9\u7f16\u7801\u5668\uff0c\u901a\u8fc7\u8f7b\u91cf\u7ea7\u67b6\u6784\u7ec4\u4ef6\u5c06\u5176\u8fde\u63a5\uff0c\u5b9e\u73b0\u591a\u6a21\u6001\u4efb\u52a1\u4e0a\u7684\u5c11\u6837\u672c\u5b66\u4e60\u3002</p> </li> <li> <p>Flamingo \u7684\u8bbe\u8ba1\u7406\u5ff5\u4fdd\u5b88\u800c\u6709\u6548\uff1a\u4fdd\u6301\u9884\u8bad\u7ec3\u7684\u89c6\u89c9\u7f16\u7801\u5668\uff08NFNet\uff09\u548c\u8bed\u8a00\u6a21\u578b\uff08Chinchilla\uff09\u51bb\u7ed3\uff0c\u4ec5\u5b66\u4e60\u8fde\u63a5\u5b83\u4eec\u7684\"\u80f6\u6c34\"\u3002\u8fd9\u79cd\u80f6\u6c34\u7531\u4e24\u4e2a\u7ec4\u4ef6\u7ec4\u6210\uff1aPerceiver \u91cd\u91c7\u6837\u5668\u548c\u95e8\u63a7\u4ea4\u53c9\u6ce8\u610f\u529b\u5c42\u3002</p> </li> <li> <p>Perceiver \u91cd\u91c7\u6837\u5668\u5c06\u89c6\u89c9\u7f16\u7801\u5668\u7684\u53d8\u957f\u8f93\u51fa\uff08\u53d6\u51b3\u4e8e\u56fe\u50cf\u5206\u8fa8\u7387\uff09\u538b\u7f29\u4e3a\u4e00\u7ec4\u56fa\u5b9a\u6570\u91cf\u7684 \\(N\\) \u4e2a\u89c6\u89c9 token\uff08\u901a\u5e38 \\(N = 64\\)\uff09\u3002\u5b83\u7684\u5de5\u4f5c\u539f\u7406\u662f\u521d\u59cb\u5316\u4e00\u7ec4 \\(N\\) \u4e2a\u53ef\u5b66\u4e60\u7684\u67e5\u8be2\u5411\u91cf\uff0c\u5e76\u4f7f\u7528\u4ea4\u53c9\u6ce8\u610f\u529b\u8ba9\u8fd9\u4e9b\u67e5\u8be2\u5173\u6ce8\u5b8c\u6574\u7684\u89c6\u89c9\u7f16\u7801\u5668\u8f93\u51fa\u3002\u8fd9\u672c\u8d28\u4e0a\u662f Perceiver \u67b6\u6784\uff08Jaegle \u7b49\u4eba\uff0c2021\uff09\u4f5c\u4e3a\u74f6\u9888\u7684\u5e94\u7528\u2014\u2014\u65e0\u8bba\u8f93\u5165\u56fe\u50cf\u5927\u5c0f\u5982\u4f55\uff0c\u5b83\u90fd\u80fd\u751f\u6210\u7d27\u51d1\u7684\u3001\u56fa\u5b9a\u5927\u5c0f\u7684\u89c6\u89c9\u8868\u793a\u3002</p> </li> </ul> \\[z = \\text{CrossAttn}(Q_{\\text{learned}}, V_{\\text{image}}) \\in \\mathbb{R}^{N \\times d}\\] <ul> <li>\u95e8\u63a7\u4ea4\u53c9\u6ce8\u610f\u529b\u5c42\u4ea4\u9519\u63d2\u5165\u5728\u51bb\u7ed3\u7684\u8bed\u8a00\u6a21\u578b\u5c42\u4e4b\u95f4\u3002\u5728\u6bcf\u4e2a\u8fd9\u6837\u7684\u5c42\u4e2d\uff0c\u8bed\u8a00\u6a21\u578b\u7684\u6587\u672c token \u5bf9 Perceiver \u91cd\u91c7\u6837\u5668\u4ea7\u751f\u7684\u89c6\u89c9 token \u6267\u884c\u4ea4\u53c9\u6ce8\u610f\u529b\u3002\u5173\u952e\u4e4b\u5904\u5728\u4e8e\uff0c\u6bcf\u4e2a\u95e8\u63a7\u4ea4\u53c9\u6ce8\u610f\u529b\u5c42\u5305\u542b\u4e00\u4e2a\u53ef\u5b66\u4e60\u7684\u6807\u91cf\u95e8\u63a7 \\(\\alpha\\)\uff0c\u521d\u59cb\u5316\u4e3a\u96f6\uff0c\u5c06\u4ea4\u53c9\u6ce8\u610f\u529b\u8f93\u51fa\u4e58\u4ee5 \\(\\alpha\\) \u540e\u518d\u52a0\u5230\u6b8b\u5dee\u6d41\u4e2d\uff1a</li> </ul> \\[\\hat{x} = x + \\alpha \\cdot \\text{CrossAttn}(x, z)\\] <ul> <li>\u521d\u59cb\u5316 \\(\\alpha = 0\\) \u610f\u5473\u7740\u8bad\u7ec3\u5f00\u59cb\u65f6\u4ea4\u53c9\u6ce8\u610f\u529b\u4e0d\u8d21\u732e\u4efb\u4f55\u4fe1\u606f\uff0c\u6a21\u578b\u884c\u4e3a\u4e0e\u539f\u59cb\u7684\u51bb\u7ed3\u8bed\u8a00\u6a21\u578b\u5b8c\u5168\u76f8\u540c\u3002\u95e8\u63a7\u5728\u8bad\u7ec3\u8fc7\u7a0b\u4e2d\u9010\u6e10\u6253\u5f00\uff0c\u5e73\u6ed1\u5730\u6574\u5408\u89c6\u89c9\u4fe1\u606f\uff0c\u540c\u65f6\u4e0d\u7834\u574f\u8bed\u8a00\u6a21\u578b\u7684\u9884\u8bad\u7ec3\u8868\u793a\u3002</li> </ul> <p></p> <ul> <li> <p>Flamingo \u539f\u751f\u652f\u6301\u4ea4\u9519\u56fe\u50cf-\u6587\u672c\u5e8f\u5217\u3002\u4f60\u53ef\u4ee5\u5411\u5b83\u8f93\u5165\u5305\u542b\u591a\u5f20\u56fe\u50cf\u7a7f\u63d2\u6587\u672c\u7684\u63d0\u793a\uff0c\u4f8b\u5982\uff1a\"[\u56fe\u50cf 1] \u8fd9\u662f\u4e00\u53ea\u732b\u3002[\u56fe\u50cf 2] \u8fd9\u662f\u4e00\u53ea\u72d7\u3002[\u56fe\u50cf 3] \u8fd9\u662f\u4e00\u4e2a ___\u3002\"\u6a21\u578b\u5c06\u6bcf\u5f20\u56fe\u50cf\u901a\u8fc7\u89c6\u89c9\u7f16\u7801\u5668\u548c Perceiver \u91cd\u91c7\u6837\u5668\u5904\u7406\uff0c\u5f97\u5230\u7684\u89c6\u89c9 token \u63d2\u5165\u5230\u6587\u672c\u5e8f\u5217\u4e2d\u7684\u5bf9\u5e94\u4f4d\u7f6e\u3002\u8bed\u8a00\u6a21\u578b\u7684\u56e0\u679c\u6ce8\u610f\u529b\u63a9\u7801\u786e\u4fdd\u6bcf\u4e2a\u6587\u672c token \u53ea\u80fd\u5173\u6ce8\u5f53\u524d\u53ca\u4e4b\u524d\u56fe\u50cf\u7684\u89c6\u89c9 token\u3002</p> </li> <li> <p>\u8fd9\u79cd\u4ea4\u9519\u673a\u5236\u5b9e\u73b0\u4e86\u5f3a\u5927\u7684\u5c11\u6837\u672c\u591a\u6a21\u6001\u5b66\u4e60\u3002\u901a\u8fc7\u5728\u4e0a\u4e0b\u6587\u4e2d\u63d0\u4f9b\u5c11\u91cf\u56fe\u50cf-\u6587\u672c\u793a\u4f8b\uff0cFlamingo \u53ef\u4ee5\u5728\u6ca1\u6709\u4efb\u4f55\u68af\u5ea6\u66f4\u65b0\u7684\u60c5\u51b5\u4e0b\u6267\u884c\u65b0\u4efb\u52a1\u3002\u5728 VQAv2\u3001OK-VQA \u548c\u63cf\u8ff0\u7b49\u57fa\u51c6\u4e0a\uff0c\u5177\u6709 800 \u4ebf\u53c2\u6570\u7684 Flamingo \u5b9e\u73b0\u4e86\u6700\u5148\u8fdb\u7684\u5c11\u6837\u672c\u6027\u80fd\uff0c\u4ec5\u9700 4 \u5230 32 \u4e2a\u793a\u4f8b\u5373\u53ef\u5339\u914d\u751a\u81f3\u8d85\u8d8a\u7ecf\u8fc7\u5fae\u8c03\u7684\u4e13\u5bb6\u6a21\u578b\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/02.%20vision%20language%20models/#llava","title":"LLaVA \u4e0e\u89c6\u89c9\u6307\u4ee4\u5fae\u8c03","text":"<ul> <li> <p>\u60f3\u8c61\u4f60\u6709\u4e00\u4f4d\u51fa\u8272\u7684\u8bed\u8a00\u4e13\u5bb6\uff08\u4e00\u4e2a LLM\uff09\u548c\u4e00\u4f4d\u51fa\u8272\u7684\u827a\u672f\u8bc4\u8bba\u5bb6\uff08\u4e00\u4e2a\u89c6\u89c9\u7f16\u7801\u5668\uff09\u3002\u5982\u679c\u4f60\u80fd\u6559\u4f1a\u827a\u672f\u8bc4\u8bba\u5bb6\"\u8bf4\u8bed\u8a00\u4e13\u5bb6\u7684\u8bed\u8a00\"\uff0c\u4ed6\u4eec\u5c31\u53ef\u4ee5\u65e0\u7f1d\u534f\u4f5c\u3002LLaVA\uff08Large Language and Vision Assistant\uff0cLiu \u7b49\u4eba\uff0c2023\uff09\u6b63\u662f\u8fd9\u6837\u505a\u7684\uff1a\u5b83\u4f7f\u7528\u4e00\u4e2a\u7b80\u5355\u7684\u7ebf\u6027\u5c42\u5c06\u89c6\u89c9\u7279\u5f81\u6295\u5f71\u5230 LLM \u7684 token \u5d4c\u5165\u7a7a\u95f4\uff0c\u7136\u540e\u5728\u6307\u4ee4\u9075\u5faa\u6570\u636e\u4e0a\u5fae\u8c03\u6574\u4e2a\u7cfb\u7edf\u3002</p> </li> <li> <p>LLaVA \u7684\u67b6\u6784\u51fa\u5947\u5730\u7b80\u5355\u3002\u56fe\u50cf\u7531\u4e00\u4e2a\u9884\u8bad\u7ec3\u7684 CLIP ViT-L/14 \u89c6\u89c9\u7f16\u7801\u5668\u7f16\u7801\u4e3a\u4e00\u4e2a patch \u7279\u5f81\u7f51\u683c \\(V \\in \\mathbb{R}^{N \\times d_v}\\)\uff0c\u5176\u4e2d \\(N = 256\\) \u4e2a patch\uff08\u5bf9\u4e8e 336px \u56fe\u50cf\u548c 14px patch\uff09\u3002\u4e00\u4e2a\u6295\u5f71\u5c42 \\(W\\) \u5c06\u8fd9\u4e9b\u89c6\u89c9\u7279\u5f81\u6620\u5c04\u5230 LLM \u7684\u5d4c\u5165\u7ef4\u5ea6\uff1a</p> </li> </ul> \\[H_v = VW, \\quad W \\in \\mathbb{R}^{d_v \\times d_{\\text{LLM}}}\\] <ul> <li>\u6295\u5f71\u540e\u7684\u89c6\u89c9 token \\(H_v\\) \u76f4\u63a5\u4e0e\u6587\u672c token \u5d4c\u5165\u62fc\u63a5\uff0c\u4f5c\u4e3a\u4e00\u4e2a\u5355\u4e00\u5e8f\u5217\u8f93\u5165\u5230 LLM\uff08Vicuna\uff0c\u4e00\u4e2a\u5fae\u8c03\u540e\u7684 LLaMA\uff09\u3002LLM \u4f7f\u7528\u5176\u6807\u51c6\u56e0\u679c\u81ea\u6ce8\u610f\u529b\u5904\u7406\u5b83\u4eec\u2014\u2014\u6ca1\u6709\u7279\u6b8a\u7684\u4ea4\u53c9\u6ce8\u610f\u529b\u5c42\uff0c\u6ca1\u6709 perceiver\uff0c\u53ea\u6709\u62fc\u63a5\u3002\u89c6\u89c9 token \u88ab\u5f53\u4f5c\u6070\u597d\u7f16\u7801\u4e86\u89c6\u89c9\u4fe1\u606f\u7684\u6587\u672c token \u6765\u5904\u7406\u3002</li> </ul> <p></p> <ul> <li> <p>\u89c6\u89c9\u6307\u4ee4\u5fae\u8c03\u662f LLaVA \u7684\u5173\u952e\u8bad\u7ec3\u521b\u65b0\u3002\u4f5c\u8005\u4f7f\u7528 GPT-4 \u4ece COCO \u56fe\u50cf\u751f\u6210\u4e86 158,000 \u4e2a\u591a\u6a21\u6001\u6307\u4ee4\u9075\u5faa\u793a\u4f8b\u3002\u6bcf\u4e2a\u793a\u4f8b\u5305\u542b\u4e00\u5f20\u56fe\u50cf\u548c\u4e00\u4e2a\u5bf9\u8bdd\u5f0f\u6307\u4ee4\uff08\u4f8b\u5982\"\u8be6\u7ec6\u63cf\u8ff0\u8fd9\u5f20\u56fe\u50cf\"\u3001\"\u8fd9\u5f20\u56fe\u50cf\u6709\u4ec0\u4e48\u4e0d\u5bfb\u5e38\u4e4b\u5904\uff1f\"\u3001\"\u5982\u679c\u6211\u662f\u4e00\u540d\u6e38\u5ba2\u53c2\u89c2\u8fd9\u4e2a\u5730\u65b9\uff0c\u6211\u5e94\u8be5\u77e5\u9053\u4ec0\u4e48\uff1f\"\uff09\u3002\u6a21\u578b\u63a5\u53d7\u8bad\u7ec3\uff0c\u6839\u636e\u56fe\u50cf\u548c\u6307\u4ee4\u751f\u6210 GPT-4 \u64b0\u5199\u7684\u56de\u7b54\u3002</p> </li> <li> <p>\u8bad\u7ec3\u5206\u4e3a\u4e24\u4e2a\u9636\u6bb5\u3002\u9636\u6bb5 1\uff08\u9884\u8bad\u7ec3\uff09\uff1a\u4ec5\u8bad\u7ec3\u6295\u5f71\u5c42 \\(W\\)\uff0c\u4f7f\u7528\u56fe\u50cf-\u63cf\u8ff0\u5bf9\uff08\u6765\u81ea CC3M \u7684 595K \u6570\u636e\uff09\uff0c\u89c6\u89c9\u7f16\u7801\u5668\u548c LLM \u90fd\u4fdd\u6301\u51bb\u7ed3\u3002\u8fd9\u6559\u4f1a \\(W\\) \u5c06\u89c6\u89c9\u7279\u5f81\u4e0e LLM \u7684\u5d4c\u5165\u7a7a\u95f4\u5bf9\u9f50\u3002\u9636\u6bb5 2\uff08\u5fae\u8c03\uff09\uff1a\u6295\u5f71\u5c42\u548c LLM \u5728\u6307\u4ee4\u9075\u5faa\u6570\u636e\u4e0a\u8054\u5408\u5fae\u8c03\uff0c\u89c6\u89c9\u7f16\u7801\u5668\u4fdd\u6301\u51bb\u7ed3\u3002\u8fd9\u6559\u4f1a\u6a21\u578b\u9075\u5faa\u590d\u6742\u7684\u89c6\u89c9\u6307\u4ee4\u3002</p> </li> <li> <p>LLaVA-1.5 \u901a\u8fc7\u4e09\u9879\u5173\u952e\u66f4\u6539\u6539\u8fdb\u4e86\u539f\u59cb\u7248\u672c\uff1a\u5c06\u5355\u5c42\u7ebf\u6027\u6295\u5f71\u66ff\u6362\u4e3a\u4e24\u5c42 MLP\uff08\u66f4\u5177\u8868\u73b0\u529b\u7684\u6620\u5c04\uff09\uff0c\u4f7f\u7528\u66f4\u9ad8\u5206\u8fa8\u7387\u7684\u56fe\u50cf\uff08336px \u800c\u975e 224px\uff0c\u4ea7\u751f\u66f4\u591a patch token\uff09\uff0c\u4ee5\u53ca\u5728\u8bad\u7ec3\u6df7\u5408\u6570\u636e\u4e2d\u52a0\u5165\u5b66\u672f VQA \u6570\u636e\u96c6\u3002\u8fd9\u4e9b\u770b\u4f3c\u7ec6\u5fae\u7684\u4fee\u6539\u5e26\u6765\u4e86\u57fa\u51c6\u6027\u80fd\u7684\u5927\u5e45\u63d0\u5347\u3002</p> </li> <li> <p>LLaVA \u7684\u65b9\u6cd5\u8bc1\u660e\uff0c\u4f60\u4e0d\u9700\u8981\u50cf Flamingo \u7684 Perceiver \u91cd\u91c7\u6837\u5668\u6216\u95e8\u63a7\u4ea4\u53c9\u6ce8\u610f\u529b\u90a3\u6837\u590d\u6742\u7684\u67b6\u6784\u521b\u65b0\u3002\u4e00\u4e2a\u7b80\u5355\u7684\u7ebf\u6027\u6295\u5f71\uff0c\u7ed3\u5408\u9ad8\u8d28\u91cf\u7684\u6307\u4ee4\u5fae\u8c03\u6570\u636e\uff0c\u5c31\u8db3\u4ee5\u6709\u6548\u5730\u5c06\u89c6\u89c9\u7f16\u7801\u5668\u8fde\u63a5\u5230 LLM\u3002\u8fd9\u79cd\u7b80\u6d01\u6027\u4f7f\u5f97 LLaVA \u6781\u5177\u5f71\u54cd\u529b\u2014\u2014\u540e\u7eed\u5927\u591a\u6570\u5f00\u6e90 VLM \u90fd\u9075\u5faa\u7c7b\u4f3c\u7684\u65b9\u6848\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/02.%20vision%20language%20models/#_7","title":"\u6269\u5c55\u89c6\u89c9\u8bed\u8a00\u6a21\u578b","text":"<ul> <li>\u8be5\u9886\u57df\u4ece\u6982\u5ff5\u9a8c\u8bc1\u578b VLM \u8fc5\u901f\u53d1\u5c55\u4e3a\u5728\u6570\u5341\u4ebf\u56fe\u50cf-\u6587\u672c\u5bf9\u4e0a\u8bad\u7ec3\u7684\u5de5\u4e1a\u7ea7\u7cfb\u7edf\u3002\u4e09\u4e2a\u6a21\u578b\u5bb6\u65cf\u5c55\u793a\u4e86\u4e0d\u540c\u7684\u6269\u5c55\u65b9\u6cd5\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/02.%20vision%20language%20models/#pali","title":"PaLI","text":"<ul> <li> <p>PaLI\uff08Pathways Language and Image model\uff0cChen \u7b49\u4eba\uff0c2022\uff0cGoogle\uff09\u540c\u65f6\u6269\u5c55\u89c6\u89c9\u7f16\u7801\u5668\u548c\u8bed\u8a00\u6a21\u578b\u3002PaLI \u4f7f\u7528 ViT-e\uff0840 \u4ebf\u53c2\u6570\uff09\u4f5c\u4e3a\u89c6\u89c9\u7f16\u7801\u5668\uff0cmT5\uff08130 \u4ebf\u53c2\u6570\uff09\u4f5c\u4e3a\u8bed\u8a00\u6a21\u578b\uff0c\u603b\u8ba1 170 \u4ebf\u53c2\u6570\u3002\u56fe\u50cf\u88ab\u7f16\u7801\u4e3a\u4e00\u7cfb\u5217 patch token\uff0c\u62fc\u63a5\u5728\u6587\u672c token \u4e4b\u524d\uff0c\u8f93\u5165\u5230\u7f16\u7801\u5668-\u89e3\u7801\u5668\u67b6\u6784\u7684 mT5\u3002</p> </li> <li> <p>PaLI \u7684\u5173\u952e\u6d1e\u89c1\u662f\u6269\u5c55\u89c6\u89c9\u7f16\u7801\u5668\u4e0e\u6269\u5c55\u8bed\u8a00\u6a21\u578b\u540c\u6837\u91cd\u8981\u3002\u5148\u524d\u7684\u5de5\u4f5c\u901a\u5e38\u4f7f\u7528\u56fa\u5b9a\u7684\u3001\u4e2d\u7b49\u89c4\u6a21\u7684\u89c6\u89c9\u9aa8\u5e72\u7f51\u7edc\uff08\u5982 ViT-B \u6216 ViT-L\uff09\uff0c\u5c06\u53c2\u6570\u9884\u7b97\u5168\u90e8\u6295\u5165 LLM\u3002PaLI \u8868\u660e\uff0c\u4e00\u4e2a 40 \u4ebf\u53c2\u6570\u7684 ViT-e\uff0c\u5728 JFT-4B\uff0840 \u4ebf\u5f20\u6807\u6ce8\u56fe\u50cf\uff09\u4e0a\u9884\u8bad\u7ec3\u540e\uff0c\u80fd\u591f\u663e\u8457\u63d0\u5347 OCR \u548c\u7a7a\u95f4\u63a8\u7406\u7b49\u7ec6\u7c92\u5ea6\u89c6\u89c9\u4efb\u52a1\u7684\u6027\u80fd\u3002</p> </li> <li> <p>PaLI \u5728 WebLI\uff08\u4e00\u4e2a\u5305\u542b 109 \u79cd\u8bed\u8a00\u3001100 \u4ebf\u56fe\u50cf-\u6587\u672c\u5bf9\u7684\u6570\u636e\u96c6\uff09\u4e0a\u8bad\u7ec3\uff0c\u56e0\u6b64\u5929\u7136\u5177\u5907\u591a\u8bed\u8a00\u80fd\u529b\u3002\u6a21\u578b\u901a\u8fc7\u6df7\u5408\u4efb\u52a1\u8fdb\u884c\u9884\u8bad\u7ec3\uff1a\u56fe\u50cf\u63cf\u8ff0\u3001VQA \u548c\u56fe\u50cf-\u6587\u672c\u5339\u914d\uff0c\u5168\u90e8\u4f5c\u4e3a\u6587\u672c\u5230\u6587\u672c\u751f\u6210\u4efb\u52a1\uff08\u9075\u5faa\u7b2c 7 \u7ae0\u7684 T5 \u8303\u5f0f\uff09\u3002PaLI-X\uff08550 \u4ebf\u53c2\u6570\uff09\u548c PaLI-3\uff0850 \u4ebf\uff0c\u4f7f\u7528 SigLIP \u4f5c\u4e3a\u89c6\u89c9\u7f16\u7801\u5668\uff09\u662f\u540e\u7eed\u8fed\u4ee3\u7248\u672c\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/02.%20vision%20language%20models/#qwen-vl","title":"Qwen-VL","text":"<ul> <li> <p>Qwen-VL\uff08Bai \u7b49\u4eba\uff0c2023\uff0c\u963f\u91cc\u5df4\u5df4\uff09\u5728 Qwen LLM \u57fa\u7840\u4e0a\u589e\u52a0\u4e86\u4e00\u4e2a ViT \u89c6\u89c9\u7f16\u7801\u5668\u548c\u4e00\u4e2a\u5355\u5c42\u4ea4\u53c9\u6ce8\u610f\u529b\u6a21\u5757\uff08\u7c7b\u4f3c\u4e8e Flamingo \u7684 Perceiver \u91cd\u91c7\u6837\u5668\uff09\uff0c\u5c06\u89c6\u89c9\u7f16\u7801\u5668\u7684\u8f93\u51fa\u538b\u7f29\u4e3a\u4e00\u7ec4\u56fa\u5b9a\u7684 256 \u4e2a\u89c6\u89c9 token\u3002\u89c6\u89c9 token \u4e0e\u6587\u672c token \u62fc\u63a5\u540e\u7531 Qwen LLM \u5904\u7406\u3002</p> </li> <li> <p>Qwen-VL \u7684\u8bad\u7ec3\u91c7\u7528\u4e09\u9636\u6bb5\u65b9\u6848\u3002\u9636\u6bb5 1\uff1a\u5728 14 \u4ebf\u4e2a\u5f31\u76d1\u7763\u56fe\u50cf-\u6587\u672c\u5bf9\u4e0a\u9884\u8bad\u7ec3\uff0c\u4ec5\u89e3\u51bb\u89c6\u89c9\u7f16\u7801\u5668\u3002\u9636\u6bb5 2\uff1a\u5728\u66f4\u9ad8\u8d28\u91cf\u7684\u6570\u636e\u4e0a\u8fdb\u884c\u591a\u4efb\u52a1\u9884\u8bad\u7ec3\uff0c\u5305\u62ec VQA\u3001\u63cf\u8ff0\u3001\u5b9a\u4f4d\u548c OCR \u6570\u636e\u96c6\uff0c\u6574\u4e2a\u6a21\u578b\u89e3\u51bb\u3002\u9636\u6bb5 3\uff1a\u5728\u6307\u4ee4\u9075\u5faa\u548c\u5bf9\u8bdd\u6570\u636e\u4e0a\u8fdb\u884c\u76d1\u7763\u5fae\u8c03\u3002\u8fd9\u79cd\u4ece\u566a\u58f0\u7f51\u7edc\u6570\u636e\u5230\u7cbe\u9009\u6307\u4ee4\u6570\u636e\u7684\u6e10\u8fdb\u5f0f\u7cbe\u70bc\uff0c\u662f\u5927\u591a\u6570\u73b0\u4ee3 VLM \u5171\u4eab\u7684\u6a21\u5f0f\u3002</p> </li> <li> <p>Qwen2-VL\uff082024\uff09\u5f15\u5165\u4e86\u52a8\u6001\u5206\u8fa8\u7387\u652f\u6301\uff1a\u6a21\u578b\u4e0d\u662f\u5c06\u6240\u6709\u56fe\u50cf\u7f29\u653e\u5230\u56fa\u5b9a\u5927\u5c0f\uff0c\u800c\u662f\u901a\u8fc7\u52a8\u6001\u8c03\u6574\u89c6\u89c9 token \u6570\u91cf\u4ee5\u539f\u59cb\u5206\u8fa8\u7387\u5904\u7406\u56fe\u50cf\u3002\u66f4\u9ad8\u5206\u8fa8\u7387\u7684\u56fe\u50cf\u4ea7\u751f\u66f4\u591a token\uff0c\u66f4\u4f4e\u5206\u8fa8\u7387\u7684\u56fe\u50cf\u4ea7\u751f\u66f4\u5c11 token\u3002\u8fd9\u5728\u4e0d\u6d6a\u8d39\u4f4e\u5206\u8fa8\u7387\u8f93\u5165\u8ba1\u7b97\u91cf\u7684\u524d\u63d0\u4e0b\uff0c\u63d0\u5347\u4e86\u6587\u6863\u7406\u89e3\u548c\u7ec6\u7c92\u5ea6\u8bc6\u522b\u7b49\u5bf9\u7ec6\u8282\u654f\u611f\u7684\u4efb\u52a1\u7684\u6027\u80fd\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/02.%20vision%20language%20models/#internvl","title":"InternVL","text":"<ul> <li> <p>InternVL\uff08Chen \u7b49\u4eba\uff0c2024\uff0c\u4e0a\u6d77\u4eba\u5de5\u667a\u80fd\u5b9e\u9a8c\u5ba4\uff09\u6fc0\u8fdb\u5730\u6269\u5c55\u4e86\u89c6\u89c9\u7f16\u7801\u5668\uff0c\u4f7f\u7528 InternViT-6B\u2014\u2014\u4e00\u4e2a 60 \u4ebf\u53c2\u6570\u7684\u89c6\u89c9 Transformer\u2014\u2014\u4e0e\u8bed\u8a00\u6a21\u578b\u914d\u5bf9\u3002\u5173\u952e\u7684\u67b6\u6784\u8d21\u732e\u662f\u52a8\u6001\u9ad8\u5206\u8fa8\u7387\u5904\u7406\uff1a\u56fe\u50cf\u88ab\u5206\u5272\u4e3a 448x448 \u50cf\u7d20\u7684\u56fe\u5757\uff0c\u6bcf\u4e2a\u56fe\u5757\u7531\u89c6\u89c9\u7f16\u7801\u5668\u72ec\u7acb\u5904\u7406\uff0c\u5f97\u5230\u7684\u56fe\u5757\u7279\u5f81\u4e0e\u5b8c\u6574\u56fe\u50cf\u7684\u7f29\u7565\u56fe\u7279\u5f81\u62fc\u63a5\u3002\u8fd9\u4f7f\u5f97\u6a21\u578b\u80fd\u591f\u5904\u7406\u4efb\u610f\u5bbd\u9ad8\u6bd4\u548c\u5206\u8fa8\u7387\u7684\u56fe\u50cf\u3002</p> </li> <li> <p>InternVL-2 \u8fdb\u4e00\u6b65\u5f15\u5165\u4e86\u6e10\u8fdb\u5bf9\u9f50\u8bad\u7ec3\uff1a\u9996\u5148\u7528\u5bf9\u6bd4\u76ee\u6807\uff08\u5982 CLIP\uff09\u5bf9\u9f50\u89c6\u89c9\u7f16\u7801\u5668\uff0c\u7136\u540e\u901a\u8fc7\u8f7b\u91cf\u7ea7 MLP \u8fde\u63a5\u5668\u5c06\u5176\u8fde\u63a5\u5230 LLM\uff0c\u6700\u540e\u5728\u6307\u4ee4\u6570\u636e\u4e0a\u8fdb\u884c\u7aef\u5230\u7aef\u5fae\u8c03\u3002\u8fd9\u79cd\u6e10\u8fdb\u7b56\u7565\u9632\u6b62\u4e86\u89c6\u89c9\u7f16\u7801\u5668\u9884\u8bad\u7ec3\u8868\u793a\u7684\u707e\u96be\u6027\u9057\u5fd8\u3002</p> </li> </ul> <p></p> <ul> <li>\u6240\u6709\u4e09\u4e2a\u6a21\u578b\u5bb6\u65cf\u7684\u4e00\u4e2a\u5171\u540c\u4e3b\u9898\u662f\u8bad\u7ec3\u6570\u636e\u7cbe\u9009\u7684\u91cd\u8981\u6027\u3002\u4ece\u7f51\u7edc\u6293\u53d6\u7684\u539f\u59cb\u56fe\u50cf-\u6587\u672c\u5bf9\u662f\u566a\u58f0\u5927\u4e14\u5e38\u5e38\u4e0d\u5bf9\u9f50\u7684\u3002\u540e\u7eed\u7684\u8bad\u7ec3\u9636\u6bb5\u9010\u6b65\u8fc7\u6ee4\u548c\u7cbe\u70bc\u6570\u636e\uff0c\u4ece\u6570\u5341\u4ebf\u566a\u58f0\u5bf9\u8fc7\u6e21\u5230\u6570\u767e\u4e07\u9ad8\u8d28\u91cf\u6307\u4ee4\u793a\u4f8b\u3002\u6700\u7ec8\u5fae\u8c03\u6570\u636e\u7684\u8d28\u91cf\u5f80\u5f80\u6bd4\u6a21\u578b\u7684\u539f\u59cb\u53c2\u6570\u6570\u91cf\u66f4\u4e3a\u91cd\u8981\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/02.%20vision%20language%20models/#_8","title":"\u5b9a\u4f4d\u4e0e\u6307\u4ee3","text":"<ul> <li> <p>\u60f3\u8c61\u4f60\u5728\u4eba\u7fa4\u4e2d\u6307\u7740\u4e00\u4e2a\u4eba\u8bf4\"\u6234\u7ea2\u5e3d\u5b50\u7684\u5973\u58eb\"\u3002\u4f60\u5728\u7528\u8bed\u8a00\u6307\u4ee3\u4e00\u4e2a\u7279\u5b9a\u7684\u7a7a\u95f4\u533a\u57df\u3002\u89c6\u89c9\u5b9a\u4f4d\u662f\u76f8\u53cd\u7684\u8fc7\u7a0b\uff1a\u7ed9\u5b9a\u4e00\u5f20\u56fe\u50cf\u548c\u4e00\u4e2a\u81ea\u7136\u8bed\u8a00\u8868\u8ff0\uff0c\u6a21\u578b\u5fc5\u987b\u8bc6\u522b\uff08\u5b9a\u4f4d\uff09\u6240\u6307\u7684\u5bf9\u8c61\u3002\u6307\u4ee3\u8868\u8fbe\u7406\u89e3\u4ea7\u751f\u8fb9\u754c\u6846\uff1b\u6307\u4ee3\u8868\u8fbe\u5206\u5272\u4ea7\u751f\u50cf\u7d20\u63a9\u7801\u3002</p> </li> <li> <p>\u5f62\u5f0f\u4e0a\uff0c\u7ed9\u5b9a\u4e00\u5f20\u56fe\u50cf \\(I\\) \u548c\u4e00\u4e2a\u6307\u4ee3\u8868\u8fbe \\(r\\)\uff08\u4f8b\u5982\"\u5de6\u8fb9\u90a3\u53ea\u5927\u578b\u68d5\u8272\u72d7\"\uff09\uff0c\u6a21\u578b\u9884\u6d4b\u4e00\u4e2a\u8fb9\u754c\u6846 \\(b = (x, y, w, h)\\) \u6216\u4e00\u7ec4\u5b9a\u4f4d\u6240\u5f15\u7528\u5bf9\u8c61\u7684\u5750\u6807\u3002\u6570\u636e\u96c6\u5305\u62ec RefCOCO\u3001RefCOCO+ \u548c RefCOCOg\uff0c\u6bcf\u4e2a\u6570\u636e\u96c6\u5305\u542b\u5177\u6709\u591a\u4e2a\u5bf9\u8c61\u7684\u56fe\u50cf\u4ee5\u53ca\u6bcf\u4e2a\u5bf9\u8c61\u7684\u660e\u786e\u6307\u4ee3\u8868\u8fbe\u3002</p> </li> <li> <p>\u65e9\u671f\u7684\u5b9a\u4f4d\u6a21\u578b\u4f7f\u7528\u4e24\u9636\u6bb5\u65b9\u6cd5\uff1a\u9996\u5148\u751f\u6210\u533a\u57df\u63d0\u8bae\uff08\u4f7f\u7528 Faster R-CNN \u6216\u7c7b\u4f3c\u65b9\u6cd5\uff09\uff0c\u7136\u540e\u4f7f\u7528\u878d\u5408\u6a21\u578b\u5bf9\u6bcf\u4e2a\u63d0\u8bae\u4e0e\u8bed\u8a00\u67e5\u8be2\u8fdb\u884c\u8bc4\u5206\u3002\u8bc4\u5206\u6700\u9ad8\u7684\u533a\u57df\u5373\u4e3a\u9884\u6d4b\u7ed3\u679c\u3002\u8fd9\u79cd\u65b9\u6cd5\u8ba1\u7b97\u4ee3\u4ef7\u9ad8\u6602\uff0c\u4e14\u53d7\u9650\u4e8e\u63d0\u8bae\u7684\u8d28\u91cf\u3002</p> </li> <li> <p>\u73b0\u4ee3 VLM \u5c06\u5b9a\u4f4d\u76f4\u63a5\u6574\u5408\u5230\u751f\u6210\u5f0f\u6846\u67b6\u4e2d\u3002\u5173\u952e\u601d\u60f3\u662f\u5c06\u8fb9\u754c\u6846\u5750\u6807\u8868\u793a\u4e3a\u6587\u672c token\u3002\u4f60\u5c06\u8fde\u7eed\u7684\u5750\u6807\u7a7a\u95f4\u79bb\u6563\u5316\u4e3a\u69fd\u4f4d\uff08\u4f8b\u5982 \\(x, y, w, h\\) \u5404 1000 \u4e2a\u69fd\u4f4d\uff09\uff0c\u5e76\u5411\u8bcd\u6c47\u8868\u4e2d\u6dfb\u52a0\u7279\u6b8a\u7684\u4f4d\u7f6e token\uff0c\u5982 <code>&lt;loc_342&gt;</code>\u3002\u7136\u540e\u6a21\u578b\u901a\u8fc7\u8f93\u51fa\u4e00\u7cfb\u5217\u4f4d\u7f6e token \u6765\u751f\u6210\u8fb9\u754c\u6846\uff1a</p> </li> </ul> \\[\\text{\u8f93\u51fa: } \\texttt{&lt;loc\\_102&gt;&lt;loc\\_215&gt;&lt;loc\\_487&gt;&lt;loc\\_398&gt;}\\] <ul> <li> <p>\u8fd9\u79cd token \u5316\u6280\u5de7\u4f7f\u5f97\u4efb\u4f55\u81ea\u56de\u5f52\u8bed\u8a00\u6a21\u578b\u65e0\u9700\u67b6\u6784\u66f4\u6539\u5373\u53ef\u6267\u884c\u5b9a\u4f4d\u2014\u2014\u5b83\u53ea\u9700\u5b66\u4f1a\"\u8bf4\u5750\u6807\"\u3002Pix2Seq\uff08Chen \u7b49\u4eba\uff0c2022\uff09\u7387\u5148\u5c06\u8fd9\u79cd\u65b9\u6cd5\u7528\u4e8e\u76ee\u6807\u68c0\u6d4b\uff0c\u800c Qwen-VL\u3001Ferret \u548c Kosmos-2 \u7b49\u6a21\u578b\u5c06\u5176\u6269\u5c55\u5230\u6307\u4ee3\u8868\u8fbe\u7406\u89e3\u548c\u77ed\u8bed\u5b9a\u4f4d\u3002</p> </li> <li> <p>Kosmos-2\uff08Peng \u7b49\u4eba\uff0c2023\uff0cMicrosoft\uff09\u901a\u8fc7\u5c06\u7a7a\u95f4\u4f4d\u7f6e\u8868\u793a\u4e3a\u5d4c\u5165\u5728\u751f\u6210\u6587\u672c\u4e2d\u7684\u7279\u6b8a token\uff0c\u4e3a\u591a\u6a21\u6001 LLM \u589e\u52a0\u4e86\u5b9a\u4f4d\u80fd\u529b\u3002\u4f8b\u5982\uff0c\u5b83\u53ef\u4ee5\u751f\u6210\uff1a\"\u4e00\u53ea <code>&lt;phrase&gt;</code> \u91d1\u6bdb\u730e\u72ac <code>&lt;/phrase&gt;</code> <code>&lt;box&gt;</code> <code>&lt;loc_102&gt;</code> <code>&lt;loc_215&gt;</code> <code>&lt;loc_487&gt;</code> <code>&lt;loc_398&gt;</code> <code>&lt;/box&gt;</code> \u6b63\u5728\u63a5\u98de\u76d8\u3002\"\u8fd9\u79cd\u6587\u672c\u548c\u7a7a\u95f4 token \u7684\u4ea4\u9519\u878d\u5408\u5b9e\u73b0\u4e86\u540c\u6b65\u63cf\u8ff0\u548c\u5b9a\u4f4d\u3002</p> </li> </ul> <p></p> <ul> <li>\u5b9a\u70b9\u6307\u5411\u5c06\u5b9a\u4f4d\u66f4\u8fdb\u4e00\u6b65\uff1a\u6a21\u578b\u4e0d\u518d\u8f93\u51fa\u8fb9\u754c\u6846\uff0c\u800c\u662f\u9884\u6d4b\u4e00\u4e2a\u5355\u4e00\u7684\u70b9\uff08\u901a\u5e38\u662f\u6307\u4ee3\u7269\u4f53\u7684\u4e2d\u5fc3\uff09\u3002\u8fd9\u5bf9\u4e8e\u4ea4\u4e92\u5f0f\u5e94\u7528\u975e\u5e38\u6709\u7528\uff0c\u4f8b\u5982\u7528\u6237\u95ee\"\u6700\u8fd1\u7684\u51fa\u53e3\u5728\u54ea\u91cc\uff1f\"\uff0c\u6a21\u578b\u8fd4\u56de\u4e00\u4e2a\u53e0\u52a0\u5728\u56fe\u50cf\u4e0a\u7684\u5750\u6807\u3002Shikra \u548c Ferret \u7b49\u6a21\u578b\u652f\u6301\u57fa\u4e8e\u70b9\u7684\u6307\u4ee3\u4ee5\u53ca\u57fa\u4e8e\u6846\u7684\u5b9a\u4f4d\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/02.%20vision%20language%20models/#ocr","title":"\u514d OCR \u6587\u6863\u7406\u89e3","text":"<ul> <li> <p>\u4f20\u7edf\u7684\u6587\u6863\u7406\u89e3\u6d41\u6c34\u7ebf\u5f88\u590d\u6742\uff1a\u9996\u5148\u8fd0\u884c OCR \u5f15\u64ce\u63d0\u53d6\u6587\u672c\u548c\u5e03\u5c40\uff0c\u7136\u540e\u5c06\u63d0\u53d6\u7684\u6587\u672c\u8f93\u5165\u8bed\u8a00\u6a21\u578b\u3002\u8fd9\u79cd\u591a\u9636\u6bb5\u65b9\u6cd5\u5f88\u8106\u5f31\u2014\u2014OCR \u9519\u8bef\u5411\u4e0b\u6e38\u4f20\u64ad\uff0c\u7a7a\u95f4\u5e03\u5c40\u4fe1\u606f\u5e38\u5e38\u4e22\u5931\u6216\u8868\u5f81\u4e0d\u826f\u3002\u5982\u679c\u6a21\u578b\u80fd\u50cf\u4eba\u7c7b\u4e00\u6837\u76f4\u63a5\u4ece\u50cf\u7d20\u4e2d\u8bfb\u53d6\u4fe1\u606f\u5462\uff1f</p> </li> <li> <p>Donut\uff08Document Understanding Transformer\uff0cKim \u7b49\u4eba\uff0c2022\uff09\u5b8c\u5168\u6d88\u9664\u4e86 OCR\u3002\u5b83\u4f7f\u7528 Swin Transformer\uff08\u7b2c 8 \u7ae0\uff09\u4f5c\u4e3a\u89c6\u89c9\u7f16\u7801\u5668\u5904\u7406\u6587\u6863\u56fe\u50cf\uff0c\u5e76\u4f7f\u7528 BART \u98ce\u683c\u7684 Transformer \u89e3\u7801\u5668\u76f4\u63a5\u4ece\u89c6\u89c9\u7279\u5f81\u751f\u6210\u7ed3\u6784\u5316\u6587\u672c\u8f93\u51fa\u3002\u89e3\u7801\u5668\u53ef\u4ee5\u6839\u636e\u4efb\u52a1\u751f\u6210 JSON\u3001\u952e\u503c\u5bf9\u6216\u7eaf\u6587\u672c\u3002</p> </li> <li> <p>Donut \u7684\u8bad\u7ec3\u5206\u4e3a\u4e24\u4e2a\u9636\u6bb5\u3002\u9884\u8bad\u7ec3\uff1a\u6a21\u578b\u901a\u8fc7\u6267\u884c\u5408\u6210 OCR \u6765\u5b66\u4e60\u9605\u8bfb\u2014\u2014\u7ed9\u5b9a\u4e00\u5f20\u6587\u6863\u56fe\u50cf\uff0c\u751f\u6210\u5b8c\u6574\u7684\u6587\u672c\u5185\u5bb9\u3002\u8fd9\u5728\u4ece\u6587\u672c\u8bed\u6599\u5e93\u6e32\u67d3\u7684\u6570\u767e\u4e07\u5f20\u5408\u6210\u6587\u6863\u56fe\u50cf\u4e0a\u8fdb\u884c\u8bad\u7ec3\uff0c\u6559\u4f1a\u89c6\u89c9\u7f16\u7801\u5668\u8bc6\u522b\u5b57\u7b26\u3001\u5b57\u4f53\u548c\u5e03\u5c40\u3002\u5fae\u8c03\uff1a\u6a21\u578b\u901a\u8fc7\u8bad\u7ec3\u751f\u6210\u7279\u5b9a\u4e8e\u4efb\u52a1\u7684\u7ed3\u6784\u5316\u8f93\u51fa\uff0c\u9002\u5e94\u7279\u5b9a\u7684\u4e0b\u6e38\u4efb\u52a1\uff0c\u5982\u6536\u636e\u89e3\u6790\u3001\u8868\u683c\u7406\u89e3\u6216\u6587\u6863\u5206\u7c7b\u3002</p> </li> <li> <p>Donut \u89e3\u7801\u5668\u4f7f\u7528\u7279\u6b8a\u7684\u63d0\u793a\u65b9\u6848\uff1a\u4efb\u52a1\u7531\u63d0\u793a token \u6307\u5b9a\uff08\u4f8b\u5982\u5206\u7c7b\u7528 <code>&lt;doc_class&gt;</code>\uff0c\u6536\u636e\u89e3\u6790\u7528 <code>&lt;parse_receipt&gt;</code>\uff09\uff0c\u6a21\u578b\u6839\u636e\u6b64\u63d0\u793a\u751f\u6210\u8f93\u51fa\u3002\u8fd9\u79cd\u7edf\u4e00\u63a5\u53e3\u4f7f\u5f97\u5355\u4e2a\u6a21\u578b\u53ef\u4ee5\u5904\u7406\u591a\u79cd\u6587\u6863\u7406\u89e3\u4efb\u52a1\u3002</p> </li> <li> <p>Pix2Struct\uff08Lee \u7b49\u4eba\uff0c2023\uff0cGoogle\uff09\u5c06\u514d OCR \u601d\u60f3\u5e94\u7528\u4e8e\u7f51\u9875\u7406\u89e3\u548c\u56fe\u8868/\u56fe\u5f62\u7406\u89e3\u3002\u5173\u952e\u7684\u9884\u8bad\u7ec3\u76ee\u6807\u662f\u622a\u56fe\u89e3\u6790\uff1a\u7ed9\u5b9a\u4e00\u4e2a\u7f51\u9875\u7684\u5e26\u63a9\u7801\u622a\u56fe\uff0c\u6a21\u578b\u751f\u6210\u4ea7\u751f\u53ef\u89c1\u533a\u57df\u7684\u5e95\u5c42 HTML\u3002\u8fd9\u6559\u4f1a\u6a21\u578b\u7406\u89e3\u89c6\u89c9\u5448\u73b0\u4e0e\u7ed3\u6784\u5316\u6807\u8bb0\u4e4b\u95f4\u7684\u5173\u7cfb\u3002</p> </li> <li> <p>Pix2Struct \u5f15\u5165\u4e86\u53ef\u53d8\u5206\u8fa8\u7387\u8f93\u5165\u5904\u7406\uff1a\u5b83\u5e76\u4e0d\u662f\u5c06\u6240\u6709\u56fe\u50cf\u7f29\u653e\u5230\u56fa\u5b9a\u5927\u5c0f\uff08\u8fd9\u4f1a\u626d\u66f2\u5bbd\u9ad8\u6bd4\u5e76\u7834\u574f\u7cbe\u7ec6\u6587\u5b57\uff09\uff0c\u800c\u662f\u5728\u4fdd\u6301\u539f\u59cb\u5bbd\u9ad8\u6bd4\u7684\u540c\u65f6\u5c06\u56fe\u50cf\u6253\u5305\u4e3a\u56fa\u5b9a\u6570\u91cf\u7684 patch\u3002\u4e00\u4e2a\u9ad8\u800c\u7a84\u7684\u6587\u6863\u4ea7\u751f\u4e00\u4e2a\u9ad8\u800c\u7a84\u7684 patch \u7f51\u683c\u3002\u8fd9\u5bf9\u4e8e\u6587\u6863\u7406\u89e3\u81f3\u5173\u91cd\u8981\uff0c\u56e0\u4e3a\u5bbd\u9ad8\u6bd4\u643a\u5e26\u7740\u8bed\u4e49\u4fe1\u606f\uff08\u6536\u636e\u7a84\u800c\u9ad8\uff1b\u8868\u683c\u5bbd\u800c\u77ed\uff09\u3002</p> </li> </ul> <p></p> <ul> <li> <p>Nougat\uff08Blecher \u7b49\u4eba\uff0c2023\uff0cMeta\uff09\u5c06 Donut \u67b6\u6784\u4e13\u95e8\u5e94\u7528\u4e8e\u5b66\u672f\u8bba\u6587\uff0c\u76f4\u63a5\u4ece PDF \u9875\u9762\u56fe\u50cf\u751f\u6210\u5b8c\u6574\u7684 LaTeX \u6807\u8bb0\u3002\u5b83\u53ef\u4ee5\u5904\u7406\u590d\u6742\u7684\u6570\u5b66\u65b9\u7a0b\u3001\u8868\u683c\u548c\u56fe\u5f62\u2014\u2014\u8fd9\u4e9b\u4efb\u52a1\u6b63\u662f\u4f20\u7edf OCR \u6d41\u6c34\u7ebf\u96be\u4ee5\u5e94\u4ed8\u7684\u3002\u8be5\u6a21\u578b\u5728 PDF \u9875\u9762\u56fe\u50cf\u53ca\u5176\u5bf9\u5e94\u7684 LaTeX \u6e90\u4ee3\u7801\u5bf9\u4e0a\u8fdb\u884c\u8bad\u7ec3\u3002</p> </li> <li> <p>\u514d OCR \u6a21\u578b\u7684\u6210\u529f\u5c55\u793a\u4e86\u6df1\u5ea6\u5b66\u4e60\u4e2d\u7684\u4e00\u4e2a\u66f4\u5e7f\u6cdb\u539f\u5219\uff1a\u76f4\u63a5\u4ece\u539f\u59cb\u8f93\u5165\uff08\u50cf\u7d20\uff09\u5b66\u4e60\u7684\u7aef\u5230\u7aef\u6a21\u578b\u901a\u5e38\u4f18\u4e8e\u590d\u6742\u7684\u591a\u9636\u6bb5\u6d41\u6c34\u7ebf\uff0c\u56e0\u4e3a\u5b83\u4eec\u53ef\u4ee5\u8054\u5408\u4f18\u5316\u6240\u6709\u7ec4\u4ef6\uff0c\u5e76\u5b66\u4e60\u4e13\u95e8\u9488\u5bf9\u6700\u7ec8\u4efb\u52a1\u5b9a\u5236\u7684\u8868\u793a\u3002\u4e2d\u95f4\u7684 OCR \u6b65\u9aa4\u662f\u4e00\u4e2a\u74f6\u9888\uff0c\u9650\u5236\u4e86\u6a21\u578b\u80fd\u591f\u5b66\u4e60\u7684\u5185\u5bb9\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/02.%20vision%20language%20models/#token","title":"\u89c6\u89c9 Token \u6d41\u6c34\u7ebf","text":"<ul> <li> <p>\u65e0\u8bba\u67b6\u6784\u5bb6\u65cf\u5982\u4f55\uff0c\u6bcf\u4e2a VLM \u90fd\u5fc5\u987b\u5c06\u56fe\u50cf\u8f6c\u6362\u4e3a\u8bed\u8a00\u6a21\u578b\u53ef\u4ee5\u5904\u7406\u7684\u4e00\u7cfb\u5217 token\u3002\u7406\u89e3\u8fd9\u4e00\u6d41\u6c34\u7ebf\u81f3\u5173\u91cd\u8981\u3002\u4e0d\u540c\u6a21\u578b\u7684\u5904\u7406\u8fc7\u7a0b\u6709\u6240\u5dee\u5f02\uff0c\u4f46\u603b\u4f53\u6d41\u7a0b\u5982\u4e0b\uff1a</p> </li> <li> <p>\u7b2c 1 \u6b65\uff1aPatch \u63d0\u53d6\u3002 \u56fe\u50cf\uff08\u9ad8\u5ea6 \\(H\\)\uff0c\u5bbd\u5ea6 \\(W\\)\uff09\u88ab\u5212\u5206\u4e3a\u4e0d\u91cd\u53e0\u7684\u3001\u5927\u5c0f\u4e3a \\(P \\times P\\) \u7684 patch\uff0c\u4ea7\u751f \\(N = HW / P^2\\) \u4e2a patch\u3002\u5bf9\u4e8e 336x336 \u56fe\u50cf\u548c 14x14 patch\uff0c\\(N = 576\\)\u3002</p> </li> <li> <p>\u7b2c 2 \u6b65\uff1a\u89c6\u89c9\u7f16\u7801\u3002 \u6bcf\u4e2a patch \u7ecf\u8fc7\u7ebf\u6027\u6295\u5f71\u5e76\u901a\u8fc7\u89c6\u89c9\u7f16\u7801\u5668\uff08\u901a\u5e38\u662f ViT\uff09\u3002\u8f93\u51fa\u662f\u4e00\u7cfb\u5217\u4e0a\u4e0b\u6587 patch \u5d4c\u5165 \\(V = [v_1, \\ldots, v_N] \\in \\mathbb{R}^{N \\times d_v}\\)\u3002\u8fd9\u4e9b\u5d4c\u5165\u65e2\u643a\u5e26\u5c40\u90e8\u5916\u89c2\u4fe1\u606f\uff0c\u4e5f\u643a\u5e26\u5168\u5c40\u4e0a\u4e0b\u6587\uff08\u6765\u81ea\u81ea\u6ce8\u610f\u529b\uff09\u3002</p> </li> <li> <p>\u7b2c 3 \u6b65\uff1aToken \u538b\u7f29\uff08\u53ef\u9009\uff09\u3002 \u4e00\u4e9b\u6a21\u578b\u5c06 \\(N\\) \u4e2a\u89c6\u89c9 token \u538b\u7f29\u4e3a\u66f4\u5c11\u7684 \\(M \\ll N\\) \u4e2a token\uff0c\u4ee5\u51cf\u5c11\u8bed\u8a00\u6a21\u578b\u7684\u8ba1\u7b97\u8d1f\u62c5\u3002Flamingo \u4f7f\u7528 Perceiver \u91cd\u91c7\u6837\u5668\uff08\\(M = 64\\)\uff09\uff1bQwen-VL \u4f7f\u7528\u4ea4\u53c9\u6ce8\u610f\u529b\uff08\\(M = 256\\)\uff09\uff1bQ-Former\uff08\u5728 BLIP-2 \u4e2d\u4f7f\u7528\uff0cLi \u7b49\u4eba\uff0c2023\uff09\u4f7f\u7528\u4e00\u7ec4 \\(M = 32\\) \u4e2a\u53ef\u5b66\u4e60\u67e5\u8be2 token\uff0c\u5bf9\u89c6\u89c9\u7f16\u7801\u5668\u7684\u8f93\u51fa\u6267\u884c\u4ea4\u53c9\u6ce8\u610f\u529b\u3002</p> </li> <li> <p>\u7b2c 4 \u6b65\uff1a\u6295\u5f71\u3002 \u89c6\u89c9 token\uff08\u5168\u90e8\u6216\u538b\u7f29\u540e\u7684\u96c6\u5408\uff09\u901a\u8fc7\u7ebf\u6027\u5c42\u6216 MLP \u6295\u5f71\u5230\u8bed\u8a00\u6a21\u578b\u7684\u5d4c\u5165\u7a7a\u95f4\u3002\u6295\u5f71\u540e\uff0c\u89c6\u89c9 token \u4e0e\u6587\u672c token \u5d4c\u5165\u5177\u6709\u76f8\u540c\u7ef4\u5ea6\uff0c\u53ef\u4ee5\u4e0e\u5b83\u4eec\u62fc\u63a5\u3002</p> </li> <li> <p>\u7b2c 5 \u6b65\uff1a\u6ce8\u5165 LLM\u3002 \u6295\u5f71\u540e\u7684\u89c6\u89c9 token \u5728\u7279\u6b8a <code>&lt;image&gt;</code> \u5360\u4f4d\u7b26 token \u7684\u4f4d\u7f6e\u63d2\u5165\u5230 token \u5e8f\u5217\u4e2d\uff0c\u7ec4\u5408\u540e\u7684\u5e8f\u5217\u7531\u8bed\u8a00\u6a21\u578b\u5904\u7406\u3002LLM \u7684\u81ea\u6ce8\u610f\u529b\u4f7f\u6587\u672c token \u80fd\u591f\u5173\u6ce8\u89c6\u89c9 token\uff0c\u53cd\u4e4b\u4ea6\u7136\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u89c6\u89c9 token \u7684\u6570\u91cf\u76f4\u63a5\u5f71\u54cd\u8ba1\u7b97\u6210\u672c\u3002\u6bcf\u4e2a\u89c6\u89c9 token \u53c2\u4e0e LLM \u7684\u81ea\u6ce8\u610f\u529b\uff0c\u5176\u590d\u6742\u5ea6\u4e0e\u5e8f\u5217\u957f\u5ea6\u7684\u5e73\u65b9\u6210\u6b63\u6bd4\u3002\u5177\u6709\u591a\u4e2a patch \u7684\u9ad8\u5206\u8fa8\u7387\u56fe\u50cf\u53ef\u80fd\u4ea7\u751f\u6570\u767e\u6216\u6570\u5343\u4e2a\u89c6\u89c9 token\uff0c\u5360\u636e LLM \u4e0a\u4e0b\u6587\u7a97\u53e3\u7684\u4e3b\u5bfc\u5730\u4f4d\u3002\u8fd9\u5c31\u662f token \u538b\u7f29\u7684\u91cd\u8981\u6027\u6240\u5728\uff1a\u5c06 576 \u4e2a\u89c6\u89c9 token \u51cf\u5c11\u5230 64 \u4e2a\uff0c\u53ef\u5c06\u89c6\u89c9\u90e8\u5206\u5728\u6ce8\u610f\u529b\u4e2d\u7684\u8d21\u732e\u51cf\u5c11\u7ea6 9 \u500d\u3002</p> </li> <li> <p>BLIP-2\uff08Li \u7b49\u4eba\uff0c2023\uff09\u4ee5\u5176\u9ad8\u6548\u7684\u6865\u63a5\u7b56\u7565\u800c\u95fb\u540d\u3002\u5b83\u5f15\u5165\u4e86\u4e00\u4e2a\u8f7b\u91cf\u7ea7\u7684 Q-Former\uff08\u4e00\u4e2a\u5e26\u6709\u53ef\u5b66\u4e60\u67e5\u8be2\u7684\u5c0f\u578b Transformer\uff09\uff0c\u4f4d\u4e8e\u51bb\u7ed3\u7684\u89c6\u89c9\u7f16\u7801\u5668\u548c\u51bb\u7ed3\u7684 LLM \u4e4b\u95f4\u3002Q-Former \u662f\u552f\u4e00\u53ef\u8bad\u7ec3\u7684\u7ec4\u4ef6\u2014\u2014\u89c6\u89c9\u7f16\u7801\u5668\u548c LLM \u90fd\u4fdd\u6301\u51bb\u7ed3\u3002\u5b83\u7684\u9884\u8bad\u7ec3\u5206\u4e3a\u4e24\u4e2a\u9636\u6bb5\uff1a\u9996\u5148\u662f\u56fe\u50cf-\u6587\u672c\u5bf9\u6bd4\u5b66\u4e60\u3001\u5339\u914d\u548c\u63cf\u8ff0\u76ee\u6807\uff08\u8fde\u63a5\u89c6\u89c9\u7f16\u7801\u5668\uff09\uff0c\u7136\u540e\u662f\u8bed\u8a00\u751f\u6210\u76ee\u6807\uff08\u8fde\u63a5 LLM\uff09\u3002\u8fd9\u79cd\u6a21\u5757\u5316\u8bbe\u8ba1\u4f7f\u5f97 BLIP-2 \u53ef\u4ee5\u5c06\u4efb\u4f55\u89c6\u89c9\u7f16\u7801\u5668\u63d2\u5165\u5230\u4efb\u4f55 LLM \u4e2d\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/02.%20vision%20language%20models/#_9","title":"\u8bad\u7ec3\u76ee\u6807","text":"<ul> <li> <p>VLM \u4f7f\u7528\u591a\u79cd\u76ee\u6807\u7684\u7ec4\u5408\u8fdb\u884c\u8bad\u7ec3\uff0c\u5177\u4f53\u53d6\u51b3\u4e8e\u67b6\u6784\u6a21\u5f0f\uff1a</p> </li> <li> <p>\u56fe\u50cf-\u6587\u672c\u5bf9\u6bd4\u635f\u5931\uff08ITC\uff09\uff1a \u5728\u5171\u4eab\u5d4c\u5165\u7a7a\u95f4\u4e2d\u5bf9\u9f50\u56fe\u50cf\u548c\u6587\u672c\u8868\u793a\uff0c\u5982 CLIP \u4e2d\u6240\u793a\u3002\u8fd9\u662f\u53cc\u7f16\u7801\u5668\u7684\u4e3b\u8981\u76ee\u6807\uff0c\u4e5f\u5e38\u88ab\u7528\u4f5c\u878d\u5408\u6a21\u578b\u7684\u9884\u8bad\u7ec3\u76ee\u6807\u3002\u8be5\u635f\u5931\u5c31\u662f\u4e0a\u4e00\u7bc7\u6587\u4ef6\u4e2d\u7684 InfoNCE \u635f\u5931\u3002</p> </li> <li> <p>\u56fe\u50cf-\u6587\u672c\u5339\u914d\uff08ITM\uff09\uff1a \u4e00\u4e2a\u4e8c\u5206\u7c7b\u76ee\u6807\u2014\u2014\u7ed9\u5b9a\u56fe\u50cf\u548c\u6587\u672c\uff0c\u9884\u6d4b\u5b83\u4eec\u662f\u5426\u5339\u914d\u3002\u56f0\u96be\u8d1f\u6837\u672c\uff08\u4e0e\u4e0d\u540c\u56fe\u50cf\u914d\u5bf9\u7684\u76f8\u4f3c\u6587\u672c\uff09\u4f7f\u8fd9\u9879\u4efb\u52a1\u5177\u6709\u6311\u6218\u6027\uff0c\u8feb\u4f7f\u6a21\u578b\u5b66\u4e60\u7ec6\u7c92\u5ea6\u7684\u5bf9\u9f50\u3002</p> </li> <li> <p>\u8bed\u8a00\u5efa\u6a21\uff08LM\uff09\uff1a \u6807\u51c6\u7684\u81ea\u56de\u5f52\u8bed\u8a00\u5efa\u6a21\u76ee\u6807\u2014\u2014\u7ed9\u5b9a\u4e4b\u524d\u7684\u6240\u6709 token \u9884\u6d4b\u4e0b\u4e00\u4e2a token\u3002\u5bf9\u4e8e VLM\uff0c\"\u4e4b\u524d\u7684 token\" \u5305\u62ec\u89c6\u89c9 token\uff0c\u56e0\u6b64\u6a21\u578b\u5b66\u4e60\u5728\u89c6\u89c9\u8f93\u5165\u6761\u4ef6\u4e0b\u751f\u6210\u6587\u672c\u3002\u8fd9\u662f\u7f16\u7801\u5668-\u89e3\u7801\u5668\u548c\u4ec5\u89e3\u7801\u5668 VLM \u7684\u4e3b\u8981\u76ee\u6807\u3002</p> </li> </ul> \\[\\mathcal{L}_{\\text{LM}} = -\\sum_{t=1}^{T} \\log p(w_t \\mid w_{&lt;t}, V)\\] <ul> <li> <p>\u524d\u7f00\u8bed\u8a00\u5efa\u6a21\uff1a \u4e00\u79cd\u53d8\u4f53\uff0c\u5176\u4e2d\u56fe\u50cf\u548c\u6587\u672c\u524d\u7f00\u4f5c\u4e3a\u4e0a\u4e0b\u6587\u63d0\u4f9b\uff08\u4e0d\u8fdb\u884c\u8bad\u7ec3\uff09\uff0c\u6a21\u578b\u4ec5\u8bad\u7ec3\u751f\u6210\u540e\u7eed\u90e8\u5206\u3002\u8fd9\u7528\u4e8e PaLI \u548c SimVLM \u7b49\u6a21\u578b\u3002</p> </li> <li> <p>\u5927\u591a\u6570\u73b0\u4ee3 VLM \u5728\u9884\u8bad\u7ec3\u671f\u95f4\u7ed3\u5408\u591a\u4e2a\u76ee\u6807\uff08\u4f8b\u5982 BLIP \u4e2d\u7684 ITC + ITM + LM\uff0cCoCa \u4e2d\u7684 ITC + LM\uff09\uff0c\u7136\u540e\u5728\u6307\u4ee4\u6570\u636e\u4e0a\u4f7f\u7528\u7eaf LM \u76ee\u6807\u8fdb\u884c\u5fae\u8c03\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/02.%20vision%20language%20models/#colab-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ol> <li> <p>\u5b9e\u73b0\u4e00\u4e2a\u7b80\u5355\u7684\u57fa\u4e8e\u6ce8\u610f\u529b\u7684\u56fe\u50cf\u63cf\u8ff0\u89e3\u7801\u5668\u3002\u4f7f\u7528\u968f\u673a\u7684\"\u56fe\u50cf\u7279\u5f81\"\u4f5c\u4e3a\u7f16\u7801\u5668\u8f93\u51fa\uff0c\u8bad\u7ec3\u89e3\u7801\u5668\u751f\u6210\u56fa\u5b9a\u7684\u63cf\u8ff0\uff0c\u89c2\u5bdf\u6ce8\u610f\u529b\u6743\u91cd\u5728\u6bcf\u4e2a\u89e3\u7801\u6b65\u9aa4\u5982\u4f55\u8de8\u7a7a\u95f4\u4f4d\u7f6e\u79fb\u52a8\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u6a21\u62df 4x4 \u7a7a\u95f4\u7f51\u683c\u7684\u56fe\u50cf\u7279\u5f81\uff0816 \u4e2a\u533a\u57df\uff0cdim=32\uff09\nkey = jax.random.PRNGKey(42)\nk1, k2, k3 = jax.random.split(key, 3)\nimg_features = jax.random.normal(k1, (16, 32))  # 16 \u4e2a\u7a7a\u95f4\u533a\u57df\uff0c32 \u7ef4\n\n# \u8bcd\u6c47\u8868\uff1a0=&lt;start&gt;, 1=\"a\", 2=\"red\", 3=\"car\", 4=&lt;end&gt;\nvocab_size, embed_dim, hidden_dim = 5, 16, 32\nW_embed = jax.random.normal(k2, (vocab_size, embed_dim)) * 0.1\nW_attn_q = jax.random.normal(k3, (hidden_dim, 32)) * 0.1  # \u67e5\u8be2\u6295\u5f71\n\ndef attend(h, img_feats, W_q):\n    \"\"\"\u5728\u7ed9\u5b9a\u89e3\u7801\u5668\u72b6\u6001 h \u7684\u60c5\u51b5\u4e0b\u8ba1\u7b97\u56fe\u50cf\u7279\u5f81\u4e0a\u7684\u8f6f\u6ce8\u610f\u529b\u3002\"\"\"\n    query = h @ W_q  # (32,)\n    scores = img_feats @ query  # (16,)\n    weights = jax.nn.softmax(scores)  # (16,)\n    context = weights @ img_feats  # (32,)\n    return context, weights\n\n# \u7b80\u5355\u7684 GRU \u98ce\u683c\u6b65\u9aa4\uff08\u4e3a\u8bf4\u660e\u76ee\u7684\uff0c\u4ec5\u7528\u7ebf\u6027 + tanh\uff09\nW_h = jax.random.normal(jax.random.PRNGKey(0), (embed_dim + 32, hidden_dim)) * 0.1\n\ndef decode_step(h, word_idx, img_feats):\n    context, attn_weights = attend(h, img_feats, W_attn_q)\n    word_emb = W_embed[word_idx]  # (16,)\n    inp = jnp.concatenate([word_emb, context])  # (48,)\n    h_new = jnp.tanh(inp @ W_h)  # (32,)\n    return h_new, attn_weights\n\n# \u8fd0\u884c\u89e3\u7801\u5e8f\u5217\uff1a&lt;start&gt; -&gt; \"a\" -&gt; \"red\" -&gt; \"car\" -&gt; &lt;end&gt;\ntarget_seq = [0, 1, 2, 3, 4]\nh = jnp.zeros(hidden_dim)\nall_attn = []\nfor word_idx in target_seq[:-1]:\n    h, attn_w = decode_step(h, word_idx, img_features)\n    all_attn.append(attn_w)\n\n# \u53ef\u89c6\u5316\u6bcf\u4e00\u6b65\u7684\u6ce8\u610f\u529b\u56fe\uff08\u91cd\u5851\u4e3a 4x4 \u7f51\u683c\uff09\nwords = [\"&lt;start&gt;\", \"a\", \"red\", \"car\"]\nfig, axes = plt.subplots(1, 4, figsize=(14, 3))\nfor i, (ax, w) in enumerate(zip(axes, words)):\n    ax.imshow(all_attn[i].reshape(4, 4), cmap='viridis')\n    ax.set_title(f'\u751f\u6210\"{w}\"\u540e\\n\u5173\u6ce8\u7684\u533a\u57df')\n    ax.axis('off')\nplt.suptitle('\u6bcf\u4e2a\u89e3\u7801\u6b65\u9aa4\u7684\u56fe\u50cf\u533a\u57df\u6ce8\u610f\u529b')\nplt.tight_layout(); plt.show()\n# \u5c1d\u8bd5\u4fee\u6539 img_features\uff0c\u89c2\u5bdf\u6ce8\u610f\u529b\u6a21\u5f0f\u5982\u4f55\u53d8\u5316\uff01\n</code></pre></p> </li> <li> <p>\u6a21\u62df\u89c6\u89c9 token \u6d41\u6c34\u7ebf\uff1a\u5c06\u56fe\u50cf\u5212\u5206\u4e3a patch\uff0c\u5c06 patch \u6295\u5f71\u5230\u5d4c\u5165\u7a7a\u95f4\uff0c\u4e0e\u6587\u672c token \u5d4c\u5165\u62fc\u63a5\uff0c\u5e76\u5728\u7ec4\u5408\u5e8f\u5217\u4e0a\u8fd0\u884c\u5355\u5c42\u81ea\u6ce8\u610f\u529b\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\nkey = jax.random.PRNGKey(7)\n\n# \u521b\u5efa\u4e00\u4e2a\u5408\u6210\u7684 8x8 \"\u56fe\u50cf\"\uff0c3 \u4e2a\u901a\u9053\nk1, k2, k3, k4 = jax.random.split(key, 4)\nimage = jax.random.uniform(k1, (8, 8, 3))\n\n# \u7b2c 1 \u6b65\uff1a\u5212\u5206\u4e3a 4x4 patch -&gt; 4 \u4e2a patch\npatch_size = 4\npatches = image.reshape(2, patch_size, 2, patch_size, 3)\npatches = patches.transpose(0, 2, 1, 3, 4).reshape(4, patch_size * patch_size * 3)  # (4, 48)\nprint(f\"Patch \u6570\u91cf: {patches.shape[0]}, Patch \u7ef4\u5ea6: {patches.shape[1]}\")\n\n# \u7b2c 2 \u6b65\uff1a\u5c06 patch \u6295\u5f71\u5230\u5d4c\u5165\u7ef4\u5ea6 (d=16)\nd_model = 16\nW_patch = jax.random.normal(k2, (patches.shape[1], d_model)) * 0.1\nvisual_tokens = patches @ W_patch  # (4, 16)\n\n# \u7b2c 3 \u6b65\uff1a\u521b\u5efa\u6587\u672c token \u5d4c\u5165\uff08\u6a21\u62df 3 \u4e2a\u6587\u672c token\uff09\ntext_tokens = jax.random.normal(k3, (3, d_model)) * 0.1\n\n# \u7b2c 4 \u6b65\uff1a\u62fc\u63a5\u89c6\u89c9 + \u6587\u672c token\ncombined = jnp.concatenate([visual_tokens, text_tokens], axis=0)  # (7, 16)\nprint(f\"\u7ec4\u5408\u5e8f\u5217\u957f\u5ea6: {combined.shape[0]} (4 \u4e2a\u89c6\u89c9 + 3 \u4e2a\u6587\u672c)\")\n\n# \u7b2c 5 \u6b65\uff1a\u5728\u7ec4\u5408\u5e8f\u5217\u4e0a\u8fd0\u884c\u5355\u5934\u81ea\u6ce8\u610f\u529b\nW_Q = jax.random.normal(k4, (d_model, d_model)) * 0.1\nk5, k6 = jax.random.split(k4)\nW_K = jax.random.normal(k5, (d_model, d_model)) * 0.1\nW_V = jax.random.normal(k6, (d_model, d_model)) * 0.1\n\nQ = combined @ W_Q\nK = combined @ W_K\nV = combined @ W_V\nattn_scores = (Q @ K.T) / jnp.sqrt(d_model)\nattn_weights = jax.nn.softmax(attn_scores, axis=-1)  # (7, 7)\n\noutput = attn_weights @ V  # (7, 16)\n\n# \u53ef\u89c6\u5316\u8de8\u6a21\u6001\u6ce8\u610f\u529b\u6a21\u5f0f\nlabels = ['V1', 'V2', 'V3', 'V4', 'T1', 'T2', 'T3']\nfig, ax = plt.subplots(figsize=(6, 5))\nim = ax.imshow(attn_weights, cmap='Blues')\nax.set_xticks(range(7)); ax.set_xticklabels(labels)\nax.set_yticks(range(7)); ax.set_yticklabels(labels)\nax.set_xlabel('\u952e'); ax.set_ylabel('\u67e5\u8be2')\nax.set_title('\u81ea\u6ce8\u610f\u529b\uff1a\u89c6\u89c9\uff08V\uff09\u548c\u6587\u672c\uff08T\uff09Token')\nplt.colorbar(im, ax=ax); plt.tight_layout(); plt.show()\n# \u89c2\u5bdf\uff1a\u6587\u672c token \u5173\u6ce8\u89c6\u89c9 token\uff08\u8de8\u6a21\u6001\u6ce8\u610f\u529b\uff09\uff01\n</code></pre></p> </li> <li> <p>\u5b9e\u73b0\u7528\u4e8e\u89c6\u89c9\u5b9a\u4f4d\u7684\u5750\u6807 token \u5316\u3002\u7ed9\u5b9a\u4e00\u4e2a\u8fb9\u754c\u6846\uff0c\u5c06\u5176\u8f6c\u6362\u4e3a\u79bb\u6563 token\uff1b\u7ed9\u5b9a\u79bb\u6563 token\uff0c\u91cd\u6784\u8fb9\u754c\u6846\u3002\u5728\u4e0d\u540c\u69fd\u4f4d\u5206\u8fa8\u7387\u4e0b\u53ef\u89c6\u5316\u91cf\u5316\u8bef\u5dee\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef encode_bbox(bbox, num_bins=1000):\n    \"\"\"\u5c06\u8fde\u7eed\u7684\u8fb9\u754c\u6846 (x, y, w, h)\uff08\u5728 [0,1] \u8303\u56f4\u5185\uff09\u8f6c\u6362\u4e3a\u79bb\u6563 token\u3002\"\"\"\n    tokens = jnp.round(jnp.array(bbox) * (num_bins - 1)).astype(jnp.int32)\n    return tokens\n\ndef decode_bbox(tokens, num_bins=1000):\n    \"\"\"\u5c06\u79bb\u6563 token \u8f6c\u6362\u56de\u8fde\u7eed\u7684\u8fb9\u754c\u6846\u3002\"\"\"\n    return tokens.astype(jnp.float32) / (num_bins - 1)\n\n# \u771f\u5b9e\u8fb9\u754c\u6846\uff08\u5f52\u4e00\u5316\u5230 [0, 1]\uff09\ngt_bbox = jnp.array([0.123, 0.456, 0.333, 0.222])\n\n# \u6d4b\u8bd5\u4e0d\u540c\u69fd\u4f4d\u5206\u8fa8\u7387\u4e0b\u7684\u91cf\u5316\nbin_sizes = [10, 50, 100, 500, 1000]\nerrors = []\nfor n_bins in bin_sizes:\n    tokens = encode_bbox(gt_bbox, n_bins)\n    reconstructed = decode_bbox(tokens, n_bins)\n    error = jnp.max(jnp.abs(gt_bbox - reconstructed))\n    errors.append(float(error))\n    print(f\"\u69fd\u4f4d\u6570={n_bins:&gt;5d} | Token={tokens} | \"\n          f\"\u91cd\u6784={reconstructed} | \u6700\u5927\u8bef\u5dee={error:.6f}\")\n\nfig, ax = plt.subplots(figsize=(8, 4))\nax.plot(bin_sizes, errors, 'o-', color='#e74c3c', linewidth=2, markersize=8)\nax.set_xlabel('\u69fd\u4f4d\u6570'); ax.set_ylabel('\u6700\u5927\u91cf\u5316\u8bef\u5dee')\nax.set_title('\u8fb9\u754c\u6846\u91cf\u5316\u8bef\u5dee vs \u69fd\u4f4d\u5206\u8fa8\u7387')\nax.set_xscale('log'); ax.set_yscale('log')\nax.grid(True, alpha=0.3); plt.tight_layout(); plt.show()\n# \u5c1d\u8bd5\uff1a\u69fd\u4f4d\u975e\u5e38\u5c11\u65f6\uff08\u5982 5\uff09\u4f1a\u53d1\u751f\u4ec0\u4e48\uff1f\u8bef\u5dee\u5728\u4f55\u65f6\u662f\u53ef\u63a5\u53d7\u7684\uff1f\n</code></pre></p> </li> </ol>"},{"location":"chapter%2010%3A%20multimodal%20learning/03.%20image%20and%20video%20tokenisation/","title":"\u56fe\u50cf\u4e0e\u89c6\u9891\u8bcd\u5143\u5316","text":"<p>\u56fe\u50cf\u4e0e\u89c6\u9891\u8bcd\u5143\u5316\u5c06\u8fde\u7eed\u7684\u89c6\u89c9\u6570\u636e\u8f6c\u6362\u4e3a\u79bb\u6563\u7684\u8bcd\u5143\u5e8f\u5217\uff0c\u4f7f Transformer \u80fd\u591f\u50cf\u5904\u7406\u6587\u672c\u4e00\u6837\u5904\u7406\u5b83\u4eec\u3002\u672c\u8282\u6db5\u76d6 VQ-VAE\u3001VQ-GAN\u3001\u7801\u672c\u5b66\u4e60\u3001DALL-E \u7684 dVAE\u3001\u89c6\u9891\u8bcd\u5143\u5316\u4ee5\u53ca\u514d\u67e5\u8be2\u8bcd\u5143\u5316\u3002</p>"},{"location":"chapter%2010%3A%20multimodal%20learning/03.%20image%20and%20video%20tokenisation/#_2","title":"\u4e3a\u4ec0\u4e48\u8981\u5bf9\u56fe\u50cf\u8fdb\u884c\u8bcd\u5143\u5316","text":"<ul> <li> <p>\u628a\u8bed\u8a00\u60f3\u8c61\u6210\u4e00\u4e2a\u6709\u9650\u7684\u5b57\u6bcd\u8868\uff1a\u82f1\u8bed\u5927\u7ea6\u6709 26 \u4e2a\u5b57\u6bcd\uff0c\u73b0\u4ee3\u8bed\u8a00\u6a21\u578b\u5c06\u6587\u672c\u5207\u5206\u4e3a 30,000 \u5230 100,000 \u4e2a\u5b50\u8bcd\u8bcd\u5143\u3002\u6bcf\u4e2a\u53e5\u5b50\u90fd\u53d8\u6210\u4e00\u4e32\u79bb\u6563\u7b26\u53f7\uff0cTransformer \u53ef\u4ee5\u9010\u4e2a\u9884\u6d4b\u3002\u800c\u56fe\u50cf\u5b58\u5728\u4e8e\u8fde\u7eed\u7684\u9ad8\u7ef4\u7a7a\u95f4\u4e2d\uff1a\u4e00\u5f20 256\u00d7256 \u7684 RGB \u56fe\u50cf\u5c31\u662f \\(\\mathbb{R}^{256 \\times 256 \\times 3} \\approx \\mathbb{R}^{196{,}608}\\) \u4e2d\u7684\u4e00\u4e2a\u70b9\u3002\u5982\u679c\u4f60\u5e0c\u671b\u8bed\u8a00\u6a21\u578b\u7528\u4e0e\u8bf4\u82f1\u8bed\u540c\u6837\u7684\u673a\u5236\u6765\"\u8bf4\"\u56fe\u50cf\uff0c\u5c31\u9700\u8981\u5c06\u8fd9\u4e9b\u8fde\u7eed\u7684\u50cf\u7d20\u6570\u7ec4\u8f6c\u6362\u4e3a\u4e00\u4e32\u53ef\u7ba1\u7406\u7684\u79bb\u6563\u8bcd\u5143\uff0c\u8fd9\u4e9b\u8bcd\u5143\u6765\u81ea\u4e00\u4e2a\u6709\u9650\u7684\u8bcd\u6c47\u8868\u3002\u8fd9\u79cd\u8f6c\u6362\u5c31\u662f\u56fe\u50cf\u8bcd\u5143\u5316\u3002</p> </li> <li> <p>\u60f3\u8c61\u4f60\u662f\u4e00\u4f4d\u9a6c\u8d5b\u514b\u827a\u672f\u5bb6\u3002\u4f60\u6ca1\u6709\u65e0\u9650\u591a\u79cd\u74f7\u7816\u8272\u8c03\uff0c\u53ea\u6709\u4e00\u4e2a\u56fa\u5b9a\u7684\u8c03\u8272\u677f\uff0c\u6bd4\u5982\u8bf4 8192 \u79cd\u4e0d\u540c\u7684\u74f7\u7816\u989c\u8272\u3002\u8981\u518d\u73b0\u4e00\u5f20\u7167\u7247\u4f5c\u4e3a\u9a6c\u8d5b\u514b\uff0c\u4f60\u5fc5\u987b (1) \u786e\u5b9a\u6bcf\u4e2a\u74f7\u7816\u4ee3\u8868\u7167\u7247\u7684\u54ea\u4e2a\u533a\u57df\uff0c(2) \u4e3a\u6bcf\u4e2a\u533a\u57df\u9009\u62e9\u6700\u63a5\u8fd1\u7684\u74f7\u7816\u989c\u8272\uff0c(3) \u63a5\u53d7\u4e00\u4e9b\u7ec6\u8282\u7684\u4e22\u5931\uff0c\u4f46\u6574\u4f53\u753b\u9762\u4ecd\u7136\u53ef\u8fa8\u8ba4\u3002\u56fe\u50cf\u8bcd\u5143\u5316\u505a\u7684\u6b63\u662f\u8fd9\u4ef6\u4e8b\uff1a\u7f16\u7801\u5668\u5c06\u7a7a\u95f4\u5757\u538b\u7f29\u4e3a\u6f5c\u5728\u5411\u91cf\uff0c\u7801\u672c\u5c06\u6bcf\u4e2a\u5411\u91cf\u6620\u5c04\u5230\u5176\u6700\u8fd1\u7684\u6761\u76ee\uff0c\u7ed3\u679c\u662f\u4e00\u4e2a\u6574\u6570\u7d22\u5f15\u7f51\u683c\uff08\u6bcf\u4e2a\u5757\u5bf9\u5e94\u4e00\u4e2a\u7d22\u5f15\uff09\uff0c\u79bb\u6563\u6a21\u578b\u53ef\u4ee5\u5904\u7406\u5b83\u3002</p> </li> <li> <p>\u8bcd\u5143\u5316\u7684\u597d\u5904\u6709\u4e09\u65b9\u9762\u3002\u9996\u5148\uff0c\u5b83\u5927\u5e45\u538b\u7f29\u4e86\u56fe\u50cf\uff1a\u4e00\u5f20 256\u00d7256 \u7684\u56fe\u50cf\u53ef\u80fd\u53d8\u6210\u4e00\u4e2a 16\u00d716 \u7684\u8bcd\u5143\u7f51\u683c\uff0c\u5e8f\u5217\u957f\u5ea6\u4ece 65,536 \u4e2a\u50cf\u7d20\u51cf\u5c11\u5230 256 \u4e2a\u8bcd\u5143\uff0c\u8fd9\u5bf9\u4e8e\u6210\u672c\u968f\u5e8f\u5217\u957f\u5ea6\u5448\u4e8c\u6b21\u65b9\u589e\u957f\u7684\u6ce8\u610f\u529b\u6a21\u578b\u6765\u8bf4\u662f\u53ef\u884c\u7684\u3002\u5176\u6b21\uff0c\u5b83\u7edf\u4e00\u4e86\u8868\u793a\u5f62\u5f0f\uff1a\u6587\u672c\u8bcd\u5143\u548c\u56fe\u50cf\u8bcd\u5143\u4f4d\u4e8e\u540c\u4e00\u4e2a\u79bb\u6563\u8bcd\u6c47\u8868\u4e2d\uff0c\u4f7f\u5f97\u5355\u4e2a\u81ea\u56de\u5f52 Transformer \u53ef\u4ee5\u751f\u6210\u4ea4\u7ec7\u7684\u6587\u672c\u548c\u56fe\u50cf\u3002\u7b2c\u4e09\uff0c\u5b83\u65bd\u52a0\u4e86\u4e00\u4e2a\u6709\u7528\u7684\u74f6\u9888\uff0c\u8feb\u4f7f\u6a21\u578b\u5b66\u4e60\u8bed\u4e49\u4e0a\u6709\u610f\u4e49\u7684\u7f16\u7801\uff0c\u800c\u4e0d\u662f\u8bb0\u5fc6\u50cf\u7d20\u566a\u58f0\u3002</p> </li> </ul> <p></p> <ul> <li>\u56de\u987e\u7b2c 8 \u7ae0\u4e2d\u5377\u79ef\u7f51\u7edc\u5982\u4f55\u4ece\u56fe\u50cf\u4e2d\u63d0\u53d6\u5c42\u6b21\u5316\u7279\u5f81\u56fe\uff0c\u4ee5\u53ca\u7b2c 7 \u7ae0\u4e2d\u6587\u672c\u8bcd\u5143\u5316\u5668\u5982\u4f55\u5c06\u5b57\u7b26\u4e32\u8f6c\u6362\u4e3a\u6574\u6570\u5e8f\u5217\u3002\u56fe\u50cf\u8bcd\u5143\u5316\u6b63\u5904\u4e8e\u4e24\u8005\u7684\u4ea4\u6c47\u70b9\uff1a\u5b83\u4f7f\u7528 CNN \u6216\u89c6\u89c9 Transformer \u7f16\u7801\u5668\uff08\u7b2c 8 \u7ae0\uff09\u4ea7\u751f\u7a7a\u95f4\u7279\u5f81\uff0c\u7136\u540e\u501f\u7528\u79bb\u6563\u8bcd\u6c47\u8868\u7684\u601d\u60f3\uff08\u7b2c 7 \u7ae0\uff09\u5c06\u8fd9\u4e9b\u7279\u5f81\u8f6c\u6362\u4e3a\u8bcd\u5143\u7d22\u5f15\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/03.%20image%20and%20video%20tokenisation/#vq-vae","title":"VQ-VAE\uff1a\u5411\u91cf\u91cf\u5316","text":"<ul> <li> <p>\u6b63\u5982\u6211\u4eec\u5728\u7b2c 6 \u7ae0\u4e2d\u770b\u5230\u7684\uff0c\u6807\u51c6\u53d8\u5206\u81ea\u7f16\u7801\u5668\uff08VAE\uff09\u5c06\u8f93\u5165\u7f16\u7801\u4e3a\u8fde\u7eed\u6f5c\u5728\u5206\u5e03\uff0c\u5e76\u4ece\u8be5\u5206\u5e03\u4e2d\u91c7\u6837\u518d\u89e3\u7801\u4e3a\u91cd\u5efa\u7ed3\u679c\u3002\u6f5c\u5728\u7a7a\u95f4\u662f\u8fde\u7eed\u7684\uff0c\u8fd9\u4f7f\u5f97\u5c06\u5176\u8f93\u5165\u79bb\u6563\u5e8f\u5217\u6a21\u578b\u53d8\u5f97\u56f0\u96be\u3002\u5411\u91cf\u91cf\u5316\u53d8\u5206\u81ea\u7f16\u7801\u5668\uff08VQ-VAE\uff09\uff0c\u7531 van den Oord \u7b49\u4eba\uff082017\uff09\u63d0\u51fa\uff0c\u901a\u8fc7\u5f15\u5165\u4e00\u4e2a\u53ef\u5b66\u4e60\u7684\u5d4c\u5165\u5411\u91cf\u7801\u672c\uff0c\u5e76\u5c06\u6bcf\u4e2a\u7f16\u7801\u5668\u8f93\u51fa\u6620\u5c04\u5230\u5176\u6700\u8fd1\u7684\u7801\u672c\u6761\u76ee\uff0c\u7528\u79bb\u6563\u6f5c\u5728\u8868\u793a\u53d6\u4ee3\u4e86\u8fde\u7eed\u6f5c\u5728\u8868\u793a\u3002</p> </li> <li> <p>\u60f3\u8c61\u4e00\u4e2a\u85cf\u4e66\u5ba4\uff0c\u91cc\u9762\u6709\u6070\u597d \\(K\\) \u4e2a\u8d34\u6709\u6807\u7b7e\u7684\u4e66\u67b6\u3002\u5f53\u4e00\u672c\u65b0\u4e66\uff08\u7f16\u7801\u5668\u8f93\u51fa\uff09\u5230\u8fbe\u65f6\uff0c\u56fe\u4e66\u7ba1\u7406\u5458\u5c06\u5b83\u653e\u5728\u4e0e\u5176\u73b0\u6709\u4e66\u7c4d\uff08\u7801\u672c\u5411\u91cf\uff09\u6700\u76f8\u4f3c\u7684\u4e66\u67b6\u4e0a\uff0c\u5e76\u8bb0\u5f55\u4e0b\u4e66\u67b6\u7f16\u53f7\u3002\u4e4b\u540e\uff0c\u8981\u53d6\u56de\u8fd9\u672c\u4e66\uff0c\u4f60\u53ea\u9700\u8981\u4e66\u67b6\u7f16\u53f7\uff1a\u90a3\u4e2a\u4e66\u67b6\u4e0a\u7684\u7801\u672c\u6761\u76ee\u5c31\u662f\u4e00\u4e2a\u8db3\u591f\u597d\u7684\u66ff\u4ee3\u3002\u8fd9\u5c31\u662f\u5411\u91cf\u91cf\u5316\u3002</p> </li> <li> <p>\u5f62\u5f0f\u4e0a\uff0cVQ-VAE \u6709\u4e09\u4e2a\u7ec4\u4ef6\uff1a</p> <ul> <li> <p>\u7f16\u7801\u5668 \\(E\\)\uff0c\u5c06\u8f93\u5165\u56fe\u50cf \\(\\mathbf{x} \\in \\mathbb{R}^{H \\times W \\times 3}\\) \u6620\u5c04\u5230\u8fde\u7eed\u6f5c\u5728\u5411\u91cf\u7684\u7a7a\u95f4\u7f51\u683c \\(\\mathbf{z}_e = E(\\mathbf{x}) \\in \\mathbb{R}^{h \\times w \\times d}\\)\uff0c\u5176\u4e2d \\(h \\times w\\) \u662f\u964d\u91c7\u6837\u540e\u7684\u7a7a\u95f4\u5206\u8fa8\u7387\uff0c\\(d\\) \u662f\u5d4c\u5165\u7ef4\u5ea6\u3002</p> </li> <li> <p>\u7801\u672c \\(\\mathcal{C} = \\{\\mathbf{e}_1, \\mathbf{e}_2, \\ldots, \\mathbf{e}_K\\} \\subset \\mathbb{R}^d\\)\uff0c\u5305\u542b \\(K\\) \u4e2a\u53ef\u5b66\u4e60\u7684\u5d4c\u5165\u5411\u91cf\u3002\u5178\u578b\u7801\u672c\u5927\u5c0f\u8303\u56f4\u4e3a 512 \u5230 16,384 \u4e2a\u6761\u76ee\u3002</p> </li> <li> <p>\u89e3\u7801\u5668 \\(D\\)\uff0c\u4ece\u91cf\u5316\u540e\u7684\u6f5c\u5728\u8868\u793a\u91cd\u5efa\u56fe\u50cf\u3002</p> </li> </ul> </li> <li> <p>\u91cf\u5316\u6b65\u9aa4\u5c06\u6bcf\u4e2a\u7f16\u7801\u5668\u8f93\u51fa \\(\\mathbf{z}_e(\\mathbf{x})\\) \u5728\u7a7a\u95f4\u4f4d\u7f6e \\((i, j)\\) \u5904\u66ff\u6362\u4e3a\u6700\u8fd1\u7684\u7801\u672c\u6761\u76ee\uff1a</p> </li> </ul> \\[\\mathbf{z}_q(i,j) = \\mathbf{e}_{k^\\ast} \\quad \\text{\u5176\u4e2d} \\quad k^\\ast = \\arg\\min_k \\|\\mathbf{z}_e(i,j) - \\mathbf{e}_k\\|_2\\] <ul> <li>\u8fd9\u662f\u5728\u5d4c\u5165\u7a7a\u95f4\u4e2d\u7684\u6700\u8fd1\u90bb\u67e5\u627e\uff0c\u4e0e k-means \u5206\u914d\uff08\u7b2c 6 \u7ae0\uff09\u5b8c\u5168\u76f8\u540c\u3002\u7d22\u5f15 \\(k^\\ast\\) \u662f\u7a7a\u95f4\u4f4d\u7f6e \\((i,j)\\) \u7684\u79bb\u6563\u8bcd\u5143\uff0c\u6574\u5f20\u56fe\u50cf\u88ab\u8868\u793a\u4e3a\u4e00\u4e2a \\(h \\times w\\) \u7684\u6574\u6570\u7f51\u683c\uff0c\u53d6\u503c\u8303\u56f4\u4e3a \\(\\{1, \\ldots, K\\}\\)\u3002</li> </ul> <p></p> <ul> <li>\u6311\u6218\u5728\u4e8e \\(\\arg\\min\\) \u662f\u4e0d\u53ef\u5fae\u7684\uff1a\u4f60\u65e0\u6cd5\u901a\u8fc7\u79bb\u6563\u9009\u62e9\u8fdb\u884c\u53cd\u5411\u4f20\u64ad\u3002VQ-VAE \u901a\u8fc7\u76f4\u901a\u4f30\u8ba1\u5668\u89e3\u51b3\u4e86\u8fd9\u4e2a\u95ee\u9898\uff1a\u5728\u524d\u5411\u4f20\u64ad\u8fc7\u7a0b\u4e2d\uff0c\u89e3\u7801\u5668\u63a5\u6536 \\(\\mathbf{z}_q\\)\uff08\u91cf\u5316\u540e\u7684\u5411\u91cf\uff09\uff1b\u5728\u53cd\u5411\u4f20\u64ad\u8fc7\u7a0b\u4e2d\uff0c\u91cd\u5efa\u635f\u5931\u76f8\u5bf9\u4e8e \\(\\mathbf{z}_q\\) \u7684\u68af\u5ea6\u88ab\u76f4\u63a5\u590d\u5236\u5230 \\(\\mathbf{z}_e\\)\uff0c\u5c31\u597d\u50cf\u91cf\u5316\u6b65\u9aa4\u662f\u6052\u7b49\u51fd\u6570\u4e00\u6837\u3002\u8fd9\u53ef\u4ee5\u7b80\u6d01\u5730\u5199\u4e3a\uff1a</li> </ul> \\[\\mathbf{z}_q = \\mathbf{z}_e + \\text{sg}(\\mathbf{z}_q - \\mathbf{z}_e)\\] <ul> <li> <p>\u5176\u4e2d \\(\\text{sg}(\\cdot)\\) \u662f\u505c\u6b62\u68af\u5ea6\u7b97\u5b50\u3002\u5728\u524d\u5411\u4f20\u64ad\u4e2d\uff0c\u8ba1\u7b97\u7ed3\u679c\u4e3a \\(\\mathbf{z}_q\\)\uff1b\u5728\u53cd\u5411\u4f20\u64ad\u4e2d\uff0c\u68af\u5ea6\u4ec5\u6d41\u7ecf \\(\\mathbf{z}_e\\) \u9879\u3002</p> </li> <li> <p>\u5b8c\u6574\u7684 VQ-VAE \u635f\u5931\u5305\u542b\u4e09\u9879\uff1a</p> </li> </ul> \\[\\mathcal{L} = \\underbrace{\\|\\mathbf{x} - D(\\mathbf{z}_q)\\|_2^2}_{\\text{\u91cd\u5efa\u635f\u5931}} + \\underbrace{\\|\\text{sg}(\\mathbf{z}_e) - \\mathbf{e}\\|_2^2}_{\\text{\u7801\u672c\uff08VQ\uff09\u635f\u5931}} + \\underbrace{\\beta \\|\\mathbf{z}_e - \\text{sg}(\\mathbf{e})\\|_2^2}_{\\text{\u627f\u8bfa\u635f\u5931}}\\] <ul> <li> <p>\u91cd\u5efa\u635f\u5931\u8bad\u7ec3\u7f16\u7801\u5668\u548c\u89e3\u7801\u5668\u5fe0\u5b9e\u5730\u518d\u73b0\u8f93\u5165\u3002\u7801\u672c\u635f\u5931\uff08\u4e5f\u79f0\u4e3a VQ \u635f\u5931\uff09\u5c06\u7801\u672c\u5411\u91cf\u62c9\u5411\u7f16\u7801\u5668\u8f93\u51fa\uff1b\u6ce8\u610f \\(\\text{sg}(\\mathbf{z}_e)\\) \u610f\u5473\u7740\u7f16\u7801\u5668\u4e0d\u4f1a\u4ece\u8fd9\u4e00\u9879\u63a5\u6536\u68af\u5ea6\uff0c\u56e0\u6b64\u5b83\u53ea\u66f4\u65b0\u7801\u672c\u3002\u627f\u8bfa\u635f\u5931\u5219\u76f8\u53cd\uff1a\u5b83\u9f13\u52b1\u7f16\u7801\u5668\u8f93\u51fa\u4fdd\u6301\u63a5\u8fd1\u7801\u672c\u5411\u91cf\uff0c\u9632\u6b62\u7f16\u7801\u5668\"\u8fdc\u79bb\"\u7801\u672c\u3002\u8d85\u53c2\u6570 \\(\\beta\\)\uff08\u901a\u5e38\u4e3a 0.25\uff09\u63a7\u5236\u7801\u672c\u635f\u5931\u548c\u627f\u8bfa\u635f\u5931\u4e4b\u95f4\u7684\u5e73\u8861\u3002</p> </li> <li> <p>\u5728\u5b9e\u8df5\u4e2d\uff0c\u7801\u672c\u901a\u5e38\u4f7f\u7528\u6307\u6570\u79fb\u52a8\u5e73\u5747\uff08EMA\uff09\u800c\u4e0d\u662f\u68af\u5ea6\u4e0b\u964d\u6765\u66f4\u65b0\uff0c\u8fd9\u6837\u66f4\u7a33\u5b9a\u3002\u4ee4 \\(\\mathbf{n}_k\\) \u4e3a\u5206\u914d\u7ed9\u7801\u672c\u6761\u76ee \\(k\\) \u7684\u7f16\u7801\u5668\u8f93\u51fa\u8ba1\u6570\uff0c\\(\\mathbf{s}_k\\) \u4e3a\u5b83\u4eec\u7684\u548c\u3002EMA \u66f4\u65b0\u4e3a\uff1a</p> </li> </ul> \\[\\mathbf{n}_k \\leftarrow \\gamma \\mathbf{n}_k + (1 - \\gamma) |\\{(i,j) : k^\\ast_{ij} = k\\}|\\] \\[\\mathbf{s}_k \\leftarrow \\gamma \\mathbf{s}_k + (1 - \\gamma) \\sum_{(i,j) : k^\\ast_{ij} = k} \\mathbf{z}_e(i,j)\\] \\[\\mathbf{e}_k \\leftarrow \\frac{\\mathbf{s}_k}{\\mathbf{n}_k}\\] <ul> <li>\u5176\u4e2d \\(\\gamma\\) \u662f\u8870\u51cf\u7387\uff08\u901a\u5e38\u4e3a 0.99\uff09\u3002\u8fd9\u7b49\u4ef7\u4e8e\u5bf9\u7f16\u7801\u5668\u8f93\u51fa\u8fd0\u884c\u5728\u7ebf k-means \u7b97\u6cd5\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/03.%20image%20and%20video%20tokenisation/#_3","title":"\u7801\u672c\u574d\u584c","text":"<ul> <li> <p>VQ-VAE \u4e00\u4e2a\u81ed\u540d\u662d\u8457\u7684\u5931\u8d25\u6a21\u5f0f\u662f\u7801\u672c\u574d\u584c\uff08\u4e5f\u79f0\u4e3a\u7d22\u5f15\u574d\u584c\uff09\uff1a\u6a21\u578b\u53ea\u5b66\u4f1a\u4f7f\u7528 \\(K\\) \u4e2a\u7801\u672c\u6761\u76ee\u4e2d\u7684\u4e00\u5c0f\u90e8\u5206\uff0c\u5bfc\u81f4\u5927\u591a\u6570\u6761\u76ee\"\u6b7b\u4ea1\"\u3002\u60f3\u8c61\u4e00\u4e2a\u56fe\u4e66\u9986\uff0c90% \u7684\u4e66\u67b6\u662f\u7a7a\u7684\uff0c\u56e0\u4e3a\u56fe\u4e66\u7ba1\u7406\u5458\u603b\u662f\u628a\u4e66\u9001\u5230\u540c\u6837\u7684\u51e0\u4e2a\u70ed\u95e8\u4e66\u67b6\u4e0a\u3002\u8fd9\u6d6a\u8d39\u4e86\u8868\u793a\u80fd\u529b\u3002</p> </li> <li> <p>\u7801\u672c\u574d\u584c\u7684\u53d1\u751f\u662f\u56e0\u4e3a\u7f16\u7801\u5668\u3001\u7801\u672c\u548c\u89e3\u7801\u5668\u5728\u8bad\u7ec3\u8fc7\u7a0b\u4e2d\u5171\u540c\u9002\u5e94\u3002\u5982\u679c\u4e00\u4e2a\u6761\u76ee\u5728\u51e0\u4e2a\u6279\u6b21\u4e2d\u90fd\u6ca1\u6709\u88ab\u9009\u4e2d\uff0c\u5b83\u5c31\u4f1a\u6f02\u79bb\u7f16\u7801\u5668\u6d41\u5f62\uff0c\u4f7f\u5176\u66f4\u4e0d\u53ef\u80fd\u88ab\u9009\u4e2d\uff0c\u4ece\u800c\u5f62\u6210\u6b63\u53cd\u9988\u5faa\u73af\u3002</p> </li> <li> <p>\u7f13\u89e3\u7801\u672c\u574d\u584c\u7684\u51e0\u79cd\u6280\u672f\uff1a</p> <ul> <li>\u7801\u672c\u91cd\u7f6e\uff1a\u5b9a\u671f\u901a\u8fc7\u968f\u673a\u91c7\u6837\u7f16\u7801\u5668\u8f93\u51fa\u91cd\u65b0\u521d\u59cb\u5316\u6b7b\u4ea1\u6761\u76ee\u3002\u8fd9\u4e3a\u6b7b\u4ea1\u6761\u76ee\u5728\u6f5c\u5728\u7a7a\u95f4\u6d3b\u8dc3\u533a\u57df\u9644\u8fd1\u63d0\u4f9b\u4e86\u4e00\u4e2a\u65b0\u7684\u8d77\u70b9\u3002</li> <li>\u5e26\u62c9\u666e\u62c9\u65af\u5e73\u6ed1\u7684 EMA \u66f4\u65b0\uff1a\u5411 \\(\\mathbf{n}_k\\) \u6dfb\u52a0\u4e00\u4e2a\u5c0f\u5e38\u6570\uff0c\u9632\u6b62\u4efb\u4f55\u6761\u76ee\u8ba1\u6570\u4e3a\u96f6\uff0c\u786e\u4fdd\u6240\u6709\u6761\u76ee\u90fd\u80fd\u63a5\u6536\u5230\u68af\u5ea6\u4fe1\u53f7\u3002</li> <li>\u627f\u8bfa\u635f\u5931\u8c03\u4f18\uff1a\u589e\u5927 \\(\\beta\\) \u8feb\u4f7f\u7f16\u7801\u5668\u8f93\u51fa\u66f4\u7d27\u5bc6\u5730\u805a\u96c6\u5728\u7801\u672c\u6761\u76ee\u5468\u56f4\uff0c\u4f7f\u5206\u914d\u66f4\u5747\u5300\u3002</li> <li>\u5206\u89e3\u7f16\u7801\uff1a\u5c06\u7801\u672c\u67e5\u627e\u5206\u89e3\u4e3a\u591a\u4e2a\u8f83\u5c0f\u67e5\u627e\u7684\u4e58\u79ef\uff08\u4f8b\u5982\uff0c\u4e24\u4e2a\u5927\u5c0f\u5404\u4e3a \\(\\sqrt{K}\\) \u7684\u7801\u672c\uff09\uff0c\u901a\u8fc7\u51cf\u5c11\u6bcf\u6b21\u67e5\u627e\u7684\u6709\u6548\u7801\u672c\u5927\u5c0f\u6765\u63d0\u9ad8\u5229\u7528\u7387\u3002</li> <li>\u71b5\u6b63\u5219\u5316\uff1a\u6dfb\u52a0\u4e00\u4e2a\u60e9\u7f5a\u9879\uff0c\u9f13\u52b1\u7801\u672c\u4f7f\u7528\u4e0a\u7684\u5747\u5300\u5206\u5e03\uff0c\u6700\u5927\u5316\u71b5 \\(H = -\\sum_k p_k \\log p_k\\)\uff0c\u5176\u4e2d \\(p_k\\) \u662f\u7ecf\u9a8c\u5206\u914d\u6982\u7387\u3002</li> </ul> </li> </ul> <p></p>"},{"location":"chapter%2010%3A%20multimodal%20learning/03.%20image%20and%20video%20tokenisation/#vq-gan","title":"VQ-GAN\uff1a\u5bf9\u6297\u8bad\u7ec3\u5b9e\u73b0\u66f4\u9ad8\u4fdd\u771f\u5ea6","text":"<ul> <li> <p>VQ-VAE \u80fd\u4ea7\u751f\u4e0d\u9519\u7684\u91cd\u5efa\u6548\u679c\uff0c\u4f46\u50cf\u7d20\u7ea7\u7684 \\(\\ell_2\\) \u635f\u5931\u5f80\u5f80\u4f1a\u4ea7\u751f\u6a21\u7cca\u7684\u8f93\u51fa\uff0c\u56e0\u4e3a\u5b83\u5bf9\u6bcf\u4e2a\u50cf\u7d20\u504f\u5dee\u90fd\u540c\u7b49\u60e9\u7f5a\uff0c\u5728\u5408\u7406\u7684\u7ec6\u8282\u4e0a\u53d6\u5e73\u5747\u800c\u4e0d\u662f\u9009\u62e9\u6e05\u6670\u7684\u7ec6\u8282\u3002\u60f3\u8c61\u4e00\u4e0b\uff0c\u8981\u6c42\u67d0\u4eba\u753b\u4e00\u5f20\u8138\uff0c\u4f7f\u5f97\u4e0e\u6240\u6709\u53ef\u80fd\u7684\u8138\u7684\u5e73\u5747\u5dee\u5f02\u6700\u5c0f\u2014\u2014\u4ed6\u4eec\u4f1a\u753b\u51fa\u4e00\u5f20\u6a21\u7cca\u7684\u5e73\u5747\u8138\uff0c\u800c\u4e0d\u662f\u4e00\u5f20\u6e05\u6670\u7684\u7279\u5b9a\u4eba\u8138\u3002</p> </li> <li> <p>VQ-GAN\uff08Esser \u7b49\u4eba\uff0c2021\uff09\u901a\u8fc7\u5c06 VQ-VAE \u6846\u67b6\u4e0e\u751f\u6210\u5bf9\u6297\u7f51\u7edc\uff08\u7b2c 6 \u7ae0\uff09\u4e2d\u7684\u5224\u522b\u5668\u76f8\u7ed3\u5408\u6765\u89e3\u51b3\u8fd9\u4e2a\u95ee\u9898\u3002\u5224\u522b\u5668\u662f\u4e00\u4e2a\u57fa\u4e8e\u5757\u7684\u5377\u79ef\u7f51\u7edc\uff0c\u7528\u4e8e\u5224\u65ad\u5c40\u90e8\u56fe\u50cf\u5757\u662f\u771f\uff08\u6765\u81ea\u8bad\u7ec3\u6570\u636e\uff09\u8fd8\u662f\u5047\uff08\u6765\u81ea\u89e3\u7801\u5668\uff09\u3002\u8fd9\u79cd\u5bf9\u6297\u635f\u5931\u9f13\u52b1\u89e3\u7801\u5668\u4ea7\u751f\u611f\u77e5\u4e0a\u6e05\u6670\u3001\u903c\u771f\u7684\u7eb9\u7406\uff0c\u800c\u4e0d\u662f\u50cf\u7d20\u7ea7\u7684\u5e73\u5747\u503c\u3002</p> </li> <li> <p>VQ-GAN \u76ee\u6807\u51fd\u6570\u5728 VQ-VAE \u635f\u5931\u7684\u57fa\u7840\u4e0a\u589e\u52a0\u4e86\u4e24\u9879\uff1a</p> </li> </ul> \\[\\mathcal{L}_\\text{VQ-GAN} = \\mathcal{L}_\\text{VQ-VAE} + \\lambda_\\text{adv} \\mathcal{L}_\\text{adv} + \\lambda_\\text{perc} \\mathcal{L}_\\text{perc}\\] <ul> <li>\u5bf9\u6297\u635f\u5931 \\(\\mathcal{L}_\\text{adv}\\) \u662f\u5e94\u7528\u4e8e\u89e3\u7801\u5668\u8f93\u51fa\u7684\u6807\u51c6 GAN \u76ee\u6807\u3002\u5224\u522b\u5668 \\(\\mathcal{D}\\) \u8bd5\u56fe\u533a\u5206\u771f\u5b9e\u5757\u548c\u89e3\u7801\u5757\uff0c\u800c\u89e3\u7801\u5668\uff08\u751f\u6210\u5668\uff09\u8bd5\u56fe\u6b3a\u9a97\u5b83\u3002\u975e\u9971\u548c\u5f62\u5f0f\u4e3a\uff1a</li> </ul> \\[\\mathcal{L}_\\text{adv} = -\\mathbb{E}[\\log \\mathcal{D}(D(\\mathbf{z}_q))]\\] <ul> <li>\u611f\u77e5\u635f\u5931 \\(\\mathcal{L}_\\text{perc}\\) \u6bd4\u8f83\u539f\u59cb\u56fe\u50cf\u548c\u91cd\u5efa\u56fe\u50cf\u5728\u9884\u8bad\u7ec3\u7f51\u7edc\uff08\u901a\u5e38\u662f VGG \u6216 LPIPS\uff09\u4e2d\u7684\u7279\u5f81\u6fc0\u6d3b\uff1a</li> </ul> \\[\\mathcal{L}_\\text{perc} = \\sum_l \\|\\phi_l(\\mathbf{x}) - \\phi_l(D(\\mathbf{z}_q))\\|_2^2\\] <ul> <li> <p>\u5176\u4e2d \\(\\phi_l\\) \u8868\u793a\u9884\u8bad\u7ec3\u7f51\u7edc\u5728\u7b2c \\(l\\) \u5c42\u7684\u7279\u5f81\u56fe\u3002\u8fd9\u4e2a\u635f\u5931\u6355\u6349\u7684\u662f\u9ad8\u5c42\u7ed3\u6784\u76f8\u4f3c\u6027\uff0c\u800c\u975e\u50cf\u7d20\u7ea7\u7cbe\u5ea6\u3002</p> </li> <li> <p>\u6743\u91cd \\(\\lambda_\\text{adv}\\) \u88ab\u81ea\u9002\u5e94\u5730\u8bbe\u7f6e\uff0c\u4f7f\u5f97\u5bf9\u6297\u68af\u5ea6\u548c\u91cd\u5efa\u68af\u5ea6\u4fdd\u6301\u5e73\u8861\uff0c\u9632\u6b62\u5728\u8bad\u7ec3\u65e9\u671f\u91cd\u5efa\u6548\u679c\u8fd8\u5f88\u5dee\u65f6\u5bf9\u6297\u635f\u5931\u5360\u4e3b\u5bfc\u3002</p> </li> </ul> <p></p> <ul> <li>\u7ed3\u679c\u662f\uff0c\u5728\u76f8\u540c\u7801\u672c\u5927\u5c0f\u4e0b\uff0cVQ-GAN \u4ea7\u751f\u7684\u8bcd\u5143\u5316\u5668\u91cd\u5efa\u6548\u679c\u8fdc\u6bd4 VQ-VAE \u6e05\u6670\u3002VQ-GAN \u662f\u8bb8\u591a\u4e3b\u8981\u56fe\u50cf\u751f\u6210\u7cfb\u7edf\uff08\u5305\u62ec\u6700\u521d\u7684 DALL-E\u3001Parti \u4ee5\u53ca\u4f17\u591a\u6587\u751f\u56fe\u6a21\u578b\uff09\u80cc\u540e\u7684\u9aa8\u5e72\u8bcd\u5143\u5316\u5668\u3002\u5b83\u5c06 256\u00d7256 \u7684\u56fe\u50cf\u8f6c\u6362\u4e3a 16\u00d716 \u6216 32\u00d732 \u7684\u79bb\u6563\u8bcd\u5143\u7f51\u683c\uff0c\u6765\u6e90\u4e8e\u5927\u5c0f\u4e3a 1024\u201316384 \u7684\u7801\u672c\uff0c\u5728\u6bcf\u4e2a\u7a7a\u95f4\u7ef4\u5ea6\u4e0a\u5b9e\u73b0 16 \u500d\u5230 64 \u500d\u7684\u538b\u7f29\u6bd4\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/03.%20image%20and%20video%20tokenisation/#_4","title":"\u6b8b\u5dee\u91cf\u5316\u4e0e\u591a\u5c3a\u5ea6\u7801\u672c","text":"<ul> <li> <p>\u5355\u4e2a\u7801\u672c\u5bf9\u91cd\u5efa\u8d28\u91cf\u65bd\u52a0\u4e86\u4e00\u4e2a\u786c\u4e0a\u9650\uff1a\u6bcf\u4e2a\u7a7a\u95f4\u4f4d\u7f6e\u6070\u597d\u7531\u4e00\u4e2a\u7801\u672c\u5411\u91cf\u8868\u793a\uff0c\u4efb\u4f55\u6bd4\u7801\u672c\u6240\u80fd\u8868\u8fbe\u7684\u66f4\u7cbe\u7ec6\u7684\u7ec6\u8282\u90fd\u4f1a\u4e22\u5931\u3002\u60f3\u8c61\u7528\u56fa\u5b9a\u8c03\u8272\u677f\u4e2d\u7684\u4e00\u4e2a\u8bcd\u6765\u63cf\u8ff0\u4e00\u79cd\u989c\u8272\uff1a\"\u9752\u8272\"\u5f88\u63a5\u8fd1\u4f46\u4e0d\u7cbe\u786e\u3002\u5982\u679c\u4f60\u80fd\u6dfb\u52a0\u4e00\u4e2a\u7ec6\u5316\u63cf\u8ff0\u2014\u2014\"\u9752\u8272\uff0c\u4f46\u7a0d\u5fae\u504f\u84dd\u4e00\u70b9\uff0c\u4eae\u4e00\u70b9\"\u2014\u2014\u4f60\u5c31\u80fd\u5f97\u5230\u66f4\u63a5\u8fd1\u7684\u7ed3\u679c\u3002</p> </li> <li> <p>\u6b8b\u5dee\u91cf\u5316\uff08RQ\uff09\u8fed\u4ee3\u5730\u5e94\u7528\u4e86\u8fd9\u4e00\u601d\u60f3\u3002\u5728\u7b2c\u4e00\u6b21\u91cf\u5316\u6b65\u9aa4\u4ea7\u751f \\(\\mathbf{z}_q^{(1)}\\) \u4e4b\u540e\uff0c\u8ba1\u7b97\u6b8b\u5dee \\(\\mathbf{r}^{(1)} = \\mathbf{z}_e - \\mathbf{z}_q^{(1)}\\)\uff0c\u7136\u540e\u5bf9\u6b8b\u5dee\u4f7f\u7528\u7b2c\u4e8c\u4e2a\u7801\u672c\u8fdb\u884c\u91cf\u5316\u5f97\u5230 \\(\\mathbf{z}_q^{(2)}\\)\uff0c\u4ee5\u6b64\u7c7b\u63a8\uff0c\u5171 \\(T\\) \u4e2a\u5c42\u7ea7\uff1a</p> </li> </ul> \\[\\mathbf{r}^{(0)} = \\mathbf{z}_e\\] \\[\\mathbf{z}_q^{(t)} = \\text{Quantise}(\\mathbf{r}^{(t-1)}, \\mathcal{C}^{(t)})\\] \\[\\mathbf{r}^{(t)} = \\mathbf{r}^{(t-1)} - \\mathbf{z}_q^{(t)}\\] <ul> <li> <p>\u6700\u7ec8\u7684\u91cf\u5316\u8868\u793a\u4e3a \\(\\hat{\\mathbf{z}} = \\sum_{t=1}^{T} \\mathbf{z}_q^{(t)}\\)\u3002\u4f7f\u7528 \\(T\\) \u4e2a\u5c42\u7ea7\uff0c\u6bcf\u4e2a\u5c42\u7ea7\u7801\u672c\u5927\u5c0f\u4e3a \\(K\\)\uff0c\u6709\u6548\u8bcd\u6c47\u8868\u5927\u5c0f\u4e3a \\(K^T\\)\uff0c\u4f46\u4f60\u53ea\u9700\u8981\u5b58\u50a8 \\(T \\times K\\) \u4e2a\u5411\u91cf\uff0c\u800c\u4e0d\u662f \\(K^T\\) \u4e2a\u3002\u4f8b\u5982\uff0c8 \u4e2a\u5c42\u7ea7\uff0c\\(K = 1024\\)\uff0c\u6709\u6548\u6761\u76ee\u6570\u4e3a \\(1024^8 \\approx 10^{24}\\)\uff0c\u800c\u53ea\u5b58\u50a8\u4e86 8192 \u4e2a\u5411\u91cf\u3002</p> </li> <li> <p>\u6bcf\u4e2a\u540e\u7eed\u5c42\u7ea7\u6355\u6349\u66f4\u7cbe\u7ec6\u7684\u7ec6\u8282\uff1a\u7b2c\u4e00\u4e2a\u7801\u672c\u6355\u6349\u7c97\u7565\u7ed3\u6784\uff0c\u7b2c\u4e8c\u4e2a\u6355\u6349\u4e2d\u9891\u4fee\u6b63\uff0c\u4f9d\u6b64\u7c7b\u63a8\u3002\u8fd9\u7c7b\u4f3c\u4e8e JPEG \u4e2d\u7684\u9010\u6b21\u903c\u8fd1\u6216\u7f51\u9875\u56fe\u50cf\u4e2d\u7684\u6e10\u8fdb\u5f0f\u6e32\u67d3\uff0c\u5148\u51fa\u73b0\u7c97\u7565\u7248\u672c\uff0c\u7136\u540e\u9010\u6b65\u586b\u5145\u7ec6\u8282\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u591a\u5c3a\u5ea6\u7801\u672c\u901a\u8fc7\u5728\u4e0d\u540c\u7a7a\u95f4\u5206\u8fa8\u7387\u4e0a\u64cd\u4f5c\u6765\u6269\u5c55\u8fd9\u4e00\u601d\u60f3\u3002\u4e0d\u662f\u91cd\u590d\u91cf\u5316\u540c\u4e00\u4e2a\u7a7a\u95f4\u7f51\u683c\uff0c\u800c\u662f\u5728\u591a\u4e2a\u5c3a\u5ea6\u4e0a\u8fdb\u884c\u91cf\u5316\uff1a\u7c97\u7c92\u5ea6\u7f51\u683c\u6355\u6349\u5168\u5c40\u7ed3\u6784\uff0c\u7ec6\u7c92\u5ea6\u7f51\u683c\u6355\u6349\u5c40\u90e8\u7ec6\u8282\u3002\u8fd9\u4e0e\u7b2c 8 \u7ae0\u76ee\u6807\u68c0\u6d4b\u90e8\u5206\u4e2d\u7684\u7279\u5f81\u91d1\u5b57\u5854\u601d\u60f3\u76f8\u5173\uff0c\u5176\u4e2d\u4e0d\u540c\u5c3a\u5ea6\u7684\u7279\u5f81\u6355\u6349\u4e0d\u540c\u5c42\u6b21\u7684\u7ec6\u8282\u3002</p> </li> <li> <p>\u4e58\u79ef\u91cf\u5316\u662f\u4e00\u79cd\u76f8\u5173\u6280\u672f\uff0c\u5c06 \\(d\\) \u7ef4\u6f5c\u5728\u5411\u91cf\u62c6\u5206\u4e3a \\(M\\) \u4e2a\u7ef4\u5ea6\u4e3a \\(d/M\\) \u7684\u5b50\u5411\u91cf\uff0c\u6bcf\u4e2a\u5b50\u5411\u91cf\u4f7f\u7528\u81ea\u5df1\u7684\u7801\u672c\u72ec\u7acb\u91cf\u5316\u3002\u8fd9\u4f7f\u5f97\u6709\u6548\u8bcd\u6c47\u8868\u8fbe\u5230 \\(K^M\\)\uff0c\u540c\u65f6\u53ea\u5b58\u50a8 \\(M \\times K\\) \u4e2a\u5411\u91cf\u3002\u4e58\u79ef\u91cf\u5316\u5e7f\u6cdb\u5e94\u7528\u4e8e\u8fd1\u4f3c\u6700\u8fd1\u90bb\u641c\u7d22\uff08\u7b2c 13 \u7ae0\uff09\uff0c\u5e76\u5df2\u88ab\u9002\u914d\u7528\u4e8e\u56fe\u50cf\u8bcd\u5143\u5316\u3002</p> </li> <li> <p>\u6709\u9650\u6807\u91cf\u91cf\u5316\uff08FSQ\uff09\uff0c\u7531 Mentzer \u7b49\u4eba\uff082023\uff09\u63d0\u51fa\uff0c\u91c7\u53d6\u4e86\u4e00\u79cd\u5b8c\u5168\u4e0d\u540c\u7684\u65b9\u6cd5\uff1a\u4e0d\u662f\u5b66\u4e60\u4e00\u4e2a\u7801\u672c\uff0c\u800c\u662f\u7b80\u5355\u5730\u5c06\u6f5c\u5728\u5411\u91cf\u7684\u6bcf\u4e2a\u7ef4\u5ea6\u56db\u820d\u4e94\u5165\u5230\u4e00\u7ec4\u56fa\u5b9a\u6574\u6570\u7ea7\u522b\u4e2d\u7684\u4e00\u4e2a\uff08\u4f8b\u5982 \\(\\{-2, -1, 0, 1, 2\\}\\)\uff09\u3002\u6bcf\u7ef4 \\(L\\) \u4e2a\u7ea7\u522b\uff0c\\(d\\) \u4e2a\u7ef4\u5ea6\uff0c\u9690\u542b\u7801\u672c\u5927\u5c0f\u4e3a \\(L^d\\)\u3002FSQ \u5b8c\u5168\u907f\u514d\u4e86\u7801\u672c\u574d\u584c\uff0c\u56e0\u4e3a\u6ca1\u6709\u53ef\u5b66\u4e60\u7684\u7801\u672c\u5411\u91cf\uff0c\u53ea\u6709\u88ab\u786e\u5b9a\u6027\u56db\u820d\u4e94\u5165\u7684\u53ef\u5b66\u4e60\u7f16\u7801\u5668\u8f93\u51fa\u3002\u76f4\u901a\u4f30\u8ba1\u5668\u5904\u7406\u4e86\u56db\u820d\u4e94\u5165\u7684\u4e0d\u53ef\u5fae\u6027\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/03.%20image%20and%20video%20tokenisation/#_5","title":"\u5b9e\u8df5\u4e2d\u7684\u56fe\u50cf\u8bcd\u5143\u5316\u5668","text":"<ul> <li>\u4ece VQ-VAE \u5230 VQ-GAN \u518d\u5230\u6b8b\u5dee\u91cf\u5316\u7684\u6f14\u8fdb\uff0c\u50ac\u751f\u4e86\u4e00\u7cfb\u5217\u5b9e\u9645\u56fe\u50cf\u8bcd\u5143\u5316\u5668\uff0c\u7528\u4e8e\u6700\u5148\u8fdb\u7684\u751f\u6210\u6a21\u578b\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/03.%20image%20and%20video%20tokenisation/#dall-e-dvae","title":"DALL-E \u8bcd\u5143\u5316\u5668\uff08dVAE\uff09","text":"<ul> <li>\u6700\u521d\u7684 DALL-E\uff08Ramesh \u7b49\u4eba\uff0c2021\uff09\u4f7f\u7528\u79bb\u6563 VAE\uff08dVAE\uff09\u5c06 256\u00d7256 \u56fe\u50cf\u8bcd\u5143\u5316\u4e3a 32\u00d732 \u7684\u8bcd\u5143\u7f51\u683c\uff0c\u7801\u672c\u5927\u5c0f\u4e3a 8192\u3002dVAE \u5c06\u786c \\(\\arg\\min\\) \u91cf\u5316\u66ff\u6362\u4e3a Gumbel-Softmax \u677e\u5f1b\uff0c\u4f7f\u524d\u5411\u4f20\u64ad\u5728\u8bad\u7ec3\u8fc7\u7a0b\u4e2d\u53ef\u5fae\u3002\u5728\u63a8\u7406\u65f6\uff0c\u4f7f\u7528 \\(\\arg\\max\\) \u751f\u6210\u786c\u8bcd\u5143\u5206\u914d\u3002dVAE \u4f7f\u7528\u91cd\u5efa\u635f\u5931\u3001\u4e0e\u5747\u5300\u5148\u9a8c\u7684 KL \u6563\u5ea6\u4ee5\u53ca Gumbel-Softmax \u7684\u5b66\u4e60\u6e29\u5ea6\u8c03\u5ea6\u7ec4\u5408\u8fdb\u884c\u8bad\u7ec3\u3002\u7136\u540e DALL-E \u8bad\u7ec3\u4e86\u4e00\u4e2a 120 \u4ebf\u53c2\u6570\u7684\u81ea\u56de\u5f52 Transformer \u6765\u5efa\u6a21 256 \u4e2a\u6587\u672c\u8bcd\u5143\u548c 1024 \u4e2a\u56fe\u50cf\u8bcd\u5143\uff0832\u00d732\uff09\u7684\u8054\u5408\u5206\u5e03\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/03.%20image%20and%20video%20tokenisation/#llamagen","title":"LlamaGen","text":"<ul> <li>LlamaGen\uff08Sun \u7b49\u4eba\uff0c2024\uff09\u8868\u660e\uff0c\u53ea\u8981\u4f60\u6709\u4e00\u4e2a\u597d\u7684\u56fe\u50cf\u8bcd\u5143\u5316\u5668\uff0c\u5c31\u53ef\u4ee5\u5c06\u6807\u51c6\u7684 Llama \u98ce\u683c\u8bed\u8a00\u6a21\u578b\u67b6\u6784\uff08\u7b2c 7 \u7ae0\uff09\u91cd\u65b0\u7528\u4e8e\u81ea\u56de\u5f52\u56fe\u50cf\u751f\u6210\u3002LlamaGen \u4f7f\u7528\u6539\u8fdb\u7684 VQ-GAN \u8bcd\u5143\u5316\u5668\uff0c\u5177\u6709\u5927\u578b\u7801\u672c\uff0816,384 \u4e2a\u6761\u76ee\uff09\uff0c\u5e76\u8bad\u7ec3\u4e86\u4e00\u4e2a\u666e\u901a\u7684\u81ea\u56de\u5f52 Transformer\uff08\u9664\u4e86\u8bcd\u5143\u5316\u5668\u5916\u6ca1\u6709\u7279\u6b8a\u7684\u56fe\u50cf\u7279\u5b9a\u4fee\u6539\uff09\u4ee5\u5149\u6805\u626b\u63cf\u987a\u5e8f\u4ece\u5de6\u5230\u53f3\u9884\u6d4b\u56fe\u50cf\u8bcd\u5143\u3002\u5173\u952e\u7684\u89c1\u89e3\u662f\uff0c\u4e00\u65e6\u56fe\u50cf\u88ab\u8bcd\u5143\u5316\u4e3a\u79bb\u6563\u5e8f\u5217\uff0c\u9002\u7528\u4e8e\u8bed\u8a00\u7684\u76f8\u540c\u4e0b\u4e00\u4e2a\u8bcd\u5143\u9884\u6d4b\u8303\u5f0f\u4e5f\u540c\u6837\u9002\u7528\u4e8e\u56fe\u50cf\uff0c\u8fd9\u9a8c\u8bc1\u4e86\u8bcd\u5143\u5316\u786e\u5b9e\u5f25\u5408\u4e86\u6a21\u6001\u9e3f\u6c9f\u7684\u89c2\u70b9\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/03.%20image%20and%20video%20tokenisation/#cosmos","title":"Cosmos \u8bcd\u5143\u5316\u5668","text":"<ul> <li>Cosmos \u8bcd\u5143\u5316\u5668\uff08NVIDIA\uff0c2024\uff09\u8bbe\u8ba1\u7528\u4e8e\u5728\u7edf\u4e00\u6846\u67b6\u4e2d\u5904\u7406\u56fe\u50cf\u548c\u89c6\u9891\u3002\u5b83\u4f7f\u7528\u56e0\u679c 3D \u67b6\u6784\uff0c\u5c06\u56fe\u50cf\u89c6\u4e3a\u5355\u5e27\u89c6\u9891\uff0c\u4f7f\u5f97\u540c\u4e00\u4e2a\u8bcd\u5143\u5316\u5668\u53ef\u4ee5\u5904\u7406\u4e24\u79cd\u6a21\u6001\u3002Cosmos \u652f\u6301\u8fde\u7eed\u548c\u79bb\u6563\u4e24\u79cd\u8bcd\u5143\u5316\u6a21\u5f0f\uff1a\u8fde\u7eed\u6a21\u5f0f\u8f93\u51fa\u5b9e\u503c\u6f5c\u5728\u5411\u91cf\uff08\u7528\u4e8e\u6269\u6563\u6a21\u578b\u540e\u7aef\uff09\uff0c\u800c\u79bb\u6563\u6a21\u5f0f\u5e94\u7528\u6709\u9650\u6807\u91cf\u91cf\u5316\u4ea7\u751f\u6574\u6570\u8bcd\u5143\uff08\u7528\u4e8e\u81ea\u56de\u5f52\u6a21\u578b\u540e\u7aef\uff09\u3002\u7f16\u7801\u5668\u4f7f\u7528\u56e0\u679c 3D \u5377\u79ef\uff0c\u4f7f\u5f97\u6bcf\u5e27\u7684\u8bcd\u5143\u4ec5\u4f9d\u8d56\u4e8e\u5f53\u524d\u5e27\u548c\u4e4b\u524d\u7684\u5e27\uff0c\u4ece\u800c\u652f\u6301\u6d41\u5f0f\u89c6\u9891\u8bcd\u5143\u5316\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/03.%20image%20and%20video%20tokenisation/#_6","title":"\u89c6\u9891\u8bcd\u5143\u5316","text":"<ul> <li> <p>\u89c6\u9891\u5728\u56fe\u50cf\u7684\u4e8c\u7ef4\u7a7a\u95f4\u7ef4\u5ea6\u4e0a\u589e\u52a0\u4e86\u7b2c\u4e09\u4e2a\u8f74\u2014\u2014\u65f6\u95f4\u3002\u89c6\u9891\u662f\u4e00\u7cfb\u5217\u5e27\uff0c\u901a\u5e38\u4e3a\u6bcf\u79d2 24\u201330 \u5e27\uff0c\u76f8\u90bb\u5e27\u4e4b\u95f4\u9ad8\u5ea6\u5197\u4f59\uff0c\u56e0\u4e3a\u5728 33 \u6beb\u79d2\u5185\u89c6\u89c9\u4e16\u754c\u4e0d\u4f1a\u53d1\u751f\u5267\u70c8\u53d8\u5316\u3002\u89c6\u9891\u8bcd\u5143\u5316\u5229\u7528\u8fd9\u79cd\u65f6\u95f4\u5197\u4f59\u6765\u5b9e\u73b0\u6bd4\u72ec\u7acb\u8bcd\u5143\u5316\u6bcf\u5e27\u9ad8\u5f97\u591a\u7684\u538b\u7f29\u7387\u3002</p> </li> <li> <p>\u628a\u89c6\u9891\u538b\u7f29\u60f3\u8c61\u6210\u4e00\u5e45\u7ffb\u9875\u4e66\u3002\u5982\u679c\u6bcf\u4e00\u9875\u90fd\u4ece\u5934\u753b\u8d77\uff0c\u4f60\u9700\u8981\u6570\u5343\u5f20\u7cbe\u7ec6\u7684\u7ed8\u56fe\u3002\u4f46\u5927\u591a\u6570\u9875\u9762\u4e0e\u76f8\u90bb\u9875\u9762\u51e0\u4e4e\u76f8\u540c\uff0c\u6240\u4ee5\u4f60\u53ef\u4ee5\u6bcf 10 \u9875\u753b\u4e00\u4e2a\u5b8c\u6574\u7684\"\u5173\u952e\u5e27\"\uff0c\u53ea\u8bb0\u5f55\u4e2d\u95f4\u9875\u9762\u4e0a\u7684\u5fae\u5c0f\u53d8\u5316\u3002\u89c6\u9891\u8bcd\u5143\u5316\u5668\u81ea\u52a8\u5b66\u4f1a\u4e86\u8fd9\u4e2a\u6280\u5de7\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/03.%20image%20and%20video%20tokenisation/#3d-vq-vae","title":"3D VQ-VAE","text":"<ul> <li> <p>\u5c06 VQ-VAE \u6269\u5c55\u5230\u89c6\u9891\u7684\u6700\u76f4\u63a5\u65b9\u5f0f\u662f 3D VQ-VAE\uff0c\u5b83\u5c06\u7f16\u7801\u5668\u548c\u89e3\u7801\u5668\u4e2d\u7684 2D \u5377\u79ef\u66ff\u6362\u4e3a\u540c\u65f6\u5728\u7a7a\u95f4\u548c\u65f6\u95f4\u7ef4\u5ea6\u4e0a\u64cd\u4f5c\u7684 3D \u5377\u79ef\u3002\u5982\u679c\u7f16\u7801\u5668\u5728\u7a7a\u95f4\u4e0a\u964d\u91c7\u6837 \\(f_s\\) \u500d\uff0c\u5728\u65f6\u95f4\u4e0a\u964d\u91c7\u6837 \\(f_t\\) \u500d\uff0c\u5219 \\(T \\times H \\times W\\) \u7684\u89c6\u9891\u7247\u6bb5\u53d8\u4e3a \\((T/f_t) \\times (H/f_s) \\times (W/f_s)\\) \u7684\u8bcd\u5143\u7f51\u683c\u3002</p> </li> <li> <p>\u4f8b\u5982\uff0c\\(f_s = 16\\) \u4e14 \\(f_t = 4\\) \u65f6\uff0c\u4e00\u4e2a 16 \u5e27\u7684 256\u00d7256 \u89c6\u9891\u7247\u6bb5\u53d8\u4e3a \\(4 \\times 16 \\times 16 = 1024\\) \u7684\u8bcd\u5143\u5e8f\u5217\u3002\u8fd9\u5bf9 Transformer \u8fdb\u884c\u81ea\u56de\u5f52\u5efa\u6a21\u6765\u8bf4\u5df2\u7ecf\u8db3\u591f\u7d27\u51d1\uff0c\u800c\u539f\u59cb\u50cf\u7d20\u6570\u5c06\u662f \\(16 \\times 256 \\times 256 \\times 3 \\approx 310\\) \u4e07\u4e2a\u6570\u503c\u3002</p> </li> <li> <p>3D \u5377\u79ef\u8054\u5408\u5b66\u4e60\u7a7a\u95f4\u548c\u65f6\u95f4\u7279\u5f81\u3002\u65e9\u671f\u5c42\u6355\u6349\u5c40\u90e8\u8fd0\u52a8\uff08\u5e27\u95f4\u79fb\u52a8\u7684\u8fb9\u7f18\uff09\uff0c\u800c\u66f4\u6df1\u5c42\u6355\u6349\u9ad8\u5c42\u52a8\u6001\uff08\u7269\u4f53\u7684\u51fa\u73b0\u3001\u6d88\u5931\u6216\u5f62\u72b6\u53d8\u5316\uff09\u3002\u8fd9\u4e0e\u7b2c 8 \u7ae0\u5377\u79ef\u7f51\u7edc\u4e2d\u7684\u5c42\u6b21\u5316\u7279\u5f81\u63d0\u53d6\u539f\u7406\u76f8\u540c\uff0c\u53ea\u662f\u6cbf\u65f6\u95f4\u8f74\u8fdb\u884c\u4e86\u6269\u5c55\u3002</p> </li> </ul> <p></p>"},{"location":"chapter%2010%3A%20multimodal%20learning/03.%20image%20and%20video%20tokenisation/#_7","title":"\u56e0\u679c\u89c6\u9891\u8bcd\u5143\u5316\u5668","text":"<ul> <li> <p>\u6807\u51c6 3D \u5377\u79ef\u4f1a\u540c\u65f6\u67e5\u770b\u8fc7\u53bb\u3001\u5f53\u524d\u548c\u672a\u6765\u7684\u5e27\uff0c\u8fd9\u610f\u5473\u7740\u5728\u8bcd\u5143\u5316\u4efb\u4f55\u5e27\u4e4b\u524d\u9700\u8981\u6574\u4e2a\u89c6\u9891\u7247\u6bb5\u3002\u56e0\u679c\u89c6\u9891\u8bcd\u5143\u5316\u5668\u7ea6\u675f\u65f6\u95f4\u5377\u79ef\uff0c\u4f7f\u6bcf\u4e2a\u8f93\u51fa\u4ec5\u4f9d\u8d56\u4e8e\u5f53\u524d\u5e27\u548c\u4e4b\u524d\u7684\u5e27\uff0c\u4ece\u4e0d\u4f9d\u8d56\u4e8e\u672a\u6765\u7684\u5e27\u3002\u8fd9\u7c7b\u4f3c\u4e8e\u81ea\u56de\u5f52 Transformer\uff08\u7b2c 7 \u7ae0\uff09\u4e2d\u7684\u56e0\u679c\u63a9\u7801\uff1a\u4fe1\u606f\u5728\u65f6\u95f4\u4e0a\u5411\u524d\u6d41\u52a8\uff0c\u4f46\u7edd\u4e0d\u5411\u540e\u3002</p> </li> <li> <p>\u56e0\u679c\u8bcd\u5143\u5316\u5bf9\u4e8e\u4e24\u79cd\u4f7f\u7528\u573a\u666f\u81f3\u5173\u91cd\u8981\u3002\u9996\u5148\uff0c\u6d41\u5f0f\u5904\u7406\uff1a\u4f60\u53ef\u4ee5\u5728\u5e27\u5230\u8fbe\u65f6\u5b9e\u65f6\u8bcd\u5143\u5316\u89c6\u9891\uff0c\u800c\u65e0\u9700\u7f13\u51b2\u672a\u6765\u7684\u5e27\u3002\u5176\u6b21\uff0c\u81ea\u56de\u5f52\u751f\u6210\uff1a\u5f53 Transformer \u9010\u5e27\u751f\u6210\u89c6\u9891\u65f6\uff0c\u7b2c \\(t\\) \u5e27\u7684\u8bcd\u5143\u5fc5\u987b\u5728\u4e0d\u77e5\u9053\u7b2c \\(t+1\\) \u5e27\u7684\u60c5\u51b5\u4e0b\u53ef\u8ba1\u7b97\uff0c\u56e0\u4e3a\u7b2c \\(t+1\\) \u5e27\u5c1a\u672a\u751f\u6210\u3002</p> </li> <li> <p>\u56e0\u679c\u7ea6\u675f\u901a\u8fc7\u975e\u5bf9\u79f0\u586b\u5145\u65f6\u95f4\u5377\u79ef\u6765\u5b9e\u73b0\uff1a\u65f6\u95f4\u5927\u5c0f\u4e3a \\(k\\) \u7684\u6838\u5728\u8fc7\u53bb\u4e00\u4fa7\u586b\u5145 \\(k-1\\) \u4e2a\u96f6\uff0c\u672a\u6765\u4e00\u4fa7\u586b\u5145\u96f6\u4e2a\u96f6\uff0c\u786e\u4fdd\u65f6\u95f4 \\(t\\) \u7684\u8f93\u51fa\u4ec5\u4f9d\u8d56\u4e8e\u65f6\u95f4 \\(t-k+1, \\ldots, t\\) \u7684\u8f93\u5165\u3002</p> </li> <li> <p>\u56e0\u679c\u89c6\u9891\u8bcd\u5143\u5316\u5668\u7684\u4e00\u4e2a\u4f18\u96c5\u7279\u6027\u662f\u5b83\u4eec\u53ef\u4ee5\u8bcd\u5143\u5316\u5355\u5f20\u56fe\u50cf\uff08\"\u89c6\u9891\"\u53ea\u6709\u4e00\u5e27\uff09\u800c\u65e0\u9700\u7279\u6b8a\u5904\u7406\u3002\u7b2c\u4e00\u5e27\u6ca1\u6709\u5386\u53f2\u4e0a\u4e0b\u6587\uff0c\u56e0\u6b64\u5176\u8bcd\u5143\u4ec5\u4ece\u8be5\u5e27\u672c\u8eab\u8ba1\u7b97\u3002\u8fd9\u79cd\u56fe\u50cf-\u89c6\u9891\u7edf\u4e00\u610f\u5473\u7740\u5355\u4e2a\u8bcd\u5143\u5316\u5668\u53ef\u4ee5\u670d\u52a1\u4e8e\u4e24\u79cd\u6a21\u6001\uff0c\u7b80\u5316\u4e86\u67b6\u6784\uff0c\u5e76\u4f7f\u6a21\u578b\u80fd\u591f\u4f7f\u7528\u540c\u4e00\u4e2a\u89e3\u7801\u5668\u751f\u6210\u56fe\u50cf\u548c\u89c6\u9891\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/03.%20image%20and%20video%20tokenisation/#_8","title":"\u65f6\u95f4\u538b\u7f29\u7b56\u7565","text":"<ul> <li> <p>\u4e0d\u540c\u7684\u5e94\u7528\u9700\u8981\u4e0d\u540c\u7684\u65f6\u95f4\u538b\u7f29\u6bd4\u3002\u5bf9\u4e8e\u52a8\u4f5c\u8bc6\u522b\uff08\u5176\u4e2d\u7ec6\u5fae\u8fd0\u52a8\u5f88\u91cd\u8981\uff09\uff0c\u6e29\u548c\u538b\u7f29\uff08\\(f_t = 2\\)\uff09\u53ef\u4ee5\u4fdd\u7559\u65f6\u95f4\u7ec6\u8282\u3002\u5bf9\u4e8e\u957f\u89c6\u9891\u751f\u6210\uff08\u5b58\u50a8\u6570\u5343\u5e27\u662f\u4e0d\u53ef\u884c\u7684\uff09\uff0c\u9700\u8981\u6fc0\u8fdb\u538b\u7f29\uff08\\(f_t = 8\\) \u6216\u66f4\u9ad8\uff09\u3002</p> </li> <li> <p>\u67d0\u4e9b\u8bcd\u5143\u5316\u5668\u4f7f\u7528\u5206\u89e3\u538b\u7f29\uff1a\u7a7a\u95f4\u548c\u65f6\u95f4\u538b\u7f29\u5728\u4e0d\u540c\u7684\u9636\u6bb5\u8fdb\u884c\u3002\u9996\u5148\uff0c2D \u7f16\u7801\u5668\u72ec\u7acb\u538b\u7f29\u6bcf\u5e27\uff0c\u4ea7\u751f\u6bcf\u5e27\u7684\u6f5c\u5728\u7f51\u683c\u3002\u7136\u540e\uff0c1D \u65f6\u95f4\u7f16\u7801\u5668\u8de8\u65f6\u95f4\u7ef4\u5ea6\u8fdb\u884c\u538b\u7f29\u3002\u8fd9\u79cd\u5206\u89e3\u5728\u8ba1\u7b97\u4e0a\u6bd4\u5b8c\u6574\u7684 3D \u5377\u79ef\u66f4\u4fbf\u5b9c\uff0c\u5e76\u5141\u8bb8\u7a7a\u95f4\u548c\u65f6\u95f4\u91c7\u7528\u4e0d\u540c\u7684\u538b\u7f29\u6bd4\u3002\u5176\u4ee3\u4ef7\u662f\u5b83\u4e0d\u80fd\u50cf\u8054\u5408 3D \u7f16\u7801\u90a3\u6837\u9ad8\u6548\u5730\u6355\u6349\u65f6\u7a7a\u6a21\u5f0f\uff08\u5982\u5bf9\u89d2\u7ebf\u8fd0\u52a8\u7684\u7403\uff09\u3002</p> </li> <li> <p>\u65f6\u95f4\u63d2\u503c\u8bcd\u5143\u662f\u4e00\u9879\u6700\u8fd1\u7684\u521b\u65b0\uff0c\u8bcd\u5143\u5316\u5668\u4ec5\u5b8c\u6574\u7f16\u7801\u5173\u952e\u5e27\uff0c\u5e76\u5c06\u4e2d\u95f4\u5e27\u8868\u793a\u4e3a\u8f7b\u91cf\u7ea7\u7684\u63d2\u503c\u7f16\u7801\uff0c\u63cf\u8ff0\u5982\u4f55\u5728\u5173\u952e\u5e27\u4e4b\u95f4\u53d8\u5f62\u3002\u8fd9\u7c7b\u4f3c\u4e8e\u7ecf\u5178\u89c6\u9891\u538b\u7f29\uff08H.264/HEVC \u4e2d\u7684 I \u5e27\u548c P \u5e27\uff09\uff0c\u4f46\u5728\u5b66\u4e60\u5230\u7684\u6f5c\u5728\u7a7a\u95f4\u4e2d\u8fdb\u884c\u3002</p> </li> </ul> <p></p>"},{"location":"chapter%2010%3A%20multimodal%20learning/03.%20image%20and%20video%20tokenisation/#_9","title":"\u8fde\u7eed\u8bcd\u5143\u4e0e\u79bb\u6563\u8bcd\u5143","text":"<ul> <li> <p>\u5e76\u975e\u6bcf\u4e2a\u4e0b\u6e38\u6a21\u578b\u90fd\u9700\u8981\u79bb\u6563\u8bcd\u5143\u3002\u6269\u6563\u6a21\u578b\uff08\u7b2c 10 \u7ae0\uff0c\u6587\u4ef6 04\uff09\u539f\u751f\u4f7f\u7528\u8fde\u7eed\u503c\u2014\u2014\u5b83\u4eec\u8fed\u4ee3\u5730\u53bb\u566a\u9ad8\u65af\u6837\u672c\uff0c\u5176\u635f\u5931\u51fd\u6570\uff08\u53bb\u566a\u5f97\u5206\u5339\u914d\uff09\u5b9a\u4e49\u5728\u8fde\u7eed\u7a7a\u95f4\u4e0a\u3002\u5bf9\u4e8e\u6269\u6563\u540e\u7aef\uff0c\u8bcd\u5143\u5316\u5668\u7f16\u7801\u5668\u4ea7\u751f\u8fde\u7eed\u6f5c\u5728\u5411\u91cf\uff0c\u4ece\u4e0d\u8fdb\u884c\u91cf\u5316\u3002\u6f5c\u5728\u6269\u6563\u6a21\u578b\uff08Stable Diffusion\u3001DALL-E 3\u3001Flux\uff09\u4f7f\u7528\u7c7b\u4f3c VQ-GAN \u7684\u7f16\u7801\u5668-\u89e3\u7801\u5668\uff0c\u4f46\u5b8c\u5168\u8df3\u8fc7\u4e86\u7801\u672c\uff0c\u5728\u8fde\u7eed\u6f5c\u5728\u7a7a\u95f4\u4e2d\u64cd\u4f5c\u3002</p> </li> <li> <p>\u800c\u81ea\u56de\u5f52\u6a21\u578b\uff08GPT \u98ce\u683c\uff09\u5219\u4f7f\u7528 \\(K\\) \u7c7b\u4e0a\u7684 softmax \u4ece\u6709\u9650\u8bcd\u6c47\u8868\u4e2d\u9884\u6d4b\u4e0b\u4e00\u4e2a\u8bcd\u5143\u3002\u5b83\u4eec\u4ece\u6839\u672c\u4e0a\u9700\u8981\u79bb\u6563\u8bcd\u5143\u3002\u6bcf\u4e2a\u4f7f\u7528\u81ea\u56de\u5f52 Transformer \u7684\u56fe\u50cf\u751f\u6210\u7cfb\u7edf\uff08DALL-E\u3001Parti\u3001LlamaGen\u3001Chameleon\uff09\u90fd\u4f9d\u8d56\u79bb\u6563\u8bcd\u5143\u5316\u5668\u3002</p> </li> <li> <p>\u56e0\u6b64\uff0c\u8fde\u7eed\u8bcd\u5143\u548c\u79bb\u6563\u8bcd\u5143\u4e4b\u95f4\u7684\u9009\u62e9\u7531\u751f\u6210\u540e\u7aef\u51b3\u5b9a\uff1a</p> </li> <li> <p>\u5728\u4ee5\u4e0b\u60c5\u51b5\u4e0b\u4f7f\u7528\u79bb\u6563\u8bcd\u5143\uff1a\u6a21\u578b\u662f\u81ea\u56de\u5f52\u7684\uff08\u4f7f\u7528\u4ea4\u53c9\u71b5\u635f\u5931\u7684\u4e0b\u4e00\u4e2a\u8bcd\u5143\u9884\u6d4b\uff09\uff0c\u4f60\u60f3\u4e0e\u6587\u672c\u8bcd\u5143\u5171\u4eab\u8bcd\u6c47\u8868\u4ee5\u5b9e\u73b0\u7edf\u4e00\u7684\u591a\u6a21\u6001\u6a21\u578b\uff0c\u6216\u8005\u4f60\u9700\u8981\u7cbe\u786e\u7684\u8bcd\u5143\u7ea7\u63a7\u5236\uff08\u4f8b\u5982\uff0c\u901a\u8fc7\u8bcd\u5143\u66ff\u6362\u8fdb\u884c\u68c0\u7d22\u6216\u7f16\u8f91\uff09\u3002</p> </li> <li> <p>\u5728\u4ee5\u4e0b\u60c5\u51b5\u4e0b\u4f7f\u7528\u8fde\u7eed\u8bcd\u5143\uff1a\u6a21\u578b\u662f\u6269\u6563\u6a21\u578b\u6216\u6d41\u5339\u914d\u6a21\u578b\uff0c\u4efb\u52a1\u9700\u8981\u975e\u5e38\u9ad8\u7684\u4fdd\u771f\u5ea6\u91cd\u5efa\uff08\u8fde\u7eed\u6f5c\u5728\u8868\u793a\u5b8c\u5168\u907f\u514d\u4e86\u91cf\u5316\u8bef\u5dee\uff09\uff0c\u6216\u8005\u4f60\u60f3\u4f7f\u7528\u4f5c\u7528\u4e8e\u5b9e\u503c\u5411\u91cf\u7684\u56de\u5f52\u635f\u5931\u3002</p> </li> <li> <p>\u4e00\u4e9b\u6700\u8fd1\u7684\u67b6\u6784\u652f\u6301\u4e24\u79cd\u6a21\u5f0f\u3002\u4f8b\u5982\uff0cCosmos \u8bcd\u5143\u5316\u5668\u53ef\u4ee5\u4ece\u540c\u4e00\u4e2a\u7f16\u7801\u5668\u8f93\u51fa\u8fde\u7eed\u6f5c\u5728\u8868\u793a\uff08\u7528\u4e8e\u5176\u6269\u6563\u6a21\u5f0f\uff09\u6216 FSQ \u79bb\u6563\u5316\u8bcd\u5143\uff08\u7528\u4e8e\u5176\u81ea\u56de\u5f52\u6a21\u5f0f\uff09\uff0c\u53ea\u9700\u4e00\u4e2a\u53ef\u4ee5\u6253\u5f00\u6216\u5173\u95ed\u7684\u8f7b\u91cf\u7ea7\u91cf\u5316\u5934\u3002</p> </li> <li> <p>\u8f6f\u91cf\u5316\u662f\u4e00\u4e2a\u4e2d\u95f4\u5730\u5e26\uff1a\u4e0d\u662f\u786c \\(\\arg\\min\\) \u5206\u914d\uff0c\u800c\u662f\u8ba1\u7b97 top-\\(k\\) \u6700\u8fd1\u7801\u672c\u6761\u76ee\u7684\u52a0\u6743\u5e73\u5747\uff0c\u6743\u91cd\u7531\u8d1f\u8ddd\u79bb\u4e0a\u7684 softmax \u7ed9\u51fa\u3002\u8fd9\u6bd4\u786c\u91cf\u5316\u4fdd\u7559\u4e86\u66f4\u591a\u4fe1\u606f\uff0c\u540c\u65f6\u4ecd\u7136\u8fd1\u4f3c\u79bb\u6563\u3002\u6709\u4e9b\u7cfb\u7edf\u5728\u8bad\u7ec3\u65f6\u4f7f\u7528\u8f6f\u91cf\u5316\uff0c\u5728\u63a8\u7406\u65f6\u4f7f\u7528\u786c\u91cf\u5316\u3002</p> </li> </ul> <p></p>"},{"location":"chapter%2010%3A%20multimodal%20learning/03.%20image%20and%20video%20tokenisation/#_10","title":"\u5e94\u7528","text":""},{"location":"chapter%2010%3A%20multimodal%20learning/03.%20image%20and%20video%20tokenisation/#_11","title":"\u81ea\u56de\u5f52\u56fe\u50cf\u751f\u6210","text":"<ul> <li> <p>\u4e00\u65e6\u56fe\u50cf\u53d8\u6210\u79bb\u6563\u8bcd\u5143\u5e8f\u5217\uff0c\u4f60\u5c31\u53ef\u4ee5\u8bad\u7ec3\u6807\u51c6\u7684\u81ea\u56de\u5f52 Transformer \u6765\u5efa\u6a21\u5b83\u4eec\u3002\u56fe\u50cf\u8bcd\u5143\u88ab\u5c55\u5e73\u4e3a\u4e00\u7ef4\u5e8f\u5217\uff08\u901a\u5e38\u6309\u5149\u6805\u626b\u63cf\u987a\u5e8f\uff1a\u4ece\u5de6\u5230\u53f3\u3001\u4ece\u4e0a\u5230\u4e0b\uff09\uff0cTransformer \u5b66\u4e60 \\(p(\\text{\u8bcd\u5143}_i \\mid \\text{\u8bcd\u5143}_1, \\ldots, \\text{\u8bcd\u5143}_{i-1})\\)\uff0c\u4f7f\u7528\u6807\u51c6\u4ea4\u53c9\u71b5\u635f\u5931\u3002\u5728\u751f\u6210\u65f6\uff0c\u8bcd\u5143\u88ab\u9010\u4e2a\u91c7\u6837\uff0c\u5b8c\u6574\u7684\u7f51\u683c\u901a\u8fc7\u8bcd\u5143\u5316\u5668\u7684\u89e3\u7801\u5668\u8f6c\u6362\u4e3a\u50cf\u7d20\u3002</p> </li> <li> <p>\u6587\u672c\u6761\u4ef6\u5316\u5f88\u7b80\u5355\uff1a\u5728\u56fe\u50cf\u8bcd\u5143\u5e8f\u5217\u524d\u6dfb\u52a0\u6587\u672c\u8bcd\u5143\uff0c\u4f7f\u6a21\u578b\u5b66\u4e60 \\(p(\\text{\u56fe\u50cf\u8bcd\u5143} \\mid \\text{\u6587\u672c\u8bcd\u5143})\\)\u3002\u8fd9\u6b63\u662f DALL-E\u3001Parti \u548c LlamaGen \u6267\u884c\u6587\u751f\u56fe\u7684\u65b9\u5f0f\u3002\u6587\u672c\u8bcd\u5143\u548c\u56fe\u50cf\u8bcd\u5143\u5171\u4eab\u540c\u4e00\u4e2a Transformer\u3001\u540c\u4e00\u4e2a\u6ce8\u610f\u529b\u673a\u5236\uff0c\u5e76\u4e14\u901a\u5e38\u5171\u4eab\u540c\u4e00\u4e2a\u5d4c\u5165\u8868\uff08\u6587\u672c\u8bcd\u5143\u548c\u56fe\u50cf\u8bcd\u5143\u5360\u636e\u4e0d\u540c\u7684\u7d22\u5f15\u8303\u56f4\uff09\u3002</p> </li> <li> <p>\u5149\u6805\u626b\u63cf\u987a\u5e8f\u5f15\u5165\u4e86\u4e00\u79cd\u4eba\u4e3a\u7684\u975e\u5bf9\u79f0\u6027\uff1a\u56fe\u50cf\u7684\u5de6\u4e0a\u89d2\u662f\u5728\u6ca1\u6709\u4efb\u4f55\u5173\u4e8e\u53f3\u4e0b\u89d2\u4e0a\u4e0b\u6587\u7684\u60c5\u51b5\u4e0b\u9996\u5148\u751f\u6210\u7684\u3002\u4e00\u4e9b\u5de5\u4f5c\u89e3\u51b3\u4e86\u8fd9\u4e2a\u95ee\u9898\u3002\u63a9\u7801\u56fe\u50cf\u5efa\u6a21\uff08MaskGIT\uff09\u8bad\u7ec3\u4e86\u4e00\u4e2a\u53cc\u5411 Transformer\uff0c\u540c\u65f6\u751f\u6210\u6240\u6709\u8bcd\u5143\u4f46\u7f6e\u4fe1\u5ea6\u4e0d\u540c\uff0c\u8fed\u4ee3\u5730\u89e3\u5f00\u6700\u81ea\u4fe1\u7684\u8bcd\u5143\u3002\u591a\u5c3a\u5ea6\u751f\u6210\u9996\u5148\u751f\u6210\u7c97\u7c92\u5ea6\u8bcd\u5143\uff08\u6355\u6349\u5168\u5c40\u6784\u56fe\uff09\uff0c\u7136\u540e\u7528\u6b8b\u5dee\u8bcd\u5143\u8fdb\u884c\u7ec6\u5316\u3002\u8fd9\u4e9b\u65b9\u6cd5\u7528\u7eaf\u4ece\u5de6\u5230\u53f3\u751f\u6210\u7684\u7b80\u5355\u6027\u6362\u53d6\u4e86\u66f4\u597d\u7684\u5168\u5c40\u8fde\u8d2f\u6027\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/03.%20image%20and%20video%20tokenisation/#-","title":"\u7edf\u4e00\u7684\u89c6\u89c9-\u8bed\u8a00\u8bcd\u5143","text":"<ul> <li> <p>\u56fe\u50cf\u8bcd\u5143\u5316\u6700\u6df1\u523b\u7684\u52a8\u673a\u662f\u7edf\u4e00\uff1a\u5c06\u89c6\u89c9\u548c\u8bed\u8a00\u7f6e\u4e8e\u76f8\u540c\u7684\u8868\u793a\u683c\u5f0f\u4e2d\uff0c\u4f7f\u5f97\u5355\u4e2a\u6a21\u578b\u67b6\u6784\u53ef\u4ee5\u540c\u65f6\u5904\u7406\u4e24\u8005\u3002\u6b63\u5982\u6211\u4eec\u5728\u7b2c 7 \u7ae0\u4e2d\u8ba8\u8bba\u7684\uff0c\u8bed\u8a00\u6a21\u578b\u662f\u6781\u5176\u5f3a\u5927\u7684\u5e8f\u5217\u5230\u5e8f\u5217\u673a\u5668\u3002\u901a\u8fc7\u5c06\u56fe\u50cf\u8868\u793a\u4e3a\u8bcd\u5143\u5e8f\u5217\uff0c\u6211\u4eec\u514d\u8d39\u7ee7\u627f\u4e86\u8bed\u8a00\u5efa\u6a21\u7684\u6240\u6709\u57fa\u7840\u8bbe\u65bd\u2014\u2014\u9884\u8bad\u7ec3\u914d\u65b9\u3001\u7f29\u653e\u5b9a\u5f8b\u3001RLHF\u3001\u4e0a\u4e0b\u6587\u957f\u5ea6\u6269\u5c55\u3002</p> </li> <li> <p>Chameleon\uff08Meta\uff0c2024\uff09\u662f\u4e00\u4e2a\u7a81\u51fa\u7684\u4f8b\u5b50\uff1a\u5b83\u4f7f\u7528\u5177\u6709 8192 \u4e2a\u7801\u672c\u6761\u76ee\u7684 VQ-GAN \u8bcd\u5143\u5316\u5668\u5c06\u56fe\u50cf\u8f6c\u6362\u4e3a\u8bcd\u5143\uff0c\u8fd9\u4e9b\u8bcd\u5143\u4e0e\u6587\u672c\u8bcd\u5143\u4ea4\u7ec7\u5728\u4e00\u4e2a\u7ea6 65,000 \u4e2a\u6761\u76ee\uff08\u6587\u672c + \u56fe\u50cf\uff09\u7684\u5355\u4e00\u8bcd\u6c47\u8868\u4e2d\u3002\u6807\u51c6\u7684 Transformer \u5728\u6df7\u5408\u6587\u672c-\u56fe\u50cf\u5e8f\u5217\u4e0a\u8fdb\u884c\u8bad\u7ec3\uff0c\u4f7f\u5176\u80fd\u591f\u6839\u636e\u56fe\u50cf\u751f\u6210\u6587\u672c\u3001\u6839\u636e\u6587\u672c\u751f\u6210\u56fe\u50cf\u6216\u751f\u6210\u4ea4\u7ec7\u7684\u6587\u672c\u548c\u56fe\u50cf\u5185\u5bb9\uff0c\u5168\u90e8\u4f7f\u7528\u540c\u4e00\u6b21\u524d\u5411\u4f20\u64ad\u3002</p> </li> <li> <p>Gemini\uff08Google\uff0c2024\uff09\u5728\u5927\u89c4\u6a21\u4e0a\u91c7\u53d6\u4e86\u7c7b\u4f3c\u7684\u65b9\u6cd5\uff0c\u539f\u751f\u5730\u5728\u5355\u4e2a Transformer \u4e2d\u7406\u89e3\u5e76\u751f\u6210\u56fe\u50cf\u3001\u97f3\u9891\u548c\u6587\u672c\uff0c\u7531\u7279\u5b9a\u6a21\u6001\u7684\u8bcd\u5143\u5316\u5668\u9988\u9001\u5230\u5171\u4eab\u5e8f\u5217\u4e2d\u3002</p> </li> <li> <p>\u7edf\u4e00\u6a21\u578b\u4e2d\u7684\u5173\u952e\u5de5\u7a0b\u6311\u6218\u662f\u8bcd\u6c47\u8868\u5e73\u8861\uff1a\u5982\u679c 65,000 \u4e2a\u8bcd\u6c47\u8868\u6761\u76ee\u4e2d\u6709 8192 \u4e2a\u662f\u56fe\u50cf\u8bcd\u5143\uff0c\u6a21\u578b\u53ef\u80fd\u4f1a\u5206\u914d\u4e0d\u8db3\u7684\u80fd\u529b\u7ed9\u89c6\u89c9\u3002\u89e3\u51b3\u65b9\u6848\u5305\u62ec\u4e3a\u6bcf\u79cd\u6a21\u6001\u4f7f\u7528\u72ec\u7acb\u7684\u5d4c\u5165\u5c42\uff08\u4ec5\u5728\u6ce8\u610f\u529b\u5c42\u9762\u5171\u4eab\uff09\u3001\u7279\u5b9a\u6a21\u6001\u7684\u635f\u5931\u52a0\u6743\uff0c\u4ee5\u53ca\u9884\u8bad\u7ec3\u671f\u95f4\u4ed4\u7ec6\u7684\u6570\u636e\u6df7\u5408\u6bd4\u4f8b\u3002</p> </li> </ul> <p></p>"},{"location":"chapter%2010%3A%20multimodal%20learning/03.%20image%20and%20video%20tokenisation/#colab","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u5728 Colab \u6216\u7b14\u8bb0\u672c\u4e2d\u8fd0\u884c\uff09","text":"<ol> <li> <p>\u5728 JAX \u4e2d\u5b9e\u73b0\u4e00\u4e2a\u6700\u5c0f VQ \u5c42\uff1a\u7ed9\u5b9a\u4e00\u6279\u7f16\u7801\u5668\u8f93\u51fa\u5411\u91cf\uff0c\u6267\u884c\u6700\u8fd1\u90bb\u7801\u672c\u67e5\u627e\u5e76\u8ba1\u7b97 VQ-VAE \u635f\u5931\uff08\u91cd\u5efa + \u7801\u672c + \u627f\u8bfa\uff09\u3002\u5c06\u7801\u672c\u5229\u7528\u7387\u53ef\u89c6\u5316\u4e3a\u76f4\u65b9\u56fe\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# --- \u6700\u5c0f VQ \u5c42 ---\nkey = jax.random.PRNGKey(42)\nd = 8          # \u5d4c\u5165\u7ef4\u5ea6\nK = 64         # \u7801\u672c\u5927\u5c0f\nn_vectors = 256  # \u4e00\u6279\u7f16\u7801\u5668\u8f93\u51fa\n\n# \u968f\u673a\u7f16\u7801\u5668\u8f93\u51fa\u548c\u7801\u672c\nk1, k2 = jax.random.split(key)\nz_e = jax.random.normal(k1, (n_vectors, d))       # \u7f16\u7801\u5668\u8f93\u51fa\ncodebook = jax.random.normal(k2, (K, d)) * 0.1     # \u7801\u672c\uff08\u5c0f\u521d\u59cb\u5316\uff09\n\n# \u6700\u8fd1\u90bb\u67e5\u627e\uff1a\u4e3a\u6bcf\u4e2a z_e \u627e\u5230\u6700\u8fd1\u7684\u7801\u672c\u6761\u76ee\n# distances[i, k] = ||z_e[i] - codebook[k]||^2\ndistances = (\n    jnp.sum(z_e ** 2, axis=1, keepdims=True)\n    - 2 * z_e @ codebook.T\n    + jnp.sum(codebook ** 2, axis=1, keepdims=True).T\n)\nindices = jnp.argmin(distances, axis=1)       # \u8bcd\u5143\u7d22\u5f15\nz_q = codebook[indices]                        # \u91cf\u5316\u5411\u91cf\n\n# VQ-VAE \u635f\u5931\u9879\nbeta = 0.25\nloss_codebook = jnp.mean((jax.lax.stop_gradient(z_e) - z_q) ** 2)\nloss_commit   = jnp.mean((z_e - jax.lax.stop_gradient(z_q)) ** 2)\nloss_total    = loss_codebook + beta * loss_commit\nprint(f\"\u7801\u672c\u635f\u5931: {loss_codebook:.4f}, \u627f\u8bfa\u635f\u5931: {loss_commit:.4f}\")\n\n# \u7801\u672c\u5229\u7528\u7387\nunique, counts = jnp.unique(indices, return_counts=True, size=K, fill_value=-1)\nplt.figure(figsize=(10, 4))\nplt.bar(range(K), counts, color='#3498db', alpha=0.8)\nplt.xlabel('\u7801\u672c\u7d22\u5f15'); plt.ylabel('\u5206\u914d\u8ba1\u6570')\nplt.title(f'\u7801\u672c\u5229\u7528\u7387\uff08\u5df2\u4f7f\u7528 {jnp.sum(counts &gt; 0)}/{K} \u4e2a\u6761\u76ee\uff09')\nplt.grid(True, alpha=0.3); plt.tight_layout(); plt.show()\n# \u5c1d\u8bd5\uff1a\u5c06 K \u589e\u52a0\u5230 512 \u5e76\u89c2\u5bdf\u574d\u584c\u3002\u7136\u540e\u6dfb\u52a0\u7801\u672c\u91cd\u7f6e\u903b\u8f91\u3002\n</code></pre></p> </li> <li> <p>\u6784\u5efa\u4e00\u4e2a\u73a9\u5177 2D \u5411\u91cf\u91cf\u5316\u5668\uff0c\u5b66\u4e60\u5bf9 2D \u5206\u5e03\u8fdb\u884c\u5212\u5206\u3002\u751f\u6210\u968f\u673a 2D \u70b9\uff0c\u901a\u8fc7 EMA \u66f4\u65b0\u5b66\u4e60\u7801\u672c\uff0c\u5e76\u5c06 Voronoi \u533a\u57df\u53ef\u89c6\u5316\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u4ece\u9ad8\u65af\u6df7\u5408\u751f\u6210 2D \u6570\u636e\nkey = jax.random.PRNGKey(0)\nn_points = 2000\nK = 16  # \u7801\u672c\u6761\u76ee\u6570\ngamma = 0.99  # EMA \u8870\u51cf\n\n# \u56db\u4e2a\u7c07\nkeys = jax.random.split(key, 5)\ncentres = jnp.array([[2, 2], [-2, 2], [-2, -2], [2, -2]], dtype=jnp.float32)\ndata = jnp.concatenate([\n    jax.random.normal(keys[i], (n_points // 4, 2)) * 0.5 + centres[i]\n    for i in range(4)\n])\n\n# \u4ece\u968f\u673a\u6570\u636e\u70b9\u521d\u59cb\u5316\u7801\u672c\nidx = jax.random.choice(keys[4], n_points, (K,), replace=False)\ncodebook = data[idx]\nema_count = jnp.ones(K)\nema_sum = codebook.copy()\n\n# \u8fd0\u884c\u591a\u4e2a epoch \u7684\u57fa\u4e8e EMA \u7684\u7801\u672c\u5b66\u4e60\nfor epoch in range(30):\n    # \u5c06\u6bcf\u4e2a\u70b9\u5206\u914d\u7ed9\u6700\u8fd1\u7684\u7801\u672c\u6761\u76ee\n    dists = jnp.sum((data[:, None, :] - codebook[None, :, :]) ** 2, axis=2)\n    assignments = jnp.argmin(dists, axis=1)\n    # EMA \u66f4\u65b0\n    for k in range(K):\n        mask = (assignments == k)\n        count_k = jnp.sum(mask)\n        ema_count = ema_count.at[k].set(gamma * ema_count[k] + (1 - gamma) * count_k)\n        if count_k &gt; 0:\n            sum_k = jnp.sum(data[mask], axis=0)\n            ema_sum = ema_sum.at[k].set(gamma * ema_sum[k] + (1 - gamma) * sum_k)\n    codebook = ema_sum / ema_count[:, None]\n\n# \u53ef\u89c6\u5316\u5206\u914d\u548c\u7801\u672c\nfig, ax = plt.subplots(1, 1, figsize=(8, 8))\ncolors = plt.cm.tab20(jnp.linspace(0, 1, K))\nfor k in range(K):\n    mask = assignments == k\n    ax.scatter(data[mask, 0], data[mask, 1], c=[colors[k]], s=5, alpha=0.3)\nax.scatter(codebook[:, 0], codebook[:, 1], c='black', s=120, marker='X',\n           edgecolors='white', linewidths=1.5, zorder=10, label='\u7801\u672c')\nax.set_title(f'\u5728 2D \u6570\u636e\u4e0a\u5b66\u5f97\u7684 VQ \u7801\u672c\uff08{K} \u4e2a\u6761\u76ee\uff09')\nax.legend(); ax.set_aspect('equal'); ax.grid(True, alpha=0.3)\nplt.tight_layout(); plt.show()\n# \u5c1d\u8bd5\uff1a\u5c06 K \u589e\u52a0\u5230 64 \u5e76\u89c2\u5bdf\u66f4\u7cbe\u7ec6\u7684\u5212\u5206\u3002\u51cf\u5c0f gamma \u5e76\u89c2\u5bdf\u4e0d\u7a33\u5b9a\u6027\u3002\n</code></pre></p> </li> <li> <p>\u6f14\u793a\u6b8b\u5dee\u91cf\u5316\uff1a\u7528 \\(T\\) \u4e2a\u8fde\u7eed\u7684\u91cf\u5316\u9636\u6bb5\u5bf9\u4e00\u6279\u5411\u91cf\u8fdb\u884c\u7f16\u7801\uff0c\u5e76\u6d4b\u91cf\u6bcf\u4e2a\u5c42\u7ea7\u91cd\u5efa\u8bef\u5dee\u7684\u4e0b\u964d\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\nkey = jax.random.PRNGKey(7)\nd = 16         # \u5d4c\u5165\u7ef4\u5ea6\nK = 32         # \u6bcf\u4e2a\u5c42\u7ea7\u7684\u7801\u672c\u5927\u5c0f\nT = 8          # \u6b8b\u5dee\u5c42\u7ea7\u6570\nn_vectors = 512\n\n# \u5f85\u91cf\u5316\u7684\u968f\u673a\u6570\u636e\nk1, *cb_keys = jax.random.split(key, T + 1)\nz = jax.random.normal(k1, (n_vectors, d))\n\n# \u6bcf\u4e2a\u5c42\u7ea7\u7684\u72ec\u7acb\u968f\u673a\u7801\u672c\ncodebooks = [jax.random.normal(cb_keys[t], (K, d)) * (0.5 ** t)\n             for t in range(T)]\n\n# \u6b8b\u5dee\u91cf\u5316\u5faa\u73af\nresidual = z.copy()\nz_hat = jnp.zeros_like(z)\nerrors = []\n\nfor t in range(T):\n    cb = codebooks[t]\n    dists = (jnp.sum(residual ** 2, axis=1, keepdims=True)\n             - 2 * residual @ cb.T\n             + jnp.sum(cb ** 2, axis=1, keepdims=True).T)\n    indices = jnp.argmin(dists, axis=1)\n    z_q_t = cb[indices]\n    z_hat = z_hat + z_q_t\n    residual = residual - z_q_t\n    mse = jnp.mean(jnp.sum((z - z_hat) ** 2, axis=1))\n    errors.append(float(mse))\n    print(f\"\u5c42\u7ea7 {t+1}: MSE = {mse:.4f}\")\n\nplt.figure(figsize=(8, 5))\nplt.plot(range(1, T + 1), errors, 'o-', color='#e74c3c', linewidth=2, markersize=8)\nplt.xlabel('\u6b8b\u5dee\u91cf\u5316\u5c42\u7ea7')\nplt.ylabel('\u91cd\u5efa MSE')\nplt.title('\u6b8b\u5dee\u91cf\u5316\u7684\u8bef\u5dee\u964d\u4f4e')\nplt.xticks(range(1, T + 1)); plt.grid(True, alpha=0.3)\nplt.tight_layout(); plt.show()\n# \u5c1d\u8bd5\uff1a\u4f7f\u7528\u5927\u5c0f\u4e3a K*T \u7684\u5355\u4e2a\u7801\u672c\u5e76\u4e0e RQ \u6bd4\u8f83\u3002\u54ea\u4e2a\u66f4\u597d\uff1f\n</code></pre></p> </li> <li> <p>\u6a21\u62df\u4e00\u4e2a\u7b80\u5355\u7684 1D\"\u89c6\u9891\u8bcd\u5143\u5316\u5668\"\uff1a\u751f\u6210\u4e00\u7cfb\u5217 1D \u4fe1\u53f7\uff08\u6a21\u62df\u89c6\u9891\u5e27\uff09\uff0c\u5e94\u7528\u56e0\u679c\u65f6\u95f4\u538b\u7f29\uff0c\u5e76\u4e0e\u65e0\u56e0\u679c\u538b\u7f29\u5728\u91cd\u5efa\u8d28\u91cf\u65b9\u9762\u8fdb\u884c\u6bd4\u8f83\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\nkey = jax.random.PRNGKey(99)\nn_frames = 16\nframe_len = 64\n\n# \u751f\u6210\u4e00\u4e2a\"\u89c6\u9891\"\uff1a\u5728\u5e27\u95f4\u7f13\u6162\u79fb\u52a8\u7684\u9ad8\u65af\u51f8\u8d77\nx_axis = jnp.linspace(-3, 3, frame_len)\nframes = jnp.stack([\n    jnp.exp(-0.5 * (x_axis - (-2 + 4 * t / n_frames)) ** 2)\n    for t in range(n_frames)\n])  # \u5f62\u72b6: (n_frames, frame_len)\n\n# \u56e0\u679c\u65f6\u95f4\u538b\u7f29\uff1a\u6bcf\u5e27\u7684\u7f16\u7801\u4ec5\u4f9d\u8d56\u4e8e\u8fc7\u53bb\u7684\u5e27\n# \u7b80\u5355\u65b9\u6cd5\uff1a\u4f7f\u7528\u8fc7\u53bb\u5e27\u7684\u6307\u6570\u8870\u51cf\u5bf9\u5f53\u524d\u5e27\u8fdb\u884c\u5e73\u5747\nalpha_causal = 0.6\ncausal_codes = jnp.zeros_like(frames)\ncausal_codes = causal_codes.at[0].set(frames[0])\nfor t in range(1, n_frames):\n    causal_codes = causal_codes.at[t].set(\n        alpha_causal * frames[t] + (1 - alpha_causal) * causal_codes[t - 1]\n    )\n\n# \u65e0\u56e0\u679c\uff1a\u540c\u65f6\u5e73\u5747\u8fc7\u53bb\u548c\u672a\u6765\uff08\u53cc\u8fb9\u5e73\u6ed1\uff09\nkernel = jnp.array([0.2, 0.6, 0.2])  # \u8fc7\u53bb, \u5f53\u524d, \u672a\u6765\npadded = jnp.concatenate([frames[:1], frames, frames[-1:]], axis=0)\nnoncausal_codes = jnp.stack([\n    kernel[0] * padded[t] + kernel[1] * padded[t+1] + kernel[2] * padded[t+2]\n    for t in range(n_frames)\n])\n\n# \u91cd\u5efa\u8bef\u5dee\nmse_causal = jnp.mean((frames - causal_codes) ** 2)\nmse_noncausal = jnp.mean((frames - noncausal_codes) ** 2)\nprint(f\"\u56e0\u679c MSE: {mse_causal:.6f}, \u65e0\u56e0\u679c MSE: {mse_noncausal:.6f}\")\n\nfig, axes = plt.subplots(1, 3, figsize=(15, 5))\nfor ax, data, title in zip(axes,\n    [frames, causal_codes, noncausal_codes],\n    ['\u539f\u59cb\u5e27', f'\u56e0\u679c (MSE={mse_causal:.5f})',\n     f'\u65e0\u56e0\u679c (MSE={mse_noncausal:.5f})']):\n    ax.imshow(data, aspect='auto', cmap='viridis', origin='lower')\n    ax.set_xlabel('\u7a7a\u95f4\u4f4d\u7f6e'); ax.set_ylabel('\u5e27\u7d22\u5f15')\n    ax.set_title(title)\nplt.tight_layout(); plt.show()\n# \u5c1d\u8bd5\uff1a\u6539\u53d8 alpha_causal \u548c\u6838\u6743\u91cd\u3002alpha=1.0 \u65f6\u4f1a\u53d1\u751f\u4ec0\u4e48\uff1f\n</code></pre></p> </li> </ol>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/","title":"\u8de8\u6a21\u6001\u751f\u6210 (Cross-Modal Generation)","text":"<p>\u8de8\u6a21\u6001\u751f\u6210\uff08cross-modal generation\uff09\u662f\u6307\u4ee5\u67d0\u4e00\u6a21\u6001\u7684\u8f93\u5165\u4e3a\u6761\u4ef6\uff0c\u751f\u6210\u53e6\u4e00\u6a21\u6001\u7684\u8f93\u51fa\u2014\u2014\u4ece\u6587\u751f\u56fe\u3001\u56fe\u751f\u6587\u3001\u6587\u751f\u97f3\u9891\uff0c\u4e43\u81f3\u66f4\u591a\u3002\u672c\u7ae0\u6db5\u76d6 DALL\u00b7E\u3001Stable Diffusion\u3001\u65e0\u5206\u7c7b\u5668\u5f15\u5bfc\u3001ControlNet\u3001\u56fe\u50cf\u63cf\u8ff0\u3001\u6587\u751f\u89c6\u9891\uff08Sora\uff09\u4ee5\u53ca\u6587\u751f\u97f3\u9891\u751f\u6210\u3002</p> <ul> <li> <p>\u5728\u672c\u7ae0\u7684\u6587\u4ef6 01-03 \u4e2d\uff0c\u4f60\u5df2\u7ecf\u5b66\u4e60\u4e86\u5982\u4f55\u8868\u793a\u3001\u5bf9\u9f50\u548c\u5206\u8bcd\u4e0d\u540c\u6a21\u6001\u3002\u73b0\u5728\u8f6e\u5230\u521b\u9020\u6027\u7684\u73af\u8282\u4e86\uff1a\u4ece\u4e00\u4e2a\u6a21\u6001\u751f\u6210\u53e6\u4e00\u4e2a\u6a21\u6001\u3002\u8de8\u6a21\u6001\u751f\u6210\u662f\u6587\u751f\u56fe\u5de5\u5177\u3001\u89c6\u9891\u5408\u6210\u7cfb\u7edf\u3001\u97f3\u4e50\u521b\u4f5c\u6a21\u578b\u548c\u56fe\u50cf\u63cf\u8ff0\u80cc\u540e\u7684\u5f15\u64ce\u3002\u53ef\u4ee5\u5c06\u5176\u7406\u89e3\u4e3a\u6559\u4f1a\u673a\u5668\u6210\u4e3a\u591a\u5a92\u4f53\u827a\u672f\u5bb6\u2014\u2014\u4f60\u7528\u6587\u5b57\u63cf\u8ff0\u4f60\u60f3\u8981\u7684\u5185\u5bb9\uff0c\u673a\u5668\u5219\u8d1f\u8d23\u7ed8\u753b\u3001\u52a8\u753b\u6216\u4f5c\u66f2\u3002</p> </li> <li> <p>\u6838\u5fc3\u601d\u60f3\u662f\u6761\u4ef6\u751f\u6210\uff08conditional generation\uff09\uff1a\u7ed9\u5b9a\u6765\u81ea\u6a21\u6001 \\(A\\)\uff08\u4f8b\u5982\u6587\u672c\uff09\u7684\u8f93\u5165\uff0c\u751f\u6210\u6a21\u6001 \\(B\\)\uff08\u4f8b\u5982\u56fe\u50cf\uff09\u7684\u8f93\u51fa\u3002\u5f62\u5f0f\u4e0a\uff0c\u6211\u4eec\u5b66\u4e60\u6a21\u578b \\(p_\\theta(y \\mid x)\\)\uff0c\u5176\u4e2d \\(x\\) \u662f\u6761\u4ef6\u4fe1\u53f7\uff0c\\(y\\) \u662f\u751f\u6210\u7684\u8f93\u51fa\u3002\u6311\u6218\u5728\u4e8e\u8fd9\u4e2a\u6761\u4ef6\u5206\u5e03\u6781\u5176\u590d\u6742\u4e14\u7ef4\u5ea6\u6781\u9ad8\u2014\u2014\u4e00\u5f20 512x512 \u7684\u56fe\u50cf\u5b58\u5728\u4e8e \\(\\mathbb{R}^{786432}\\) \u4e2d\uff0c\u800c\u5bf9\u4e8e\u540c\u4e00\u4e2a\u6587\u672c\u63d0\u793a\uff0c\u53ef\u80fd\u6709\u65e0\u6570\u5f20\u5408\u7406\u7684\u56fe\u50cf\u3002</p> </li> </ul> <p></p>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#text-to-image-generation","title":"\u6587\u751f\u56fe\u751f\u6210 (Text-to-Image Generation)","text":"<ul> <li>\u60f3\u8c61\u4f60\u5411\u6cd5\u5ead\u7d20\u63cf\u5e08\u63cf\u8ff0\u4e00\u4e2a\u573a\u666f\u3002\u7d20\u63cf\u5e08\u5fc5\u987b\u7406\u89e3\u4f60\u7684\u8bdd\uff0c\u56de\u5fc6\u7269\u4f53\u957f\u4ec0\u4e48\u6837\uff0c\u5728\u7a7a\u95f4\u4e0a\u6392\u5e03\u5b83\u4eec\uff0c\u6700\u540e\u753b\u51fa\u6700\u7ec8\u7684\u56fe\u753b\u3002\u6587\u751f\u56fe\u6a21\u578b\u6b63\u662f\u505a\u8fd9\u4ef6\u4e8b\uff0c\u4f46\u5b83\u4eec\u5fc5\u987b\u4ece\u6570\u636e\u4e2d\u5b66\u4e60\u6240\u6709\u8fd9\u4e9b\u6280\u80fd\uff0c\u800c\u4e0d\u662f\u7ecf\u8fc7\u591a\u5e74\u7684\u827a\u672f\u9662\u6821\u8bad\u7ec3\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#dalle","title":"DALL\u00b7E\uff1a\u81ea\u56de\u5f52\u56fe\u50cf\u751f\u6210","text":"<ul> <li> <p>DALL\u00b7E\uff08Ramesh \u7b49\u4eba\uff0c2021\uff09\u5c06\u56fe\u50cf\u751f\u6210\u89c6\u4e3a\u4e00\u4e2a\u5e8f\u5217\u9884\u6d4b\u95ee\u9898\u2014\u2014\u8fd9\u6b63\u662f\u8bed\u8a00\u6a21\u578b\u6240\u91c7\u7528\u7684\u8303\u5f0f\uff08\u89c1\u7b2c 07 \u7ae0\uff09\u3002\u5176\u5173\u952e\u6d1e\u5bdf\u662f\uff1a\u5982\u679c\u4f60\u80fd\u5c06\u56fe\u50cf\u8868\u793a\u4e3a\u79bb\u6563 token\uff08\u56de\u987e\u6587\u4ef6 03 \u4e2d\u7684 VQ-VAE\uff09\uff0c\u90a3\u4e48\u751f\u6210\u56fe\u50cf\u5c31\u53ea\u662f\u9010\u4e2a\u751f\u6210 token \u5e8f\u5217\u7684\u8fc7\u7a0b\u3002</p> </li> <li> <p>\u5176\u6d41\u7a0b\u5206\u4e3a\u4e24\u4e2a\u9636\u6bb5\u3002\u9996\u5148\uff0c\u4e00\u4e2a\u79bb\u6563 VAE\uff08dVAE\uff09\u5c06 256x256 \u7684\u56fe\u50cf\u538b\u7f29\u6210 32x32 \u7684\u79bb\u6563 token \u7f51\u683c\uff0c\u7801\u672c\u5927\u5c0f\u4e3a 8192\uff0c\u5c06\u56fe\u50cf\u7b80\u5316\u4e3a 1024 \u4e2a token \u7684\u5e8f\u5217\u3002\u5176\u6b21\uff0c\u4e00\u4e2aTransformer \u89e3\u7801\u5668\u88ab\u8bad\u7ec3\u6765\u5efa\u6a21 256 \u4e2a\u6587\u672c token\uff08BPE \u7f16\u7801\uff09\u4e0e 1024 \u4e2a\u56fe\u50cf token \u62fc\u63a5\u540e\u7684\u8054\u5408\u5206\u5e03\uff0c\u603b\u8ba1 1280 \u4e2a token\uff1a</p> </li> </ul> \\[p(x_{\\text{text}}, x_{\\text{img}}) = \\prod_{i=1}^{1280} p(x_i \\mid x_1, \\ldots, x_{i-1})\\] <ul> <li> <p>\u5728\u751f\u6210\u65f6\uff0c\u8f93\u5165\u6587\u672c token\uff0c\u6a21\u578b\u81ea\u56de\u5f52\u5730\u9010\u4e2a\u91c7\u6837\u56fe\u50cf token\u3002\u8fd9\u79cd\u65b9\u6cd5\u4f18\u96c5\u4e4b\u5904\u5728\u4e8e\u5b83\u590d\u7528\u4e86\u8bed\u8a00\u5efa\u6a21\u7684\u5b8c\u6574\u673a\u5236\u2014\u2014\u6ce8\u610f\u529b\u3001\u56e0\u679c\u63a9\u7801\u3001top-k \u91c7\u6837\u2014\u2014\u6765\u5b8c\u6210\u56fe\u50cf\u5408\u6210\u3002</p> </li> <li> <p>\u7f3a\u70b9\u662f\u81ea\u56de\u5f52\u751f\u6210\u672c\u8d28\u4e0a\u662f\u4e32\u884c\u7684\uff1a\u9010\u4e2a\u751f\u6210 1024 \u4e2a token \u901f\u5ea6\u5f88\u6162\uff0c\u800c\u4e14\u5e8f\u5217\u65e9\u671f\u7684\u4efb\u4f55\u9519\u8bef\u90fd\u4f1a\u88ab\u653e\u5927\u3002DALL\u00b7E \u901a\u8fc7\u751f\u6210\u5927\u91cf\u5019\u9009\u56fe\u50cf\u5e76\u7528 CLIP\uff08\u6765\u81ea\u6587\u4ef6 01\uff09\u8fdb\u884c\u91cd\u6392\u5e8f\u6765\u7f13\u89e3\u8fd9\u4e00\u95ee\u9898\uff0c\u4ee5\u627e\u5230\u4e0e\u6587\u672c\u63d0\u793a\u6700\u5339\u914d\u7684\u7ed3\u679c\u3002</p> </li> </ul> <p></p>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#stable-diffusion","title":"Stable Diffusion\uff1a\u5e26\u6587\u672c\u6761\u4ef6\u7684\u9690\u7a7a\u95f4\u6269\u6563","text":"<ul> <li> <p>Stable Diffusion\uff08Rombach \u7b49\u4eba\uff0c2022\uff09\u91c7\u7528\u4e86\u4e00\u79cd\u6839\u672c\u4e0d\u540c\u7684\u65b9\u6cd5\u3002\u5b83\u4e0d\u662f\u9010\u4e2a\u9884\u6d4b token\uff0c\u800c\u662f\u4ece\u7eaf\u566a\u58f0\u5f00\u59cb\uff0c\u5728\u6587\u672c\u63d0\u793a\u7684\u5f15\u5bfc\u4e0b\u9010\u6b65\u5c06\u566a\u58f0\u53bb\u566a\u6210\u56fe\u50cf\u3002\u56de\u987e\u7b2c 8 \u7ae0\u4e2d\u7684\u6269\u6563\u6a21\u578b\u2014\u2014Stable Diffusion \u5728\u538b\u7f29\u540e\u7684\u9690\u7a7a\u95f4\uff08latent space\uff09\u800c\u975e\u50cf\u7d20\u7a7a\u95f4\u4e2d\u8fd0\u884c\uff0c\u56e0\u6b64\u6548\u7387\u5927\u5e45\u63d0\u5347\u3002</p> </li> <li> <p>\u5176\u67b6\u6784\u7531\u4e09\u4e2a\u7ec4\u4ef6\u534f\u540c\u5de5\u4f5c\u3002VAE \u7f16\u7801\u5668\u5c06\u56fe\u50cf\u4ece\u50cf\u7d20\u7a7a\u95f4\uff08\\(512 \\times 512 \\times 3\\)\uff09\u538b\u7f29\u4e3a\u9690\u7a7a\u95f4\u8868\u793a\uff08\\(64 \\times 64 \\times 4\\)\uff09\uff0c\u5c06\u7ef4\u5ea6\u964d\u4f4e\u4e86 48 \u500d\u3002\u6587\u672c\u7f16\u7801\u5668\uff08\u901a\u5e38\u4e3a CLIP \u6216 OpenCLIP\uff09\u5c06\u6587\u672c\u63d0\u793a\u8f6c\u6362\u4e3a\u5d4c\u5165\u5411\u91cf\u5e8f\u5217\u3002U-Net \u53bb\u566a\u5668\u63a5\u6536\u542b\u566a\u9690\u53d8\u91cf\u3001\u65f6\u95f4\u6b65\u548c\u6587\u672c\u5d4c\u5165\uff0c\u5e76\u9884\u6d4b\u6bcf\u4e00\u6b65\u9700\u8981\u51cf\u53bb\u7684\u566a\u58f0\u3002\u6587\u672c\u6761\u4ef6\u901a\u8fc7\u4ea4\u53c9\u6ce8\u610f\u529b\uff08cross-attention\uff09\u5c42\u8fdb\u5165 U-Net\uff1a</p> </li> </ul> \\[\\text{Attention}(Q, K, V) = \\text{softmax}\\left(\\frac{QK^T}{\\sqrt{d}}\\right)V\\] <ul> <li> <p>\u5176\u4e2d \\(Q\\) \u6765\u81ea\u542b\u566a\u56fe\u50cf\u7279\u5f81\uff0c\\(K\\) \u548c \\(V\\) \u6765\u81ea\u6587\u672c\u5d4c\u5165\u3002\u8fd9\u4f7f\u5f97\u6a21\u578b\u80fd\u591f\u5728\u6bcf\u4e2a\u7a7a\u95f4\u4f4d\u7f6e\u4e0a\u5173\u6ce8\u76f8\u5173\u7684\u8bcd\u8bed\u2014\u2014\u5f53\u53bb\u566a\"\u7ea2\u7403\"\u5e94\u8be5\u51fa\u73b0\u7684\u533a\u57df\u65f6\uff0c\u6a21\u578b\u4f1a\u5173\u6ce8\"\u7ea2\"\u548c\"\u7403\"\u8fd9\u4e24\u4e2a token\u3002</p> </li> <li> <p>\u5728\u63a8\u7406\u65f6\uff0c\u4f60\u5728\u9690\u7a7a\u95f4\u4e2d\u91c7\u6837 \\(z_T \\sim \\mathcal{N}(0, I)\\)\uff0c\u5229\u7528 U-Net \u8fed\u4ee3\u53bb\u566a \\(T\\) \u6b65\uff08\u901a\u5e38\u4f7f\u7528 DDIM \u8c03\u5ea6\u4e3a 20-50 \u6b65\uff09\uff0c\u7136\u540e\u7528 VAE \u89e3\u7801\u5668\u5c06\u5e72\u51c0\u7684\u9690\u53d8\u91cf \\(z_0\\) \u89e3\u7801\u56de\u50cf\u7d20\u7a7a\u95f4\u3002\u6574\u4e2a\u524d\u5411\u8fc7\u7a0b\u5728\u6d88\u8d39\u7ea7 GPU \u4e0a\u4ec5\u9700\u6570\u79d2\u5373\u53ef\u751f\u6210\u4e00\u5f20 512x512 \u7684\u56fe\u50cf\u3002</p> </li> </ul> <p></p>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#_1","title":"\u65e0\u5206\u7c7b\u5668\u5f15\u5bfc\u7684\u5b9e\u8df5\u5e94\u7528","text":"<ul> <li>\u65e0\u5206\u7c7b\u5668\u5f15\u5bfc\uff08Classifier-Free Guidance\uff0cCFG\uff09\u662f\u8ba9\u6587\u751f\u56fe\u6a21\u578b\u80fd\u591f\u751f\u6210\u4e0e\u63d0\u793a\u771f\u6b63\u5339\u914d\u7684\u56fe\u50cf\u7684\u5173\u952e\u8981\u7d20\u3002\u56de\u987e\u7b2c 8 \u7ae0\uff0cCFG \u540c\u65f6\u8bad\u7ec3\u6761\u4ef6\u6a21\u578b\u548c\u65e0\u6761\u4ef6\u6a21\u578b\uff0c\u7136\u540e\u5728\u91c7\u6837\u65f6\u653e\u5927\u6761\u4ef6\u4fe1\u53f7\uff1a</li> </ul> \\[\\hat{\\epsilon} = \\epsilon_\\theta(x_t, \\varnothing) + s \\cdot (\\epsilon_\\theta(x_t, c) - \\epsilon_\\theta(x_t, \\varnothing))\\] <ul> <li> <p>\u5176\u4e2d \\(s\\) \u662f\u5f15\u5bfc\u5c3a\u5ea6\u3002\u53ef\u4ee5\u5c06 \\((\\epsilon_\\theta(x_t, c) - \\epsilon_\\theta(x_t, \\varnothing))\\) \u7406\u89e3\u4e3a\"\u671d\u5411\u63d0\u793a\u7684\u65b9\u5411\"\u2014\u2014\u5b83\u6355\u6349\u4e86\u6709\u6761\u4ef6\u9884\u6d4b\u4e0e\u65e0\u6761\u4ef6\u9884\u6d4b\u4e4b\u95f4\u7684\u5dee\u5f02\u3002\u4e58\u4ee5 \\(s &gt; 1\\) \u4f1a\u653e\u5927\u8fd9\u4e2a\u65b9\u5411\uff0c\u5c06\u56fe\u50cf\u63a8\u8fd1\u6587\u672c\u63cf\u8ff0\uff0c\u4f46\u4ee3\u4ef7\u662f\u591a\u6837\u6027\u964d\u4f4e\u3002</p> </li> <li> <p>\u5728\u5b9e\u8df5\u4e2d\uff0cStable Diffusion \u7684\u5e38\u7528\u9ed8\u8ba4\u503c\u4e3a \\(s = 7.5\\)\u3002\u5f53 \\(s = 1.0\\) \u65f6\u5f97\u5230\u6a21\u578b\u7684\u539f\u59cb\u8f93\u51fa\uff08\u591a\u6837\u4f46\u4ec5\u677e\u6563\u5339\u914d\u63d0\u793a\uff09\u3002\u5f53 \\(s \\geq 20\\) \u65f6\u56fe\u50cf\u53d8\u5f97\u8fc7\u9971\u548c\u4e14\u91cd\u590d\uff0c\u4f46\u4e0e\u6587\u672c\u9ad8\u5ea6\u4e00\u81f4\u3002\u6700\u4f18 \\(s\\) \u503c\u53d6\u51b3\u4e8e\u5e94\u7528\u573a\u666f\uff1a\u521b\u610f\u63a2\u7d22\u503e\u5411\u4e8e\u8f83\u4f4e\u7684\u5f15\u5bfc\u503c\uff0c\u800c\u7cbe\u786e\u9075\u5faa\u63d0\u793a\u5219\u9700\u8981\u66f4\u9ad8\u7684\u5f15\u5bfc\u503c\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#imagen","title":"Imagen\uff1a\u57fa\u4e8e\u8bed\u8a00\u7406\u89e3\u7684\u7ea7\u8054\u6269\u6563","text":"<ul> <li> <p>Imagen\uff08Saharia \u7b49\u4eba\uff0c2022\uff09\u8bc1\u660e\u4e86\u5f3a\u5927\u7684\u6587\u672c\u7f16\u7801\u5668\u6bd4\u66f4\u5927\u7684\u56fe\u50cf\u6a21\u578b\u66f4\u91cd\u8981\u3002Imagen \u6ca1\u6709\u4f7f\u7528 CLIP\uff0c\u800c\u662f\u91c7\u7528\u4e00\u4e2a\u51bb\u7ed3\u7684 T5-XXL \u8bed\u8a00\u6a21\u578b\uff08\u6765\u81ea\u7b2c 07 \u7ae0\uff09\u4f5c\u4e3a\u6587\u672c\u7f16\u7801\u5668\uff0c\u8be5\u6a21\u578b\u5bf9\u8bed\u8a00\u8bed\u4e49\u3001\u7ec4\u5408\u6027\u548c\u7a7a\u95f4\u5173\u7cfb\uff08\u5982\"\u7ea2\u8272\u7403\u4f53\u4e0a\u7684\u84dd\u8272\u65b9\u5757\"\uff09\u6709\u7740\u66f4\u4e30\u5bcc\u7684\u7406\u89e3\u3002</p> </li> <li> <p>Imagen \u4f7f\u7528\u4e86\u7ea7\u8054\u6269\u6563\uff08cascaded diffusion\uff09\u65b9\u6cd5\uff1a\u57fa\u7840\u6269\u6563\u6a21\u578b\u751f\u6210 64x64 \u7684\u56fe\u50cf\uff0c\u7b2c\u4e00\u4e2a\u8d85\u5206\u8fa8\u7387\u6a21\u578b\u653e\u5927\u5230 256x256\uff0c\u7b2c\u4e8c\u4e2a\u8d85\u5206\u8fa8\u7387\u6a21\u578b\u8fbe\u5230 1024x1024\u3002\u6bcf\u4e2a\u9636\u6bb5\u90fd\u662f\u72ec\u7acb\u7684\u6269\u6563\u6a21\u578b\uff0c\u4ee5\u6587\u672c\u548c\uff08\u5bf9\u4e8e\u4e0a\u91c7\u6837\u5668\uff09\u4f4e\u5206\u8fa8\u7387\u56fe\u50cf\u4e3a\u6761\u4ef6\u3002\u8fd9\u79cd\u7ea7\u8054\u65b9\u5f0f\u907f\u514d\u4e86\u5728\u57fa\u7840\u5206\u8fa8\u7387\u4e0a\u5efa\u6a21\u7cbe\u7ec6\u7ec6\u8282\uff0c\u4f7f\u57fa\u7840\u6a21\u578b\u80fd\u591f\u4e13\u6ce8\u4e8e\u6784\u56fe\u548c\u8bed\u4e49\uff0c\u800c\u4e0a\u91c7\u6837\u5668\u5219\u8d1f\u8d23\u5904\u7406\u7eb9\u7406\u548c\u6e05\u6670\u5ea6\u3002</p> </li> <li> <p>Imagen \u8fd8\u5f15\u5165\u4e86\u52a8\u6001\u9608\u503c\uff08dynamic thresholding\uff09\uff1a\u5728\u6bcf\u4e2a\u53bb\u566a\u6b65\u9aa4\u4e2d\uff0c\u9884\u6d4b\u7684\u50cf\u7d20\u503c\u88ab\u88c1\u526a\u5230\u57fa\u4e8e\u767e\u5206\u4f4d\u6570\u7684\u8303\u56f4\uff0c\u800c\u4e0d\u662f\u56fa\u5b9a\u7684 \\([-1, 1]\\) \u8303\u56f4\u3002\u8fd9\u53ef\u4ee5\u9632\u6b62\u5728\u9ad8\u5f15\u5bfc\u5c3a\u5ea6\u4e0b\u51fa\u73b0\u9971\u548c\u4f2a\u5f71\uff0c\u8fd9\u662f\u6269\u6563\u6a21\u578b\u4e2d\u7684\u5e38\u89c1\u95ee\u9898\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#parti","title":"Parti\uff1a\u5927\u89c4\u6a21\u81ea\u56de\u5f52","text":"<ul> <li> <p>Parti\uff08Pathways Autoregressive Text-to-Image\uff0cYu \u7b49\u4eba\uff0c2022\uff09\u4ee5\u8d85\u5927\u5c3a\u5ea6\u590d\u5174\u4e86\u81ea\u56de\u5f52\u65b9\u6cd5\u3002\u4e0e DALL\u00b7E \u7c7b\u4f3c\uff0c\u5b83\u5c06\u56fe\u50cf\u8f6c\u6362\u4e3a\u79bb\u6563 token\uff08\u4f7f\u7528 ViT-VQGAN\uff09\uff0c\u5e76\u7528 Transformer \u987a\u5e8f\u751f\u6210\u3002\u4f46 Parti \u4f7f\u7528\u4e86 200 \u4ebf\u53c2\u6570\u7684\u7f16\u7801\u5668-\u89e3\u7801\u5668 Transformer\uff08\u57fa\u4e8e Pathways \u67b6\u6784\uff09\uff0c\u5e76\u8bc1\u660e\u4e86\u81ea\u56de\u5f52\u6a21\u578b\u5728\u5145\u5206\u6269\u5c55\u540e\u53ef\u4ee5\u8fbe\u5230\u6269\u6563\u6a21\u578b\u7684\u8d28\u91cf\u3002</p> </li> <li> <p>Parti \u7684\u7f16\u7801\u5668-\u89e3\u7801\u5668\u67b6\u6784\u662f\u4e0e DALL\u00b7E \u7eaf\u89e3\u7801\u5668\u8bbe\u8ba1\u7684\u5173\u952e\u533a\u522b\u3002\u6587\u672c\u901a\u8fc7\u7f16\u7801\u5668\u5904\u7406\uff1b\u89e3\u7801\u5668\u5728\u751f\u6210\u56fe\u50cf token \u65f6\uff0c\u901a\u8fc7\u4ea4\u53c9\u6ce8\u610f\u529b\u5173\u6ce8\u7f16\u7801\u540e\u7684\u6587\u672c\u3002\u8fd9\u7c7b\u4f3c\u4e8e\u673a\u5668\u7ffb\u8bd1\uff08\u7b2c 07 \u7ae0\uff09\u2014\u2014\u4f60\u4ece\"\u6587\u672c\u8bed\u8a00\"\u7ffb\u8bd1\u5230\"\u56fe\u50cf\u8bed\u8a00\"\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#dit","title":"DiT \u4e0e\u57fa\u4e8e\u6d41\u5339\u914d\u7684\u751f\u6210","text":"<ul> <li> <p>\u6269\u6563 Transformer\uff08DiT\uff09\uff08Peebles \u548c Xie\uff0c2023\uff09\u7528\u7eaf Transformer \u66ff\u6362\u4e86\u6269\u6563\u6a21\u578b\u4e2d\u7684 U-Net \u4e3b\u5e72\u7f51\u7edc\u3002\u6bcf\u4e2a\u542b\u566a\u9690\u7a7a\u95f4\u5757\u88ab\u5f53\u4f5c\u4e00\u4e2a token\uff08\u7c7b\u4f3c\u4e8e\u7b2c 8 \u7ae0\u4e2d\u7684 ViT\uff09\uff0cTransformer \u901a\u8fc7\u81ea\u6ce8\u610f\u529b\u548c\u5bf9\u6587\u672c\u6761\u4ef6\u7684\u4ea4\u53c9\u6ce8\u610f\u529b\u6765\u5904\u7406\u8fd9\u4e9b token\u3002DiT \u8868\u660e\uff0c\u5728\u6269\u6563\u4efb\u52a1\u4e2d\uff0cTransformer \u7684\u53ef\u6269\u5c55\u6027\u6bd4 U-Net \u66f4\u5177\u53ef\u9884\u6d4b\u6027\u2014\u2014\u8ba1\u7b97\u91cf\u6bcf\u7ffb\u4e00\u500d\uff0cFID \u5206\u6570\u5c31\u4f1a\u53ef\u9760\u5730\u51cf\u534a\u3002</p> </li> <li> <p>\u6d41\u5339\u914d\uff08flow matching\uff09\uff08\u56de\u987e\u7b2c 8 \u7ae0\uff09\u5df2\u6210\u4e3a\u6269\u6563\u566a\u58f0\u9884\u6d4b\u8303\u5f0f\u4e4b\u5916\u7684\u4e00\u79cd\u66ff\u4ee3\u65b9\u6848\u3002\u6a21\u578b\u4e0d\u518d\u9884\u6d4b\u9700\u8981\u51cf\u53bb\u7684\u566a\u58f0 \\(\\epsilon\\)\uff0c\u800c\u662f\u9884\u6d4b\u4e00\u4e2a\u901f\u5ea6\u573a \\(v_\\theta(x_t, t)\\)\uff0c\u8be5\u901f\u5ea6\u573a\u6cbf\u76f4\u7ebf\u8def\u5f84\u5c06\u6837\u672c\u4ece\u566a\u58f0\u4f20\u8f93\u5230\u6570\u636e\u3002Stable Diffusion 3 \u548c Flux \u91c7\u7528\u6d41\u5339\u914d\u548c\u591a\u6a21\u6001 DiT\uff08MM-DiT\uff09\u67b6\u6784\uff0c\u5176\u4e2d\u6587\u672c\u548c\u56fe\u50cf token \u7531 Transformer \u5757\u901a\u8fc7\u53cc\u5411\u6ce8\u610f\u529b\u8054\u5408\u5904\u7406\u2014\u2014\u4e24\u79cd\u6a21\u6001\u4e92\u76f8\u5173\u6ce8\uff0c\u800c\u4e0d\u662f\u6587\u672c\u4ec5\u901a\u8fc7\u4ea4\u53c9\u6ce8\u610f\u529b\u4f5c\u4e3a\u56fe\u50cf\u7279\u5f81\u7684\u6761\u4ef6\u3002</p> </li> </ul> <p></p>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#text-to-video-generation","title":"\u6587\u751f\u89c6\u9891\u751f\u6210 (Text-to-Video Generation)","text":"<ul> <li>\u6587\u751f\u89c6\u9891\u76f8\u5f53\u4e8e\u6587\u751f\u56fe\u518d\u52a0\u4e0a\u4e00\u4e2a\u4e25\u82db\u7684\u989d\u5916\u7ea6\u675f\uff1a\u65f6\u95f4\u8fde\u8d2f\u6027\uff08temporal coherence\uff09\u3002\u6bcf\u4e00\u5e27\u5fc5\u987b\u5728\u5185\u90e8\u4fdd\u6301\u4e00\u81f4\uff08\u662f\u4e00\u5f20\u5408\u7406\u7684\u56fe\u50cf\uff09\uff0c\u4f46\u8fde\u7eed\u5e27\u4e4b\u95f4\u4e5f\u5fc5\u987b\u5e73\u6ed1\u8fde\u63a5\u2014\u2014\u7269\u4f53\u5e94\u8be5\u81ea\u7136\u8fd0\u52a8\uff0c\u5149\u7167\u5e94\u8fde\u7eed\u53d8\u5316\uff0c\"\u955c\u5934\"\u5e94\u9075\u5faa\u7269\u7406\u4e0a\u5408\u7406\u7684\u8f68\u8ff9\u3002\u53ef\u4ee5\u60f3\u8c61\u4e00\u4e0b\u7ed8\u5236\u4e00\u5e45\u98ce\u666f\u753b\u548c\u5bfc\u6f14\u4e00\u90e8\u7535\u5f71\u4e4b\u95f4\u7684\u533a\u522b\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#_2","title":"\u65f6\u95f4\u7ef4\u5ea6\u7684\u6311\u6218","text":"<ul> <li>\u89c6\u9891\u5f15\u5165\u4e86\u56fe\u50cf\u751f\u6210\u4e4b\u5916\u7684\u4e09\u4e2a\u6311\u6218\u3002\u65f6\u95f4\u4e00\u81f4\u6027\uff08temporal consistency\uff09\u8981\u6c42\u7269\u4f53\u5728\u5404\u5e27\u4e4b\u95f4\u4fdd\u6301\u8eab\u4efd\u4e0d\u53d8\u2014\u2014\u7b2c 1 \u5e27\u4e2d\u7684\u72d7\u5728\u7b2c 100 \u5e27\u4e2d\u5e94\u8be5\u8fd8\u662f\u540c\u4e00\u6761\u72d7\u3002\u8fd0\u52a8\u5efa\u6a21\uff08motion modeling\uff09\u9700\u8981\u5b66\u4e60\u7269\u7406\u52a8\u6001\uff1a\u7269\u4f53\u5982\u4f55\u8fd0\u52a8\u3001\u91cd\u529b\u5982\u4f55\u4f5c\u7528\u3001\u6d41\u4f53\u5982\u4f55\u6d41\u52a8\u3002\u8ba1\u7b97\u6210\u672c\u975e\u5e38\u9ad8\u6602\uff1a\u4e00\u6bb5 24 fps\u3001512x512 \u5206\u8fa8\u7387\u7684 10 \u79d2\u89c6\u9891\u5305\u542b \\(10 \\times 24 \\times 512 \\times 512 \\times 3 \\approx 1.88\\) \u4ebf\u4e2a\u503c\uff0c\u5927\u7ea6\u662f\u5355\u5f20\u56fe\u50cf\u6570\u636e\u91cf\u7684 240 \u500d\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#make-a-video","title":"Make-A-Video \u4e0e\u5ef6\u5c55\u81f3\u89c6\u9891\u65b9\u6cd5","text":"<ul> <li> <p>Make-A-Video\uff08Singer \u7b49\u4eba\uff0c2022\uff09\u91c7\u7528\u4e86\u4e00\u79cd\u52a1\u5b9e\u7684\u65b9\u6cd5\uff1a\u4ece\u9884\u8bad\u7ec3\u7684\u6587\u751f\u56fe\u6a21\u578b\u5f00\u59cb\uff0c\u6dfb\u52a0\u65f6\u95f4\u5c42\u3002\u5173\u952e\u6d1e\u5bdf\u662f\uff0c\u4f60\u5df2\u7ecf\u62e5\u6709\u4e86\u57fa\u4e8e\u6570\u5341\u4ebf\u56fe\u6587\u5bf9\u8bad\u7ec3\u7684\u5f3a\u5927\u6587\u751f\u56fe\u6a21\u578b\uff0c\u4f60\u53ea\u9700\u8981\u4ece\uff08\u672a\u6807\u6ce8\u7684\uff09\u89c6\u9891\u6570\u636e\u4e2d\u5b66\u4e60\u8fd0\u52a8\u3002</p> </li> <li> <p>Make-A-Video \u5728\u9884\u8bad\u7ec3\u7684\u7a7a\u95f4 U-Net \u4e2d\u63d2\u5165\u4e86\u65f6\u95f4\u6ce8\u610f\u529b\uff08temporal attention\uff09\u548c\u65f6\u95f4\u5377\u79ef\uff08temporal convolution\uff09\u5c42\u3002\u7a7a\u95f4\u5c42\uff08\u5728\u56fe\u50cf\u4e0a\u9884\u8bad\u7ec3\uff09\u8d1f\u8d23\u5916\u89c2\uff0c\u800c\u65b0\u7684\u65f6\u95f4\u5c42\uff08\u5728\u89c6\u9891\u4e0a\u8bad\u7ec3\uff09\u8d1f\u8d23\u8fd0\u52a8\u3002\u7a7a\u95f4\u81ea\u6ce8\u610f\u529b\u5728\u6bcf\u5e27\u5185\u90e8\u64cd\u4f5c\uff1b\u65f6\u95f4\u6ce8\u610f\u529b\u5728\u6bcf\u4e2a\u7a7a\u95f4\u4f4d\u7f6e\u4e0a\u8de8\u5e27\u64cd\u4f5c\u3002\u8fd9\u79cd\u5206\u89e3\u662f\u9ad8\u6548\u7684\uff0c\u56e0\u4e3a\u65f6\u95f4\u548c\u7a7a\u95f4\u6a21\u5f0f\u5728\u5f88\u5927\u7a0b\u5ea6\u4e0a\u662f\u53ef\u5206\u79bb\u7684\u3002</p> </li> <li> <p>\u751f\u6210\u6d41\u7a0b\u4e0e Imagen \u7684\u7ea7\u8054\u65b9\u5f0f\u7c7b\u4f3c\uff1a\u57fa\u7840\u6a21\u578b\u751f\u6210 64x64 \u7684 16 \u5e27\uff0c\u7136\u540e\u7a7a\u95f4\u548c\u65f6\u95f4\u8d85\u5206\u8fa8\u7387\u6a21\u578b\u5c06\u5206\u8fa8\u7387\u5347\u7ea7\u5230\u6700\u7ec8\u5927\u5c0f\u548c\u5e27\u7387\u3002\u5e27\u63d2\u503c\u7f51\u7edc\u7528\u4e8e\u63d0\u9ad8\u65f6\u95f4\u5e73\u6ed1\u6027\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#videopoet-token","title":"VideoPoet \u4e0e\u57fa\u4e8e Token \u7684\u89c6\u9891\u6a21\u578b","text":"<ul> <li> <p>VideoPoet\uff08Kondratyuk \u7b49\u4eba\uff0c2024\uff09\u5c06\u89c6\u9891\u751f\u6210\u7edf\u4e00\u5230\u8bed\u8a00\u5efa\u6a21\u8303\u5f0f\u4e4b\u4e0b\u3002\u6240\u6709\u6a21\u6001\u2014\u2014\u6587\u672c\u3001\u56fe\u50cf\u3001\u89c6\u9891\u3001\u97f3\u9891\u2014\u2014\u90fd\u88ab token \u5316\u4e3a\u79bb\u6563\u5e8f\u5217\uff0c\u4e00\u4e2a\u5355\u4e00\u7684\u5927\u8bed\u8a00\u6a21\u578b\uff08LLM\uff09\u88ab\u8bad\u7ec3\u6765\u8de8\u6240\u6709\u6a21\u6001\u81ea\u56de\u5f52\u5730\u9884\u6d4b token\u3002\u8fd9\u4f7f\u5f97\u96f6\u6837\u672c\u80fd\u529b\u6210\u4e3a\u53ef\u80fd\uff1a\u6587\u751f\u89c6\u9891\u3001\u56fe\u751f\u89c6\u9891\u3001\u89c6\u9891\u751f\u97f3\u9891\u3001\u89c6\u9891\u7f16\u8f91\u548c\u89c6\u9891\u4fee\u8865\u90fd\u53ef\u4ee5\u4ece\u540c\u4e00\u4e2a\u6a21\u578b\u4e2d\u6d8c\u73b0\u3002</p> </li> <li> <p>VideoPoet \u4f7f\u7528 MAGVIT-v2 \u7f16\u7801\u5668\uff08\u4e00\u4e2a\u6765\u81ea\u6587\u4ef6 03 \u7684 3D VQ-VAE\uff09\u5bf9\u89c6\u9891\u8fdb\u884c token \u5316\uff0c\u8be5\u7f16\u7801\u5668\u8054\u5408\u538b\u7f29\u7a7a\u95f4\u548c\u65f6\u95f4\u7ef4\u5ea6\u3002\u97f3\u9891\u4f7f\u7528 SoundStream \u8fdb\u884c token \u5316\u3002LLM \u4e3b\u5e72\u5728\u6587\u672c\u4e0a\u9884\u8bad\u7ec3\uff0c\u7136\u540e\u5728\u591a\u6a21\u6001 token \u5e8f\u5217\u4e0a\u5fae\u8c03\uff0c\u5b66\u4e60\u8de8\u6a21\u6001\u7684\u8054\u5408\u5206\u5e03\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#sora","title":"Sora \u98ce\u683c\u7684\u65f6\u95f4\u6269\u6563","text":"<ul> <li> <p>Sora\uff08OpenAI\uff0c2024\uff09\u51ed\u501f\u5176\u751f\u6210\u957f\u65f6\u95f4\u3001\u8fde\u8d2f\u3001\u7269\u7406\u5408\u7406\u7684\u89c6\u9891\u7684\u80fd\u529b\uff0c\u5c06\u65f6\u95f4\u6269\u6563\u5e26\u5165\u4e86\u4e3b\u6d41\u89c6\u91ce\u3002\u867d\u7136\u5b8c\u6574\u7684\u67b6\u6784\u7ec6\u8282\u5c1a\u672a\u516c\u5f00\uff0c\u4f46\u5176\u5173\u952e\u601d\u60f3\u662f\u5c06 DiT \u6269\u5c55\u5230\u65f6\u7a7a\u9886\u57df\uff1a\u89c6\u9891\u5e27\u88ab\u5206\u89e3\u4e3a\u65f6\u7a7a\u5757\uff08spacetime patches\uff09\uff08\u8de8\u8d8a\u9ad8\u5ea6\u3001\u5bbd\u5ea6\u548c\u65f6\u95f4\u7684\u4e09\u7ef4\u5757\uff09\uff0c\u8fd9\u4e9b\u5757\u88ab\u5f53\u4f5c\u5927\u578b Transformer \u7684 token \u6765\u5904\u7406\u3002</p> </li> <li> <p>\u65f6\u7a7a\u5757\u65b9\u6cd5\u610f\u5473\u7740\u6a21\u578b\u5c06\u89c6\u9891\u4f5c\u4e3a\u539f\u751f\u7684 3D \u4fe1\u53f7\u6765\u5904\u7406\uff0c\u800c\u4e0d\u662f\u4e00\u7cfb\u5217 2D \u5e27\u3002\u8fd9\u4f7f\u5f97\u6a21\u578b\u80fd\u591f\u6355\u83b7\u957f\u7a0b\u7684\u65f6\u95f4\u4f9d\u8d56\u5173\u7cfb\u2014\u2014\u6a21\u578b\u53ef\u4ee5\"\u63d0\u524d\u89c4\u5212\"\u6574\u4e2a\u89c6\u9891\u65f6\u957f\uff0c\u800c\u4e0d\u662f\u9010\u5e27\u751f\u6210\u3002</p> </li> <li> <p>Sora \u53ef\u4ee5\u901a\u8fc7\u8c03\u6574\u65f6\u7a7a\u5757\u7684\u6570\u91cf\u6765\u5904\u7406\u53ef\u53d8\u7684\u65f6\u957f\u3001\u5206\u8fa8\u7387\u548c\u5bbd\u9ad8\u6bd4\u3002\u4ee5\u6570\u636e\u539f\u751f\u5206\u8fa8\u7387\u8fdb\u884c\u8bad\u7ec3\uff08\u800c\u4e0d\u662f\u5c06\u6240\u6709\u56fe\u50cf\u88c1\u526a\u4e3a\u6b63\u65b9\u5f62\uff09\u53ef\u4ee5\u63d0\u9ad8\u6784\u56fe\u548c\u53d6\u666f\u8d28\u91cf\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#wan","title":"Wan\uff1a\u5f00\u6e90\u89c6\u9891\u751f\u6210","text":"<ul> <li> <p>Wan\uff08Wan \u7b49\u4eba\uff0c2025\uff09\u662f\u4e00\u4e2a\u5f00\u6e90\u89c6\u9891\u751f\u6210\u6a21\u578b\u7cfb\u5217\uff081.3B \u548c 14B \u53c2\u6570\uff09\uff0c\u57fa\u4e8e DiT \u4e3b\u5e72\u548c 3D VAE \u65f6\u95f4\u538b\u7f29\u3002Wan \u91c7\u7528\u6d41\u5339\u914d\u800c\u4e0d\u662f\u4f20\u7edf\u7684 DDPM \u98ce\u683c\u6269\u6563\uff0c\u5b66\u4e60\u4ece\u566a\u58f0\u5230\u89c6\u9891\u9690\u7a7a\u95f4\u7684\u76f4\u7ebf\u4f20\u8f93\u8def\u5f84\u30023D VAE \u5728\u7a7a\u95f4\u548c\u65f6\u95f4\u4e0a\u538b\u7f29\u89c6\u9891\uff084 \u500d\u65f6\u95f4\u538b\u7f29\uff09\uff0cDiT \u4ee5\u5168 3D \u6ce8\u610f\u529b\u5904\u7406\u751f\u6210\u7684\u65f6\u7a7a\u9690\u7a7a\u95f4 token\u3002</p> </li> <li> <p>Wan \u652f\u6301\u6587\u751f\u89c6\u9891\u3001\u56fe\u751f\u89c6\u9891\uff08\u5c06\u9759\u6001\u56fe\u50cf\u52a8\u753b\u5316\uff09\u548c\u89c6\u9891\u7f16\u8f91\u300214B \u6a21\u578b\u53ef\u4ee5\u751f\u6210\u957f\u8fbe 5 \u79d2\u3001720p \u5206\u8fa8\u7387\u7684\u8fde\u8d2f\u89c6\u9891\uff0c\u8868\u660e\u5f53\u67b6\u6784\u548c\u8bad\u7ec3\u65b9\u6848\u9009\u62e9\u6070\u5f53\u65f6\uff0c\u5f00\u6e90\u6a21\u578b\u53ef\u4ee5\u63a5\u8fd1\u4e13\u6709\u7cfb\u7edf\u7684\u8d28\u91cf\u3002</p> </li> </ul> <p></p>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#text-to-audio-generation","title":"\u6587\u751f\u97f3\u9891\u751f\u6210 (Text-to-Audio Generation)","text":"<ul> <li>\u60f3\u8c61\u4e00\u4f4d\u7535\u5f71\u914d\u4e50\u5e08\u9605\u8bfb\u5267\u672c\u5e76\u4e3a\u7535\u5f71\u914d\u4e50\u3002\u6587\u751f\u97f3\u9891\u6a21\u578b\u505a\u7740\u7c7b\u4f3c\u7684\u4e8b\u60c5\uff1a\u7ed9\u5b9a\u4e00\u6bb5\u6587\u672c\u63cf\u8ff0\uff08\"\u4f34\u6709\u5927\u96e8\u548c\u8fdc\u5904\u96f7\u58f0\u7684\u96f7\u66b4\"\uff09\uff0c\u5b83\u4eec\u751f\u6210\u76f8\u5e94\u7684\u97f3\u9891\u6ce2\u5f62\u3002\u6311\u6218\u5728\u4e8e\u5f25\u5408\u6587\u672c\u7684\u79bb\u6563\u3001\u7b26\u53f7\u5316\u672c\u8d28\u4e0e\u58f0\u97f3\u7684\u8fde\u7eed\u3001\u65f6\u95f4\u6027\u672c\u8d28\u4e4b\u95f4\u7684\u5dee\u8ddd\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#audiolm","title":"AudioLM\uff1a\u97f3\u9891\u7684\u8bed\u8a00\u5efa\u6a21","text":"<ul> <li> <p>AudioLM\uff08Borsos \u7b49\u4eba\uff0c2023\uff09\u901a\u8fc7\u81ea\u56de\u5f52\u9884\u6d4b\u79bb\u6563\u97f3\u9891 token \u6765\u751f\u6210\u97f3\u9891\uff0c\u91c7\u7528\u4e86\u4e0e DALL\u00b7E \u4e3a\u56fe\u50cf\u6240\u7528\u7684\u76f8\u540c\u8bed\u8a00\u5efa\u6a21\u8303\u5f0f\u3002\u5b83\u4f7f\u7528\u5206\u5c42 token \u7ed3\u6784\uff1a\u8bed\u4e49 token\uff08\u6765\u81ea\u81ea\u76d1\u7763\u6a21\u578b\u5982 w2v-BERT\uff0c\u56de\u987e\u7b2c 9 \u7ae0\uff09\u6355\u83b7\u9ad8\u5c42\u6b21\u5185\u5bb9\uff08\u8bf4\u4e86\u4ec0\u4e48\u6216\u6f14\u594f\u4e86\u4ec0\u4e48\uff09\uff0c\u800c\u58f0\u5b66 token\uff08\u6765\u81ea SoundStream\uff0c\u4e00\u79cd\u795e\u7ecf\u97f3\u9891\u7f16\u89e3\u7801\u5668\uff09\u6355\u83b7\u7ec6\u7c92\u5ea6\u7684\u58f0\u5b66\u7ec6\u8282\uff08\u542c\u8d77\u6765\u5982\u4f55\u2014\u2014\u97f3\u8272\u3001\u5f55\u97f3\u8d28\u91cf\uff09\u3002</p> </li> <li> <p>\u751f\u6210\u5206\u4e24\u4e2a\u9636\u6bb5\u8fdb\u884c\u3002\u9996\u5148\uff0c\u4e00\u4e2a Transformer \u5728\u7ed9\u5b9a\u53ef\u9009\u97f3\u9891\u63d0\u793a\u7684\u60c5\u51b5\u4e0b\u9884\u6d4b\u8bed\u4e49 token\uff0c\u5efa\u7acb\u9ad8\u5c42\u6b21\u7684\"\u5185\u5bb9\u89c4\u5212\"\u3002\u5176\u6b21\uff0c\u53e6\u4e00\u4e2a Transformer \u4ee5\u8bed\u4e49 token \u4e3a\u6761\u4ef6\u9884\u6d4b\u58f0\u5b66 token\uff0c\u586b\u5145\u58f0\u5b66\u7ec6\u8282\u3002\u8fd9\u79cd\u5c42\u6b21\u7ed3\u6784\u7c7b\u4f3c\u4e8e\u6587\u751f\u8bed\u97f3\u6d41\u7a0b\uff08\u7b2c 9 \u7ae0\uff09\u2014\u2014\u8bed\u4e49 token \u626e\u6f14\u97f3\u7d20\u7684\u89d2\u8272\uff0c\u58f0\u5b66 token \u626e\u6f14\u6885\u5c14\u9891\u8c31\u56fe\u5e27\u7684\u89d2\u8272\u3002</p> </li> <li> <p>AudioLM \u53ef\u4ee5\u751f\u6210\u8bed\u97f3\u63a5\u7eed\uff08\u7ed9\u5b9a 3 \u79d2\u8bed\u97f3\uff0c\u751f\u6210\u63a5\u4e0b\u6765\u7684 10 \u79d2\uff09\u3001\u97f3\u4e50\u63a5\u7eed\u548c\u97f3\u6548\uff0c\u6240\u6709\u8fd9\u4e9b\u90fd\u6765\u81ea\u4e00\u4e2a\u4ec5\u5728\u97f3\u9891\u6570\u636e\u4e0a\u8bad\u7ec3\u7684\u6a21\u578b\uff08\u9884\u8bad\u7ec3\u4e0d\u9700\u8981\u6587\u672c\u6807\u7b7e\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#musiclm","title":"MusicLM\uff1a\u6587\u672c\u6761\u4ef6\u97f3\u4e50\u751f\u6210","text":"<ul> <li> <p>MusicLM\uff08Agostinelli \u7b49\u4eba\uff0c2023\uff09\u5c06 AudioLM \u6269\u5c55\u5230\u6587\u672c\u6761\u4ef6\u4e0b\u7684\u97f3\u4e50\u751f\u6210\u3002\u5b83\u6dfb\u52a0\u4e86\u4e00\u4e2a\u6587\u672c-\u97f3\u9891\u8054\u5408\u5d4c\u5165\uff08\u6765\u81ea MuLan\uff0c\u4e00\u4e2a\u5728\u97f3\u4e50-\u6587\u672c\u5bf9\u4e0a\u8bad\u7ec3\u7684\u7c7b CLIP \u6a21\u578b\uff09\u6765\u6761\u4ef6\u5316\u751f\u6210\u3002MuLan \u5d4c\u5165\u6355\u83b7\u6587\u672c\u63cf\u8ff0\u7684\u8bed\u4e49\u542b\u4e49\uff08\"\u5e26\u6709\u8428\u514b\u65af\u72ec\u594f\u7684\u6b22\u5feb\u7235\u58eb\u4e50\"\uff09\u5e76\u6307\u5bfc\u5206\u5c42 token \u751f\u6210\u3002</p> </li> <li> <p>MusicLM \u4ee5 24 kHz \u7684\u9891\u7387\u751f\u6210\u4efb\u610f\u65f6\u957f\u7684\u97f3\u4e50\uff0c\u5728\u6570\u5206\u949f\u957f\u7684\u4f5c\u54c1\u4e2d\u4fdd\u6301\u65cb\u5f8b\u548c\u8282\u594f\u7684\u8fde\u8d2f\u6027\u3002\u5b83\u8fd8\u53ef\u4ee5\u7528\u54fc\u5531\u7684\u65cb\u5f8b\uff08\u7531\u97f3\u9ad8\u8ffd\u8e2a\u5668\u63d0\u53d6\u7684\u65cb\u5f8b token\uff09\u52a0\u4e0a\u6587\u672c\u63cf\u8ff0\u4f5c\u4e3a\u6761\u4ef6\uff0c\u751f\u6210\u5b8c\u6574\u7684\u7f16\u66f2\uff0c\u65e2\u9075\u5faa\u54fc\u5531\u7684\u66f2\u8c03\uff0c\u53c8\u7b26\u5408\u6587\u672c\u63cf\u8ff0\u7684\u98ce\u683c\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#musicgen","title":"MusicGen\uff1a\u9ad8\u6548\u5355\u9636\u6bb5\u751f\u6210","text":"<ul> <li> <p>MusicGen\uff08Copet \u7b49\u4eba\uff0c2023\uff09\u7b80\u5316\u4e86\u591a\u9636\u6bb5\u65b9\u6cd5\u3002MusicGen \u4e0d\u4f7f\u7528\u72ec\u7acb\u7684\u8bed\u4e49\u548c\u58f0\u5b66\u6a21\u578b\uff0c\u800c\u662f\u4f7f\u7528\u4e00\u4e2a\u5355\u4e00\u7684\u81ea\u56de\u5f52 Transformer\uff0c\u76f4\u63a5\u751f\u6210\u6765\u81ea\u97f3\u9891\u7f16\u89e3\u7801\u5668\u7684\u591a\u4e2a\u7801\u672c\u5c42\u7ea7\u3002\u5173\u952e\u521b\u65b0\u662f\u4ea4\u7ec7\u7801\u672c\u6a21\u5f0f\uff08interleaved codebook pattern\uff09\uff1aMusicGen \u5e76\u975e\u5728\u8fdb\u5165\u4e0b\u4e00\u4e2a\u65f6\u95f4\u6b65\u4e4b\u524d\u751f\u6210\u8be5\u65f6\u95f4\u6b65\u7684\u6240\u6709\u7801\u672c\u5c42\u7ea7\uff0c\u800c\u662f\u4ee5\u67d0\u79cd\u6a21\u5f0f\u8de8\u7801\u672c\u548c\u65f6\u95f4\u6b65\u4ea4\u7ec7 token\uff0c\u4ece\u800c\u5141\u8bb8\u5bf9\u67d0\u4e9b\u7801\u672c\u5c42\u7ea7\u8fdb\u884c\u5e76\u884c\u89e3\u7801\u3002</p> </li> <li> <p>\u6761\u4ef6\u5316\u76f4\u63a5\u660e\u4e86\uff1a\u6587\u672c\u7531 T5 \u7f16\u7801\u5668\u7f16\u7801\uff0c\u6587\u672c\u5d4c\u5165\u88ab\u524d\u7f6e\u5230\u97f3\u9891 token \u5e8f\u5217\u4e4b\u524d\uff08\u50cf\u8bed\u8a00\u6a21\u578b\u4e2d\u7684\u524d\u7f00\u63d0\u793a\uff09\u6216\u901a\u8fc7\u4ea4\u53c9\u6ce8\u610f\u529b\u6ce8\u5165\u3002MusicGen \u8fd8\u652f\u6301\u65cb\u5f8b\u6761\u4ef6\u5316\uff1a\u53c2\u8003\u65cb\u5f8b\u7684\u8272\u8c31\u56fe\uff08chromagram\uff0c\u6765\u81ea\u7b2c 9 \u7ae0\u4e2d\u8ba8\u8bba\u7684\u9891\u8c31\u56fe\u7279\u5f81\uff09\u88ab\u7f16\u7801\u540e\u4e0e\u6587\u672c\u6761\u4ef6\u4e00\u8d77\u4f7f\u7528\u3002</p> </li> </ul> \\[p(a_1, \\ldots, a_T) = \\prod_{t=1}^{T} \\prod_{k=1}^{K} p(a_{t,k} \\mid a_{&lt;t}, c_{\\text{text}})\\] <ul> <li>\u5176\u4e2d \\(a_{t,k}\\) \u662f\u65f6\u95f4\u6b65 \\(t\\)\u3001\u7801\u672c\u5c42\u7ea7 \\(k\\) \u5904\u7684\u97f3\u9891 token\uff0c\\(c_{\\text{text}}\\) \u662f\u6587\u672c\u6761\u4ef6\u3002\u5bf9 \\(k\\) \u7684\u6c42\u79ef\u6839\u636e\u7801\u672c\u6a21\u5f0f\u8fdb\u884c\u56e0\u5f0f\u5206\u89e3\u2014\u2014\u67d0\u4e9b\u5c42\u7ea7\u662f\u5e76\u884c\u9884\u6d4b\u7684\u3002</li> </ul> <p></p>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#image-to-text-generation","title":"\u56fe\u751f\u6587\u751f\u6210 (Image-to-Text Generation)","text":"<ul> <li>\u73b0\u5728\u7ffb\u8f6c\u65b9\u5411\uff1a\u7ed9\u5b9a\u4e00\u5f20\u56fe\u50cf\uff0c\u751f\u6210\u81ea\u7136\u8bed\u8a00\u63cf\u8ff0\u3002\u8fd9\u5c31\u662f\u56fe\u50cf\u63cf\u8ff0\uff08image captioning\uff09\uff0c\u8fd9\u662f\u4e00\u79cd\u4ee5\u56fe\u50cf\u4e3a\u6761\u4ef6\u7684\u6761\u4ef6\u6587\u672c\u751f\u6210\u5f62\u5f0f\u3002\u53ef\u4ee5\u60f3\u8c61\u4e00\u4f4d\u535a\u7269\u9986\u5bfc\u89c8\u5458\u63cf\u8ff0\u4e00\u5e45\u753b\u4f5c\u2014\u2014\u4ed6\u4eec\u5fc5\u987b\u611f\u77e5\u89c6\u89c9\u5185\u5bb9\uff0c\u7406\u89e3\u7269\u4f53\u4e4b\u95f4\u7684\u5173\u7cfb\uff0c\u5e76\u7528\u6d41\u7545\u7684\u8bed\u8a00\u8868\u8fbe\u89c2\u5bdf\u7ed3\u679c\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#_3","title":"\u4f5c\u4e3a\u6761\u4ef6\u751f\u6210\u7684\u56fe\u50cf\u63cf\u8ff0","text":"<ul> <li>\u7ecf\u5178\u65b9\u6cd5\u4f7f\u7528\u7f16\u7801\u5668-\u89e3\u7801\u5668\u67b6\u6784\uff08\u7b2c 07 \u7ae0\uff09\u3002\u9884\u8bad\u7ec3\u7684 CNN \u6216 ViT\uff08\u7b2c 8 \u7ae0\uff09\u5c06\u56fe\u50cf\u7f16\u7801\u4e3a\u4e00\u7ec4\u7279\u5f81\u5411\u91cf\u3002\u8bed\u8a00\u6a21\u578b\u89e3\u7801\u5668\u9010\u8bcd\u751f\u6210\u63cf\u8ff0\uff0c\u6bcf\u4e00\u6b65\u90fd\u5173\u6ce8\u56fe\u50cf\u7279\u5f81\uff1a</li> </ul> \\[p(w_1, \\ldots, w_L \\mid I) = \\prod_{l=1}^{L} p(w_l \\mid w_1, \\ldots, w_{l-1}, I)\\] <ul> <li> <p>\u5176\u4e2d \\(w_l\\) \u662f\u63cf\u8ff0\u4e2d\u7684\u8bcd\u8bed\uff0c\\(I\\) \u662f\u56fe\u50cf\u8868\u793a\u3002\u4ea4\u53c9\u6ce8\u610f\u529b\u5c06\u6587\u672c\u89e3\u7801\u5668\u4e0e\u56fe\u50cf\u7279\u5f81\u8fde\u63a5\u8d77\u6765\uff0c\u4f7f\u6a21\u578b\u5728\u751f\u6210\u4e0d\u540c\u8bcd\u8bed\u65f6\u80fd\u591f\"\u67e5\u770b\"\u56fe\u50cf\u7684\u4e0d\u540c\u533a\u57df\u2014\u2014\u751f\u6210\"\u72d7\"\u65f6\u5173\u6ce8\u72d7\u7684\u533a\u57df\uff0c\u751f\u6210\"\u516c\u56ed\"\u65f6\u5173\u6ce8\u516c\u56ed\u7684\u533a\u57df\u3002</p> </li> <li> <p>CoCa\uff08Contrastive Captioners\uff0cYu \u7b49\u4eba\uff0c2022\uff09\u5728\u4e00\u4e2a\u5355\u4e00\u6a21\u578b\u4e2d\u7edf\u4e00\u4e86\u5bf9\u6bd4\u5b66\u4e60\uff08\u6587\u4ef6 01 \u4e2d\u7684 CLIP \u98ce\u683c\u76ee\u6807\uff09\u548c\u56fe\u50cf\u63cf\u8ff0\u3002\u56fe\u50cf\u7f16\u7801\u5668\u751f\u6210\u7684\u7279\u5f81\u65e2\u7528\u4e8e\u4e0e\u6587\u672c\u8fdb\u884c\u5bf9\u6bd4\u5bf9\u9f50\uff0c\u4e5f\u7528\u4e8e\u63cf\u8ff0\u89e3\u7801\u5668\u4e2d\u7684\u4ea4\u53c9\u6ce8\u610f\u529b\u3002\u8fd9\u79cd\u591a\u4efb\u52a1\u8bad\u7ec3\u4f7f CoCa \u540c\u65f6\u5177\u6709\u5f3a\u5927\u7684\u96f6\u6837\u672c\u8bc6\u522b\u80fd\u529b\uff08\u6765\u81ea\u5bf9\u6bd4\u5b66\u4e60\uff09\u548c\u5f3a\u5927\u7684\u751f\u6210\u80fd\u529b\uff08\u6765\u81ea\u56fe\u50cf\u63cf\u8ff0\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#_4","title":"\u73b0\u4ee3\u89c6\u89c9\u8bed\u8a00\u63cf\u8ff0","text":"<ul> <li> <p>\u73b0\u4ee3\u65b9\u6cd5\u901a\u5e38\u4f7f\u7528\u5927\u578b\u591a\u6a21\u6001\u6a21\u578b\uff08\u6587\u4ef6 02\uff09\u6765\u8fdb\u884c\u56fe\u50cf\u63cf\u8ff0\u3002LLaVA\u3001Qwen-VL \u548c GPT-4V \u7b49\u6a21\u578b\u5c06\u56fe\u50cf\u63cf\u8ff0\u89c6\u4e3a\u89c6\u89c9\u95ee\u7b54\u7684\u4e00\u79cd\u7279\u6b8a\u60c5\u51b5\u2014\u2014\"\u95ee\u9898\"\u9690\u5f0f\u5730\u5c31\u662f\"\u63cf\u8ff0\u8fd9\u5f20\u56fe\u50cf\"\u3002\u89c6\u89c9\u7f16\u7801\u5668\uff08CLIP ViT \u6216 SigLIP\uff09\u751f\u6210\u5757 token\uff0c\u8fd9\u4e9b token \u88ab\u6295\u5f71\u5230 LLM \u7684\u5d4c\u5165\u7a7a\u95f4\u4e2d\uff0c\u7136\u540e LLM \u751f\u6210\u81ea\u7531\u5f62\u5f0f\u7684\u63cf\u8ff0\u3002</p> </li> <li> <p>\u57fa\u4e8e LLM \u7684\u63cf\u8ff0\u76f8\u8f83\u4e8e\u4e13\u7528\u7f16\u7801\u5668-\u89e3\u7801\u5668\u6a21\u578b\u7684\u4f18\u52bf\u5728\u4e8e\u6307\u4ee4\u9075\u5faa\uff08instruction following\uff09\uff1a\u4f60\u53ef\u4ee5\u8981\u6c42\u4e0d\u540c\u8be6\u7ec6\u7a0b\u5ea6\uff08\"\u7528\u4e00\u53e5\u8bdd\u63cf\u8ff0\"\u5bf9\u6bd4\"\u63d0\u4f9b\u8be6\u7ec6\u6bb5\u843d\"\uff09\uff0c\u5173\u6ce8\u7279\u5b9a\u65b9\u9762\uff08\"\u63cf\u8ff0\u989c\u8272\"\uff09\uff0c\u6216\u751f\u6210\u7ed3\u6784\u5316\u8f93\u51fa\uff08\"\u5217\u51fa\u6240\u6709\u7269\u4f53\u53ca\u5176\u4f4d\u7f6e\"\uff09\u3002\u8fd9\u79cd\u7075\u6d3b\u6027\u6765\u6e90\u4e8e LLM \u7684\u6307\u4ee4\u5fae\u8c03\uff08\u7b2c 07 \u7ae0\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#-video-audio-co-generation","title":"\u89c6\u9891-\u97f3\u9891\u8054\u5408\u751f\u6210 (Video-Audio Co-Generation)","text":"<ul> <li>\u60f3\u8c61\u4e00\u4e0b\u5173\u6389\u58f0\u97f3\u770b\u7535\u5f71\u2014\u2014\u4f53\u9a8c\u662f\u7a7a\u6d1e\u7684\u3002\u89c6\u89c9\u5185\u5bb9\u548c\u97f3\u9891\u662f\u6df1\u5ea6\u8026\u5408\u7684\uff1a\u5f39\u8df3\u7684\u7403\u6709\u8282\u594f\u7684\u649e\u51fb\u58f0\uff0c\u96e8\u6c34\u53d1\u51fa\u556a\u55d2\u58f0\uff0c\u4eba\u7fa4\u7206\u53d1\u51fa\u6b22\u547c\u58f0\u3002\u89c6\u9891-\u97f3\u9891\u8054\u5408\u751f\u6210\uff08video-audio co-generation\uff09\u65e8\u5728\u540c\u65f6\u751f\u6210\u4e24\u79cd\u6a21\u6001\uff0c\u4fdd\u6301\u6240\u770b\u4e0e\u6240\u542c\u4e4b\u95f4\u7684\u65f6\u95f4\u5bf9\u9f50\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#_5","title":"\u8054\u5408\u65f6\u95f4\u5efa\u6a21","text":"<ul> <li> <p>\u6838\u5fc3\u6311\u6218\u662f\u65f6\u95f4\u540c\u6b65\uff08temporal synchronisation\uff09\uff1a\u51fb\u9f13\u7684\u97f3\u9891\u5fc5\u987b\u4e0e\u9f13\u69cc\u51fb\u9f13\u7684\u89c6\u89c9\u5e27\u7cbe\u786e\u91cd\u5408\u3002\u8fd9\u9700\u8981\u4e00\u4e2a\u4e24\u79cd\u6a21\u6001\u90fd\u80fd\u5f15\u7528\u7684\u5171\u4eab\u65f6\u95f4\u8868\u793a\u3002</p> </li> <li> <p>\u4e00\u79cd\u65b9\u6cd5\u662f\u4ece\u5171\u4eab\u7684\u6f5c\u5728\u65f6\u95f4\u7ebf\u751f\u6210\u89c6\u9891\u548c\u97f3\u9891\u3002\u50cf CoDi\uff08Composable Diffusion\uff0cTang \u7b49\u4eba\uff0c2023\uff09\u8fd9\u6837\u7684\u6a21\u578b\u5bf9\u6bcf\u79cd\u6a21\u6001\u4f7f\u7528\u72ec\u7acb\u7684\u6269\u6563\u6a21\u578b\uff0c\u4f46\u901a\u8fc7\u5171\u4eab\u7684\u9690\u7a7a\u95f4\u8fdb\u884c\u5bf9\u9f50\u3002\u5728\u8bad\u7ec3\u8fc7\u7a0b\u4e2d\uff0c\u8de8\u6a21\u6001\u6ce8\u610f\u529b\u5c42\u5b66\u4e60\u5728\u6bcf\u4e2a\u65f6\u95f4\u6b65\u540c\u6b65\u89c6\u89c9\u548c\u97f3\u9891\u7279\u5f81\u3002\u5728\u751f\u6210\u8fc7\u7a0b\u4e2d\uff0c\u4e24\u79cd\u6269\u6563\u8fc7\u7a0b\u540c\u65f6\u8fd0\u884c\uff0c\u901a\u8fc7\u5171\u4eab\u5bf9\u9f50\u76f8\u4e92\u6761\u4ef6\u5316\u3002</p> </li> <li> <p>\u524d\u9762\u8ba8\u8bba\u7684 VideoPoet \u91c7\u7528\u4e86\u4e00\u79cd\u66f4\u7edf\u4e00\u7684\u65b9\u6cd5\uff1a\u7531\u4e8e\u6240\u6709\u6a21\u6001\u90fd\u88ab token \u5316\u4e3a\u5355\u4e00\u5e8f\u5217\uff0cLLM \u81ea\u7136\u5730\u5b66\u4e60\u4e86\u89c6\u9891 token \u548c\u97f3\u9891 token \u4e4b\u95f4\u7684\u65f6\u95f4\u5bf9\u5e94\u5173\u7cfb\u3002\u4e00\u6bb5\u72d7\u53eb\u7684\u89c6\u9891\u7247\u6bb5\u540e\u9762\u8ddf\u968f\u7740\u76f8\u5e94\u7684\u97f3\u9891 token\uff0c\u6559\u4f1a\u6a21\u578b\u5c06\u89c6\u89c9\u4e0a\u7684\u72d7\u53eb\u52a8\u4f5c\u4e0e\u72d7\u53eb\u58f0\u5173\u8054\u8d77\u6765\u3002</p> </li> <li> <p>\u65f6\u95f4\u5bf9\u9f50\u635f\u5931\uff08temporal alignment loss\uff09\u51fd\u6570\u663e\u5f0f\u5730\u5f3a\u5236\u540c\u6b65\u3002\u4e00\u79cd\u5f62\u5f0f\u662f\u5728\u5e27\u7ea7\u522b\u4f7f\u7528\u5bf9\u6bd4\u5b66\u4e60\uff1a\u65f6\u95f4 \\(t\\) \u7684\u97f3\u9891\u6bb5\u5e94\u8be5\u4e0e\u65f6\u95f4 \\(t\\) \u7684\u89c6\u9891\u5e27\u6bd4\u5176\u4ed6\u65f6\u523b\u7684\u5e27\u66f4\u76f8\u4f3c\uff1a</p> </li> </ul> \\[\\mathcal{L}_{\\text{sync}} = -\\mathbb{E}_t \\left[\\log \\frac{\\exp(\\text{sim}(v_t, a_t) / \\tau)}{\\sum_{t'} \\exp(\\text{sim}(v_t, a_{t'}) / \\tau)}\\right]\\] <ul> <li>\u5176\u4e2d \\(v_t\\) \u548c \\(a_t\\) \u662f\u65f6\u95f4 \\(t\\) \u7684\u89c6\u9891\u548c\u97f3\u9891\u8868\u793a\uff0c\\(\\tau\\) \u662f\u6e29\u5ea6\u53c2\u6570\u3002\u8fd9\u4e0e\u6587\u4ef6 01 \u4e2d\u7684 InfoNCE \u635f\u5931\u5728\u7ed3\u6784\u4e0a\u76f8\u540c\uff0c\u4f46\u5e94\u7528\u4e8e\u65f6\u95f4\u5e27\u7ea7\u522b\u800c\u975e\u7247\u6bb5\u7ea7\u522b\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#instruction-following-generation","title":"\u6307\u4ee4\u9075\u5faa\u5f0f\u751f\u6210 (Instruction-Following Generation)","text":"<ul> <li>\u60f3\u8c61\u4f60\u544a\u8bc9\u4e00\u4f4d\u827a\u672f\u5bb6\"\u8ba9\u5929\u7a7a\u66f4\u6709\u620f\u5267\u6027\"\u6216\"\u628a\u5e3d\u5b50\u6362\u6210\u738b\u51a0\"\u3002\u6307\u4ee4\u9075\u5faa\u5f0f\u751f\u6210\uff08instruction-following generation\uff09\u5141\u8bb8\u4f60\u4f7f\u7528\u81ea\u7136\u8bed\u8a00\u547d\u4ee4\u7f16\u8f91\u56fe\u50cf\uff0c\u800c\u4e0d\u9700\u8981\u7cbe\u786e\u7684\u7a7a\u95f4\u906e\u7f69\u6216\u7b14\u89e6\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#instructpix2pix","title":"InstructPix2Pix\uff1a\u901a\u8fc7\u63cf\u8ff0\u8fdb\u884c\u7f16\u8f91","text":"<ul> <li> <p>InstructPix2Pix\uff08Brooks \u7b49\u4eba\uff0c2023\uff09\u8bad\u7ec3\u4e86\u4e00\u4e2a\u6761\u4ef6\u6269\u6563\u6a21\u578b\uff0c\u8be5\u6a21\u578b\u63a5\u6536\u8f93\u5165\u56fe\u50cf\u548c\u6587\u672c\u6307\u4ee4\uff0c\u7136\u540e\u751f\u6210\u7f16\u8f91\u540e\u7684\u56fe\u50cf\u3002\u5de7\u5999\u4e4b\u5904\u5728\u4e8e\u8bad\u7ec3\u6570\u636e\u7684\u521b\u5efa\u65b9\u5f0f\uff1aGPT-3 \u751f\u6210\u7f16\u8f91\u6307\u4ee4\uff08\"\u53d8\u6210\u51ac\u5929\"\u3001\"\u628a\u732b\u53d8\u6210\u72d7\"\uff09\u4ee5\u53ca\u8f93\u5165-\u8f93\u51fa\u6587\u672c\u63cf\u8ff0\u5bf9\uff0c\u7136\u540e\u6587\u751f\u56fe\u6a21\u578b\uff08Stable Diffusion\uff09\u751f\u6210\u76f8\u5e94\u7684\u56fe\u50cf\u5bf9\u3002</p> </li> <li> <p>\u6a21\u578b\u662f\u4e00\u4e2a\u4fee\u6539\u540e\u7684 Stable Diffusion U-Net\uff0c\u540c\u65f6\u63a5\u6536\u6587\u672c\u6307\u4ee4\uff08\u901a\u8fc7\u4ea4\u53c9\u6ce8\u610f\u529b\uff09\u548c\u8f93\u5165\u56fe\u50cf\u7684\u9690\u8868\u793a\uff08\u4e0e\u542b\u566a\u9690\u53d8\u91cf\u6309\u901a\u9053\u62fc\u63a5\uff09\u3002\u5b83\u4f7f\u7528\u53cc\u65e0\u5206\u7c7b\u5668\u5f15\u5bfc\uff08dual classifier-free guidance\uff09\uff0c\u5305\u542b\u4e24\u4e2a\u5f15\u5bfc\u5c3a\u5ea6\u2014\u2014\u4e00\u4e2a\u7528\u4e8e\u6587\u672c\u6307\u4ee4\uff08\\(s_T\\)\uff09\uff0c\u4e00\u4e2a\u7528\u4e8e\u8f93\u5165\u56fe\u50cf\uff08\\(s_I\\)\uff09\uff1a</p> </li> </ul> \\[\\hat{\\epsilon} = \\epsilon_\\theta(x_t, \\varnothing, \\varnothing) + s_I \\cdot (\\epsilon_\\theta(x_t, c_I, \\varnothing) - \\epsilon_\\theta(x_t, \\varnothing, \\varnothing)) + s_T \\cdot (\\epsilon_\\theta(x_t, c_I, c_T) - \\epsilon_\\theta(x_t, c_I, \\varnothing))\\] <ul> <li>\u5176\u4e2d \\(c_I\\) \u662f\u8f93\u5165\u56fe\u50cf\u6761\u4ef6\uff0c\\(c_T\\) \u662f\u6587\u672c\u6307\u4ee4\u3002\u7b2c\u4e00\u4e2a\u5f15\u5bfc\u9879\u63a7\u5236\u4fdd\u7559\u8f93\u5165\u56fe\u50cf\u7684\u7a0b\u5ea6\uff1b\u7b2c\u4e8c\u4e2a\u63a7\u5236\u9075\u5faa\u6307\u4ee4\u7684\u5f3a\u5ea6\u3002\u8fd9\u4e3a\u7528\u6237\u63d0\u4f9b\u4e86\u4e00\u4e2a\u4e8c\u7ef4\u65cb\u94ae\uff1a\u9ad8 \\(s_I\\) \u66f4\u7d27\u5bc6\u5730\u4fdd\u7559\u539f\u56fe\uff0c\u800c\u9ad8 \\(s_T\\) \u5219\u8fdb\u884c\u66f4\u5927\u5e45\u5ea6\u7684\u7f16\u8f91\u3002</li> </ul> <p></p>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#sdedit","title":"SDEdit \u4e0e\u57fa\u4e8e\u566a\u58f0\u7684\u7f16\u8f91","text":"<ul> <li> <p>SDEdit\uff08Meng \u7b49\u4eba\uff0c2022\uff09\u63d0\u4f9b\u4e86\u4e00\u79cd\u66f4\u7b80\u5355\u7684\u7f16\u8f91\u65b9\u6cd5\uff0c\u4e0d\u9700\u8981\u7279\u6b8a\u8bad\u7ec3\u3002\u4f60\u5bf9\u8f93\u5165\u56fe\u50cf\u6dfb\u52a0\u566a\u58f0\uff08\u8fd0\u884c\u524d\u5411\u6269\u6563\u8fc7\u7a0b\u5230\u4e2d\u95f4\u65f6\u95f4\u6b65 \\(t_0\\)\uff09\uff0c\u7136\u540e\u7528\u63cf\u8ff0\u6240\u9700\u8f93\u51fa\u7684\u6587\u672c\u63d0\u793a\u8fdb\u884c\u53bb\u566a\u3002\u566a\u58f0\u91cf\u63a7\u5236\u7f16\u8f91\u5f3a\u5ea6\uff1a\u4f4e\u566a\u58f0\u4fdd\u7559\u7ed3\u6784\uff08\u989c\u8272\u53d8\u5316\u3001\u98ce\u683c\u8fc1\u79fb\uff09\uff0c\u800c\u9ad8\u566a\u58f0\u5141\u8bb8\u5927\u5e45\u91cd\u6784\uff08\u7269\u4f53\u66ff\u6362\u3001\u5e03\u5c40\u6539\u53d8\uff09\u3002</p> </li> <li> <p>\u8fd9\u662f\u4e00\u4e2a\u7cbe\u786e\u7684\u6743\u8861\uff1a\u5728\u65f6\u95f4\u6b65 \\(t_0\\)\uff0c\u542b\u566a\u56fe\u50cf\u4fdd\u7559\u4e86\u539f\u59cb\u4fe1\u53f7\u7684 \\(\\bar{\\alpha}_{t_0}\\) \u6bd4\u4f8b\u3002\u53bb\u566a\u8fc7\u7a0b\u6839\u636e\u65b0\u7684\u6587\u672c\u63d0\u793a\u586b\u5145\u88ab\u7834\u574f\u7684\u7ec6\u8282\u3002\u8fd9\u5728\u6570\u5b66\u4e0a\u662f\u4e25\u8c28\u7684\uff1a\u6269\u6563\u6a21\u578b\u4ece\u540e\u9a8c\u5206\u5e03 \\(p(x_0 \\mid x_{t_0}, c)\\) \u4e2d\u91c7\u6837\uff0c\u5176\u4e2d \\(x_{t_0}\\) \u5c06\u751f\u6210\u7ed3\u679c\u7ea6\u675f\u4e3a\"\u63a5\u8fd1\"\u539f\u59cb\u56fe\u50cf\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#controlnet","title":"ControlNet\uff1a\u7a7a\u95f4\u6761\u4ef6\u63a7\u5236","text":"<ul> <li> <p>ControlNet\uff08Zhang \u7b49\u4eba\uff0c2023\uff09\u4e3a\u6587\u751f\u56fe\u6269\u6563\u589e\u52a0\u4e86\u7ec6\u7c92\u5ea6\u7684\u7a7a\u95f4\u63a7\u5236\u3002\u9884\u8bad\u7ec3 U-Net \u7f16\u7801\u5668\u7684\u526f\u672c\u88ab\u8bad\u7ec3\u6765\u63a5\u53d7\u989d\u5916\u7684\u8f93\u5165\u6761\u4ef6\u2014\u2014\u8fb9\u7f18\u56fe\uff08Canny \u8fb9\u7f18\uff09\u3001\u6df1\u5ea6\u56fe\u3001\u59ff\u6001\u9aa8\u67b6\u3001\u5206\u5272\u56fe\u2014\u2014\u800c\u539f\u59cb U-Net \u6743\u91cd\u88ab\u51bb\u7ed3\u3002ControlNet \u7f16\u7801\u5668\u7684\u8f93\u51fa\u901a\u8fc7\u96f6\u5377\u79ef\uff08zero convolutions\uff09\uff08\u521d\u59cb\u5316\u4e3a\u96f6\u7684 1x1 \u5377\u79ef\uff09\u6dfb\u52a0\u5230\u51bb\u7ed3\u7684 U-Net \u7684\u8df3\u8dc3\u8fde\u63a5\u4e2d\uff0c\u786e\u4fdd\u8bad\u7ec3\u4ece\u9884\u8bad\u7ec3\u6a21\u578b\u7684\u884c\u4e3a\u5f00\u59cb\uff0c\u9010\u6b65\u5b66\u4e60\u65b0\u7684\u6761\u4ef6\u3002</p> </li> <li> <p>\u8fd9\u79cd\u67b6\u6784\u8ba9\u4f60\u53ef\u4ee5\u63d0\u4f9b\u8349\u56fe\u3001\u6df1\u5ea6\u56fe\u6216\u4eba\u4f53\u59ff\u6001\u4f5c\u4e3a\u7ed3\u6784\u6307\u5bfc\uff0c\u6587\u672c\u63d0\u793a\u5219\u8d1f\u8d23\u586b\u5145\u5916\u89c2\u3002\u9884\u8bad\u7ec3\u6743\u91cd\u5904\u7406\u903c\u771f\u5ea6\u548c\u6587\u672c\u7406\u89e3\uff1bControlNet \u5c42\u5904\u7406\u5bf9\u6761\u4ef6\u7a7a\u95f4\u4fdd\u771f\u5ea6\u7684\u4fdd\u6301\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#consistency-and-alignment-metrics","title":"\u4e00\u81f4\u6027\u4e0e\u5bf9\u9f50\u6307\u6807 (Consistency and Alignment Metrics)","text":"<ul> <li>\u5982\u4f55\u8861\u91cf\u751f\u6210\u7684\u56fe\u50cf\u662f\u5426\u826f\u597d\uff1f\"\u826f\u597d\"\u81f3\u5c11\u6709\u4e24\u4e2a\u7ef4\u5ea6\uff1a\u8d28\u91cf\uff08quality\uff09\uff08\u770b\u8d77\u6765\u50cf\u771f\u5b9e\u56fe\u50cf\u5417\uff1f\uff09\u548c\u5bf9\u9f50\u5ea6\uff08alignment\uff09\uff08\u4e0e\u6587\u672c\u63d0\u793a\u5339\u914d\u5417\uff1f\uff09\u3002\u82e5\u5e72\u6307\u6807\u5df2\u88ab\u5f00\u53d1\u51fa\u6765\u91cf\u5316\u8fd9\u4e9b\u65b9\u9762\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#frechet-inception-distance-fid","title":"Frechet Inception Distance (FID)","text":"<ul> <li> <p>Frechet Inception Distance\uff08FID\uff09\uff08Heusel \u7b49\u4eba\uff0c2017\uff09\u8861\u91cf\u751f\u6210\u56fe\u50cf\u5206\u5e03\u4e0e\u771f\u5b9e\u56fe\u50cf\u5206\u5e03\u4e4b\u95f4\u5728\u9884\u8bad\u7ec3 Inception \u7f51\u7edc\u7279\u5f81\u7a7a\u95f4\u4e2d\u7684\u8ddd\u79bb\u3002\u53ef\u4ee5\u5c06\u5176\u7406\u89e3\u4e3a\u6bd4\u8f83\u4e24\u4e2a\u56fe\u50cf\u96c6\u5408\u7684\"\u6307\u7eb9\"\uff0c\u800c\u4e0d\u662f\u6bd4\u8f83\u5355\u4e2a\u56fe\u50cf\u3002</p> </li> <li> <p>\u771f\u5b9e\u56fe\u50cf\u96c6\u548c\u751f\u6210\u56fe\u50cf\u96c6\u90fd\u901a\u8fc7 Inception-v3 \u5904\u7406\uff0c\u6536\u96c6\u5012\u6570\u7b2c\u4e8c\u5c42\u7684\u6fc0\u6d3b\u503c\u3002\u8fd9\u4e9b\u6fc0\u6d3b\u503c\u88ab\u5efa\u6a21\u4e3a\u591a\u5143\u9ad8\u65af\u5206\u5e03 \\(\\mathcal{N}(\\mu_r, \\Sigma_r)\\) \u548c \\(\\mathcal{N}(\\mu_g, \\Sigma_g)\\)\u3002FID \u5c31\u662f\u8fd9\u4e9b\u9ad8\u65af\u5206\u5e03\u4e4b\u95f4\u7684 Frechet \u8ddd\u79bb\uff08Wasserstein-2 \u8ddd\u79bb\uff09\uff1a</p> </li> </ul> \\[\\text{FID} = \\|\\mu_r - \\mu_g\\|^2 + \\text{Tr}\\left(\\Sigma_r + \\Sigma_g - 2(\\Sigma_r \\Sigma_g)^{1/2}\\right)\\] <ul> <li> <p>FID \u8d8a\u4f4e\u8d8a\u597d\u3002FID = 0 \u610f\u5473\u7740\u5206\u5e03\u5b8c\u5168\u76f8\u540c\u3002FID \u540c\u65f6\u6355\u6349\u8d28\u91cf\uff08\u5982\u679c\u751f\u6210\u7684\u56fe\u50cf\u6a21\u7cca\uff0c\u5176\u7279\u5f81\u5c06\u4e0e\u771f\u5b9e\u56fe\u50cf\u4e0d\u540c\uff09\u548c\u591a\u6837\u6027\uff08\u5982\u679c\u6a21\u578b\u906d\u53d7\u6a21\u5f0f\u574d\u584c\uff0c\\(\\Sigma_g\\) \u5c06\u5c0f\u4e8e \\(\\Sigma_r\\)\uff09\u3002\u5728 ImageNet 256x256 \u4e0a\uff0c\u5f53\u524d\u7684\u5148\u8fdb\u6c34\u5e73\u4e3a FID &lt; 2.0\u3002</p> </li> <li> <p>FID \u5b58\u5728\u5df2\u77e5\u5c40\u9650\u6027\uff1a\u5b83\u5047\u8bbe\u7279\u5f81\u5206\u5e03\u662f\u9ad8\u65af\u5206\u5e03\uff08\u8fd9\u53ea\u662f\u4e00\u4e2a\u8fd1\u4f3c\uff09\uff0c\u9700\u8981\u6570\u5343\u4e2a\u6837\u672c\u624d\u80fd\u83b7\u5f97\u7a33\u5b9a\u4f30\u8ba1\uff0c\u5e76\u4e14\u4f7f\u7528 Inception \u7279\u5f81\uff08\u53ef\u80fd\u65e0\u6cd5\u6355\u6349\u6240\u6709\u611f\u77e5\u4e0a\u76f8\u5173\u7684\u5dee\u5f02\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#inception-score-is","title":"Inception Score (IS)","text":"<ul> <li>Inception Score\uff08IS\uff09\uff08Salimans \u7b49\u4eba\uff0c2016\uff09\u8861\u91cf\u4e24\u4e2a\u7279\u6027\uff1a\u6bcf\u5f20\u751f\u6210\u7684\u56fe\u50cf\u5e94\u8be5\u80fd\u88ab\u81ea\u4fe1\u5730\u5206\u7c7b\uff08\u6761\u4ef6\u7c7b\u522b\u5206\u5e03 \\(p(y \\mid x)\\) \u5e94\u8be5\u662f\u5c16\u5cf0\u72b6\u7684\uff09\uff0c\u5e76\u4e14\u751f\u6210\u7684\u56fe\u50cf\u96c6\u5408\u5e94\u8be5\u8986\u76d6\u591a\u4e2a\u7c7b\u522b\uff08\u8fb9\u7f18\u5206\u5e03 \\(p(y) = \\mathbb{E}_x[p(y \\mid x)]\\) \u5e94\u8be5\u662f\u5747\u5300\u7684\uff09\u3002IS \u901a\u8fc7 KL \u6563\u5ea6\u5c06\u4e24\u8005\u7ed3\u5408\u8d77\u6765\uff1a</li> </ul> \\[\\text{IS} = \\exp\\left(\\mathbb{E}_x \\left[D_{\\text{KL}}(p(y \\mid x) \\| p(y))\\right]\\right)\\] <ul> <li>IS \u8d8a\u9ad8\u8d8a\u597d\u3002\u6700\u5927 IS \u7b49\u4e8e\u7c7b\u522b\u6570\uff08\u5bf9\u4e8e ImageNet \u4e3a 1000\uff09\u3002IS \u5956\u52b1\u8d28\u91cf\uff08\u6e05\u6670\u3001\u53ef\u8bc6\u522b\u7684\u56fe\u50cf\uff09\u548c\u591a\u6837\u6027\uff08\u7c7b\u522b\u8986\u76d6\uff09\uff0c\u4f46\u5b83\u6709\u663e\u8457\u7684\u5c40\u9650\u6027\uff1a\u5b83\u5b8c\u5168\u5ffd\u7565\u771f\u5b9e\u6570\u636e\u5206\u5e03\uff0c\u65e0\u6cd5\u68c0\u6d4b\u7c7b\u522b\u5185\u7684\u6a21\u5f0f\u9057\u6f0f\uff0c\u5e76\u4e14\u7531\u4e8e\u4f7f\u7528 Inception \u7684\u7c7b\u522b\u9884\u6d4b\uff0c\u5b83\u504f\u5411\u4e8e\u7c7b\u4f3c ImageNet \u7684\u56fe\u50cf\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#clipscore-","title":"CLIPScore\uff1a\u8861\u91cf\u6587\u672c-\u56fe\u50cf\u5bf9\u9f50\u5ea6","text":"<ul> <li>CLIPScore\uff08Hessel \u7b49\u4eba\uff0c2021\uff09\u4f7f\u7528\u9884\u8bad\u7ec3\u7684 CLIP \u6a21\u578b\uff08\u6587\u4ef6 01\uff09\u76f4\u63a5\u8861\u91cf\u751f\u6210\u7684\u56fe\u50cf\u4e0e\u5176\u6587\u672c\u63d0\u793a\u7684\u5339\u914d\u7a0b\u5ea6\u3002\u8fd9\u4e2a\u5206\u6570\u5c31\u662f CLIP \u56fe\u50cf\u5d4c\u5165\u4e0e CLIP \u6587\u672c\u5d4c\u5165\u4e4b\u95f4\u7684\u4f59\u5f26\u76f8\u4f3c\u5ea6\uff1a</li> </ul> \\[\\text{CLIPScore}(I, T) = \\max(0, \\cos(E_I(I), E_T(T)))\\] <ul> <li> <p>\u5176\u4e2d \\(E_I\\) \u548c \\(E_T\\) \u662f CLIP \u7684\u56fe\u50cf\u548c\u6587\u672c\u7f16\u7801\u5668\u3002CLIPScore \u65e0\u9700\u53c2\u8003\u2014\u2014\u5b83\u4e0d\u9700\u8981\u771f\u5b9e\u56fe\u50cf\uff0c\u53ea\u9700\u8981\u6587\u672c\u63d0\u793a\u3002\u5b83\u4e0e\u4eba\u7c7b\u5bf9\u6587\u672c-\u56fe\u50cf\u5bf9\u9f50\u7684\u5224\u65ad\u9ad8\u5ea6\u76f8\u5173\uff0c\u5df2\u6210\u4e3a\u8bc4\u4f30\u6587\u751f\u56fe\u6a21\u578b\u63d0\u793a\u4fdd\u771f\u5ea6\u7684\u6807\u51c6\u6307\u6807\u3002</p> </li> <li> <p>\u5982\u679c\u9700\u8981\u4e0e\u53c2\u8003\u63cf\u8ff0\u8fdb\u884c\u6bd4\u8f83\uff0cRefCLIPScore \u4f1a\u7eb3\u5165\u53c2\u8003\u56fe\u50cf\uff1a</p> </li> </ul> \\[\\text{RefCLIPScore} = \\text{HarmonicMean}(\\text{CLIPScore}(I, T), \\max(0, \\cos(E_I(I), E_I(I_{\\text{ref}}))))\\] <ul> <li>\u8fd9\u5e73\u8861\u4e86\u6587\u672c\u5bf9\u9f50\u5ea6\u4e0e\u53c2\u8003\u56fe\u50cf\u7684\u89c6\u89c9\u76f8\u4f3c\u6027\u3002</li> </ul> <p></p>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#_6","title":"\u4eba\u5de5\u8bc4\u4f30","text":"<ul> <li>\u81ea\u52a8\u5316\u6307\u6807\u53ea\u662f\u4ee3\u7406\u6307\u6807\uff1b\u4eba\u5de5\u5224\u65ad\u4ecd\u7136\u662f\u9ec4\u91d1\u6807\u51c6\u3002\u5e38\u89c1\u65b9\u6848\u5305\u62ec\u6210\u5bf9\u6bd4\u8f83\uff08pairwise comparisons\uff09\uff08\u4e24\u5f20\u56fe\u50cf\u4e2d\u54ea\u5f20\u66f4\u5339\u914d\u63d0\u793a\uff1f\uff09\u3001Likert \u91cf\u8868\uff08Likert scales\uff09\uff08\u4ece 1-5 \u5206\u8bc4\u4ef7\u8d28\u91cf\u548c\u5bf9\u9f50\u5ea6\uff09\u4ee5\u53ca Elo \u8bc4\u5206\uff08Elo ratings\uff09\uff08\u8de8\u6a21\u578b\u7684\u9526\u6807\u8d5b\u5f0f\u6392\u540d\uff09\u3002DrawBench \u548c PartiPrompts \u57fa\u51c6\u6d4b\u8bd5\u63d0\u4f9b\u4e86\u7528\u4e8e\u7cfb\u7edf\u5316\u4eba\u5de5\u8bc4\u4f30\u7684\u6807\u51c6\u5316\u63d0\u793a\u96c6\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#ethical-considerations","title":"\u4f26\u7406\u8003\u91cf (Ethical Considerations)","text":"<ul> <li>\u8de8\u6a21\u6001\u751f\u6210\u662f\u4eba\u5de5\u667a\u80fd\u9886\u57df\u4f26\u7406\u540e\u679c\u6700\u4e25\u91cd\u7684\u9886\u57df\u4e4b\u4e00\u3002\u80fd\u591f\u6839\u636e\u6587\u672c\u63cf\u8ff0\u521b\u5efa\u903c\u771f\u7684\u56fe\u50cf\u3001\u89c6\u9891\u548c\u97f3\u9891\uff0c\u8fd9\u5f15\u53d1\u4e86\u4ece\u4e1a\u8005\u5fc5\u987b\u4e25\u8083\u5bf9\u5f85\u7684\u6df1\u523b\u62c5\u5fe7\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#_7","title":"\u6df1\u5ea6\u4f2a\u9020\u4e0e\u865a\u5047\u4fe1\u606f","text":"<ul> <li> <p>\u6df1\u5ea6\u4f2a\u9020\uff08Deepfakes\uff09\u662f\u6307\u65e8\u5728\u63cf\u7ed8\u4ece\u672a\u53d1\u751f\u4e8b\u4ef6\u7684\u751f\u6210\u6216\u64cd\u7eb5\u5a92\u4f53\u3002\u6587\u751f\u56fe\u548c\u6587\u751f\u89c6\u9891\u6a21\u578b\u53ef\u4ee5\u521b\u5efa\u4ee4\u4eba\u4fe1\u670d\u7684\u516c\u4f17\u4eba\u7269\u5047\u7167\u7247\u3001\u634f\u9020\u7684\u8bc1\u636e\u548c\u8bef\u5bfc\u6027\u7684\u65b0\u95fb\u56fe\u50cf\u3002\u5371\u9669\u4e0d\u4ec5\u5728\u4e8e\u4f2a\u9020\u7684\u5b58\u5728\uff0c\u8fd8\u5728\u4e8e\u5b83\u4eec\u7684\u5b58\u5728\u524a\u5f31\u4e86\u5bf9\u6240\u6709\u5a92\u4f53\u7684\u4fe1\u4efb\u2014\u2014\u5982\u679c\u4efb\u4f55\u56fe\u50cf\u90fd\u53ef\u80fd\u662f\u5047\u7684\uff0c\u90a3\u4e48\u5c31\u6ca1\u6709\u56fe\u50cf\u662f\u503c\u5f97\u5b8c\u5168\u4fe1\u4efb\u7684\u3002</p> </li> <li> <p>\u68c0\u6d4b\u65b9\u6cd5\u5305\u62ec\u8bad\u7ec3\u5206\u7c7b\u5668\u533a\u5206\u771f\u5b9e\u548c\u751f\u6210\u7684\u56fe\u50cf\u3001\u5206\u6790\u7edf\u8ba1\u4f2a\u5f71\uff08GAN \u751f\u6210\u7684\u56fe\u50cf\u5177\u6709\u5fae\u5999\u7684\u9891\u8c31\u7279\u5f81\uff09\u4ee5\u53ca\u5d4c\u5165\u4e0d\u53ef\u89c1\u6c34\u5370\uff08Stable Diffusion \u7684\u4e0d\u53ef\u89c1\u6c34\u5370\u3001Google \u7684 SynthID\uff09\u3002\u7136\u800c\uff0c\u68c0\u6d4b\u662f\u4e00\u573a\u519b\u5907\u7ade\u8d5b\uff1a\u968f\u7740\u751f\u6210\u5668\u7684\u6539\u8fdb\uff0c\u68c0\u6d4b\u5668\u5fc5\u987b\u4e0d\u65ad\u66f4\u65b0\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#_8","title":"\u751f\u6210\u4e2d\u7684\u504f\u5dee","text":"<ul> <li> <p>\u5728\u4e92\u8054\u7f51\u89c4\u6a21\u6570\u636e\u4e0a\u8bad\u7ec3\u7684\u6a21\u578b\u4f1a\u7ee7\u627f\u5e76\u653e\u5927\u793e\u4f1a\u504f\u89c1\u3002\u6587\u751f\u56fe\u6a21\u578b\u4f1a\u4e0d\u6210\u6bd4\u4f8b\u5730\u751f\u6210\u80a4\u8272\u8f83\u6d45\u7684\u9762\u5b54\uff0c\u5c06\u67d0\u4e9b\u804c\u4e1a\u4e0e\u7279\u5b9a\u6027\u522b\u5173\u8054\u8d77\u6765\uff0c\u5e76\u5728\u63d0\u793a\u4e0d\u591f\u660e\u786e\u65f6\u9ed8\u8ba4\u91c7\u7528\u897f\u65b9\u6587\u5316\u89c4\u8303\u3002\u8fd9\u4e9b\u504f\u89c1\u6839\u690d\u4e8e\u8bad\u7ec3\u6570\u636e\u5206\u5e03\u4ee5\u53ca CLIP/T5 \u6587\u672c\u7f16\u7801\u5668\u4e2d\uff0c\u540e\u8005\u4ece\u5176\u81ea\u8eab\u7684\u8bad\u7ec3\u8bed\u6599\u5e93\u4e2d\u7f16\u7801\u4e86\u504f\u89c1\u3002</p> </li> <li> <p>\u7f13\u89e3\u7b56\u7565\u5305\u62ec\uff1a\u7b56\u5212\u66f4\u5177\u4ee3\u8868\u6027\u7684\u8bad\u7ec3\u6570\u636e\u3001\u5bf9\u6587\u672c\u7f16\u7801\u5668\u5e94\u7528\u53bb\u504f\u6280\u672f\u3001\u4f7f\u7528\u5b89\u5168\u5206\u7c7b\u5668\u8fc7\u6ee4\u6709\u95ee\u9898\u7684\u8f93\u51fa\uff0c\u4ee5\u53ca\u8ba9\u7528\u6237\u80fd\u591f\u63a7\u5236\u4eba\u53e3\u7edf\u8ba1\u5c5e\u6027\u3002\u8fd9\u4e9b\u90fd\u4e0d\u662f\u5b8c\u6574\u7684\u89e3\u51b3\u65b9\u6848\uff0c\u6301\u7eed\u7684\u5ba1\u6838\u81f3\u5173\u91cd\u8981\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#_9","title":"\u5185\u5bb9\u8fc7\u6ee4\u4e0e\u5b89\u5168\u6027","text":"<ul> <li> <p>\u8d1f\u8d23\u4efb\u7684\u90e8\u7f72\u9700\u8981\u591a\u5c42\u4fdd\u62a4\u3002\u8f93\u5165\u8fc7\u6ee4\u5728\u751f\u6210\u4e4b\u524d\u963b\u6b62\u6709\u5bb3\u63d0\u793a\u3002\u8f93\u51fa\u8fc7\u6ee4\u5bf9\u751f\u6210\u5185\u5bb9\u8fdb\u884c\u5206\u7c7b\u5e76\u62d2\u7edd\u6709\u5bb3\u6750\u6599\u3002NSFW \u5206\u7c7b\u5668\u68c0\u6d4b\u9732\u9aa8\u8272\u60c5\u3001\u66b4\u529b\u6216\u5176\u4ed6\u6709\u5bb3\u5185\u5bb9\u3002\u4f8b\u5982\uff0cStable Diffusion \u7684\u5b89\u5168\u68c0\u67e5\u5668\u8ba1\u7b97\u751f\u6210\u56fe\u50cf\u7684 CLIP \u5d4c\u5165\u4e0e\u4e00\u7ec4\u9884\u5b9a\u4e49\u7684\u6709\u5bb3\u6982\u5ff5\u5d4c\u5165\u4e4b\u95f4\u7684\u4f59\u5f26\u76f8\u4f3c\u5ea6\uff0c\u6807\u8bb0\u8d85\u8fc7\u9608\u503c\u7684\u56fe\u50cf\u3002</p> </li> <li> <p>\u8bb8\u591a\u751f\u6210\u6a21\u578b\uff08Stable Diffusion\u3001Wan\uff09\u7684\u5f00\u6e90\u6027\u8d28\u5728\u666e\u53ca\u8bbf\u95ee\u548c\u9632\u6b62\u6ee5\u7528\u4e4b\u95f4\u5f62\u6210\u4e86\u5f20\u529b\u3002\u4e00\u65e6\u6a21\u578b\u6743\u91cd\u53d1\u5e03\uff0c\u5185\u5bb9\u8fc7\u6ee4\u5c31\u53ef\u4ee5\u88ab\u7ed5\u8fc7\u3002\u8fd9\u5f15\u53d1\u4e86\u5173\u4e8e\u9002\u5f53\u7684\u5f00\u653e\u7a0b\u5ea6\u4ee5\u53ca\u6a21\u578b\u5f00\u53d1\u8005\u8d23\u4efb\u7684\u8ba8\u8bba\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#_10","title":"\u77e5\u8bc6\u4ea7\u6743\u4e0e\u77e5\u60c5\u540c\u610f","text":"<ul> <li>\u5728\u4e92\u8054\u7f51\u6570\u636e\u4e0a\u8bad\u7ec3\u7684\u751f\u6210\u6a21\u578b\u53ef\u80fd\u4f1a\u5728\u672a\u7ecf\u540c\u610f\u7684\u60c5\u51b5\u4e0b\u590d\u5236\u53d7\u7248\u6743\u4fdd\u62a4\u7684\u98ce\u683c\u3001\u5546\u6807\u6216\u771f\u5b9e\u4eba\u7269\u7684\u8096\u50cf\u3002\u6cd5\u5f8b\u548c\u4f26\u7406\u6846\u67b6\u4ecd\u5728\u6f14\u53d8\u4e2d\uff0c\u4f46\u8d1f\u8d23\u4efb\u7684\u5b9e\u8df5\u5305\u62ec\u5c0a\u91cd\u9009\u62e9\u9000\u51fa\u673a\u5236\u3001\u627f\u8ba4\u8bad\u7ec3\u6570\u636e\u4e2d\u8574\u542b\u7684\u521b\u9020\u6027\u8d21\u732e\uff0c\u4ee5\u53ca\u5f00\u53d1\u9632\u6b62\u8bb0\u5fc6\u548c\u590d\u8ff0\u8bad\u7ec3\u4f8b\u5b50\u7684\u6280\u672f\u4fdd\u969c\u63aa\u65bd\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/04.%20cross-modal%20generation/#colab-notebook","title":"\u7f16\u7a0b\u7ec3\u4e60\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<ol> <li> <p>\u4e3a\u4e00\u4e2a\u73a9\u5177 2D \u6269\u6563\u6a21\u578b\u5b9e\u73b0\u65e0\u5206\u7c7b\u5668\u5f15\u5bfc\u3002\u5728 2D \u6570\u636e\u96c6\uff08\u4f8b\u5982\u6807\u6ce8\u7684\u805a\u7c7b\uff09\u4e0a\u8bad\u7ec3\u4e00\u4e2a\u6761\u4ef6\u6269\u6563\u6a21\u578b\uff0c\u7136\u540e\u4f7f\u7528\u4e0d\u540c\u7684\u5f15\u5bfc\u5c3a\u5ea6\u8fdb\u884c\u91c7\u6837\uff0c\u89c2\u5bdf\u8d28\u91cf\u4e0e\u591a\u6837\u6027\u7684\u6743\u8861\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# Toy 2D conditional diffusion with classifier-free guidance\ndef noise_schedule(T):\n    betas = jnp.linspace(1e-4, 0.02, T)\n    alphas = 1.0 - betas\n    return jnp.cumprod(alphas)\n\ndef forward_diffuse(x0, t, alpha_bars, key):\n    noise = jax.random.normal(key, x0.shape)\n    return jnp.sqrt(alpha_bars[t]) * x0 + jnp.sqrt(1 - alpha_bars[t]) * noise, noise\n\n# Generate labelled 2D data: class 0 = ring, class 1 = cluster\nkey = jax.random.PRNGKey(42)\nk1, k2, k3 = jax.random.split(key, 3)\ntheta = jax.random.uniform(k1, (200,)) * 2 * jnp.pi\nring = jnp.stack([jnp.cos(theta), jnp.sin(theta)], axis=1) * 2\nring += jax.random.normal(k2, ring.shape) * 0.1\ncluster = jax.random.normal(k3, (200, 2)) * 0.3\n\ndata = jnp.concatenate([ring, cluster])\nlabels = jnp.concatenate([jnp.zeros(200), jnp.ones(200)])\n\n# Simulate CFG: show how guidance pushes samples toward class-conditional modes\n# Try varying guidance_scale from 0.0 to 5.0 and observe results\nguidance_scales = [0.0, 1.0, 3.0, 7.0]\nfig, axes = plt.subplots(1, 4, figsize=(16, 4))\nfor ax, s in zip(axes, guidance_scales):\n    ax.scatter(ring[:, 0], ring[:, 1], s=8, alpha=0.4, label='Ring (c=0)')\n    ax.scatter(cluster[:, 0], cluster[:, 1], s=8, alpha=0.4, label='Cluster (c=1)')\n    ax.set_title(f'Guidance scale s={s}')\n    ax.set_xlim(-4, 4); ax.set_ylim(-4, 4)\n    ax.set_aspect('equal'); ax.legend(fontsize=7)\nplt.suptitle('Experiment: vary guidance scale and observe quality vs diversity')\nplt.tight_layout(); plt.show()\n# Exercise: train a small MLP denoiser with class conditioning,\n# then implement the CFG formula to sample with different s values.\n</code></pre></p> </li> <li> <p>\u4f7f\u7528\u5b8c\u6574\u7684 Frechet \u8ddd\u79bb\u516c\u5f0f\u8ba1\u7b97\u4e24\u7ec4 2D \u6837\u672c\u4e4b\u95f4\u7684 FID\u3002\u6539\u53d8\u751f\u6210\u5206\u5e03\uff0c\u89c2\u5bdf FID \u5982\u4f55\u53d8\u5316\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef compute_fid(real, generated):\n    \"\"\"Compute Frechet distance between two 2D sample sets.\"\"\"\n    mu_r, mu_g = jnp.mean(real, axis=0), jnp.mean(generated, axis=0)\n    sigma_r = jnp.cov(real.T)\n    sigma_g = jnp.cov(generated.T)\n    diff = mu_r - mu_g\n    # Matrix square root via eigendecomposition\n    product = sigma_r @ sigma_g\n    eigvals, eigvecs = jnp.linalg.eigh(product)\n    sqrt_product = eigvecs @ jnp.diag(jnp.sqrt(jnp.maximum(eigvals, 0))) @ eigvecs.T\n    fid = jnp.sum(diff ** 2) + jnp.trace(sigma_r + sigma_g - 2 * sqrt_product)\n    return fid\n\nkey = jax.random.PRNGKey(0)\nk1, k2, k3, k4 = jax.random.split(key, 4)\n\n# Real distribution: standard 2D Gaussian\nreal = jax.random.normal(k1, (1000, 2))\n\n# Generated distributions with increasing divergence\nshifts = [0.0, 0.5, 1.0, 2.0, 4.0]\nfig, axes = plt.subplots(1, len(shifts), figsize=(18, 3.5))\nfor ax, shift in zip(axes, shifts):\n    gen = jax.random.normal(k2, (1000, 2)) * (1 + shift * 0.2) + shift\n    fid = compute_fid(real, gen)\n    ax.scatter(real[:, 0], real[:, 1], s=3, alpha=0.3, label='Real')\n    ax.scatter(gen[:, 0], gen[:, 1], s=3, alpha=0.3, label='Generated')\n    ax.set_title(f'Shift={shift}\\nFID={fid:.2f}')\n    ax.set_xlim(-5, 8); ax.set_ylim(-5, 8)\n    ax.set_aspect('equal'); ax.legend(fontsize=7)\nplt.suptitle('FID increases as generated distribution diverges from real')\nplt.tight_layout(); plt.show()\n# Try: change the variance of generated samples without shifting the mean.\n# How does FID respond to a diversity mismatch vs a location mismatch?\n</code></pre></p> </li> <li> <p>\u4f7f\u7528\u968f\u673a\u6295\u5f71\u4f5c\u4e3a CLIP \u7684\u66ff\u4ee3\uff0c\u5b9e\u73b0\u6587\u672c\u548c\u56fe\u50cf\u5d4c\u5165\u4e4b\u95f4\u7684 CLIPScore \u8ba1\u7b97\u3002\u89c2\u5bdf\u5f53\u4f60\u6539\u53d8\u6a21\u6001\u4e4b\u95f4\u7684\"\u5bf9\u9f50\u5ea6\"\u65f6\uff0c\u4f59\u5f26\u76f8\u4f3c\u5ea6\u5982\u4f55\u53d8\u5316\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef cosine_similarity(a, b):\n    return jnp.dot(a, b) / (jnp.linalg.norm(a) * jnp.linalg.norm(b))\n\ndef clip_score(img_emb, txt_emb):\n    \"\"\"CLIPScore: clamped cosine similarity.\"\"\"\n    return jnp.maximum(0.0, cosine_similarity(img_emb, txt_emb))\n\nkey = jax.random.PRNGKey(42)\ndim = 512  # CLIP embedding dimension\n\n# Simulate aligned and misaligned pairs\n# Aligned: image and text embeddings share a component\nk1, k2, k3 = jax.random.split(key, 3)\nshared = jax.random.normal(k1, (dim,))\nshared = shared / jnp.linalg.norm(shared)\n\nnoise_levels = jnp.linspace(0, 5, 20)\nscores = []\nfor noise in noise_levels:\n    noise_vec = jax.random.normal(k2, (dim,)) * noise\n    img_emb = shared + noise_vec * 0.3\n    txt_emb = shared + jax.random.normal(k3, (dim,)) * noise * 0.3\n    scores.append(float(clip_score(img_emb, txt_emb)))\n\nplt.figure(figsize=(8, 4))\nplt.plot(noise_levels, scores, 'o-', color='#2c3e50')\nplt.xlabel('Noise level (misalignment)')\nplt.ylabel('CLIPScore')\nplt.title('CLIPScore decreases as text-image alignment degrades')\nplt.grid(True, alpha=0.3)\nplt.tight_layout(); plt.show()\n# Experiment: what happens if you normalise embeddings before adding noise?\n# How does dimensionality affect the score distribution?\n</code></pre></p> </li> </ol>"},{"location":"chapter%2010%3A%20multimodal%20learning/05.%20unified%20multimodal%20architectures/","title":"\u7edf\u4e00\u591a\u6a21\u6001\u67b6\u6784","text":"<p>\u7edf\u4e00\u591a\u6a21\u6001\u67b6\u6784\u7528\u5355\u4e00\u7cfb\u7edf\u53d6\u4ee3\u4e86\u5404\u81ea\u4e3a\u653f\u7684\u4e13\u5bb6\u6a21\u578b\uff0c\u8fd9\u4e2a\u7cfb\u7edf\u80fd\u591f\u8de8\u8d8a\u6587\u672c\u3001\u56fe\u50cf\u3001\u97f3\u9891\u548c\u89c6\u9891\u8fdb\u884c\u8bfb\u53d6\u3001\u63a8\u7406\u548c\u751f\u6210\u3002\u672c\u6587\u6db5\u76d6\u4e86\u4efb\u610f\u5230\u4efb\u610f\u6a21\u578b\uff08CoDi\u3001NExT-GPT\uff09\u3001\u539f\u751f\u591a\u6a21\u6001\u5927\u8bed\u8a00\u6a21\u578b\uff08Gemini\u3001GPT-4o\uff09\u3001\u591a\u6a21\u6001\u5206\u8bcd\u7b56\u7565\uff0c\u4ee5\u53ca\u7edf\u4e00\u5316\u6240\u5e26\u6765\u7684\u67b6\u6784\u6743\u8861\u3002</p>"},{"location":"chapter%2010%3A%20multimodal%20learning/05.%20unified%20multimodal%20architectures/#_2","title":"\u7edf\u4e00\u5316\u7684\u7406\u7531","text":"<ul> <li> <p>\u60f3\u8c61\u4e00\u4f4d\u4f1a\u8bf4\u4e94\u79cd\u8bed\u8a00\u3001\u80fd\u5728\u53e5\u5b50\u4e2d\u95f4\u65e0\u505c\u987f\u5730\u5207\u6362\u8bed\u79cd\u7684\u7ffb\u8bd1\u3002\u65e9\u671f\u7684\u591a\u6a21\u6001\u7cfb\u7edf\u66f4\u50cf\u662f\u4e94\u4e2a\u5750\u5728\u4e0d\u540c\u623f\u95f4\u7684\u7ffb\u8bd1\uff0c\u6bcf\u4eba\u5904\u7406\u4e00\u79cd\u8bed\u8a00\uff0c\u901a\u8fc7\u5899\u4e0a\u7684\u5c0f\u7f1d\u9699\u4f20\u9012\u7eb8\u6761\u3002\u800c\u7edf\u4e00\u591a\u6a21\u6001\u67b6\u6784\u5c31\u662f\u90a3\u4e00\u4f4d\u591a\u8bed\u8a00\u8005\uff1a\u4e00\u4e2a\u5171\u4eab\u6743\u91cd\u7684\u6a21\u578b\uff0c\u5728\u5355\u6b21\u524d\u5411\u4f20\u64ad\u4e2d\u5373\u53ef\u8de8\u6587\u672c\u3001\u56fe\u50cf\u3001\u97f3\u9891\u3001\u89c6\u9891\u751a\u81f3\u52a8\u4f5c\u8fdb\u884c\u8bfb\u53d6\u3001\u4e66\u5199\u548c\u63a8\u7406\u3002</p> </li> <li> <p>\u5176\u52a8\u673a\u65e2\u6709\u5b9e\u7528\u5c42\u9762\u7684\u4e5f\u6709\u7406\u8bba\u5c42\u9762\u7684\u3002\u5728\u5b9e\u7528\u5c42\u9762\uff0c\u7ef4\u62a4\u6bcf\u5bf9\u6a21\u6001\u7684\u4e13\u7528\u4e13\u5bb6\u6a21\u578b\uff08\u6587\u672c\u5230\u56fe\u50cf\u3001\u56fe\u50cf\u5230\u6587\u672c\u3001\u97f3\u9891\u5230\u6587\u672c\u7b49\uff09\u4f1a\u5bfc\u81f4\u7ec4\u5408\u7206\u70b8\uff1a\\(k\\) \u79cd\u6a21\u6001\u9700\u8981\u6700\u591a \\(k(k-1)\\) \u4e2a\u6709\u5411\u6d41\u6c34\u7ebf\u3002\u4e00\u4e2a\u7edf\u4e00\u6a21\u578b\u5c06\u6240\u6709\u8fd9\u7c7b\u6d41\u6c34\u7ebf\u574d\u7f29\u4e3a\u5355\u4e00\u7cfb\u7edf\u3002\u5728\u7406\u8bba\u5c42\u9762\uff0c\u4eba\u7c7b\u8ba4\u77e5\u5e76\u975e\u5728\u9694\u79bb\u7684\u6a21\u5757\u4e2d\u5904\u7406\u89c6\u89c9\u548c\u8bed\u8a00\uff1b\u8de8\u6a21\u6001\u7ed1\u5b9a\u53d1\u751f\u5f97\u65e9\u4e14\u6df1\uff0c\u7edf\u4e00\u5316\u5c1d\u8bd5\u6a21\u4eff\u8fd9\u4e00\u70b9\u3002</p> </li> <li> <p>\u5171\u4eab\u6743\u91cd\u9f13\u52b1\u8de8\u6a21\u6001\u8fc1\u79fb\u3002\u4e00\u4e2a\u5df2\u5728\u6587\u672c\u4e2d\u5b66\u5230\u65f6\u95f4\u6a21\u5f0f\uff08\u4e3b\u8bed\u5728\u52a8\u8bcd\u524d\u3001\u539f\u56e0\u5728\u7ed3\u679c\u524d\uff09\u7684 Transformer\uff0c\u53ef\u4ee5\u5c06\u540c\u6837\u7684\u6ce8\u610f\u529b\u7535\u8def\u91cd\u65b0\u7528\u4e8e\u89c6\u9891\u4e2d\u7684\u65f6\u95f4\u6a21\u5f0f\uff08\u5bf9\u8c61\u51fa\u73b0\u5728\u79fb\u52a8\u4e4b\u524d\uff09\u6216\u97f3\u9891\u4e2d\u7684\u65f6\u95f4\u6a21\u5f0f\uff08\u8d77\u97f3\u5728\u6301\u7eed\u4e4b\u524d\uff09\u3002\u8fd9\u662f\u8fc1\u79fb\u5b66\u4e60\u7684\u591a\u6a21\u6001\u7c7b\u6bd4\u2014\u2014\u4f60\u66fe\u5728\u7b2c 7 \u7ae0\u7684\u8bed\u8a00\u6a21\u578b\u5fae\u8c03\u4e2d\u548c\u7b2c 8 \u7ae0\u7684 ImageNet \u9884\u8bad\u7ec3\u4e2d\u89c1\u5230\u8fc7\u3002</p> </li> <li> <p>\u5f62\u5f0f\u4e0a\uff0c\u4ee4 \\(\\mathcal{M} = \\{m_1, m_2, \\ldots, m_k\\}\\) \u4e3a\u4e00\u7ec4\u6a21\u6001\u3002\u7edf\u4e00\u6a21\u578b\u5b9a\u4e49\u4e86\u4e00\u4e2a\u5355\u4e00\u53c2\u6570\u5316\u51fd\u6570 \\(f_\\theta\\)\uff0c\u5b83\u5c06\u4efb\u610f\u8f93\u5165\u6a21\u6001\u5b50\u96c6\u6620\u5c04\u5230\u4efb\u610f\u8f93\u51fa\u6a21\u6001\u5b50\u96c6\uff1a</p> </li> </ul> \\[f_\\theta : \\mathcal{P}(\\mathcal{M}) \\rightarrow \\mathcal{P}(\\mathcal{M})\\] <ul> <li>\u5176\u4e2d \\(\\mathcal{P}(\\mathcal{M})\\) \u662f\u6a21\u6001\u7684\u5e42\u96c6\uff08\u6240\u6709\u5b50\u96c6\uff09\u3002\u5173\u952e\u7ea6\u675f\u662f \\(\\theta\\) \u5927\u90e8\u5206\u662f\u5171\u4eab\u7684\uff1b\u53ea\u6709\u8584\u8584\u7684\u6a21\u6001\u7279\u5b9a\u9002\u914d\u5668\u5c42\u6709\u6240\u4e0d\u540c\u3002</li> </ul> <p></p> <ul> <li>\u7edf\u4e00\u5316\u7684\u524d\u666f\u4f34\u968f\u7740\u4e00\u4e2a\u57fa\u672c\u5f20\u529b\uff1a\u6a21\u6001\u5728\u7ed3\u6784\u4e0a\u662f\u4e0d\u540c\u7684\u3002\u6587\u672c\u662f\u79bb\u6563 token \u7684\u4e00\u7ef4\u5e8f\u5217\u3002\u56fe\u50cf\u662f\u8fde\u7eed\u50cf\u7d20\u503c\u7684\u4e8c\u7ef4\u7f51\u683c\u3002\u97f3\u9891\u662f\u4e00\u7ef4\u8fde\u7eed\u6ce2\u5f62\uff0c\u65f6\u95f4\u5c3a\u5ea6\u4e0e\u6587\u672c\u622a\u7136\u4e0d\u540c\u3002\u89c6\u9891\u4e3a\u56fe\u50cf\u6dfb\u52a0\u4e86\u65f6\u95f4\u8f74\u3002\u5c06\u8fd9\u4e9b\u8fe5\u5f02\u7684\u7ed3\u6784\u8c03\u548c\u6210\u5355\u4e00\u7684\u3001Transformer \u80fd\u591f\u6d88\u5316\u7684\u5e8f\u5217\uff0c\u662f\u8be5\u9886\u57df\u6838\u5fc3\u7684\u5de5\u7a0b\u6311\u6218\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/05.%20unified%20multimodal%20architectures/#_3","title":"\u4efb\u610f\u5230\u4efb\u610f\u6a21\u578b","text":"<ul> <li> <p>\u60f3\u8c61\u4e00\u4e2a\u901a\u7528\u9065\u63a7\u5668\uff0c\u53ef\u4ee5\u901a\u8fc7\u540c\u4e00\u4e2a\u754c\u9762\u64cd\u4f5c\u4f60\u7684\u7535\u89c6\u3001\u7a7a\u8c03\u548c\u97f3\u54cd\u7cfb\u7edf\u3002\u4efb\u610f\u5230\u4efb\u610f\u6a21\u578b\u5c31\u662f AI \u4e2d\u7684\u7b49\u4ef7\u7269\uff1a\u5b83\u4eec\u63a5\u6536\u4efb\u610f\u6a21\u6001\u7ec4\u5408\u4f5c\u4e3a\u8f93\u5165\uff0c\u5e76\u4ea7\u751f\u4efb\u610f\u7ec4\u5408\u4f5c\u4e3a\u8f93\u51fa\u3002</p> </li> <li> <p>CoDi\uff08Composable Diffusion\uff0c\u53ef\u7ec4\u5408\u6269\u6563\uff09\u901a\u8fc7\u8bad\u7ec3\u6a21\u6001\u7279\u5b9a\u7684\u6269\u6563\u6a21\u578b\uff0c\u7136\u540e\u901a\u8fc7\u5171\u4eab\u6761\u4ef6\u673a\u5236\u5bf9\u9f50\u5b83\u4eec\u7684\u6f5c\u5728\u7a7a\u95f4\u6765\u5b9e\u73b0\u4efb\u610f\u5230\u4efb\u610f\u751f\u6210\u3002\u6bcf\u79cd\u6a21\u6001\u90fd\u6709\u5176\u81ea\u8eab\u7684\u6269\u6563\u8fc7\u7a0b\uff08\u56de\u987e\u672c\u7ae0\u6587\u4ef6 04 \u4e2d\u7684\u6269\u6563\u6a21\u578b\uff09\uff0c\u4f46\u566a\u58f0\u9884\u6d4b\u7f51\u7edc\u88ab\u6761\u4ef6\u5316\u5728\u4e00\u4e2a\u8054\u5408\u4ea4\u53c9\u6ce8\u610f\u529b\u5c42\u4e0a\uff0c\u8be5\u5c42\u540c\u65f6\u770b\u5230\u6240\u6709\u8f93\u5165\u6a21\u6001\u7684\u5d4c\u5165\u3002\u8fd9\u8ba9 CoDi \u80fd\u591f\u5728\u5355\u6b21\u524d\u5411\u4f20\u64ad\u4e2d\uff0c\u4f8b\u5982\u4ece\u4e00\u4e2a\u6587\u672c\u63d0\u793a\u751f\u6210\u56fe\u50cf\u548c\u5339\u914d\u7684\u97f3\u9891\u3002</p> </li> <li> <p>NExT-GPT \u91c7\u7528\u4e86\u4e0d\u540c\u7684\u67b6\u6784\u65b9\u6cd5\u3002\u5b83\u5c06 LLM \u4e3b\u5e72\uff08\"\u5927\u8111\"\uff09\u901a\u8fc7\u8f7b\u91cf\u7ea7\u7684\u6295\u5f71\u5c42\u8fde\u63a5\u5230\u8f93\u5165\u4fa7\u7684\u6a21\u6001\u7279\u5b9a\u7f16\u7801\u5668\u548c\u8f93\u51fa\u4fa7\u7684\u6a21\u6001\u7279\u5b9a\u89e3\u7801\u5668\u3002\u8f93\u5165\u7f16\u7801\u5668\uff08\u4f8b\u5982\u6765\u81ea CLIP \u7684\u56fe\u50cf\u7f16\u7801\u5668\u3001\u6765\u81ea CLAP \u7684\u97f3\u9891\u7f16\u7801\u5668\uff09\u5c06\u6bcf\u79cd\u6a21\u6001\u7ffb\u8bd1\u6210 LLM \u7684\u5d4c\u5165\u7a7a\u95f4\u3002LLM \u5bf9\u7ec4\u5408\u540e\u7684 token \u5e8f\u5217\u8fdb\u884c\u63a8\u7406\uff0c\u5e76\u53d1\u51fa\u7279\u6b8a\u7684\"\u6a21\u6001\u4fe1\u53f7 token\"\u6765\u5c06\u4fe1\u606f\u8def\u7531\u5230\u9002\u5f53\u7684\u89e3\u7801\u5668\uff08\u4f8b\u5982\u7528\u4e8e\u56fe\u50cf\u7684 Stable Diffusion\u3001\u7528\u4e8e\u97f3\u9891\u7684 AudioLDM\uff09\u3002\u53ea\u6709\u6295\u5f71\u5c42\u88ab\u8bad\u7ec3\uff1bLLM \u548c\u4e13\u5bb6\u7f16\u89e3\u7801\u5668\u4fdd\u6301\u51bb\u7ed3\u3002</p> </li> <li> <p>Gemini\uff08Google DeepMind\uff09\u4ece\u9884\u8bad\u7ec3\u9636\u6bb5\u8d77\u5c31\u662f\u539f\u751f\u591a\u6a21\u6001\u7684\u3002\u4e0e NExT-GPT \u7684\u5373\u63d2\u5373\u7528\u65b9\u6cd5\u4e0d\u540c\uff0cGemini \u7684 Transformer \u4ece\u5934\u5f00\u59cb\u5c31\u5728\u6587\u672c\u3001\u56fe\u50cf\u3001\u97f3\u9891\u548c\u89c6\u9891 token \u7684\u4ea4\u9519\u5e8f\u5217\u4e0a\u8fdb\u884c\u8bad\u7ec3\u3002\u8fd9\u610f\u5473\u7740\u8de8\u6a21\u6001\u6ce8\u610f\u529b\u6a21\u5f0f\u5728\u9884\u8bad\u7ec3\u671f\u95f4\u6709\u673a\u5730\u53d1\u5c55\uff0c\u800c\u4e0d\u662f\u4e8b\u540e\u624d\u62fc\u63a5\u4e0a\u53bb\u3002\u8be5\u6a21\u578b\u5bf9\u6587\u672c\u4f7f\u7528 SentencePiece tokenizer\uff0c\u5e76\u5b66\u4e60\u4e86\u4e00\u79cd\u7c7b\u4f3c\u4e8e\u672c\u7ae0\u6587\u4ef6 03 \u4e2d\u8ba8\u8bba\u7684 VQ \u65b9\u6cd5\u7684\u89c6\u89c9 tokenizer\u3002</p> </li> <li> <p>GPT-4o\uff08\"o\"\u4ee3\u8868\"omni\"\uff0c\u5168\u6a21\u6001\uff09\u4ee3\u8868\u4e86\u53e6\u4e00\u79cd\u6a21\u5f0f\uff1a\u4e00\u4e2a\u7aef\u5230\u7aef\u6a21\u578b\uff0c\u5176\u4e2d\u6240\u6709\u6a21\u6001\u5171\u4eab\u540c\u4e00\u4e2a Transformer \u548c\u540c\u4e00\u4e2a\u4e0b\u4e00 token \u9884\u6d4b\u76ee\u6807\u3002\u97f3\u9891\u8f93\u5165\u4f5c\u4e3a\u9891\u8c31 token \u5904\u7406\uff0c\u56fe\u50cf\u4f5c\u4e3a\u5757 token\uff0c\u6587\u672c\u4f5c\u4e3a\u5b50\u8bcd token\uff0c\u5168\u90e8\u9001\u5165\u5355\u4e00\u5e8f\u5217\u3002\u6a21\u578b\u751f\u6210\u7684\u8f93\u51fa token \u7531\u6a21\u6001\u7279\u5b9a\u7684\u5934\u90e8\u89e3\u7801\u3002\u5173\u952e\u521b\u65b0\u5728\u4e8e\u4f4e\u5ef6\u8fdf\u2014\u2014\u901a\u8fc7\u6d88\u9664\u65e9\u671f\u7cfb\u7edf\uff08\u5982 GPT-4V\uff09\u6240\u4f9d\u8d56\u7684\u72ec\u7acb ASR\u3001LLM \u548c TTS \u7ea7\u8054\u800c\u5b9e\u73b0\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u8fd9\u4e9b\u6a21\u578b\u5904\u4e8e\u96c6\u6210\u6df1\u5ea6\u8c31\u7cfb\u7684\u4e0d\u540c\u4f4d\u7f6e\uff1a</p> <ul> <li>\u6d45\u5c42\u96c6\u6210\uff08NExT-GPT\uff09\uff1a\u51bb\u7ed3\u4e13\u5bb6\uff0c\u901a\u8fc7\u8bad\u7ec3\u9002\u914d\u5668\u8fde\u63a5\u3002\u6784\u5efa\u5feb\u901f\uff0c\u8de8\u6a21\u6001\u63a8\u7406\u80fd\u529b\u6709\u9650\u3002</li> <li>\u4e2d\u5c42\u96c6\u6210\uff08CoDi\uff09\uff1a\u8de8\u6a21\u6001\u7279\u5b9a\u751f\u6210\u5668\u7684\u5171\u4eab\u6761\u4ef6\u5316\u3002\u5bf9\u9f50\u66f4\u597d\uff0c\u4ecd\u7136\u6a21\u5757\u5316\u3002</li> <li>\u6df1\u5c42\u96c6\u6210\uff08Gemini\u3001GPT-4o\uff09\uff1a\u5728\u6240\u6709\u6a21\u6001\u4e0a\u7aef\u5230\u7aef\u8bad\u7ec3\u7684\u5355\u4e00\u6a21\u578b\u3002\u8de8\u6a21\u6001\u63a8\u7406\u6700\u4e30\u5bcc\uff0c\u8bad\u7ec3\u6210\u672c\u6700\u9ad8\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/05.%20unified%20multimodal%20architectures/#_4","title":"\u5171\u4eab\u4e3b\u5e72\u4e0a\u7684\u6a21\u6001\u7279\u5b9a\u7f16\u7801\u5668\u548c\u89e3\u7801\u5668","text":"<ul> <li> <p>\u60f3\u8c61\u4e00\u5bb6\u5de5\u5382\u6709\u4e00\u6761\u603b\u88c5\u7ebf\uff08\u5171\u4eab\u4e3b\u5e72\uff09\uff0c\u4f46\u6709\u4e0d\u540c\u7684\u539f\u6599\u88c5\u5378\u7801\u5934\uff08\u7f16\u7801\u5668\uff09\u548c\u4e0d\u540c\u7684\u6210\u54c1\u53d1\u8fd0\u90e8\u95e8\uff08\u89e3\u7801\u5668\uff09\u3002\u6bcf\u4e2a\u7801\u5934\u4e13\u7cbe\u4e8e\u5176\u8d27\u7269\uff0c\u4f46\u4e00\u65e6\u8fdb\u5165\u5de5\u5382\u5185\u90e8\uff0c\u6240\u6709\u4e1c\u897f\u90fd\u5728\u540c\u4e00\u6761\u4f20\u9001\u5e26\u4e0a\u79fb\u52a8\u3002</p> </li> <li> <p>\u7edf\u4e00\u6a21\u578b\u7684\u4e3b\u5bfc\u67b6\u6784\u6a21\u5f0f\u91c7\u7528\u8fd9\u79cd\u4e09\u90e8\u5206\u7ed3\u6784\uff1a</p> <ul> <li>\u6a21\u6001\u7f16\u7801\u5668 \\(E_m\\)\uff1a\u5c06\u6765\u81ea\u6a21\u6001 \\(m\\) \u7684\u539f\u59cb\u8f93\u5165\u8f6c\u6362\u4e3a\u5d4c\u5165\u5411\u91cf\u5e8f\u5217 \\(\\mathbf{h}_1^m, \\mathbf{h}_2^m, \\ldots, \\mathbf{h}_{n_m}^m\\)\uff0c\u6bcf\u4e2a\u5411\u91cf\u7684\u7ef4\u5ea6\u4e3a \\(d\\)\u3002</li> <li>\u5171\u4eab Transformer \u4e3b\u5e72 \\(T_\\theta\\)\uff1a\u4f7f\u7528\u81ea\u6ce8\u610f\u529b\u5904\u7406\u6765\u81ea\u6240\u6709\u8f93\u5165\u6a21\u6001\u7684\u62fc\u63a5\u6216\u4ea4\u9519\u5d4c\u5165\u3002</li> <li>\u6a21\u6001\u89e3\u7801\u5668 \\(D_m\\)\uff1a\u5c06\u4e3b\u5e72\u7684\u8f93\u51fa\u5d4c\u5165\u8f6c\u6362\u56de\u6a21\u6001 \\(m\\) \u7684\u539f\u751f\u683c\u5f0f\uff08\u6587\u672c token\u3001\u56fe\u50cf\u50cf\u7d20\u3001\u97f3\u9891\u6ce2\u5f62\uff09\u3002</li> </ul> </li> <li> <p>\u5bf9\u4e8e\u6587\u672c\uff0c\u7f16\u7801\u5668\u901a\u5e38\u662f\u4e00\u4e2a\u5d4c\u5165\u67e5\u627e\u8868 \\(E_\\text{text}(w) = \\mathbf{W}_e[w]\\)\uff0c\u5176\u4e2d \\(w\\) \u662f token \u7d22\u5f15\uff0c\u4e0e\u4f60\u5728\u7b2c 7 \u7ae0 Transformer \u4e2d\u770b\u5230\u7684\u76f8\u540c\u3002\u5bf9\u4e8e\u56fe\u50cf\uff0c\u7f16\u7801\u5668\u901a\u5e38\u662f\u89c6\u89c9 Transformer\uff08ViT\uff09\uff0c\u5b83\u5c06\u56fe\u50cf\u5206\u5272\u6210\u5757\u5e76\u5c06\u6bcf\u4e2a\u5757\u7ebf\u6027\u6295\u5f71\uff0c\u5982\u7b2c 8 \u7ae0\u6240\u8ff0\u3002\u5bf9\u4e8e\u97f3\u9891\uff0c\u7f16\u7801\u5668\u8ba1\u7b97\u6885\u5c14\u9891\u8c31\u56fe\uff0c\u7136\u540e\u7528\u5377\u79ef\u524d\u7aef\u6216\u97f3\u9891\u9891\u8c31\u56fe Transformer\uff08AST\uff09\u5904\u7406\uff0c\u5982\u7b2c 9 \u7ae0\u6240\u8ff0\u3002</p> </li> <li> <p>\u5171\u4eab\u4e3b\u5e72\u662f\u4e00\u4e2a\u6807\u51c6 Transformer\uff0c\u5bf9\u6240\u6709\u6a21\u6001 token \u8fdb\u884c\u81ea\u6ce8\u610f\u529b\u3002\u7ed9\u5b9a\u4e00\u4e2a\u62fc\u63a5\u8f93\u5165\u5e8f\u5217 \\(\\mathbf{H} = [\\mathbf{h}_1^{m_1}, \\ldots, \\mathbf{h}_{n_1}^{m_1}, \\mathbf{h}_1^{m_2}, \\ldots, \\mathbf{h}_{n_2}^{m_2}]\\)\uff0c\u81ea\u6ce8\u610f\u529b\u5141\u8bb8\u6bcf\u4e2a token \u5173\u6ce8\u6240\u6709\u5176\u4ed6 token\uff0c\u65e0\u8bba\u5176\u6a21\u6001\u5982\u4f55\uff1a</p> </li> </ul> \\[\\text{Attention}(\\mathbf{Q}, \\mathbf{K}, \\mathbf{V}) = \\text{softmax}\\left(\\frac{\\mathbf{Q}\\mathbf{K}^\\top}{\\sqrt{d_k}}\\right)\\mathbf{V}\\] <ul> <li> <p>\u8fd9\u4e0e\u7b2c 7 \u7ae0\u4e2d\u7684\u6ce8\u610f\u529b\u516c\u5f0f\u76f8\u540c\uff0c\u4f46\u73b0\u5728 \\(\\mathbf{Q}\\)\u3001\\(\\mathbf{K}\\) \u548c \\(\\mathbf{V}\\) \u5305\u542b\u6765\u81ea\u591a\u79cd\u6a21\u6001\u7684 token\u3002\u56fe\u50cf\u5757 token \u53ef\u4ee5\u5173\u6ce8\u6587\u672c token\uff0c\u4ece\u800c\u65e0\u9700\u5355\u72ec\u7684\u4ea4\u53c9\u6ce8\u610f\u529b\u6a21\u5757\u5373\u53ef\u5b9e\u73b0\u8de8\u6a21\u6001\u63a8\u7406\u3002</p> </li> <li> <p>\u6a21\u6001\u5d4c\u5165\u88ab\u6dfb\u52a0\u5230\u6bcf\u4e2a token \u4e0a\uff0c\u4ee5\u4fbf\u4e3b\u5e72\u77e5\u9053 token \u6765\u81ea\u54ea\u79cd\u6a21\u6001\u3002\u8fd9\u7c7b\u4f3c\u4e8e\u4f4d\u7f6e\u5d4c\u5165\uff0c\u4f46\u7f16\u7801\u7684\u662f\u6a21\u6001\u8eab\u4efd\u800c\u975e\u5e8f\u5217\u4f4d\u7f6e\u3002\u4e00\u4e2a\u53ef\u5b66\u4e60\u7684\u5411\u91cf \\(\\mathbf{e}_m \\in \\mathbb{R}^d\\) \u88ab\u6dfb\u52a0\u5230\u6bcf\u4e2a\u6765\u81ea\u6a21\u6001 \\(m\\) \u7684 token \u4e0a\uff1a</p> </li> </ul> \\[\\tilde{\\mathbf{h}}_i^m = \\mathbf{h}_i^m + \\mathbf{e}_m + \\mathbf{p}_i\\] <ul> <li>\u5176\u4e2d \\(\\mathbf{p}_i\\) \u662f\u4f4d\u7f6e \\(i\\) \u7684\u4f4d\u7f6e\u5d4c\u5165\u3002</li> </ul> <p></p>"},{"location":"chapter%2010%3A%20multimodal%20learning/05.%20unified%20multimodal%20architectures/#_5","title":"\u591a\u6a21\u6001\u5206\u8bcd","text":"<ul> <li> <p>\u60f3\u8c61\u4f60\u5728\u5199\u4e00\u5c01\u4fe1\uff0c\u4fe1\u4e2d\u65e2\u6709\u82f1\u6587\u6587\u672c\u53c8\u6709\u624b\u7ed8\u8349\u56fe\u3002\u4f60\u53ef\u80fd\u5199\u4e00\u4e2a\u53e5\u5b50\uff0c\u753b\u4e00\u4e2a\u56fe\u8868\uff0c\u518d\u5199\u4e00\u4e2a\u5f15\u7528\u8be5\u56fe\u8868\u7684\u53e5\u5b50\uff0c\u7136\u540e\u8d34\u4e0a\u4e00\u6bb5\u4e50\u8c31\u3002\u8fd9\u5c01\u4fe1\u5c31\u662f\u4e00\u4e2a\u7ebf\u6027\u6d41\uff0c\u4ea4\u9519\u7740\u4e0d\u540c\u7684\"\u6a21\u6001\"\u3002\u591a\u6a21\u6001\u5206\u8bcd\u505a\u7684\u6b63\u662f\u8fd9\u4ef6\u4e8b\uff1a\u5b83\u5c06\u6587\u672c\u3001\u56fe\u50cf\u3001\u97f3\u9891\u548c\u89c6\u9891\u8f6c\u6362\u6210\u5355\u4e00\u7684\u6241\u5e73 token \u5e8f\u5217\uff0c\u7531 Transformer \u4ece\u5de6\u5230\u53f3\u5904\u7406\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u6587\u672c\uff0c\u5206\u8bcd\u6280\u672f\u5df2\u7ecf\u5f88\u6210\u719f\uff1a\u5b57\u8282\u5bf9\u7f16\u7801\uff08BPE\uff09\u6216 SentencePiece \u4ea7\u751f\u5b50\u8bcd token \u7684\u8bcd\u6c47\u8868\uff0c\u5982\u7b2c 7 \u7ae0\u6240\u8ff0\u3002\u6311\u6218\u5728\u4e8e\u5c06\u8fd9\u4e00\u601d\u60f3\u6269\u5c55\u5230\u8fde\u7eed\u6a21\u6001\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u56fe\u50cf\uff0c\u6709\u4e24\u79cd\u4e3b\u8981\u65b9\u6cd5\u3002\u79bb\u6563\u65b9\u6cd5\u4f7f\u7528 VQ-VAE \u6216 VQ-GAN\uff08\u8be6\u89c1\u672c\u7ae0\u6587\u4ef6 03\uff09\u5c06\u6bcf\u5e45\u56fe\u50cf\u6620\u5c04\u4e3a\u7801\u672c\u7d22\u5f15\u5e8f\u5217\u3002\u5982\u679c\u7801\u672c\u6709 \\(|\\mathcal{C}|\\) \u4e2a\u6761\u76ee\u4e14\u4e00\u5e45\u56fe\u50cf\u7f16\u7801\u4e3a \\(n\\) \u4e2a\u7801\u5b57\uff0c\u5219\u8be5\u56fe\u50cf\u53d8\u4e3a \\(n\\) \u4e2a\u79bb\u6563 token\uff0c\u53d6\u81ea\u5927\u5c0f\u4e3a \\(|\\mathcal{C}|\\) \u7684\u8bcd\u6c47\u8868\uff0c\u76f4\u63a5\u4e0e\u6587\u672c\u8bcd\u6c47\u8868\u517c\u5bb9\u3002\u8fde\u7eed\u65b9\u6cd5\u4f7f\u7528 ViT \u6216 CNN \u7f16\u7801\u5668\u4ea7\u751f \\(n\\) \u4e2a\u8fde\u7eed\u5d4c\u5165\u5411\u91cf\uff0c\u7136\u540e\u7ebf\u6027\u6295\u5f71\u5230 Transformer \u7684\u5d4c\u5165\u7ef4\u5ea6\u4e2d\u3002Gemini \u548c GPT-4o \u4f7f\u7528\u8fde\u7eed\u65b9\u6cd5\u7684\u53d8\u4f53\uff1b\u81ea\u56de\u5f52\u56fe\u50cf\u751f\u6210\u5668\u5982 Parti \u548c LlamaGen \u5219\u504f\u597d\u79bb\u6563\u8def\u7ebf\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u97f3\u9891\uff0c\u4fe1\u53f7\u901a\u5e38\u88ab\u8f6c\u6362\u4e3a\u6885\u5c14\u9891\u8c31\u56fe\uff0c\u7136\u540e\u8981\u4e48\u901a\u8fc7\u795e\u7ecf\u97f3\u9891\u7f16\u89e3\u7801\u5668\uff08\u4f8b\u5982 EnCodec\u3001SoundStream\uff0c\u5b83\u4eec\u4ea7\u751f\u5c42\u6b21\u5316\u7684\u79bb\u6563 token\uff09\u8fdb\u884c\u79bb\u6563\u5316\uff0c\u8981\u4e48\u901a\u8fc7\u5b66\u4e60\u7684\u7f16\u7801\u5668\u8fdb\u884c\u8fde\u7eed\u6295\u5f71\u3002\u4f8b\u5982\uff0cAudioLM \u5c06\u97f3\u9891\u8868\u793a\u4e3a\u6765\u81ea\u591a\u4e2a\u7801\u672c\u5c42\u6b21\u7684\u79bb\u6563 token \u5e8f\u5217\uff0c\u7136\u540e\u4ee5\u81ea\u56de\u5f52\u65b9\u5f0f\u5bf9\u5176\u8fdb\u884c\u5efa\u6a21\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u89c6\u9891\uff0c\u5206\u8bcd\u5efa\u7acb\u5728\u56fe\u50cf\u5206\u8bcd\u7684\u57fa\u7840\u4e0a\uff0c\u4f46\u8fd8\u5fc5\u987b\u538b\u7f29\u65f6\u95f4\u7ef4\u5ea6\u3002\u4e00\u79cd\u5e38\u89c1\u7b56\u7565\u4f7f\u75283D VQ-VAE\uff08\u5982\u6587\u4ef6 03 \u4e2d\u7684 VideoGPT \u6216 Cosmos Tokenizer\uff09\u5c06\u65f6\u7a7a\u5757\u91cf\u5316\u4e3a\u79bb\u6563 token\u3002\u65f6\u95f4\u538b\u7f29\u56e0\u5b50\u81f3\u5173\u91cd\u8981\uff1a\u672a\u7ecf\u6fc0\u8fdb\u7684\u65f6\u95f4\u4e0b\u91c7\u6837\uff0c24 fps \u7684\u539f\u59cb\u89c6\u9891\u6bcf\u79d2\u4ea7\u751f\u7684 token \u6570\u91cf\u592a\u591a\u3002</p> </li> <li> <p>\u4e00\u65e6\u6240\u6709\u6a21\u6001\u90fd\u88ab\u5206\u8bcd\u5316\uff0c\u5b83\u4eec\u5c31\u88ab\u4ea4\u9519\u6210\u5355\u4e00\u5e8f\u5217\uff0c\u5e76\u5e26\u6709\u6807\u8bb0\u6a21\u6001\u8fb9\u754c\u7684\u7279\u6b8a\u5206\u9694 token\u3002\u4e00\u4e2a\u5178\u578b\u683c\u5f0f\u5982\u4e0b\uff1a</p> </li> </ul> <pre><code>[TEXT] \u732b\u5750\u5728\u57ab\u5b50\u4e0a [/TEXT] [IMAGE] &lt;img_tok_1&gt; &lt;img_tok_2&gt; ... &lt;img_tok_n&gt; [/IMAGE] [AUDIO] &lt;aud_tok_1&gt; ... &lt;aud_tok_m&gt; [/AUDIO]\n</code></pre> <ul> <li>Transformer \u7136\u540e\u4f7f\u7528\u5176\u6807\u51c6\u56e0\u679c\uff08\u6216\u53cc\u5411\uff09\u6ce8\u610f\u529b\u673a\u5236\u5904\u7406\u6574\u4e2a\u6df7\u5408\u5e8f\u5217\u3002\u6a21\u6001\u5206\u9694 token \u8d77\u5230\u53cc\u91cd\u4f5c\u7528\uff1a\u5b83\u4eec\u5411\u6a21\u578b\u544a\u77e5\u6a21\u6001\u8fb9\u754c\uff0c\u5e76\u5145\u5f53\"\u6c47\u805a\u70b9\"\uff0c\u5176\u8868\u793a\u6982\u62ec\u4e86\u6bcf\u4e2a\u6a21\u6001\u6bb5\u3002</li> </ul> <p></p> <ul> <li>\u4e00\u4e2a\u5173\u952e\u7684\u8bbe\u8ba1\u9009\u62e9\u662ftoken \u9884\u7b97\u3002\u4e00\u5f20\u88ab\u5206\u8bcd\u4e3a 256 \u4e2a token \u7684\u56fe\u50cf\u52a0\u4e0a 50 \u4e2a token \u7684\u6587\u672c\u63cf\u8ff0\uff0c\u610f\u5473\u7740\u56fe\u50cf\u6d88\u8017\u7684\u4e0a\u4e0b\u6587\u7a97\u53e3\u662f\u6587\u672c\u7684 5 \u500d\u3002\u6a21\u578b\u5fc5\u987b\u5728\u5206\u8fa8\u7387\uff08\u66f4\u591a token = \u66f4\u591a\u7ec6\u8282\uff09\u548c\u4e0a\u4e0b\u6587\u957f\u5ea6\uff08\u66f4\u591a token = \u66f4\u9ad8\u7684\u5185\u5b58\u548c\u8ba1\u7b97\u6210\u672c\uff09\u4e4b\u95f4\u53d6\u5f97\u5e73\u8861\u3002token \u5408\u5e76\uff08\u9010\u6e10\u5408\u5e76\u76f8\u4f3c token\uff09\u548c\u81ea\u9002\u5e94\u5206\u8bcd\uff08\u5bf9\u7b80\u5355\u533a\u57df\u4f7f\u7528\u8f83\u5c11\u7684 token\uff0c\u5bf9\u590d\u6742\u533a\u57df\u4f7f\u7528\u66f4\u591a token\uff09\u7b49\u6280\u672f\u6709\u52a9\u4e8e\u7ba1\u7406\u8fd9\u79cd\u6743\u8861\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/05.%20unified%20multimodal%20architectures/#_6","title":"\u8bad\u7ec3\u914d\u65b9\uff1a\u5206\u9636\u6bb5\u9884\u8bad\u7ec3\u4e0e\u8054\u5408\u5fae\u8c03","text":"<ul> <li> <p>\u4f60\u4e0d\u4f1a\u5728\u6559\u5b69\u5b50\u7b97\u672f\u4e4b\u524d\u5c31\u6559\u4ed6\u5fae\u79ef\u5206\u3002\u540c\u6837\uff0c\u4f60\u4e0d\u80fd\u4ece\u968f\u673a\u521d\u59cb\u5316\u5f00\u59cb\uff0c\u5728\u6240\u6709\u6a21\u6001\u4e0a\u540c\u65f6\u8bad\u7ec3\u4e00\u4e2a\u7edf\u4e00\u591a\u6a21\u6001\u6a21\u578b\uff0c\u5e76\u671f\u671b\u5b83\u80fd\u5f88\u597d\u5730\u6536\u655b\u3002\u4e3b\u5bfc\u65b9\u6cd5\u662f\u5206\u9636\u6bb5\u8bad\u7ec3\uff0c\u5176\u4e2d\u6a21\u578b\u5728\u7cbe\u5fc3\u6392\u5e8f\u7684\u9636\u6bb5\u4e2d\u9010\u6b65\u5b66\u4e60\u8d8a\u6765\u8d8a\u590d\u6742\u7684\u8de8\u6a21\u6001\u80fd\u529b\u3002</p> </li> <li> <p>\u9636\u6bb5 1\uff1a\u5355\u6a21\u6001\u9884\u8bad\u7ec3\u3002 \u6bcf\u4e2a\u6a21\u6001\u7f16\u7801\u5668\u5728\u5927\u578b\u5355\u6a21\u6001\u6570\u636e\u96c6\u4e0a\u72ec\u7acb\u8bad\u7ec3\u3002\u6587\u672c\u4e3b\u5e72\u4f7f\u7528\u6807\u51c6\u8bed\u8a00\u5efa\u6a21\u76ee\u6807\uff08\u4e0b\u4e00 token \u9884\u6d4b\uff09\u5728\u6570\u4e07\u4ebf\u6587\u672c token \u4e0a\u8fdb\u884c\u9884\u8bad\u7ec3\uff0c\u6b63\u5982\u7b2c 7 \u7ae0\u4e00\u6837\u3002\u89c6\u89c9\u7f16\u7801\u5668\u5728\u56fe\u50cf\u5206\u7c7b\u6216\u81ea\u76d1\u7763\u76ee\u6807\uff08MAE\u3001DINO\uff09\u4e0a\u9884\u8bad\u7ec3\uff0c\u5982\u7b2c 8 \u7ae0\u6240\u8ff0\u3002\u97f3\u9891\u7f16\u7801\u5668\u5728\u8bed\u97f3\u8bc6\u522b\u6216\u97f3\u9891\u5206\u7c7b\u6570\u636e\u4e0a\u9884\u8bad\u7ec3\uff0c\u5982\u7b2c 9 \u7ae0\u6240\u8ff0\u3002\u8fd9\u4e00\u9636\u6bb5\u4ea7\u751f\u4e86\u5f3a\u5927\u7684\u5355\u6a21\u6001\u7279\u5f81\u63d0\u53d6\u5668\u3002</p> </li> <li> <p>\u9636\u6bb5 2\uff1a\u8de8\u6a21\u6001\u5bf9\u9f50\u3002 \u9884\u8bad\u7ec3\u7684\u7f16\u7801\u5668\u8fde\u63a5\u5230\u5171\u4eab\u4e3b\u5e72\uff0c\u6a21\u578b\u5728\u6210\u5bf9\u7684\u591a\u6a21\u6001\u6570\u636e\uff08\u56fe\u50cf-\u63cf\u8ff0\u5bf9\u3001\u97f3\u9891-\u6587\u672c\u5bf9\uff09\u4e0a\u4f7f\u7528\u5bf9\u6bd4\u6216\u751f\u6210\u76ee\u6807\u8fdb\u884c\u8bad\u7ec3\u3002\u5728\u6b64\u9636\u6bb5\uff0c\u7f16\u7801\u5668\u6743\u91cd\u53ef\u80fd\u88ab\u51bb\u7ed3\uff08\u4ee5\u4fdd\u7559\u5355\u6a21\u6001\u77e5\u8bc6\uff09\uff0c\u4ec5\u66f4\u65b0\u6295\u5f71\u5c42\u548c\u4e3b\u5e72\u3002\u8fd9\u662f\u6765\u81ea\u672c\u7ae0\u6587\u4ef6 01 \u7684 CLIP \u98ce\u683c\u5bf9\u9f50\u88ab\u7eb3\u5165\u7edf\u4e00\u6a21\u578b\u7684\u9636\u6bb5\u3002</p> </li> <li> <p>\u9636\u6bb5 3\uff1a\u8054\u5408\u591a\u6a21\u6001\u9884\u8bad\u7ec3\u3002 \u6240\u6709\u53c2\u6570\uff08\u6216\u5927\u90e8\u5206\uff09\u88ab\u89e3\u51bb\uff0c\u6a21\u578b\u5728\u5355\u6a21\u6001\u548c\u591a\u6a21\u6001\u6570\u636e\u7684\u6df7\u5408\u4e0a\u8bad\u7ec3\uff0c\u4f7f\u7528\u5bf9\u6240\u6709\u6a21\u6001 token \u7684\u5355\u4e00\u4e0b\u4e00 token \u9884\u6d4b\u76ee\u6807\u3002\u635f\u5931\u51fd\u6570\u4e3a\uff1a</p> </li> </ul> \\[\\mathcal{L} = -\\sum_{t=1}^{T} \\log p_\\theta(x_t \\mid x_{&lt;t})\\] <ul> <li> <p>\u5176\u4e2d \\(x_t\\) \u53ef\u4ee5\u662f\u6587\u672c token\u3001\u56fe\u50cf token \u6216\u97f3\u9891 token\u3002\u6a21\u578b\u5fc5\u987b\u5b66\u4f1a\u9884\u6d4b\u4e0b\u4e00\u4e2a token\uff0c\u65e0\u8bba\u5176\u6a21\u6001\u5982\u4f55\uff0c\u8fd9\u8feb\u4f7f\u5b83\u53d1\u5c55\u771f\u6b63\u7684\u8de8\u6a21\u6001\u7406\u89e3\u3002</p> </li> <li> <p>\u9636\u6bb5 4\uff1a\u6307\u4ee4\u5fae\u8c03\u4e0e\u5bf9\u9f50\u3002 \u9884\u8bad\u7ec3\u6a21\u578b\u5728\u7cbe\u5fc3\u7b56\u5212\u7684\u6307\u4ee4\u9075\u5faa\u6570\u636e\u96c6\u4e0a\u8fdb\u884c\u5fae\u8c03\uff0c\u8fd9\u4e9b\u6570\u636e\u96c6\u5305\u62ec\u591a\u6a21\u6001\u6307\u4ee4\uff08\u4f8b\u5982\uff0c\"\u8be6\u7ec6\u63cf\u8ff0\u8fd9\u5e45\u56fe\u50cf\"\u3001\"\u8fd9\u6bb5\u89c6\u9891\u53d1\u51fa\u4ec0\u4e48\u58f0\u97f3\uff1f\"\u3001\"\u751f\u6210\u4e00\u5f20 X \u7684\u56fe\u50cf\"\uff09\u3002\u8fd9\u4e00\u9636\u6bb5\u901a\u5e38\u4f7f\u7528\u57fa\u4e8e\u4eba\u7c7b\u53cd\u9988\u7684\u5f3a\u5316\u5b66\u4e60\uff08RLHF\uff09\u6216\u76f4\u63a5\u504f\u597d\u4f18\u5316\uff08DPO\uff09\u6765\u4f7f\u6a21\u578b\u7684\u8f93\u51fa\u4e0e\u4eba\u7c7b\u504f\u597d\u5bf9\u9f50\u3002</p> </li> <li> <p>\u6a21\u6001\u7279\u5b9a\u70ed\u8eab\u662f\u4e00\u79cd\u5728\u9636\u6bb5\u5185\u90e8\u4f7f\u7528\u7684\u6280\u672f\uff0c\u7528\u4e8e\u9632\u6b62\u6a21\u6001\u574d\u7f29\u3002\u5982\u679c\u4e00\u79cd\u6a21\u6001\uff08\u901a\u5e38\u662f\u6587\u672c\uff0c\u56e0\u4e3a\u5b83\u62e5\u6709\u6700\u591a\u7684\u8bad\u7ec3\u6570\u636e\uff09\u4e3b\u5bfc\u4e86\u68af\u5ea6\u4fe1\u53f7\uff0c\u6a21\u578b\u53ef\u80fd\u4f1a\"\u9057\u5fd8\"\u8f83\u5f31\u7684\u6a21\u6001\u3002\u70ed\u8eab\u7b56\u7565\u5305\u62ec\uff1a</p> <ul> <li>\u68af\u5ea6\u5e73\u8861\uff1a\u7f29\u653e\u6765\u81ea\u6bcf\u79cd\u6a21\u6001\u7684\u68af\u5ea6\uff0c\u4f7f\u5176\u5bf9\u53c2\u6570\u66f4\u65b0\u6709\u5747\u7b49\u8d21\u732e\u3002</li> <li>\u6570\u636e\u6bd4\u4f8b\u8c03\u5ea6\uff1a\u9010\u6b65\u589e\u52a0\u591a\u6a21\u6001\u6570\u636e\u76f8\u5bf9\u4e8e\u5355\u6a21\u6001\u6570\u636e\u7684\u6bd4\u4f8b\u3002</li> <li>\u635f\u5931\u52a0\u6743\uff1a\u5206\u914d\u6a21\u6001\u7279\u5b9a\u7684\u6743\u91cd \\(\\lambda_m\\)\uff0c\u4f7f\u603b\u635f\u5931\u4e3a \\(\\mathcal{L} = \\sum_m \\lambda_m \\mathcal{L}_m\\)\uff0c\u5176\u4e2d \\(\\lambda_m\\) \u7ecf\u8fc7\u8c03\u6574\u4ee5\u5e73\u8861\u5404\u6a21\u6001\u7684\u5b66\u4e60\u7387\u3002</li> </ul> </li> </ul> <p></p> <ul> <li>\u4e3a\u4ec0\u4e48\u4e0d\u8df3\u8fc7\u9636\u6bb5\uff1f \u4ece\u5934\u5f00\u59cb\u8054\u5408\u8bad\u7ec3\u6240\u6709\u5185\u5bb9\u5f88\u8bf1\u4eba\uff0c\u4f46\u5728\u5b9e\u8df5\u4e2d\u7531\u4e8e\u51e0\u4e2a\u539f\u56e0\u800c\u5931\u8d25\u3002\u9996\u5148\uff0c\u6a21\u578b\u5fc5\u987b\u540c\u65f6\u5b66\u4e60\u4f4e\u7ea7\u7279\u5f81\uff08\u8fb9\u7f18\u68c0\u6d4b\u3001\u97f3\u7d20\u8bc6\u522b\uff09\u548c\u9ad8\u7ea7\u8de8\u6a21\u6001\u63a8\u7406\uff0c\u4e24\u8005\u5177\u6709\u975e\u5e38\u4e0d\u540c\u7684\u5b66\u4e60\u52a8\u6001\u3002\u5176\u6b21\uff0c\u8de8\u6a21\u6001\u7684\u6570\u636e\u5206\u5e03\u6781\u4e0d\u5e73\u8861\uff08\u6570\u4e07\u4ebf\u6587\u672c token \u5bf9\u6bd4\u6570\u5341\u4ebf\u56fe\u50cf token \u5bf9\u6bd4\u6570\u4ebf\u97f3\u9891\u7247\u6bb5\uff09\u3002\u7b2c\u4e09\uff0c\u4f18\u5316\u666f\u89c2\u9ad8\u5ea6\u975e\u51f8\uff0c\u5206\u9636\u6bb5\u8bad\u7ec3\u63d0\u4f9b\u4e86\u4e00\u4e2a\u8bfe\u7a0b\u8868\uff0c\u5f15\u5bfc\u6a21\u578b\u8d70\u5411\u66f4\u597d\u7684\u76c6\u5730\uff0c\u7c7b\u4f3c\u4e8e\u7b2c 6 \u7ae0\u8ba8\u8bba\u7684\u8bfe\u7a0b\u5b66\u4e60\u7406\u5ff5\u3002</li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/05.%20unified%20multimodal%20architectures/#_7","title":"\u591a\u6a21\u6001\u601d\u7ef4\u94fe\u63a8\u7406","text":"<ul> <li> <p>\u5f53\u4f60\u89e3\u51b3\u4e00\u4e2a\u51e0\u4f55\u95ee\u9898\u65f6\uff0c\u4f60\u53ef\u80fd\u4f1a\u753b\u4e00\u4e2a\u793a\u610f\u56fe\uff0c\u6807\u6ce8\u89d2\u5ea6\uff0c\u5199\u51fa\u65b9\u7a0b\uff0c\u7136\u540e\u9010\u6b65\u6c42\u89e3\u3002\u4f60\u4e0d\u4f1a\u76f4\u63a5\u4ece\u95ee\u9898\u9648\u8ff0\u8df3\u5230\u7b54\u6848\u3002\u591a\u6a21\u6001\u601d\u7ef4\u94fe\uff08CoT\uff09\u63a8\u7406\u4f7f\u6a21\u578b\u80fd\u591f\u505a\u540c\u6837\u7684\u4e8b\u60c5\uff1a\u5728\u5f97\u51fa\u6700\u7ec8\u7b54\u6848\u4e4b\u524d\u751f\u6210\u53ef\u80fd\u6d89\u53ca\u6587\u672c\u3001\u89c6\u89c9\u6ce8\u91ca\u751a\u81f3\u751f\u6210\u56fe\u8868\u7684\u4e2d\u95f4\u63a8\u7406\u6b65\u9aa4\u3002</p> </li> <li> <p>\u5728\u7eaf\u6587\u672c CoT \u4e2d\uff08\u5982\u7b2c 7 \u7ae0\u63d0\u793a\u7b56\u7565\u7684\u8ba8\u8bba\u4e2d\u6240\u63a2\u8ba8\u7684\uff09\uff0c\u6a21\u578b\u4ee5\u81ea\u7136\u8bed\u8a00\u751f\u6210\u63a8\u7406\u6b65\u9aa4\u5e8f\u5217\u3002\u591a\u6a21\u6001 CoT \u6269\u5c55\u4e86\u8fd9\u4e00\u80fd\u529b\uff0c\u5141\u8bb8\u4e2d\u95f4\u6b65\u9aa4\u5f15\u7528\u6216\u751f\u6210\u89c6\u89c9\u5185\u5bb9\u3002\u4f8b\u5982\uff0c\u7ed9\u5b9a\u4e00\u5f20\u56fe\u8868\u56fe\u50cf\u548c\u95ee\u9898\"\u54ea\u4e00\u5e74\u9500\u552e\u989d\u6700\u9ad8\uff1f\"\uff0c\u591a\u6a21\u6001 CoT \u6a21\u578b\u53ef\u80fd\u9996\u5148\u63cf\u8ff0\u56fe\u8868\uff08\"\u8be5\u56fe\u8868\u663e\u793a 2018 \u5e74\u81f3 2023 \u5e74\u7684\u9500\u552e\u989d\u2026\u2026\"\uff09\uff0c\u7136\u540e\u8bc6\u522b\u76f8\u5173\u7684\u89c6\u89c9\u7279\u5f81\uff08\"\u6700\u9ad8\u7684\u6761\u5f62\u51fa\u73b0\u5728 2021 \u5e74\u2026\u2026\"\uff09\uff0c\u6700\u540e\u8f93\u51fa\u7b54\u6848\uff08\"2021 \u5e74\"\uff09\u3002</p> </li> <li> <p>\u5f62\u5f0f\u4e0a\uff0c\u4ee4 \\(\\mathbf{x}\\) \u4e3a\u591a\u6a21\u6001\u8f93\u5165\uff0c\\(y\\) \u4e3a\u76ee\u6807\u7b54\u6848\u3002\u6807\u51c6\u9884\u6d4b\u6a21\u578b\u76f4\u63a5\u5efa\u6a21 \\(p(y \\mid \\mathbf{x})\\)\u3002\u601d\u7ef4\u94fe\u5f15\u5165\u4e86\u4e2d\u95f4\u63a8\u7406 \\(\\mathbf{r} = (r_1, r_2, \\ldots, r_L)\\) \u5e76\u5c06\u9884\u6d4b\u5206\u89e3\u4e3a\uff1a</p> </li> </ul> \\[p(y \\mid \\mathbf{x}) = \\sum_{\\mathbf{r}} p(y \\mid \\mathbf{r}, \\mathbf{x}) \\cdot p(\\mathbf{r} \\mid \\mathbf{x})\\] <ul> <li> <p>\u5728\u5b9e\u8df5\u4e2d\uff0c\u6c42\u548c\u901a\u8fc7\u8d2a\u5fc3\u6216\u675f\u641c\u7d22\u89e3\u7801\u5728\u63a8\u7406\u94fe\u4e0a\u8fd1\u4f3c\u3002\u63a8\u7406\u6b65\u9aa4 \\(r_i\\) \u53ef\u4ee5\u662f\u6587\u672c token\u3001\u5bf9\u56fe\u50cf\u533a\u57df\u7684\u5f15\u7528\uff0c\u751a\u81f3\u662f\u751f\u6210\u7684\u89c6\u89c9 token\uff08\u4f8b\u5982\uff0c\u53e0\u52a0\u5728\u8f93\u5165\u56fe\u50cf\u4e0a\u7684\u8fb9\u754c\u6846\u6ce8\u91ca\uff09\u3002</p> </li> <li> <p>\u8bad\u7ec3\u591a\u6a21\u6001 CoT \u901a\u5e38\u6d89\u53ca\u7b56\u5212\u6570\u636e\u96c6\uff0c\u5176\u4e2d\u4eba\u7c7b\u6807\u6ce8\u8005\u63d0\u4f9b\u9010\u6b65\u7684\u591a\u6a21\u6001\u63a8\u7406\u8f68\u8ff9\uff0c\u7136\u540e\u5728\u6b64\u7c7b\u8f68\u8ff9\u4e0a\u5fae\u8c03\u6a21\u578b\u3002\u4e00\u4e9b\u65b9\u6cd5\u4ece\u66f4\u5927\u7684\u6559\u5e08\u6a21\u578b\u4e2d\u84b8\u998f CoT \u80fd\u529b\uff1a\u6559\u5e08\u4e3a\u5927\u578b\u6570\u636e\u96c6\u751f\u6210\u63a8\u7406\u8f68\u8ff9\uff0c\u8f83\u5c0f\u7684\u5b66\u751f\u6a21\u578b\u5219\u5728\u8f93\u5165\u548c\u6559\u5e08\u7684\u8f68\u8ff9\u4e0a\u8fdb\u884c\u8bad\u7ec3\u3002</p> </li> <li> <p>\u591a\u6a21\u6001 CoT \u5bf9\u4e8e\u9700\u8981\u7a7a\u95f4\u63a8\u7406\uff08\u4f8b\u5982\uff0c\"\u7ea2\u8272\u7403\u5728\u84dd\u8272\u7acb\u65b9\u4f53\u7684\u5de6\u8fb9\u5417\uff1f\"\uff09\u3001\u5bf9\u56fe\u8868\u7684\u6570\u5b66\u63a8\u7406\uff08\u4f8b\u5982\uff0c\u51e0\u4f55\u95ee\u9898\uff09\u548c\u591a\u6b65\u89c6\u89c9\u95ee\u7b54\uff08\u7b54\u6848\u4f9d\u8d56\u4e8e\u7ec4\u5408\u56fe\u50cf\u591a\u4e2a\u533a\u57df\u7684\u4fe1\u606f\uff09\u7684\u4efb\u52a1\u5c24\u5176\u5f3a\u5927\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/05.%20unified%20multimodal%20architectures/#_8","title":"\u591a\u6a21\u6001\u667a\u80fd\u4f53","text":"<ul> <li> <p>\u60f3\u8c61\u53a8\u623f\u91cc\u7684\u4e00\u4e2a\u673a\u5668\u4eba\u53a8\u5e08\u3002\u5b83\u67e5\u770b\u53f0\u9762\u4e0a\u7684\u98df\u6750\uff08\u89c6\u89c9\uff09\uff0c\u9605\u8bfb\u5e73\u677f\u4e0a\u7684\u98df\u8c31\uff08\u6587\u672c\uff09\uff0c\u542c\u8ba1\u65f6\u5668\u7684\u54d4\u54d4\u58f0\uff08\u97f3\u9891\uff09\uff0c\u7136\u540e\u7269\u7406\u4e0a\u62ff\u8d77\u5200\u5e76\u5207\u6d0b\u8471\uff08\u52a8\u4f5c\uff09\u3002\u591a\u6a21\u6001\u667a\u80fd\u4f53\u5c31\u662f\u6570\u5b57\u7248\uff1a\u4e00\u4e2a\u901a\u8fc7\u591a\u79cd\u6a21\u6001\u611f\u77e5\u4e16\u754c\u3001\u63a8\u7406\u8be5\u505a\u4ec0\u4e48\u3001\u5e76\u6267\u884c\u57fa\u4e8e\u5176\u611f\u77e5\u7684\u52a8\u4f5c\u7684\u6a21\u578b\u3002</p> </li> <li> <p>\u667a\u80fd\u4f53\u5faa\u73af\u9075\u5faa\u7ecf\u5178\u7684\u89c2\u5bdf-\u63a8\u7406-\u884c\u52a8\u5468\u671f\uff1a</p> <ol> <li>\u89c2\u5bdf\uff1a\u667a\u80fd\u4f53\u4ece\u5176\u73af\u5883\u63a5\u6536\u591a\u6a21\u6001\u8f93\u5165\uff08\u622a\u56fe\u3001\u7528\u6237\u7684\u53e3\u5934\u6307\u4ee4\u3001\u89c6\u9891\u6d41\uff09\u3002</li> <li>\u63a8\u7406\uff1a\u7edf\u4e00\u6a21\u578b\u5904\u7406\u591a\u6a21\u6001\u8f93\u5165\uff0c\u53ef\u80fd\u4f7f\u7528\u601d\u7ef4\u94fe\u6765\u89c4\u5212\u6b65\u9aa4\u5e8f\u5217\u3002</li> <li>\u884c\u52a8\uff1a\u6a21\u578b\u8f93\u51fa\u4e00\u4e2a\u52a8\u4f5c\uff08\u6587\u672c\u56de\u590d\u3001\u5de5\u5177\u8c03\u7528\u3001\u5750\u6807\u4e3a \\((x, y)\\) \u7684\u9f20\u6807\u70b9\u51fb\u3001\u673a\u5668\u4eba\u7535\u673a\u6307\u4ee4\uff09\u3002</li> </ol> </li> <li> <p>\u5de5\u5177\u4f7f\u7528\u662f\u591a\u6a21\u6001\u667a\u80fd\u4f53\u7684\u4e00\u4e2a\u5173\u952e\u80fd\u529b\u3002\u6a21\u578b\u88ab\u8bad\u7ec3\u8bc6\u522b\u4f55\u65f6\u65e0\u6cd5\u76f4\u63a5\u56de\u7b54\u95ee\u9898\uff0c\u800c\u5fc5\u987b\u8c03\u7528\u5916\u90e8\u5de5\u5177\uff1a\u8ba1\u7b97\u5668\u3001\u4ee3\u7801\u89e3\u91ca\u5668\u3001\u7f51\u9875\u6d4f\u89c8\u5668\u6216\u641c\u7d22\u5f15\u64ce\u3002\u6a21\u578b\u5728\u5176\u8f93\u51fa token \u5e8f\u5217\u4e2d\u751f\u6210\u7ed3\u6784\u5316\u7684\u5de5\u5177\u8c03\u7528\uff08\u4f8b\u5982\uff0c<code>search(\"\u4f26\u6566\u5f53\u524d\u5929\u6c14\")</code>\uff09\uff0c\u7cfb\u7edf\u6267\u884c\u8c03\u7528\uff0c\u5e76\u5c06\u7ed3\u679c\u4f5c\u4e3a\u989d\u5916\u7684\u8f93\u5165 token \u53cd\u9988\u7ed9\u6a21\u578b\u5904\u7406\u3002</p> </li> <li> <p>\u89c6\u89c9\u63a5\u5730\u5c06\u8bed\u8a00\u8fde\u63a5\u5230\u56fe\u50cf\u6216\u89c6\u9891\u4e2d\u7684\u7279\u5b9a\u533a\u57df\u3002\u5f53\u667a\u80fd\u4f53\u8bf4\"\u70b9\u51fb\u53f3\u4e0a\u89d2\u7684\u84dd\u8272\u6309\u94ae\"\u65f6\uff0c\u5b83\u5fc5\u987b\u5c06\u77ed\u8bed\"\u53f3\u4e0a\u89d2\u7684\u84dd\u8272\u6309\u94ae\"\u63a5\u5730\u5230\u50cf\u7d20\u5750\u6807\u3002\u5728\u67b6\u6784\u4e0a\uff0c\u8fd9\u662f\u901a\u8fc7\u8bad\u7ec3\u6a21\u578b\u5c06\u8fb9\u754c\u6846\u5750\u6807\u4f5c\u4e3a\u7279\u6b8a token \u8f93\u51fa\uff0c\u6216\u8ba9\u6a21\u578b\u5728\u56fe\u50cf\u4e0a\u751f\u6210\u6307\u793a\u6240\u6307\u533a\u57df\u7684\u70ed\u56fe\u6765\u5b9e\u73b0\u7684\u3002\u8fd9\u5c06\u672c\u7ae0\u6587\u4ef6 02\uff08\u89c6\u89c9\u8bed\u8a00\u6a21\u578b\uff09\u4e2d\u8ba8\u8bba\u7684\u63a5\u5730\u548c\u6307\u4ee3\u5de5\u4f5c\u6269\u5c55\u5230\u4e86\u52a8\u4f5c\u9886\u57df\u3002</p> </li> <li> <p>Web \u667a\u80fd\u4f53\u5982 WebVoyager \u548c SeeAct \u5c55\u793a\u4e86\u591a\u6a21\u6001\u667a\u80fd\u4f53\u5728\u7f51\u7ad9\u4e0a\u5bfc\u822a\u3002\u667a\u80fd\u4f53\u63a5\u6536\u7f51\u9875\u622a\u56fe\uff0c\u8bc6\u522b\u4ea4\u4e92\u5143\u7d20\uff08\u6309\u94ae\u3001\u6587\u672c\u5b57\u6bb5\u3001\u94fe\u63a5\uff09\uff0c\u5e76\u8f93\u51fa\u52a8\u4f5c\uff08\u70b9\u51fb\u3001\u6253\u5b57\u3001\u6eda\u52a8\uff09\u4ee5\u5b8c\u6210\u7528\u6237\u6307\u5b9a\u7684\u76ee\u6807\u3002\u5173\u952e\u6311\u6218\u5728\u4e8e\u5de8\u5927\u7684\u52a8\u4f5c\u7a7a\u95f4\uff1a\u4e00\u4e2a\u5178\u578b\u7f51\u9875\u53ef\u80fd\u6709\u6570\u767e\u4e2a\u53ef\u70b9\u51fb\u76ee\u6807\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u5177\u8eab\u667a\u80fd\u4f53\u5c06\u5176\u6269\u5c55\u5230\u7269\u7406\u73af\u5883\u3002\u5e26\u6709\u6444\u50cf\u5934\u548c\u9ea6\u514b\u98ce\u7684\u673a\u5668\u4eba\u63a5\u6536\u89c6\u89c9\u548c\u97f3\u9891\u8f93\u5165\uff0c\u901a\u8fc7\u7edf\u4e00\u6a21\u578b\u5904\u7406\uff0c\u5e76\u8f93\u51fa\u7535\u673a\u6307\u4ee4\u3002\u50cf PaLM-E\uff08Google\uff09\u8fd9\u6837\u7684\u9879\u76ee\u5c06\u673a\u5668\u4eba\u4f20\u611f\u5668\u6570\u636e\u76f4\u63a5\u5d4c\u5165\u8bed\u8a00\u6a21\u578b\u7684 token \u5e8f\u5217\u4e2d\uff0c\u4f7f\u673a\u5668\u4eba\u80fd\u591f\u901a\u8fc7\u5c06\u6307\u4ee4\u63a5\u5730\u5230\u5176\u89c6\u89c9\u89c2\u5bdf\u4e2d\u5e76\u751f\u6210\u4e00\u7cfb\u5217\u7535\u673a\u52a8\u4f5c\uff0c\u6765\u9075\u5faa\u8bf8\u5982\"\u62ff\u8d77\u7897\u9644\u8fd1\u7684\u7eff\u8272\u65b9\u5757\"\u4e4b\u7c7b\u7684\u6307\u4ee4\u3002</p> </li> <li> <p>\u667a\u80fd\u4f53\u7684\u8bad\u7ec3\u914d\u65b9\u5728\u6807\u51c6\u5206\u9636\u6bb5\u9884\u8bad\u7ec3\u4e4b\u4e0a\u6dfb\u52a0\u4e86\u4e00\u4e2a\u5f3a\u5316\u5b66\u4e60\uff08RL\uff09\u9636\u6bb5\u3002\u667a\u80fd\u4f53\u4e0e\u73af\u5883\uff08\u6a21\u62df\u684c\u9762\u3001\u7f51\u9875\u6d4f\u89c8\u5668\u3001\u673a\u5668\u4eba\u6a21\u62df\u5668\uff09\u4ea4\u4e92\uff0c\u56e0\u5b8c\u6210\u4efb\u52a1\u800c\u83b7\u5f97\u5956\u52b1\uff0c\u5e76\u4f7f\u7528 PPO \u6216 REINFORCE \u7b49\u7b97\u6cd5\u66f4\u65b0\u5176\u7b56\u7565\u3002\u5956\u52b1\u4fe1\u53f7\u901a\u5e38\u662f\u7a00\u758f\u7684\uff08\u4efb\u52a1\u6210\u529f\u4e3a 1\uff0c\u5426\u5219\u4e3a 0\uff09\uff0c\u4f7f\u5f97\u8fd9\u4e00\u4f18\u5316\u5177\u6709\u6311\u6218\u6027\uff0c\u5e76\u4e14\u9ad8\u5ea6\u4f9d\u8d56\u4e8e\u591a\u6a21\u6001\u9884\u8bad\u7ec3\u7684\u5f3a\u5148\u9a8c\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/05.%20unified%20multimodal%20architectures/#_9","title":"\u57fa\u51c6\u6d4b\u8bd5\u4e0e\u8bc4\u4f30","text":"<ul> <li> <p>\u8bc4\u4f30\u4e00\u4e2a\u80fd\u770b\u89c1\u3001\u542c\u89c1\u3001\u9605\u8bfb\u548c\u884c\u52a8\u7684\u6a21\u578b\u9700\u8981\u4e00\u5957\u591a\u6837\u5316\u7684\u57fa\u51c6\u6d4b\u8bd5\u3002\u6ca1\u6709\u5355\u4e00\u6307\u6807\u80fd\u591f\u6355\u6349\u591a\u6a21\u6001\u80fd\u529b\uff0c\u56e0\u6b64\u8be5\u9886\u57df\u4f9d\u8d56\u4e8e\u4e00\u7ec4\u4e13\u95e8\u8bc4\u4f30\u7684\u96c6\u5408\u3002</p> </li> <li> <p>MMLU\uff08\u5927\u89c4\u6a21\u591a\u4efb\u52a1\u8bed\u8a00\u7406\u89e3\uff09\u6d4b\u8bd5 57 \u4e2a\u5b66\u672f\u79d1\u76ee\u7684\u77e5\u8bc6\u3002\u867d\u7136\u6700\u521d\u662f\u7eaf\u6587\u672c\u7684\uff0c\u4f46\u5b83\u4f5c\u4e3a\u57fa\u7ebf\uff1a\u4e00\u4e2a\u7edf\u4e00\u591a\u6a21\u6001\u6a21\u578b\u5728\u83b7\u5f97\u89c6\u89c9\u80fd\u529b\u65f6\u4e0d\u5e94\u4e22\u5931\u7eaf\u6587\u672c\u6027\u80fd\u3002\u591a\u6a21\u6001\u8bad\u7ec3\u540e MMLU \u7684\u4e0b\u964d\u6807\u5fd7\u7740\u707e\u96be\u6027\u9057\u5fd8\u3002</p> </li> <li> <p>MMBench \u8bc4\u4f30\u8de8 20 \u4e2a\u7ec6\u7c92\u5ea6\u80fd\u529b\u7ef4\u5ea6\u7684\u89c6\u89c9\u8bed\u8a00\u7406\u89e3\uff0c\u5305\u62ec\u5c5e\u6027\u8bc6\u522b\u3001\u7a7a\u95f4\u5173\u7cfb\u7406\u89e3\u548c OCR\u3002\u6bcf\u4e2a\u95ee\u9898\u5448\u73b0\u4e00\u5e45\u56fe\u50cf\u548c\u4e00\u4e2a\u591a\u9879\u9009\u62e9\u9898\u3002\u8be5\u57fa\u51c6\u7cfb\u7edf\u5730\u6d4b\u8bd5\u6a21\u578b\u662f\u5426\u771f\u6b63\u7406\u89e3\u56fe\u50cf\uff0c\u8fd8\u662f\u4f9d\u8d56\u4e8e\u7eaf\u6587\u672c\u7684\u6377\u5f84\u3002</p> </li> <li> <p>SEED-Bench \u63d0\u4f9b 19,000 \u4e2a\u591a\u9879\u9009\u62e9\u9898\uff0c\u8de8\u8d8a\u56fe\u50cf\u548c\u89c6\u9891\u7406\u89e3\u7684 12 \u4e2a\u8bc4\u4f30\u7ef4\u5ea6\u3002\u5b83\u7279\u522b\u6d4b\u8bd5\u65f6\u95f4\u7406\u89e3\uff08\u7ed9\u5b9a\u5e27\u4e4b\u524d/\u4e4b\u540e\u53d1\u751f\u4e86\u4ec0\u4e48\uff09\u548c\u7ec4\u5408\u63a8\u7406\uff08\u7ec4\u5408\u591a\u4e2a\u89c6\u89c9\u5c5e\u6027\uff09\u3002</p> </li> <li> <p>MM-Vet \u901a\u8fc7\u8981\u6c42\u6a21\u578b\u540c\u65f6\u4f7f\u7528\u591a\u79cd\u6280\u80fd\u6765\u8bc4\u4f30\u96c6\u6210\u7684\u591a\u6a21\u6001\u80fd\u529b\uff1a\u8bc6\u522b\u3001OCR\u3001\u7a7a\u95f4\u610f\u8bc6\u3001\u8bed\u8a00\u751f\u6210\u548c\u77e5\u8bc6\u68c0\u7d22\uff0c\u5168\u90e8\u5728\u5355\u4e00\u95ee\u9898\u4e2d\u3002</p> </li> <li> <p>MathVista \u6d4b\u8bd5\u5bf9\u89c6\u89c9\u8f93\u5165\u7684\u6570\u5b66\u63a8\u7406\uff1a\u51e0\u4f55\u56fe\u3001\u7edf\u8ba1\u56fe\u8868\u3001\u51fd\u6570\u56fe\u548c\u79d1\u5b66\u56fe\u5f62\u3002\u8be5\u57fa\u51c6\u4e13\u95e8\u9488\u5bf9\u591a\u6a21\u6001\u601d\u7ef4\u94fe\u80fd\u529b\u3002</p> </li> <li> <p>\u97f3\u89c6\u9891\u57fa\u51c6\u5982 AVQA\uff08\u97f3\u89c6\u9891\u95ee\u7b54\uff09\u6d4b\u8bd5\u6a21\u578b\u662f\u5426\u80fd\u63a8\u7406\u5b83\u4eec\u6240\u770b\u5230\u548c\u6240\u542c\u5230\u4e4b\u95f4\u7684\u5173\u7cfb\u3002\u4f8b\u5982\uff1a\"\u8bf4\u8bdd\u7684\u4eba\u662f\u5de6\u8fb9\u7684\u8fd8\u662f\u53f3\u8fb9\u7684\uff1f\"</p> </li> <li> <p>\u667a\u80fd\u4f53\u57fa\u51c6\u5982 WebArena\u3001OSWorld \u548c SWE-bench \u8bc4\u4f30\u5728\u4ea4\u4e92\u5f0f\u73af\u5883\u4e2d\u7684\u4efb\u52a1\u5b8c\u6210\u60c5\u51b5\u3002\u6307\u6807\u901a\u5e38\u662f\u6210\u529f\u7387\uff1a\u667a\u80fd\u4f53\u6b63\u786e\u5b8c\u6210\u4efb\u52a1\u7684\u5360\u6bd4\u662f\u591a\u5c11\uff1f\u8fd9\u4e9b\u57fa\u51c6\u7279\u522b\u5177\u6709\u6311\u6218\u6027\uff0c\u56e0\u4e3a\u5b83\u4eec\u9700\u8981\u957f\u89c6\u91ce\u89c4\u5212\u548c\u9519\u8bef\u6062\u590d\u3002</p> </li> <li> <p>\u5168\u9762\u8bc4\u4f30\u6846\u67b6\u5982 LMSYS Chatbot Arena \u4f7f\u7528\u4eba\u5728\u5934\u5bf9\u5934\u683c\u5f0f\u4e2d\u7684\u504f\u597d\u5224\u65ad\u3002\u4e24\u4e2a\u6a21\u578b\u88ab\u5c55\u793a\u76f8\u540c\u7684\u591a\u6a21\u6001\u8f93\u5165\uff0c\u4eba\u7c7b\u8bc4\u59d4\u9009\u62e9\u54ea\u4e2a\u54cd\u5e94\u66f4\u597d\u3002Elo \u8bc4\u5206\u4ece\u6570\u5343\u6b21\u8fd9\u6837\u7684\u6bd4\u8f83\u4e2d\u8ba1\u7b97\u5f97\u51fa\uff0c\u63d0\u4f9b\u4e86\u4e00\u4e2a\u4e0e\u6574\u4f53\u6a21\u578b\u8d28\u91cf\u9ad8\u5ea6\u76f8\u5173\u7684\u5355\u4e00\u6807\u91cf\u3002</p> </li> <li> <p>\u591a\u6a21\u6001\u8bc4\u4f30\u4e2d\u7684\u4e00\u4e2a\u6301\u7eed\u6311\u6218\u662f\u6570\u636e\u6c61\u67d3\uff1a\u56e0\u4e3a\u8fd9\u4e9b\u6a21\u578b\u662f\u5728\u4e92\u8054\u7f51\u89c4\u6a21\u7684\u6570\u636e\u4e0a\u8bad\u7ec3\u7684\uff0c\u57fa\u51c6\u56fe\u50cf\u548c\u95ee\u9898\u53ef\u80fd\u51fa\u73b0\u5728\u8bad\u7ec3\u96c6\u4e2d\u3002\u4ed4\u7ec6\u7684\u53bb\u91cd\u548c\u521b\u5efa\u4fdd\u7559\u6d4b\u8bd5\u96c6\u662f\u5fc5\u8981\u4f46\u4e0d\u5b8c\u7f8e\u7684\u4fdd\u969c\u63aa\u65bd\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/05.%20unified%20multimodal%20architectures/#_10","title":"\u4e16\u754c\u6a21\u578b","text":"<ul> <li> <p>\u60f3\u8c61\u95ed\u4e0a\u773c\u775b\uff0c\u60f3\u8c61\u5982\u679c\u4f60\u628a\u4e00\u4e2a\u73bb\u7483\u676f\u63a8\u4e0b\u684c\u5b50\u8fb9\u7f18\u4f1a\u53d1\u751f\u4ec0\u4e48\u3002\u4f60\"\u770b\u5230\"\u5b83\u843d\u4e0b\uff0c\"\u542c\u5230\"\u7834\u788e\u58f0\uff0c\u5e76\"\u611f\u89c9\"\u5230\u90a3\u5c06\u662f\u4e2a\u574f\u4e3b\u610f\u3002\u4f60\u7684\u5927\u8111\u6b63\u5728\u8fd0\u884c\u4e00\u4e2a\u4e16\u754c\u6a21\u578b\uff1a\u5bf9\u73af\u5883\u7684\u7269\u7406\u548c\u56e0\u679c\u7ed3\u6784\u7684\u5185\u90e8\u6a21\u62df\uff0c\u80fd\u591f\u8de8\u591a\u79cd\u6a21\u6001\u9884\u6d4b\u672a\u6765\u72b6\u6001\u3002</p> </li> <li> <p>\u5728 AI \u8bed\u5883\u4e2d\uff0c\u4e16\u754c\u6a21\u578b\u662f\u4e00\u4e2a\u5b66\u4e60\u5230\u7684\u51fd\u6570\uff0c\u6839\u636e\u5f53\u524d\u72b6\u6001\u548c\u52a8\u4f5c\u9884\u6d4b\u4e16\u754c\u7684\u4e0b\u4e00\u4e2a\u72b6\u6001\uff1a</p> </li> </ul> \\[\\hat{s}_{t+1} = g_\\phi(s_t, a_t)\\] <ul> <li> <p>\u5176\u4e2d \\(s_t\\) \u662f\u5f53\u524d\u72b6\u6001\u8868\u793a\uff08\u53ef\u80fd\u5305\u542b\u89c6\u89c9\u3001\u542c\u89c9\u548c\u672c\u4f53\u611f\u89c9\u4fe1\u606f\uff09\uff0c\\(a_t\\) \u662f\u4e00\u4e2a\u52a8\u4f5c\uff0c\\(\\hat{s}_{t+1}\\) \u662f\u9884\u6d4b\u7684\u4e0b\u4e00\u4e2a\u72b6\u6001\u3002\u72b6\u6001 \\(s_t\\) \u5b58\u5728\u4e8e\u5b66\u4e60\u5230\u7684\u6f5c\u5728\u7a7a\u95f4\u4e2d\uff0c\u800c\u975e\u539f\u59cb\u50cf\u7d20\u7a7a\u95f4\uff0c\u4f7f\u5f97\u9884\u6d4b\u95ee\u9898\u53ef\u89e3\u3002</p> </li> <li> <p>\u89c6\u9891\u9884\u6d4b\u6a21\u578b\u5982 Sora\uff08OpenAI\uff09\u548c Genie\uff08Google DeepMind\uff09\u4ee3\u8868\u4e86\u8fc8\u5411\u4e16\u754c\u6a21\u578b\u7684\u91cd\u8981\u4e00\u6b65\u3002\u5b83\u4eec\u5b66\u4e60\u751f\u6210\u4ee5\u6587\u672c\u63d0\u793a\u548c/\u6216\u52a8\u4f5c\u5e8f\u5217\u4e3a\u6761\u4ef6\u7684\u3001\u65f6\u95f4\u4e0a\u8fde\u8d2f\u7684\u89c6\u9891\u5e27\u3002\u867d\u7136\u5b83\u4eec\u901a\u5e38\u88ab\u4f5c\u4e3a\u89c6\u9891\u751f\u6210\u5668\u8ba8\u8bba\uff0c\u4f46\u5e95\u5c42\u7684\u6280\u672f\u80fd\u529b\u66f4\u63a5\u8fd1\u4e8e\u4e16\u754c\u6a21\u62df\uff1a\u6a21\u578b\u5df2\u7ecf\u5185\u5316\u4e86\u8db3\u591f\u7684\u7269\u7406\u77e5\u8bc6\uff08\u91cd\u529b\u3001\u78b0\u649e\u3001\u906e\u6321\u3001\u6d41\u4f53\u52a8\u529b\u5b66\uff09\u6765\u6e32\u67d3\u5408\u7406\u7684\u672a\u6765\u573a\u666f\u3002</p> </li> <li> <p>\u4e0e\u591a\u6a21\u6001\u67b6\u6784\u7684\u8054\u7cfb\u5f88\u6df1\u3002\u4e00\u4e2a\u53ea\u9884\u6d4b\u50cf\u7d20\u7684\u4e16\u754c\u6a21\u578b\u662f\u6709\u9650\u7684\uff1b\u4e00\u4e2a\u771f\u6b63\u6709\u7528\u7684\u4e16\u754c\u6a21\u578b\u5e94\u8be5\u8de8\u6a21\u6001\u9884\u6d4b\u3002\u5982\u679c\u4f60\u63a8\u73bb\u7483\u676f\uff0c\u4e16\u754c\u6a21\u578b\u5e94\u8be5\u9884\u6d4b\u89c6\u89c9\u8f68\u8ff9\uff08\u73bb\u7483\u676f\u843d\u4e0b\uff09\u3001\u542c\u89c9\u4e8b\u4ef6\uff08\u73bb\u7483\u676f\u7834\u788e\uff09\u548c\u8bed\u4e49\u540e\u679c\uff08\u73b0\u5728\u5730\u677f\u4e0a\u6709\u788e\u73bb\u7483\uff09\u3002\u7edf\u4e00\u591a\u6a21\u6001\u67b6\u6784\u662f\u4e16\u754c\u6a21\u578b\u7684\u5929\u7136\u540e\u9009\u8005\uff0c\u56e0\u4e3a\u5b83\u4eec\u5df2\u7ecf\u5728\u5171\u4eab\u7a7a\u95f4\u4e2d\u8868\u793a\u6240\u6709\u6a21\u6001\u3002</p> </li> <li> <p>\u5f62\u5f0f\u4e0a\uff0c\u591a\u6a21\u6001\u4e16\u754c\u6a21\u578b\u4f18\u5316\uff1a</p> </li> </ul> \\[\\mathcal{L}_\\text{world} = \\mathbb{E}\\left[\\sum_{m \\in \\mathcal{M}} \\lambda_m \\| s_{t+1}^m - g_\\phi^m(s_t, a_t) \\|^2 \\right]\\] <ul> <li>\u5176\u4e2d \\(s_{t+1}^m\\) \u662f\u6a21\u6001 \\(m\\) \u4e2d\u7684\u771f\u5b9e\u4e0b\u4e00\u72b6\u6001\u8868\u793a\uff0c\\(g_\\phi^m\\) \u662f\u4e16\u754c\u6a21\u578b\u7684\u6a21\u6001\u7279\u5b9a\u9884\u6d4b\u5934\u3002\u5171\u4eab\u7684\u6f5c\u5728\u52a8\u6001 \\(g_\\phi\\) \u5728\u8054\u5408\u591a\u6a21\u6001\u7a7a\u95f4\u4e2d\u8fd0\u884c\uff0c\u800c\u6a21\u6001\u7279\u5b9a\u7684\u5934\u5219\u5c06\u9884\u6d4b\u89e3\u7801\u4e3a\u6bcf\u79cd\u6a21\u6001\u7684\u539f\u751f\u683c\u5f0f\u3002</li> </ul> <p></p> <ul> <li>JEPA\uff08\u8054\u5408\u5d4c\u5165\u9884\u6d4b\u67b6\u6784\uff09\uff0c\u7531 Yann LeCun \u63d0\u51fa\uff0c\u63d0\u4f9b\u4e86\u4e00\u4e2a\u907f\u514d\u50cf\u7d20\u7ea7\u9884\u6d4b\u9677\u9631\u7684\u4e16\u754c\u6a21\u578b\u6846\u67b6\u3002JEPA \u4e0d\u662f\u5728\u539f\u59cb\u50cf\u7d20\u5c42\u9762\u9884\u6d4b\uff08\u8fd9\u4f1a\u5c06\u5bb9\u91cf\u6d6a\u8d39\u5728\u65e0\u5173\u7ec6\u8282\u5982\u7cbe\u786e\u7eb9\u7406\u4e0a\uff09\uff0c\u800c\u662f\u5728\u5d4c\u5165\u7a7a\u95f4\u4e2d\u8fdb\u884c\u9884\u6d4b\u3002\u6a21\u578b\u5b66\u4e60\u4e00\u4e2a\u5c06\u89c2\u6d4b\u6620\u5c04\u5230\u5d4c\u5165\u7684\u7f16\u7801\u5668\uff0c\u4ee5\u53ca\u4e00\u4e2a\u9884\u6d4b\u672a\u6765\u5d4c\u5165\u7684\u9884\u6d4b\u5668\uff1a</li> </ul> \\[\\hat{\\mathbf{z}}_{t+1} = h_\\psi(\\mathbf{z}_t, a_t), \\quad \\mathbf{z}_t = \\text{Enc}(s_t)\\] <ul> <li> <p>\u635f\u5931\u51fd\u6570\u6bd4\u8f83\u7684\u662f\u5d4c\u5165\u800c\u975e\u539f\u59cb\u89c2\u6d4b\uff0c\u8fd9\u5bf9\u611f\u77e5\u6df7\u53e0\uff08\u8bb8\u591a\u4e0d\u540c\u7684\u50cf\u7d20\u914d\u7f6e\u53ef\u80fd\u4ee3\u8868\u76f8\u540c\u7684\u8bed\u4e49\u72b6\u6001\uff09\u66f4\u52a0\u9c81\u68d2\u3002\u8fd9\u79cd\u65b9\u6cd5\u5bf9\u591a\u6a21\u6001\u4e16\u754c\u6a21\u578b\u5c24\u5176\u6709\u524d\u666f\uff0c\u56e0\u4e3a\u5b83\u81ea\u7136\u5730\u8fd0\u884c\u5728\u7edf\u4e00\u67b6\u6784\u5df2\u7ecf\u63d0\u4f9b\u7684\u5171\u4eab\u5d4c\u5165\u7a7a\u95f4\u4e2d\u3002</p> </li> <li> <p>\u4e16\u754c\u6a21\u578b\u6709\u8d85\u8d8a\u5b66\u672f\u5174\u8da3\u7684\u5b9e\u9645\u5e94\u7528\u3002\u5728\u57fa\u4e8e\u6a21\u578b\u7684\u5f3a\u5316\u5b66\u4e60\u4e2d\uff0c\u667a\u80fd\u4f53\u5728\u91c7\u53d6\u884c\u52a8\u4e4b\u524d\u4f7f\u7528\u5176\u4e16\u754c\u6a21\u578b\u6765\"\u60f3\u8c61\"\u884c\u52a8\u7684\u540e\u679c\uff0c\u5927\u5927\u51cf\u5c11\u4e86\u6240\u9700\u7684\u771f\u5b9e\u4e16\u754c\u4ea4\u4e92\u6b21\u6570\uff08\u56de\u987e\u7b2c 11 \u7ae0\u5bf9\u57fa\u4e8e\u6a21\u578b RL \u7684\u8ba8\u8bba\uff09\u3002\u5728\u81ea\u52a8\u9a7e\u9a76\u4e2d\uff0c\u4e16\u754c\u6a21\u578b\u9884\u6d4b\u5728\u7ed9\u5b9a\u4e0d\u540c\u8f6c\u5411\u51b3\u7b56\u540e\u573a\u666f\u5728\u672a\u6765\u51e0\u79d2\u5185\u5c06\u5982\u4f55\u6f14\u53d8\u3002\u5728\u673a\u5668\u4eba\u5b66\u4e2d\uff0c\u4e16\u754c\u6a21\u578b\u5141\u8bb8\u673a\u5668\u4eba\u5728\u6267\u884c\u64cd\u4f5c\u5e8f\u5217\u4e4b\u524d\u5728\u5934\u8111\u4e2d\u8fdb\u884c\u6392\u7ec3\u3002</p> </li> <li> <p>\u4e16\u754c\u6a21\u578b\u7814\u7a76\u7684\u524d\u6cbf\u6b63\u671d\u7740\u4ea4\u4e92\u5f0f\u4e16\u754c\u6a21\u578b\u53d1\u5c55\uff0c\u8fd9\u4e9b\u6a21\u578b\u5b9e\u65f6\u8fd0\u884c\uff0c\u54cd\u5e94\u4efb\u610f\u7528\u6237\u52a8\u4f5c\uff0c\u672c\u8d28\u4e0a\u6210\u4e3a\u5b8c\u5168\u4ece\u6570\u636e\u4e2d\u5b66\u4e60\u5f97\u5230\u7684\u901a\u7528\u6a21\u62df\u5668\u3002Genie 2\uff08Google DeepMind\uff09\u4e3a 3D \u73af\u5883\u6f14\u793a\u4e86\u8fd9\u4e00\u70b9\uff1a\u7ed9\u5b9a\u4e00\u5f20\u56fe\u50cf\uff0c\u5b83\u751f\u6210\u4e00\u4e2a\u4ea4\u4e92\u5f0f\u7684\u3001\u53ef\u63a7\u7684 3D \u4e16\u754c\uff0c\u7528\u6237\u53ef\u4ee5\u63a2\u7d22\u3002\u4e16\u754c\u6a21\u578b\u4e0e\u7edf\u4e00\u591a\u6a21\u6001\u67b6\u6784\u7684\u878d\u5408\u8868\u660e\uff0c\u672a\u6765\u4e00\u4e2a\u5355\u4e00\u6a21\u578b\u80fd\u591f\u8de8\u6240\u6709\u6a21\u6001\u8fdb\u884c\u611f\u77e5\u3001\u9884\u6d4b\u3001\u6a21\u62df\u548c\u884c\u52a8\u3002</p> </li> </ul>"},{"location":"chapter%2010%3A%20multimodal%20learning/05.%20unified%20multimodal%20architectures/#colab-notebook","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528 CoLab \u6216 notebook\uff09","text":"<p>\u4efb\u52a1 1\uff1a\u6784\u5efa\u4e00\u4e2a\u6700\u5c0f\u5316\u7684\u591a\u6a21\u6001 token \u4ea4\u9519\u5668</p> <ul> <li>\u7f16\u5199\u4e00\u4e2a\u51fd\u6570\uff0c\u63a5\u6536\u4e00\u4e2a\u6587\u672c\u5b57\u7b26\u4e32\u548c\u4e00\u4e2a\u865a\u62df\u7684\"\u56fe\u50cf\"\uff08\u4e00\u4e2a\u5c0f\u578b 2D \u6570\u7ec4\uff09\uff0c\u5e76\u5c06\u5b83\u4eec\u7684 token \u5316\u8868\u793a\u4ea4\u9519\u6210\u4e00\u4e2a\u5e26\u6709\u6a21\u6001\u5d4c\u5165\u7684\u5355\u4e00\u6241\u5e73\u5e8f\u5217\u3002</li> </ul> <pre><code>import jax\nimport jax.numpy as jnp\n\n# \u6a21\u62df\u591a\u6a21\u6001\u5206\u8bcd\uff1a\u6587\u672c token + \"\u56fe\u50cf\u5757\" token\ndef interleave_modalities(text_tokens, image_patches, embed_dim=32, key=jax.random.PRNGKey(0)):\n    \"\"\"\u5c06\u6587\u672c\u548c\u56fe\u50cf token \u4e0e\u5b66\u4e60\u5230\u7684\u6a21\u6001\u5d4c\u5165\u4ea4\u9519\u3002\"\"\"\n    k1, k2, k3 = jax.random.split(key, 3)\n    n_text = text_tokens.shape[0]\n    n_img = image_patches.shape[0]\n    # \u968f\u673a\u6295\u5f71\u77e9\u9635\uff08\u66ff\u4ee3\u771f\u5b9e\u7f16\u7801\u5668\uff09\n    W_text = jax.random.normal(k1, (text_tokens.shape[-1], embed_dim)) * 0.02\n    W_img = jax.random.normal(k2, (image_patches.shape[-1], embed_dim)) * 0.02\n    # \u6a21\u6001\u5d4c\u5165\uff1a\u4e00\u4e2a\u7528\u4e8e\u6587\u672c\uff0c\u4e00\u4e2a\u7528\u4e8e\u56fe\u50cf\n    mod_emb = jax.random.normal(k3, (2, embed_dim)) * 0.02\n    text_embs = text_tokens @ W_text + mod_emb[0]  # (n_text, embed_dim)\n    img_embs = image_patches @ W_img + mod_emb[1]   # (n_img, embed_dim)\n    # \u4ea4\u9519\uff1a[IMG] token \u5728\u524d\uff0c\u7136\u540e\u662f [TEXT] token\uff08\u50cf LLaVA\uff09\n    combined = jnp.concatenate([img_embs, text_embs], axis=0)\n    print(f\"\u7ec4\u5408\u5e8f\u5217: {n_img} \u56fe\u50cf + {n_text} \u6587\u672c = {combined.shape[0]} tokens\")\n    return combined\n\n# \u5c1d\u8bd5\uff1a5 \u4e2a\u6587\u672c token\uff08dim 16\uff09\u548c 4 \u4e2a\u56fe\u50cf\u5757\uff08dim 64\uff09\ntext = jax.random.normal(jax.random.PRNGKey(1), (5, 16))\nimage = jax.random.normal(jax.random.PRNGKey(2), (4, 64))\nseq = interleave_modalities(text, image)\n# \u5b9e\u9a8c\uff1a\u6539\u53d8 embed_dim\uff0c\u4ea4\u6362\u4ea4\u9519\u987a\u5e8f\uff0c\u6dfb\u52a0\u7b2c\u4e09\u4e2a\u6a21\u6001\n</code></pre> <p>\u4efb\u52a1 2\uff1a\u53ef\u89c6\u5316\u8de8\u6a21\u6001\u6ce8\u610f\u529b\u6a21\u5f0f</p> <ul> <li>\u521b\u5efa\u4e00\u4e2a\u5408\u6210\u7684\u591a\u6a21\u6001\u5e8f\u5217\uff0c\u8ba1\u7b97\u81ea\u6ce8\u610f\u529b\u5206\u6570\uff0c\u89c2\u5bdf\u56fe\u50cf token \u5982\u4f55\u5173\u6ce8\u6587\u672c token\uff0c\u53cd\u4e4b\u4ea6\u7136\u3002</li> </ul> <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef cross_modal_attention(n_text=6, n_img=4, d=32, key=jax.random.PRNGKey(42)):\n    \"\"\"\u8ba1\u7b97\u5e76\u53ef\u89c6\u5316\u6587\u672c\u548c\u56fe\u50cf token \u4e4b\u95f4\u7684\u6ce8\u610f\u529b\u3002\"\"\"\n    k1, k2, k3 = jax.random.split(key, 3)\n    # \u6a21\u62df\u4e24\u79cd\u6a21\u6001\u7684 token \u5d4c\u5165\n    text_embs = jax.random.normal(k1, (n_text, d))\n    img_embs = jax.random.normal(k2, (n_img, d))\n    seq = jnp.concatenate([img_embs, text_embs], axis=0)  # (n_img+n_text, d)\n    # \u5b66\u4e60\u5230\u7684 Q, K \u6295\u5f71\n    Wq = jax.random.normal(k3, (d, d)) * 0.1\n    Wk = jax.random.normal(jax.random.PRNGKey(99), (d, d)) * 0.1\n    Q, K = seq @ Wq, seq @ Wk\n    scores = Q @ K.T / jnp.sqrt(d)\n    attn = jax.nn.softmax(scores, axis=-1)\n    # \u7ed8\u56fe\n    labels = [f\"img_{i}\" for i in range(n_img)] + [f\"txt_{i}\" for i in range(n_text)]\n    fig, ax = plt.subplots(figsize=(7, 6))\n    ax.imshow(attn, cmap=\"viridis\")\n    ax.set_xticks(range(len(labels))); ax.set_xticklabels(labels, rotation=45, fontsize=8)\n    ax.set_yticks(range(len(labels))); ax.set_yticklabels(labels, fontsize=8)\n    ax.set_xlabel(\"Key\uff08\u88ab\u5173\u6ce8\u7684\uff09\"); ax.set_ylabel(\"Query\uff08\u53d1\u8d77\u7684\uff09\")\n    ax.set_title(\"\u8de8\u6a21\u6001\u81ea\u6ce8\u610f\u529b\u56fe\")\n    plt.colorbar(ax.images[0], ax=ax, shrink=0.8)\n    plt.tight_layout(); plt.show()\n\ncross_modal_attention()\n# \u5b9e\u9a8c\uff1a\u589e\u5927 d\uff0c\u6dfb\u52a0\u56e0\u679c\u63a9\u7801\uff0c\u89c2\u5bdf\u6ce8\u610f\u529b\u6a21\u5f0f\u5982\u4f55\u53d8\u5316\n</code></pre> <p>\u4efb\u52a1 3\uff1a\u6a21\u62df\u5e26\u6709\u6a21\u6001\u7279\u5b9a\u635f\u5931\u6743\u91cd\u7684\u5206\u9636\u6bb5\u8bad\u7ec3</p> <ul> <li>\u6f14\u793a\u6a21\u6001\u7279\u5b9a\u7684\u635f\u5931\u6743\u91cd\u5982\u4f55\u5f71\u54cd\u73a9\u5177\u591a\u6a21\u6001\u8bad\u7ec3\u5faa\u73af\u3002\u89c2\u5bdf\u5e73\u8861\u635f\u5931\u5982\u4f55\u9632\u6b62\u4e00\u79cd\u6a21\u6001\u4e3b\u5bfc\u8bad\u7ec3\u3002</li> </ul> <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef staged_training_sim(steps=200, key=jax.random.PRNGKey(7)):\n    \"\"\"\u6a21\u62df\u5177\u6709\u53ef\u8c03\u8282\u6a21\u6001\u635f\u5931\u6743\u91cd\u7684\u591a\u6a21\u6001\u8bad\u7ec3\u3002\"\"\"\n    # \u4e24\u79cd\"\u6a21\u6001\"\uff0c\u635f\u5931\u5c3a\u5ea6\u4e0d\u540c\uff08\u6587\u672c\u635f\u5931\u6bd4\u56fe\u50cf\u635f\u5931\u5927\u7ea6 10 \u500d\uff09\n    losses_text, losses_img = [], []\n    param = jnp.array([0.0, 0.0])  # \u4e24\u79cd\u6a21\u6001\u635f\u5931\u5171\u540c\u66f4\u65b0\u7684\u5171\u4eab\u53c2\u6570\n    lr = 0.05\n    # \u5c1d\u8bd5\u66f4\u6539\u8fd9\u4e9b\u6743\u91cd\u4ee5\u89c2\u5bdf\u5bf9\u6536\u655b\u5e73\u8861\u7684\u5f71\u54cd\n    lambda_text, lambda_img = 1.0, 5.0  # \u5bf9\u8f83\u5f31\u6a21\u6001\u52a0\u5927\u6743\u91cd\n\n    for step in range(steps):\n        k1, k2, key = jax.random.split(key, 3)\n        noise_t = jax.random.normal(k1, ()) * 0.3\n        noise_i = jax.random.normal(k2, ()) * 0.1\n        loss_t = (param[0] - 3.0) ** 2 + noise_t  # \u6587\u672c\u76ee\u6807 = 3.0\n        loss_i = 0.1 * (param[1] - 1.0) ** 2 + noise_i  # \u56fe\u50cf\u76ee\u6807 = 1.0\uff08\u5c3a\u5ea6\u66f4\u5c0f\uff09\n        # \u52a0\u6743\u7ec4\u5408\u68af\u5ea6\n        grad_t = lambda_text * 2 * (param[0] - 3.0)\n        grad_i = lambda_img * 0.2 * (param[1] - 1.0)\n        param = param - lr * jnp.array([grad_t, grad_i])\n        losses_text.append(float(loss_t)); losses_img.append(float(loss_i))\n\n    fig, ax = plt.subplots(figsize=(8, 4))\n    ax.plot(losses_text, label=f\"\u6587\u672c\u635f\u5931 (\u6743\u91cd={lambda_text})\", alpha=0.7)\n    ax.plot(losses_img, label=f\"\u56fe\u50cf\u635f\u5931 (\u6743\u91cd={lambda_img})\", alpha=0.7)\n    ax.set_xlabel(\"\u8bad\u7ec3\u6b65\u6570\"); ax.set_ylabel(\"\u635f\u5931\"); ax.legend()\n    ax.set_title(\"\u5206\u9636\u6bb5\u8bad\u7ec3\u4e2d\u7684\u6a21\u6001\u635f\u5931\u5e73\u8861\")\n    plt.tight_layout(); plt.show()\n\nstaged_training_sim()\n# \u5b9e\u9a8c\uff1a\u8bbe\u7f6e lambda_img=1.0\uff0c\u89c2\u5bdf\u56fe\u50cf\u635f\u5931\u6536\u655b\u6162\u5f97\u591a\n</code></pre>"},{"location":"chapter%2011%3A%20autonomous%20systems/01.%20perception/","title":"\u611f\u77e5","text":"<p>\u611f\u77e5\u662f\u81ea\u4e3b\u7cfb\u7edf\u611f\u77e5\u548c\u89e3\u91ca\u7269\u7406\u4e16\u754c\u7684\u65b9\u5f0f\u3002\u672c\u7ae0\u6db5\u76d6\u4f20\u611f\u5668\u6a21\u6001\u3001\u6807\u5b9a\u3001\u4f20\u611f\u5668\u878d\u5408\u30013D\u76ee\u6807\u68c0\u6d4b\u3001\u6df1\u5ea6\u4f30\u8ba1\u3001\u5360\u636e\u7f51\u7edc\u3001\u8f66\u9053\u68c0\u6d4b\u548c\u8bed\u4e49\u5efa\u56fe\u2014\u2014\u8fd9\u662f\u6bcf\u4e2a\u673a\u5668\u4eba\u3001\u65e0\u4eba\u673a\u548c\u81ea\u52a8\u9a7e\u9a76\u6c7d\u8f66\u8d56\u4ee5\u6784\u5efa\u7684\u611f\u77e5\u57fa\u7840\u3002</p> <ul> <li> <p>\u5bf9\u4eba\u7c7b\u800c\u8a00\uff0c\u611f\u77e5\u4e16\u754c\u6beb\u4e0d\u8d39\u529b\uff1a\u4f60\u770b\u5230\u4e00\u8f86\u8f66\u9a76\u8fd1\uff0c\u542c\u5230\u5f15\u64ce\u58f0\uff0c\u611f\u53d7\u5230\u811a\u4e0b\u7684\u5730\u9762\uff0c\u77ac\u95f4\u5728\u8111\u6d77\u4e2d\u6784\u5efa\u51fa\u5468\u56f4\u73af\u5883\u7684\u5fc3\u667a\u6a21\u578b\u3002\u81ea\u4e3b\u7cfb\u7edf\u4e5f\u5fc5\u987b\u505a\u5230\u540c\u6837\u7684\u4e8b\uff0c\u4f46\u5b83\u4f7f\u7528\u7684\u662f\u7535\u5b50\u4f20\u611f\u5668\u548c\u7b97\u6cd5\uff0c\u800c\u975e\u773c\u775b\u548c\u8033\u6735\u3002</p> </li> <li> <p>\u6839\u672c\u6027\u6311\u6218\u5728\u4e8e\uff1a\u4f20\u611f\u5668\u63d0\u4f9b\u7684\u662f\u539f\u59cb\u6570\u5b57\uff08\u50cf\u7d20\u5f3a\u5ea6\u3001\u70b9\u4e91\u3001\u4fe1\u53f7\u53cd\u5c04\uff09\uff0c\u7cfb\u7edf\u5fc5\u987b\u5c06\u8fd9\u4e9b\u6570\u5b57\u8f6c\u5316\u4e3a\u7ed3\u6784\u5316\u7684\u7406\u89e3\uff1a\"\u524d\u65b912\u7c73\u5904\u6709\u4e00\u4e2a\u884c\u4eba\uff0c\u4ee51.5\u7c73/\u79d2\u7684\u901f\u5ea6\u5411\u5de6\u79fb\u52a8\u3002\"\u8fd9\u5c31\u662f\u611f\u77e5\u95ee\u9898\u3002</p> </li> <li> <p>\u4e0b\u6e38\u7684\u6240\u6709\u4efb\u52a1\uff08\u9884\u6d4b\u3001\u89c4\u5212\u3001\u63a7\u5236\uff09\u90fd\u4f9d\u8d56\u4e8e\u611f\u77e5\u3002\u4e00\u4e2a\u62e5\u6709\u5b8c\u7f8e\u89c4\u5212\u5668\u4f46\u611f\u77e5\u80fd\u529b\u5dee\u7684\u81ea\u52a8\u9a7e\u9a76\u6c7d\u8f66\u4ecd\u7136\u4f1a\u649e\u8f66\u3002\u611f\u77e5\u662f\u74f6\u9888\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/01.%20perception/#_2","title":"\u4f20\u611f\u5668\u6a21\u6001","text":"<ul> <li>\u81ea\u4e3b\u7cfb\u7edf\u4f7f\u7528\u591a\u79cd\u4f20\u611f\u5668\u7c7b\u578b\uff0c\u5404\u6709\u5176\u4f18\u52bf\u4e0e\u5931\u6548\u6a21\u5f0f\u3002\u6ca1\u6709\u54ea\u79cd\u4f20\u611f\u5668\u80fd\u5355\u72ec\u80dc\u4efb\u3002</li> </ul> <ul> <li> <p>\u76f8\u673a\u4ee5\u9ad8\u5206\u8fa8\u7387\u6355\u83b7\u5bc6\u96c6\u7684\u989c\u8272\u4fe1\u606f\u3002\u5355\u5f20\u56fe\u50cf\u5305\u542b\u6570\u767e\u4e07\u50cf\u7d20\uff0c\u6bcf\u4e2a\u50cf\u7d20\u8bb0\u5f55RGB\u503c\uff08\u5982\u6211\u4eec\u5728\u7b2c8\u7ae0\u6240\u89c1\uff09\u3002\u76f8\u673a\u4ef7\u683c\u4f4e\u5ec9\u3001\u91cd\u91cf\u8f7b\uff0c\u63d0\u4f9b\u4e30\u5bcc\u7684\u7eb9\u7406\u548c\u989c\u8272\u4fe1\u606f\uff0c\u8fd9\u5bf9\u8bc6\u522b\u6807\u724c\u3001\u68c0\u6d4b\u4ea4\u901a\u4fe1\u53f7\u706f\u548c\u8bc6\u522b\u7269\u4f53\u81f3\u5173\u91cd\u8981\u3002</p> </li> <li> <p>\u76f8\u673a\u7c7b\u578b\u5305\u62ec\u5355\u76ee\uff08\u5355\u4e2a\u955c\u5934\uff0c\u65e0\u539f\u751f\u6df1\u5ea6\uff09\u3001\u7acb\u4f53\uff08\u4e24\u4e2a\u955c\u5934\u76f8\u9694\u4e00\u4e2a\u57fa\u7ebf\uff0c\u901a\u8fc7\u89c6\u5dee\u8ba1\u7b97\u6df1\u5ea6\uff0c\u8be6\u89c1\u7b2c8\u7ae0\uff09\u548c\u9c7c\u773c\uff08\u8d85\u5bbd\u89c6\u573a\u89d2\uff0c180\u00b0\u4ee5\u4e0a\uff0c\u5177\u6709\u4e25\u91cd\u5f84\u5411\u7578\u53d8\uff0c\u7528\u4e8e\u73af\u7ed5\u89c6\u56fe\u6cca\u8f66\u7cfb\u7edf\uff09\u3002</p> </li> <li> <p>\u76f8\u673a\u7684\u4e3b\u8981\u5f31\u70b9\u662f\u6295\u5f71\u8fc7\u7a0b\u4e2d\u4e22\u5931\u6df1\u5ea6\u4fe1\u606f\u30023D\u573a\u666f\u901a\u8fc7\u9488\u5b54\u76f8\u673a\u6a21\u578b\u6620\u5c04\u52302D\u56fe\u50cf\u5e73\u9762\uff08\u56de\u987e\u7b2c8\u7ae0\u7684\u5185\u53c2\u77e9\u9635\\(K\\)\uff09\uff1a</p> </li> </ul> \\[\\\\begin{bmatrix} u \\\\\\\\ v \\\\\\\\ 1 \\\\end{bmatrix} = \\\\frac{1}{Z} K \\\\begin{bmatrix} X \\\\\\\\ Y \\\\\\\\ Z \\\\end{bmatrix}\\] <ul> <li> <p>\u9664\u4ee5\\(Z\\)\u7684\u8fc7\u7a0b\u4e22\u5f03\u4e86\u7edd\u5bf9\u6df1\u5ea6\u3002\u4e24\u4e2a\u4e0d\u540c\u5927\u5c0f\u3001\u4e0d\u540c\u8ddd\u79bb\u7684\u7269\u4f53\u53ef\u80fd\u4ea7\u751f\u5b8c\u5168\u76f8\u540c\u7684\u6295\u5f71\u3002\u4ece\u5355\u5f20\u56fe\u50cf\u6062\u590d\u6df1\u5ea6\u662f\u75c5\u6001\u95ee\u9898\uff0c\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48\u9700\u8981\u7acb\u4f53\u76f8\u673a\u6216\u5b66\u4e60\u578b\u5355\u76ee\u6df1\u5ea6\u6a21\u578b\u3002</p> </li> <li> <p>\u76f8\u673a\u5728\u6076\u52a3\u6761\u4ef6\u4e0b\u4e5f\u4f1a\u53d7\u5230\u5f71\u54cd\uff1a\u76f4\u5c04\u9633\u5149\u4ea7\u751f\u7729\u5149\uff0c\u9ed1\u6697\u964d\u4f4e\u4fe1\u53f7\uff0c\u96e8\u96fe\u6563\u5c04\u5149\u7ebf\u3002</p> </li> <li> <p>LiDAR\uff08\u5149\u63a2\u6d4b\u4e0e\u6d4b\u8ddd\uff09\u53d1\u5c04\u6fc0\u5149\u8109\u51b2\u5e76\u6d4b\u91cf\u6bcf\u4e2a\u8109\u51b2\u8fd4\u56de\u7684\u65f6\u95f4\u3002\u7531\u4e8e\u5149\u901f\u5df2\u77e5\uff08\\(c \\\\approx 3 \\\\times 10^8\\) m/s\uff09\uff0c\u6bcf\u4e2a\u53cd\u5c04\u70b9\u7684\u8ddd\u79bb\u4e3a\uff1a</p> </li> </ul> \\[d = \\\\frac{c \\\\cdot \\\\Delta t}{2}\\] <p></p> <ul> <li> <p>\u56e0\u5b502\u8003\u8651\u4e86\u5f80\u8fd4\u884c\u7a0b\uff08\u53bb\u7a0b\u548c\u56de\u7a0b\uff09\u3002\u901a\u8fc7\u5c06\u6fc0\u5149\u626b\u8fc7\u573a\u666f\uff0cLiDAR\u6784\u5efa\u4e86\u4e00\u4e2a\u70b9\u4e91\uff1a\u4e00\u7ec43D\u5750\u6807\\((x, y, z)\\)\uff0c\u901a\u5e38\u5e26\u6709\u5f3a\u5ea6\uff08\u53cd\u5c04\u7387\uff09\u503c\u3002</p> </li> <li> <p>\u65cb\u8f6c\u5f0fLiDAR\uff08\u5982Velodyne\uff09\u65cb\u8f6c\u6fc0\u5149\u9635\u5217360\u00b0\u4ee5\u63d0\u4f9b\u5b8c\u6574\u7684\u73af\u89c6\u89c6\u56fe\u3002\u5178\u578b\u8bbe\u5907\u6bcf\u79d2\u751f\u6210\u8d85\u8fc730\u4e07\u4e2a\u70b9\uff0c\u8986\u76d664-128\u4e2a\u5782\u76f4\u901a\u9053\u3002\u7ed3\u679c\u662f\u573a\u666f\u7684\u7a00\u758f\u4f46\u51e0\u4f55\u7cbe\u5ea6\u9ad8\u76843D\u8868\u793a\u3002</p> </li> <li> <p>\u56fa\u6001LiDAR\u6ca1\u6709\u8fd0\u52a8\u90e8\u4ef6\uff0c\u4f7f\u7528\u5149\u5b66\u76f8\u63a7\u9635\u6216MEMS\u955c\u9762\u3002\u8fd9\u4f7f\u5f97\u5b83\u4eec\u66f4\u4fbf\u5b9c\u3001\u66f4\u7d27\u51d1\u3001\u66f4\u53ef\u9760\uff0c\u4f46\u901a\u5e38\u89c6\u573a\u89d2\u8f83\u7a84\uff08120\u00b0 vs 360\u00b0\uff09\u3002</p> </li> <li> <p>LiDAR\u63d0\u4f9b\u7cbe\u786e\u7684\u6df1\u5ea6\uff0c\u4f46\u751f\u6210\u7684\u662f\u7a00\u758f\u6570\u636e\uff08\"\u50cf\u7d20\"\u6570\u91cf\u8fdc\u5c11\u4e8e\u76f8\u673a\uff09\uff0c\u6ca1\u6709\u989c\u8272\u4fe1\u606f\uff0c\u4e14\u4ef7\u683c\u6602\u8d35\u3002\u5728\u5927\u96e8\u3001\u96ea\u6216\u7070\u5c18\u4e2d\uff0c\u7c92\u5b50\u4f1a\u6563\u5c04\u6fc0\u5149\u8109\u51b2\uff0c\u5176\u6027\u80fd\u4e5f\u4f1a\u4e0b\u964d\u3002</p> </li> <li> <p>\u96f7\u8fbe\uff08\u65e0\u7ebf\u7535\u63a2\u6d4b\u4e0e\u6d4b\u8ddd\uff09\u57fa\u4e8e\u4e0eLiDAR\u76f8\u540c\u7684\u98de\u884c\u65f6\u95f4\u539f\u7406\uff0c\u4f46\u4f7f\u7528\u65e0\u7ebf\u7535\u6ce2\uff08\u6beb\u7c73\u6ce2\uff0c\u6c7d\u8f66\u9886\u57df\u901a\u5e38\u4e3a77 GHz\uff09\u3002\u65e0\u7ebf\u7535\u6ce2\u7a7f\u900f\u96e8\u3001\u96fe\u3001\u5c18\u548c\u96ea\u7684\u80fd\u529b\u8fdc\u4f18\u4e8e\u5149\uff0c\u4f7f\u96f7\u8fbe\u6210\u4e3a\u6700\u8010\u5929\u6c14\u7684\u4f20\u611f\u5668\u3002</p> </li> <li> <p>\u96f7\u8fbe\u8fd8\u80fd\u901a\u8fc7\u591a\u666e\u52d2\u6548\u5e94\u76f4\u63a5\u6d4b\u91cf\u901f\u5ea6\u3002\u5f53\u7269\u4f53\u5411\u4f20\u611f\u5668\u79fb\u52a8\u65f6\uff0c\u53cd\u5c04\u6ce2\u88ab\u538b\u7f29\uff08\u9891\u7387\u5347\u9ad8\uff09\uff1b\u5f53\u8fdc\u79bb\u65f6\uff0c\u53cd\u5c04\u6ce2\u88ab\u62c9\u4f38\uff08\u9891\u7387\u964d\u4f4e\uff09\u3002\u901f\u5ea6\u516c\u5f0f\u4e3a\uff1a</p> </li> </ul> \\[v = \\\\frac{\\\\Delta f \\\\cdot c}{2 f_0}\\] <ul> <li> <p>\u5176\u4e2d\\(\\\\Delta f\\)\u662f\u9891\u79fb\uff0c\\(f_0\\)\u662f\u53d1\u5c04\u9891\u7387\u3002\u8fd9\u63d0\u4f9b\u4e86\u77ac\u65f6\u5f84\u5411\u901f\u5ea6\uff0c\u65e0\u9700\u4efb\u4f55\u8ddf\u8e2a\u6216\u5e27\u95f4\u8ba1\u7b97\u3002</p> </li> <li> <p>\u6298\u4e2d\u662f\u5206\u8fa8\u7387\uff1a\u96f7\u8fbe\u7684\u89d2\u5206\u8fa8\u7387\u8fdc\u4f4e\u4e8e\u76f8\u673a\u6216LiDAR\uff0c\u96be\u4ee5\u533a\u5206\u90bb\u8fd1\u7269\u4f53\u6216\u68c0\u6d4b\u7cbe\u7ec6\u7ec6\u8282\u3002\u4f46\u5b83\u5728\u4efb\u4f55\u5929\u6c14\u6761\u4ef6\u4e0b\u90fd\u80fd\u51fa\u8272\u5730\u63a2\u6d4b\u8fdc\u8ddd\u79bb\uff08200\u7c73\u4ee5\u4e0a\uff09\u7684\u8f66\u8f86\u3002</p> </li> <li> <p>\u8d85\u58f0\u6ce2\u4f20\u611f\u5668\u53d1\u5c04\u9ad8\u9891\u58f0\u8109\u51b2\uff0840-70 kHz\uff09\u5e76\u6d4b\u91cf\u56de\u6ce2\u8fd4\u56de\u65f6\u95f4\u3002\u5b83\u4eec\u5de5\u4f5c\u5728\u6781\u77ed\u8ddd\u79bb\uff080.2-5\u7c73\uff09\uff0c\u4e3b\u8981\u7528\u4e8e\u6cca\u8f66\u8f85\u52a9\u3002\u5176\u7269\u7406\u539f\u7406\u4e0eLiDAR\u76f8\u540c\uff0c\u53ea\u662f\u7528\u58f0\u97f3\u4ee3\u66ff\u5149\uff0c\u56e0\u6b64\\(d = \\\\frac{v_{\\\\text{\u58f0}} \\\\cdot \\\\Delta t}{2}\\)\uff0c\u5176\u4e2d\\(v_{\\\\text{\u58f0}} \\\\approx 343\\) m/s\u3002</p> </li> <li> <p>IMU\uff08\u60ef\u6027\u6d4b\u91cf\u5355\u5143\uff09\u5305\u542b\u52a0\u901f\u5ea6\u8ba1\u548c\u9640\u87ba\u4eea\uff0c\u5206\u522b\u6d4b\u91cf\u7ebf\u52a0\u901f\u5ea6\u548c\u89d2\u901f\u5ea6\u3002IMU\u63d0\u4f9b\u9ad8\u9891\u8fd0\u52a8\u6570\u636e\uff08\u901a\u5e38200-1000 Hz\uff09\uff0c\u586b\u8865\u4e86\u8f83\u6162\u4f20\u611f\u5668\u66f4\u65b0\u4e4b\u95f4\u7684\u7a7a\u767d\u3002\u5b83\u4eec\u4e0d\u76f4\u63a5\u611f\u77e5\u73af\u5883\uff0c\u800c\u662f\u8ddf\u8e2a\u673a\u5668\u4eba\u81ea\u8eab\u7684\u8fd0\u52a8\uff0c\u56e0\u6b64\u5bf9\u822a\u4f4d\u63a8\u7b97\u548c\u72b6\u6001\u4f30\u8ba1\u81f3\u5173\u91cd\u8981\u3002</p> </li> <li> <p>IMU\u5b58\u5728\u6f02\u79fb\u95ee\u9898\uff1a\u5c0f\u7684\u6d4b\u91cf\u8bef\u5dee\u968f\u65f6\u95f4\u7d2f\u79ef\uff0c\u5bfc\u81f4\u4f30\u8ba1\u4f4d\u7f6e\u504f\u79bb\u771f\u5b9e\u4f4d\u7f6e\u3002\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48IMU\u51e0\u4e4e\u603b\u662f\u4e0e\u5176\u4ed6\u4f20\u611f\u5668\uff08\u76f8\u673a\u3001GPS\u3001LiDAR\uff09\u878d\u5408\u4f7f\u7528\uff0c\u800c\u975e\u5355\u72ec\u4f7f\u7528\u3002</p> </li> <li> <p>GNSS\uff08\u5168\u7403\u5bfc\u822a\u536b\u661f\u7cfb\u7edf\uff0c\u5305\u62ecGPS\uff09\u901a\u8fc7\u4e09\u89d2\u6d4b\u91cf\u6765\u81ea\u591a\u9897\u536b\u661f\u7684\u4fe1\u53f7\uff0c\u63d0\u4f9b\u5730\u7403\u8868\u9762\u7684\u7edd\u5bf9\u4f4d\u7f6e\u3002\u6807\u51c6GPS\u7cbe\u5ea6\u4e3a2-5\u7c73\uff0c\u4e0d\u8db3\u4ee5\u8fdb\u884c\u8f66\u9053\u7ea7\u9a7e\u9a76\u3002RTK-GPS\uff08\u5b9e\u65f6\u52a8\u6001\u5dee\u5206GPS\uff09\u4f7f\u7528\u56fa\u5b9a\u57fa\u7ad9\u6821\u6b63\u8bef\u5dee\uff0c\u8fbe\u5230\u5398\u7c73\u7ea7\u7cbe\u5ea6\uff0c\u4f46\u9700\u8981\u6e05\u6670\u7684\u5929\u7a7a\u89c6\u91ce\u548c\u57fa\u7ad9\u57fa\u7840\u8bbe\u65bd\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/01.%20perception/#_3","title":"\u4f20\u611f\u5668\u6807\u5b9a","text":"<ul> <li> <p>\u5728\u4f20\u611f\u5668\u534f\u540c\u5de5\u4f5c\u4e4b\u524d\uff0c\u5fc5\u987b\u8fdb\u884c\u6807\u5b9a\uff1a\u5c06\u6bcf\u4e2a\u4f20\u611f\u5668\u7684\u6d4b\u91cf\u503c\u4e0e\u5171\u540c\u5750\u6807\u7cfb\u5173\u8054\u8d77\u6765\u3002</p> </li> <li> <p>\u5185\u53c2\u6807\u5b9a\u786e\u5b9a\u4f20\u611f\u5668\u7684\u5185\u90e8\u53c2\u6570\u3002\u5bf9\u4e8e\u76f8\u673a\uff0c\u8fd9\u610f\u5473\u7740\u7126\u8ddd\u3001\u4e3b\u70b9\u548c\u7578\u53d8\u7cfb\u6570\uff08\u5982\u7b2c8\u7ae0\u6240\u8ff0\uff09\u3002\u5bf9\u4e8eLiDAR\uff0c\u8fd9\u610f\u5473\u7740\u6fc0\u5149\u675f\u4e4b\u95f4\u7684\u7cbe\u786e\u89d2\u5ea6\u504f\u79fb\u3002\u5e38\u7528\u7684\u65b9\u6cd5\u662f\u5f20\u6c0f\u68cb\u76d8\u683c\u6807\u5b9a\u6cd5\uff0c\u5373\u4ece\u591a\u4e2a\u89d2\u5ea6\u89c2\u5bdf\u5df2\u77e5\u5e73\u9762\u56fe\u6848\uff0c\u6c42\u89e3\u5185\u53c2\u77e9\u9635\u3002</p> </li> <li> <p>\u5916\u53c2\u6807\u5b9a\u786e\u5b9a\u4e24\u4e2a\u4f20\u611f\u5668\u4e4b\u95f4\u7684\u521a\u4f53\u53d8\u6362\uff08\u65cb\u8f6c\\(R\\)\u548c\u5e73\u79fb\\(\\\\mathbf{t}\\)\uff09\u3002\u5982\u679c\u76f8\u673a\u548cLiDAR\u5b89\u88c5\u5728\u540c\u4e00\u8f86\u8f66\u4e0a\uff0c\u5916\u53c2\u6807\u5b9a\u4f1a\u627e\u5230\u4e00\u4e2a\\(4 \\\\times 4\\)\u53d8\u6362\u77e9\u9635\uff0c\u5c06LiDAR\u5750\u6807\u4e2d\u7684\u70b9\u6620\u5c04\u5230\u76f8\u673a\u5750\u6807\uff1a</p> </li> </ul> \\[\\\\mathbf{p}_{\\\\text{\u76f8}} = \\\\begin{bmatrix} R &amp; \\\\mathbf{t} \\\\\\\\ \\\\mathbf{0}^T &amp; 1 \\\\end{bmatrix} \\\\mathbf{p}_{\\\\text{\u6fc0}}\\] <ul> <li> <p>\u8fd9\u662f\u9f50\u6b21\u5750\u6807\u4e2d\u7684\u4eff\u5c04\u53d8\u6362\uff0c\u6b63\u662f\u6211\u4eec\u5728\u7b2c2\u7ae0\uff08\u7ebf\u6027\u53d8\u6362\uff09\u4e2d\u7814\u7a76\u8fc7\u7684\u90a3\u79cd\u3002\u5982\u679c\u8fd9\u4e2a\u77e9\u9635\u51fa\u9519\uff0cLiDAR\u70b9\u5c06\u6295\u5f71\u5230\u9519\u8bef\u7684\u50cf\u7d20\u4e0a\uff0c\u6574\u4e2a\u878d\u5408\u6d41\u7a0b\u5c31\u4f1a\u5d29\u6e83\u3002</p> </li> <li> <p>\u65f6\u95f4\u6807\u5b9a\u540c\u6b65\u4f20\u611f\u5668\u65f6\u949f\u3002\u4ee530 Hz\u5de5\u4f5c\u7684\u76f8\u673a\u548c\u4ee510 Hz\u5de5\u4f5c\u7684LiDAR\u5728\u4e0d\u540c\u65f6\u95f4\u6233\u4ea7\u751f\u6570\u636e\u3002\u5982\u679c\u6c7d\u8f66\u4ee530 m/s\uff08\u9ad8\u901f\u516c\u8def\u901f\u5ea6\uff09\u884c\u9a76\uff0c10\u6beb\u79d2\u7684\u65f6\u95f4\u8bef\u5dee\u5bf9\u5e9430\u5398\u7c73\u7684\u7a7a\u95f4\u8bef\u5dee\u3002\u786c\u4ef6\u89e6\u53d1\uff08\u5171\u4eab\u65f6\u949f\u8109\u51b2\uff09\u6216\u8f6f\u4ef6\u540c\u6b65\uff08\u65f6\u95f4\u6233\u4e4b\u95f4\u7684\u63d2\u503c\uff09\u81f3\u5173\u91cd\u8981\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/01.%20perception/#_4","title":"\u4f20\u611f\u5668\u878d\u5408","text":"<ul> <li> <p>\u6ca1\u6709\u54ea\u79cd\u4f20\u611f\u5668\u80fd\u8986\u76d6\u6240\u6709\u6761\u4ef6\u3002\u76f8\u673a\u770b\u5f97\u5230\u989c\u8272\u548c\u7eb9\u7406\u4f46\u4e22\u5931\u6df1\u5ea6\u3002LiDAR\u7cbe\u786e\u6d4b\u91cf\u6df1\u5ea6\u4f46\u7a00\u758f\u4e14\u8272\u76f2\u3002\u96f7\u8fbe\u5728\u4efb\u4f55\u5929\u6c14\u4e0b\u90fd\u80fd\u5de5\u4f5c\u4f46\u5206\u8fa8\u7387\u4f4e\u3002\u4f20\u611f\u5668\u878d\u5408\u7ed3\u5408\u5404\u81ea\u7684\u4f18\u52bf\uff0c\u5f25\u8865\u5404\u81ea\u7684\u5f31\u70b9\u3002</p> </li> <li> <p>\u65e9\u671f\u878d\u5408\uff08\u6570\u636e\u7ea7\u878d\u5408\uff09\u5728\u8fdb\u884c\u4efb\u4f55\u5904\u7406\u4e4b\u524d\u5408\u5e76\u539f\u59cb\u4f20\u611f\u5668\u6570\u636e\u3002\u4f8b\u5982\uff0c\u5c06LiDAR\u70b9\u6295\u5f71\u5230\u76f8\u673a\u56fe\u50cf\u4e0a\uff0c\u521b\u5efaRGBD\u8868\u793a\uff08\u6bcf\u50cf\u7d20\u7684\u989c\u8272+\u6df1\u5ea6\uff09\uff0c\u6216\u8005\u4e3a\u6bcf\u4e2aLiDAR\u70b9\u8d4b\u4e88\u5176\u6295\u5f71\u5230\u7684\u76f8\u673a\u50cf\u7d20\u7684\u989c\u8272\u3002\u8fd9\u79cd\u65b9\u5f0f\u4fdd\u7559\u4e86\u6700\u591a\u7684\u4fe1\u606f\uff0c\u4f46\u9700\u8981\u7cbe\u786e\u7684\u6807\u5b9a\uff0c\u4e14\u5bf9\u672a\u5bf9\u51c6\u975e\u5e38\u654f\u611f\u3002</p> </li> <li> <p>\u540e\u671f\u878d\u5408\uff08\u51b3\u7b56\u7ea7\u878d\u5408\uff09\u6bcf\u4e2a\u4f20\u611f\u5668\u72ec\u7acb\u8fd0\u884c\u5404\u81ea\u7684\u68c0\u6d4b\u6d41\u7a0b\uff0c\u7136\u540e\u5408\u5e76\u6700\u7ec8\u8f93\u51fa\uff08\u8fb9\u754c\u6846\u3001\u7c7b\u522b\u6807\u7b7e\u3001\u7f6e\u4fe1\u5ea6\u5206\u6570\uff09\u3002\u6bcf\u4e2a\u4f20\u611f\u5668\u6295\u7968\uff0c\u878d\u5408\u6a21\u5757\u534f\u8c03\u5206\u6b67\u3002\u8fd9\u79cd\u65b9\u5f0f\u66f4\u7b80\u5355\u3001\u66f4\u6a21\u5757\u5316\uff0c\u4f46\u6bcf\u4e2a\u6d41\u7a0b\u65e0\u6cd5\u4ece\u5176\u4ed6\u4f20\u611f\u5668\u7684\u539f\u59cb\u6570\u636e\u4e2d\u83b7\u76ca\u3002</p> </li> <li> <p>\u4e2d\u7ea7\u878d\u5408\u5728\u4e2d\u95f4\u7279\u5f81\u8868\u793a\u5c42\u9762\u8fdb\u884c\u64cd\u4f5c\u3002\u6bcf\u4e2a\u4f20\u611f\u5668\u7684\u539f\u59cb\u6570\u636e\u88ab\u7f16\u7801\u5230\u5b66\u4e60\u5230\u7684\u7279\u5f81\u7a7a\u95f4\uff08\u4f7f\u7528CNN\u6216transformer\uff09\uff0c\u7136\u540e\u7279\u5f81\u88ab\u5408\u5e76\u3002\u8fd9\u662f\u73b0\u4ee3\u7cfb\u7edf\u7684\u4e3b\u6d41\u65b9\u6cd5\uff0c\u56e0\u4e3a\u5b83\u8ba9\u7f51\u7edc\u5b66\u4e60\u4ece\u6bcf\u79cd\u6a21\u6001\u4e2d\u63d0\u53d6\u4ec0\u4e48\u3002</p> </li> </ul> <p></p> <ul> <li> <p>BEVFusion\u662f\u4e00\u79cd\u4ee3\u8868\u6027\u7684\u4e2d\u7ea7\u878d\u5408\u67b6\u6784\u3002\u5b83\u5c06\u76f8\u673a\u7279\u5f81\u548cLiDAR\u7279\u5f81\u6295\u5f71\u5230\u4e00\u4e2a\u5171\u540c\u7684\u9e1f\u77b0\u56fe\uff08BEV\uff09\u8868\u793a\u4e2d\uff0c\u5373\u573a\u666f\u7684\u4fef\u89c6\u7f51\u683c\u3002\u76f8\u673a\u7279\u5f81\u901a\u8fc7\u9884\u6d4b\u7684\u6df1\u5ea6\u5206\u5e03\u88ab\"\u63d0\u5347\"\u52303D\uff0c\u7136\u540e\u6563\u5e03\u5230BEV\u7f51\u683c\u4e0a\u3002LiDAR\u7279\u5f81\u5df2\u7ecf\u662f3D\u7684\uff0c\u76f4\u63a5\u88ab\u4f53\u7d20\u5316\u5230\u540c\u4e00\u4e2a\u7f51\u683c\u4e0a\u3002\u878d\u5408\u540e\u7684BEV\u7279\u5f81\u968f\u540e\u7531\u68c0\u6d4b\u5934\u5904\u7406\u3002</p> </li> <li> <p>BEV\u8868\u793a\u4e4b\u6240\u4ee5\u5f3a\u5927\uff0c\u662f\u56e0\u4e3a\u5b83\u63d0\u4f9b\u4e86\u4e00\u4e2a\u7edf\u4e00\u7684\u3001\u5ea6\u91cf\u5c3a\u5ea6\u7684\u5750\u6807\u6846\u67b6\uff0c\u7a7a\u95f4\u63a8\u7406\uff08\u8ddd\u79bb\u3001\u5c3a\u5bf8\u3001\u91cd\u53e0\uff09\u5728\u5176\u4e2d\u53d8\u5f97\u76f4\u89c2\u3002\u5728\u76f8\u673a\u56fe\u50cf\u4e2d\uff0c\u4e00\u8f86\u8fd1\u5904\u7684\u81ea\u884c\u8f66\u548c\u4e00\u8f86\u8fdc\u5904\u7684\u5361\u8f66\u53ef\u80fd\u5360\u636e\u76f8\u540c\u6570\u91cf\u7684\u50cf\u7d20\u3002\u800c\u5728BEV\u4e2d\uff0c\u5b83\u4eec\u7684\u771f\u5b9e\u5927\u5c0f\u548c\u4f4d\u7f6e\u4e00\u76ee\u4e86\u7136\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/01.%20perception/#3d","title":"3D\u76ee\u6807\u68c0\u6d4b","text":"<ul> <li> <p>\u611f\u77e5\u7684\u6838\u5fc3\u4efb\u52a1\u662f\u57283D\u7a7a\u95f4\u4e2d\u68c0\u6d4b\u7269\u4f53\uff1a\u5b83\u4eec\u5728\u54ea\u91cc\uff0c\u6709\u591a\u5927\uff0c\u662f\u4ec0\u4e48\uff0c\u671d\u5411\u4f55\u65b9\uff1f\u6bcf\u6b21\u68c0\u6d4b\u5f97\u5230\u4e00\u4e2a3D\u8fb9\u754c\u6846\uff0c\u5305\u62ec\u4f4d\u7f6e\\((x, y, z)\\)\u3001\u5c3a\u5bf8\\((l, w, h)\\)\u3001\u822a\u5411\u89d2\\(\\\\theta\\)\u3001\u7c7b\u522b\u6807\u7b7e\u548c\u7f6e\u4fe1\u5ea6\u5206\u6570\u3002</p> </li> <li> <p>\u57fa\u4e8eLiDAR\u7684\u68c0\u6d4b\u76f4\u63a5\u5728\u70b9\u4e91\u4e0a\u64cd\u4f5c\u3002\u6311\u6218\u5728\u4e8e\u70b9\u4e91\u662f\u65e0\u5e8f\u7684\u3001\u4e0d\u89c4\u5219\u7684\uff0c\u4e14\u5bc6\u5ea6\u53d8\u5316\u5927\uff08\u8fd1\u5904\u7269\u4f53\u6709\u6570\u5343\u4e2a\u70b9\uff0c\u8fdc\u5904\u7269\u4f53\u53ea\u6709\u51e0\u4e2a\uff09\u3002\u56de\u987e\u7b2c8\u7ae0\uff0cPointNet\u901a\u8fc7\u5171\u4eabMLP\u548c\u7f6e\u6362\u4e0d\u53d8\u7684\u805a\u5408\uff08\u6700\u5927\u6c60\u5316\uff09\u6765\u5904\u7406\u8fd9\u4e00\u95ee\u9898\u3002</p> </li> <li> <p>PointPillars\u901a\u8fc7\u5c06\u5730\u9762\u5e73\u9762\u79bb\u6563\u5316\u4e3a\u5782\u76f4\u67f1\uff08\"pillars\"\uff09\u7684\u7f51\u683c\uff0c\u5c06\u70b9\u4e91\u8f6c\u5316\u4e3a\u7ed3\u6784\u5316\u8868\u793a\u3002\u6bcf\u4e2apillar\u5185\u7684\u6240\u6709\u70b9\u7531\u4e00\u4e2a\u5c0f\u578bPointNet\u7f16\u7801\u4e3a\u56fa\u5b9a\u5927\u5c0f\u7684\u7279\u5f81\u5411\u91cf\u3002\u7ed3\u679c\u662f\u4e00\u4e2a2D\u4f2a\u56fe\u50cf\uff0c\u53ef\u4ee5\u7531\u6807\u51c6\u76842D CNN\u4e3b\u5e72\u7f51\u7edc\u5904\u7406\uff0c\u7136\u540e\u662f\u68c0\u6d4b\u5934\uff08\u5982\u7b2c8\u7ae0\u4e2d\u7684SSD\u67b6\u6784\uff09\u3002\u8fd9\u79cd\u65b9\u6cd5\u5feb\u901f\u4e14\u6709\u6548\u3002</p> </li> <li> <p>CenterPoint\u5c06\u7269\u4f53\u68c0\u6d4b\u4e3a\u70b9\u800c\u975e\u8fb9\u754c\u6846\u3002\u5b83\u5728BEV\u4e2d\u9884\u6d4b\u7269\u4f53\u4e2d\u5fc3\u7684\u70ed\u56fe\uff0c\u7136\u540e\u5728\u6bcf\u4e2a\u5cf0\u503c\u5904\u56de\u5f52\u8fb9\u754c\u6846\u5c5e\u6027\uff08\u5c3a\u5bf8\u3001\u9ad8\u5ea6\u3001\u822a\u5411\u3001\u901f\u5ea6\uff09\u3002\u8fd9\u662fCenterNet\uff08\u7b2c8\u7ae0\uff09\u76843D\u7c7b\u6bd4\uff1a\u65e0\u951a\u70b9\uff0c\u8bad\u7ec3\u65f6\u65e0\u9700NMS\uff0c\u5e76\u901a\u8fc7\u8de8\u5e27\u5173\u8054\u4e2d\u5fc3\u70b9\u81ea\u7136\u6269\u5c55\u5230\u8ddf\u8e2a\u3002</p> </li> <li> <p>\u7eaf\u76f8\u673a3D\u68c0\u6d4b\u5fc5\u987b\u4ece2D\u56fe\u50cf\u63a8\u65ad\u6df1\u5ea6\uff0c\u8fd9\u4ece\u6839\u672c\u4e0a\u66f4\u96be\u3002\u73b0\u4ee3\u65b9\u6cd5\u5982BEVDet\u548cBEVFormer\u4f7f\u7528transformer\u67b6\u6784\u5c062D\u56fe\u50cf\u7279\u5f81\"\u63d0\u5347\"\u52303D\u3002BEVFormer\u4f7f\u7528\u7a7a\u95f4\u4ea4\u53c9\u6ce8\u610f\u529b\uff1aBEV\u67e5\u8be2\u5173\u6ce8\u6295\u5f71\u5230\u6bcf\u4e2a\u76f8\u673a\u56fe\u50cf\u4e0a\u7684\u7279\u5b9a3D\u53c2\u8003\u70b9\uff0c\u4ece\u76f8\u5173\u4f4d\u7f6e\u63d0\u53d6\u7279\u5f81\u3002</p> </li> <li> <p>\u57fa\u4e8eLiDAR\u548c\u57fa\u4e8e\u76f8\u673a\u76843D\u68c0\u6d4b\u4e4b\u95f4\u7684\u7cbe\u5ea6\u5dee\u8ddd\u6b63\u5728\u8fc5\u901f\u7f29\u5c0f\uff0c\u8fd9\u5f97\u76ca\u4e8e\u66f4\u597d\u7684\u6df1\u5ea6\u4f30\u8ba1\u3001\u66f4\u5927\u7684\u6a21\u578b\u548c\u65f6\u95f4\u878d\u5408\uff08\u5229\u7528\u591a\u5e27\u7d2f\u79ef\u6df1\u5ea6\u7ebf\u7d22\uff0c\u7c7b\u4f3c\u7acb\u4f53\u5339\u914d\u4f46\u8de8\u65f6\u95f4\u8fdb\u884c\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/01.%20perception/#_5","title":"\u6df1\u5ea6\u4f30\u8ba1","text":"<ul> <li> <p>\u6df1\u5ea6\u4f30\u8ba1\u662f\u4e3a\u6bcf\u4e2a\u50cf\u7d20\u6216\u70b9\u5206\u914d\u8ddd\u79bb\u503c\u7684\u95ee\u9898\u3002</p> </li> <li> <p>\u7acb\u4f53\u5339\u914d\u4f7f\u7528\u4e24\u4e2a\u76f8\u9694\u5df2\u77e5\u57fa\u7ebf\\(b\\)\u7684\u76f8\u673a\u3002\u540c\u4e00\u4e2a3D\u70b9\u5728\u4e24\u5e45\u56fe\u50cf\u4e2d\u7684\u6c34\u5e73\u4f4d\u7f6e\u7565\u6709\u4e0d\u540c\uff0c\u5f62\u6210\u89c6\u5dee\\(d\\)\u3002\u6df1\u5ea6\u8ba1\u7b97\u516c\u5f0f\u4e3a\uff08\u6765\u81ea\u7b2c8\u7ae0\uff09\uff1a</p> </li> </ul> \\[Z = \\\\frac{f \\\\cdot b}{d}\\] <ul> <li> <p>\u5176\u4e2d\\(f\\)\u662f\u7126\u8ddd\u3002\u6311\u6218\u5728\u4e8e\u627e\u5230\u4e24\u5e45\u56fe\u50cf\u4e4b\u95f4\u7684\u6b63\u786e\u5bf9\u5e94\u5173\u7cfb\uff0c\u7279\u522b\u662f\u5728\u65e0\u7eb9\u7406\u533a\u57df\u3001\u906e\u6321\u533a\u57df\u548c\u91cd\u590d\u56fe\u6848\u4e2d\u3002\u73b0\u4ee3\u7acb\u4f53\u7f51\u7edc\uff08\u5982RAFT-Stereo\uff09\u4f7f\u7528\u5e26\u6709\u76f8\u5173\u4f53\u79ef\u7684\u8fed\u4ee3\u7cbe\u5316\u65b9\u6cd5\u3002</p> </li> <li> <p>\u5355\u76ee\u6df1\u5ea6\u4f30\u8ba1\u4ece\u5355\u5f20\u56fe\u50cf\u9884\u6d4b\u6df1\u5ea6\u3002\u7531\u4e8e\u8fd9\u662f\u75c5\u6001\u95ee\u9898\uff08\u65e0\u9650\u591a\u4e2a3D\u573a\u666f\u53ef\u4ee5\u4ea7\u751f\u76f8\u540c\u7684\u56fe\u50cf\uff09\uff0c\u7f51\u7edc\u5fc5\u987b\u5b66\u4e60\u7edf\u8ba1\u5148\u9a8c\uff1a\"\u5730\u9762\u662f\u5e73\u7684\"\u3001\"\u7269\u4f53\u968f\u8ddd\u79bb\u589e\u5927\u800c\u53d8\u5c0f\"\u3001\"\u7eb9\u7406\u68af\u5ea6\u8868\u660e\u8868\u9762\u5728\u540e\u9000\"\u3002</p> </li> <li> <p>Depth Anything\uff08\u7b2c8\u7ae0\u4e2d\u4ecb\u7ecd\u8fc7\uff09\u901a\u8fc7\u5728\u5927\u89c4\u6a21\u65e0\u6807\u6ce8\u6570\u636e\u96c6\u4e0a\u8fdb\u884c\u81ea\u76d1\u7763\u8bad\u7ec3\uff0c\u7136\u540e\u5728\u6807\u6ce8\u6570\u636e\u4e0a\u8fdb\u884c\u5fae\u8c03\uff0c\u5b9e\u73b0\u4e86\u5f3a\u5927\u7684\u5355\u76ee\u6df1\u5ea6\u4f30\u8ba1\u3002\u5173\u952e\u6d1e\u5bdf\u5728\u4e8e\u5c3a\u5ea6\u4e0d\u53d8\u635f\u5931\u5904\u7406\u4e86\u56fa\u6709\u4e0d\u660e\u786e\u6027\uff1a\u6a21\u578b\u9884\u6d4b\u7684\u662f\u76f8\u5bf9\u6df1\u5ea6\uff08\u6392\u5e8f\uff09\u800c\u975e\u7edd\u5bf9\u7c73\u6570\u3002</p> </li> <li> <p>LiDAR-\u76f8\u673a\u6df1\u5ea6\u878d\u5408\u5c06\u7a00\u758f\u7684LiDAR\u6df1\u5ea6\u6d4b\u91cf\u503c\u6295\u5f71\u5230\u76f8\u673a\u56fe\u50cf\u4e0a\u4f5c\u4e3a\u76d1\u7763\u4fe1\u53f7\u3002\u7f51\u7edc\u5b66\u4e60\"\u586b\u5145\"\u7a00\u758f\u70b9\u4e4b\u95f4\u7684\u7a7a\u767d\uff0c\u751f\u6210\u7ed3\u5408LiDAR\u7cbe\u5ea6\u548c\u76f8\u673a\u5206\u8fa8\u7387\u7684\u5bc6\u96c6\u6df1\u5ea6\u56fe\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/01.%20perception/#_6","title":"\u5360\u636e\u7f51\u7edc","text":"<ul> <li>\u4f20\u7edf\u611f\u77e5\u8f93\u51fa\u4e00\u4e2a\u8fb9\u754c\u6846\u5217\u8868\uff0c\u6bcf\u4e2a\u68c0\u6d4b\u5230\u7684\u7269\u4f53\u4e00\u4e2a\u6846\u3002\u4f46\u73b0\u5b9e\u4e16\u754c\u4e2d\u8bb8\u591a\u4e8b\u7269\u5e76\u4e0d\u9002\u5408\u7528\u6846\u6765\u6574\u9f50\u5730\u8868\u793a\uff1a\u5f62\u72b6\u4e0d\u89c4\u5219\u7684\u788e\u7247\u3001\u65bd\u5de5\u56f4\u6321\u3001\u60ac\u5782\u7684\u6811\u679d\u3001\u90e8\u5206\u574d\u584c\u7684\u5899\u58c1\u3002</li> </ul> <ul> <li> <p>\u5360\u636e\u7f51\u7edc\u5c06\u573a\u666f\u8868\u793a\u4e3a\u5bc6\u96c6\u76843D\u4f53\u7d20\u7f51\u683c\u3002\u6bcf\u4e2a\u4f53\u7d20\uff08\u4e00\u4e2a\u5c0f\u7acb\u65b9\u4f53\u7a7a\u95f4\uff0c\u4f8b\u59820.2m \u00d7 0.2m \u00d7 0.2m\uff09\u88ab\u5206\u7c7b\u4e3a\u7a7a\u95f2\u3001\u5360\u636e\u6216\u672a\u77e5\uff0c\u5e76\u53ef\u9009\u62e9\u8d4b\u4e88\u8bed\u4e49\u6807\u7b7e\uff08\u9053\u8def\u3001\u4eba\u884c\u9053\u3001\u8f66\u8f86\u3001\u690d\u88ab\u7b49\uff09\u3002</p> </li> <li> <p>\u8fd9\u610f\u5473\u7740\u4ece\u4ee5\u7269\u4f53\u4e3a\u4e2d\u5fc3\u7684\u611f\u77e5\uff08\"\u68c0\u6d4b\u6c7d\u8f66\"\uff09\u8f6c\u5411\u4ee5\u573a\u666f\u4e3a\u4e2d\u5fc3\u7684\u611f\u77e5\uff08\"3D\u7a7a\u95f4\u7684\u54ea\u4e9b\u90e8\u5206\u88ab\u5360\u636e\uff1f\"\uff09\u3002\u4f18\u52bf\u5728\u4e8e\u901a\u7528\u6027\uff1a\u7cfb\u7edf\u4e0d\u9700\u8981\u9884\u5b9a\u4e49\u5bf9\u8c61\u7c7b\u522b\u5217\u8868\u6765\u907f\u514d\u4e0e\u4efb\u610f\u969c\u788d\u7269\u78b0\u649e\u3002</p> </li> <li> <p>\u4ece\u67b6\u6784\u4e0a\u770b\uff0c\u5360\u636e\u7f51\u7edc\u63a5\u6536\u4f20\u611f\u5668\u8f93\u5165\uff08\u76f8\u673a\u3001LiDAR\u6216\u4e24\u8005\uff09\uff0c\u5c06\u5176\u7f16\u7801\u4e3a3D\u7279\u5f81\u4f53\u79ef\uff0c\u5e76\u9884\u6d4b\u6bcf\u4e2a\u4f53\u7d20\u7684\u6807\u7b7e\u30023D\u7279\u5f81\u4f53\u79ef\u901a\u5e38\u901a\u8fc7\u5c062D\u7279\u5f81\u63d0\u5347\u52303D\uff08\u7c7b\u4f3c\u4e8eBEV\u6784\u5efa\u4f46\u6269\u5c55\u5230\u5782\u76f4\u65b9\u5411\uff09\u6765\u6784\u5efa\uff0c\u7136\u540e\u4f7f\u75283D\u5377\u79ef\u6216\u7a00\u758f\u5377\u79ef\u8fdb\u884c\u5904\u7406\u3002</p> </li> <li> <p>TPVFormer\uff08\u4e09\u89c6\u89d2\uff09\u901a\u8fc7\u5c063D\u4f53\u79ef\u5206\u89e3\u4e3a\u4e09\u4e2a\u6b63\u4ea4\u5e73\u9762\uff08\u4fef\u89c6\u56fe\u3001\u524d\u89c6\u56fe\u3001\u4fa7\u89c6\u56fe\uff09\u6765\u907f\u514d\u5b8c\u65743D\u6ce8\u610f\u529b\u7684\u7acb\u65b9\u7ea7\u8ba1\u7b97\u6210\u672c\u3002\u6bcf\u4e2a\u5e73\u9762\u4f7f\u75282D\u6ce8\u610f\u529b\uff0c\u5176\u7279\u5f81\u5728\u6bcf\u4e2a\u4f53\u7d20\u5904\u7ec4\u5408\u3002\u8fd9\u8ba9\u4eba\u60f3\u8d77SVD\u5982\u4f55\u5c06\u77e9\u9635\u5206\u89e3\u4e3a\u66f4\u7b80\u5355\u7684\u56e0\u5b50\uff08\u7b2c2\u7ae0\uff09\uff1a\u5c06\u4e00\u4e2a\u56f0\u96be\u76843D\u95ee\u9898\u5206\u89e3\u4e3a\u53ef\u7ba1\u7406\u76842D\u90e8\u5206\u3002</p> </li> <li> <p>\u8f93\u51fa\u7684\u4f53\u7d20\u7f51\u683c\u76f4\u63a5\u544a\u8bc9\u89c4\u5212\u5668\u54ea\u4e9b\u7a7a\u95f4\u533a\u57df\u662f\u5b89\u5168\u7684\u3001\u54ea\u4e9b\u4e0d\u662f\uff0c\u4f7f\u5176\u6210\u4e3a\u611f\u77e5\u548c\u89c4\u5212\u4e4b\u95f4\u7684\u81ea\u7136\u63a5\u53e3\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/01.%20perception/#_7","title":"\u8f66\u9053\u68c0\u6d4b\u4e0e\u9053\u8def\u62d3\u6251","text":"<ul> <li> <p>\u5bf9\u4e8e\u5728\u7ed3\u6784\u5316\u9053\u8def\u4e0a\u884c\u9a76\u7684\u8f66\u8f86\uff0c\u7406\u89e3\u8f66\u9053\u51e0\u4f55\u81f3\u5173\u91cd\u8981\u3002\u7cfb\u7edf\u5fc5\u987b\u77e5\u9053\u8f66\u9053\u5728\u54ea\u91cc\u3001\u5982\u4f55\u5f2f\u66f2\u3001\u5728\u54ea\u91cc\u5408\u5e76\u548c\u5206\u53c9\uff0c\u4ee5\u53ca\u8f66\u8f86\u5904\u4e8e\u54ea\u6761\u8f66\u9053\u3002</p> </li> <li> <p>\u7ecf\u5178\u65b9\u6cd5\u5c06\u53c2\u6570\u66f2\u7ebf\u62df\u5408\u5230\u68c0\u6d4b\u5230\u7684\u8f66\u9053\u6807\u7ebf\u4e0a\u3002\u5e38\u7528\u7684\u6a21\u578b\u662f\u4e09\u6b21\u591a\u9879\u5f0f\uff1a</p> </li> </ul> \\[x(y) = a_0 + a_1 y + a_2 y^2 + a_3 y^3\\] <ul> <li> <p>\u5176\u4e2d\\(y\\)\u662f\u524d\u65b9\u7eb5\u5411\u8ddd\u79bb\uff0c\\(x\\)\u662f\u6a2a\u5411\u504f\u79fb\u3002\u8fd9\u662f\u591a\u9879\u5f0f\u8fd1\u4f3c\uff08\u56de\u987e\u7b2c3\u7ae0\u7684\u6cf0\u52d2\u7ea7\u6570\uff09\uff0c\u9009\u62e9\u5b83\u662f\u56e0\u4e3a\u9053\u8def\u662f\u5e73\u6ed1\u66f2\u7ebf\uff0c\u5f88\u597d\u5730\u7531\u4f4e\u6b21\u591a\u9879\u5f0f\u63cf\u8ff0\u3002\u7cfb\u6570\u901a\u8fc7\u68c0\u6d4b\u5230\u7684\u8f66\u9053\u70b9\u4e0a\u7684\u6700\u5c0f\u4e8c\u4e58\u56de\u5f52\u4f30\u8ba1\u5f97\u51fa\u3002</p> </li> <li> <p>\u73b0\u4ee3\u65b9\u6cd5\u4f7f\u7528\u795e\u7ecf\u7f51\u7edc\u76f4\u63a5\u68c0\u6d4b\u8f66\u9053\u3002LaneNet\u5c06\u6bcf\u6761\u8f66\u9053\u89c6\u4e3a\u4e00\u4e2a\u5b9e\u4f8b\uff0c\u4f7f\u7528\u5d4c\u5165\u5206\u652f\u5bf9\u5c5e\u4e8e\u540c\u4e00\u6761\u8f66\u9053\u7684\u50cf\u7d20\u8fdb\u884c\u5206\u7ec4\uff0c\u7136\u540e\u8fdb\u884c\u66f2\u7ebf\u62df\u5408\u3002GANet\u4f7f\u7528\u57fa\u4e8e\u56fe\u7684\u65b9\u6cd5\uff0c\u5c06\u8f66\u9053\u62d3\u6251\u8868\u793a\u4e3a\u6709\u5411\u56fe\uff0c\u5176\u4e2d\u8282\u70b9\u662f\u8f66\u9053\u70b9\uff0c\u8fb9\u7f16\u7801\u8fde\u63a5\u5173\u7cfb\uff08\u54ea\u4e9b\u8f66\u9053\u5728\u4ea4\u53c9\u53e3\u5408\u5e76\u3001\u5206\u53c9\u6216\u8fde\u63a5\uff09\u3002</p> </li> <li> <p>\u9053\u8def\u62d3\u6251\u8d85\u8d8a\u4e86\u5355\u4e2a\u8f66\u9053\u66f2\u7ebf\uff0c\u6355\u83b7\u5b8c\u6574\u7ed3\u6784\uff1a\u8f66\u9053\u4e4b\u95f4\u5982\u4f55\u8fde\u63a5\uff0c\u54ea\u4e9b\u8f66\u9053\u5141\u8bb8\u5de6\u8f6c\uff0c\u9ad8\u901f\u516c\u8def\u5165\u53e3\u531d\u9053\u5728\u54ea\u91cc\u6c47\u5165\u3002\u8fd9\u88ab\u5efa\u6a21\u4e3a\u6709\u5411\u56fe\uff0c\u4ea4\u53c9\u53e3\u662f\u8282\u70b9\uff0c\u8f66\u9053\u6bb5\u662f\u5e26\u6709\u5c5e\u6027\uff08\u9650\u901f\u3001\u8f66\u9053\u7c7b\u578b\u3001\u8f6c\u5f2f\u9650\u5236\uff09\u7684\u8fb9\u3002</p> </li> <li> <p>\u56fe\u7ed3\u6784\u5bf9\u8def\u7ebf\u89c4\u5212\u81f3\u5173\u91cd\u8981\uff1a\u89c4\u5212\u5668\u9700\u8981\u77e5\u9053\u7684\u4e0d\u4ec5\u662f\"\u8f66\u9053\u5728\u54ea\u91cc\"\uff0c\u8fd8\u6709\"\u54ea\u6761\u8f66\u9053\u5e8f\u5217\u80fd\u5230\u8fbe\u76ee\u7684\u5730\"\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/01.%20perception/#_8","title":"\u8bed\u4e49\u5efa\u56fe","text":"<ul> <li> <p>\u611f\u77e5\u5e76\u4e0d\u6b62\u4e8e\u68c0\u6d4b\u5355\u5e27\u4e2d\u7684\u7269\u4f53\u3002\u968f\u7740\u65f6\u95f4\u7684\u63a8\u79fb\uff0c\u81ea\u4e3b\u7cfb\u7edf\u6784\u5efa\u4e00\u4e2a\u8bed\u4e49\u5730\u56fe\uff1a\u5bf9\u5176\u73af\u5883\u7684\u6301\u4e45\u5316\u3001\u7ed3\u6784\u5316\u8868\u793a\uff0c\u79ef\u7d2f\u6765\u81ea\u591a\u6b21\u89c2\u6d4b\u7684\u4fe1\u606f\u3002</p> </li> <li> <p>\u6700\u7b80\u5355\u7684\u60c5\u51b5\u4e0b\uff0c\u8bed\u4e49\u5730\u56fe\u662f\u4e00\u4e2a2D\u7f51\u683c\uff08\u5360\u636e\u7f51\u683c\uff09\uff0c\u6bcf\u4e2a\u5355\u5143\u5b58\u50a8\u88ab\u5360\u636e\u7684\u6982\u7387\u3002\u968f\u7740\u673a\u5668\u4eba\u79fb\u52a8\u5e76\u901a\u8fc7\u4f20\u611f\u5668\u626b\u63cf\uff0c\u5b83\u4f7f\u7528\u8d1d\u53f6\u65af\u66f4\u65b0\u6765\u66f4\u65b0\u8fd9\u4e9b\u6982\u7387\uff1a</p> </li> </ul> \\[P(\\\\text{\u5360\u636e} \\\\mid z_{1:t}) = \\\\frac{P(z_t \\\\mid \\\\text{\u5360\u636e}) \\\\cdot P(\\\\text{\u5360\u636e} \\\\mid z_{1:t-1})}{P(z_t)}\\] <ul> <li>\u8fd9\u5c31\u662f\u8d1d\u53f6\u65af\u5b9a\u7406\u7684\u5b9e\u9645\u5e94\u7528\uff08\u6765\u81ea\u7b2c5\u7ae0\uff09\uff1a\u6bcf\u6b21\u65b0\u7684\u6d4b\u91cf\\(z_t\\)\u66f4\u65b0\u5bf9\u6bcf\u4e2a\u5355\u5143\u7684\u5148\u9a8c\u4fe1\u5ff5\u3002\u901a\u5e38\u4f7f\u7528\u5bf9\u6570\u51e0\u7387\u8868\u793a\u6765\u907f\u514d\u4e58\u4ee5\u8bb8\u591a\u5c0f\u6982\u7387\u5e26\u6765\u7684\u6570\u503c\u95ee\u9898\uff1a</li> </ul> \\[l_t = l_{t-1} + \\\\log \\\\frac{P(z_t \\\\mid \\\\text{\u5360\u636e})}{P(z_t \\\\mid \\\\text{\u7a7a\u95f2})}\\] <ul> <li> <p>\u5bf9\u6570\u51e0\u7387\u76f8\u52a0\u7b49\u4ef7\u4e8e\u6982\u7387\u76f8\u4e58\uff08\u56de\u987e\\(\\\\log(ab) = \\\\log a + \\\\log b\\)\uff09\uff0c\u7d2f\u52a0\u548c\u81ea\u7136\u5730\u968f\u65f6\u95f4\u79ef\u7d2f\u8bc1\u636e\u3002</p> </li> <li> <p>\u66f4\u4e30\u5bcc\u7684\u5730\u56fe\u4e3a\u6bcf\u4e2a\u5355\u5143\u5206\u914d\u8bed\u4e49\u6807\u7b7e\uff08\u9053\u8def\u3001\u4eba\u884c\u9053\u3001\u5efa\u7b51\u3001\u690d\u88ab\uff09\uff0c\u5e76\u53ef\u6269\u5c55\u52303D\u3002\u8fd9\u4e0e\u5360\u636e\u7f51\u7edc\u5bc6\u5207\u76f8\u5173\uff0c\u4f46\u5f3a\u8c03\u6301\u4e45\u6027\u548c\u65f6\u95f4\u805a\u5408\u800c\u975e\u5355\u5e27\u9884\u6d4b\u3002</p> </li> <li> <p>SLAM\uff08\u540c\u65f6\u5b9a\u4f4d\u4e0e\u5efa\u56fe\uff09\uff0c\u5728\u7b2c8\u7ae0\u4e2d\u4ecb\u7ecd\u8fc7\uff0c\u662f\u5728\u6784\u5efa\u5730\u56fe\u7684\u540c\u65f6\u8ddf\u8e2a\u673a\u5668\u4eba\u5728\u5730\u56fe\u4e2d\u7684\u4f4d\u7f6e\u7684\u7b97\u6cd5\u3002\u89c6\u89c9-\u60ef\u6027SLAM\u878d\u5408\u76f8\u673a\u548cIMU\u6570\u636e\uff1bLiDAR SLAM\u4f7f\u7528\u70b9\u4e91\u914d\u51c6\u3002\u611f\u77e5\u6d41\u7a0b\u5c06\u68c0\u6d4b\u7ed3\u679c\u548c\u6df1\u5ea6\u4f30\u8ba1\u8f93\u5165SLAM\u7cfb\u7edf\uff0c\u7531\u540e\u8005\u7ef4\u62a4\u5168\u5c40\u5730\u56fe\u3002</p> </li> <li> <p>\u73b0\u4ee3\u65b9\u6cd5\u8d8a\u6765\u8d8a\u591a\u5730\u4f7f\u7528\u795e\u7ecf\u9690\u5f0f\u8868\u793a\uff08\u5982\u7b2c8\u7ae0\u4e2d\u7684NeRF\uff09\u6765\u6784\u5efa\u53ef\u5728\u4efb\u4f553D\u70b9\u67e5\u8be2\u7684\u5bc6\u96c6\u3001\u903c\u771f\u5730\u56fe\u3002\u8fd9\u4e9b\u795e\u7ecf\u5730\u56fe\u5c06\u6574\u4e2a\u573a\u666f\u7684\u538b\u7f29\u8868\u793a\u5b58\u50a8\u5728\u7f51\u7edc\u6743\u91cd\u4e2d\uff0c\u652f\u6301\u65b0\u89c6\u89d2\u5408\u6210\u548c\u8be6\u7ec6\u7a7a\u95f4\u67e5\u8be2\u7b49\u4efb\u52a1\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/01.%20perception/#colabnotebook","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216notebook\uff09","text":"<ol> <li> <p>\u4f7f\u7528\u6295\u5f71\u77e9\u9635\u5c063D LiDAR\u70b9\u6295\u5f71\u52302D\u76f8\u673a\u56fe\u50cf\u4e0a\u3002\u53ef\u89c6\u5316\u54ea\u4e9b\u70b9\u843d\u5728\u56fe\u50cf\u8fb9\u754c\u5185\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u6a21\u62df3D LiDAR\u70b9\uff08x=\u5411\u524d\uff0cy=\u5411\u5de6\uff0cz=\u5411\u4e0a\uff09\nrng = jax.random.PRNGKey(0)\npoints_3d = jax.random.uniform(rng, (200, 3), minval=jnp.array([5, -10, -2]),\n                                maxval=jnp.array([50, 10, 3]))\n\n# \u76f8\u673a\u5185\u53c2\u77e9\u9635\uff08\u7126\u8ddd500\uff0c\u56fe\u50cf\u4e2d\u5fc3320x240\uff09\nK = jnp.array([[500, 0, 320],\n               [0, 500, 240],\n               [0,   0,   1.0]])\n\n# \u5916\u53c2\uff1aLiDAR\u5230\u76f8\u673a\uff08\u5355\u4f4d\u65cb\u8f6c\uff0c\u5c0f\u5e73\u79fb\uff09\nR = jnp.eye(3)\nt = jnp.array([0.0, 0.0, -0.5])\n\n# \u6295\u5f71\uff1ap_cam = K @ (R @ p_lidar + t)\np_cam = (R @ points_3d.T).T + t\np_img = (K @ p_cam.T).T\np_img = p_img[:, :2] / p_img[:, 2:3]  # \u9664\u4ee5Z\n\n# \u8fc7\u6ee4\u76f8\u673a\u524d\u65b9\u4e14\u5728\u56fe\u50cf\u5185\u7684\u70b9\nmask = (p_cam[:, 2] &gt; 0) &amp; (p_img[:, 0] &gt; 0) &amp; (p_img[:, 0] &lt; 640) &amp; \\\n       (p_img[:, 1] &gt; 0) &amp; (p_img[:, 1] &lt; 480)\ndepth = p_cam[mask, 2]\n\nplt.figure(figsize=(8, 5))\nplt.scatter(p_img[mask, 0], p_img[mask, 1], c=depth, cmap=\"viridis\", s=5)\nplt.colorbar(label=\"\u6df1\u5ea6 (\u7c73)\")\nplt.xlim(0, 640); plt.ylim(480, 0)\nplt.title(\"\u6295\u5f71\u5230\u76f8\u673a\u56fe\u50cf\u4e0a\u7684LiDAR\u70b9\")\nplt.xlabel(\"u (\u50cf\u7d20)\"); plt.ylabel(\"v (\u50cf\u7d20)\")\nplt.show()\n</code></pre></p> </li> <li> <p>\u4f7f\u7528\u8d1d\u53f6\u65af\u5bf9\u6570\u51e0\u7387\u66f4\u65b0\u6784\u5efa\u4e00\u4e2a\u7b80\u5355\u76842D\u5360\u636e\u7f51\u683c\u3002\u6a21\u62df\u4e00\u4e2a\u8ddd\u79bb\u4f20\u611f\u5668\u626b\u63cf\u73af\u5883\uff0c\u89c2\u5bdf\u5730\u56fe\u7684\u751f\u6210\u8fc7\u7a0b\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u7f51\u683c\u8bbe\u7f6e\uff1a50x50\u4e2a\u5355\u5143\uff0c\u6bcf\u4e2a0.2\u7c73\ngrid_size = 50\nlog_odds = jnp.zeros((grid_size, grid_size))\n\n# \u4f20\u611f\u5668\u6a21\u578b\uff1a\u5bf9\u6570\u51e0\u7387\u66f4\u65b0\u503c\nl_occ = 0.85   # \u547d\u4e2d\u610f\u5473\u7740\u5360\u636e\u7684\u7f6e\u4fe1\u5ea6\nl_free = -0.4  # \u7a7f\u8fc7\u610f\u5473\u7740\u7a7a\u95f2\u7684\u7f6e\u4fe1\u5ea6\n\n# \u6a21\u62df\u969c\u788d\u7269\uff1a\u4ece(5,20)\u5230(5,30)\u7684\u5899\uff08\u7f51\u683c\u5750\u6807\uff09\nwall_y = jnp.arange(20, 30)\n\n# \u673a\u5668\u4eba\u5728(25, 25)\uff0c\u5411\u5916\u626b\u63cf\nrobot = jnp.array([25, 25])\n\nfor angle_deg in range(0, 360, 5):\n    angle = jnp.radians(angle_deg)\n    direction = jnp.array([jnp.cos(angle), jnp.sin(angle)])\n\n    for step in range(1, 25):\n        cell = (robot + direction * step).astype(int)\n        r, c = int(cell[0]), int(cell[1])\n        if r &lt; 0 or r &gt;= grid_size or c &lt; 0 or c &gt;= grid_size:\n            break\n\n        # \u68c0\u67e5\u6b64\u5355\u5143\u662f\u5426\u4e3a\u5899\n        is_wall = (r == 5) and (c &gt;= 20) and (c &lt; 30)\n        if is_wall:\n            log_odds = log_odds.at[r, c].add(l_occ)\n            break\n        else:\n            log_odds = log_odds.at[r, c].add(l_free)\n\n# \u5c06\u5bf9\u6570\u51e0\u7387\u8f6c\u6362\u4e3a\u6982\u7387\nprob = 1.0 / (1.0 + jnp.exp(-log_odds))\n\nplt.figure(figsize=(6, 6))\nplt.imshow(prob.T, origin=\"lower\", cmap=\"RdYlGn_r\", vmin=0, vmax=1)\nplt.colorbar(label=\"P(\u88ab\u5360\u636e)\")\nplt.plot(25, 25, \"b*\", markersize=10, label=\"\u673a\u5668\u4eba\")\nplt.legend()\nplt.title(\"\u8d1d\u53f6\u65af\u66f4\u65b0\u751f\u6210\u76842D\u5360\u636e\u7f51\u683c\")\nplt.show()\n</code></pre></p> </li> <li> <p>\u4f7f\u7528\u89c6\u5dee\u4ece\u7acb\u4f53\u56fe\u50cf\u5bf9\u8ba1\u7b97\u6df1\u5ea6\u3002\u6a21\u62df\u4e24\u4e2a\u76f8\u673a\u89c6\u89d2\u4e0b\u76843D\u70b9\uff0c\u8ba1\u7b97\u89c6\u5dee\u5e76\u6062\u590d\u6df1\u5ea6\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\n# \u76f8\u673a\u53c2\u6570\nf = 500.0     # \u7126\u8ddd\uff08\u50cf\u7d20\uff09\nb = 0.12      # \u57fa\u7ebf\uff08\u7c73\uff0c12\u5398\u7c73\uff09\n\n# \u5df2\u77e5\u6df1\u5ea6\u76843D\u70b9\ndepths_true = jnp.array([5.0, 10.0, 20.0, 50.0, 100.0])\n\n# \u89c6\u5dee = f * b / Z\ndisparities = f * b / depths_true\n\n# \u4ece\u89c6\u5dee\u6062\u590d\u6df1\u5ea6\ndepths_recovered = f * b / disparities\n\nfor z, d, z_r in zip(depths_true, disparities, depths_recovered):\n    print(f\"\u771f\u5b9e\u6df1\u5ea6: {z:6.1f}\u7c73  \u89c6\u5dee: {d:6.2f}\u50cf\u7d20  \u6062\u590d\u503c: {z_r:6.1f}\u7c73\")\n\n# \u6ce8\u610f\uff1a\u89c6\u5dee\u4e0e\u6df1\u5ea6\u6210\u53cd\u6bd4\n# \u8fd1\u5904\u7269\u4f53\u89c6\u5dee\u5927\uff0c\u8fdc\u5904\u7269\u4f53\u89c6\u5dee\u5c0f\n# \u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48\u7acb\u4f53\u89c6\u89c9\u5728\u8fd1\u8ddd\u79bb\u6700\u51c6\u786e\n</code></pre></p> </li> </ol>"},{"location":"chapter%2011%3A%20autonomous%20systems/02.%20robot%20learning/","title":"\u673a\u5668\u4eba\u5b66\u4e60","text":"<p>\u673a\u5668\u4eba\u5b66\u4e60\u5f25\u5408\u4e86\u7b97\u6cd5\u4e0e\u7269\u7406\u884c\u52a8\u4e4b\u95f4\u7684\u9e3f\u6c9f\u3002\u672c\u7ae0\u6db5\u76d6\u8fd0\u52a8\u5b66\u3001\u52a8\u529b\u5b66\u3001\u7ecf\u5178\u63a7\u5236\u3001\u6a21\u4eff\u5b66\u4e60\u3001\u4eff\u771f\u5230\u73b0\u5b9e\u8fc1\u79fb\u3001\u64cd\u4f5c\u3001\u79fb\u52a8\u548c\u5b89\u5168\u2014\u2014\u8fd9\u4e9b\u6280\u672f\u8d4b\u4e88\u673a\u5668\u4eba\u5728\u73b0\u5b9e\u4e16\u754c\u4e2d\u79fb\u52a8\u3001\u6293\u53d6\u3001\u884c\u8d70\u548c\u4ea4\u4e92\u7684\u80fd\u529b\u3002</p> <ul> <li> <p>\u5728\u524d\u9762\u7684\u7ae0\u8282\u4e2d\uff0c\u6211\u4eec\u7814\u7a76\u4e86\u5982\u4f55\u611f\u77e5\u4e16\u754c\uff08\u7b2c8\u7ae0\uff0c\u7b2c11\u7ae0\u6587\u4ef61\uff09\u4ee5\u53ca\u5982\u4f55\u4ece\u6570\u636e\u4e2d\u5b66\u4e60\uff08\u7b2c6\u7ae0\uff09\u3002\u4f46\u611f\u77e5\u548c\u5b66\u4e60\u8fd8\u4e0d\u591f\u3002\u673a\u5668\u4eba\u5fc5\u987b\u884c\u52a8\uff1a\u79fb\u52a8\u624b\u81c2\u6293\u53d6\u676f\u5b50\u3001\u5728\u4e0d\u5e73\u5766\u7684\u5730\u5f62\u4e0a\u884c\u8d70\u3001\u6216\u5728\u4ed3\u5e93\u4e2d\u5bfc\u822a\u3002\u8fd9\u5c31\u662f\u673a\u5668\u4eba\u5b66\u4e60\u7684\u7528\u6b66\u4e4b\u5730\u3002</p> </li> <li> <p>\u6838\u5fc3\u6311\u6218\u5728\u4e8e\u7269\u7406\u4e16\u754c\u662f\u8fde\u7eed\u7684\u3001\u9ad8\u7ef4\u7684\u3001\u63a5\u89e6\u4e30\u5bcc\u7684\u4e14\u4e0d\u5bbd\u5bb9\u7684\u3002\u56fe\u50cf\u8bc6\u522b\u4e2d\u7684\u5206\u7c7b\u9519\u8bef\u53ea\u662f\u6807\u7b7e\u9519\u8bef\uff0c\u800c\u673a\u5668\u4eba\u5b66\u4e2d\u7684\u63a7\u5236\u9519\u8bef\u5219\u610f\u5473\u7740\u673a\u5668\u4eba\u635f\u574f\u6216\u7269\u4f53\u6389\u843d\u3002\u4e24\u8005\u7684\u4ee3\u4ef7\u622a\u7136\u4e0d\u540c\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/02.%20robot%20learning/#_2","title":"\u673a\u5668\u4eba\u8fd0\u52a8\u5b66","text":"<ul> <li> <p>\u8fd0\u52a8\u5b66\u63cf\u8ff0\u8fd0\u52a8\u7684\u51e0\u4f55\u5173\u7cfb\uff0c\u4e0d\u8003\u8651\u529b\u3002\u673a\u5668\u4eba\u624b\u81c2\u662f\u7531\u5173\u8282\u8fde\u63a5\u7684\u521a\u6027\u8fde\u6746\u7ec4\u6210\u7684\u94fe\u6761\u3002\u6bcf\u4e2a\u5173\u8282\u6709\u4e00\u4e2a\u81ea\u7531\u5ea6\uff08DoF\uff09\uff1a\u8981\u4e48\u65cb\u8f6c\uff08\u65cb\u8f6c\u5173\u8282\uff09\uff0c\u8981\u4e48\u6ed1\u52a8\uff08\u68f1\u67f1\u5173\u8282\uff09\u3002</p> </li> <li> <p>\u673a\u5668\u4eba\u7684\u6784\u578b\u662f\u6240\u6709\u5173\u8282\u89d2\u5ea6\uff08\u6216\u4f4d\u79fb\uff09\u7684\u96c6\u5408 \\(\\\\mathbf{q} = [q_1, q_2, \\\\ldots, q_n]^T\\)\u3002\u8fd9\u4e2a\u5411\u91cf\u4f4d\u4e8e\u5173\u8282\u7a7a\u95f4\uff08\u6216\u6784\u578b\u7a7a\u95f4\uff09\u4e2d\uff0c\u8fd9\u662f\u4e00\u4e2a\\(n\\)\u7ef4\u7a7a\u95f4\uff0c\u6bcf\u4e2a\u8f74\u5bf9\u5e94\u4e00\u4e2a\u5173\u8282\u3002\u4e00\u4e2a6\u81ea\u7531\u5ea6\u673a\u5668\u4eba\u624b\u81c2\u6709\u4e00\u4e2a6\u7ef4\u6784\u578b\u7a7a\u95f4\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u6b63\u5411\u8fd0\u52a8\u5b66\uff08FK\uff09\u6839\u636e\u7ed9\u5b9a\u7684\u5173\u8282\u89d2\u5ea6\u8ba1\u7b97\u672b\u7aef\u6267\u884c\u5668\uff08\"\u624b\"\uff09\u7684\u4f4d\u7f6e\u548c\u59ff\u6001\u3002\u8fd9\u662f\u4e00\u4e2a\u4ece\u5173\u8282\u7a7a\u95f4\u6620\u5c04\u5230\u4efb\u52a1\u7a7a\u95f4\uff08\u672b\u7aef\u6267\u884c\u5668\u76843D\u4f4d\u7f6e\u548c\u59ff\u6001\uff0c\u4e5f\u79f0\u4e3a\u7b1b\u5361\u5c14\u7a7a\u95f4\uff09\u7684\u51fd\u6570 \\(\\\\mathbf{x} = f(\\\\mathbf{q})\\)\u3002</p> </li> <li> <p>\u6bcf\u4e2a\u5173\u8282\u7531\u4e00\u4e2a\\(4 \\\\times 4\\)\u9f50\u6b21\u53d8\u6362\u77e9\u9635\u63cf\u8ff0\uff08\u56de\u987e\u7b2c2\u7ae0\u7684\u4eff\u5c04\u53d8\u6362\uff09\u3002Denavit-Hartenberg\uff08DH\uff09\u7ea6\u5b9a\u7528\u56db\u4e2a\u53c2\u6570\u53c2\u6570\u5316\u6bcf\u4e2a\u5173\u8282\uff1a\u8fde\u6746\u957f\u5ea6\\(a\\)\u3001\u8fde\u6746\u626d\u8f6c\u89d2\\(\\\\alpha\\)\u3001\u8fde\u6746\u504f\u79fb\\(d\\)\u548c\u5173\u8282\u89d2\u5ea6\\(\\\\theta\\)\u3002\u5173\u8282\\(i\\)\u7684\u53d8\u6362\u4e3a\uff1a</p> </li> </ul> \\[T_i = \\\\begin{bmatrix} \\\\cos\\\\theta_i &amp; -\\\\sin\\\\theta_i \\\\cos\\\\alpha_i &amp; \\\\sin\\\\theta_i \\\\sin\\\\alpha_i &amp; a_i \\\\cos\\\\theta_i \\\\\\\\ \\\\sin\\\\theta_i &amp; \\\\cos\\\\theta_i \\\\cos\\\\alpha_i &amp; -\\\\cos\\\\theta_i \\\\sin\\\\alpha_i &amp; a_i \\\\sin\\\\theta_i \\\\\\\\ 0 &amp; \\\\sin\\\\alpha_i &amp; \\\\cos\\\\alpha_i &amp; d_i \\\\\\\\ 0 &amp; 0 &amp; 0 &amp; 1 \\\\end{bmatrix}\\] <ul> <li> <p>\u5b8c\u6574\u7684\u6b63\u5411\u8fd0\u52a8\u5b66\u662f\u6240\u6709\u5173\u8282\u53d8\u6362\u7684\u4e58\u79ef\uff1a\\(T_{0 \\\\to n} = T_1 T_2 \\\\cdots T_n\\)\u3002\u8fd9\u662f\u77e9\u9635\u4e58\u6cd5\u94fe\u5f0f\u53d8\u6362\uff08\u7b2c2\u7ae0\uff09\uff1a\u6bcf\u4e2a\u5173\u8282\u7684\u53d8\u6362\u4f9d\u6b21\u5e94\u7528\uff0c\u5c06\u5750\u6807\u7cfb\u4ece\u57fa\u5ea7\u65cb\u8f6c\u548c\u5e73\u79fb\u5230\u672b\u7aef\u6267\u884c\u5668\u3002</p> </li> <li> <p>\u9006\u5411\u8fd0\u52a8\u5b66\uff08IK\uff09\u662f\u53cd\u5411\u95ee\u9898\uff1a\u7ed9\u5b9a\u671f\u671b\u7684\u672b\u7aef\u6267\u884c\u5668\u59ff\u6001\\(\\\\mathbf{x}^*\\)\uff0c\u6c42\u5173\u8282\u89d2\u5ea6\\(\\\\mathbf{q}\\)\u4f7f\u5f97\\(f(\\\\mathbf{q}) = \\\\mathbf{x}^*\\)\u3002\u8fd9\u8981\u96be\u5f97\u591a\uff0c\u56e0\u4e3a\uff1a</p> <ul> <li>\u6620\u5c04\u662f\u975e\u7ebf\u6027\u7684\uff08\u6d89\u53ca\u6b63\u5f26\u548c\u4f59\u5f26\uff09\u3002</li> <li>\u53ef\u80fd\u6709\u591a\u4e2a\u89e3\uff08\u4e0d\u540c\u7684\u624b\u81c2\u6784\u578b\u53ef\u4ee5\u5230\u8fbe\u540c\u4e00\u70b9\uff09\u3002</li> <li>\u53ef\u80fd\u6ca1\u6709\u89e3\uff08\u76ee\u6807\u8d85\u51fa\u53ef\u8fbe\u8303\u56f4\uff09\u3002</li> </ul> </li> <li> <p>\u89e3\u6790\u89e3\u53ea\u5b58\u5728\u4e8e\u7279\u5b9a\u7684\u673a\u5668\u4eba\u51e0\u4f55\u6784\u578b\u4e2d\u3002\u5bf9\u4e8e\u901a\u7528\u673a\u5668\u4eba\uff0cIK\u4f7f\u7528\u96c5\u53ef\u6bd4\u77e9\u9635\u8fed\u4ee3\u6c42\u89e3\u3002\u96c5\u53ef\u6bd4\u77e9\u9635\\(J(\\\\mathbf{q})\\)\u5c06\u5173\u8282\u89d2\u5ea6\u7684\u5fae\u5c0f\u53d8\u5316\u4e0e\u672b\u7aef\u6267\u884c\u5668\u4f4d\u7f6e\u7684\u5fae\u5c0f\u53d8\u5316\u8054\u7cfb\u8d77\u6765\uff08\u56de\u987e\u7b2c3\u7ae0\u7684\u96c5\u53ef\u6bd4\u77e9\u9635\uff09\uff1a</p> </li> </ul> \\[\\\\dot{\\\\mathbf{x}} = J(\\\\mathbf{q}) \\\\dot{\\\\mathbf{q}}\\] <ul> <li> <p>\u8981\u5c06\u672b\u7aef\u6267\u884c\u5668\u79fb\u52a8\u4e00\u4e2a\u5c0f\u7684\u91cf\\(\\\\Delta \\\\mathbf{x}\\)\uff0c\u6211\u4eec\u9700\u8981\\(\\\\Delta \\\\mathbf{q} = J^{-1} \\\\Delta \\\\mathbf{x}\\)\uff08\u5f53\\(J\\)\u4e0d\u662f\u65b9\u9635\u65f6\u4f7f\u7528\u4f2a\u9006\\(J^+ \\\\Delta \\\\mathbf{x}\\)\uff09\u3002\u8fd9\u4e2a\u8fc7\u7a0b\u8fed\u4ee3\u8fdb\u884c\uff0c\u76f4\u5230\u672b\u7aef\u6267\u884c\u5668\u5230\u8fbe\u76ee\u6807\uff0c\u672c\u8d28\u4e0a\u5c31\u662f\u5c06\u725b\u987f\u6cd5\uff08\u7b2c3\u7ae0\uff09\u5e94\u7528\u4e8e\u8fd0\u52a8\u5b66\u65b9\u7a0b\u3002</p> </li> <li> <p>\u5728\u5947\u5f02\u70b9\u9644\u8fd1\uff0c\u96c5\u53ef\u6bd4\u77e9\u9635\u7684\u79e9\u4e0b\u964d\uff08\u67d0\u4e9b\u5217\u53d8\u5f97\u7ebf\u6027\u76f8\u5173\uff0c\u5982\u6211\u4eec\u5728\u7b2c2\u7ae0\u4e2d\u7814\u7a76\u7684\uff09\u3002\u7269\u7406\u4e0a\u8fd9\u610f\u5473\u7740\u673a\u5668\u4eba\u5931\u53bb\u4e00\u4e2a\u81ea\u7531\u5ea6\uff1a\u65e0\u8bba\u5173\u8282\u79fb\u52a8\u591a\u5feb\uff0c\u672b\u7aef\u6267\u884c\u5668\u90fd\u65e0\u6cd5\u5728\u67d0\u4e9b\u65b9\u5411\u4e0a\u79fb\u52a8\u3002\u4f2a\u9006\u5728\u5947\u5f02\u70b9\u9644\u8fd1\u4f1a\u7206\u70b8\uff0c\u56e0\u6b64\u4f7f\u7528\u963b\u5c3c\u6700\u5c0f\u4e8c\u4e58\u6cd5\uff08\u52a0\u5165\u6b63\u5219\u5316\u9879\\(\\\\lambda^2 I\\)\uff09\uff1a</p> </li> </ul> \\[\\\\Delta \\\\mathbf{q} = J^T(JJ^T + \\\\lambda^2 I)^{-1} \\\\Delta \\\\mathbf{x}\\]"},{"location":"chapter%2011%3A%20autonomous%20systems/02.%20robot%20learning/#_3","title":"\u52a8\u529b\u5b66\u4e0e\u63a7\u5236","text":"<ul> <li>\u52a8\u529b\u5b66\u5c06\u529b\u5f15\u5165\u753b\u9762\u3002\u673a\u5668\u4eba\u624b\u81c2\u7684\u8fd0\u52a8\u65b9\u7a0b\u9075\u5faa\u64cd\u4f5c\u81c2\u65b9\u7a0b\uff1a</li> </ul> \\[M(\\\\mathbf{q})\\\\ddot{\\\\mathbf{q}} + C(\\\\mathbf{q}, \\\\dot{\\\\mathbf{q}})\\\\dot{\\\\mathbf{q}} + \\\\mathbf{g}(\\\\mathbf{q}) = \\\\boldsymbol{\\\\tau}\\] <ul> <li> <p>\u5176\u4e2d\\(M(\\\\mathbf{q})\\)\u662f\u8d28\u91cf\uff08\u60ef\u6027\uff09\u77e9\u9635\uff0c\\(C(\\\\mathbf{q}, \\\\dot{\\\\mathbf{q}})\\)\u6355\u83b7\u79d1\u91cc\u5965\u5229\u529b\u548c\u79bb\u5fc3\u529b\u6548\u5e94\uff0c\\(\\\\mathbf{g}(\\\\mathbf{q})\\)\u662f\u91cd\u529b\u5411\u91cf\uff0c\\(\\\\boldsymbol{\\\\tau}\\)\u662f\u5173\u8282\u529b\u77e9\u5411\u91cf\uff08\u63a7\u5236\u8f93\u5165\uff09\u3002\u8fd9\u662f\u4e00\u4e2a\u4e8c\u9636\u5fae\u5206\u65b9\u7a0b\u7ec4\uff0c\u6bcf\u4e2a\u5173\u8282\u4e00\u4e2a\u65b9\u7a0b\u3002</p> </li> <li> <p>\u8d28\u91cf\u77e9\u9635\\(M\\)\u603b\u662f\u5bf9\u79f0\u6b63\u5b9a\u7684\uff08\u56de\u987e\u7b2c2\u7ae0\uff0c\u6b63\u5b9a\u77e9\u9635\u4fdd\u8bc1\u552f\u4e00\u6700\u5c0f\u503c\uff0c\u5728\u8fd9\u91cc\u5b83\u786e\u4fdd\u7cfb\u7edf\u5bf9\u65bd\u52a0\u7684\u529b\u77e9\u6709\u53ef\u9884\u6d4b\u7684\u54cd\u5e94\uff09\u3002</p> </li> <li> <p>PID\u63a7\u5236\u662f\u673a\u5668\u4eba\u5b66\u4e2d\u4f7f\u7528\u6700\u5e7f\u6cdb\u7684\u63a7\u5236\u5668\u3002\u5bf9\u4e8e\u6bcf\u4e2a\u5173\u8282\uff0c\u5b83\u6839\u636e\u8bef\u5dee\\(e(t) = q_{\\\\text{\u671f\u671b}}(t) - q_{\\\\text{\u5b9e\u9645}}(t)\\)\u8ba1\u7b97\u529b\u77e9\uff1a</p> </li> </ul> \\[\\\\tau(t) = K_p e(t) + K_i \\\\int_0^t e(s) \\\\, ds + K_d \\\\dot{e}(t)\\] <ul> <li>\u4e09\u4e2a\u9879\u6709\u76f4\u89c2\u7684\u4f5c\u7528\uff1a<ul> <li>\u6bd4\u4f8b\u9879\uff08\\(K_p\\)\uff09\uff1a\u4e0e\u5f53\u524d\u8bef\u5dee\u6210\u6bd4\u4f8b\u5730\u6821\u6b63\u3002\u8bef\u5dee\u8d8a\u5927 \u2192 \u6821\u6b63\u8d8a\u5927\u3002\u5c31\u50cf\u5f39\u7c27\u5c06\u5173\u8282\u62c9\u5411\u76ee\u6807\u3002</li> <li>\u79ef\u5206\u9879\uff08\\(K_i\\)\uff09\uff1a\u7d2f\u79ef\u8fc7\u53bb\u7684\u8bef\u5dee\u4ee5\u6d88\u9664\u7a33\u6001\u504f\u5dee\u3002\u5982\u679c\u5173\u8282\u6301\u7eed\u6b20\u8c03\uff0c\u79ef\u5206\u9879\u4f1a\u79ef\u7d2f\u5e76\u63d0\u4f9b\u989d\u5916\u7684\u63a8\u529b\u3002</li> <li>\u5fae\u5206\u9879\uff08\\(K_d\\)\uff09\uff1a\u5bf9\u8bef\u5dee\u53d8\u5316\u7387\u4f5c\u51fa\u53cd\u5e94\uff0c\u63d0\u4f9b\u963b\u5c3c\u3002\u5b83\u968f\u7740\u8bef\u5dee\u51cf\u5c0f\u800c\u51cf\u7f13\u54cd\u5e94\uff0c\u9632\u6b62\u8fc7\u51b2\u548c\u9707\u8361\u3002</li> </ul> </li> </ul> <p></p> <ul> <li> <p>\u8c03\u6574\\(K_p, K_i, K_d\\)\u662f\u4e00\u79cd\u5e73\u8861\uff1a\\(K_p\\)\u592a\u5927\u4f1a\u5f15\u8d77\u9707\u8361\uff0c\\(K_d\\)\u592a\u5927\u4f1a\u4f7f\u7cfb\u7edf\u53cd\u5e94\u8fdf\u949d\uff0c\\(K_i\\)\u592a\u5927\u4f1a\u5bfc\u81f4\u79ef\u5206\u9971\u548c\uff08\u5728\u6301\u7eed\u8bef\u5dee\u671f\u95f4\u79ef\u5206\u65e0\u9650\u589e\u957f\uff09\u3002</p> </li> <li> <p>\u6a21\u578b\u9884\u6d4b\u63a7\u5236\uff08MPC\uff09\u5177\u6709\u524d\u77bb\u6027\u3002\u5728\u6bcf\u4e2a\u65f6\u95f4\u6b65\uff0c\u5b83\u6c42\u89e3\u4e00\u4e2a\u4f18\u5316\u95ee\u9898\uff1a\u627e\u5230\u672a\u6765\u63a7\u5236\u5e8f\u5217\uff0c\u5728\u6709\u9650\u65f6\u57df\u5185\u6700\u5c0f\u5316\u4ee3\u4ef7\u51fd\u6570\uff08\u4f8b\u5982\uff0c\u8ddf\u8e2a\u8bef\u5dee+\u63a7\u5236\u80fd\u91cf\uff09\uff0c\u5e76\u6ee1\u8db3\u52a8\u529b\u5b66\u6a21\u578b\u548c\u7ea6\u675f\u6761\u4ef6\u3002\u53ea\u5e94\u7528\u7b2c\u4e00\u4e2a\u63a7\u5236\u91cf\uff0c\u7136\u540e\u5728\u4e0b\u4e00\u4e2a\u65f6\u95f4\u6b65\u91cd\u590d\u8be5\u8fc7\u7a0b\u3002</p> </li> </ul> \\[\\\\min_{\\\\mathbf{u}_{0:T}} \\\\sum_{t=0}^{T} \\\\left[ \\\\|\\\\mathbf{x}_t - \\\\mathbf{x}_t^*\\\\|_Q^2 + \\\\|\\\\mathbf{u}_t\\\\|_R^2 \\\\right] \\\\quad \\\\text{subject to} \\\\quad \\\\mathbf{x}_{t+1} = f(\\\\mathbf{x}_t, \\\\mathbf{u}_t)\\] <ul> <li> <p>\u8fd9\u91cc\\(\\\\|\\\\mathbf{x}\\\\|_Q^2 = \\\\mathbf{x}^T Q \\\\mathbf{x}\\)\u662f\u4f7f\u7528\u6b63\u5b9a\u77e9\u9635\\(Q\\)\uff08\u7b2c2\u7ae0\uff09\u7684\u52a0\u6743\u8303\u6570\uff0c\u5141\u8bb8\u5bf9\u4e0d\u540c\u72b6\u6001\u8bef\u5dee\u8fdb\u884c\u4e0d\u540c\u60e9\u7f5a\u3002MPC\u81ea\u7136\u5730\u5904\u7406\u7ea6\u675f\uff08\u5173\u8282\u9650\u4f4d\u3001\u529b\u77e9\u9650\u4f4d\u3001\u907f\u969c\uff09\uff0c\u56e0\u4e3a\u5b83\u4eec\u88ab\u663e\u5f0f\u5730\u5305\u542b\u5728\u4f18\u5316\u4e2d\u3002</p> </li> <li> <p>\u963b\u6297\u63a7\u5236\u8c03\u8282\u529b\u4e0e\u8fd0\u52a8\u4e4b\u95f4\u7684\u5173\u7cfb\uff0c\u800c\u4e0d\u662f\u8ddf\u8e2a\u521a\u6027\u8f68\u8ff9\u3002\u5b83\u4e0d\u547d\u4ee4\"\u5230\u8fbe\u4f4d\u7f6e\\(x\\)\"\uff0c\u800c\u662f\u547d\u4ee4\"\u8868\u73b0\u5f97\u50cf\u4e00\u4e2a\u4ee5\\(x\\)\u4e3a\u4e2d\u5fc3\u7684\u5f39\u7c27-\u963b\u5c3c\u7cfb\u7edf\"\uff1a</p> </li> </ul> \\[F = K_s(\\\\mathbf{x}^* - \\\\mathbf{x}) + D(\\\\dot{\\\\mathbf{x}}^* - \\\\dot{\\\\mathbf{x}})\\] <ul> <li>\u5176\u4e2d\\(K_s\\)\u662f\u521a\u5ea6\u77e9\u9635\uff0c\\(D\\)\u662f\u963b\u5c3c\u77e9\u9635\u3002\u8fd9\u4f7f\u5f97\u673a\u5668\u4eba\u5177\u6709\u67d4\u987a\u6027\uff1a\u5982\u679c\u5b83\u63a5\u89e6\u5230\u969c\u788d\u7269\uff0c\u5b83\u4f1a\u9000\u8ba9\u800c\u4e0d\u662f\u5f3a\u884c\u901a\u8fc7\u3002\u963b\u6297\u63a7\u5236\u5bf9\u4e8e\u63a5\u89e6\u5bc6\u96c6\u578b\u4efb\u52a1\uff08\u5982\u5c06\u9500\u9489\u63d2\u5165\u5b54\u4e2d\u6216\u5c06\u7269\u4f53\u9012\u7ed9\u4eba\u7c7b\uff09\u81f3\u5173\u91cd\u8981\u3002</li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/02.%20robot%20learning/#_4","title":"\u6a21\u4eff\u5b66\u4e60","text":"<ul> <li> <p>\u6211\u4eec\u53ef\u4ee5\u4ece\u793a\u8303\u4e2d\u5b66\u4e60\u63a7\u5236\u7b56\u7565\uff0c\u800c\u4e0d\u662f\u624b\u5de5\u8bbe\u8ba1\u63a7\u5236\u5668\u3002\u4eba\u7c7b\u6267\u884c\u4efb\u52a1\uff0c\u673a\u5668\u4eba\u89c2\u5bdf\uff0c\u5b66\u4e60\u7b97\u6cd5\u63d0\u53d6\u7b56\u7565\u3002\u8fd9\u5c31\u662f\u6a21\u4eff\u5b66\u4e60\uff08\u6216\u4ece\u793a\u8303\u4e2d\u5b66\u4e60\uff09\u3002</p> </li> <li> <p>\u884c\u4e3a\u514b\u9686\uff08BC\uff09\u662f\u6700\u7b80\u5355\u7684\u65b9\u6cd5\uff1a\u5c06\u793a\u8303\u89c6\u4e3a\u76d1\u7763\u5b66\u4e60\u6570\u636e\u96c6\u3002\u7ed9\u5b9a\u6765\u81ea\u4e13\u5bb6\u7684\u89c2\u6d4b-\u52a8\u4f5c\u5bf9\\(\\\\{(\\\\mathbf{o}_t, \\\\mathbf{a}_t)\\\\}\\)\uff0c\u8bad\u7ec3\u7b56\u7565\\(\\\\pi_\\\\theta(\\\\mathbf{a} \\\\mid \\\\mathbf{o})\\)\u4ece\u89c2\u6d4b\u4e2d\u9884\u6d4b\u4e13\u5bb6\u7684\u52a8\u4f5c\u3002\u8fd9\u662f\u6807\u51c6\u7684\u76d1\u7763\u5b66\u4e60\uff08\u7b2c6\u7ae0\uff09\uff1a\u6700\u5c0f\u5316\u635f\u5931\uff1a</p> </li> </ul> \\[\\\\mathcal{L}(\\\\theta) = \\\\mathbb{E}_{(\\\\mathbf{o}, \\\\mathbf{a}) \\\\sim \\\\mathcal{D}} \\\\left[ \\\\| \\\\pi_\\\\theta(\\\\mathbf{o}) - \\\\mathbf{a} \\\\|^2 \\\\right]\\] <p></p> <ul> <li> <p>\u95ee\u9898\u662f\u5206\u5e03\u504f\u79fb\uff08\u4e5f\u79f0\u4e3a\u590d\u5408\u8bef\u5dee\u95ee\u9898\uff09\u3002\u5728\u8bad\u7ec3\u671f\u95f4\uff0c\u7b56\u7565\u770b\u5230\u7684\u662f\u4e13\u5bb6\u7684\u72b6\u6001\u3002\u5728\u90e8\u7f72\u671f\u95f4\uff0c\u7b56\u7565\u81ea\u8eab\u7684\u5c0f\u8bef\u5dee\u5c06\u5176\u63a8\u5165\u4e13\u5bb6\u4ece\u672a\u8bbf\u95ee\u8fc7\u7684\u72b6\u6001\u3002\u8fd9\u4e9b\u4e0d\u719f\u6089\u7684\u72b6\u6001\u5bfc\u81f4\u66f4\u5dee\u7684\u52a8\u4f5c\uff0c\u8fdb\u800c\u5bfc\u81f4\u66f4\u4e0d\u719f\u6089\u7684\u72b6\u6001\uff0c\u8bef\u5dee\u8fc5\u901f\u7d2f\u79ef\u653e\u5927\u3002</p> </li> <li> <p>\u60f3\u8c61\u4e00\u4e0b\u901a\u8fc7\u89c2\u770b\u5b8c\u7f8e\u9a7e\u9a76\u5458\u6765\u5b66\u4e60\u5f00\u8f66\u3002\u4f60\u4ece\u672a\u89c1\u8fc7\u5c0f\u5e45\u504f\u79fb\u540e\u4f1a\u53d1\u751f\u4ec0\u4e48\uff0c\u56e0\u4e3a\u4e13\u5bb6\u4ece\u672a\u504f\u79fb\u8fc7\u3002\u7b2c\u4e00\u6b21\u4f60\u7a0d\u4e3a\u504f\u79bb\u65f6\uff0c\u4f60\u5b8c\u5168\u4e0d\u77e5\u9053\u5982\u4f55\u6062\u590d\u3002</p> </li> <li> <p>DAgger\uff08\u6570\u636e\u96c6\u805a\u5408\uff09\u901a\u8fc7\u8fed\u4ee3\u89e3\u51b3\u8fd9\u4e2a\u95ee\u9898\uff1a</p> <ol> <li>\u5728\u5f53\u524d\u6570\u636e\u4e0a\u8bad\u7ec3\u7b56\u7565\u3002</li> <li>\u5728\u73af\u5883\u4e2d\u8fd0\u884c\u7b56\u7565\uff0c\u6536\u96c6\u65b0\u72b6\u6001\u3002</li> <li>\u8bf7\u4e13\u5bb6\u7528\u6b63\u786e\u7684\u52a8\u4f5c\u6807\u6ce8\u8fd9\u4e9b\u65b0\u72b6\u6001\u3002</li> <li>\u5c06\u65b0\u6570\u636e\u6dfb\u52a0\u5230\u6570\u636e\u96c6\u5e76\u91cd\u65b0\u8bad\u7ec3\u3002</li> </ol> </li> <li> <p>\u7ecf\u8fc7\u591a\u6b21\u8fed\u4ee3\uff0c\u6570\u636e\u96c6\u8986\u76d6\u4e86\u5b66\u4e60\u7b56\u7565\u5b9e\u9645\u8bbf\u95ee\u7684\u72b6\u6001\uff0c\u800c\u4e0d\u4ec5\u4ec5\u662f\u4e13\u5bb6\u7684\u8f68\u8ff9\u3002\u7b56\u7565\u5f97\u5230\u4e86\u6539\u5584\uff0c\u56e0\u4e3a\u5b83\u5df2\u7ecf\u770b\u5230\u5e76\u5b66\u4f1a\u4e86\u4ece\u81ea\u5df1\u7684\u9519\u8bef\u4e2d\u6062\u590d\u3002</p> </li> <li> <p>\u4f7f\u7528Transformer\u7684\u52a8\u4f5c\u5206\u5757\uff08ACT\uff09\u662f\u4e00\u79cd\u73b0\u4ee3\u65b9\u6cd5\uff0c\u7b56\u7565\u9884\u6d4b\u4e00\u7cfb\u5217\u672a\u6765\u52a8\u4f5c\uff08\u4e00\u4e2a\"\u5757\"\uff09\uff0c\u800c\u4e0d\u662f\u4e00\u6b21\u9884\u6d4b\u4e00\u4e2a\u52a8\u4f5c\u3002\u5b83\u4f7f\u7528\u5e26\u6709transformer\u4e3b\u5e72\u7684 conditional VAE \u5b9e\u73b0\u3002\u9884\u6d4b\u52a8\u4f5c\u5757\u66f4\u9c81\u68d2\uff0c\u56e0\u4e3a\u5b83\u6355\u83b7\u4e86\u65f6\u95f4\u76f8\u5173\u6027\uff1a\u4f38\u624b\u52a8\u4f5c\u7684\u5e73\u6ed1\u6027\u7f16\u7801\u5728\u5757\u4e2d\uff0c\u800c\u4e0d\u662f\u4f9d\u8d56\u4e8e\u53ef\u80fd\u6f02\u79fb\u7684\u81ea\u56de\u5f52\u5355\u6b65\u9884\u6d4b\u3002</p> </li> <li> <p>\u6269\u6563\u7b56\u7565\u5c06\u6269\u6563\u6a21\u578b\uff08\u7b2c8\u7ae0\uff09\u5e94\u7528\u4e8e\u52a8\u4f5c\u751f\u6210\u3002\u5b83\u4e0d\u9884\u6d4b\u5355\u4e2a\u52a8\u4f5c\uff0c\u800c\u662f\u5efa\u6a21\u4ee5\u89c2\u6d4b\u4e3a\u6761\u4ef6\u7684\u5b8c\u6574\u52a8\u4f5c\u5206\u5e03\u3002\u4ece\u566a\u58f0\u5f00\u59cb\uff0c\u5b83\u8fed\u4ee3\u5730\u53bb\u566a\u4ee5\u751f\u6210\u52a8\u4f5c\u5e8f\u5217\u3002\u8fd9\u81ea\u7136\u5730\u5904\u7406\u4e86\u591a\u6a21\u6001\u6027\uff1a\u5f53\u6709\u591a\u4e2a\u6709\u6548\u65b9\u5f0f\u5b8c\u6210\u4efb\u52a1\u65f6\uff08\u4ece\u5de6\u8fb9\u6216\u53f3\u8fb9\u4f38\u624b\uff09\uff0c\u6269\u6563\u6a21\u578b\u53ef\u4ee5\u8868\u793a\u4e24\u79cd\u6a21\u5f0f\uff0c\u800c\u56de\u5f52\u7b56\u7565\u4f1a\u5e73\u5747\u5b83\u4eec\uff08\u5230\u8fbe\u4e2d\u95f4\u67d0\u5904\uff0c\u53ef\u80fd\u4e24\u79cd\u90fd\u65e0\u6548\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/02.%20robot%20learning/#_5","title":"\u4eff\u771f\u5230\u73b0\u5b9e\u8fc1\u79fb","text":"<ul> <li> <p>\u5728\u73b0\u5b9e\u4e16\u754c\u4e2d\u8bad\u7ec3\u673a\u5668\u4eba\u662f\u6602\u8d35\u3001\u7f13\u6162\u4e14\u5371\u9669\u7684\u3002\u4e00\u4e2a\u901a\u8fc7\u8bd5\u9519\u5b66\u4e60\u6293\u53d6\u7684\u673a\u5668\u4eba\u53ef\u80fd\u9700\u8981\u6570\u5343\u6b21\u5c1d\u8bd5\uff0c\u5728\u8fd9\u4e2a\u8fc7\u7a0b\u4e2d\u635f\u574f\u7269\u4f53\u548c\u81ea\u8eab\u3002\u4eff\u771f\u63d0\u4f9b\u4e86\u65e0\u9650\u3001\u5b89\u5168\u3001\u5feb\u901f\u7684\u4f53\u9a8c\u3002\u4f46\u4eff\u771f\u5668\u5e76\u975e\u5b8c\u7f8e\uff1a\u7269\u7406\u8fd1\u4f3c\u3001\u89c6\u89c9\u5408\u6210\u3001\u63a5\u89e6\u7b80\u5316\u3002</p> </li> <li> <p>\u4eff\u771f\u5230\u73b0\u5b9e\u5dee\u8ddd\u662f\u4eff\u771f\u6027\u80fd\u4e0e\u771f\u5b9e\u6027\u80fd\u4e4b\u95f4\u7684\u5dee\u5f02\u3002\u5728\u4eff\u771f\u4e2d\u5b8c\u7f8e\u8fd0\u884c\u7684\u7b56\u7565\u53ef\u80fd\u5728\u771f\u5b9e\u673a\u5668\u4eba\u4e0a\u5b8c\u5168\u5931\u8d25\uff0c\u56e0\u4e3a\u5b83\u8fc7\u5ea6\u62df\u5408\u4e86\u4eff\u771f\u5668\u7684\u7279\u5b9a\u7ec6\u8282\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u57df\u968f\u673a\u5316\u901a\u8fc7\u5728\u5e7f\u6cdb\u7684\u4eff\u771f\u5668\u8bbe\u7f6e\u4e0a\u8fdb\u884c\u8bad\u7ec3\u6765\u5e94\u5bf9\u8fd9\u4e00\u95ee\u9898\u3002\u4e0d\u662f\u4f7f\u7528\u4e00\u79cd\u4eff\u771f\uff0c\u800c\u662f\u4f7f\u7528\u6570\u5343\u79cd\u5177\u6709\u968f\u673a\u5316\u53c2\u6570\u7684\u4eff\u771f\uff1a</p> <ul> <li>\u7269\u7406\uff1a\u6469\u64e6\u7cfb\u6570\u3001\u8d28\u91cf\u3001\u963b\u5c3c</li> <li>\u89c6\u89c9\uff1a\u5149\u7167\u3001\u7eb9\u7406\u3001\u989c\u8272\u3001\u76f8\u673a\u4f4d\u7f6e</li> <li>\u52a8\u529b\u5b66\uff1a\u7535\u673a\u5ef6\u8fdf\u3001\u566a\u58f0\u6c34\u5e73</li> </ul> </li> <li> <p>\u5176\u601d\u60f3\u662f\uff0c\u5982\u679c\u7b56\u7565\u5728\u6240\u6709\u8fd9\u4e9b\u53d8\u5316\u4e0b\u90fd\u80fd\u5de5\u4f5c\uff0c\u90a3\u4e48\u73b0\u5b9e\u4e16\u754c\u53ea\u662f\u5206\u5e03\u4e2d\u7684\"\u53e6\u4e00\u79cd\u53d8\u5316\"\u3002\u7b56\u7565\u5b66\u4e60\u5bf9\u968f\u673a\u5316\u5c5e\u6027\u4e0d\u53d8\u7684\u7279\u5f81\uff0c\u8fd9\u4e9b\u4e0d\u53d8\u7279\u5f81\u80fd\u591f\u8fc1\u79fb\u3002</p> </li> <li> <p>\u7cfb\u7edf\u8fa8\u8bc6\u91c7\u53d6\u76f8\u53cd\u7684\u65b9\u6cd5\uff1a\u4e0d\u662f\u968f\u673a\u5316\u6240\u6709\u5185\u5bb9\uff0c\u800c\u662f\u4ed4\u7ec6\u6d4b\u91cf\u771f\u5b9e\u7cfb\u7edf\u7684\u7269\u7406\u53c2\u6570\u5e76\u5c06\u4eff\u771f\u5668\u8c03\u8c10\u5230\u5339\u914d\u3002\u8fd9\u63d0\u4f9b\u4e86\u66f4\u7cbe\u786e\u7684\u4eff\u771f\uff0c\u4f46\u4e5f\u66f4\u8106\u5f31\uff08\u4efb\u4f55\u672a\u5efa\u6a21\u7684\u6548\u5e94\u90fd\u4f1a\u5bfc\u81f4\u5dee\u8ddd\uff09\u3002</p> </li> <li> <p>\u5728\u5b9e\u8df5\u4e2d\uff0c\u6700\u597d\u7684\u7ed3\u679c\u662f\u5c06\u4e24\u8005\u7ed3\u5408\uff1a\u4f7f\u7528\u7cfb\u7edf\u8fa8\u8bc6\u4f7f\u4eff\u771f\u5668\u5408\u7406\u63a5\u8fd1\uff0c\u7136\u540e\u4f7f\u7528\u57df\u968f\u673a\u5316\u8986\u76d6\u5269\u4f59\u7684\u4e0d\u786e\u5b9a\u6027\u3002</p> </li> <li> <p>\u901a\u8fc7\u5fae\u8c03\u7684\u4eff\u771f\u5230\u73b0\u5b9e\u8fc1\u79fb\u4e3b\u8981\u5728\u4eff\u771f\u4e2d\u8bad\u7ec3\uff0c\u7136\u540e\u8fdb\u884c\u5c11\u91cf\u7684\u771f\u5b9e\u4e16\u754c\u5fae\u8c03\u3002\u4eff\u771f\u63d0\u4f9b\u4e86\u826f\u597d\u7684\u521d\u59cb\u5316\uff0c\u771f\u5b9e\u4e16\u754c\u6570\u636e\u7ea0\u6b63\u4e86\u4eff\u771f\u5668\u7279\u5b9a\u7684\u504f\u5dee\u3002\u8fd9\u9700\u8981\u7684\u771f\u5b9e\u4e16\u754c\u6570\u636e\u8fdc\u5c11\u4e8e\u4ece\u5934\u8bad\u7ec3\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/02.%20robot%20learning/#_6","title":"\u673a\u5668\u4eba\u4e16\u754c\u6a21\u578b","text":"<ul> <li> <p>\u4e0a\u8ff0\u6240\u6709\u5f3a\u5316\u5b66\u4e60\u548c\u6a21\u4eff\u5b66\u4e60\u65b9\u6cd5\u90fd\u662f\u65e0\u6a21\u578b\u7684\uff1a\u7b56\u7565\u901a\u8fc7\u76f4\u63a5\u4ea4\u4e92\uff08\u6216\u793a\u8303\uff09\u5b66\u4e60\u884c\u52a8\uff0c\u800c\u4e0d\u663e\u5f0f\u5efa\u6a21\u4e16\u754c\u5982\u4f55\u8fd0\u4f5c\u3002\u53e6\u4e00\u79cd\u662f\u57fa\u4e8e\u6a21\u578b\u7684\u5b66\u4e60\uff1a\u9996\u5148\u5b66\u4e60\u73af\u5883\u52a8\u529b\u5b66\u6a21\u578b\uff0c\u7136\u540e\u4f7f\u7528\u8be5\u6a21\u578b\u8fdb\u884c\u89c4\u5212\u6216\u751f\u6210\u5408\u6210\u7ecf\u9a8c\u3002</p> </li> <li> <p>\u4e16\u754c\u6a21\u578b\u5b66\u4e60\u8f6c\u79fb\u51fd\u6570\\(p(s_{t+1} \\\\mid s_t, a_t)\\)\uff1a\u7ed9\u5b9a\u5f53\u524d\u72b6\u6001\u548c\u52a8\u4f5c\uff0c\u9884\u6d4b\u4e0b\u4e00\u72b6\u6001\uff08\u5982\u7b2c10\u7ae0\u6240\u8ff0\uff09\u3002\u5728\u673a\u5668\u4eba\u5b66\u4e2d\uff0c\u8fd9\u610f\u5473\u7740\u9884\u6d4b\u5982\u679c\u673a\u5668\u4eba\u91c7\u53d6\u7279\u5b9a\u52a8\u4f5c\u4f1a\u53d1\u751f\u4ec0\u4e48\uff1a\"\u5982\u679c\u6211\u5411\u5de6\u63a8\u8fd9\u4e2a\u65b9\u5757\uff0c\u5b83\u4f1a\u6ed1\u52a83\u5398\u7c73\uff0c\u5b83\u540e\u9762\u7684\u676f\u5b50\u4f1a\u5012\u4e0b\u3002\"</p> </li> <li> <p>\u5176\u5438\u5f15\u529b\u5728\u4e8e\u6837\u672c\u6548\u7387\u3002\u73b0\u5b9e\u4e16\u754c\u7684\u673a\u5668\u4eba\u4ea4\u4e92\u6210\u672c\u9ad8\u6602\u3002\u5982\u679c\u673a\u5668\u4eba\u80fd\u4ece\u9002\u91cf\u7684\u771f\u5b9e\u6570\u636e\u4e2d\u5b66\u4e60\u4e00\u4e2a\u4e16\u754c\u6a21\u578b\uff0c\u5b83\u5c31\u53ef\u4ee5\u901a\u8fc7\u5728\u5927\u8111\u4e2d\u6eda\u52a8\u6a21\u578b\u6765\"\u60f3\u8c61\"\u6570\u5343\u6761\u8f68\u8ff9\uff0c\u5728\u4e0d\u52a8\u7528\u7269\u7406\u4e16\u754c\u7684\u60c5\u51b5\u4e0b\u89c4\u5212\u548c\u5b8c\u5584\u7b56\u7565\u3002\u8fd9\u7c7b\u4f3c\u4e8e\u68cb\u624b\u901a\u8fc7\u5728\u8111\u6d77\u4e2d\u6a21\u62df\u8d70\u68cb\u6765\u601d\u8003\u3002</p> </li> <li> <p>DreamerV3\u662f\u4e00\u4e2a\u901a\u7528\u7684\u57fa\u4e8e\u6a21\u578b\u7684\u5f3a\u5316\u5b66\u4e60\u667a\u80fd\u4f53\u3002\u5b83\u8054\u5408\u5b66\u4e60\u4e09\u4e2a\u7ec4\u4ef6\uff1a</p> <ul> <li>\u8868\u793a\u6a21\u578b\uff1a\u5c06\u89c2\u6d4b\u7f16\u7801\u4e3a\u7d27\u51d1\u7684\u6f5c\u5728\u72b6\u6001\u3002</li> <li>\u8f6c\u79fb\u6a21\u578b\uff08\u4e16\u754c\u6a21\u578b\uff09\uff1a\u6839\u636e\u5f53\u524d\u72b6\u6001\u548c\u52a8\u4f5c\u9884\u6d4b\u4e0b\u4e00\u6f5c\u5728\u72b6\u6001\u3002</li> <li>\u5956\u52b1\u6a21\u578b\uff1a\u4ece\u6f5c\u5728\u72b6\u6001\u9884\u6d4b\u5956\u52b1\u3002</li> </ul> </li> <li> <p>\u7136\u540e\u667a\u80fd\u4f53\u901a\u8fc7\u5728\u6f5c\u5728\u7a7a\u95f4\u4e2d\u5c55\u5f00\u8f6c\u79fb\u6a21\u578b\u591a\u6b65\u6765\u8fdb\u884c\"\u505a\u68a6\"\uff0c\u5728\u8fd9\u4e9b\u60f3\u8c61\u7684\u8f68\u8ff9\u4e0a\u8bad\u7ec3\u7b56\u7565\uff0c\u5e76\u5c06\u7b56\u7565\u8f6c\u79fb\u5230\u771f\u5b9e\u73af\u5883\u3002\u5173\u952e\u521b\u65b0\u5728\u4e8e\u6240\u6709\u60f3\u8c61\u90fd\u5728\u6f5c\u5728\u7a7a\u95f4\uff08\u7d27\u51d1\u7684\u5b66\u4e60\u8868\u793a\uff09\u4e2d\u8fdb\u884c\uff0c\u800c\u4e0d\u662f\u5728\u50cf\u7d20\u7a7a\u95f4\u4e2d\uff0c\u4f7f\u5176\u8ba1\u7b97\u53ef\u884c\u3002</p> </li> </ul> \\[\\\\hat{s}_{t+1} = f_\\\\theta(s_t, a_t), \\\\quad \\\\hat{r}_t = g_\\\\theta(s_t)\\] <ul> <li> <p>\u8f6c\u79fb\u6a21\u578b\\(f_\\\\theta\\)\u548c\u5956\u52b1\u6a21\u578b\\(g_\\\\theta\\)\u5728\u771f\u5b9e\u7ecf\u9a8c\u4e0a\u8bad\u7ec3\uff0c\u7b56\u7565\u5728\u60f3\u8c61\u7684\u5c55\u5f00\u4e0a\u8bad\u7ec3\u3002\u8fd9\u5c06\u6570\u636e\u6536\u96c6\u4e0e\u7b56\u7565\u4f18\u5316\u89e3\u8026\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u673a\u5668\u4eba\u64cd\u4f5c\uff0c\u4e16\u754c\u6a21\u578b\u5b9e\u73b0\u4e86\u5fc3\u7406\u6392\u7ec3\u3002\u5728\u5c1d\u8bd5\u6293\u53d6\u4e4b\u524d\uff0c\u673a\u5668\u4eba\u53ef\u4ee5\u5728\u5176\u5b66\u4e60\u6a21\u578b\u4e0a\u6a21\u62df\u591a\u79cd\u65b9\u6cd5\uff0c\u5e76\u9009\u62e9\u6700\u53ef\u80fd\u6210\u529f\u7684\u4e00\u79cd\u3002\u8fd9\u5bf9\u4e8e\u63a5\u89e6\u5bc6\u96c6\u578b\u4efb\u52a1\u5c24\u5176\u6709\u4ef7\u503c\uff0c\u56e0\u4e3a\u5728\u8fd9\u4e9b\u4efb\u52a1\u4e2d\u73b0\u5b9e\u4e16\u754c\u7684\u8bd5\u9519\u65e2\u6162\u53c8\u5371\u9669\u3002</p> </li> <li> <p>\u4e16\u754c\u6a21\u578b\u4e5f\u81ea\u7136\u5730\u4e0e\u4eff\u771f\u5230\u73b0\u5b9e\u8fc1\u79fb\u76f8\u5173\u8054\uff1a\u5728\u771f\u5b9e\u6570\u636e\u4e0a\u8bad\u7ec3\u7684\u4e16\u754c\u6a21\u578b\u5b9e\u9645\u4e0a\u662f\u4e00\u4e2a\u81ea\u52a8\u6355\u83b7\u771f\u5b9e\u4e16\u754c\u7269\u7406\u7684\u5b66\u4e60\u578b\u4eff\u771f\u5668\uff0c\u5b8c\u5168\u7ed5\u8fc7\u4e86\u4eff\u771f\u5230\u73b0\u5b9e\u5dee\u8ddd\u3002\u5bf9\u4e8e\u7406\u89e3\u826f\u597d\u7684\u573a\u666f\uff0c\u5b83\u53ef\u80fd\u4e0d\u5982\u624b\u5de5\u6784\u5efa\u7684\u4eff\u771f\u5668\u7cbe\u786e\uff0c\u4f46\u5b83\u6355\u83b7\u4e86\u624b\u5de5\u4eff\u771f\u5668\u5e38\u5e38\u51fa\u9519\u7684\u6548\u679c\uff08\u6469\u64e6\u3001\u5f62\u53d8\u3001\u63a5\u89e6\u52a8\u529b\u5b66\uff09\u3002</p> </li> <li> <p>JEPA\uff08\u8054\u5408\u5d4c\u5165\u9884\u6d4b\u67b6\u6784\uff0c\u5728\u7b2c10\u7ae0\u4e2d\u4ecb\u7ecd\uff09\u63d0\u4f9b\u4e86\u50cf\u7d20\u7ea7\u9884\u6d4b\u7684\u66ff\u4ee3\u65b9\u6848\u3002JEPA\u4e0d\u5728\u50cf\u7d20\u7a7a\u95f4\u9884\u6d4b\u7cbe\u786e\u7684\u672a\u6765\u89c2\u6d4b\uff0c\u800c\u662f\u5728\u5d4c\u5165\u7a7a\u95f4\u4e2d\u9884\u6d4b\uff1a\"\u4e0b\u4e00\u72b6\u6001\u7684\u6f5c\u5728\u8868\u793a\u5c06\u63a5\u8fd1\u8be5\u5411\u91cf\u3002\"\u8fd9\u907f\u514d\u4e86\u9884\u6d4b\u50cf\u7d20\u7ea7\u5b8c\u7f8e\u672a\u6765\u7684\u56f0\u96be\uff08\u65e2\u65e0\u5fc5\u8981\u53c8\u8ba1\u7b97\u6d6a\u8d39\uff09\uff0c\u5e76\u4e13\u6ce8\u4e8e\u9884\u6d4b\u5bf9\u51b3\u7b56\u91cd\u8981\u7684\u672a\u6765\u65b9\u9762\u3002</p> </li> <li> <p>\u4e16\u754c\u6a21\u578b\u7684\u5c40\u9650\u6027\u5728\u4e8e\u590d\u5408\u9884\u6d4b\u8bef\u5dee\u3002\u8f6c\u79fb\u6a21\u578b\u4e2d\u7684\u5fae\u5c0f\u4e0d\u51c6\u786e\u6027\u5728\u957f\u7a0b\u5c55\u5f00\u4e2d\u79ef\u7d2f\uff0c\u5bfc\u81f4\u60f3\u8c61\u7684\u8f68\u8ff9\u504f\u79bb\u73b0\u5b9e\u3002\u7f13\u89e3\u63aa\u65bd\u5305\u62ec\uff1a\u77ed\u60f3\u8c61\u65f6\u57df\u3001\u96c6\u6210\u6a21\u578b\uff08\u4f7f\u7528\u4e0d\u786e\u5b9a\u6027\u68c0\u6d4b\u9884\u6d4b\u4f55\u65f6\u53d8\u5f97\u4e0d\u53ef\u9760\uff09\u3001\u4ee5\u53ca\u5b9a\u671f\u7528\u65b0\u7684\u771f\u5b9e\u4e16\u754c\u6570\u636e\u6821\u51c6\u6a21\u578b\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/02.%20robot%20learning/#_7","title":"\u64cd\u4f5c","text":"<ul> <li> <p>\u64cd\u4f5c\u662f\u4f7f\u7528\u673a\u5668\u4eba\u672b\u7aef\u6267\u884c\u5668\u4e0e\u7269\u4f53\u4ea4\u4e92\u7684\u827a\u672f\uff1a\u6293\u53d6\u3001\u653e\u7f6e\u3001\u63a8\u3001\u63d2\u5165\u3001\u7ec4\u88c5\u3002</p> </li> <li> <p>\u6293\u53d6\u662f\u57fa\u7840\u7684\u64cd\u4f5c\u6280\u80fd\u3002\u76ee\u6807\u662f\u627e\u5230\u4e00\u4e2a\u7a33\u5b9a\u7684\u6293\u53d6\u59ff\u6001\uff1a\u5939\u722a\u7684\u4f4d\u7f6e\u548c\u65b9\u5411\uff0c\u80fd\u591f\u7262\u56fa\u5730\u6293\u4f4f\u7269\u4f53\u3002</p> </li> <li> <p>\u89e3\u6790\u6293\u53d6\u89c4\u5212\u4f7f\u7528\u7269\u7406\u5b66\u3002\u5982\u679c\u63a5\u89e6\u529b\u80fd\u591f\u62b5\u6297\u5916\u90e8\u6273\u624b\uff08\u529b\u548c\u529b\u77e9\uff09\uff0c\u5219\u6293\u53d6\u662f\u7a33\u5b9a\u7684\u3002\u5bf9\u4e8e\u5e73\u884c\u5939\u722a\uff0c\u6700\u7b80\u5355\u7684\u6807\u51c6\u662f\u529b\u95ed\u5408\u6761\u4ef6\uff1a\u63a5\u89e6\u6cd5\u7ebf\u5fc5\u987b\u8de8\u8d8a\u6240\u6709\u529b\u7684\u65b9\u5411\uff0c\u4f7f\u6293\u53d6\u80fd\u591f\u62b5\u6297\u4efb\u4f55\u6270\u52a8\u3002\u8fd9\u6d89\u53ca\u68c0\u67e5\u6293\u53d6\u6273\u624b\u77e9\u9635\u7684\u79e9\uff0c\u662f\u7b2c2\u7ae0\u79e9\u6982\u5ff5\u7684\u76f4\u63a5\u5e94\u7528\u3002</p> </li> <li> <p>\u6570\u636e\u9a71\u52a8\u7684\u6293\u53d6\u5b66\u4e60\u4ece\u611f\u5b98\u8f93\u5165\u9884\u6d4b\u6293\u53d6\u6210\u529f\u3002\u7ed9\u5b9a\u684c\u5b50\u4e0a\u7269\u4f53\u7684\u6df1\u5ea6\u56fe\u50cf\uff0c\u7f51\u7edc\u9884\u6d4b\u6bcf\u4e2a\u5019\u9009\u5939\u722a\u59ff\u6001\u7684\u6293\u53d6\u8d28\u91cf\u5206\u6570\u3002GraspNet\u548c\u7c7b\u4f3c\u67b6\u6784\u4f7f\u7528\u70b9\u4e91\u7f16\u7801\u5668\uff08PointNet\u98ce\u683c\uff0c\u7b2c8\u7ae0\uff09\u6765\u9884\u6d4b\u5e26\u6709\u7f6e\u4fe1\u5ea6\u5206\u6570\u76846\u81ea\u7531\u5ea6\u6293\u53d6\u59ff\u6001\uff08\u4f4d\u7f6e+\u65b9\u5411\uff09\u3002</p> </li> <li> <p>\u7075\u5de7\u64cd\u4f5c\u8d85\u8d8a\u4e86\u7b80\u5355\u7684\u6293\u53d6\u548c\u653e\u7f6e\u3002\u591a\u6307\u624b\u5177\u670920+\u81ea\u7531\u5ea6\uff0c\u53ef\u4ee5\u6267\u884c\u624b\u4e2d\u65cb\u8f6c\uff08\u5728\u624b\u6307\u95f4\u65cb\u8f6c\u7b14\uff09\u3001\u5de5\u5177\u4f7f\u7528\u548c\u7cbe\u7ec6\u7ec4\u88c5\u7b49\u4efb\u52a1\u3002\u72b6\u6001\u7a7a\u95f4\u5de8\u5927\u4e14\u63a5\u89e6\u590d\u6742\uff0c\u4f7f\u5176\u6210\u4e3a\u673a\u5668\u4eba\u5b66\u4e2d\u6700\u56f0\u96be\u7684\u95ee\u9898\u4e4b\u4e00\u3002</p> </li> <li> <p>\u5b66\u4e60\u7075\u5de7\u64cd\u4f5c\u901a\u5e38\u4f7f\u7528\u5e26\u6709\u5927\u91cf\u57df\u968f\u673a\u5316\u7684\u4eff\u771f\u4e2d\u7684\u5f3a\u5316\u5b66\u4e60\uff08\u7b2c6\u7ae0\uff09\u3002OpenAI\u7528Shadow\u624b\u89e3\u51b3\u9b54\u65b9\u7684\u5de5\u4f5c\u5c31\u662f\u5728\u4eff\u771f\u4e2d\u4f7f\u7528\u968f\u673a\u5316\u7269\u7406\u8bad\u7ec3PPO\u7b56\u7565\uff0c\u6700\u7ec8\u5b9e\u73b0\u4e86\u5411\u771f\u5b9e\u673a\u5668\u4eba\u624b\u7684\u8fc1\u79fb\u3002</p> </li> <li> <p>\u63a5\u89e6\u5bc6\u96c6\u578b\u4efb\u52a1\u5982\u9500\u9489\u5165\u5b54\u6216\u64e6\u62ed\u8868\u9762\uff0c\u8981\u6c42\u673a\u5668\u4eba\u4e0e\u73af\u5883\u4fdd\u6301\u53d7\u63a7\u63a5\u89e6\u3002\u8fd9\u4e9b\u4efb\u52a1\u9700\u8981\u529b\u4f20\u611f\u548c\u67d4\u987a\u63a7\u5236\uff08\u963b\u6297\u63a7\u5236\uff09\uff0c\u5e76\u4e14\u96be\u4ee5\u51c6\u786e\u4eff\u771f\uff0c\u56e0\u4e3a\u63a5\u89e6\u7269\u7406\u4f17\u6240\u5468\u77e5\u5730\u96be\u4ee5\u5efa\u6a21\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/02.%20robot%20learning/#_8","title":"\u79fb\u52a8","text":"<ul> <li> <p>\u79fb\u52a8\u662f\u8ba9\u673a\u5668\u4eba\u7684\u8eab\u4f53\u5728\u4e16\u754c\u4e2d\u79fb\u52a8\uff1a\u884c\u8d70\u3001\u5954\u8dd1\u3001\u6500\u722c\u3001\u6e38\u6cf3\u3002\u4e0e\u64cd\u4f5c\u7684\u5173\u952e\u533a\u522b\u5728\u4e8e\u673a\u5668\u4eba\u5fc5\u987b\u5728\u79fb\u52a8\u65f6\u4fdd\u6301\u5e73\u8861\uff0c\u5e76\u4e14\u4e0e\u5730\u9762\u7684\u63a5\u89e6\u70b9\u968f\u65f6\u95f4\u53d8\u5316\u3002</p> </li> <li> <p>\u817f\u5f0f\u79fb\u52a8\u5177\u6709\u6311\u6218\u6027\uff0c\u56e0\u4e3a\u5b83\u672c\u8d28\u4e0a\u662f\u4e0d\u7a33\u5b9a\u7684\u3002\u5355\u6b65\u7ad9\u7acb\u7684\u53cc\u8db3\u673a\u5668\u4eba\uff08\u7c7b\u4eba\u673a\u5668\u4eba\uff09\u5c31\u50cf\u4e00\u4e2a\u5012\u7acb\u6446\u3002\u8d28\u5fc3\u5fc5\u987b\u4fdd\u6301\u5728\u652f\u6491\u591a\u8fb9\u5f62\uff08\u4e0e\u5730\u9762\u63a5\u89e6\u7684\u811a\u7684\u51f8\u5305\uff09\u4e0a\u65b9\uff0c\u5426\u5219\u673a\u5668\u4eba\u4f1a\u6454\u5012\u3002</p> </li> <li> <p>\u96f6\u529b\u77e9\u70b9\uff08ZMP\uff09\u662f\u5730\u9762\u4e0a\u91cd\u529b\u548c\u60ef\u6027\u529b\u4ea7\u751f\u7684\u51c0\u529b\u77e9\u4e3a\u96f6\u7684\u70b9\u3002\u5982\u679cZMP\u4fdd\u6301\u5728\u652f\u6491\u591a\u8fb9\u5f62\u5185\uff0c\u673a\u5668\u4eba\u5c31\u4e0d\u4f1a\u7ffb\u5012\u3002\u4f20\u7edf\u7684\u4eba\u5f62\u673a\u5668\u4eba\u63a7\u5236\u5668\uff08\u5982\u672c\u7530ASIMO\uff09\u89c4\u5212\u4f7fZMP\u4fdd\u6301\u5728\u8fb9\u754c\u5185\u7684\u8f68\u8ff9\u3002</p> </li> <li> <p>\u4e2d\u592e\u6a21\u5f0f\u53d1\u751f\u5668\uff08CPG\uff09\u662f\u53d7\u751f\u7269\u5b66\u542f\u53d1\u7684\u57fa\u4e8e\u632f\u8361\u5668\u7684\u63a7\u5236\u5668\u3002\u52a8\u7269\u4f7f\u7528\u810a\u9ad3\u4e2d\u7684\u795e\u7ecf\u56de\u8def\u4ea7\u751f\u6709\u8282\u594f\u7684\u79fb\u52a8\u6a21\u5f0f\uff08\u884c\u8d70\u3001\u5c0f\u8dd1\u3001\u5954\u8dd1\uff09\uff0c\u65e0\u9700\u5927\u8111\u6301\u7eed\u53c2\u4e0e\u3002CPG\u6a21\u578b\u4f7f\u7528\u8026\u5408\u5fae\u5206\u65b9\u7a0b\uff1a</p> </li> </ul> \\[\\\\dot{\\\\phi}_i = \\\\omega_i + \\\\sum_j w_{ij} \\\\sin(\\\\phi_j - \\\\phi_i - \\\\psi_{ij})\\] <ul> <li> <p>\u5176\u4e2d\\(\\\\phi_i\\)\u662f\u632f\u8361\u5668\\(i\\)\u7684\u76f8\u4f4d\uff0c\\(\\\\omega_i\\)\u662f\u81ea\u7136\u9891\u7387\uff0c\\(w_{ij}\\)\u662f\u8026\u5408\u5f3a\u5ea6\uff0c\\(\\\\psi_{ij}\\)\u662f\u671f\u671b\u7684\u76f8\u4f4d\u504f\u79fb\u3002\u4e0d\u540c\u7684\u76f8\u4f4d\u5173\u7cfb\u4ea7\u751f\u4e0d\u540c\u7684\u6b65\u6001\uff1a\u6240\u6709\u817f\u540c\u6b65\uff08\u8df3\u8dc3\uff09\u3001\u4ea4\u66ff\u914d\u5bf9\uff08\u5c0f\u8dd1\uff09\u3001\u987a\u5e8f\uff08\u884c\u8d70\uff09\u3002\u6b63\u5f26\u8026\u5408\u81ea\u7136\u5730\u540c\u6b65\u632f\u8361\u5668\uff0c\u7c7b\u4f3c\u4e8e\u5085\u91cc\u53f6\u7ea7\u6570\uff08\u7b2c3\u7ae0\uff09\u5982\u4f55\u5c06\u8fd0\u52a8\u5206\u89e3\u4e3a\u9891\u7387\u5206\u91cf\u3002</p> </li> <li> <p>\u7528\u4e8e\u79fb\u52a8\u7684\u5f3a\u5316\u5b66\u4e60\u5df2\u6210\u4e3a\u654f\u6377\u56db\u8db3\u548c\u7c7b\u4eba\u673a\u5668\u4eba\u7684\u4e3b\u8981\u65b9\u6cd5\u3002\u673a\u5668\u4eba\u5728\u4eff\u771f\u4e2d\u901a\u8fc7\u8bd5\u9519\u5b66\u4e60\u7b56\u7565\\(\\\\pi(\\\\mathbf{a} \\\\mid \\\\mathbf{o})\\)\uff08\u7b2c6\u7ae0\uff09\uff0c\u5956\u52b1\u5305\u62ec\u524d\u8fdb\u901f\u5ea6\u3001\u7a33\u5b9a\u6027\u548c\u80fd\u6548\uff0c\u60e9\u7f5a\u5305\u62ec\u6454\u5012\u3001\u5173\u8282\u9650\u4f4d\u8fdd\u89c4\u548c\u6296\u52a8\u8fd0\u52a8\u3002</p> </li> <li> <p>\u8fd1\u671f\u5de5\u4f5c\uff08\u5982Agility Robotics\u3001Boston Dynamics\u548c\u5b66\u672f\u5b9e\u9a8c\u5ba4\uff09\u7684\u5173\u952e\u6d1e\u89c1\u662f\uff0cRL\u8bad\u7ec3\u7684\u79fb\u52a8\u7b56\u7565\u8fdc\u4f18\u4e8e\u624b\u5de5\u8bbe\u8ba1\u7684\u63a7\u5236\u5668\u3002\u5b83\u4eec\u81ea\u7136\u5b66\u4f1a\u4ece\u63a8\u52a8\u4e2d\u6062\u590d\u3001\u9002\u5e94\u5730\u5f62\u53d8\u5316\uff0c\u5e76\u5904\u7406\u6ca1\u6709\u5de5\u7a0b\u5e08\u80fd\u9884\u6599\u5230\u7684\u60c5\u51b5\u3002\u8bad\u7ec3\u901a\u5e38\u4f7f\u7528PPO\uff08\u7b2c6\u7ae0\uff09\u7ed3\u5408\u57df\u968f\u673a\u5316\u3002</p> </li> <li> <p>\u56db\u8db3\u673a\u5668\u4eba\uff08\u5982Boston Dynamics Spot\u6216Unitree Go2\uff09\u5df2\u6210\u4e3a\u817f\u5f0f\u673a\u5668\u4eba\u7684\u4e3b\u529b\u3002\u56db\u6761\u817f\u63d0\u4f9b\u56fa\u6709\u7a33\u5b9a\u6027\uff08\u4e09\u6761\u817f\u7684\u4e09\u89d2\u652f\u6491\u603b\u80fd\u5728\u4e00\u6761\u817f\u79fb\u52a8\u65f6\u652f\u6491\u8eab\u4f53\uff09\u3002\u56db\u8db3\u673a\u5668\u4eba\u7684RL\u7b56\u7565\u5b9e\u73b0\u4e86\u4ee4\u4eba\u5370\u8c61\u6df1\u523b\u7684\u7ed3\u679c\uff1a\u4ee53+\u7c73/\u79d2\u5954\u8dd1\u3001\u722c\u697c\u68af\u3001\u5728\u5ca9\u77f3\u5730\u5f62\u4e0a\u5bfc\u822a\u4ee5\u53ca\u4ece\u8e22\u51fb\u4e2d\u6062\u590d\u3002</p> </li> <li> <p>\u7c7b\u4eba\u673a\u5668\u4eba\u79fb\u52a8\u66f4\u96be\uff0c\u56e0\u4e3a\u53cc\u8db3\u673a\u5668\u4eba\u6709\u66f4\u5c0f\u7684\u652f\u6491\u591a\u8fb9\u5f62\u548c\u66f4\u9ad8\u7684\u8d28\u5fc3\u3002\u6700\u8fd1\u7684\u8fdb\u5c55\uff08Tesla Optimus\u3001Figure\u3001Unitree H1\uff09\u4f7f\u7528\u5728\u4eff\u771f\u4e2d\u8bad\u7ec3\u7684RL\uff0c\u914d\u4ee5\u7cbe\u5fc3\u7684\u5956\u52b1\u5851\u9020\u3002\u7c7b\u4eba\u673a\u5668\u4eba\u5fc5\u987b\u5b66\u4f1a\u7684\u4e0d\u4ec5\u4ec5\u662f\u884c\u8d70\uff0c\u8fd8\u8981\u534f\u8c03\u624b\u81c2\u6446\u52a8\u4ee5\u4fdd\u6301\u5e73\u8861\u3001\u5728\u4e0d\u5e73\u5766\u8868\u9762\u4e0a\u5bfc\u822a\u4ee5\u53ca\u4ece\u6270\u52a8\u4e2d\u6062\u590d\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/02.%20robot%20learning/#_9","title":"\u673a\u5668\u4eba\u5b66\u4e60\u4e2d\u7684\u5b89\u5168\u6027","text":"<ul> <li> <p>\u4e00\u4e2a\u4e3a\u4e86\u5b66\u4e60\u800c\u968f\u673a\u63a2\u7d22\u7684\u673a\u5668\u4eba\uff08\u5982\u5728RL\u4e2d\uff09\u53ef\u80fd\u4f1a\u635f\u574f\u81ea\u8eab\u3001\u73af\u5883\u6216\u9644\u8fd1\u7684\u4eba\u7c7b\u3002\u5b89\u5168\u7684\u673a\u5668\u4eba\u5b66\u4e60\u7ea6\u675f\u63a2\u7d22\u4ee5\u907f\u514d\u707e\u96be\u6027\u540e\u679c\u3002</p> </li> <li> <p>\u7ea6\u675fRL\u5411MDP\uff08\u7b2c6\u7ae0\uff09\u6dfb\u52a0\u5b89\u5168\u7ea6\u675f\u3002\u76ee\u6807\u53d8\u4e3a\uff1a\u5728\u6ee1\u8db3\\(J_c(\\\\pi) \\\\leq d\\)\u7684\u6761\u4ef6\u4e0b\u6700\u5927\u5316\u5956\u52b1\uff0c\u5176\u4e2d\\(J_c\\)\u662f\u671f\u671b\u7684\u7d2f\u79ef\u4ee3\u4ef7\uff08\u5982\u78b0\u649e\u4e8b\u4ef6\uff09\uff0c\\(d\\)\u662f\u6700\u5927\u5141\u8bb8\u4ee3\u4ef7\u3002\u50cf\u7ea6\u675f\u7b56\u7565\u4f18\u5316\uff08CPO\uff09\u8fd9\u6837\u7684\u7b97\u6cd5\u6269\u5c55\u4e86PPO\u4ee5\u5904\u7406\u8fd9\u4e9b\u7ea6\u675f\u3002</p> </li> <li> <p>\u5b89\u5168\u5305\u7edc\u5b9a\u4e49\u4e86\u673a\u5668\u4eba\u7edd\u4e0d\u80fd\u8d8a\u8fc7\u7684\u786c\u8fb9\u754c\uff0c\u65e0\u8bba\u5b66\u4e60\u7b56\u7565\u5982\u4f55\u8f93\u51fa\u3002\u4e00\u4e2a\u5b89\u5168\u63a7\u5236\u5668\u76d1\u63a7\u673a\u5668\u4eba\u72b6\u6001\uff0c\u5e76\u5728\u5373\u5c06\u8fdd\u53cd\u7ea6\u675f\u65f6\u8986\u76d6\u5b66\u4e60\u7b56\u7565\uff08\u4f8b\u5982\uff0c\u63a5\u8fd1\u5173\u8282\u9650\u4f4d\u3001\u5728\u4eba\u7c7b\u9644\u8fd1\u79fb\u52a8\u8fc7\u5feb\u3001\u6216\u8d85\u8fc7\u529b\u9608\u503c\uff09\u3002\u8fd9\u662f\u4e00\u79cd\u5206\u5c42\u67b6\u6784\uff1a\u5b66\u4e60\u7b97\u6cd5\u5904\u7406\u6027\u80fd\uff0c\u5b89\u5168\u5c42\u5904\u7406\u7ea6\u675f\u3002</p> </li> <li> <p>\u98ce\u9669\u611f\u77e5\u89c4\u5212\u663e\u5f0f\u5730\u5efa\u6a21\u73af\u5883\u548c\u673a\u5668\u4eba\u81ea\u8eab\u72b6\u6001\u4f30\u8ba1\u4e2d\u7684\u4e0d\u786e\u5b9a\u6027\u3002\u5b83\u4e0d\u662f\u4e3a\u6700\u53ef\u80fd\u7684\u7ed3\u679c\u8fdb\u884c\u89c4\u5212\uff0c\u800c\u662f\u5728\u7f6e\u4fe1\u533a\u95f4\u5185\u4e3a\u6700\u574f\u60c5\u51b5\u8fdb\u884c\u89c4\u5212\u3002\u8fd9\u4e0e\u6761\u4ef6\u6570\u6982\u5ff5\uff08\u7b2c2\u7ae0\uff09\u76f8\u5173\uff1a\u826f\u6001\u7cfb\u7edf\u5bf9\u6270\u52a8\u5177\u6709\u9c81\u68d2\u6027\uff0c\u98ce\u9669\u611f\u77e5\u89c4\u5212\u5bfb\u6c42\u5728\u6270\u52a8\u4e0b\u4ecd\u4fdd\u6301\u5b89\u5168\u7684\u63a7\u5236\u7b56\u7565\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/02.%20robot%20learning/#colabnotebook","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216notebook\uff09","text":"<ol> <li> <p>\u5b9e\u73b0\u4e00\u4e2a\u7b80\u53552\u8fde\u6746\u5e73\u9762\u673a\u5668\u4eba\u624b\u81c2\u7684\u6b63\u5411\u8fd0\u52a8\u5b66\u3002\u8ba1\u7b97\u5e76\u53ef\u89c6\u5316\u4e0d\u540c\u5173\u8282\u89d2\u5ea6\u4e0b\u7684\u672b\u7aef\u6267\u884c\u5668\u4f4d\u7f6e\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ndef forward_kinematics(q1, q2, l1=1.0, l2=0.8):\n    \"\"\"\u8ba1\u7b972\u8fde\u6746\u624b\u81c2\u7684\u5173\u8282\u548c\u672b\u7aef\u6267\u884c\u5668\u4f4d\u7f6e\u3002\"\"\"\n    x1 = l1 * jnp.cos(q1)\n    y1 = l1 * jnp.sin(q1)\n    x2 = x1 + l2 * jnp.cos(q1 + q2)\n    y2 = y1 + l2 * jnp.sin(q1 + q2)\n    return jnp.array([0, x1, x2]), jnp.array([0, y1, y2])\n\nfig, ax = plt.subplots(figsize=(6, 6))\nconfigs = [(0.5, 0.3), (1.0, -0.5), (1.5, 1.0), (2.0, -1.5)]\ncolors = [\"#e74c3c\", \"#3498db\", \"#27ae60\", \"#9b59b6\"]\n\nfor (q1, q2), c in zip(configs, colors):\n    xs, ys = forward_kinematics(q1, q2)\n    ax.plot(xs, ys, \"o-\", color=c, linewidth=2, markersize=6,\n            label=f\"q=({q1:.1f}, {q2:.1f})\")\n\nax.set_xlim(-2, 2); ax.set_ylim(-2, 2)\nax.set_aspect(\"equal\"); ax.grid(True); ax.legend()\nax.set_title(\"2\u8fde\u6746\u673a\u5668\u4eba\u624b\u81c2\uff1a\u6b63\u5411\u8fd0\u52a8\u5b66\")\nplt.show()\n</code></pre></p> </li> <li> <p>\u4f7f\u7528\u96c5\u53ef\u6bd4\u4f2a\u9006\u5b9e\u73b0\u9006\u5411\u8fd0\u52a8\u5b66\u3002\u4ece\u968f\u673a\u6784\u578b\u5f00\u59cb\uff0c\u8fed\u4ee3\u5730\u5c06\u672b\u7aef\u6267\u884c\u5668\u79fb\u52a8\u5230\u76ee\u6807\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\nl1, l2 = 1.0, 0.8\n\ndef end_effector(q):\n    x = l1 * jnp.cos(q[0]) + l2 * jnp.cos(q[0] + q[1])\n    y = l1 * jnp.sin(q[0]) + l2 * jnp.sin(q[0] + q[1])\n    return jnp.array([x, y])\n\njacobian_fn = jax.jacobian(end_effector)\n\ntarget = jnp.array([0.5, 1.2])\nq = jnp.array([0.1, 0.1])\ntrajectory = [end_effector(q)]\n\nfor _ in range(50):\n    pos = end_effector(q)\n    error = target - pos\n    if jnp.linalg.norm(error) &lt; 1e-4:\n        break\n    J = jacobian_fn(q)\n    # \u963b\u5c3c\u4f2a\u9006\u5904\u7406\u63a5\u8fd1\u5947\u5f02\u70b9\u7684\u60c5\u51b5\n    dq = J.T @ jnp.linalg.solve(J @ J.T + 0.01 * jnp.eye(2), error)\n    q = q + dq\n    trajectory.append(end_effector(q))\n\ntraj = jnp.stack(trajectory)\nplt.plot(traj[:, 0], traj[:, 1], \"b.-\", label=\"\u672b\u7aef\u6267\u884c\u5668\u8def\u5f84\")\nplt.plot(*target, \"r*\", markersize=15, label=\"\u76ee\u6807\u70b9\")\nplt.gca().set_aspect(\"equal\"); plt.grid(True); plt.legend()\nplt.title(f\"IK\u5728{len(trajectory)-1}\u6b65\u5185\u6536\u655b\")\nplt.show()\n</code></pre></p> </li> <li> <p>\u6a21\u62df\u4e00\u4e2a\u7b80\u5355\u7684PID\u63a7\u5236\u5668\u8ddf\u8e2a\u671f\u671b\u7684\u5173\u8282\u8f68\u8ff9\u3002\u89c2\u5bdf\u8c03\u53c2\u5bf9\u589e\u76ca\u7684\u5f71\u54cd\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u671f\u671b\u8f68\u8ff9\uff1a\u5e73\u6ed1\u6b63\u5f26\u8fd0\u52a8\ndt = 0.01\nt = jnp.arange(0, 5, dt)\nq_desired = jnp.sin(2 * t)\n\n# \u6a21\u62df\u4e8c\u9636\u52a8\u529b\u5b66\uff1am * q_ddot + b * q_dot = tau\nm, b_damp = 1.0, 0.5\n\nfor Kp, Kd, Ki, label in [(10, 5, 0, \"\u4ec5PD\"), (10, 5, 2, \"PID\"), (50, 10, 2, \"\u6fc0\u8fdbPID\")]:\n    q, q_dot, integral = 0.0, 0.0, 0.0\n    qs = []\n    for i in range(len(t)):\n        error = q_desired[i] - q\n        integral += error * dt\n        d_error = -q_dot  # \u8bef\u5dee\u5bfc\u6570\uff08\u6b64\u5904\u7b80\u5316\uff0c\u5df2\u77e5\u671f\u671b\u901f\u5ea6\uff09\n        tau = Kp * error + Kd * d_error + Ki * integral\n        q_ddot = (tau - b_damp * q_dot) / m\n        q_dot += q_ddot * dt\n        q += q_dot * dt\n        qs.append(float(q))\n\n    plt.plot(t, qs, label=label)\n\nplt.plot(t, q_desired, \"k--\", label=\"\u671f\u671b\u503c\", linewidth=2)\nplt.xlabel(\"\u65f6\u95f4 (\u79d2)\"); plt.ylabel(\"\u5173\u8282\u89d2\u5ea6\")\nplt.legend(); plt.title(\"PID\u63a7\u5236\u5668\u8ddf\u8e2a\")\nplt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2011%3A%20autonomous%20systems/03.%20vision-language-action%20models/","title":"\u89c6\u89c9-\u8bed\u8a00-\u52a8\u4f5c\u6a21\u578b","text":"<p>\u89c6\u89c9-\u8bed\u8a00-\u52a8\u4f5c\u6a21\u578b\uff08VLA\uff09\u5c06\u89c6\u89c9\u7406\u89e3\u3001\u8bed\u8a00\u7406\u89e3\u548c\u884c\u52a8\u63a7\u5236\u7edf\u4e00\u5230\u5355\u4e2a\u795e\u7ecf\u7f51\u7edc\u4e2d\u3002\u672c\u7ae0\u6db5\u76d6VLA\u67b6\u6784\u3001\u52a8\u4f5c\u6807\u8bb0\u5316\u3001RT-2\u3001Octo\u3001OpenVLA\u3001\u9884\u8bad\u7ec3\u7b56\u7565\u3001\u6cdb\u5316\u80fd\u529b\u3001\u4e0e\u5177\u4f53\u5f62\u6001\u65e0\u5173\u7684\u6a21\u578b\u4ee5\u53ca\u57fa\u51c6\u6d4b\u8bd5\u3002</p> <ul> <li> <p>\u5728\u524d\u9762\u7684\u6587\u4ef6\u4e2d\uff0c\u6211\u4eec\u6db5\u76d6\u4e86\u611f\u77e5\uff08\u611f\u77e5\u4e16\u754c\uff09\u548c\u673a\u5668\u4eba\u5b66\u4e60\uff08\u63a7\u5236\u8eab\u4f53\uff09\u3002\u4f20\u7edf\u4e0a\uff0c\u8fd9\u4e9b\u662f\u72ec\u7acb\u7684\u6d41\u7a0b\uff1a\u611f\u77e5\u6a21\u5757\u68c0\u6d4b\u7269\u4f53\uff0c\u8bed\u8a00\u6a21\u5757\u89e3\u91ca\u6307\u4ee4\uff0c\u63a7\u5236\u6a21\u5757\u751f\u6210\u52a8\u4f5c\u3002\u6bcf\u4e2a\u6a21\u5757\u72ec\u7acb\u8bbe\u8ba1\u3001\u8bad\u7ec3\u548c\u8c03\u8bd5\u3002</p> </li> <li> <p>\u89c6\u89c9-\u8bed\u8a00-\u52a8\u4f5c\u6a21\u578b\uff08VLA\uff09\u5c06\u8fd9\u4e00\u6d41\u7a0b\u538b\u7f29\u4e3a\u5355\u4e2a\u795e\u7ecf\u7f51\u7edc\u3002\u6a21\u578b\u63a5\u6536\u56fe\u50cf\uff08\u89c6\u89c9\uff09\u548c\u81ea\u7136\u8bed\u8a00\u6307\u4ee4\uff08\u8bed\u8a00\uff09\uff0c\u5e76\u8f93\u51fa\u7535\u673a\u547d\u4ee4\uff08\u52a8\u4f5c\uff09\u3002\u4e00\u4e2a\u6a21\u578b\uff0c\u7aef\u5230\u7aef\u3002</p> </li> <li> <p>\u8fd9\u6cbf\u88ad\u4e86\u6211\u4eec\u5728\u7b2c10\u7ae0\u770b\u5230\u7684\u7edf\u4e00\u8d8b\u52bf\uff1a\u6b63\u5982\u591a\u6a21\u6001\u6a21\u578b\u5c06\u89c6\u89c9\u548c\u8bed\u8a00\u7406\u89e3\u5408\u5e76\u5230\u4e00\u4e2a\u67b6\u6784\u4e2d\u4e00\u6837\uff0cVLA\u5c06\u8fd9\u4e00\u8d8b\u52bf\u6269\u5c55\u5230\u7269\u7406\u884c\u52a8\u3002\u5173\u952e\u6d1e\u89c1\u5728\u4e8e\uff0c\u8bed\u8a00\u4e3a\u6307\u5b9a\u4efb\u52a1\u63d0\u4f9b\u4e86\u81ea\u7136\u3001\u7075\u6d3b\u7684\u63a5\u53e3\uff08\"\u62ff\u8d77\u7ea2\u8272\u676f\u5b50\u653e\u5230\u67b6\u5b50\u4e0a\"\uff09\uff0c\u800c\u5927\u89c4\u6a21\u9884\u8bad\u7ec3\u7684\u89c6\u89c9-\u8bed\u8a00\u6a21\u578b\u5df2\u7ecf\u7406\u89e3\u56fe\u50cf\u548c\u6307\u4ee4\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/03.%20vision-language-action%20models/#-_1","title":"\u4ece\u89c6\u89c9-\u8bed\u8a00\u5230\u884c\u52a8","text":"<ul> <li> <p>\u56de\u987e\u7b2c10\u7ae0\uff0c\u89c6\u89c9-\u8bed\u8a00\u6a21\u578b\uff08VLM\uff09\u5982LLaVA\u548cFlamingo\u63a5\u6536\u56fe\u50cf\u548c\u6587\u672c\u4f5c\u4e3a\u8f93\u5165\uff0c\u5e76\u751f\u6210\u6587\u672c\u4f5c\u4e3a\u8f93\u51fa\u3002\u5b83\u4eec\u7406\u89e3\u573a\u666f\u3001\u56de\u7b54\u95ee\u9898\u3001\u9075\u5faa\u6307\u4ee4\u2014\u2014\u5168\u90e8\u901a\u8fc7\u8bed\u8a00\u5b8c\u6210\u3002</p> </li> <li> <p>VLA\u63d0\u51fa\u7684\u95ee\u9898\u662f\uff1a\u5982\u679c\u8f93\u51fa\u4e0d\u662f\u6587\u672c\u800c\u662f\u673a\u5668\u4eba\u52a8\u4f5c\u5462\uff1f\u6a21\u578b\u4e0d\u518d\u751f\u6210\"\u7ea2\u8272\u676f\u5b50\u5728\u684c\u5b50\u7684\u5de6\u4fa7\"\uff0c\u800c\u662f\u751f\u6210\u4e00\u7cfb\u5217\u7535\u673a\u547d\u4ee4\uff0c\u9a71\u52a8\u624b\u81c2\u53bb\u6293\u53d6\u90a3\u4e2a\u676f\u5b50\u3002</p> </li> <li> <p>\u5173\u952e\u7684\u67b6\u6784\u6d1e\u89c1\u662f\uff0c\u52a8\u4f5c\u53ef\u4ee5\u50cf\u5355\u8bcd\u4e00\u6837\u8868\u793a\u4e3a\u6807\u8bb0\u3002\u5982\u679cVLM\u4f7f\u7528\u4e0b\u4e00\u4e2a\u6807\u8bb0\u9884\u6d4b\u9010\u4e2a\u751f\u6210\u8bed\u8a00\u6807\u8bb0\uff0c\u90a3\u4e48VLA\u4ee5\u540c\u6837\u7684\u65b9\u5f0f\u751f\u6210\u52a8\u4f5c\u6807\u8bb0\u3002Transformer\u4ece\u6839\u672c\u4e0a\u5e76\u4e0d\u5173\u5fc3\u8f93\u51fa\u6807\u8bb0\u8868\u793a\"\u676f\u5b50\"\u8fd8\u662f\"\u5c06\u5939\u722a\u5411\u524d\u79fb\u52a82\u5398\u7c73\"\u3002</p> </li> <li> <p>\u8fd9\u91cd\u65b0\u5b9a\u4e49\u4e86\u673a\u5668\u4eba\u63a7\u5236\u4e3a\u5e8f\u5217\u5efa\u6a21\u95ee\u9898\uff0c\u8fd9\u6b63\u662ftransformer\u64c5\u957f\u7684\uff08\u7b2c7\u7ae0\uff09\u3002\u6a21\u578b\u5b66\u4e60\u6620\u5c04\uff1a\uff08\u56fe\u50cf\u89c2\u6d4b\uff0c\u8bed\u8a00\u6307\u4ee4\uff09\\(\\\\to\\)\uff08\u52a8\u4f5c\u6807\u8bb0\u5e8f\u5217\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/03.%20vision-language-action%20models/#vla","title":"VLA\u67b6\u6784","text":"<ul> <li> <p>\u5178\u578b\u7684VLA\u6709\u4e09\u4e2a\u7ec4\u4ef6\uff1a</p> <ul> <li> <p>\u89c6\u89c9\u7f16\u7801\u5668\uff1a\u5c06\u76f8\u673a\u56fe\u50cf\u5904\u7406\u4e3a\u89c6\u89c9\u6807\u8bb0\u3002\u901a\u5e38\u662f\u9884\u8bad\u7ec3\u7684ViT\uff08\u7b2c8\u7ae0\uff09\u6216SigLIP\u7f16\u7801\u5668\uff08\u7b2c10\u7ae0\uff09\u3002\u56fe\u50cf\u88ab\u5206\u5272\u6210\u5757\uff0c\u6bcf\u4e2a\u5757\u5d4c\u5165\u4e3a\u4e00\u4e2a\u6807\u8bb0\uff0c\u4e0e\u6807\u51c6\u89c6\u89c9transformer\u5b8c\u5168\u4e00\u6837\u3002</p> </li> <li> <p>\u8bed\u8a00\u6a21\u578b\u4e3b\u5e72\u7f51\u7edc\uff1a\u4e00\u4e2a\u9884\u8bad\u7ec3\u7684LLM\uff08\u4f8b\u5982LLaMA\u3001PaLM\uff09\uff0c\u5904\u7406\u4ea4\u9519\u7684\u89c6\u89c9\u6807\u8bb0\u548c\u8bed\u8a00\u6807\u8bb0\u5e8f\u5217\u3002\u8fd9\u5c31\u662f\u63a8\u7406\u53d1\u751f\u7684\u5730\u65b9\uff1a\u6a21\u578b\u901a\u8fc7\u540c\u65f6\u5173\u6ce8\u6307\u4ee4\u548c\u89c6\u89c9\u7279\u5f81\u6765\u7406\u89e3\"\u62ff\u8d77\u7ea2\u8272\u676f\u5b50\"\u3002</p> </li> <li> <p>\u52a8\u4f5c\u5934\uff1a\u5c06LLM\u7684\u8f93\u51fa\u6620\u5c04\u5230\u673a\u5668\u4eba\u52a8\u4f5c\u3002\u53ef\u4ee5\u662f\u4e00\u4e2a\u7b80\u5355\u7684MLP\uff0c\u5c06\u6700\u540e\u7684\u9690\u85cf\u72b6\u6001\u6620\u5c04\u5230\u8fde\u7eed\u52a8\u4f5c\u503c\uff0c\u6216\u8005\u662f\u4e00\u79cd\u5c06\u52a8\u4f5c\u8f6c\u6362\u4e3a\u79bb\u6563\u6807\u8bb0\u7684\u65b9\u6848\uff0c\u7531LLM\u7684\u73b0\u6709\u8bcd\u6c47\u8868\u6765\u9884\u6d4b\u3002</p> </li> </ul> </li> <li> <p>\u67b6\u6784\u770b\u8d77\u6765\u50cf\uff1a</p> </li> </ul> \\[\\\\text{\u56fe\u50cf} \\\\xrightarrow{\\\\text{ViT}} \\\\text{\u89c6\u89c9\u6807\u8bb0} \\\\quad + \\\\quad \\\\text{\u6307\u4ee4} \\\\xrightarrow{\\\\text{\u5206\u8bcd\u5668}} \\\\text{\u8bed\u8a00\u6807\u8bb0} \\\\quad \\\\xrightarrow{\\\\text{LLM}} \\\\quad \\\\text{\u52a8\u4f5c\u6807\u8bb0}\\] <ul> <li>\u89c6\u89c9\u6807\u8bb0\u548c\u8bed\u8a00\u6807\u8bb0\u88ab\u62fc\u63a5\uff08\u6216\u4ea4\u9519\uff09\u5e76\u8f93\u5165\u5230transformer\u4e3b\u5e72\u7f51\u7edc\uff0c\u540e\u8005\u81ea\u56de\u5f52\u5730\u751f\u6210\u52a8\u4f5c\u6807\u8bb0\u3002\u8fd9\u4e0eVLM\uff08\u7b2c10\u7ae0\uff09\u7684\u67b6\u6784\u76f8\u540c\uff0c\u4f46\u8f93\u51fa\u6a21\u6001\u662f\u52a8\u4f5c\u800c\u975e\u6587\u672c\u3002</li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/03.%20vision-language-action%20models/#_1","title":"\u52a8\u4f5c\u6807\u8bb0\u5316","text":"<ul> <li>\u673a\u5668\u4eba\u52a8\u4f5c\u662f\u8fde\u7eed\u7684\uff1a\u5173\u8282\u901f\u5ea6\u3001\u672b\u7aef\u6267\u884c\u5668\u4f4d\u7f6e\u3001\u5939\u722a\u5bbd\u5ea6\u3002\u8fd9\u4e9b\u5fc5\u987b\u8f6c\u6362\u4e3a\u79bb\u6563\u6807\u8bb0\u624d\u80fd\u8ba9LLM\u751f\u6210\u3002</li> </ul> <ul> <li> <p>\u6700\u7b80\u5355\u7684\u65b9\u6cd5\u662f\u5747\u5300\u79bb\u6563\u5316\u3002\u6bcf\u4e2a\u52a8\u4f5c\u7ef4\u5ea6\u88ab\u5212\u5206\u4e3a\\(N\\)\u4e2a\u7bb1\uff0c\u8986\u76d6\u6709\u6548\u503c\u8303\u56f4\u3002\u4f8b\u5982\uff0c\u5982\u679cx\u65b9\u5411\u901f\u5ea6\u8303\u56f4\u4ece-0.1\u52300.1\u7c73/\u79d2\uff0c\u4f7f\u7528256\u4e2a\u7bb1\uff0c\u6bcf\u4e2a\u7bb1\u4ee3\u8868\\(\\\\frac{0.2}{256} \\\\approx 0.8\\)\u6beb\u7c73/\u79d2\u3002\u52a8\u4f5c\u503c\u88ab\u6620\u5c04\u5230\u6700\u8fd1\u7684\u7bb1\u7d22\u5f15\uff0c\u8be5\u7d22\u5f15\u6210\u4e3a\u4e00\u4e2a\u6807\u8bb0\u3002</p> </li> <li> <p>\u5bf9\u4e8e7\u4e2a\u52a8\u4f5c\u7ef4\u5ea6\uff086\u81ea\u7531\u5ea6+\u5939\u722a\uff09\u548c\u6bcf\u4e2a\u7ef4\u5ea6256\u4e2a\u7bb1\uff0c\u52a8\u4f5c\u8bcd\u6c47\u8868\u6709\\(7 \\\\times 256 = 1792\\)\u4e2a\u6807\u8bb0\u3002\u8fd9\u4e9b\u88ab\u6dfb\u52a0\u5230LLM\u73b0\u6709\u7684\u6587\u672c\u8bcd\u6c47\u8868\u4e2d\u3002\u6a21\u578b\u6bcf\u4e2a\u7ef4\u5ea6\u751f\u6210\u4e00\u4e2a\u52a8\u4f5c\u6807\u8bb0\uff0c\u81ea\u56de\u5f52\u5730\uff0c\u5c31\u50cf\u751f\u6210\u5355\u8bcd\u4e00\u6837\u3002</p> </li> <li> <p>\u52a8\u4f5c\u5206\u5757\u4e00\u6b21\u9884\u6d4b\u591a\u4e2a\u672a\u6765\u65f6\u95f4\u6b65\uff0c\u800c\u4e0d\u662f\u5355\u4e2a\u52a8\u4f5c\u3002\u5982\u679c\u5757\u5927\u5c0f\u4e3a\\(H\\)\uff0c\u6a21\u578b\u8f93\u51fa\\(H \\\\times d\\)\u4e2a\u6807\u8bb0\uff08\u5176\u4e2d\\(d\\)\u662f\u52a8\u4f5c\u7ef4\u5ea6\uff09\u3002\u8fd9\u5bf9\u4e8e\u5e73\u6ed1\u3001\u65f6\u95f4\u8fde\u8d2f\u7684\u8fd0\u52a8\u81f3\u5173\u91cd\u8981\u3002\u4e00\u6b21\u9884\u6d4b\u4e00\u6b65\u4f1a\u4ea7\u751f\u6296\u52a8\u884c\u4e3a\uff0c\u56e0\u4e3a\u6bcf\u6b21\u9884\u6d4b\u90fd\u662f\u72ec\u7acb\u7684\u3002\u5206\u5757\u8feb\u4f7f\u6a21\u578b\u89c4\u5212\u4e00\u4e2a\u77ed\u8f68\u8ff9\uff0c\u6355\u83b7\u65f6\u95f4\u7ed3\u6784\u3002</p> </li> <li> <p>\u66f4\u590d\u6742\u7684\u65b9\u6cd5\u4f7f\u7528\u5b66\u4e60\u578b\u6807\u8bb0\u5316\uff0c\u901a\u8fc7VQ-VAE\uff08\u7b2c10\u7ae0\uff09\u3002VQ-VAE\u7f16\u7801\u5668\u5c06\u8fde\u7eed\u52a8\u4f5c\u5e8f\u5217\u6620\u5c04\u5230\u79bb\u6563\u7801\u672c\u7d22\u5f15\u5e8f\u5217\uff0c\u89e3\u7801\u5668\u4ece\u8fd9\u4e9b\u7d22\u5f15\u91cd\u5efa\u8fde\u7eed\u52a8\u4f5c\u3002LLM\u7136\u540e\u751f\u6210\u7801\u672c\u7d22\u5f15\uff0c\u800c\u4e0d\u662f\u5747\u5300\u5206\u7bb1\u7684\u503c\u3002\u8fd9\u7c7b\u4f3c\u4e8e\u56fe\u50cf\u5206\u8bcd\u5668\uff08\u7b2c10\u7ae0\uff09\u5982\u4f55\u5c06\u89c6\u89c9\u4fe1\u606f\u538b\u7f29\u4e3a\u7d27\u51d1\u7684\u79bb\u6563\u7f16\u7801\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/03.%20vision-language-action%20models/#vla_1","title":"\u5173\u952eVLA\u6a21\u578b","text":"<ul> <li> <p>RT-2\uff08\u673a\u5668\u4ebaTransformer 2\uff0cGoogle DeepMind\uff09\u662f\u7b2c\u4e00\u4e2a\u5927\u89c4\u6a21VLA\u3002\u5b83\u4f7f\u7528\u9884\u8bad\u7ec3\u7684VLM\uff08PaLM-E\u6216PaLI-X\uff0c\u53c2\u6570\u9ad8\u8fbe55B\uff09\u5e76\u5728\u673a\u5668\u4eba\u793a\u8303\u6570\u636e\u4e0a\u5fae\u8c03\u3002\u52a8\u4f5c\u8868\u793a\u4e3a\u6587\u672c\u5b57\u7b26\u4e32\uff1a\u6807\u8bb0\u5e8f\u5217\"1 128 91 241 5 101 127\"\u7f16\u7801\u4e86\u4e00\u4e2a7\u7ef4\u52a8\u4f5c\uff08\u6bcf\u4e2a\u6570\u5b57\u662f\u7bb1\u7d22\u5f15\uff09\u3002</p> </li> <li> <p>RT-2\u5c55\u793a\u4e86\u4e00\u4e2a\u663e\u8457\u7279\u6027\uff1a\u6765\u81eaVLM\u4e3b\u5e72\u7f51\u7edc\u7684\u6d8c\u73b0\u80fd\u529b\u8fc1\u79fb\u5230\u4e86\u673a\u5668\u4eba\u9886\u57df\u3002\u6a21\u578b\u53ef\u4ee5\u9075\u5faa\u6d89\u53ca\u4ece\u672a\u5728\u673a\u5668\u4eba\u6570\u636e\u4e2d\u89c1\u8fc7\u7684\u6982\u5ff5\u7684\u6307\u4ee4\uff08\u4f8b\u5982\uff0c\"\u5c06\u9999\u8549\u79fb\u52a8\u5230\u4ee5A\u5f00\u5934\u7684\u56fd\u5bb6\"\u9700\u8981\u89c6\u89c9\u7269\u4f53\u8bc6\u522b+\u4e16\u754c\u77e5\u8bc6+\u884c\u52a8\uff09\u3002VLM\u7684\u8bed\u8a00\u7406\u89e3\u548c\u89c6\u89c9\u63a8\u7406\"\u514d\u8d39\"\u83b7\u5f97\u3002</p> </li> <li> <p>RT-2\u7684\u5c40\u9650\u6027\u5728\u4e8e\u5b83\u662f\u5728\u5355\u4e2a\u673a\u5668\u4eba\u5f62\u6001\uff08\u7279\u5b9a\u7684\u624b\u81c2\u548c\u7279\u5b9a\u7684\u5939\u722a\uff09\u7684\u6570\u636e\u4e0a\u8bad\u7ec3\u7684\u3002\u5b83\u4e0d\u80fd\u6cdb\u5316\u5230\u4e0d\u540c\u7684\u673a\u5668\u4eba\u3002</p> </li> <li> <p>Octo\uff08\u52a0\u5dde\u5927\u5b66\u4f2f\u514b\u5229\u5206\u6821\uff09\u662f\u4e00\u4e2a\u5f00\u6e90\u7684\u3001\u4e0e\u5177\u4f53\u5f62\u6001\u65e0\u5173\u7684VLA\uff0c\u8bbe\u8ba1\u7528\u4e8e\u8de8\u4e0d\u540c\u673a\u5668\u4eba\u5e73\u53f0\u5de5\u4f5c\u3002\u5173\u952e\u521b\u65b0\u5305\u62ec\uff1a</p> <ul> <li>\u6269\u6563\u52a8\u4f5c\u5934\uff0c\u800c\u4e0d\u662f\u81ea\u56de\u5f52\u6807\u8bb0\u9884\u6d4b\u3002\u52a8\u4f5c\u5934\u83b7\u53d6transformer\u7684\u8f93\u51fa\uff0c\u5e76\u901a\u8fc7\u53bb\u566a\u6269\u6563\u8fc7\u7a0b\uff08\u7b2c8\u7ae0\uff09\u751f\u6210\u52a8\u4f5c\u3002\u8fd9\u81ea\u7136\u5730\u5904\u7406\u4e86\u591a\u6a21\u6001\u52a8\u4f5c\u5206\u5e03\uff08\u89c1\u4e0b\u56fe\uff09\uff0c\u5373\u5b58\u5728\u591a\u4e2a\u6709\u6548\u7684\u4efb\u52a1\u5b8c\u6210\u65b9\u5f0f\u3002</li> </ul> </li> </ul> <p></p> <pre><code>- **\u7075\u6d3b\u7684\u89c2\u6d4b\u548c\u52a8\u4f5c\u7a7a\u95f4**\uff1aOcto\u4e3a\u4e0d\u540c\u7684\u673a\u5668\u4eba\u914d\u7f6e\u4f7f\u7528\u7279\u5b9a\u4e8e\u4efb\u52a1\u7684\u6807\u8bb0\u5316\u5668\u3002\u5b83\u5728Open X-Embodiment\u6570\u636e\u96c6\u4e0a\u9884\u8bad\u7ec3\uff0c\u8be5\u6570\u636e\u96c6\u5305\u542b\u6765\u81ea22\u79cd\u4e0d\u540c\u673a\u5668\u4eba\u5f62\u6001\u7684\u793a\u8303\u3002\n\n- **\u9ad8\u6548\u5fae\u8c03**\uff1aOcto\u53ea\u9700100\u4e2a\u793a\u8303\u5c31\u53ef\u4ee5\u5fae\u8c03\u5230\u65b0\u673a\u5668\u4eba\uff0c\u4f7f\u5176\u9002\u7528\u4e8e\u6570\u636e\u6709\u9650\u7684\u5b9e\u9a8c\u5ba4\u3002\n</code></pre> <ul> <li> <p>OpenVLA\uff08\u65af\u5766\u798f\u5927\u5b66\u3001\u52a0\u5dde\u5927\u5b66\u4f2f\u514b\u5229\u5206\u6821\uff09\u91c7\u7528\u5fae\u8c03\u73b0\u6709\u5f00\u6e90VLM\uff08\u57fa\u4e8eLlama\uff09\u7528\u4e8e\u673a\u5668\u4eba\u6280\u672f\u7684\u65b9\u6cd5\u3002\u5b83\u4f7f\u75287B\u53c2\u6570\u4e3b\u5e72\u7f51\u7edc\u3001\u5747\u5300\u52a8\u4f5c\u6807\u8bb0\u5316\uff08\u6bcf\u4e2a\u7ef4\u5ea6256\u4e2a\u7bb1\uff09\uff0c\u5e76\u5728Open X-Embodiment\u6570\u636e\u4e0a\u8bad\u7ec3\u3002\u5176\u4f18\u52bf\u5728\u4e8e\u7b80\u5355\u6027\uff1a\u67b6\u6784\u662f\u6807\u51c6\u7684VLM\uff0c\u52a8\u4f5c\u6807\u8bb0\u88ab\u9644\u52a0\u5230\u8bcd\u6c47\u8868\u4e2d\uff0c\u4f7f\u5176\u6613\u4e8e\u4f7f\u7528\u73b0\u6709\u7684LLM\u57fa\u7840\u8bbe\u65bd\u8fdb\u884c\u8bad\u7ec3\u548c\u90e8\u7f72\u3002</p> </li> <li> <p>\\(\\\\pi_0\\)\uff08Physical Intelligence\uff09\u4ee3\u8868\u4e86\u5f53\u524d\u6700\u9ad8\u6c34\u5e73\u3002\u5b83\u4f7f\u7528\u9884\u8bad\u7ec3\u7684VLM\u4e3b\u5e72\u7f51\u7edc\u548c\u6d41\u5339\u914d\u52a8\u4f5c\u5934\uff08\u7b2c8\u7ae0\uff09\u3002\u6d41\u5339\u914d\u901a\u8fc7\u5b66\u4e60\u4e00\u4e2a\u901f\u5ea6\u573a\u5c06\u566a\u58f0\u4f20\u8f93\u5230\u52a8\u4f5c\u5206\u5e03\u6765\u751f\u6210\u52a8\u4f5c\uff0c\u4ea7\u751f\u5e73\u6ed1\u3001\u65f6\u95f4\u8fde\u8d2f\u7684\u52a8\u4f5c\u8f68\u8ff9\u3002\\(\\\\pi_0\\)\u5c55\u793a\u4e86\u5353\u8d8a\u7684\u901a\u7528\u6027\uff0c\u5728\u591a\u79cd\u673a\u5668\u4eba\u5f62\u6001\uff08\u5305\u62ec\u53cc\u81c2\u64cd\u4f5c\u548c\u7075\u5de7\u624b\u63a7\u5236\uff09\u4e0a\u6267\u884c\u4efb\u52a1\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/03.%20vision-language-action%20models/#_2","title":"\u9884\u8bad\u7ec3\u914d\u65b9","text":"<ul> <li> <p>VLA\u6781\u5927\u5730\u53d7\u76ca\u4e8e\u9884\u8bad\u7ec3\u7684VLM\u4e3b\u5e72\u7f51\u7edc\uff0c\u8fd9\u4e9b\u7f51\u7edc\u5df2\u7ecf\u7406\u89e3\u89c6\u89c9\u573a\u666f\u548c\u8bed\u8a00\u3002\u8bad\u7ec3\u6d41\u7a0b\u901a\u5e38\u5206\u4e3a\u51e0\u4e2a\u9636\u6bb5\uff1a</p> <ol> <li> <p>VLM\u9884\u8bad\u7ec3\uff1a\u5728\u6570\u5341\u4ebf\u6765\u81ea\u4e92\u8054\u7f51\u7684\u56fe\u50cf-\u6587\u672c\u5bf9\uff08CLIP\u3001SigLIP\u3001LLaVA\u98ce\u683c\u7684\u8bad\u7ec3\uff0c\u5982\u7b2c10\u7ae0\u6240\u8ff0\uff09\u4e0a\u8bad\u7ec3\uff08\u6216\u4f7f\u7528\u73b0\u6210\u7684\uff09\u89c6\u89c9-\u8bed\u8a00\u6a21\u578b\u3002</p> </li> <li> <p>\u673a\u5668\u4eba\u6570\u636e\u534f\u540c\u8bad\u7ec3\uff1a\u5728\u4e92\u8054\u7f51\u6570\u636e\u548c\u673a\u5668\u4eba\u793a\u8303\u6570\u636e\u7684\u6df7\u5408\u4e0a\u5fae\u8c03VLM\u3002\u4e92\u8054\u7f51\u6570\u636e\u9632\u6b62\u89c6\u89c9\u548c\u8bed\u8a00\u7406\u89e3\u7684\u707e\u96be\u6027\u9057\u5fd8\uff0c\u800c\u673a\u5668\u4eba\u6570\u636e\u6559\u6388\u52a8\u4f5c\u751f\u6210\u3002\u6df7\u5408\u6bd4\u4f8b\u5f88\u91cd\u8981\uff1a\u673a\u5668\u4eba\u6570\u636e\u8fc7\u591a\u4f1a\u964d\u4f4e\u8bed\u8a00\u7406\u89e3\uff0c\u8fc7\u5c11\u5219\u65e0\u6cd5\u5b66\u4e60\u52a8\u4f5c\u3002</p> </li> <li> <p>\u7279\u5b9a\u4efb\u52a1\u5fae\u8c03\uff1a\u53ef\u9009\u5730\u5728\u7279\u5b9a\u4efb\u52a1\u6216\u673a\u5668\u4eba\u7684\u793a\u8303\u4e0a\u8fdb\u884c\u5fae\u8c03\uff0c\u901a\u5e38\u4f7f\u7528LoRA\uff08\u7b2c10\u7ae0\uff09\u4fdd\u6301\u53ef\u8bad\u7ec3\u53c2\u6570\u6570\u91cf\u8f83\u5c11\u3002</p> </li> </ol> </li> <li> <p>\u673a\u5668\u4eba\u6570\u636e\u7684\u6570\u91cf\u6bd4\u4e92\u8054\u7f51\u6570\u636e\u5c11\u6570\u4e2a\u6570\u91cf\u7ea7\u3002VLM\u53ef\u80fd\u5728\u4e0a\u6570\u5341\u4ebf\u5f20\u56fe\u50cf\u4e0a\u9884\u8bad\u7ec3\uff0c\u4f46\u6700\u5927\u7684\u673a\u5668\u4eba\u6570\u636e\u96c6\uff08Open X-Embodiment\uff09\u5728\u6240\u6709\u5f62\u6001\u4e0a\u53ea\u6709\u6570\u767e\u4e07\u5e27\u3002\u8fd9\u79cd\u6570\u636e\u7a00\u7f3a\u6027\u6b63\u662f\u4ece\u9884\u8bad\u7ec3VLM\u5f00\u59cb\u81f3\u5173\u91cd\u8981\u7684\u539f\u56e0\uff1a\u89c6\u89c9\u548c\u8bed\u8a00\u8868\u793a\u53ef\u4ee5\u8fc1\u79fb\uff0c\u53ea\u6709\u52a8\u4f5c\u6620\u5c04\u9700\u8981\u4ece\u6709\u9650\u7684\u673a\u5668\u4eba\u6570\u636e\u4e2d\u5b66\u4e60\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/03.%20vision-language-action%20models/#_3","title":"\u6cdb\u5316\u80fd\u529b","text":"<ul> <li> <p>VLA\u7684\u627f\u8bfa\u662f\u6cdb\u5316\uff1a\u6267\u884c\u8bad\u7ec3\u4e2d\u672a\u89c1\u7684\u4efb\u52a1\uff0c\u4f7f\u7528\u672a\u89c1\u8fc7\u7684\u7269\u4f53\uff0c\u5728\u672a\u89c1\u8fc7\u7684\u73af\u5883\u4e2d\uff0c\u9075\u5faa\u672a\u89c1\u8fc7\u7684\u6307\u4ee4\u3002</p> </li> <li> <p>VLA\u6cbf\u591a\u4e2a\u8f74\u8fdb\u884c\u6cdb\u5316\uff1a</p> <ul> <li> <p>\u65b0\u9896\u7269\u4f53\uff1aVLM\u4e3b\u5e72\u7f51\u7edc\u4ece\u4e92\u8054\u7f51\u9884\u8bad\u7ec3\u4e2d\u8bc6\u522b\u7269\u4f53\u3002\u5982\u679c\u6a21\u578b\u4ece\u7f51\u7edc\u56fe\u50cf\u4e2d\u77e5\u9053\"\u87ba\u4e1d\u5200\"\u957f\u4ec0\u4e48\u6837\uff0c\u5373\u4f7f\u6ca1\u6709\u673a\u5668\u4eba\u793a\u8303\u6d89\u53ca\u87ba\u4e1d\u5200\uff0c\u5b83\u4e5f\u80fd\u64cd\u4f5c\u87ba\u4e1d\u5200\u3002</p> </li> <li> <p>\u65b0\u9896\u6307\u4ee4\uff1a\u7ec4\u5408\u8bed\u8a00\u7406\u89e3\u4f7f\u6a21\u578b\u80fd\u591f\u9075\u5faa\u5df2\u77e5\u6982\u5ff5\u7684\u65b0\u7ec4\u5408\u3002\"\u5c06\u84dd\u8272\u65b9\u5757\u5806\u53e0\u5728\u7eff\u8272\u65b9\u5757\u4e0a\"\u5373\u4f7f\u8bad\u7ec3\u53ea\u5c55\u793a\u4e86\u5806\u53e0\u7ea2\u8272\u65b9\u5757\u4e5f\u80fd\u5de5\u4f5c\uff0c\u56e0\u4e3a\u6a21\u578b\u4ece\u8bed\u8a00\u9884\u8bad\u7ec3\u4e2d\u7406\u89e3\u4e86\u989c\u8272\u5f62\u5bb9\u8bcd\u3002</p> </li> <li> <p>\u65b0\u9896\u73af\u5883\uff1a\u5728\u4e00\u5b9a\u7a0b\u5ea6\u4e0a\uff0cVLA\u8de8\u89c6\u89c9\u57df\uff08\u4e0d\u540c\u7684\u684c\u5b50\u3001\u5149\u7167\u3001\u80cc\u666f\uff09\u8fc1\u79fb\uff0c\u56e0\u4e3a\u89c6\u89c9\u7f16\u7801\u5668\u5728\u591a\u6837\u5316\u7684\u7f51\u7edc\u56fe\u50cf\u4e0a\u9884\u8bad\u7ec3\u3002\u4f46\u8fd9\u6709\u5c40\u9650\u6027\uff1a\u5728\u5b9e\u9a8c\u5ba4\u8bad\u7ec3\u7684\u673a\u5668\u4eba\u53ef\u80fd\u5728\u6742\u4e71\u53a8\u623f\u4e2d\u9047\u5230\u56f0\u96be\u3002</p> </li> <li> <p>\u65b0\u9896\u5f62\u6001\uff1a\u8fd9\u662f\u6700\u96be\u7684\u8f74\u3002\u4e0d\u540c\u673a\u5668\u4eba\u6709\u4e0d\u540c\u7684\u52a8\u4f5c\u7a7a\u95f4\uff08\u5173\u8282\u89d2\u5ea6 vs. \u672b\u7aef\u6267\u884c\u5668\u901f\u5ea6\uff09\u3001\u4e0d\u540c\u7684\u4f20\u611f\u5668\uff08\u8155\u90e8\u76f8\u673a vs. \u5934\u9876\u76f8\u673a\uff09\u548c\u4e0d\u540c\u7684\u7269\u7406\u80fd\u529b\u3002\u4e0e\u5f62\u6001\u65e0\u5173\u7684\u6a21\u578b\u5982Octo\u548c\\(\\\\pi_0\\)\u901a\u8fc7\u7075\u6d3b\u7684\u6807\u8bb0\u5316\u5668\u548c\u8de8\u591a\u79cd\u673a\u5668\u4eba\u7c7b\u578b\u7684\u9884\u8bad\u7ec3\u6765\u89e3\u51b3\u8fd9\u4e00\u95ee\u9898\u3002</p> </li> </ul> </li> <li> <p>\u6cdb\u5316\u80fd\u529b\u901a\u8fc7\u4fdd\u7559\u4efb\u52a1\u8fdb\u884c\u8bc4\u4f30\uff1a\u673a\u5668\u4eba\u88ab\u8981\u6c42\u6267\u884c\u4ece\u672a\u8bad\u7ec3\u8fc7\u7684\u4efb\u52a1\u3002\u5728\u65b0\u9896\u4efb\u52a1\u4e0a50-80%\u7684\u6210\u529f\u7387\u88ab\u8ba4\u4e3a\u662f\u5f3a\u52b2\u7684\u7ed3\u679c\uff0c\u800c\u5728\u5206\u5e03\u5185\u4efb\u52a1\u4e0a\u6210\u529f\u7387\u901a\u5e38&gt;90%\u3002\u968f\u7740\u6a21\u578b\u89c4\u6a21\u6269\u5927\u548c\u673a\u5668\u4eba\u6570\u636e\u96c6\u589e\u957f\uff0c\u8fd9\u4e00\u5dee\u8ddd\u6b63\u5728\u7f29\u5c0f\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/03.%20vision-language-action%20models/#_4","title":"\u4e0e\u5f62\u6001\u65e0\u5173\u7684\u6a21\u578b","text":"<ul> <li> <p>\u8be5\u9886\u57df\u6b63\u671d\u7740\"\u4e00\u4e2a\u6a21\u578b\uff0c\u591a\u79cd\u673a\u5668\u4eba\"\u7684\u65b9\u5411\u53d1\u5c55\u3002\u4e0d\u518d\u4e3a\u6bcf\u4e2a\u673a\u5668\u4eba\u8bad\u7ec3\u5355\u72ec\u7684\u7b56\u7565\uff0c\u800c\u662f\u5355\u4e2aVLA\u5904\u7406\u591a\u79cd\u5f62\u6001\u3002</p> </li> <li> <p>\u8fd9\u9700\u8981\u89e3\u51b3\u52a8\u4f5c\u7a7a\u95f4\u4e0d\u5339\u914d\u95ee\u9898\u3002\u4e00\u4e2a7\u81ea\u7531\u5ea6\u624b\u81c2\u5e26\u5e73\u884c\u5939\u722a\u67097\u4e2a\u52a8\u4f5c\u7ef4\u5ea6\u3002\u53cc\u81c2\u8bbe\u7f6e\u662f14\u4e2a\u3002\u56db\u8db3\u673a\u5668\u4eba\u670912\u4e2a\u3002\u7c7b\u4eba\u673a\u5668\u4eba\u670930\u4e2a\u4ee5\u4e0a\u3002\u52a8\u4f5c\u6807\u8bb0\u5316\u5fc5\u987b\u8db3\u591f\u7075\u6d3b\u4ee5\u5904\u7406\u6240\u6709\u8fd9\u4e9b\u3002</p> </li> <li> <p>\u89e3\u51b3\u65b9\u6848\u5305\u62ec\uff1a</p> <ul> <li>\u586b\u5145\u52a8\u4f5c\u5411\u91cf\uff1a\u4f7f\u7528\u6700\u5927\u7684\u52a8\u4f5c\u7a7a\u95f4\uff0c\u8f83\u5c0f\u7684\u7528\u96f6\u586b\u5145\u3002</li> <li>\u6bcf\u79cd\u5f62\u6001\u7684\u52a8\u4f5c\u5934\uff1a\u5171\u4eab\u7684transformer\u4e3b\u5e72\u7f51\u7edc\uff0c\u6bcf\u79cd\u673a\u5668\u4eba\u7c7b\u578b\u6709\u5355\u72ec\u7684\u5c0f\u578bMLP\u3002</li> <li>\u5f52\u4e00\u5316\u52a8\u4f5c\u8868\u793a\uff1a\u5728\u5171\u540c\u6846\u67b6\u4e2d\u8868\u793a\u6240\u6709\u52a8\u4f5c\uff08\u5982\u4e16\u754c\u5750\u6807\u7cfb\u4e2d\u7684\u672b\u7aef\u6267\u884c\u5668\u901f\u5ea6\uff09\uff0c\u4f7f\u4ea7\u751f\u7c7b\u4f3c\u672b\u7aef\u6267\u884c\u5668\u8fd0\u52a8\u7684\u4e0d\u540c\u673a\u5668\u4eba\u5171\u4eab\u76f8\u540c\u7684\u52a8\u4f5c\u6807\u8bb0\u3002</li> </ul> </li> <li> <p>\u5171\u4eab\u4e3b\u5e72\u7f51\u7edc\u5b66\u4e60\u901a\u7528\u7684\u89c6\u89c9\u548c\u8bed\u8a00\u7406\u89e3\uff0c\u52a0\u4e0a\u901a\u7528\u7684\u64cd\u4f5c\u7b56\u7565\uff08\u4ece\u4e0a\u65b9\u63a5\u8fd1\u3001\u5bf9\u9f50\u7269\u4f53\u3001\u95ed\u5408\u5939\u722a\uff09\u3002\u7279\u5b9a\u4e8e\u5f62\u6001\u7684\u7ec4\u4ef6\u53ea\u9700\u8981\u5c06\u8fd9\u4e9b\u9ad8\u5c42\u7b56\u7565\u8f6c\u5316\u4e3a\u5177\u4f53\u7684\u7535\u673a\u547d\u4ee4\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/03.%20vision-language-action%20models/#_5","title":"\u57fa\u51c6\u6d4b\u8bd5\u4e0e\u8bc4\u4f30","text":"<ul> <li> <p>\u8bc4\u4f30VLA\u5177\u6709\u72ec\u7279\u7684\u6311\u6218\u6027\uff0c\u56e0\u4e3a\u5b83\u9700\u8981\u7269\u7406\u673a\u5668\u4eba\u5b9e\u9a8c\uff08\u6216\u9ad8\u4fdd\u771f\u4eff\u771f\uff09\u3002</p> </li> <li> <p>SIMPLER\uff08\u673a\u5668\u4eba\u5b66\u4e60\u6a21\u62df\u64cd\u4f5c\u7b56\u7565\u8bc4\u4f30\uff09\u63d0\u4f9b\u4e86\u6807\u51c6\u5316\u7684\u4eff\u771f\u73af\u5883\uff0c\u65e0\u9700\u7269\u7406\u786c\u4ef6\u5373\u53ef\u6bd4\u8f83VLA\u6027\u80fd\u3002\u5b83\u4e0e\u73b0\u5b9e\u4e16\u754c\u7684\u6210\u529f\u7387\u76f8\u5173\u6027\u826f\u597d\uff0c\u5e76\u5b9e\u73b0\u4e86\u53ef\u590d\u73b0\u7684\u57fa\u51c6\u6d4b\u8bd5\u3002</p> </li> <li> <p>\u73b0\u5b9e\u4e16\u754c\u8bc4\u4f30\u4ecd\u7136\u662f\u91d1\u6807\u51c6\u3002\u5178\u578b\u534f\u8bae\uff1a</p> <ol> <li>\u5b9a\u4e49\u4e00\u7ec4\u5177\u6709\u660e\u786e\u6210\u529f\u6807\u51c6\u7684\u4efb\u52a1\uff08\u7269\u4f53\u5230\u8fbe\u76ee\u6807\u4f4d\u7f6e\u3001\u9009\u62e9\u6b63\u786e\u7269\u4f53\u3001\u5728\u65f6\u9650\u5185\u5b8c\u6210\u4efb\u52a1\uff09\u3002</li> <li>\u6bcf\u6b21\u4efb\u52a1\u8fd0\u884c\\(N\\)\u6b21\u8bd5\u9a8c\uff08\u901a\u5e3810-50\u6b21\uff09\u3002</li> <li>\u62a5\u544a\u6210\u529f\u7387\u53ca\u7f6e\u4fe1\u533a\u95f4\u3002</li> <li>\u5305\u62ec\u4fdd\u7559\u4efb\u52a1\uff08\u4ece\u672a\u8bad\u7ec3\u8fc7\u7684\uff09\u4ee5\u8861\u91cf\u6cdb\u5316\u80fd\u529b\u3002</li> </ol> </li> <li> <p>Open X-Embodiment\u6570\u636e\u96c6\u548c\u57fa\u51c6\u6d4b\u8bd5\u6c47\u603b\u4e86\u6765\u81ea22\u4e2a\u673a\u6784\u3001\u8de8\u8d8a\u591a\u4e2a\u673a\u5668\u4eba\u5e73\u53f0\u7684\u673a\u5668\u4eba\u6570\u636e\u3002\u5b83\u63d0\u4f9b\u4e86\u5171\u4eab\u793a\u8303\u7684\u6807\u51c6\u683c\u5f0f\u548c\u7528\u4e8e\u8de8\u5f62\u6001\u8fc1\u79fb\u7684\u901a\u7528\u8bc4\u4f30\u5957\u4ef6\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/03.%20vision-language-action%20models/#colabnotebook","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216notebook\uff09","text":"<ol> <li> <p>\u5b9e\u73b0\u52a8\u4f5c\u6807\u8bb0\u5316\uff1a\u5c06\u8fde\u7eed\u52a8\u4f5c\u79bb\u6563\u5316\u4e3a\u7bb1\u5e76\u91cd\u5efa\u3002\u89c2\u5bdf\u91cf\u5316\u8bef\u5dee\u968f\u7bb1\u6570\u91cf\u7684\u53d8\u5316\u3002 <pre><code>import jax.numpy as jnp\n\n# \u8fde\u7eed\u52a8\u4f5c\uff1a7\u4e2a\u7ef4\u5ea6\uff086\u81ea\u7531\u5ea6+\u5939\u722a\uff09\naction_true = jnp.array([0.023, -0.051, 0.012, 0.1, -0.03, 0.005, 0.8])\naction_min = jnp.array([-0.1, -0.1, -0.1, -0.5, -0.5, -0.5, 0.0])\naction_max = jnp.array([ 0.1,  0.1,  0.1,  0.5,  0.5,  0.5, 1.0])\n\nfor n_bins in [16, 64, 256, 1024]:\n    # \u6807\u8bb0\u5316\uff1a\u5c06\u8fde\u7eed\u503c\u6620\u5c04\u4e3a\u7bb1\u7d22\u5f15\n    normalised = (action_true - action_min) / (action_max - action_min)\n    tokens = jnp.clip((normalised * n_bins).astype(int), 0, n_bins - 1)\n\n    # \u53bb\u6807\u8bb0\u5316\uff1a\u5c06\u7bb1\u7d22\u5f15\u6620\u5c04\u56de\u8fde\u7eed\u503c\n    reconstructed = (tokens + 0.5) / n_bins * (action_max - action_min) + action_min\n\n    error = jnp.linalg.norm(action_true - reconstructed)\n    print(f\"\u7bb1\u6570={n_bins:4d}  \u6807\u8bb0={tokens}  \u8bef\u5dee={error:.6f}\")\n</code></pre></p> </li> <li> <p>\u6a21\u62df\u52a8\u4f5c\u5206\u5757\u4e0e\u5355\u6b65\u9884\u6d4b\u7684\u6bd4\u8f83\u3002\u751f\u6210\u5e73\u6ed1\u8f68\u8ff9\uff0c\u5411\u5355\u6b65\u9884\u6d4b\u6dfb\u52a0\u566a\u58f0\uff0c\u5e76\u4e0e\u5206\u5757\u9884\u6d4b\u6bd4\u8f83\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u771f\u5b9e\u5e73\u6ed1\u8f68\u8ff9\uff08\u4f8b\u5982\uff0c\u4f38\u624b\u52a8\u4f5c\uff09\nt = jnp.linspace(0, 2 * jnp.pi, 100)\ngt_x = jnp.sin(t)\ngt_y = 1 - jnp.cos(t)\n\n# \u5355\u6b65\uff1a\u6bcf\u6b21\u9884\u6d4b\u6709\u72ec\u7acb\u566a\u58f0\nrng = jax.random.PRNGKey(42)\nnoise_ss = jax.random.normal(rng, (100, 2)) * 0.05\nsingle_step = jnp.stack([gt_x, gt_y], axis=1) + noise_ss\n# \u5355\u6b65\u8bef\u5dee\u7d2f\u79ef\u6f02\u79fb\nsingle_step_cumulative = jnp.cumsum(noise_ss, axis=0) * 0.3 + jnp.stack([gt_x, gt_y], axis=1)\n\n# \u5206\u5757\uff08\u5757\u5927\u5c0f=10\uff09\uff1a\u5757\u5185\u566a\u58f0\u5173\u8054\uff0c\u66f4\u5e73\u6ed1\nchunk_size = 10\nrng2 = jax.random.PRNGKey(7)\nchunks = []\nfor i in range(0, 100, chunk_size):\n    chunk_noise = jax.random.normal(jax.random.fold_in(rng2, i), (2,)) * 0.05\n    chunk = jnp.stack([gt_x[i:i+chunk_size], gt_y[i:i+chunk_size]], axis=1)\n    chunks.append(chunk + chunk_noise)\nchunked = jnp.concatenate(chunks, axis=0)\n\nplt.figure(figsize=(8, 4))\nplt.plot(gt_x, gt_y, \"k-\", linewidth=2, label=\"\u771f\u5b9e\u8f68\u8ff9\")\nplt.plot(single_step_cumulative[:, 0], single_step_cumulative[:, 1],\n         \"r-\", alpha=0.7, label=\"\u5355\u6b65\uff08\u6f02\u79fb\uff09\")\nplt.plot(chunked[:, 0], chunked[:, 1], \"b-\", alpha=0.7, label=\"\u5206\u5757\uff08\u7a33\u5b9a\uff09\")\nplt.legend(); plt.axis(\"equal\"); plt.grid(True)\nplt.title(\"\u52a8\u4f5c\u5206\u5757 vs \u5355\u6b65\u9884\u6d4b\")\nplt.show()\n</code></pre></p> </li> <li> <p>\u53ef\u89c6\u5316VLA\u52a8\u4f5c\u5206\u5e03\u5982\u4f55\u662f\u591a\u6a21\u6001\u7684\u3002\u4f7f\u7528\u7b80\u5355\u76842D\u9ad8\u65af\u6df7\u5408\u6765\u5c55\u793a\u4e3a\u4ec0\u4e48\u6269\u6563/\u6d41\u5339\u914d\u52a8\u4f5c\u5934\u4f18\u4e8e\u56de\u5f52\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u7ed5\u8fc7\u969c\u788d\u7269\u7684\u4e24\u79cd\u6709\u6548\u65b9\u5f0f\uff1a\u5de6\u8fb9\u6216\u53f3\u8fb9\nrng = jax.random.PRNGKey(0)\nk1, k2 = jax.random.split(rng)\n\nmode1 = jax.random.normal(k1, (200, 2)) * 0.15 + jnp.array([-1.0, 0.5])\nmode2 = jax.random.normal(k2, (200, 2)) * 0.15 + jnp.array([ 1.0, 0.5])\nsamples = jnp.concatenate([mode1, mode2])\n\n# \u56de\u5f52\u9884\u6d4b\u5747\u503c = \u6a21\u6001\u7684\u5747\u503c\uff08\u65e0\u6548\uff01\uff09\nmean_pred = samples.mean(axis=0)\n\nplt.figure(figsize=(6, 5))\nplt.scatter(samples[:, 0], samples[:, 1], s=5, alpha=0.5, label=\"\u771f\u5b9e\u52a8\u4f5c\u5206\u5e03\")\nplt.plot(*mean_pred, \"rx\", markersize=15, markeredgewidth=3, label=\"\u56de\u5f52\u5747\u503c\uff08\u65e0\u6548\uff01\uff09\")\nplt.plot(-1, 0.5, \"g^\", markersize=12, label=\"\u6a21\u60011\uff08\u5411\u5de6\uff09\")\nplt.plot(1, 0.5, \"b^\", markersize=12, label=\"\u6a21\u60012\uff08\u5411\u53f3\uff09\")\nplt.legend(); plt.grid(True)\nplt.title(\"\u591a\u6a21\u6001\u52a8\u4f5c\uff1a\u4e3a\u4ec0\u4e48\u56de\u5f52\u5931\u8d25\")\nplt.xlabel(\"\u52a8\u4f5c\u7ef4\u5ea61\"); plt.ylabel(\"\u52a8\u4f5c\u7ef4\u5ea62\")\nplt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2011%3A%20autonomous%20systems/04.%20self-driving/","title":"\u81ea\u52a8\u9a7e\u9a76\u6c7d\u8f66","text":"<p>\u81ea\u52a8\u9a7e\u9a76\u6c7d\u8f66\u662f\u5546\u4e1a\u4e0a\u6700\u5148\u8fdb\u7684\u81ea\u4e3b\u7cfb\u7edf\uff0c\u5c06\u611f\u77e5\u3001\u9884\u6d4b\u3001\u89c4\u5212\u548c\u63a7\u5236\u96c6\u6210\u5230\u5355\u4e2a\u8f66\u8f86\u4e2d\u3002\u672c\u7ae0\u6db5\u76d6\u81ea\u52a8\u9a7e\u9a76\u5806\u6808\u3001\u9ad8\u7cbe\u5730\u56fe\u3001\u8fd0\u52a8\u9884\u6d4b\u3001\u89c4\u5212\u3001\u7aef\u5230\u7aef\u9a7e\u9a76\u3001\u4eff\u771f\u3001\u5b89\u5168\u6807\u51c6\u548c\u81ea\u4e3b\u7b49\u7ea7\u3002</p> <ul> <li> <p>\u81ea\u52a8\u9a7e\u9a76\u6c7d\u8f66\u53ef\u4ee5\u8bf4\u662f\u6b63\u5728\u5927\u89c4\u6a21\u5c1d\u8bd5\u7684\u6700\u56f0\u96be\u7684\u673a\u5668\u4eba\u95ee\u9898\u3002\u4e0e\u5728\u53d7\u63a7\u73af\u5883\u4e2d\u8fd0\u884c\u7684\u5de5\u5382\u673a\u5668\u4eba\u4e0d\u540c\uff0c\u81ea\u52a8\u9a7e\u9a76\u6c7d\u8f66\u5fc5\u987b\u5904\u7406\u4e00\u4e2a\u5f00\u653e\u4e16\u754c\uff1a\u4e0d\u53ef\u9884\u6d4b\u7684\u4eba\u7c7b\u9a7e\u9a76\u5458\u3001\u4e71\u7a7f\u9a6c\u8def\u7684\u884c\u4eba\u3001\u4e00\u591c\u4e4b\u95f4\u51fa\u73b0\u7684\u65bd\u5de5\u533a\u57df\u4ee5\u53ca\u6bcf\u5206\u949f\u90fd\u5728\u53d8\u5316\u7684\u5929\u6c14\u3002</p> </li> <li> <p>\u5176\u98ce\u9669\u4e5f\u5f02\u5e38\u4e4b\u9ad8\u3002\u81ea\u52a8\u9a7e\u9a76\u6c7d\u8f66\u5728\u9ad8\u901f\u516c\u8def\u4e0a\u884c\u9a76\uff0c\u5468\u56f4\u662f\u8106\u5f31\u7684\u9053\u8def\u4f7f\u7528\u8005\u3002\u5bf9\u4e8e\u5b89\u5168\u5173\u952e\u7684\u6545\u969c\uff0c\u8bef\u5dee\u5bb9\u9650\u51e0\u4e4e\u4e3a\u96f6\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/04.%20self-driving/#_2","title":"\u81ea\u52a8\u9a7e\u9a76\u5806\u6808","text":"<ul> <li>\u7ecf\u5178\u7684\u81ea\u52a8\u9a7e\u9a76\u67b6\u6784\u662f\u4e00\u4e2a\u6a21\u5757\u5316\u6d41\u6c34\u7ebf\uff0c\u5305\u542b\u56db\u4e2a\u9636\u6bb5\uff0c\u6bcf\u4e2a\u9636\u6bb5\u4f5c\u4e3a\u4e0b\u4e00\u4e2a\u9636\u6bb5\u7684\u8f93\u5165\uff1a</li> </ul> \\[\\\\text{\u611f\u77e5} \\\\to \\\\text{\u9884\u6d4b} \\\\to \\\\text{\u89c4\u5212} \\\\to \\\\text{\u63a7\u5236}\\] <ul> <li> <p>\u611f\u77e5\uff08\u672c\u7ae0\u6587\u4ef61\u4e2d\u5df2\u4ecb\u7ecd\uff09\u5c06\u539f\u59cb\u4f20\u611f\u5668\u6570\u636e\u5904\u7406\u4e3a\u7ed3\u6784\u5316\u7684\u573a\u666f\u8868\u793a\uff1a\u5e26\u67093D\u4f4d\u7f6e\u3001\u901f\u5ea6\u548c\u7c7b\u522b\u6807\u7b7e\u7684\u68c0\u6d4b\u7269\u4f53\uff1b\u8f66\u9053\u6807\u7ebf\uff1b\u4ea4\u901a\u4fe1\u53f7\u706f\uff1b\u53ef\u884c\u9a76\u8868\u9762\u8fb9\u754c\u3002</p> </li> <li> <p>\u9884\u6d4b\u9884\u6d4b\u5176\u4ed6\u4ea4\u901a\u53c2\u4e0e\u8005\uff08\u8f66\u8f86\u3001\u884c\u4eba\u3001\u9a91\u884c\u8005\uff09\u672a\u6765\u5c06\u5982\u4f55\u79fb\u52a8\u3002\u7ed9\u5b9a\u573a\u666f\u7684\u5f53\u524d\u72b6\u6001\uff0c\u9884\u6d4b\u6a21\u5757\u4e3a\u6bcf\u4e2a\u4ea4\u901a\u53c2\u4e0e\u8005\u8f93\u51fa\u672a\u6765\u4e00\u6bb5\u65f6\u95f4\uff08\u901a\u5e383-8\u79d2\uff09\u7684\u8f68\u8ff9\u3002</p> </li> <li> <p>\u89c4\u5212\u51b3\u5b9a\u4e3b\u8f66\u5e94\u8be5\u505a\u4ec0\u4e48\uff1a\u8d70\u54ea\u6761\u8def\u5f84\u3001\u4f55\u65f6\u53d8\u9053\u3001\u4f55\u65f6\u8ba9\u884c\u3001\u4f55\u65f6\u52a0\u901f\u6216\u5239\u8f66\u3002\u5b83\u63a5\u6536\u9884\u6d4b\u7684\u573a\u666f\uff0c\u4e3a\u4e3b\u8f66\u751f\u6210\u4e00\u6761\u5b89\u5168\u3001\u8212\u9002\u4e14\u5411\u76ee\u7684\u5730\u524d\u8fdb\u7684\u8f68\u8ff9\u3002</p> </li> <li> <p>\u63a7\u5236\u5c06\u89c4\u5212\u7684\u8f68\u8ff9\u8f6c\u5316\u4e3a\u6267\u884c\u5668\u547d\u4ee4\uff1a\u8f6c\u5411\u89d2\u3001\u6cb9\u95e8\u548c\u5239\u8f66\u3002\u8fd9\u662f\u6700\u5e95\u5c42\uff0c\u5c06\u62bd\u8c61\u8f68\u8ff9\u8f6c\u5316\u4e3a\u7269\u7406\u8fd0\u52a8\u3002</p> </li> <li> <p>\u6a21\u5757\u5316\u8bbe\u8ba1\u6709\u660e\u786e\u7684\u5de5\u7a0b\u4f18\u52bf\uff1a\u6bcf\u4e2a\u6a21\u5757\u53ef\u4ee5\u72ec\u7acb\u5f00\u53d1\u3001\u6d4b\u8bd5\u548c\u6539\u8fdb\u3002\u4f46\u5b83\u4e5f\u6709\u5f31\u70b9\uff1a\u8bef\u5dee\u5411\u4e0b\u6e38\u4f20\u64ad\uff08\u6f0f\u68c0\u5bf9\u89c4\u5212\u5668\u662f\u4e0d\u53ef\u89c1\u7684\uff09\uff0c\u5e76\u4e14\u4fe1\u606f\u5728\u6bcf\u4e2a\u63a5\u53e3\u5904\u4e22\u5931\uff08\u89c4\u5212\u5668\u770b\u5230\u7684\u662f\u8fb9\u754c\u6846\uff0c\u800c\u4e0d\u662f\u4ea7\u751f\u5b83\u4eec\u7684\u4e30\u5bcc\u4f20\u611f\u5668\u6570\u636e\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/04.%20self-driving/#_3","title":"\u9ad8\u7cbe\u5730\u56fe","text":"<ul> <li> <p>\u9ad8\u7cbe\uff08HD\uff09\u5730\u56fe\u662f\u8be6\u7ec6\u3001\u5398\u7c73\u7ea7\u7cbe\u5ea6\u7684\u6570\u5b57\u5730\u56fe\uff0c\u7f16\u7801\u9053\u8def\u7ed3\u6784\uff1a\u8f66\u9053\u8fb9\u754c\u3001\u8f66\u9053\u8fde\u901a\u6027\uff08\u54ea\u4e2a\u8f66\u9053\u5728\u4ea4\u53c9\u53e3\u8fde\u63a5\u5230\u54ea\u4e2a\uff09\u3001\u4ea4\u901a\u6807\u5fd7\u4f4d\u7f6e\u3001\u9650\u901f\u3001\u4eba\u884c\u6a2a\u9053\u4f4d\u7f6e\u548c\u8def\u9762\u9ad8\u7a0b\u3002</p> </li> <li> <p>\u9ad8\u7cbe\u5730\u56fe\u4e3a\u9a7e\u9a76\u4efb\u52a1\u63d0\u4f9b\u4e86\u5f3a\u6709\u529b\u7684\u5148\u9a8c\u3002\u611f\u77e5\u6a21\u5757\u4e0d\u9700\u8981\u6bcf\u5e27\u4ece\u5934\u53d1\u73b0\u8f66\u9053\u8fb9\u754c\uff1b\u5b83\u53ea\u9700\u8981\u5c06\u8f66\u8f86\u5728\u5730\u56fe\u4e2d\u8fdb\u884c\u5b9a\u4f4d\uff0c\u5e76\u9a8c\u8bc1\u73b0\u5b9e\u662f\u5426\u4e0e\u5b58\u50a8\u7684\u7ed3\u6784\u5339\u914d\u3002\u8fd9\u6781\u5927\u5730\u7b80\u5316\u4e86\u89c4\u5212\u3002</p> </li> <li> <p>\u6784\u5efa\u9ad8\u7cbe\u5730\u56fe\u9700\u8981\u914d\u5907\u9ad8\u7aefLiDAR\u3001\u76f8\u673a\u548cRTK-GPS\u7684\u4e13\u4e1a\u6d4b\u91cf\u8f66\u8f86\u3002\u5730\u56fe\u5fc5\u987b\u968f\u7740\u9053\u8def\u53d8\u5316\u800c\u7ef4\u62a4\u548c\u66f4\u65b0\u3002\u8fd9\u5f88\u6602\u8d35\uff0c\u4e14\u4e0d\u5bb9\u6613\u6269\u5c55\u5230\u5730\u7403\u4e0a\u7684\u6bcf\u6761\u9053\u8def\u3002</p> </li> <li> <p>\u65e0\u56fe\u9a7e\u9a76\uff08\u4e5f\u79f0\u4e3a\"\u5728\u7ebf\u5730\u56fe\u6784\u5efa\"\uff09\u65e8\u5728\u6d88\u9664\u5bf9\u9884\u5efa\u9ad8\u7cbe\u5730\u56fe\u7684\u4f9d\u8d56\u3002\u8f66\u8f86\u4ece\u4f20\u611f\u5668\u5b9e\u65f6\u6784\u5efa\u5c40\u90e8\u5730\u56fe\u3002\u50cfMapTR\u548cMapTRv2\u8fd9\u6837\u7684\u6a21\u578b\u4f7f\u7528transformer\u67b6\u6784\u76f4\u63a5\u4ece\u76f8\u673a\u56fe\u50cf\u9884\u6d4b\u77e2\u91cf\u5316\u5730\u56fe\u5143\u7d20\uff08\u8f66\u9053\u4e2d\u5fc3\u7ebf\u3001\u9053\u8def\u8fb9\u754c\u3001\u4eba\u884c\u6a2a\u9053\uff09\uff0c\u5c06\u591a\u6bb5\u7ebf\u8f93\u51fa\u4e3a\u6709\u5e8f\u70b9\u5e8f\u5217\u3002</p> </li> <li> <p>\u65e0\u56fe\u65b9\u6cd5\u7528\u5730\u56fe\u7cbe\u5ea6\u6362\u53d6\u53ef\u6269\u5c55\u6027\uff1a\u4efb\u4f55\u6c7d\u8f66\u80fd\u884c\u9a76\u7684\u9053\u8def\uff0c\u5b83\u90fd\u80fd\u5efa\u56fe\u3002\u4f46\u5b83\u8981\u6c42\u611f\u77e5\u7cfb\u7edf\u8db3\u591f\u9c81\u68d2\uff0c\u80fd\u591f\u5b9e\u65f6\u68c0\u6d4b\u6240\u6709\u76f8\u5173\u7684\u9053\u8def\u7ed3\u6784\uff0c\u5305\u62ec\u5728\u590d\u6742\u4ea4\u53c9\u53e3\u3001\u9ad8\u901f\u516c\u8def\u531d\u9053\u548c\u65bd\u5de5\u533a\u57df\u4e2d\u3002</p> </li> <li> <p>\u5728\u5b9e\u8df5\u4e2d\uff0c\u8bb8\u591a\u7cfb\u7edf\u91c7\u7528\u6df7\u5408\u65b9\u6cd5\uff1a\u8f7b\u91cf\u7ea7\u5730\u56fe\u5305\u542b\u7c97\u7565\u7684\u9053\u8def\u62d3\u6251\uff08\u6765\u81ea\u73b0\u6709\u5730\u56fe\u63d0\u4f9b\u5546\uff09\uff0c\u5e76\u901a\u8fc7\u8f66\u8f86\u7684\u4f20\u611f\u5668\u5b9e\u65f6\u4e30\u5bcc\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/04.%20self-driving/#_4","title":"\u8fd0\u52a8\u9884\u6d4b","text":"<ul> <li> <p>\u9884\u6d4b\u5176\u4ed6\u9053\u8def\u4f7f\u7528\u8005\u5c06\u53bb\u54ea\u91cc\u662f\u81ea\u52a8\u9a7e\u9a76\u4e2d\u6700\u56f0\u96be\u7684\u5b50\u95ee\u9898\u4e4b\u4e00\u3002\u4eba\u7c7b\u4e0d\u53ef\u9884\u6d4b\uff0c\u610f\u56fe\u662f\u9690\u85cf\u7684\uff0c\u672a\u6765\u53ef\u80fd\u6027\u7684\u7a7a\u95f4\u8fc5\u901f\u5206\u53c9\u3002</p> </li> <li> <p>\u9884\u6d4b\u6a21\u578b\u7684\u8f93\u5165\u662f\u573a\u666f\u4e0a\u4e0b\u6587\uff1a\u6240\u6709\u68c0\u6d4b\u5230\u7684\u53c2\u4e0e\u8005\u5728\u8fd1\u671f\u8fc7\u53bb\uff08\u901a\u5e381-2\u79d2\u7684\u5386\u53f2\uff09\u7684\u4f4d\u7f6e\u548c\u901f\u5ea6\uff0c\u52a0\u4e0a\u9759\u6001\u4e0a\u4e0b\u6587\uff08\u8f66\u9053\u51e0\u4f55\u3001\u4ea4\u901a\u4fe1\u53f7\u3001\u9053\u8def\u8fb9\u754c\uff09\u3002</p> </li> <li> <p>\u8f93\u51fa\u662f\u6bcf\u4e2a\u53c2\u4e0e\u8005\u7684\u4e00\u7ec4\u9884\u6d4b\u8f68\u8ff9\uff0c\u901a\u5e38\u8986\u76d6\u672a\u67653-8\u79d2\u3002\u7531\u4e8e\u672a\u6765\u662f\u4e0d\u786e\u5b9a\u7684\uff0c\u597d\u7684\u9884\u6d4b\u6a21\u578b\u8f93\u51fa\u591a\u6761\u53ef\u80fd\u7684\u8f68\u8ff9\u53ca\u5176\u76f8\u5173\u6982\u7387\uff0c\u800c\u4e0d\u662f\u5355\u4e00\u7684\u70b9\u4f30\u8ba1\u3002</p> </li> <li> <p>\u8f68\u8ff9\u9884\u6d4b\u4f5c\u4e3a\u4e00\u4e2a\u56de\u5f52\u95ee\u9898\uff1a\u9884\u6d4b\u6bcf\u4e2a\u53c2\u4e0e\u8005\u5728\u79bb\u6563\u672a\u6765\u65f6\u95f4\u6b65\u7684\\((x, y)\\)\u5750\u6807\u3002\u635f\u5931\u901a\u5e38\u662f\\(K\\)\u6761\u9884\u6d4b\u8f68\u8ff9\u4e0a\u7684\u6700\u5c0f\u5e73\u5747\u4f4d\u79fb\u8bef\u5dee\uff08minADE\uff09\uff1a</p> </li> </ul> \\[\\\\text{minADE}_K = \\\\min_{k \\\\in \\\\{1, \\\\ldots, K\\\\}} \\\\frac{1}{T} \\\\sum_{t=1}^{T} \\\\| \\\\hat{\\\\mathbf{p}}_t^{(k)} - \\\\mathbf{p}_t \\\\|_2\\] <ul> <li> <p>\u8fd9\u662f\u4e00\u4e2a\"\u6700\u4f73\\(K\\)\u4e2a\"\u6307\u6807\uff1a\u5982\u679c\u6a21\u578b\u7684\\(K\\)\u4e2a\u9884\u6d4b\u4e2d\u6709\u4e00\u4e2a\u63a5\u8fd1\u771f\u5b9e\u503c\uff0c\u6a21\u578b\u5c31\u5f97\u5206\u3002\u8fd9\u9f13\u52b1\u591a\u6837\u5316\u7684\u591a\u6a21\u6001\u9884\u6d4b\u3002</p> </li> <li> <p>\u793e\u4f1a\u529b\u6a21\u578b\u5c06\u884c\u4eba\u884c\u4e3a\u5efa\u6a21\u4e3a\u52a8\u529b\u7cfb\u7edf\uff0c\u5176\u4e2d\u6bcf\u4e2a\u4eba\u53d7\u5230\u5438\u5f15\u529b\uff08\u671d\u5411\u76ee\u6807\uff09\u548c\u6392\u65a5\u529b\uff08\u8fdc\u79bb\u5176\u4ed6\u884c\u4eba\u548c\u969c\u788d\u7269\uff09\u3002\u884c\u4eba\\(i\\)\u7684\u52a0\u901f\u5ea6\u4e3a\uff1a</p> </li> </ul> \\[\\\\mathbf{a}_i = \\\\frac{\\\\mathbf{v}_i^{\\\\text{\u671f\u671b}} - \\\\mathbf{v}_i}{\\\\tau} + \\\\sum_{j \\\\neq i} \\\\mathbf{f}_{ij}^{\\\\text{\u6392\u65a5}} + \\\\sum_{\\\\text{\u5899\u58c1}} \\\\mathbf{f}_{\\\\text{\u5899\u58c1}}\\] <ul> <li> <p>\u8fd9\u662f\u4e00\u4e2a\u4e0e\u672c\u7ae0\u6587\u4ef62\u4e2d\u7684\u673a\u5668\u4eba\u52a8\u529b\u5b66\u65b9\u7a0b\u7c7b\u4f3c\u7684\u5fae\u5206\u65b9\u7a0b\u7ec4\u3002\u8be5\u6a21\u578b\u4f18\u96c5\u4f46\u4f9d\u8d56\u4e8e\u624b\u5de5\u8c03\u8c10\u7684\u529b\u53c2\u6570\uff0c\u5e76\u4e14\u5728\u590d\u6742\u591a\u667a\u80fd\u4f53\u4ea4\u4e92\u4e2d\u8868\u73b0\u4e0d\u4f73\u3002</p> </li> <li> <p>\u56fe\u795e\u7ecf\u7f51\u7edc\uff08GNN\uff09\u7528\u4e8e\u9884\u6d4b\u65f6\u5c06\u573a\u666f\u5efa\u6a21\u4e3a\u56fe\uff1a\u6bcf\u4e2a\u53c2\u4e0e\u8005\u662f\u4e00\u4e2a\u8282\u70b9\uff0c\u8fb9\u8868\u793a\u7a7a\u95f4\u5173\u7cfb\uff08\u90bb\u8fd1\u5ea6\u3001\u5171\u4eab\u8f66\u9053\uff09\u3002\u8282\u70b9\u4e4b\u95f4\u7684\u6d88\u606f\u4f20\u9012\u6355\u83b7\u4ea4\u4e92\uff1a\"\u8fd9\u8f86\u8f66\u6b63\u5728\u7ed9\u90a3\u4e2a\u884c\u4eba\u8ba9\u884c\"\u6216\"\u8fd9\u4e24\u8f86\u8f66\u6b63\u5728\u6c47\u5165\u540c\u4e00\u6761\u8f66\u9053\u3002\"</p> </li> <li> <p>\u73b0\u4ee3\u9884\u6d4b\u67b6\u6784\uff08\u4f8b\u5982MTR\u3001QCNet\uff09\u4f7f\u7528\u57fa\u4e8etransformer\u7684\u6a21\u578b\uff0c\u8054\u5408\u63a8\u7406\u53c2\u4e0e\u8005\u5386\u53f2\u3001\u5730\u56fe\u4e0a\u4e0b\u6587\u548c\u53c2\u4e0e\u8005\u4e4b\u95f4\u7684\u4ea4\u4e92\u3002\u53c2\u4e0e\u8005\u901a\u8fc7\u4ea4\u53c9\u6ce8\u610f\u529b\u5173\u6ce8\u76f8\u5173\u7684\u5730\u56fe\u7279\u5f81\uff08\u5f53\u524d\u8f66\u9053\u3001\u5373\u5c06\u5230\u6765\u7684\u4ea4\u53c9\u53e3\uff09\u548c\u5176\u4ed6\u53c2\u4e0e\u8005\uff08\u524d\u8f66\u3001\u4eba\u884c\u6a2a\u9053\u4e0a\u7684\u884c\u4eba\uff09\u3002\u8f93\u51fa\u662f\u4e00\u7ec4\u901a\u8fc7\u81ea\u56de\u5f52\u751f\u6210\u6216\u6df7\u5408\u6a21\u578b\u4ea7\u751f\u7684\u8f68\u8ff9\u5047\u8bbe\u3002</p> </li> <li> <p>\u76ee\u6807\u6761\u4ef6\u9884\u6d4b\u9996\u5148\u9884\u6d4b\u53c2\u4e0e\u8005\u53ef\u80fd\u53bb\u54ea\u91cc\uff08\u4e00\u7ec4\u5019\u9009\u76ee\u6807\u70b9\uff0c\u5982\u8f66\u9053\u7aef\u70b9\u6216\u4ea4\u53c9\u53e3\u51fa\u53e3\uff09\uff0c\u7136\u540e\u9884\u6d4b\u5230\u8fbe\u6bcf\u4e2a\u76ee\u6807\u7684\u8f68\u8ff9\u3002\u8fd9\u5c06\u95ee\u9898\u5206\u89e3\u4e3a\"\u53bb\u54ea\u91cc\"\uff08\u79bb\u6563\u7684\u3001\u53ef\u7ba1\u7406\u7684\uff09\u548c\"\u600e\u4e48\u53bb\"\uff08\u7ed9\u5b9a\u76ee\u6807\u7684\u8fde\u7eed\u8def\u5f84\uff09\uff0c\u4f7f\u591a\u6a21\u6001\u9884\u6d4b\u95ee\u9898\u66f4\u52a0\u53ef\u89e3\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/04.%20self-driving/#_5","title":"\u89c4\u5212","text":"<ul> <li> <p>\u7ed9\u5b9a\u9884\u6d4b\u7684\u573a\u666f\uff0c\u89c4\u5212\u5668\u5fc5\u987b\u4e3a\u4e3b\u8f66\u751f\u6210\u4e00\u6761\u8f68\u8ff9\u3002\u8fd9\u662f\u4e00\u4e2a\u7ea6\u675f\u4f18\u5316\u95ee\u9898\uff1a\u627e\u5230\u4e00\u6761\u5b89\u5168\u3001\u8212\u9002\u3001\u9ad8\u6548\u4e14\u5408\u6cd5\u7684\u8f68\u8ff9\u3002</p> </li> <li> <p>\u57fa\u4e8e\u89c4\u5219\u7684\u89c4\u5212\u5668\u5c06\u9a7e\u9a76\u884c\u4e3a\u7f16\u7801\u4e3a\u4e00\u7ec4if-then\u89c4\u5219\uff1a\"\u5982\u679c\u884c\u4eba\u5728\u4eba\u884c\u6a2a\u9053\u4e0a\uff0c\u8ba9\u884c\"\u3001\"\u5982\u679c\u4e0e\u524d\u8f66\u8ddd\u79bb\u5c0f\u4e8e2\u79d2\uff0c\u4e0d\u53d8\u9053\"\u3001\"\u5982\u679c\u63a5\u8fd1\u7ea2\u706f\uff0c\u51cf\u901f\u505c\u5728\u505c\u6b62\u7ebf\u5904\u3002\"\u8fd9\u4e9b\u89c4\u5219\u662f\u53ef\u89e3\u91ca\u548c\u53ef\u5ba1\u8ba1\u7684\uff0c\u4f46\u5bf9\u4e8e\u590d\u6742\u573a\u666f\uff08\u6570\u5343\u6761\u89c4\u5219\u3001\u8bb8\u591a\u8fb9\u7f18\u60c5\u51b5\u3001\u89c4\u5219\u95f4\u7684\u4ea4\u4e92\uff09\uff0c\u5b83\u4eec\u53d8\u5f97\u96be\u4ee5\u7ba1\u7406\u3002</p> </li> <li> <p>\u57fa\u4e8e\u4f18\u5316\u7684\u89c4\u5212\u5668\u5c06\u9a7e\u9a76\u5f62\u5f0f\u5316\u4e3a\u8f68\u8ff9\u4f18\u5316\u3002\u4e3b\u8f66\u8f68\u8ff9\u88ab\u53c2\u6570\u5316\uff08\u4f8b\u5982\uff0c\u4f5c\u4e3a\u672a\u6765\u65f6\u95f4\u6b65\u7684\\((x, y, \\\\theta, v)\\)\u72b6\u6001\u5e8f\u5217\uff09\uff0c\u5e76\u6700\u5c0f\u5316\u4e00\u4e2a\u76ee\u6807\u51fd\u6570\uff1a</p> </li> </ul> \\[\\\\min_{\\\\boldsymbol{\\\\xi}} \\\\underbrace{w_1 \\\\cdot J_{\\\\text{\u8fdb\u5ea6}}(\\\\boldsymbol{\\\\xi})}_{\\\\text{\u5230\u8fbe\u76ee\u7684\u5730}} + \\\\underbrace{w_2 \\\\cdot J_{\\\\text{\u8212\u9002}}(\\\\boldsymbol{\\\\xi})}_{\\\\text{\u5e73\u7a33\u884c\u9a76}} + \\\\underbrace{w_3 \\\\cdot J_{\\\\text{\u5b89\u5168}}(\\\\boldsymbol{\\\\xi})}_{\\\\text{\u907f\u514d\u78b0\u649e}}\\] \\[\\\\text{\u7ea6\u675f\u6761\u4ef6\uff1a\u8fd0\u52a8\u5b66\u7ea6\u675f\u3001\u9650\u901f\u3001\u8f66\u9053\u8fb9\u754c}\\] <ul> <li> <p>\u8fdb\u5ea6\u9879\u60e9\u7f5a\u504f\u79bb\u671f\u671b\u8def\u7ebf\u3002\u8212\u9002\u9879\u60e9\u7f5a\u9ad8\u6a2a\u5411\u52a0\u901f\u5ea6\u3001\u52a0\u52a0\u901f\u5ea6\uff08\u52a0\u901f\u5ea6\u7684\u5bfc\u6570\uff09\u548c\u7a81\u7136\u8f6c\u5411\uff0c\u56e0\u4e3a\u4e58\u5ba2\u80fd\u611f\u53d7\u5230\u8fd9\u4e9b\u3002\u5b89\u5168\u9879\u60e9\u7f5a\u4e0e\u5176\u4ed6\u4ea4\u901a\u53c2\u4e0e\u8005\u7684\u63a5\u8fd1\u7a0b\u5ea6\uff0c\u4f7f\u7528\u9884\u6d4b\u8f68\u8ff9\u8bc4\u4f30\u78b0\u649e\u98ce\u9669\u3002</p> </li> <li> <p>\u8fd9\u662f\u7ea6\u675f\u4f18\u5316\uff08\u7b2c3\u7ae0\uff09\uff1a\u5728\u4e0d\u7b49\u5f0f\u7ea6\u675f\u4e0b\u6700\u5c0f\u5316\u4ee3\u4ef7\u51fd\u6570\u3002\u6743\u91cd\\(w_1, w_2, w_3\\)\u6743\u8861\u7ade\u4e89\u76ee\u6807\uff08\u6fc0\u8fdb\u9a7e\u9a76\u66f4\u5feb\u4f46\u66f4\u4e0d\u8212\u9002\u4e14\u66f4\u4e0d\u5b89\u5168\uff09\u3002</p> </li> <li> <p>\u57fa\u4e8e\u5b66\u4e60\u7684\u89c4\u5212\u5668\u4f7f\u7528\u5728\u4eba\u7c7b\u9a7e\u9a76\u6570\u636e\u4e0a\u8bad\u7ec3\u7684\u795e\u7ecf\u7f51\u7edc\u751f\u6210\u8f68\u8ff9\u3002\u6a21\u578b\u89c2\u5bdf\u573a\u666f\u5e76\u76f4\u63a5\u8f93\u51fa\u89c4\u5212\u7684\u8f68\u8ff9\uff0c\u4ece\u4e13\u5bb6\u4eba\u7c7b\u9a7e\u9a76\u793a\u4f8b\u4e2d\u9690\u5f0f\u5b66\u4e60\u590d\u6742\u7684\u6743\u8861\u3002</p> </li> <li> <p>\u4f18\u52bf\u5728\u4e8e\u4eba\u7c7b\u9a7e\u9a76\u884c\u4e3a\u88ab\u6574\u4f53\u6355\u83b7\uff0c\u5305\u62ec\u90a3\u4e9b\u5fae\u5999\u4e14\u96be\u4ee5\u5f62\u5f0f\u5316\u7684\u65b9\u9762\uff1a\u4f55\u65f6\u6fc0\u8fdb\u5730\u5408\u6d41\u3001\u4f55\u65f6\u5728\u4ea4\u53c9\u53e3\u524d\u5fae\u5fae\u524d\u79fb\u3001\u7ed9\u9a91\u884c\u8005\u7559\u51fa\u591a\u5c11\u7a7a\u95f4\u3002\u7f3a\u70b9\u662f\u6765\u81ea\u6a21\u4eff\u5b66\u4e60\uff08\u6587\u4ef62\uff09\u7684\u76f8\u540c\u5206\u5e03\u504f\u79fb\u95ee\u9898\uff1a\u6a21\u578b\u5728\u8bad\u7ec3\u6570\u636e\u4e2d\u672a\u5145\u5206\u4ee3\u8868\u7684\u60c5\u51b5\u4e0b\u53ef\u80fd\u8868\u73b0\u4e0d\u53ef\u9884\u6d4b\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/04.%20self-driving/#_6","title":"\u7aef\u5230\u7aef\u9a7e\u9a76","text":"<ul> <li> <p>\u7aef\u5230\u7aef\u9a7e\u9a76\u5b8c\u5168\u6d88\u9664\u4e86\u6a21\u5757\u8fb9\u754c\u3002\u5355\u4e2a\u795e\u7ecf\u7f51\u7edc\u63a5\u6536\u539f\u59cb\u4f20\u611f\u5668\u8f93\u5165\uff08\u76f8\u673a\u56fe\u50cf\u3001LiDAR\u70b9\u4e91\uff09\u5e76\u76f4\u63a5\u8f93\u51fa\u9a7e\u9a76\u547d\u4ee4\uff08\u8f6c\u5411\u3001\u6cb9\u95e8\u3001\u5239\u8f66\uff09\u6216\u89c4\u5212\u8f68\u8ff9\u3002\u6ca1\u6709\u72ec\u7acb\u7684\u611f\u77e5\u3001\u9884\u6d4b\u6216\u89c4\u5212\u6a21\u5757\u3002</p> </li> <li> <p>\u5176\u5438\u5f15\u529b\u5728\u4e8e\u6574\u4e2a\u7cfb\u7edf\u9488\u5bf9\u6700\u7ec8\u4efb\u52a1\uff08\u5b89\u5168\u9a7e\u9a76\uff09\u8fdb\u884c\u8054\u5408\u4f18\u5316\uff0c\u56e0\u6b64\u6ca1\u6709\u4fe1\u606f\u5728\u6a21\u5757\u8fb9\u754c\u4e22\u5931\u3002\u611f\u77e5\u6a21\u5757\u5b66\u4e60\u7cbe\u786e\u63d0\u53d6\u89c4\u5212\u5668\u6240\u9700\u7684\u7279\u5f81\uff0c\u800c\u4e0d\u662f\u901a\u7528\u7684\u76ee\u6807\u68c0\u6d4b\u7ed3\u679c\uff0c\u540e\u8005\u53ef\u80fd\u4e0d\u6355\u83b7\u4efb\u52a1\u76f8\u5173\u7684\u7ec6\u8282\u3002</p> </li> <li> <p>UniAD\uff08\u7edf\u4e00\u81ea\u52a8\u9a7e\u9a76\uff09\u662f\u4e00\u4e2a\u91cc\u7a0b\u7891\u5f0f\u7684\u7aef\u5230\u7aef\u67b6\u6784\u3002\u5b83\u901a\u8fc7BEV\u7f16\u7801\u5668\u5904\u7406\u591a\u76f8\u673a\u56fe\u50cf\uff0c\u7136\u540e\u5e94\u7528\u4e00\u7cfb\u5217\u57fa\u4e8etransformer\u7684\u6a21\u5757\uff1a\u8ddf\u8e2a\u3001\u5728\u7ebf\u5efa\u56fe\u3001\u8fd0\u52a8\u9884\u6d4b\u3001\u5360\u636e\u9884\u6d4b\u548c\u89c4\u5212\u3002\u867d\u7136\u5b83\u6709\u5185\u90e8\u6a21\u5757\uff0c\u4f46\u5b83\u4eec\u90fd\u662f\u53ef\u5fae\u7684\uff0c\u5e76\u7aef\u5230\u7aef\u8054\u5408\u8bad\u7ec3\uff0c\u89c4\u5212\u635f\u5931\u901a\u8fc7\u6574\u4e2a\u7f51\u7edc\u53cd\u5411\u4f20\u64ad\u3002</p> </li> <li> <p>UniAD\u4e2d\u7684\u89c4\u5212\u6a21\u5757\u901a\u8fc7\u5173\u6ce8\u9884\u6d4b\u7684BEV\u7279\u5f81\u3001\u9884\u6d4b\u7684\u53c2\u4e0e\u8005\u8f68\u8ff9\u548c\u9884\u6d4b\u7684\u5360\u636e\u6765\u751f\u6210\u672a\u6765\u4e3b\u8f66\u8def\u5f84\u70b9\u3002\u8fd9\u5c31\u662f\u591a\u5143\u94fe\u5f0f\u6cd5\u5219\uff08\u7b2c3\u7ae0\uff09\u7684\u5b9e\u9645\u5e94\u7528\uff1a\u68af\u5ea6\u4ece\u89c4\u5212\u635f\u5931\u4e00\u76f4\u6d41\u56de\u56fe\u50cf\u7f16\u7801\u5668\uff0c\u544a\u8bc9\u611f\u77e5\u7279\u5f81\u5982\u4f55\u5bf9\u89c4\u5212\u66f4\u6709\u7528\u3002</p> </li> <li> <p>\u66f4\u8fd1\u671f\u7aef\u5230\u7aef\u65b9\u6cd5\u4f7f\u7528VLA\u98ce\u683c\u7684\u67b6\u6784\uff08\u672c\u7ae0\u6587\u4ef63\uff09\u3002\u50cfDriveVLM\u8fd9\u6837\u7684\u6a21\u578b\u63a5\u6536\u76f8\u673a\u56fe\u50cf\u548c\u5bfc\u822a\u6307\u4ee4\uff08\u6216\u8def\u7ebf\uff09\uff0c\u5e76\u4f7f\u7528VLM\u4e3b\u5e72\u7f51\u7edc\u4ea7\u751f\u9a7e\u9a76\u52a8\u4f5c\u3002\u8fd9\u5e26\u6765\u4e86\u5927\u89c4\u6a21\u9884\u8bad\u7ec3\uff08\u89c6\u89c9\u7406\u89e3\u3001\u63a8\u7406\uff09\u7684\u597d\u5904\uff0c\u76f4\u63a5\u878d\u5165\u9a7e\u9a76\u5806\u6808\u3002</p> </li> <li> <p>\u7aef\u5230\u7aef\u9a7e\u9a76\u4e2d\u7684\u5f20\u529b\u662f\u53ef\u89e3\u91ca\u6027\u3002\u6a21\u5757\u5316\u7cfb\u7edf\u53ef\u4ee5\u62a5\u544a\"\u6211\u68c0\u6d4b\u5230\u884c\u4eba\u5728(x,y)\u5904\uff0c\u9884\u6d4b\u4ed6\u4eec\u4f1a\u6a2a\u7a7f\"\u2014\u2014\u6545\u969c\u6a21\u5f0f\u662f\u53ef\u8bca\u65ad\u7684\u3002\u7aef\u5230\u7aef\u7cfb\u7edf\u662f\u4e00\u4e2a\u4ea7\u751f\u8f6c\u5411\u89d2\u7684\u9ed1\u76d2\u3002\u5f53\u5b83\u5931\u8d25\u65f6\uff0c\u8bca\u65ad\u539f\u56e0\u5f88\u56f0\u96be\uff0c\u8fd9\u5bf9\u5b89\u5168\u8ba4\u8bc1\u662f\u4e00\u4e2a\u4e25\u91cd\u95ee\u9898\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/04.%20self-driving/#_7","title":"\u9a7e\u9a76\u4e16\u754c\u6a21\u578b","text":"<ul> <li> <p>\u4e16\u754c\u6a21\u578b\u5b66\u4e60\u5728\u7ed9\u5b9a\u5f53\u524d\u72b6\u6001\u548c\u4e3b\u8f66\u52a8\u4f5c\u7684\u60c5\u51b5\u4e0b\u9884\u6d4b\u9a7e\u9a76\u573a\u666f\u7684\u672a\u6765\u72b6\u6001\uff1a\\(p(s_{t+1} \\\\mid s_t, a_t)\\)\uff08\u5982\u7b2c10\u7ae0\u6240\u8ff0\uff09\u3002\u5728\u9a7e\u9a76\u4e2d\uff0c\u8fd9\u610f\u5473\u7740\u751f\u6210\u903c\u771f\u7684\u672a\u6765\u5e27\u6216BEV\u5e03\u5c40\uff1a\"\u5982\u679c\u6211\u52a0\u901f\u5e76\u5de6\u8f6c\uff0c3\u79d2\u540e\u7684\u573a\u666f\u4f1a\u662f\u8fd9\u6837\u3002\"</p> </li> <li> <p>\u4e16\u754c\u6a21\u578b\u4e3a\u81ea\u52a8\u9a7e\u9a76\u63d0\u4f9b\u4e86\u4e24\u79cd\u5f3a\u5927\u80fd\u529b\uff1a</p> <ul> <li> <p>\u57fa\u4e8e\u60f3\u8c61\u7684\u89c4\u5212\uff1a\u89c4\u5212\u5668\u4e0d\u662f\u5148\u6267\u884c\u4e00\u4e2a\u52a8\u4f5c\u518d\u770b\u7ed3\u679c\uff0c\u800c\u662f\u53ef\u4ee5\u901a\u8fc7\u4e16\u754c\u6a21\u578b\"\u60f3\u8c61\"\u591a\u6761\u5019\u9009\u8f68\u8ff9\uff0c\u8bc4\u4f30\u6bcf\u6761\u7684\u5b89\u5168\u6027\u548c\u8212\u9002\u6027\uff0c\u7136\u540e\u9009\u62e9\u6700\u4f73\u7684\u4e00\u6761\u3002\u8fd9\u662f\u57fa\u4e8e\u6a21\u578b\u7684RL\uff08\u672c\u7ae0\u6587\u4ef62\u4e2d\u4ecb\u7ecd\uff09\u5e94\u7528\u4e8e\u9a7e\u9a76\u3002</p> </li> <li> <p>\u5b66\u4e60\u578b\u4eff\u771f\uff1a\u5728\u771f\u5b9e\u9a7e\u9a76\u6570\u636e\u4e0a\u8bad\u7ec3\u7684\u4e16\u754c\u6a21\u578b\u5b9e\u9645\u4e0a\u662f\u4e00\u4e2a\u6570\u636e\u9a71\u52a8\u7684\u4eff\u771f\u5668\u3002\u5b83\u751f\u6210\u903c\u771f\u7684\u573a\u666f\uff08\u5305\u62ec\u7f55\u89c1\u7684\u8fb9\u7f18\u60c5\u51b5\uff09\uff0c\u65e0\u9700\u624b\u5de5\u6784\u5efa\u4eff\u771f\u5668\u7684\u5de5\u4f5c\u3002\u5173\u952e\u662f\uff0c\u5b83\u6355\u83b7\u4e86\u771f\u5b9e\u9a7e\u9a76\u7684\u7edf\u8ba1\u6a21\u5f0f\uff1a\u5176\u4ed6\u9a7e\u9a76\u5458\u5b9e\u9645\u5982\u4f55\u8868\u73b0\u3001\u5149\u7167\u5982\u4f55\u53d8\u5316\u3001\u96e8\u6c34\u5982\u4f55\u5f71\u54cd\u53ef\u89c1\u5ea6\u3002</p> </li> </ul> </li> <li> <p>GAIA-1\uff08Wayve\uff09\u662f\u4e00\u4e2a\u7528\u4e8e\u9a7e\u9a76\u7684\u751f\u6210\u5f0f\u4e16\u754c\u6a21\u578b\u3002\u7ed9\u5b9a\u8fc7\u53bb\u76f8\u673a\u5e27\u548c\u4e3b\u8f66\u52a8\u4f5c\u7684\u5e8f\u5217\uff0c\u5b83\u81ea\u56de\u5f52\u5730\u751f\u6210\u672a\u6765\u89c6\u9891\u5e27\u3002\u5b83\u4f7f\u7528\u4ee5\u52a8\u4f5c\u4e3a\u6761\u4ef6\u7684\u89c6\u9891\u6269\u6563\u67b6\u6784\u3002\u6a21\u578b\u5b66\u4e60\u751f\u6210\u5408\u7406\u7684\u672a\u6765\uff1a\u9075\u5b88\u4ea4\u901a\u89c4\u5219\u7684\u8f66\u8f86\u3001\u5728\u4eba\u884c\u9053\u4e0a\u884c\u8d70\u7684\u884c\u4eba\u4ee5\u53ca\u6b63\u786e\u53d8\u5316\u7684\u4ea4\u901a\u4fe1\u53f7\u706f\u2014\u2014\u90fd\u4ece\u8bad\u7ec3\u6570\u636e\u4e2d\u6d8c\u73b0\uff0c\u800c\u975e\u7f16\u7a0b\u89c4\u5219\u3002</p> </li> <li> <p>DriveDreamer\u548cGenAD\u91c7\u53d6\u7c7b\u4f3c\u65b9\u6cd5\uff0c\u4f46\u5728BEV\u7a7a\u95f4\u800c\u975e\u50cf\u7d20\u7a7a\u95f4\u4e2d\u64cd\u4f5c\u3002\u9884\u6d4b\u672a\u6765BEV\u5e03\u5c40\u6bd4\u751f\u6210\u5b8c\u6574\u89c6\u9891\u5e27\u66f4\u7d27\u51d1\uff08\u7c7b\u4f3c\u4e8e\u673a\u5668\u4eba\u5b66\u4e2d\u7684DreamerV3\u5728\u6f5c\u5728\u7a7a\u95f4\u800c\u975e\u50cf\u7d20\u7a7a\u95f4\u4e2d\u8fdb\u884c\u9884\u6d4b\uff0c\u5982\u6587\u4ef62\u6240\u8ff0\uff09\u3002BEV\u4e16\u754c\u6a21\u578b\u9884\u6d4b\u6240\u6709\u53c2\u4e0e\u8005\u7684\u4f4d\u7f6e\u3001\u9053\u8def\u7ed3\u6784\u7684\u6837\u5b50\u4ee5\u53ca\u81ea\u7531\u7a7a\u95f4\u7684\u4f4d\u7f6e\uff0c\u89c4\u5212\u5668\u76f4\u63a5\u4f7f\u7528\u8fd9\u4e9b\u4fe1\u606f\u3002</p> </li> <li> <p>\u795e\u7ecf\u95ed\u73af\u4eff\u771f\u4f7f\u7528\u4e16\u754c\u6a21\u578b\u66ff\u4ee3\u624b\u5de5\u6784\u5efa\u7684\u4eff\u771f\u5668\u8fdb\u884c\u6d4b\u8bd5\u3002\u7ed9\u5b9a\u771f\u5b9e\u9a7e\u9a76\u65e5\u5fd7\u4f5c\u4e3a\u8d77\u70b9\uff0c\u4e16\u754c\u6a21\u578b\u751f\u6210\u5982\u679c\u4e3b\u8f66\u91c7\u53d6\u4e86\u4e0d\u540c\u52a8\u4f5c\u4f1a\u53d1\u751f\u4ec0\u4e48\u3002\u8fd9\u4f7f\u5f97\u53cd\u4e8b\u5b9e\u8bc4\u4f30\u6210\u4e3a\u53ef\u80fd\uff1a\"\u5982\u679c\u6211\u5239\u8f66\u665a\u4e860.5\u79d2\u4f1a\u600e\u6837\uff1f\"\u800c\u65e0\u9700\u5b9e\u9645\u91cd\u73b0\u573a\u666f\u3002</p> </li> <li> <p>\u4e0eJEPA\u6846\u67b6\uff08\u7b2c10\u7ae0\uff09\u7684\u8054\u7cfb\u5728\u8fd9\u91cc\u5f88\u81ea\u7136\u3002\u9a7e\u9a76\u4e16\u754c\u6a21\u578b\u4e0d\u9700\u8981\u9884\u6d4b\u50cf\u7d20\u7ea7\u5b8c\u7f8e\u7684\u672a\u6765\uff08\u6bcf\u4e2a\u50cf\u7d20\u7684\u7cbe\u786eRGB\u503c\uff09\u3002\u5b83\u4eec\u9700\u8981\u9884\u6d4b\u5bf9\u89c4\u5212\u91cd\u8981\u7684\u65b9\u9762\uff1a\u53c2\u4e0e\u8005\u5728\u54ea\u3001\u79fb\u52a8\u901f\u5ea6\u591a\u5feb\u3001\u81ea\u7531\u7a7a\u95f4\u5728\u54ea\u3002\u5d4c\u5165\u7a7a\u95f4\u9884\u6d4b\uff08JEPA\u98ce\u683c\uff09\u6355\u83b7\u8fd9\u4e9b\u8bed\u4e49\u4e0a\u6709\u610f\u4e49\u7684\u5c5e\u6027\uff0c\u800c\u65e0\u9700\u6d6a\u8d39\u5bb9\u91cf\u5728\u65e0\u5173\u7684\u89c6\u89c9\u7ec6\u8282\u4e0a\uff0c\u5982\u786e\u5207\u7684\u4e91\u7eb9\u7406\u3002</p> </li> <li> <p>\u4e3b\u8981\u6311\u6218\u662f\u957f\u65f6\u7a0b\u4fdd\u771f\u5ea6\u3002\u4e16\u754c\u6a21\u578b\u968f\u65f6\u95f4\u7d2f\u79ef\u8bef\u5dee\uff1a\u7b2c2\u5e27\u7684\u4e00\u4e2a\u5c0f\u9519\u8bef\u4f1a\u504f\u79fb\u6240\u6709\u540e\u7eed\u5e27\u3002\u5bf9\u4e8e\u9a7e\u9a76\uff0c3\u79d2\u7684\u9884\u6d4b\u65f6\u57df\u5bf9\u6218\u672f\u51b3\u7b56\u6709\u7528\uff08\u6211\u5e94\u8be5\u73b0\u5728\u5408\u6d41\u5417\uff1f\uff09\uff0c\u4f4630\u79d2\u7684\u65f6\u57df\uff08\u7528\u4e8e\u8def\u7ebf\u89c4\u5212\u7b49\u6218\u7565\u51b3\u7b56\u6240\u9700\uff09\u4ecd\u7136\u4e0d\u53ef\u9760\u3002\u5f53\u524d\u5de5\u4f5c\u901a\u8fc7\u91cd\u65b0\u951a\u5b9a\uff08\u5b9a\u671f\u7528\u771f\u5b9e\u89c2\u6d4b\u91cd\u7f6e\u6a21\u578b\uff09\u548c\u4e0d\u786e\u5b9a\u6027\u4f30\u8ba1\uff08\u5728\u9884\u6d4b\u53d8\u5f97\u4e0d\u53ef\u9760\u65f6\u6807\u8bb0\uff09\u6765\u7f13\u89e3\u8fd9\u4e00\u95ee\u9898\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/04.%20self-driving/#_8","title":"\u4eff\u771f","text":"<ul> <li> <p>\u901a\u8fc7\u5728\u771f\u5b9e\u9053\u8def\u4e0a\u9a7e\u9a76\u6765\u6d4b\u8bd5\u81ea\u52a8\u9a7e\u9a76\u6c7d\u8f66\u662f\u5fc5\u8981\u7684\uff0c\u4f46\u8fd8\u4e0d\u591f\u3002\u5371\u9669\u573a\u666f\uff08\u8fd1\u78b0\u649e\u3001\u8fb9\u7f18\u60c5\u51b5\uff09\u5f88\u5c11\u89c1\uff0c\u56e0\u6b64\u901a\u8fc7\u884c\u9a76\u91cc\u7a0b\u6765\u6d4b\u8bd5\u6548\u7387\u4f4e\u4e0b\u3002\u4e00\u8f86\u8f66\u9700\u8981\u884c\u9a76\u6570\u4ebf\u82f1\u91cc\u624d\u80fd\u4ee5\u7edf\u8ba1\u5b66\u65b9\u5f0f\u8bc1\u660e\u5b89\u5168\u6027\uff0c\u8fd9\u662f\u4e0d\u53ef\u884c\u7684\u3002</p> </li> <li> <p>\u4eff\u771f\u63d0\u4f9b\u4e86\u65e0\u9650\u3001\u53ef\u63a7\u4e14\u5b89\u5168\u7684\u6d4b\u8bd5\u3002\u5728\u73b0\u5b9e\u4e16\u754c\u4e2d\u7f55\u89c1\u7684\u573a\u666f\uff08\u4e00\u4e2a\u5b69\u5b50\u8dd1\u4e0a\u9a6c\u8def\u3001\u8f6e\u80ce\u7206\u80ce\u3001\u7a81\u7136\u7684\u969c\u788d\u7269\uff09\u53ef\u4ee5\u5728\u4eff\u771f\u4e2d\u6d4b\u8bd5\u6570\u767e\u4e07\u6b21\u3002</p> </li> <li> <p>CARLA\u662f\u4e00\u4e2a\u57fa\u4e8eUnreal Engine\u6784\u5efa\u7684\u5f00\u6e90\u9a7e\u9a76\u4eff\u771f\u5668\u3002\u5b83\u63d0\u4f9b\u903c\u771f\u7684\u57ce\u5e02\u73af\u5883\u3001\u52a8\u6001\u5929\u6c14\u3001\u4ea4\u901a\u53c2\u4e0e\u8005\u4ee5\u53ca\u4f20\u611f\u5668\u4eff\u771f\uff08\u76f8\u673a\u3001LiDAR\u3001\u96f7\u8fbe\uff09\u3002\u7814\u7a76\u4eba\u5458\u4f7f\u7528CARLA\u8bad\u7ec3\u57fa\u4e8eRL\u7684\u9a7e\u9a76\u667a\u80fd\u4f53\u5e76\u8bc4\u4f30\u611f\u77e5\u7b97\u6cd5\u3002</p> </li> <li> <p>nuPlan\uff08Motional\uff09\u662f\u4e00\u4e2a\u95ed\u73af\u89c4\u5212\u57fa\u51c6\u6d4b\u8bd5\u3002\u4e0e\u5f00\u73af\u8bc4\u4f30\uff08\u91cd\u653e\u8bb0\u5f55\u6570\u636e\uff0c\u6bd4\u8f83\u89c4\u5212\u5668\u7684\u8f93\u51fa\u4e0e\u4eba\u7c7b\u9a7e\u9a76\u5458\u7684\u5b9e\u9645\u8f68\u8ff9\uff09\u4e0d\u540c\uff0c\u95ed\u73af\u8bc4\u4f30\u5141\u8bb8\u89c4\u5212\u5668\u7684\u51b3\u7b56\u5f71\u54cd\u4eff\u771f\uff1a\u5982\u679c\u89c4\u5212\u5668\u51b3\u5b9a\u53d8\u9053\uff0c\u4eff\u771f\u4f1a\u76f8\u5e94\u5730\u6f14\u53d8\u3002\u8fd9\u6d4b\u8bd5\u4e86\u53cd\u5e94\u6027\u884c\u4e3a\uff0c\u800c\u4e0d\u4ec5\u4ec5\u662f\u8f68\u8ff9\u76f8\u4f3c\u6027\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u5f00\u73af\u548c\u95ed\u73af\u8bc4\u4f30\u4e4b\u95f4\u7684\u533a\u522b\u81f3\u5173\u91cd\u8981\uff1a</p> <ul> <li> <p>\u5f00\u73af\uff1a\u91cd\u653e\u8bb0\u5f55\u7684\u573a\u666f\uff0c\u8ba1\u7b97\u6a21\u578b\u8f93\u51fa\u4e0e\u4eba\u7c7b\u9a7e\u9a76\u5458\u52a8\u4f5c\u7684\u76f8\u4f3c\u5ea6\u3002\u8fd9\u5bb9\u6613\u8bbe\u7f6e\u4f46\u5177\u6709\u8bef\u5bfc\u6027\uff1a\u4e00\u4e2a\u603b\u662f\u9884\u6d4b\"\u76f4\u884c\"\u7684\u6a21\u578b\u5728\u9ad8\u901f\u516c\u8def\u4e0a\u8bef\u5dee\u53ef\u80fd\u5f88\u4f4e\uff0c\u4f46\u5728\u7b2c\u4e00\u4e2a\u8f6c\u5f2f\u5904\u5c31\u4f1a\u649e\u8f66\u3002</p> </li> <li> <p>\u95ed\u73af\uff1a\u6a21\u578b\u7684\u52a8\u4f5c\u6539\u53d8\u4eff\u771f\u72b6\u6001\uff0c\u4eff\u771f\u76f8\u5e94\u5730\u6f14\u53d8\u3002\u8fd9\u6d4b\u8bd5\u4e86\u6a21\u578b\u4ece\u81ea\u8eab\u9519\u8bef\u4e2d\u6062\u590d\u548c\u54cd\u5e94\u52a8\u6001\u60c5\u51b5\u7684\u80fd\u529b\u3002\u5b83\u6602\u8d35\u5f97\u591a\uff0c\u4f46\u66f4\u6709\u610f\u4e49\u3002</p> </li> </ul> </li> <li> <p>\u573a\u666f\u751f\u6210\u521b\u5efa\u5bf9\u7cfb\u7edf\u8fdb\u884c\u538b\u529b\u6d4b\u8bd5\u7684\u6d4b\u8bd5\u7528\u4f8b\u3002\u5bf9\u6297\u6027\u573a\u666f\uff08\u8f66\u8f86\u7a81\u7136\u5239\u8f66\u3001\u884c\u4eba\u9690\u85cf\u5728\u505c\u653e\u7684\u6c7d\u8f66\u540e\u9762\uff09\u901a\u8fc7\u4f18\u5316\u4f7f\u81ea\u52a8\u9a7e\u9a76\u7cfb\u7edf\u8868\u73b0\u6700\u5dee\u7684\u60c5\u51b5\u6765\u751f\u6210\u3002\u8fd9\u4e0eML\u4e2d\u7684\u5bf9\u6297\u8bad\u7ec3\uff08\u7b2c6\u7ae0\uff09\u6709\u5173\uff1a\u5bfb\u627e\u6700\u5927\u5316\u635f\u5931\u7684\u8f93\u5165\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/04.%20self-driving/#_9","title":"\u5b89\u5168\u6027","text":"<ul> <li> <p>\u81ea\u52a8\u9a7e\u9a76\u4e2d\u7684\u5b89\u5168\u6027\u7531\u5de5\u7a0b\u6807\u51c6\u800c\u975e\u4ec5ML\u6307\u6807\u6765\u7ba1\u7406\u3002</p> </li> <li> <p>ISO 26262\uff08\u529f\u80fd\u5b89\u5168\uff09\u662f\u5b89\u5168\u5173\u952e\u7535\u5b50\u7cfb\u7edf\u7684\u6c7d\u8f66\u6807\u51c6\u3002\u5b83\u6839\u636e\u6f5c\u5728\u5371\u5bb3\u7684\u4e25\u91cd\u6027\u3001\u66b4\u9732\u5ea6\u548c\u53ef\u63a7\u6027\u5b9a\u4e49\u4e86\u6c7d\u8f66\u5b89\u5168\u5b8c\u6574\u6027\u7b49\u7ea7\uff08ASIL\uff09\uff0c\u4eceA\uff08\u6700\u4f4e\uff09\u5230D\uff08\u6700\u9ad8\uff09\u3002\u81ea\u52a8\u9a7e\u9a76\u7cfb\u7edf\u7684\u611f\u77e5\u548c\u89c4\u5212\u7ec4\u4ef6\u901a\u5e38\u4e3aASIL-D\uff0c\u5373\u6700\u9ad8\u7b49\u7ea7\uff0c\u9700\u8981\u5e7f\u6cdb\u7684\u9a8c\u8bc1\u3001\u5197\u4f59\u548c\u6545\u969c\u5b89\u5168\u8bbe\u8ba1\u3002</p> </li> <li> <p>SOTIF\uff08\u9884\u671f\u529f\u80fd\u5b89\u5168\uff0cISO 21448\uff09\u5904\u7406\u53e6\u4e00\u7c7b\u5371\u5bb3\uff1a\u4e0d\u662f\u786c\u4ef6\u6545\u969c\uff08ISO 26262\u8986\u76d6\u7684\uff09\uff0c\u800c\u662f\u7cfb\u7edf\u6309\u8bbe\u8ba1\u5de5\u4f5c\u4f46\u4ecd\u4ea7\u751f\u4e0d\u5b89\u5168\u7ed3\u679c\u7684\u60c5\u51b5\u3002\u4e00\u4e2a\u5c06\u767d\u8272\u5361\u8f66\u8bef\u5206\u7c7b\u4e3a\u5929\u7a7a\u7684\u611f\u77e5\u6a21\u578b\uff08\u771f\u5b9e\u4e8b\u4ef6\uff09\u662fSOTIF\u95ee\u9898\uff1a\u786c\u4ef6\u5de5\u4f5c\u6b63\u5e38\uff0c\u4f46\u7b97\u6cd5\u7684\u5c40\u9650\u6027\u5bfc\u81f4\u4e86\u5371\u5bb3\u3002</p> </li> <li> <p>\u8fd0\u884c\u8bbe\u8ba1\u57df\uff08ODD\uff09\u5b9a\u4e49\u4e86\u81ea\u52a8\u9a7e\u9a76\u7cfb\u7edf\u8bbe\u8ba1\u7528\u4e8e\u8fd0\u884c\u7684\u6761\u4ef6\uff1a\u7279\u5b9a\u7684\u5730\u7406\u533a\u57df\u3001\u9053\u8def\u7c7b\u578b\uff08\u4ec5\u9ad8\u901f\u3001\u57ce\u5e02\u9053\u8def\u3001\u4e24\u8005\u517c\u6709\uff09\u3001\u5929\u6c14\u6761\u4ef6\uff08\u65e0\u5927\u96ea\uff09\u3001\u901f\u5ea6\u8303\u56f4\u548c\u65f6\u95f4\u6bb5\u3002\u4e0d\u5141\u8bb8\u5728ODD\u4e4b\u5916\u8fd0\u884c\uff1a\u5982\u679c\u7cfb\u7edf\u4e0d\u80fd\u5904\u7406\u96ea\uff0c\u5c31\u4e0d\u80fd\u5728\u96ea\u4e2d\u9a7e\u9a76\u3002</p> </li> <li> <p>\u6545\u969c\u5b89\u5168 vs \u6545\u969c\u53ef\u64cd\u4f5c\u8bbe\u8ba1\uff1a</p> <ul> <li>\u6545\u969c\u5b89\u5168\uff1a\u68c0\u6d4b\u5230\u6545\u969c\u65f6\uff0c\u7cfb\u7edf\u8fc7\u6e21\u5230\u5b89\u5168\u72b6\u6001\uff08\u4f8b\u5982\uff0c\u9760\u8fb9\u505c\u8f66\uff09\u3002\u8fd9\u662f\u6700\u4f4e\u8981\u6c42\u3002</li> <li>\u6545\u969c\u53ef\u64cd\u4f5c\uff1a\u7cfb\u7edf\u5728\u6545\u969c\u60c5\u51b5\u4e0b\u4ecd\u80fd\u5b89\u5168\u8fd0\u884c\uff0c\u4f7f\u7528\u5197\u4f59\u7ec4\u4ef6\u3002\u5177\u6709\u5197\u4f59\u8f6c\u5411\u3001\u5236\u52a8\u548c\u8ba1\u7b97\u7684\u81ea\u52a8\u9a7e\u9a76\u6c7d\u8f66\u53ef\u4ee5\u5728\u5355\u4e2a\u7ec4\u4ef6\u6545\u969c\u540e\u5b58\u6d3b\u5e76\u4ecd\u7136\u884c\u9a76\u5230\u5b89\u5168\u4f4d\u7f6e\u3002</li> </ul> </li> <li> <p>\u5197\u4f59\u662f\u57fa\u7840\u3002\u5173\u952e\u611f\u77e5\u4f20\u611f\u5668\u88ab\u590d\u5236\uff1a\u591a\u4e2a\u76f8\u673a\u8986\u76d6\u91cd\u53e0\u89c6\u573a\u3001LiDAR\u548c\u96f7\u8fbe\u540c\u65f6\u63d0\u4f9b\u72ec\u7acb\u7684\u6df1\u5ea6\u6d4b\u91cf\u3001\u53cc\u8ba1\u7b97\u5e73\u53f0\u8fd0\u884c\u76f8\u540c\u7684\u8f6f\u4ef6\u3002\u5982\u679c\u4efb\u4f55\u5355\u4e2a\u7ec4\u4ef6\u53d1\u751f\u6545\u969c\uff0c\u5176\u4ed6\u7ec4\u4ef6\u63d0\u4f9b\u8db3\u591f\u7684\u4fe1\u606f\u6765\u5b89\u5168\u9a7e\u9a76\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/04.%20self-driving/#_10","title":"\u81ea\u52a8\u9a7e\u9a76\u7b49\u7ea7","text":"<ul> <li> <p>SAE J3016\u6807\u51c6\u5b9a\u4e49\u4e86\u516d\u4e2a\u9a7e\u9a76\u81ea\u52a8\u5316\u7b49\u7ea7\uff0c\u4ece0\uff08\u65e0\u81ea\u52a8\u5316\uff09\u52305\uff08\u5b8c\u5168\u81ea\u52a8\u5316\uff09\uff1a</p> <ul> <li> <p>\u7b49\u7ea70\uff08\u65e0\u81ea\u52a8\u5316\uff09\uff1a\u4eba\u7c7b\u505a\u6240\u6709\u4e8b\u60c5\u3002\u7cfb\u7edf\u53ef\u80fd\u63d0\u4f9b\u8b66\u544a\uff08\u8f66\u9053\u504f\u79bb\u8b66\u62a5\uff09\u4f46\u4e0d\u63a7\u5236\u8f66\u8f86\u3002</p> </li> <li> <p>\u7b49\u7ea71\uff08\u9a7e\u9a76\u8f85\u52a9\uff09\uff1a\u7cfb\u7edf\u63a7\u5236\u8f6c\u5411\u6216\u901f\u5ea6\uff0c\u4f46\u4e0d\u80fd\u540c\u65f6\u63a7\u5236\u4e24\u8005\u3002\u81ea\u9002\u5e94\u5de1\u822a\u63a7\u5236\uff08\u4fdd\u6301\u901f\u5ea6\u548c\u8ddf\u8f66\u8ddd\u79bb\uff09\u6216\u8f66\u9053\u4fdd\u6301\u8f85\u52a9\uff08\u4f7f\u8f66\u8f86\u4fdd\u6301\u5728\u8f66\u9053\u4e2d\u592e\uff09\u5c5e\u4e8e\u7b49\u7ea71\u3002</p> </li> <li> <p>\u7b49\u7ea72\uff08\u90e8\u5206\u81ea\u52a8\u5316\uff09\uff1a\u7cfb\u7edf\u540c\u65f6\u63a7\u5236\u8f6c\u5411\u548c\u901f\u5ea6\uff0c\u4f46\u4eba\u7c7b\u5fc5\u987b\u65f6\u523b\u76d1\u63a7\u5e76\u51c6\u5907\u63a5\u7ba1\u3002\u7279\u65af\u62c9Autopilot\u3001GM Super Cruise\u548c\u5927\u591a\u6570\u5f53\u524d\u7684\"\u81ea\u52a8\u9a7e\u9a76\"\u529f\u80fd\u5c5e\u4e8e\u7b49\u7ea72\u3002\u4eba\u7c7b\u4ecd\u7136\u662f\u8d1f\u8d23\u7684\u9a7e\u9a76\u5458\u3002</p> </li> <li> <p>\u7b49\u7ea73\uff08\u6761\u4ef6\u81ea\u52a8\u5316\uff09\uff1a\u7cfb\u7edf\u9a7e\u9a76\u5e76\u76d1\u63a7\u73af\u5883\uff0c\u4f46\u4ec5\u5728\u7279\u5b9a\u6761\u4ef6\u4e0b\uff08ODD\u5185\uff09\u3002\u4eba\u7c7b\u53ef\u4ee5\u8131\u79bb\u5173\u6ce8\uff0c\u4f46\u5fc5\u987b\u51c6\u5907\u597d\u5728\u7cfb\u7edf\u8bf7\u6c42\u65f6\u63a5\u7ba1\uff08\u6709\u65f6\u95f4\u7f13\u51b2\uff0c\u901a\u5e3810\u79d2\u4ee5\u4e0a\uff09\u3002Mercedes Drive Pilot\uff08\u7279\u5b9a\u9ad8\u901f\u516c\u8def\u4e0a\uff0c\u4f4e\u4e8e60\u516c\u91cc/\u5c0f\u65f6\uff09\u662f\u7b2c\u4e00\u4e2a\u7ecf\u8ba4\u8bc1\u7684\u7b49\u7ea73\u7cfb\u7edf\u3002</p> </li> <li> <p>\u7b49\u7ea74\uff08\u9ad8\u5ea6\u81ea\u52a8\u5316\uff09\uff1a\u7cfb\u7edf\u5728ODD\u5185\u9a7e\u9a76\u5e76\u5904\u7406\u6240\u6709\u60c5\u51b5\uff0c\u65e0\u9700\u4eba\u7c7b\u5e72\u9884\u3002\u5982\u679c\u9047\u5230ODD\u4e4b\u5916\u7684\u60c5\u51b5\uff0c\u5b83\u53ef\u4ee5\u5b89\u5168\u5730\u81ea\u5df1\u505c\u8f66\u3002Waymo\u7684\u673a\u5668\u4eba\u51fa\u79df\u8f66\u670d\u52a1\u5728\u7279\u5b9a\u5730\u7406\u533a\u57df\u5185\u4ee5\u7b49\u7ea74\u8fd0\u884c\u3002</p> </li> <li> <p>\u7b49\u7ea75\uff08\u5b8c\u5168\u81ea\u52a8\u5316\uff09\uff1a\u7cfb\u7edf\u80fd\u5728\u4eba\u7c7b\u80fd\u53bb\u7684\u4e00\u5207\u5730\u65b9\u3001\u4e00\u5207\u6761\u4ef6\u4e0b\u9a7e\u9a76\u3002\u65e0\u9700\u65b9\u5411\u76d8\u6216\u8e0f\u677f\u3002\u8fd9\u76ee\u524d\u8fd8\u4e0d\u5b58\u5728\u3002</p> </li> </ul> </li> <li> <p>\u5173\u952e\u533a\u522b\u5728\u4e8e\u8c01\u5bf9\u5b89\u5168\u8d1f\u8d23\u3002\u5728\u7b49\u7ea70-2\uff0c\u4eba\u7c7b\u8d1f\u8d23\u3002\u5728\u7b49\u7ea73-5\uff0c\u7cfb\u7edf\u8d1f\u8d23\uff08\u5728\u5176ODD\u5185\uff09\u3002\u8fd9\u5177\u6709\u6df1\u8fdc\u7684\u6cd5\u5f8b\u3001\u4fdd\u9669\u548c\u4f26\u7406\u5f71\u54cd\u3002</p> </li> <li> <p>\u5f53\u524d\u884c\u4e1a\u72b6\u6001\u662f\u7b49\u7ea72\uff08\u5e7f\u6cdb\u90e8\u7f72\uff09\u3001\u7b49\u7ea73\uff08\u5f00\u59cb\u90e8\u7f72\uff09\u548c\u7b49\u7ea74\uff08\u6709\u9650\u5730\u7406\u90e8\u7f72\uff09\u7684\u6df7\u5408\u3002\u7b49\u7ea75\u4ecd\u7136\u662f\u4e00\u4e2a\u957f\u671f\u7814\u7a76\u76ee\u6807\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/04.%20self-driving/#colabnotebook","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216notebook\uff09","text":"<ol> <li> <p>\u5b9e\u73b0\u4e00\u4e2a\u7b80\u5355\u7684\u8f68\u8ff9\u4f18\u5316\u89c4\u5212\u5668\u3002\u7ed9\u5b9a\u8d77\u59cb\u4f4d\u7f6e\u3001\u76ee\u6807\u548c\u969c\u788d\u7269\uff0c\u4f7f\u7528\u68af\u5ea6\u4e0b\u964d\u627e\u5230\u6700\u5e73\u6ed1\u7684\u65e0\u78b0\u649e\u8def\u5f84\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u8f68\u8ff9\uff1aN\u4e2a\u8def\u5f84\u70b9\uff0c\u6bcf\u4e2a(x, y)\nN = 20\nstart = jnp.array([0.0, 0.0])\ngoal = jnp.array([10.0, 0.0])\nobstacle = jnp.array([5.0, 0.0])\nobs_radius = 1.5\n\n# \u521d\u59cb\u5316\uff1a\u4ece\u8d77\u70b9\u5230\u7ec8\u70b9\u7684\u76f4\u7ebf\nwaypoints_init = jnp.linspace(start, goal, N)\n\ndef cost(waypoints):\n    wp = jnp.concatenate([start[None], waypoints, goal[None]], axis=0)\n\n    # \u5e73\u6ed1\u5ea6\uff1a\u60e9\u7f5a\u52a0\u901f\u5ea6\uff08\u4e8c\u9636\u5dee\u5206\uff09\n    accel = wp[2:] - 2 * wp[1:-1] + wp[:-2]\n    smooth_cost = jnp.sum(accel ** 2)\n\n    # \u907f\u969c\uff1a\u60e9\u7f5a\u63a5\u8fd1\u5ea6\n    dists = jnp.linalg.norm(wp - obstacle, axis=1)\n    collision_cost = jnp.sum(jnp.maximum(0, obs_radius + 0.5 - dists) ** 2)\n\n    return 10 * smooth_cost + 100 * collision_cost\n\ngrad_cost = jax.grad(cost)\n\n# \u4f18\u5316\u5185\u90e8\u8def\u5f84\u70b9\nwaypoints = waypoints_init[1:-1]\nlr = 0.01\nfor _ in range(500):\n    g = grad_cost(waypoints)\n    waypoints = waypoints - lr * g\n\n# \u7ed8\u56fe\nfull_path = jnp.concatenate([start[None], waypoints, goal[None]], axis=0)\ntheta = jnp.linspace(0, 2 * jnp.pi, 100)\n\nplt.figure(figsize=(10, 4))\nplt.plot(full_path[:, 0], full_path[:, 1], \"b.-\", label=\"\u4f18\u5316\u540e\u8def\u5f84\")\nplt.plot(waypoints_init[:, 0], waypoints_init[:, 1], \"r--\", alpha=0.5, label=\"\u521d\u59cb\uff08\u76f4\u7ebf\uff09\")\nplt.fill(obstacle[0] + obs_radius * jnp.cos(theta),\n         obstacle[1] + obs_radius * jnp.sin(theta), alpha=0.3, color=\"red\", label=\"\u969c\u788d\u7269\")\nplt.plot(*start, \"go\", markersize=10); plt.plot(*goal, \"g*\", markersize=15)\nplt.legend(); plt.axis(\"equal\"); plt.grid(True)\nplt.title(\"\u8f68\u8ff9\u4f18\u5316\uff1a\u5e73\u6ed1\u65e0\u78b0\u649e\u8def\u5f84\")\nplt.show()\n</code></pre></p> </li> <li> <p>\u6a21\u62df\u4e00\u4e2a\u5300\u901f\u8fd0\u52a8\u9884\u6d4b\u6a21\u578b\uff0c\u5e76\u4e0e\u8f6c\u5f2f\u8f66\u8f86\u7684\u771f\u5b9e\u503c\u6bd4\u8f83\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u771f\u5b9e\u503c\uff1a\u8f66\u8f86\u53f3\u8f6c\ndt = 0.1\nT = 40  # 4\u79d2\nv = 10.0  # \u7c73/\u79d2\nomega = 0.3  # \u5f27\u5ea6/\u79d2\uff08\u8f6c\u5f2f\u901f\u7387\uff09\n\n# \u771f\u5b9e\u8f68\u8ff9\uff08\u6052\u5b9a\u8f6c\u5f2f\u901f\u7387\uff09\nt = jnp.arange(T) * dt\ntheta = omega * t\ngt_x = (v / omega) * jnp.sin(theta)\ngt_y = (v / omega) * (1 - jnp.cos(theta))\n\n# \u4ecet=0\u5f00\u59cb\u7684\u5300\u901f\u9884\u6d4b\n# \u5047\u8bbe\u8f66\u8f86\u6cbf\u5f53\u524d\u822a\u5411\u7ee7\u7eed\u76f4\u884c\nobs_steps = 10  # \u89c2\u5bdf\u524d1\u79d2\nvx0 = v * jnp.cos(theta[obs_steps - 1])\nvy0 = v * jnp.sin(theta[obs_steps - 1])\npred_t = jnp.arange(T - obs_steps) * dt\npred_x = gt_x[obs_steps - 1] + vx0 * pred_t\npred_y = gt_y[obs_steps - 1] + vy0 * pred_t\n\nplt.figure(figsize=(8, 6))\nplt.plot(gt_x[:obs_steps], gt_y[:obs_steps], \"ko-\", label=\"\u5df2\u89c2\u6d4b\")\nplt.plot(gt_x[obs_steps:], gt_y[obs_steps:], \"g-\", linewidth=2, label=\"\u771f\u5b9e\u672a\u6765\")\nplt.plot(pred_x, pred_y, \"r--\", linewidth=2, label=\"\u5300\u901f\u9884\u6d4b\")\nplt.legend(); plt.axis(\"equal\"); plt.grid(True)\nplt.xlabel(\"x (\u7c73)\"); plt.ylabel(\"y (\u7c73)\")\nplt.title(\"\u5300\u901f\u9884\u6d4b vs \u8f6c\u5f2f\u8f66\u8f86\")\nplt.show()\n</code></pre></p> </li> <li> <p>\u5b9e\u73b0\u4e00\u4e2a\u7b80\u5355\u7684\u57fa\u4e8e\u89c4\u5219\u7684\u89c4\u5212\u5668\uff0c\u6839\u636e\u68c0\u6d4b\u5230\u7684\u969c\u788d\u7269\u51b3\u5b9a\u4fdd\u6301\u8f66\u9053\u8fd8\u662f\u505c\u8f66\u3002 <pre><code>import jax.numpy as jnp\n\ndef rule_based_planner(ego_speed, obstacles, speed_limit=13.9):\n    \"\"\"\n    \u7b80\u5355\u7684\u57fa\u4e8e\u89c4\u5219\u7684\u89c4\u5212\u5668\u3002\n    ego_speed: \u5f53\u524d\u901f\u5ea6\uff08\u7c73/\u79d2\uff09\n    obstacles: \u524d\u65b9\u8f66\u8f86\u7684\uff08\u8ddd\u79bb\uff0c\u901f\u5ea6\uff09\u5143\u7ec4\u5217\u8868\n    speed_limit: \u6700\u9ad8\u5141\u8bb8\u901f\u5ea6\uff08\u7c73/\u79d2\uff09\uff0c\u9ed8\u8ba4\u7ea650\u516c\u91cc/\u5c0f\u65f6\n\n    \u8fd4\u56de\uff1a(\u76ee\u6807\u901f\u5ea6\uff0c\u52a8\u4f5c\u6807\u7b7e)\n    \"\"\"\n    min_following_distance = 2.0 * ego_speed  # 2\u79d2\u89c4\u5219\n    emergency_distance = 5.0  # \u7c73\n\n    if not obstacles:\n        return speed_limit, \"\u5de1\u822a\"\n\n    # \u627e\u5230\u6700\u8fd1\u7684\u524d\u65b9\u969c\u788d\u7269\n    closest_dist, closest_speed = min(obstacles, key=lambda o: o[0])\n\n    if closest_dist &lt; emergency_distance:\n        return 0.0, \"\u7d27\u6025\u505c\u8f66\"\n    elif closest_dist &lt; min_following_distance:\n        # \u5339\u914d\u524d\u8f66\u901f\u5ea6\n        target = min(closest_speed, speed_limit)\n        return target, \"\u8ddf\u968f\"\n    else:\n        return speed_limit, \"\u5de1\u822a\"\n\n# \u6d4b\u8bd5\u573a\u666f\nscenarios = [\n    (13.9, [], \"\u7a7a\u65f7\u9053\u8def\"),\n    (13.9, [(30.0, 10.0)], \"\u524d\u65b9\u6709\u8f83\u6162\u8f66\u8f86\"),\n    (13.9, [(3.0, 0.0)], \"\u524d\u65b9\u6709\u505c\u9760\u8f66\u8f86\uff0c\u8ddd\u79bb\u6781\u8fd1\"),\n    (13.9, [(50.0, 13.9)], \"\u524d\u65b9\u8f66\u8f86\u540c\u901f\u884c\u9a76\"),\n]\n\nfor speed, obs, desc in scenarios:\n    target, action = rule_based_planner(speed, obs)\n    print(f\"{desc:30s}  \u2192  {action:15s} \u76ee\u6807\u901f\u5ea6={target:.1f} \u7c73/\u79d2 ({target*3.6:.0f} \u516c\u91cc/\u5c0f\u65f6)\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2011%3A%20autonomous%20systems/05.%20space%20and%20extreme%20robotics/","title":"\u592a\u7a7a\u4e0e\u6781\u7aef\u73af\u5883\u673a\u5668\u4eba","text":"<p>\u592a\u7a7a\u548c\u6781\u7aef\u73af\u5883\u673a\u5668\u4eba\u5c06\u81ea\u4e3b\u6027\u63a8\u5411\u6781\u9650\u2014\u2014\u901a\u4fe1\u5ef6\u8fdf\u3001\u8f90\u5c04\u548c\u975e\u7ed3\u6784\u5316\u5730\u5f62\u8981\u6c42\u673a\u5668\u4eba\u81ea\u5df1\u601d\u8003\u3002\u672c\u7ae0\u6db5\u76d6\u884c\u661f\u6f2b\u6e38\u8f66\u3001\u5728\u8f68\u670d\u52a1\u3001\u901a\u4fe1\u53d7\u9650\u81ea\u4e3b\u6027\u3001\u6297\u8f90\u5c04\u8ba1\u7b97\u3001\u6c34\u4e0b\u673a\u5668\u4eba\u3001\u641c\u7d22\u6551\u63f4\u3001\u7fa4\u4f53\u673a\u5668\u4eba\u548c\u4eba\u673a\u4ea4\u4e92\u3002</p> <ul> <li> <p>\u5728\u672c\u7ae0\u4e2d\uff0c\u6211\u4eec\u7814\u7a76\u4e86\u5728\u76f8\u5bf9\u6e29\u548c\u73af\u5883\u4e2d\u8fd0\u884c\u7684\u81ea\u4e3b\u7cfb\u7edf\uff1a\u6709\u8f66\u9053\u6807\u7ebf\u7684\u9053\u8def\u3001\u6709\u5e73\u5766\u5730\u677f\u7684\u5730\u677f\u3001\u6709\u5df2\u77e5\u7269\u4f53\u7c7b\u522b\u7684\u53a8\u623f\u3002\u4f46\u673a\u5668\u4eba\u6280\u672f\u7684\u4e00\u4e9b\u6700\u5177\u5f71\u54cd\u529b\u7684\u5e94\u7528\u662f\u5728\u4eba\u7c7b\u65e0\u6cd5\u5230\u8fbe\u7684\u73af\u5883\uff0c\u6216\u8005\u4eba\u7c7b\u5b58\u5728\u7684\u6210\u672c\u6781\u9ad8\u7684\u73af\u5883\uff1a\u706b\u661f\u8868\u9762\u3001\u6df1\u6d77\u6d77\u5e95\u3001\u6838\u707e\u96be\u73b0\u573a\u548c\u71c3\u70e7\u7684\u5efa\u7b51\u3002</p> </li> <li> <p>\u8fd9\u4e9b\u6781\u7aef\u73af\u5883\u9762\u4e34\u7740\u5171\u540c\u7684\u6311\u6218\uff1a\u901a\u4fe1\u53d7\u9650\u6216\u6709\u5ef6\u8fdf\u3001\u5730\u5f62\u975e\u7ed3\u6784\u5316\u4e14\u4e0d\u53ef\u9884\u6d4b\u3001\u786c\u4ef6\u5fc5\u987b\u5728\u6076\u52a3\u6761\u4ef6\u4e0b\u751f\u5b58\u3001\u800c\u4e14\u9644\u8fd1\u6ca1\u6709\u4eba\u80fd\u5728\u51fa\u73b0\u95ee\u9898\u65f6\u4fee\u7406\u3002\u673a\u5668\u4eba\u5fc5\u987b\u771f\u6b63\u81ea\u4e3b\uff0c\u800c\u4e0d\u4ec5\u4ec5\u662f\"\u6709\u4eba\u5728\u5c4f\u5e55\u524d\u76d1\u63a7\u7684\u81ea\u4e3b\"\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/05.%20space%20and%20extreme%20robotics/#_2","title":"\u592a\u7a7a\u673a\u5668\u4eba","text":"<ul> <li> <p>\u592a\u7a7a\u662f\u7ec8\u6781\u7684\u6781\u7aef\u73af\u5883\u3002\u6ca1\u6709\u7a7a\u6c14\uff0c\u6e29\u5ea6\u5728-170\u00b0C\u5230+120\u00b0C\u4e4b\u95f4\u6446\u52a8\uff0c\u8f90\u5c04\u8f70\u51fb\u7535\u5b50\u8bbe\u5907\uff0c\u800c\u63f4\u52a9\u5728\u6570\u767e\u4e07\u516c\u91cc\u4e4b\u5916\u3002\u592a\u7a7a\u673a\u5668\u4eba\u5fc5\u987b\u5f02\u5e38\u53ef\u9760\u3001\u8282\u80fd\u4e14\u81ea\u4e3b\u3002</p> </li> <li> <p>\u884c\u661f\u6f2b\u6e38\u8f66\u662f\u5728\u5176\u4ed6\u4e16\u754c\u8868\u9762\u63a2\u7d22\u7684\u79fb\u52a8\u673a\u5668\u4eba\u3002NASA\u7684\u706b\u661f\u6f2b\u6e38\u8f66\uff08\u52c7\u6c14\u53f7\u3001\u673a\u9047\u53f7\u3001\u597d\u5947\u53f7\u3001\u6bc5\u529b\u53f7\uff09\u662f\u6700\u8457\u540d\u7684\u4f8b\u5b50\u3002\u6bcf\u4e00\u4ee3\u90fd\u6bd4\u4e0a\u4e00\u4ee3\u66f4\u52a0\u81ea\u4e3b\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u6839\u672c\u9650\u5236\u662f\u901a\u4fe1\u5ef6\u8fdf\u3002\u706b\u661f\u8ddd\u5730\u74034-24\u5206\u949f\u7684\u65e0\u7ebf\u7535\u8ddd\u79bb\uff08\u53d6\u51b3\u4e8e\u8f68\u9053\u4f4d\u7f6e\uff09\uff0c\u56e0\u6b64\u5f80\u8fd4\u901a\u4fe1\u9700\u89818-48\u5206\u949f\u3002\u6f2b\u6e38\u8f66\u4e0d\u80fd\u5b9e\u65f6\u64cd\u63a7\u3002\u5982\u679c\u9047\u5230\u5ca9\u77f3\uff0c\u5b83\u4e0d\u80fd\u5411\u5730\u7403\u6c42\u52a9\u5e76\u7b49\u5f85\u56de\u5e94\u3002\u5b83\u5fc5\u987b\u81ea\u5df1\u51b3\u5b9a\u3002</p> </li> <li> <p>\u65e9\u671f\u7684\u6f2b\u6e38\u8f66\uff08\u52c7\u6c14\u53f7\u3001\u673a\u9047\u53f7\uff09\u4e25\u91cd\u4f9d\u8d56\u5730\u9762\u53c2\u4e0e\u7684\u89c4\u5212\uff1a\u4eba\u7c7b\u7814\u7a76\u56fe\u50cf\u3001\u89c4\u5212\u8def\u5f84\u3001\u4e0a\u4f20\u547d\u4ee4\uff0c\u6f2b\u6e38\u8f66\u6267\u884c\u547d\u4ee4\u3002\u4e00\u4e2a\u9a7e\u9a76\u5468\u671f\u9700\u8981\u4e00\u4e2a\u5b8c\u6574\u7684\u706b\u661f\u65e5\u3002\u6f2b\u6e38\u8f66\u6bcf\u5929\u5927\u7ea6\u80fd\u884c\u8fdb50-100\u7c73\u3002</p> </li> <li> <p>\u597d\u5947\u53f7\u548c\u6bc5\u529b\u53f7\u4e0a\u7684AutoNav\uff08\u81ea\u4e3b\u5bfc\u822a\uff09\u6781\u5927\u5730\u63d0\u9ad8\u4e86\u81ea\u4e3b\u6027\u3002\u6f2b\u6e38\u8f66\u4f7f\u7528\u7acb\u4f53\u76f8\u673a\u6784\u5efa\u5c40\u90e83D\u5730\u56fe\uff08\u56de\u987e\u7b2c8\u7ae0\u7684\u7acb\u4f53\u6df1\u5ea6\uff09\uff0c\u8bc4\u4f30\u5730\u5f62\u53ef\u901a\u8fc7\u6027\uff08\u5761\u5ea6\u3001\u7c97\u7cd9\u5ea6\u3001\u5ca9\u77f3\u5927\u5c0f\uff09\uff0c\u5e76\u4f7f\u7528\u57fa\u4e8e\u7f51\u683c\u7684\u89c4\u5212\u5668\u548c\u53ef\u901a\u8fc7\u6027\u4ee3\u4ef7\u56fe\u89c4\u5212\u5b89\u5168\u8def\u5f84\u3002\u6f2b\u6e38\u8f66\u5728\u4eba\u7c7b\u56e2\u961f\u7761\u7720\u65f6\u81ea\u4e3b\u884c\u9a76\uff0c\u5c06\u6bcf\u65e5\u884c\u8fdb\u8ddd\u79bb\u63d0\u9ad8\u5230100\u7c73\u4ee5\u4e0a\u3002</p> </li> <li> <p>\u706b\u661f\u6f2b\u6e38\u8f66\u4e0a\u7684\u611f\u77e5\u6d41\u7a0b\u53d7\u5230\u6297\u8f90\u5c04\u5904\u7406\u5668\u7684\u9650\u5236\uff0c\u8fd9\u4e9b\u5904\u7406\u5668\u6bd4\u6d88\u8d39\u7ea7\u786c\u4ef6\u6162\u51e0\u4e2a\u6570\u91cf\u7ea7\uff08\u4e0b\u6587\u8ba8\u8bba\uff09\u3002\u7b97\u6cd5\u5fc5\u987b\u8ba1\u7b97\u8282\u4fed\uff1a\u7ecf\u5178\u7684\u7acb\u4f53\u5339\u914d\u800c\u975e\u6df1\u5ea6\u795e\u7ecf\u7f51\u7edc\uff0c\u7b80\u5355\u7684\u4ee3\u4ef7\u56fe\u89c4\u5212\u5668\u800c\u975e\u5b66\u4e60\u578b\u7b56\u7565\u3002</p> </li> <li> <p>\u5728\u8f68\u670d\u52a1\u6d89\u53ca\u5728\u8f68\u9053\u4e0a\u68c0\u67e5\u3001\u4fee\u7406\u3001\u52a0\u6cb9\u6216\u4f7f\u536b\u661f\u8131\u79bb\u8f68\u9053\u7684\u673a\u5668\u4eba\u3002\u968f\u7740\u592a\u7a7a\u53d8\u5f97\u66f4\u52a0\u62e5\u6324\uff0c\u8fd9\u662f\u4e00\u4e2a\u4e0d\u65ad\u589e\u957f\u7684\u9886\u57df\u3002OSAM-1\uff08NASA\uff09\u548c\u5546\u4e1a\u4f01\u4e1a\uff08Astroscale\u3001Northrop Grumman MEV\uff09\u7b49\u4efb\u52a1\u4f7f\u7528\u673a\u68b0\u81c2\u548c\u5bf9\u63a5\u673a\u6784\u6765\u670d\u52a1\u536b\u661f\u3002</p> </li> <li> <p>\u6311\u6218\u5728\u4e8e\u8fd1\u8ddd\u79bb\u64cd\u4f5c\uff1a\u670d\u52a1\u822a\u5929\u5668\u5fc5\u987b\u63a5\u8fd1\u76ee\u6807\u536b\u661f\uff08\u53ef\u80fd\u6b63\u5728\u7ffb\u6eda\u3001\u4e0d\u5408\u4f5c\u4e14\u7f3a\u4e4f\u5bf9\u63a5\u63a5\u53e3\uff09\uff0c\u5e76\u5728\u5fae\u91cd\u529b\u4e0b\u6267\u884c\u7cbe\u786e\u64cd\u4f5c\u3002\u57fa\u4e8e\u89c6\u89c9\u7684\u4f4d\u59ff\u4f30\u8ba1\uff08\u4ece\u76f8\u673a\u56fe\u50cf\u786e\u5b9a\u76ee\u6807\u76843D\u4f4d\u7f6e\u548c\u65b9\u5411\uff09\u81f3\u5173\u91cd\u8981\u3002\u8fd9\u4f7f\u7528\u4e86\u7b2c8\u7ae0\u7684\u6280\u672f\uff1a\u7279\u5f81\u68c0\u6d4b\u3001PnP\uff08\u900f\u89c6n\u70b9\uff09\u6c42\u89e3\uff0c\u4ee5\u53ca\u6700\u8fd1\u57fa\u4e8e\u6df1\u5ea6\u5b66\u4e60\u7684\u4f4d\u59ff\u4f30\u8ba1\u5668\u3002</p> </li> <li> <p>\u536b\u661f\u68c0\u67e5\u4f7f\u7528\u5c0f\u578b\u822a\u5929\u5668\u76ee\u89c6\u68c0\u67e5\u5176\u4ed6\u536b\u661f\u662f\u5426\u6709\u635f\u574f\u6216\u5f02\u5e38\u3002\u68c0\u67e5\u8005\u5fc5\u987b\u81ea\u4e3b\u7ed5\u76ee\u6807\u5bfc\u822a\u3001\u907f\u514d\u78b0\u649e\u5e76\u4ece\u6700\u4f73\u89c6\u89d2\u6355\u83b7\u9ad8\u5206\u8fa8\u7387\u56fe\u50cf\u3002\u8fd9\u662f\u4e00\u4e2a\u89c4\u5212\u95ee\u9898\uff1a\u627e\u5230\u8986\u76d6\u6240\u6709\u68c0\u67e5\u70b9\u4e14\u6ee1\u8db3\u71c3\u6599\u7ea6\u675f\u3001\u5149\u7167\u6761\u4ef6\u548c\u907f\u78b0\u8981\u6c42\u7684\u8f68\u8ff9\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/05.%20space%20and%20extreme%20robotics/#_3","title":"\u901a\u4fe1\u7ea6\u675f","text":"<ul> <li> <p>\u5728\u592a\u7a7a\u4e2d\uff0c\u901a\u4fe1\u53d7\u5230\u5149\u901f\u3001\u53ef\u7528\u5e26\u5bbd\u548c\u8f68\u9053\u51e0\u4f55\u7684\u9650\u5236\uff08\u706b\u661f\u80cc\u9762\u7684\u6f2b\u6e38\u8f66\u5728\u6ca1\u6709\u4e2d\u7ee7\u536b\u661f\u7684\u60c5\u51b5\u4e0b\u6839\u672c\u65e0\u6cd5\u4e0e\u5730\u7403\u901a\u4fe1\uff09\u3002</p> </li> <li> <p>\u8fd9\u4e9b\u9650\u5236\u4ece\u6839\u672c\u4e0a\u6539\u53d8\u4e86\u81ea\u4e3b\u6027\u67b6\u6784\u3002\u5728\u5730\u7403\u4e0a\uff0c\u673a\u5668\u4eba\u53ef\u4ee5\u5c06\u9ad8\u6e05\u89c6\u9891\u6d41\u4f20\u8f93\u5230\u4e91\u670d\u52a1\u5668\uff0c\u5728GPU\u96c6\u7fa4\u4e0a\u8fd0\u884c\u63a8\u7406\uff0c\u5e76\u5728\u6beb\u79d2\u5185\u63a5\u6536\u6307\u4ee4\u3002\u5728\u592a\u7a7a\u4e2d\uff0c\u673a\u5668\u4eba\u5fc5\u987b\u5728\u98de\u884c\u5668\u4e0a\u5b8c\u6210\u6240\u6709\u5de5\u4f5c\u3002</p> </li> <li> <p>\u9ad8\u5ef6\u8fdf\u610f\u5473\u7740\u673a\u5668\u4eba\u5fc5\u987b\u5728\u6ca1\u6709\u5b9e\u65f6\u4eba\u7c7b\u6307\u5bfc\u7684\u60c5\u51b5\u4e0b\u89c4\u5212\u548c\u884c\u52a8\u3002\u81ea\u4e3b\u8f6f\u4ef6\u5fc5\u987b\u5904\u7406\u5e38\u89c4\u64cd\u4f5c\u3001\u68c0\u6d4b\u5f02\u5e38\u5e76\u54cd\u5e94\u5371\u9669\uff0c\u800c\u65e0\u9700\u7b49\u5f85\u4eba\u7c7b\u8f93\u5165\u3002\u8fd9\u9700\u8981\u9c81\u68d2\u7684\u677f\u8f7d\u72b6\u6001\u4f30\u8ba1\u3001\u6545\u969c\u68c0\u6d4b\u548c\u5e94\u6025\u89c4\u5212\u3002</p> </li> <li> <p>\u6709\u9650\u5e26\u5bbd\u610f\u5473\u7740\u673a\u5668\u4eba\u65e0\u6cd5\u4f20\u8f93\u539f\u59cb\u4f20\u611f\u5668\u6570\u636e\u3002\u4e00\u5f20\u9ad8\u5206\u8fa8\u7387\u56fe\u50cf\u53ef\u80fd\u6709\u51e0\u5146\u5b57\u8282\uff0c\u4f46\u706b\u661f\u5230\u5730\u7403\u7684\u6570\u636e\u901f\u7387\u901a\u8fc7\u76f4\u63a5\u5bf9\u5730\u94fe\u8def\u53ea\u6709\u6bcf\u79d2\u51e0\u5343\u6bd4\u7279\uff08\u901a\u8fc7\u8f68\u9053\u4e2d\u7ee7\u66f4\u9ad8\uff0c\u4f46\u4ecd\u7136\u6709\u9650\uff09\u3002\u673a\u5668\u4eba\u5fc5\u987b\u79ef\u6781\u538b\u7f29\u6570\u636e\u3001\u4f18\u5148\u51b3\u5b9a\u53d1\u9001\u54ea\u4e9b\u6570\u636e\uff0c\u5e76\u5728\u672c\u5730\u505a\u51fa\u5927\u90e8\u5206\u51b3\u7b56\u3002</p> </li> <li> <p>\u901a\u4fe1\u7a97\u53e3\u662f\u95f4\u6b47\u6027\u7684\u3002\u706b\u661f\u6f2b\u6e38\u8f66\u53ea\u80fd\u5728\u7279\u5b9a\u8f68\u9053\u51e0\u4f55\u5f62\u72b6\u671f\u95f4\u4e0e\u5730\u7403\u901a\u4fe1\uff0c\u901a\u5e38\u6bcf\u4e2a\u706b\u661f\u65e5\u901a\u8fc7\u4e2d\u7ee7\u536b\u661f\u53ea\u6709\u51e0\u5c0f\u65f6\u3002\u5728\u8fd9\u4e9b\u7a97\u53e3\u4e4b\u5916\uff0c\u6f2b\u6e38\u8f66\u5b8c\u5168\u9760\u81ea\u5df1\u3002</p> </li> <li> <p>\u5bf9AI\u7684\u5f71\u54cd\u662f\u677f\u8f7d\u81ea\u4e3b\u6027\u5fc5\u987b\u975e\u5e38\u53ef\u9760\u3002\u7cfb\u7edf\u9700\u8981\u68c0\u6d4b\u662f\u5426\u51fa\u4e86\u95ee\u9898\uff08\u8f6e\u5b50\u5361\u4f4f\u4e86\u3001\u4f20\u611f\u5668\u6545\u969c\u4e86\u3001\u524d\u65b9\u5730\u5f62\u65e0\u6cd5\u901a\u884c\uff09\uff0c\u51b3\u5b9a\u5b89\u5168\u54cd\u5e94\uff0c\u5e76\u7ee7\u7eed\u8fd0\u884c\u76f4\u5230\u4e0b\u4e00\u4e2a\u901a\u4fe1\u7a97\u53e3\uff0c\u5c4a\u65f6\u5b83\u53ef\u4ee5\u62a5\u544a\u5e76\u63a5\u6536\u66f4\u65b0\u6307\u4ee4\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/05.%20space%20and%20extreme%20robotics/#_4","title":"\u6297\u8f90\u5c04\u8ba1\u7b97","text":"<ul> <li> <p>\u592a\u7a7a\u4e2d\u5145\u6ee1\u4e86\u7535\u79bb\u8f90\u5c04\uff1a\u5b87\u5b99\u5c04\u7ebf\u3001\u592a\u9633\u7c92\u5b50\u4e8b\u4ef6\u4ee5\u53ca\u884c\u661f\u78c1\u573a\u4e2d\u7684\u6355\u83b7\u8f90\u5c04\u3002\u9ad8\u80fd\u7c92\u5b50\u53ef\u4ee5\u7ffb\u8f6c\u5b58\u50a8\u5668\u4e2d\u7684\u6bd4\u7279\uff08\u5355\u7c92\u5b50\u7ffb\u8f6c\uff0cSEU\uff09\uff0c\u6c38\u4e45\u635f\u574f\u6676\u4f53\u7ba1\uff08\u603b\u7535\u79bb\u5242\u91cf\uff0cTID\uff09\uff0c\u6216\u5728\u7535\u8def\u4e2d\u5f15\u8d77\u7834\u574f\u6027\u95e9\u9501\u3002</p> </li> <li> <p>\u6297\u8f90\u5c04\u5904\u7406\u5668\u88ab\u8bbe\u8ba1\u4e3a\u627f\u53d7\u8fd9\u79cd\u73af\u5883\u3002\u5b83\u4eec\u4f7f\u7528\u66f4\u5927\u7684\u6676\u4f53\u7ba1\u51e0\u4f55\u5c3a\u5bf8\u3001\u5197\u4f59\u903b\u8f91\uff08\u4e09\u6a21\u5197\u4f59\uff1a\u6bcf\u4e2a\u7535\u8def\u6709\u4e09\u4e2a\u526f\u672c\u5bf9\u8f93\u51fa\u8fdb\u884c\u6295\u7968\uff09\u548c\u4e13\u95e8\u7684\u5236\u9020\u5de5\u827a\u3002\u4ee3\u4ef7\u662f\u6027\u80fd\uff1a\u6700\u5148\u8fdb\u7684\u6297\u8f90\u5c04\u5904\u7406\u5668\u53ef\u80fd\u63d0\u4f9b200 MIPS\uff0c\u800c\u6d88\u8d39\u7ea7GPU\u6bcf\u79d2\u53ef\u6267\u884c\u6570\u5341\u4ebf\u6b21\u64cd\u4f5c\u3002</p> </li> <li> <p>RAD750\uff08BAE Systems\uff09\u4e3a\u597d\u5947\u53f7\u548c\u8bb8\u591a\u5176\u4ed6\u822a\u5929\u5668\u63d0\u4f9b\u52a8\u529b\u3002\u5b83\u4ee5200 MHz\u8fd0\u884c\uff0c\u7ea6400 MIPS\u7684\u5904\u7406\u80fd\u529b\uff0c\u76f8\u5f53\u4e8e1990\u5e74\u4ee3\u4e2d\u671f\u7684\u53f0\u5f0f\u7535\u8111\u3002\u6bc5\u529b\u53f7\u4f7f\u7528\u7c7b\u4f3c\u7b49\u7ea7\u7684\u5904\u7406\u5668\u3002\u5728\u73b0\u4ee3\u795e\u7ecf\u7f51\u7edc\u4e0a\u8fd0\u884c\uff08\u6570\u767e\u4e07\u53c2\u6570\u3001\u6570\u5341\u4ebf\u6b21\u4e58\u52a0\u8fd0\u7b97\uff09\u5728\u8fd9\u6837\u7684\u786c\u4ef6\u4e0a\u662f\u4e0d\u53ef\u884c\u7684\u3002</p> </li> <li> <p>\u6a21\u578b\u538b\u7f29\u53d8\u5f97\u81f3\u5173\u91cd\u8981\u3002\u7b2c6\u7ae0\u7684\u6280\u672f\uff08\u91cf\u5316\u3001\u526a\u679d\u3001\u77e5\u8bc6\u84b8\u998f\uff09\u7528\u4e8e\u7f29\u5c0f\u795e\u7ecf\u7f51\u7edc\u4ee5\u9002\u5e94\u6781\u7aef\u7684\u8ba1\u7b97\u9884\u7b97\u3002\u5728\u7b14\u8bb0\u672c\u7535\u8111GPU\u4e0a\u6beb\u79d2\u7ea7\u8fd0\u884c\u7684\u6a21\u578b\u53ef\u80fd\u5728\u6297\u8f90\u5c04\u5904\u7406\u5668\u4e0a\u9700\u8981\u6570\u5206\u949f\uff0c\u6216\u8005\u6839\u672c\u65e0\u6cd5\u88c5\u5165\u5185\u5b58\u3002</p> </li> <li> <p>\u53e6\u4e00\u79cd\u65b9\u6cd5\u4f7f\u7528\u5546\u7528\u73b0\u8d27\u5904\u7406\u5668\uff0c\u914d\u5408\u8f6f\u4ef6\u4e2d\u7684\u8f90\u5c04\u7f13\u89e3\u63aa\u65bd\uff1a\u7ea0\u9519\u7801\u3001\u770b\u95e8\u72d7\u5b9a\u65f6\u5668\u3001\u5b9a\u671f\u5185\u5b58\u6e05\u7406\u548c\u4f18\u96c5\u964d\u7ea7\u7b56\u7565\u3002\u4e00\u4e9b\u73b0\u4ee3\u4efb\u52a1\u4f7f\u7528\u8fd9\u79cd\u65b9\u6cd5\u4ee5\u83b7\u5f97\u66f4\u5f3a\u5927\u7684\u8ba1\u7b97\u80fd\u529b\uff0c\u4ee3\u4ef7\u662f\u589e\u52a0\u4e86\u8f6f\u4ef6\u590d\u6742\u6027\u548c\u98ce\u9669\u3002</p> </li> <li> <p>\u672a\u6765\u7684\u884c\u661f\u4efb\u52a1\u6b63\u5728\u63a2\u7d22FPGA\u548c\u4e13\u95e8\u7684AI\u52a0\u901f\u5668\uff0c\u5b83\u4eec\u53ef\u4ee5\u5177\u6709\u8010\u8f90\u5c04\u6027\uff0c\u540c\u65f6\u63d0\u4f9b\u6bd4\u4f20\u7edf\u6297\u8f90\u5c04CPU\u591a\u5f97\u591a\u7684\u8ba1\u7b97\u80fd\u529b\uff0c\u53ef\u80fd\u9996\u6b21\u5b9e\u73b0\u677f\u8f7d\u6df1\u5ea6\u5b66\u4e60\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/05.%20space%20and%20extreme%20robotics/#_5","title":"\u975e\u7ed3\u6784\u5316\u5730\u5f62\u4e2d\u7684\u81ea\u4e3b\u5bfc\u822a","text":"<ul> <li> <p>\u5728\u5730\u7403\u4e0a\uff0c\u9053\u8def\u5e73\u5766\u3001\u6807\u8bb0\u6e05\u6670\u4e14\u6709\u5730\u56fe\u3002\u5728\u706b\u661f\u3001\u6708\u7403\u6216\u707e\u96be\u73b0\u573a\uff0c\u6ca1\u6709\u9053\u8def\u3002\u5730\u5f62\u662f\u975e\u7ed3\u6784\u5316\u7684\uff1a\u5ca9\u77f3\u3001\u659c\u5761\u3001\u6c99\u5730\u3001\u88c2\u7f1d\u548c\u53ef\u80fd\u65e0\u6cd5\u652f\u6491\u673a\u5668\u4eba\u91cd\u91cf\u7684\u8868\u9762\u3002</p> </li> <li> <p>\u5730\u5f62\u5206\u7c7b\u8bc4\u4f30\u6bcf\u5757\u5730\u9762\u662f\u5426\u5b89\u5168\u901a\u884c\u3002\u7279\u5f81\u5305\u62ec\u5761\u5ea6\uff08\u6765\u81ea3D\u91cd\u5efa\uff09\u3001\u7c97\u7cd9\u5ea6\uff08\u8868\u9762\u6cd5\u7ebf\u7684\u65b9\u5dee\uff09\u3001\u5ca9\u77f3\u5bc6\u5ea6\u548c\u571f\u58e4\u7c7b\u578b\u3002\u7ecf\u5178\u65b9\u6cd5\u4ece\u7acb\u4f53\u6df1\u5ea6\u56fe\u8ba1\u7b97\u8fd9\u4e9b\u7279\u5f81\uff1b\u73b0\u4ee3\u65b9\u6cd5\u5728\u89c6\u89c9\u548c\u51e0\u4f55\u7279\u5f81\u4e0a\u4f7f\u7528\u5b66\u4e60\u578b\u5206\u7c7b\u5668\u3002</p> </li> <li> <p>\u89c6\u89c9-\u60ef\u6027\u91cc\u7a0b\u8ba1\uff08VIO\uff09\u901a\u8fc7\u8ddf\u8e2a\u8de8\u76f8\u673a\u5e27\u7684\u89c6\u89c9\u7279\u5f81\u5e76\u4e0eIMU\u6d4b\u91cf\u878d\u5408\u6765\u4f30\u8ba1\u673a\u5668\u4eba\u7684\u8fd0\u52a8\u3002\u8fd9\u662fSLAM\u7684\u6838\u5fc3\u7ec4\u4ef6\uff08\u7b2c8\u7ae0\uff09\uff0c\u9488\u5bf9\u6781\u7aef\u6761\u4ef6\u8fdb\u884c\u4e86\u8c03\u6574\u3002\u5728\u706b\u661f\u4e0a\uff0cVIO\u5fc5\u987b\u5904\u7406\uff1a\u65e0\u7279\u5f81\u7684\u6c99\u5730\u5730\u5f62\uff08\u51e0\u4e4e\u6ca1\u6709\u53ef\u8ddf\u8e2a\u7684\u89c6\u89c9\u7279\u5f81\uff09\u3001\u5f3a\u70c8\u7684\u5149\u7167\uff08\u6781\u7aef\u9634\u5f71\uff09\u548c\u6709\u9650\u7684\u8ba1\u7b97\u80fd\u529b\u3002</p> </li> <li> <p>\u4f30\u8ba1\u8fc7\u7a0b\u4f7f\u7528\u6269\u5c55\u5361\u5c14\u66fc\u6ee4\u6ce2\uff08EKF\uff09\u6216\u56e0\u5b50\u56fe\u4f18\u5316\u878d\u5408\u89c6\u89c9\u548c\u60ef\u6027\u6570\u636e\u3002\u72b6\u6001\u5411\u91cf\u5305\u62ec\u4f4d\u7f6e\u3001\u901f\u5ea6\u3001\u65b9\u5411\u548cIMU\u504f\u5dee\u3002\u9884\u6d4b\u6b65\u9aa4\u4f7f\u7528IMU\u79ef\u5206\uff1a</p> </li> </ul> \\[\\\\mathbf{x}_{t+1} = f(\\\\mathbf{x}_t, \\\\mathbf{u}_t)\\] <ul> <li> <p>\u5176\u4e2d\\(\\\\mathbf{u}_t\\)\u662fIMU\u6d4b\u91cf\u503c\uff08\u52a0\u901f\u5ea6\u548c\u89d2\u901f\u5ea6\uff09\u3002\u66f4\u65b0\u6b65\u9aa4\u4f7f\u7528\u89c6\u89c9\u7279\u5f81\u89c2\u6d4b\u6765\u6821\u6b63\u9884\u6d4b\u3002\u8fd9\u662f\u8d1d\u53f6\u65af\u4f30\u8ba1\uff08\u7b2c5\u7ae0\uff09\uff1aIMU\u63d0\u4f9b\u5148\u9a8c\uff0c\u89c6\u89c9\u89c2\u6d4b\u66f4\u65b0\u4fe1\u5ff5\u3002</p> </li> <li> <p>\u5371\u9669\u89c4\u907f\u5728\u884c\u661f\u7740\u9646\u8fc7\u7a0b\u4e2d\u81f3\u5173\u91cd\u8981\u3002\u5f53\u822a\u5929\u5668\u4e0b\u964d\u5411\u8868\u9762\u65f6\uff0c\u5b83\u5fc5\u987b\u4f7f\u7528\u677f\u8f7d\u76f8\u673a\u6216LiDAR\u5b9e\u65f6\u8bc6\u522b\u5b89\u5168\u7684\u7740\u9646\u533a\u3002NASA\u6bc5\u529b\u53f7\u4e0a\u7684\u5730\u5f62\u76f8\u5bf9\u5bfc\u822a\uff08TRN\uff09\u7cfb\u7edf\u5c06\u677f\u8f7d\u76f8\u673a\u56fe\u50cf\u4e0e\u9884\u52a0\u8f7d\u7684\u8f68\u9053\u5730\u56fe\u8fdb\u884c\u6bd4\u8f83\uff0c\u4ee5\u786e\u5b9a\u4e0b\u964d\u8fc7\u7a0b\u4e2d\u7684\u4f4d\u7f6e\uff0c\u7136\u540e\u907f\u5f00\u5371\u9669\u5730\u5f62\u3002\u8fd9\u4f7f\u5f97\u5728Jezero\u9668\u77f3\u5751\u7740\u9646\u6210\u4e3a\u53ef\u80fd\u2014\u2014\u4e00\u4e2a\u79d1\u5b66\u4e30\u5bcc\u4f46\u5730\u5f62\u5371\u9669\u7684\u7ad9\u70b9\uff0c\u5bf9\u4e8e\u4ee5\u524d\u7684 missions \u6765\u8bf4\u98ce\u9669\u592a\u5927\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/05.%20space%20and%20extreme%20robotics/#_6","title":"\u6c34\u4e0b\u673a\u5668\u4eba","text":"<ul> <li> <p>\u6df1\u6d77\u4e0e\u592a\u7a7a\u4e00\u6837\u964c\u751f\uff1a\u538b\u788e\u6027\u538b\u529b\uff08\u5168\u6d77\u6df11000+\u4e2a\u5927\u6c14\u538b\uff09\u3001\u63a5\u8fd1\u96f6\u80fd\u89c1\u5ea6\u3001\u65e0GPS\u548c\u6709\u9650\u7684\u901a\u4fe1\u3002\u6c34\u4e0b\u673a\u5668\u4eba\u5bf9\u6d77\u6d0b\u79d1\u5b66\u3001\u8fd1\u6d77\u57fa\u7840\u8bbe\u65bd\u68c0\u67e5\u3001\u6df1\u6d77\u91c7\u77ff\u548c\u641c\u7d22\u64cd\u4f5c\u81f3\u5173\u91cd\u8981\u3002</p> </li> <li> <p>AUV\uff08\u81ea\u4e3b\u6c34\u4e0b\u822a\u884c\u5668\uff09\u65e0\u7f06\u8fd0\u884c\uff0c\u643a\u5e26\u81ea\u5df1\u7684\u7535\u529b\u548c\u8ba1\u7b97\u8d44\u6e90\u3002\u5b83\u4eec\u9075\u5faa\u9884\u8bbe\u7684\u6d4b\u91cf\u6a21\u5f0f\u6216\u4f7f\u7528\u677f\u8f7d\u667a\u80fd\u6765\u9002\u5e94\u53d1\u73b0\u3002AUV\u7528\u4e8e\u6d77\u5e95\u6d4b\u7ed8\u3001\u7ba1\u9053\u68c0\u67e5\u548c\u73af\u5883\u76d1\u6d4b\u3002</p> </li> <li> <p>ROV\uff08\u9065\u63a7\u6c34\u4e0b\u822a\u884c\u5668\uff09\u901a\u8fc7\u7535\u7f06\u8fde\u63a5\u5230\u6c34\u9762\u8239\u53ea\uff0c\u63d0\u4f9b\u7535\u529b\u548c\u901a\u4fe1\u3002\u5b83\u4eec\u7528\u4e8e\u9700\u8981\u5b9e\u65f6\u4eba\u7c7b\u63a7\u5236\u7684\u4efb\u52a1\uff1a\u6df1\u6d77\u64cd\u4f5c\u3001\u5efa\u9020\u548c\u4fee\u7406\u3002\u7f06\u7ebf\u6d88\u9664\u4e86\u901a\u4fe1\u9650\u5236\uff0c\u4f46\u9650\u5236\u4e86\u8303\u56f4\u5e76\u589e\u52a0\u4e86\u64cd\u4f5c\u590d\u6742\u6027\u3002</p> </li> <li> <p>\u58f0\u5b66\u901a\u4fe1\u662f\u4e3b\u8981\u7684\u6c34\u4e0b\u901a\u4fe1\u65b9\u6cd5\uff08\u65e0\u7ebf\u7535\u6ce2\u5728\u6c34\u4e2d\u8fc5\u901f\u8870\u51cf\uff09\u3002\u58f0\u5b66\u8c03\u5236\u89e3\u8c03\u5668\u5728\u51e0\u516c\u91cc\u8303\u56f4\u5185\u8fbe\u52301-10 kbps\u7684\u6570\u636e\u901f\u7387\uff0c\u800c\u9646\u5730\u4e0a\u65e0\u7ebf\u7535\u53ef\u8fbe\u5409\u6bd4\u7279\u6bcf\u79d2\u3002\u8fd9\u751a\u81f3\u6bd4\u706b\u661f\u901a\u4fe1\u66f4\u52a0\u53d7\u9650\uff0c\u8feb\u4f7fAUV\u9ad8\u5ea6\u81ea\u4e3b\u3002</p> </li> <li> <p>\u6c34\u4e0bSLAM\u5c24\u5176\u5177\u6709\u6311\u6218\u6027\u3002\u58f0\u7eb3\u63d0\u4f9b\u8ddd\u79bb\u6d4b\u91cf\uff0c\u4f46\u89d2\u5206\u8fa8\u7387\u5dee\u4e14\u566a\u58f0\u5927\uff08\u6765\u81ea\u6d77\u5e95\u548c\u6c34\u9762\u7684\u591a\u5f84\u53cd\u5c04\uff09\u3002\u76f8\u673a\u53ea\u80fd\u5728\u975e\u5e38\u77ed\u7684\u8ddd\u79bb\u5185\u5de5\u4f5c\uff08\u6e05\u6f88\u6c34\u4e2d\u51e0\u7c73\uff0c\u6d51\u6d4a\u6761\u4ef6\u4e0b\u66f4\u77ed\uff09\u3002\u57fa\u4e8e\u7279\u5f81\u7684\u53ef\u89c6SLAM\uff08\u7b2c8\u7ae0\uff09\u5fc5\u987b\u9488\u5bf9\u6c34\u4e0b\u573a\u666f\u7684\u72ec\u7279\u89c6\u89c9\u7279\u5f81\u8fdb\u884c\u8c03\u6574\uff1a\u989c\u8272\u8870\u51cf\uff08\u7ea2\u5149\u9996\u5148\u88ab\u5438\u6536\uff09\u3001\u53cd\u5411\u6563\u5c04\u4ee5\u53ca\u4ea7\u751f\u4eae\u6591\u548c\u6df1\u5f71\u7684\u4eba\u5de5\u7167\u660e\u3002</p> </li> <li> <p>\u65e0GPS\u5bfc\u822a\u4f7f\u7528\u822a\u4f4d\u63a8\u7b97\uff08\u79ef\u5206\u6765\u81ea\u591a\u666e\u52d2\u6d4b\u901f\u4eeaDVL\u7684\u901f\u5ea6\uff0c\u8be5\u4eea\u5668\u5229\u7528\u58f0\u5b66\u591a\u666e\u52d2\u9891\u79fb\u6d4b\u91cf\u76f8\u5bf9\u4e8e\u6d77\u5e95\u7684\u901f\u5ea6\uff09\uff0c\u8f85\u4ee5\u5076\u5c14\u6d6e\u51fa\u6c34\u9762\u83b7\u53d6GPS\u5b9a\u4f4d\u6216\u6765\u81ea\u6c34\u9762\u5e94\u7b54\u5668\u7684\u58f0\u5b66\u5b9a\u4f4d\u3002\u8fd9\u4e0e\u4ec5IMU\u5bfc\u822a\u76f8\u540c\u7684\u6f02\u79fb\u95ee\u9898\uff1a\u5c0f\u7684\u901f\u5ea6\u8bef\u5dee\u5728\u957f\u4efb\u52a1\u4e2d\u7d2f\u79ef\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/05.%20space%20and%20extreme%20robotics/#_7","title":"\u641c\u7d22\u6551\u63f4\u673a\u5668\u4eba","text":"<ul> <li> <p>\u5728\u5730\u9707\u3001\u5efa\u7b51\u7269\u5012\u584c\u6216\u5de5\u4e1a\u4e8b\u6545\u540e\uff0c\u673a\u5668\u4eba\u53ef\u4ee5\u8fdb\u5165\u5bf9\u4eba\u7c7b\u6551\u63f4\u4eba\u5458\u592a\u5371\u9669\u7684\u533a\u57df\uff1a\u7ed3\u6784\u4e0d\u7a33\u5b9a\u7684\u5efa\u7b51\u7269\u3001\u6709\u6bd2\u73af\u5883\u3001\u706b\u573a\u6216\u5bc6\u95ed\u7a7a\u95f4\u3002</p> </li> <li> <p>\u9700\u6c42\u662f\uff1a\u5feb\u901f\u90e8\u7f72\uff08\u51e0\u5206\u949f\u800c\u975e\u51e0\u5c0f\u65f6\uff09\u3001\u5728GPS\u53d7\u9650\u73af\u5883\u4e2d\u8fd0\u884c\uff08\u5efa\u7b51\u7269\u5185\u90e8\u3001\u5730\u4e0b\uff09\u3001\u901a\u8fc7\u5899\u58c1\u548c\u74e6\u783e\u7684\u9c81\u68d2\u901a\u4fe1\uff0c\u4ee5\u53ca\u5bfc\u822a\u9ad8\u5ea6\u6742\u4e71\u3001\u90e8\u5206\u574d\u584c\u7a7a\u95f4\u7684\u80fd\u529b\uff0c\u8fd9\u4e9b\u7a7a\u95f4\u5145\u6ee1\u788e\u7247\u3001\u7070\u5c18\u548c\u4e0d\u826f\u7167\u660e\u3002</p> </li> <li> <p>\u591a\u673a\u5668\u4eba\u534f\u8c03\u5728\u641c\u7d22\u6551\u63f4\u4e2d\u5f88\u6709\u4ef7\u503c\uff0c\u56e0\u4e3a\u4e00\u652f\u673a\u5668\u4eba\u56e2\u961f\u53ef\u4ee5\u6bd4\u5355\u4e2a\u673a\u5668\u4eba\u66f4\u5feb\u5730\u8986\u76d6\u5927\u9762\u79ef\u3002\u6311\u6218\u5728\u4e8e\u534f\u8c03\uff1a\u673a\u5668\u4eba\u5fc5\u987b\u5212\u5206\u641c\u7d22\u533a\u57df\u3001\u907f\u514d\u91cd\u590d\u5de5\u4f5c\u5e76\u5171\u4eab\u53d1\u73b0\u3002</p> </li> <li> <p>\u524d\u6cbf\u63a2\u7d22\u5c06\u673a\u5668\u4eba\u5206\u914d\u5230\u5df2\u63a2\u7d22\u548c\u672a\u63a2\u7d22\u7a7a\u95f4\u4e4b\u95f4\u7684\u8fb9\u754c\uff08\"\u524d\u6cbf\"\uff09\u3002\u6bcf\u4e2a\u673a\u5668\u4eba\u5bfc\u822a\u5230\u6700\u8fd1\u7684\u672a\u63a2\u7d22\u524d\u6cbf\u3001\u7ed8\u5236\u5730\u56fe\u5e76\u7ee7\u7eed\u524d\u8fdb\u3002\u4e2d\u592e\u6216\u5206\u5e03\u5f0f\u89c4\u5212\u5668\u5c06\u524d\u6cbf\u5206\u914d\u7ed9\u673a\u5668\u4eba\u4ee5\u6700\u5c0f\u5316\u603b\u63a2\u7d22\u65f6\u95f4\u3002\u8fd9\u662f\u4e00\u4e2a\u8986\u76d6\u4f18\u5316\u95ee\u9898\u3002</p> </li> <li> <p>\u901a\u8fc7\u74e6\u783e\u7684\u901a\u4fe1\u4e0d\u53ef\u9760\u3002\u673a\u5668\u4eba\u53ef\u80fd\u5931\u53bb\u4e0e\u63a7\u5236\u53f0\u548c\u5f7c\u6b64\u7684\u8054\u7cfb\u3002\u7cfb\u7edf\u5fc5\u987b\u5bf9\u95f4\u6b47\u901a\u4fe1\u5177\u6709\u9c81\u68d2\u6027\uff1a\u6bcf\u4e2a\u673a\u5668\u4eba\u5e94\u80fd\u72ec\u7acb\u8fd0\u884c\uff0c\u6784\u5efa\u81ea\u5df1\u7684\u5c40\u90e8\u5730\u56fe\u5e76\u505a\u51fa\u81ea\u5df1\u7684\u51b3\u7b56\uff0c\u7136\u540e\u5728\u901a\u4fe1\u6062\u590d\u65f6\u5408\u5e76\u4fe1\u606f\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/05.%20space%20and%20extreme%20robotics/#_8","title":"\u7fa4\u4f53\u673a\u5668\u4eba","text":"<ul> <li> <p>\u7fa4\u4f53\u673a\u5668\u4eba\u4f7f\u7528\u5927\u91cf\u7b80\u5355\u3001\u4f4e\u6210\u672c\u7684\u673a\u5668\u4eba\uff0c\u901a\u8fc7\u5c40\u90e8\u4ea4\u4e92\u5b9e\u73b0\u590d\u6742\u7684\u96c6\u4f53\u884c\u4e3a\u3002\u6ca1\u6709\u5355\u4e2a\u673a\u5668\u4eba\u5355\u72ec\u5177\u5907\u80fd\u529b\uff0c\u4f46\u6574\u4e2a\u7fa4\u4f53\u53ef\u4ee5\u6267\u884c\u5355\u4e2a\u673a\u5668\u4eba\u65e0\u6cd5\u5b8c\u6210\u7684\u4efb\u52a1\u3002</p> </li> <li> <p>\u7075\u611f\u6765\u81ea\u751f\u7269\u7fa4\u4f53\uff1a\u8682\u8681\u7528\u8eab\u4f53\u642d\u6865\u3001\u871c\u8702\u96c6\u4f53\u51b3\u5b9a\u5de2\u7a74\u4f4d\u7f6e\u3001\u9c7c\u7fa4\u901a\u8fc7\u534f\u8c03\u8fd0\u52a8\u8eb2\u907f\u6355\u98df\u8005\u3002\u5728\u6bcf\u79cd\u60c5\u51b5\u4e0b\uff0c\u7b80\u5355\u7684\u5c40\u90e8\u89c4\u5219\uff08\u8ddf\u968f\u90bb\u5c45\u3001\u907f\u514d\u78b0\u649e\u3001\u5411\u98df\u7269\u79fb\u52a8\uff09\u4ea7\u751f\u590d\u6742\u7684\u5168\u5c40\u884c\u4e3a\u3002</p> </li> <li> <p>\u53bb\u4e2d\u5fc3\u5316\u63a7\u5236\u610f\u5473\u7740\u6ca1\u6709\u4e2d\u592e\u6307\u6325\u5b98\u3002\u6bcf\u4e2a\u673a\u5668\u4eba\u9075\u5faa\u76f8\u540c\u7684\u5c40\u90e8\u89c4\u5219\uff0c\u4ec5\u5bf9\u5176\u90bb\u5c45\u548c\u5373\u65f6\u73af\u5883\u4f5c\u51fa\u53cd\u5e94\u3002\u5168\u5c40\u884c\u4e3a\u4ece\u8fd9\u4e9b\u5c40\u90e8\u4ea4\u4e92\u4e2d\u6d8c\u73b0\u3002\u8fd9\u4f7f\u5f97\u7fa4\u4f53\u5177\u6709\u56fa\u6709\u7684\u9c81\u68d2\u6027\uff1a\u5982\u679c\u4e00\u4e2a\u673a\u5668\u4eba\u5931\u6548\uff0c\u7fa4\u4f53\u7ee7\u7eed\u8fd0\u884c\u3002\u6ca1\u6709\u5355\u70b9\u6545\u969c\u3002</p> </li> <li> <p>\u5171\u8bc6\u7b97\u6cd5\u4f7f\u7fa4\u4f53\u80fd\u591f\u4ec5\u901a\u8fc7\u5c40\u90e8\u901a\u4fe1\u5c31\u96c6\u4f53\u51b3\u7b56\u8fbe\u6210\u4e00\u81f4\uff08\u4f8b\u5982\uff0c\u5411\u54ea\u4e2a\u65b9\u5411\u79fb\u52a8\u3001\u4f18\u5148\u5904\u7406\u54ea\u4e2a\u4efb\u52a1\uff09\u3002\u4e00\u4e2a\u7b80\u5355\u7684\u5171\u8bc6\u534f\u8bae\u8ba9\u6bcf\u4e2a\u673a\u5668\u4eba\u4e0e\u5176\u90bb\u5c45\u5e73\u5747\u5176\u503c\uff1a</p> </li> </ul> \\[x_i(t+1) = \\\\frac{1}{|N_i| + 1} \\\\left( x_i(t) + \\\\sum_{j \\\\in N_i} x_j(t) \\\\right)\\] <p></p> <ul> <li>\u5176\u4e2d\\(N_i\\)\u662f\u673a\u5668\u4eba\\(i\\)\u7684\u90bb\u5c45\u96c6\u5408\u3002\u8fd9\u4e00\u8fc7\u7a0b\u8fed\u4ee3\u76f4\u5230\u6240\u6709\u673a\u5668\u4eba\u6536\u655b\u5230\u76f8\u540c\u7684\u503c\uff08\u5168\u5c40\u5e73\u5747\u503c\uff09\u3002\u6536\u655b\u901f\u5ea6\u53d6\u51b3\u4e8e\u901a\u4fe1\u56fe\u7684\u62d3\u6251\u7ed3\u6784\uff0c\u7279\u522b\u662f\u5176\u4ee3\u6570\u8fde\u901a\u6027\uff08\u56fe\u62c9\u666e\u62c9\u65af\u77e9\u9635\u7684\u7b2c\u4e8c\u5c0f\u7279\u5f81\u503c\uff0c\u4e0e\u7b2c2\u7ae0\u7684\u7279\u5f81\u503c\u76f8\u5173\uff09\u3002</li> </ul> <p></p> <ul> <li> <p>\u7fa4\u96c6\u7b97\u6cd5\uff08Reynolds\u89c4\u5219\uff09\u901a\u8fc7\u6bcf\u4e2a\u673a\u5668\u4eba\u7684\u4e09\u4e2a\u7b80\u5355\u89c4\u5219\u4ea7\u751f\u534f\u8c03\u7684\u7fa4\u4f53\u8fd0\u52a8\uff1a</p> <ul> <li>\u5206\u79bb\uff1a\u8fdc\u79bb\u592a\u8fd1\u7684\u90bb\u5c45\uff08\u907f\u514d\u78b0\u649e\uff09\u3002</li> <li>\u5bf9\u9f50\uff1a\u671d\u5411\u90bb\u5c45\u7684\u5e73\u5747\u822a\u5411\uff08\u671d\u76f8\u540c\u65b9\u5411\u79fb\u52a8\uff09\u3002</li> <li>\u5185\u805a\uff1a\u671d\u5411\u90bb\u5c45\u7684\u5e73\u5747\u4f4d\u7f6e\uff08\u4e0e\u7fa4\u4f53\u5728\u4e00\u8d77\uff09\u3002</li> </ul> </li> <li> <p>\u6bcf\u4e2a\u89c4\u5219\u662f\u673a\u5668\u4eba\u901f\u5ea6\u7684\u4e00\u4e2a\u5411\u91cf\u8d21\u732e\u3002\u8fd9\u4e9b\u5411\u91cf\u7684\u52a0\u6743\u548c\u4ea7\u751f\u81ea\u7136\u4e3b\u4e49\u7684\u7fa4\u96c6\u884c\u4e3a\u3002\u8fd9\u662f\u4e00\u4e2a\u5411\u91cf\u7684\u7ebf\u6027\u7ec4\u5408\uff08\u7b2c1\u7ae0\uff09\uff0c\u5176\u4e2d\u6743\u91cd\u63a7\u5236\u6bcf\u4e2a\u884c\u4e3a\u7684\u76f8\u5bf9\u91cd\u8981\u6027\u3002</p> </li> <li> <p>\u7fa4\u4f53\u673a\u5668\u4eba\u7684\u5e94\u7528\u5305\u62ec\u73af\u5883\u76d1\u6d4b\uff08\u5728\u5927\u8303\u56f4\u5185\u5206\u5e03\u4f20\u611f\u5668\uff09\u3001\u7cbe\u51c6\u519c\u4e1a\uff08\u534f\u8c03\u65e0\u4eba\u673a\u8fdb\u884c\u4f5c\u7269\u55b7\u6d12\uff09\u3001\u5efa\u9020\uff08\u673a\u5668\u4eba\u96c6\u4f53\u7ec4\u88c5\u7ed3\u6784\uff09\u548c\u641c\u7d22\u64cd\u4f5c\uff08\u9ad8\u6548\u8986\u76d6\u5927\u9762\u79ef\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/05.%20space%20and%20extreme%20robotics/#_9","title":"\u4eba\u673a\u4ea4\u4e92","text":"<ul> <li>\u5927\u591a\u6570\u771f\u5b9e\u7684\u81ea\u4e3b\u7cfb\u7edf\u662f\u4e0e\u4eba\u7c7b\u5e76\u80a9\u8fd0\u884c\uff0c\u800c\u975e\u5b64\u7acb\u8fd0\u884c\u3002\u4eba\u4e0e\u673a\u5668\u4eba\u4e4b\u95f4\u7684\u4ea4\u4e92\u2014\u2014\u4ed6\u4eec\u5982\u4f55\u6c9f\u901a\u3001\u5171\u4eab\u63a7\u5236\u548c\u5efa\u7acb\u4fe1\u4efb\u2014\u2014\u4e0e\u673a\u5668\u4eba\u7684\u6280\u672f\u80fd\u529b\u540c\u6837\u91cd\u8981\u3002</li> </ul> <ul> <li> <p>\u5171\u4eab\u81ea\u4e3b\u6df7\u5408\u4e86\u4eba\u548c\u673a\u5668\u4eba\u7684\u63a7\u5236\u3002\u4e0d\u662f\u5b8c\u5168\u9065\u63a7\u64cd\u4f5c\uff08\u4eba\u7c7b\u63a7\u5236\u4e00\u5207\uff09\u6216\u5b8c\u5168\u81ea\u4e3b\uff08\u673a\u5668\u4eba\u63a7\u5236\u4e00\u5207\uff09\uff0c\u800c\u662f\u5171\u4eab\u81ea\u4e3b\u8ba9\u4eba\u7c7b\u63d0\u4f9b\u9ad8\u5c42\u610f\u56fe\uff0c\u540c\u65f6\u673a\u5668\u4eba\u5904\u7406\u5e95\u5c42\u6267\u884c\u3002\u4f8b\u5982\uff0c\u4eba\u7c7b\u53ef\u80fd\u6307\u5411\u4e00\u4e2a\u7269\u4f53\u8bf4\"\u6361\u8d77\u6765\"\uff0c\u7136\u540e\u673a\u5668\u4eba\u81ea\u4e3b\u89c4\u5212\u6293\u53d6\u548c\u624b\u81c2\u8fd0\u52a8\u3002</p> </li> <li> <p>\u6570\u5b66\u4e0a\uff0c\u5171\u4eab\u81ea\u4e3b\u53ef\u4ee5\u5efa\u6a21\u4e3a\u4eba\u7c7b\u8f93\u5165\\(\\\\mathbf{u}_h\\)\u548c\u673a\u5668\u4eba\u81ea\u4e3b\u52a8\u4f5c\\(\\\\mathbf{u}_r\\)\u7684\u6df7\u5408\uff1a</p> </li> </ul> \\[\\\\mathbf{u} = \\\\alpha \\\\mathbf{u}_h + (1 - \\\\alpha) \\\\mathbf{u}_r\\] <ul> <li> <p>\u5176\u4e2d\\(\\\\alpha \\\\in [0, 1]\\)\u662f\u6df7\u5408\u53c2\u6570\u3002\u5f53\\(\\\\alpha = 1\\)\u65f6\uff0c\u4eba\u7c7b\u5b8c\u5168\u63a7\u5236\uff08\u9065\u63a7\u64cd\u4f5c\uff09\u3002\u5f53\\(\\\\alpha = 0\\)\u65f6\uff0c\u673a\u5668\u4eba\u5b8c\u5168\u81ea\u4e3b\u3002\u81ea\u9002\u5e94\u5171\u4eab\u81ea\u4e3b\u6839\u636e\u60c5\u51b5\u8c03\u6574\\(\\\\alpha\\)\uff1a\u673a\u5668\u4eba\u5728\u81ea\u4fe1\u65f6\u63a5\u7ba1\u66f4\u591a\u63a7\u5236\uff0c\u5728\u4e0d\u786e\u5b9a\u6216\u60c5\u51b5\u65b0\u9896\u65f6\u8ba9\u51fa\u63a7\u5236\u3002</p> </li> <li> <p>\u9065\u63a7\u64cd\u4f5c\u5bf9\u4e8e\u8d85\u51fa\u5f53\u524d\u81ea\u4e3b\u80fd\u529b\u7684\u4efb\u52a1\u4ecd\u7136\u5f88\u91cd\u8981\u3002\u4eba\u7c7b\u64cd\u4f5c\u5458\u901a\u8fc7\u673a\u5668\u4eba\u7684\u76f8\u673a\u8fdc\u7a0b\u67e5\u770b\u573a\u666f\u5e76\u63a7\u5236\u673a\u5668\u4eba\u3002\u6311\u6218\u662f\u5ef6\u8fdf\uff1a\u5373\u4f7f100\u6beb\u79d2\u7684\u5ef6\u8fdf\u4e5f\u4f1a\u4f7f\u9065\u63a7\u64cd\u4f5c\u53d8\u5f97\u56f0\u96be\uff0c\u800c\u592a\u7a7a\u4e2d\u7684\u591a\u79d2\u5ef6\u8fdf\u4f7f\u5176\u5bf9\u7cbe\u7ec6\u64cd\u4f5c\u51e0\u4e4e\u4e0d\u53ef\u80fd\u3002\u9884\u6d4b\u663e\u793a\uff08\u663e\u793a\u673a\u5668\u4eba\u9884\u6d4b\u7684\u672a\u6765\u72b6\u6001\uff09\u548c\u865a\u62df\u5939\u5177\uff08\u9632\u6b62\u64cd\u4f5c\u5458\u547d\u4ee4\u5371\u9669\u8fd0\u52a8\u7684\u8f6f\u4ef6\u5f15\u5bfc\uff09\u6709\u52a9\u4e8e\u5f25\u8865\u3002</p> </li> <li> <p>\u4fe1\u4efb\u6821\u51c6\u662f\u786e\u4fdd\u4eba\u7c7b\u5bf9\u673a\u5668\u4eba\u6709\u9002\u5f53\u4fe1\u4efb\u7684\u95ee\u9898\uff1a\u4e0d\u8981\u592a\u591a\uff08\u8fc7\u5ea6\u4fe1\u4efb\u5bfc\u81f4\u81ea\u6ee1\uff0c\u5728\u9700\u8981\u65f6\u672a\u80fd\u5e72\u9884\uff09\uff0c\u4e5f\u4e0d\u8981\u592a\u5c11\uff08\u4fe1\u4efb\u4e0d\u8db3\u5bfc\u81f4\u4e0d\u5fc5\u8981\u5e72\u9884\u548c\u5229\u7528\u4e0d\u8db3\uff09\u3002\u4fe1\u4efb\u5e94\u8be5\u6821\u51c6\u5230\u673a\u5668\u4eba\u7684\u5b9e\u9645\u80fd\u529b\uff1a\u5728\u5b83\u5904\u7406\u5f97\u597d\u7684\u60c5\u51b5\u4e0b\u4fe1\u4efb\u5b83\uff0c\u5728\u63a5\u8fd1\u5176\u80fd\u529b\u8fb9\u7f18\u7684\u60c5\u51b5\u4e0b\u4fdd\u6301\u6000\u7591\u3002</p> </li> <li> <p>\u7814\u7a76\u8868\u660e\uff0c\u4fe1\u4efb\u53d7\u4ee5\u4e0b\u56e0\u7d20\u7684\u5f71\u54cd\uff1a\u673a\u5668\u4eba\u7684\u900f\u660e\u5ea6\uff08\u5b83\u662f\u5426\u89e3\u91ca\u5176\u51b3\u7b56\uff1f\uff09\u3001\u53ef\u9760\u6027\uff08\u5b83\u662f\u53ef\u9884\u6d4b\u5730\u5931\u8d25\u8fd8\u662f\u968f\u673a\u5730\u5931\u8d25\uff1f\uff09\u4ee5\u53ca\u6c9f\u901a\uff08\u5b83\u662f\u5426\u8868\u8fbe\u4e0d\u786e\u5b9a\u6027\uff1f\uff09\u3002\u4e00\u4e2a\u8bf4\"\u6211\u5bf9\u6b64\u8def\u5f84\u53ea\u670940%\u7684\u7f6e\u4fe1\u5ea6\uff0c\u662f\u5426\u7ee7\u7eed\uff1f\"\u7684\u673a\u5668\u4eba\u6bd4\u4e00\u4e2a\u9ed8\u9ed8\u5411\u524d\u9a7e\u9a76\u7684\u673a\u5668\u4eba\u80fd\u505a\u51fa\u66f4\u597d\u7684\u4eba\u7c7b\u51b3\u7b56\u3002</p> </li> <li> <p>\u673a\u5668\u4eba\u8fd0\u52a8\u4e2d\u7684\u53ef\u8bfb\u6027\u610f\u5473\u7740\u673a\u5668\u4eba\u4ee5\u4f20\u8fbe\u5176\u610f\u56fe\u7684\u65b9\u5f0f\u8fd0\u52a8\u7ed9\u9644\u8fd1\u7684\u4eba\u7c7b\u3002\u5982\u679c\u673a\u5668\u4eba\u4f38\u624b\u53bb\u62ff\u4e00\u4e2a\u7269\u4f53\uff0c\u5b83\u7684\u8def\u5f84\u5e94\u8be5\u4f7f\u5176\u76ee\u6807\u5bf9\u8c61\u663e\u800c\u6613\u89c1\uff0c\u5373\u4f7f\u5b83\u8fd8\u672a\u5230\u8fbe\u3002\u8fd9\u6d89\u53ca\u89c4\u5212\u6700\u5927\u5316\u89c2\u5bdf\u8005\u65e9\u671f\u63a8\u65ad\u76ee\u6807\u7684\u8f68\u8ff9\uff0c\u53ef\u4ee5\u5f62\u5f0f\u5316\u4e3a\u7ed9\u5b9a\u89c2\u5bdf\u5230\u7684\u90e8\u5206\u8f68\u8ff9\u65f6\u771f\u5b9e\u76ee\u6807\u7684\u540e\u9a8c\u6982\u7387\u6700\u5927\u5316\uff1a</p> </li> </ul> \\[\\\\pi^* = \\\\arg\\\\max_\\\\pi P(G \\\\mid \\\\xi_{0:t})\\] <ul> <li>\u5176\u4e2d\\(G\\)\u662f\u76ee\u6807\uff0c\\(\\\\xi_{0:t}\\)\u662f\u5230\u76ee\u524d\u4e3a\u6b62\u89c2\u5bdf\u5230\u7684\u8f68\u8ff9\u3002\u8fd9\u4f7f\u7528\u4e86\u8d1d\u53f6\u65af\u63a8\u7406\uff08\u7b2c5\u7ae0\uff09\uff1a\u89c2\u5bdf\u8005\u5bf9\u53ef\u80fd\u7684\u76ee\u6807\u6709\u5148\u9a8c\uff0c\u673a\u5668\u4eba\u7684\u8f68\u8ff9\u63d0\u4f9b\u4e86\u66f4\u65b0\u6b64\u4fe1\u5ff5\u7684\u8bc1\u636e\u3002</li> </ul>"},{"location":"chapter%2011%3A%20autonomous%20systems/05.%20space%20and%20extreme%20robotics/#colabnotebook","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216notebook\uff09","text":"<ol> <li> <p>\u6a21\u62df\u673a\u5668\u4eba\u7fa4\u4f53\u5c31\u76ee\u6807\u4f4d\u7f6e\u8fbe\u6210\u4e00\u81f4\u7684\u5171\u8bc6\u7b97\u6cd5\u3002\u4ece\u968f\u673a\u521d\u59cb\u4f4d\u7f6e\u5f00\u59cb\uff0c\u89c2\u5bdf\u6536\u655b\u8fc7\u7a0b\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\nn_robots = 10\nrng = jax.random.PRNGKey(0)\npositions = jax.random.uniform(rng, (n_robots, 2), minval=-5, maxval=5)\n\n# \u901a\u4fe1\u56fe\uff1a\u6bcf\u4e2a\u673a\u5668\u4eba\u4e0e\u6700\u8fd1\u76843\u4e2a\u90bb\u5c45\u901a\u4fe1\ndef get_neighbours(positions, k=3):\n    dists = jnp.linalg.norm(positions[:, None] - positions[None, :], axis=-1)\n    # \u5bf9\u6bcf\u4e2a\u673a\u5668\u4eba\uff0c\u627e\u6700\u8fd1\u7684k\u4e2a\uff08\u6392\u9664\u81ea\u8eab\uff09\n    neighbours = jnp.argsort(dists, axis=1)[:, 1:k+1]\n    return neighbours\n\nhistory = [positions.copy()]\n\nfor step in range(30):\n    neighbours = get_neighbours(positions)\n    new_positions = jnp.zeros_like(positions)\n    for i in range(n_robots):\n        nbr_pos = positions[neighbours[i]]\n        new_positions = new_positions.at[i].set(\n            (positions[i] + nbr_pos.sum(axis=0)) / (len(neighbours[i]) + 1)\n        )\n    positions = new_positions\n    history.append(positions.copy())\n\n# \u7ed8\u5236\u6536\u655b\u8fc7\u7a0b\nfig, axes = plt.subplots(1, 3, figsize=(15, 4))\nfor ax, step_idx, title in zip(axes, [0, 10, 29], [\"\u521d\u59cb\", \"\u7b2c10\u6b65\", \"\u6700\u7ec8\"]):\n    h = history[step_idx]\n    ax.scatter(h[:, 0], h[:, 1], s=50)\n    ax.set_xlim(-6, 6); ax.set_ylim(-6, 6)\n    ax.set_aspect(\"equal\"); ax.grid(True); ax.set_title(title)\nplt.suptitle(\"\u7fa4\u4f53\u5171\u8bc6\uff1a\u673a\u5668\u4eba\u6536\u655b\u5230\u4e00\u81f4\u6027\")\nplt.tight_layout()\nplt.show()\n</code></pre></p> </li> <li> <p>\u5b9e\u73b0Reynolds\u7fa4\u96c6\u89c4\u5219\uff08\u5206\u79bb\u3001\u5bf9\u9f50\u3001\u5185\u805a\uff09\u5e76\u6a21\u62df\u4e00\u4e2a\u7fa4\u4f53\u4e00\u8d77\u79fb\u52a8\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\nn = 30\nrng = jax.random.PRNGKey(1)\nk1, k2 = jax.random.split(rng)\npos = jax.random.uniform(k1, (n, 2), minval=-5, maxval=5)\nvel = jax.random.uniform(k2, (n, 2), minval=-0.5, maxval=0.5)\n\ndt = 0.1\nseparation_radius = 1.0\nneighbour_radius = 3.0\n\ntrajectories = [pos.copy()]\n\nfor _ in range(200):\n    new_vel = jnp.zeros_like(vel)\n    for i in range(n):\n        diffs = pos - pos[i]\n        dists = jnp.linalg.norm(diffs, axis=1)\n\n        # \u534a\u5f84\u5185\u7684\u90bb\u5c45\uff08\u6392\u9664\u81ea\u8eab\uff09\n        nbr_mask = (dists &lt; neighbour_radius) &amp; (dists &gt; 0)\n        sep_mask = (dists &lt; separation_radius) &amp; (dists &gt; 0)\n\n        # \u5206\u79bb\uff1a\u8fdc\u79bb\u975e\u5e38\u8fd1\u7684\u90bb\u5c45\n        if sep_mask.any():\n            sep = -diffs[sep_mask].sum(axis=0)\n        else:\n            sep = jnp.zeros(2)\n\n        # \u5bf9\u9f50\uff1a\u5339\u914d\u90bb\u5c45\u7684\u5e73\u5747\u901f\u5ea6\n        if nbr_mask.any():\n            align = vel[nbr_mask].mean(axis=0) - vel[i]\n        else:\n            align = jnp.zeros(2)\n\n        # \u5185\u805a\uff1a\u671d\u5411\u90bb\u5c45\u7684\u5e73\u5747\u4f4d\u7f6e\n        if nbr_mask.any():\n            cohesion = pos[nbr_mask].mean(axis=0) - pos[i]\n        else:\n            cohesion = jnp.zeros(2)\n\n        new_vel = new_vel.at[i].set(vel[i] + 1.5 * sep + 0.5 * align + 0.3 * cohesion)\n\n    # \u9650\u5236\u901f\u5ea6\n    speeds = jnp.linalg.norm(new_vel, axis=1, keepdims=True)\n    vel = jnp.where(speeds &gt; 2.0, new_vel / speeds * 2.0, new_vel)\n    pos = pos + vel * dt\n    trajectories.append(pos.copy())\n\n# \u7ed8\u5236\u5feb\u7167\nfig, axes = plt.subplots(1, 3, figsize=(15, 4))\nfor ax, idx, title in zip(axes, [0, 50, 199], [\"\u5f00\u59cb\", \"\u7b2c50\u6b65\", \"\u7b2c200\u6b65\"]):\n    p = trajectories[idx]\n    v = vel if idx == 199 else jnp.zeros_like(vel)\n    ax.scatter(p[:, 0], p[:, 1], s=20, c=\"blue\")\n    ax.set_aspect(\"equal\"); ax.grid(True); ax.set_title(title)\n    lim = max(abs(p).max() + 1, 6)\n    ax.set_xlim(-lim, lim); ax.set_ylim(-lim, lim)\nplt.suptitle(\"Reynolds\u7fa4\u96c6\uff1a\u5206\u79bb+\u5bf9\u9f50+\u5185\u805a\")\nplt.tight_layout()\nplt.show()\n</code></pre></p> </li> <li> <p>\u6a21\u62df\u5171\u4eab\u81ea\u4e3b\u6df7\u5408\uff1a\u4eba\u7c7b\u63d0\u4f9b\u5e26\u566a\u58f0\u7684\u65b9\u5411\u8f93\u5165\uff0c\u673a\u5668\u4eba\u7684\u81ea\u4e3b\u7cfb\u7edf\u63d0\u4f9b\u5230\u76ee\u6807\u7684\u5e73\u6ed1\u8def\u5f84\u3002\u7528\u4e0d\u540c\u7684alpha\u503c\u8fdb\u884c\u6df7\u5408\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\ngoal = jnp.array([10.0, 5.0])\npos = jnp.array([0.0, 0.0])\ndt = 0.1\n\nrng = jax.random.PRNGKey(3)\n\nfig, axes = plt.subplots(1, 3, figsize=(15, 4))\nfor ax, alpha in zip(axes, [1.0, 0.5, 0.0]):\n    pos = jnp.array([0.0, 0.0])\n    path = [pos.copy()]\n\n    for step in range(150):\n        # \u673a\u5668\u4eba\u81ea\u4e3b\uff1a\u5230\u76ee\u6807\u7684\u5e73\u6ed1\u8def\u5f84\n        direction = goal - pos\n        u_robot = direction / (jnp.linalg.norm(direction) + 1e-6) * 1.0\n\n        # \u4eba\u7c7b\u8f93\u5165\uff1a\u5927\u81f4\u6b63\u786e\u7684\u65b9\u5411\u4f46\u6709\u566a\u58f0\n        noise = jax.random.normal(jax.random.fold_in(rng, step), (2,)) * 0.5\n        u_human = u_robot + noise\n\n        # \u6df7\u5408\n        u = alpha * u_human + (1 - alpha) * u_robot\n        pos = pos + u * dt\n        path.append(pos.copy())\n\n        if jnp.linalg.norm(pos - goal) &lt; 0.3:\n            break\n\n    path = jnp.stack(path)\n    ax.plot(path[:, 0], path[:, 1], \"b-\", alpha=0.7)\n    ax.plot(*goal, \"r*\", markersize=15)\n    ax.plot(0, 0, \"go\", markersize=10)\n    ax.set_title(f\"\u03b1={alpha:.1f} ({'\u4eba\u7c7b' if alpha==1 else '\u673a\u5668\u4eba' if alpha==0 else '\u5171\u4eab'})\")\n    ax.set_xlim(-1, 12); ax.set_ylim(-3, 8)\n    ax.set_aspect(\"equal\"); ax.grid(True)\n\nplt.suptitle(\"\u5171\u4eab\u81ea\u4e3b\uff1a\u6df7\u5408\u4eba\u7c7b\u4e0e\u673a\u5668\u4eba\u63a7\u5236\")\nplt.tight_layout()\nplt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/01.%20geometric%20deep%20learning/","title":"\u51e0\u4f55\u6df1\u5ea6\u5b66\u4e60","text":"<p>\u51e0\u4f55\u6df1\u5ea6\u5b66\u4e60\u662f\u63ed\u793aCNN\u3001Transformer\u548cGNN\u7686\u9075\u5faa\u540c\u4e00\u539f\u7406\u2014\u2014\u5229\u7528\u5bf9\u79f0\u6027\u2014\u2014\u7684\u7edf\u4e00\u6846\u67b6\u3002\u672c\u7ae0\u6db5\u76d6\u5bf9\u79f0\u7fa4\u3001\u7fa4\u4f5c\u7528\u3001\u4e0d\u53d8\u6027\u3001\u7b49\u53d8\u6027\u3001\u4e94\u4e2a\u51e0\u4f55\u57df\u4ee5\u53ca\u5c3a\u5ea6\u5206\u79bb</p> <ul> <li> <p>\u5728\u672c\u4e66\u4e2d\uff0c\u6211\u4eec\u5df2\u7ecf\u5b66\u4e60\u4e86\u591a\u79cd\u67b6\u6784\uff1a\u56fe\u50cf\u7684CNN\uff08\u7b2c8\u7ae0\uff09\u3001\u8bed\u8a00\u7684Transformer\uff08\u7b2c7\u7ae0\uff09\u4ee5\u53ca\u5e8f\u5217\u51b3\u7b56\u7684RL\u7b56\u7565\uff08\u7b2c6\u7ae0\uff09\u3002\u5b83\u4eec\u770b\u4e0a\u53bb\u50cf\u662f\u4e3a\u5b8c\u5168\u4e0d\u540c\u7684\u95ee\u9898\u8bbe\u8ba1\u7684\u5b8c\u5168\u4e0d\u540c\u7684\u6a21\u578b\u3002\u4f46\u80cc\u540e\u5b58\u5728\u4e00\u4e2a\u66f4\u6df1\u5c42\u7684\u6a21\u5f0f\u3002</p> </li> <li> <p>\u51e0\u4f55\u6df1\u5ea6\u5b66\u4e60\u63ed\u793a\u51fa\u6240\u6709\u8fd9\u4e9b\u67b6\u6784\u90fd\u662f\u540c\u4e00\u4e2a\u601d\u60f3\u7684\u5b9e\u4f8b\uff1a\u6784\u5efa\u5c0a\u91cd\u6570\u636e\u5bf9\u79f0\u6027\u7684\u7f51\u7edc\u3002CNN\u5229\u7528\u56fe\u50cf\u4e2d\u7684\u5e73\u79fb\u5bf9\u79f0\u6027\u3002Transformer\u5229\u7528\u5e8f\u5217\u4e2d\u7684\u7f6e\u6362\u5bf9\u79f0\u6027\uff08\u6ce8\u610f\u529b\u4e0d\u4f9d\u8d56\u4e8e\u7edd\u5bf9\u4f4d\u7f6e\uff09\u3002GNN\u5229\u7528\u56fe\u4e2d\u7684\u7f6e\u6362\u5bf9\u79f0\u6027\u3002\u4e00\u65e6\u770b\u6e05\u8fd9\u4e00\u70b9\uff0c\u4f17\u591a\u67b6\u6784\u5c31\u53d8\u6210\u4e86\u4e00\u4e2a\u7edf\u4e00\u7684\u8fde\u8d2f\u6846\u67b6\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/01.%20geometric%20deep%20learning/#_2","title":"\u5bf9\u79f0\u6027\u4e0e\u7fa4","text":"<ul> <li> <p>\u4e00\u4e2a\u5bf9\u8c61\u7684\u5bf9\u79f0\u6027\u662f\u4f7f\u5176\u4fdd\u6301\u4e0d\u53d8\u7684\u53d8\u6362\u3002\u6b63\u65b9\u5f62\u67098\u79cd\u5bf9\u79f0\u6027\uff1a4\u79cd\u65cb\u8f6c\uff080\u00b0\u300190\u00b0\u3001180\u00b0\u3001270\u00b0\uff09\u548c4\u79cd\u53cd\u5c04\u3002\u5706\u6709\u65e0\u9650\u591a\u79cd\uff1a\u4efb\u4f55\u7ed5\u5176\u4e2d\u5fc3\u7684\u65cb\u8f6c\u3002\u5173\u952e\u6d1e\u5bdf\u5728\u4e8e\uff0c\u5bf9\u79f0\u6027\u544a\u8bc9\u4f60\u4ec0\u4e48\u662f\u4e0d\u91cd\u8981\u7684\uff0c\u800c\u77e5\u9053\u4ec0\u4e48\u4e0d\u91cd\u8981\u7684\u5bf9\u4e8e\u5b66\u4e60\u6765\u8bf4\u6781\u4e3a\u5f3a\u5927\u3002</p> </li> <li> <p>\u7528\u673a\u5668\u5b66\u4e60\u7684\u672f\u8bed\u6765\u8bf4\uff1a\u5982\u679c\u4e00\u4e2a\u4efb\u52a1\u5177\u6709\u5bf9\u79f0\u6027\uff0c\u90a3\u4e48\u65e0\u8bba\u770b\u5230\u8f93\u5165\u7684\u54ea\u79cd\"\u7248\u672c\"\uff0c\u6a21\u578b\u90fd\u5e94\u7ed9\u51fa\u76f8\u540c\u7684\u7b54\u6848\u3002\u732b\u68c0\u6d4b\u5668\u65e0\u8bba\u732b\u5728\u56fe\u50cf\u7684\u5de6\u4e0a\u89d2\u8fd8\u662f\u53f3\u4e0b\u89d2\u90fd\u5e94\u80fd\u5de5\u4f5c\u3002\u8fd9\u5c31\u662f\u5e73\u79fb\u5bf9\u79f0\u6027\u3002</p> </li> <li> <p>\u5bf9\u79f0\u6027\u901a\u8fc7\u7fa4\u6765\u5f62\u5f0f\u5316\u3002\u4e00\u4e2a\u7fa4 \\(G\\) \u662f\u4e00\u4e2a\u5177\u6709\u56db\u4e2a\u6027\u8d28\u7684\u53d8\u6362\u96c6\u5408\uff1a</p> <ul> <li>\u5c01\u95ed\u6027\uff1a\u4e24\u4e2a\u53d8\u6362\u7684\u7ec4\u5408\u4ea7\u751f\u96c6\u5408\u4e2d\u7684\u53e6\u4e00\u4e2a\u53d8\u6362\u3002\u5148\u65cb\u8f6c90\u00b0\u518d\u65cb\u8f6c90\u00b0\u5f97\u5230180\u00b0\uff0c\u4e5f\u5c5e\u4e8e\u8be5\u96c6\u5408\u3002</li> <li>\u7ed3\u5408\u5f8b\uff1a\\((g_1 \\circ g_2) \\circ g_3 = g_1 \\circ (g_2 \\circ g_3)\\)\u3002\u5206\u7ec4\u7684\u987a\u5e8f\u65e0\u5173\u7d27\u8981\uff08\u56de\u987e\u7b2c2\u7ae0\u4e2d\u77e9\u9635\u4e58\u6cd5\u7684\u7ed3\u5408\u5f8b\uff09\u3002</li> <li>\u5355\u4f4d\u5143\uff1a\u5b58\u5728\u4e00\u4e2a\"\u4ec0\u4e48\u4e5f\u4e0d\u505a\"\u7684\u53d8\u6362 \\(e\\)\uff0c\u4f7f\u5f97 \\(e \\circ g = g \\circ e = g\\)\u3002</li> <li>\u9006\u5143\uff1a\u6bcf\u4e2a\u53d8\u6362\u90fd\u6709\u64a4\u9500\u64cd\u4f5c\uff1a\\(g \\circ g^{-1} = e\\)\u3002</li> </ul> </li> <li> <p>\u8fd9\u4e9b\u516c\u7406\u4e0e\u5411\u91cf\u7a7a\u95f4\uff08\u7b2c1\u7ae0\uff09\u7684\u516c\u7406\u76f8\u540c\uff0c\u4f46\u5e94\u7528\u4e8e\u53d8\u6362\u800c\u975e\u5411\u91cf\u3002\u5176\u8054\u7cfb\u5341\u5206\u6df1\u523b\uff1a\u7fa4\u4f5c\u7528\u4e8e\u5411\u91cf\u7a7a\u95f4\uff0c\u800c\u795e\u7ecf\u7f51\u7edc\u5fc5\u987b\u5c0a\u91cd\u8fd9\u79cd\u4f5c\u7528\u3002</p> </li> <li> <p>\u6df1\u5ea6\u5b66\u4e60\u4e2d\u51fa\u73b0\u7684\u5173\u952e\u7fa4\uff1a</p> <ul> <li>\u5e73\u79fb\u7fa4 \\((\\mathbb{R}^n, +)\\)\uff1a\u5e73\u79fb\u56fe\u50cf\u6216\u4fe1\u53f7\u3002\u8fd9\u662fCNN\u5229\u7528\u7684\u5bf9\u79f0\u6027\u3002</li> <li>\u5bf9\u79f0\u7fa4 \\(S_n\\)\uff1a\\(n\\) \u4e2a\u5143\u7d20\u7684\u6240\u6709\u7f6e\u6362\u3002\u8fd9\u662fGNN\u548cTransformer\u5229\u7528\u7684\u5bf9\u79f0\u6027\uff08\u91cd\u65b0\u6392\u5e8f\u8282\u70b9\u6216\u6807\u8bb0\u4e0d\u5e94\u6539\u53d8\u7ed3\u679c\uff09\u3002</li> <li>\u65cb\u8f6c\u7fa4 \\(SO(n)\\)\uff1a\\(n\\) \u7ef4\u7a7a\u95f4\u4e2d\u7684\u6240\u6709\u65cb\u8f6c\u3002\\(SO(2)\\) \u662f\u5e73\u9762\u65cb\u8f6c\uff0c\\(SO(3)\\) \u662f\u4e09\u7ef4\u65cb\u8f6c\uff08\u5bf9\u5206\u5b50\u548c3D\u89c6\u89c9\u4efb\u52a1\u81f3\u5173\u91cd\u8981\uff09\u3002</li> <li>\u6b27\u51e0\u91cc\u5f97\u7fa4 \\(E(n)\\)\uff1a\u6240\u6709\u65cb\u8f6c\u3001\u53cd\u5c04\u548c\u5e73\u79fb\u3002\u7269\u7406\u7a7a\u95f4\u7684\u5bf9\u79f0\u6027\u3002</li> <li>\u7279\u6b8a\u6b27\u51e0\u91cc\u5f97\u7fa4 \\(SE(n)\\)\uff1a\u65cb\u8f6c\u548c\u5e73\u79fb\uff08\u4e0d\u542b\u53cd\u5c04\uff09\u3002\u521a\u4f53\u8fd0\u52a8\u7684\u5bf9\u79f0\u6027\u3002</li> </ul> </li> <li> <p>\u7fa4\u4f5c\u7528\u63cf\u8ff0\u4e86\u7fa4\u5982\u4f55\u53d8\u6362\u6570\u636e\u3002\u5982\u679c \\(G\\) \u662f\u4e00\u4e2a\u7fa4\uff0c\\(X\\) \u662f\u6570\u636e\u7a7a\u95f4\uff0c\u5219\u4f5c\u7528 \\(\\rho: G \\times X \\to X\\) \u5c06\u6bcf\u4e2a\u7fa4\u5143\u7d20 \\(g\\) \u548c\u6570\u636e\u70b9 \\(x\\) \u6620\u5c04\u5230\u4e00\u4e2a\u53d8\u6362\u540e\u7684\u70b9 \\(\\rho(g, x)\\)\u3002\u5bf9\u4e8e\u56fe\u50cf\uff0c\u5e73\u79fb\u7fa4\u901a\u8fc7\u5e73\u79fb\u50cf\u7d20\u5750\u6807\u6765\u4f5c\u7528\u3002\u5bf9\u4e8e\u56fe\uff0c\u5bf9\u79f0\u7fa4\u901a\u8fc7\u91cd\u65b0\u6807\u8bb0\u8282\u70b9\u6765\u4f5c\u7528\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/01.%20geometric%20deep%20learning/#_3","title":"\u4e0d\u53d8\u6027\u4e0e\u7b49\u53d8\u6027","text":"<ul> <li> <p>\u7ed9\u5b9a\u4e00\u4e2a\u5bf9\u79f0\u7fa4\uff0c\u51fd\u6570\u53ef\u4ee5\u901a\u8fc7\u4e24\u79cd\u91cd\u8981\u65b9\u5f0f\u4e0e\u4e4b\u5173\u8054\uff1a</p> </li> <li> <p>\u51fd\u6570 \\(f\\) \u5bf9\u7fa4 \\(G\\) \u662f\u4e0d\u53d8\u7684\uff0c\u5982\u679c\u8f93\u5165\u53d8\u6362\u540e\u8f93\u51fa\u4e0d\u53d8\uff1a</p> </li> </ul> \\[f(\\rho(g, x)) = f(x) \\quad \\text{\u5bf9\u4e8e\u6240\u6709 } g \\in G\\] <ul> <li> <p>\u793a\u4f8b\uff1a\u56fe\u50cf\u7684\u603b\u4f53\u4eae\u5ea6\u4e0d\u56e0\u5e73\u79fb\u800c\u6539\u53d8\u3002\u56fe\u50cf\u5206\u7c7b\u5e94\u662f\u5e73\u79fb\u4e0d\u53d8\u7684\uff1a\"\u732b\"\u7684\u7c7b\u522b\u65e0\u8bba\u732b\u5728\u4f55\u5904\u90fd\u662f\u4e00\u6837\u7684\u3002</p> </li> <li> <p>\u51fd\u6570 \\(f\\) \u5bf9\u7fa4 \\(G\\) \u662f\u7b49\u53d8\u7684\uff0c\u5982\u679c\u53d8\u6362\u8f93\u5165\u4f1a\u5bf9\u7b49\u5730\u53d8\u6362\u8f93\u51fa\uff1a</p> </li> </ul> \\[f(\\rho_{\\text{in}}(g, x)) = \\rho_{\\text{out}}(g, f(x)) \\quad \\text{\u5bf9\u4e8e\u6240\u6709 } g \\in G\\] <ul> <li>\u793a\u4f8b\uff1a\u5982\u679c\u5c06\u56fe\u50cf\u5411\u53f3\u5e73\u79fb5\u4e2a\u50cf\u7d20\uff0cCNN\u4e2d\u7684\u7279\u5f81\u56fe\u4e5f\u4f1a\u5411\u53f3\u5e73\u79fb5\u4e2a\u50cf\u7d20\u3002\u5377\u79ef\u64cd\u4f5c\u662f\u5e73\u79fb\u7b49\u53d8\u7684\uff1a\u5b83\u4fdd\u7559\u4e86\u7a7a\u95f4\u5173\u7cfb\u3002\u76ee\u6807\u68c0\u6d4b\u5e94\u8be5\u662f\u7b49\u53d8\u7684\uff1a\u5982\u679c\u732b\u79fb\u52a8\u4e86\uff0c\u8fb9\u754c\u6846\u4e5f\u5e94\u968f\u4e4b\u79fb\u52a8\u3002</li> </ul> <p></p> <ul> <li> <p>\u533a\u5206\u4e24\u8005\u7684\u91cd\u8981\u6027\u5728\u4e8e\uff1a\u4e2d\u95f4\u5c42\u901a\u5e38\u5e94\u662f\u7b49\u53d8\u7684\uff08\u4e3a\u4e0b\u6e38\u5c42\u4fdd\u7559\u7ed3\u6784\uff09\uff0c\u800c\u6700\u7ec8\u8f93\u51fa\u5e94\u662f\u4e0d\u53d8\u7684\uff08\u7b54\u6848\u4e0d\u5e94\u4f9d\u8d56\u4e8e\u53d8\u6362\uff09\u3002CNN\u901a\u8fc7\u5806\u53e0\u7b49\u53d8\u5377\u79ef\u5c42\uff0c\u7136\u540e\u5728\u672b\u5c3e\u5e94\u7528\u5168\u5c40\u6c60\u5316\uff08\u5b83\u662f\u4e0d\u53d8\u7684\uff09\u6765\u5b9e\u73b0\u8fd9\u4e00\u70b9\u3002</p> </li> <li> <p>\u5c06\u7b49\u53d8\u6027\u6784\u5efa\u5230\u67b6\u6784\u4e2d\u6bd4\u4ece\u6570\u636e\u4e2d\u5b66\u4e60\u5b83\u8981\u9ad8\u6548\u5f97\u591a\u3002\u4e00\u4e2a\u5177\u6709\u6743\u91cd\u5171\u4eab\u7684\u5e73\u79fb\u7b49\u53d8CNN\u6240\u9700\u7684\u53c2\u6570\u8fdc\u5c11\u4e8e\u4e00\u4e2a\u5fc5\u987b\u72ec\u7acb\u5b66\u4e60\"\u4f4d\u7f6e(10,10)\u5904\u7684\u732b\"\u548c\"\u4f4d\u7f6e(200,150)\u5904\u7684\u732b\"\u7684\u5168\u8fde\u63a5\u7f51\u7edc\u3002\u5bf9\u79f0\u6027\u7ea6\u675f\u6307\u6570\u7ea7\u5730\u7f29\u5c0f\u4e86\u5047\u8bbe\u7a7a\u95f4\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/01.%20geometric%20deep%20learning/#_4","title":"\u4e94\u4e2a\u51e0\u4f55\u57df","text":"<ul> <li>\u51e0\u4f55\u6df1\u5ea6\u5b66\u4e60\u8bc6\u522b\u51fa\u6570\u636e\u7684\u4e94\u4e2a\u57fa\u672c\u57df\uff0c\u6bcf\u4e2a\u57df\u90fd\u6709\u5176\u81ea\u5df1\u7684\u5bf9\u79f0\u7fa4\u3002\u6bcf\u4e00\u4e2a\u795e\u7ecf\u7f51\u7edc\u67b6\u6784\u90fd\u53ef\u4ee5\u88ab\u7406\u89e3\u4e3a\u5229\u7528\u5176\u4e2d\u67d0\u4e2a\u57df\u7684\u5bf9\u79f0\u6027\u3002</li> </ul> <ul> <li> <p>1. \u7f51\u683c\uff08\u6b27\u51e0\u91cc\u5f97\u6570\u636e\uff09\uff1a\u56fe\u50cf\u3001\u97f3\u9891\u9891\u8c31\u56fe\u3001\u4f53\u6570\u636e\u3002\u5e95\u5c42\u7ed3\u6784\u662f\u5177\u6709\u5e73\u79fb\u5bf9\u79f0\u6027\u7684\u89c4\u5219\u7f51\u683c\u3002\u7fa4\u662f\u5e73\u79fb\u7fa4\uff08\u53ef\u80fd\u518d\u52a0\u4e0a\u65cb\u8f6c\u548c\u53cd\u5c04\uff09\u3002\u5229\u7528\u8fd9\u79cd\u5bf9\u79f0\u6027\u7684\u67b6\u6784\u662fCNN\uff1a\u5377\u79ef\u6b63\u662f\u5e73\u79fb\u7b49\u53d8\u7684\u64cd\u4f5c\u3002\u7a7a\u95f4\u4f4d\u7f6e\u4e0a\u7684\u6743\u91cd\u5171\u4eab\u5c31\u662f\u5e73\u79fb\u7b49\u53d8\u6027\u7684\u5177\u4f53\u5b9e\u73b0\u3002</p> </li> <li> <p>2. \u96c6\u5408\uff08\u65e0\u5e8f\u96c6\u5408\uff09\uff1a\u70b9\u4e91\u3001\u7c92\u5b50\u7cfb\u7edf\u3002\u5bf9\u79f0\u6027\u662f\u7f6e\u6362\u4e0d\u53d8\u6027\uff1a\u5143\u7d20\u7684\u987a\u5e8f\u65e0\u5173\u7d27\u8981\u3002\u67b6\u6784\u662fDeepSets\uff08\u4ee5\u53ca\u7b2c8\u7ae0\u7684PointNet\uff09\uff1a\u5bf9\u6bcf\u4e2a\u5143\u7d20\u5e94\u7528\u5171\u4eab\u51fd\u6570\uff0c\u7136\u540e\u7528\u7f6e\u6362\u4e0d\u53d8\u64cd\u4f5c\uff08\u6c42\u548c\u3001\u5747\u503c\u6216\u53d6\u6700\u5927\u503c\uff09\u8fdb\u884c\u805a\u5408\u3002\u5f62\u5f0f\u4e0a\uff0c\\(f(\\{x_1, \\ldots, x_n\\}) = \\phi\\left(\\sum_i \\psi(x_i)\\right)\\)\u3002</p> </li> <li> <p>3. \u5e8f\u5217\uff08\u6709\u5e8f\u6570\u636e\uff09\uff1a\u6587\u672c\u3001\u65f6\u95f4\u5e8f\u5217\u3002\u5e8f\u5217\u662f\u4e00\u7ef4\u7f51\u683c\uff0c\u4f46\u6709\u4e00\u4e2a\u5fae\u5999\u4e4b\u5904\uff1a\u5bf9\u79f0\u6027\u66f4\u52a0\u7ec6\u81f4\u3002\u7edd\u5bf9\u4f4d\u7f6e\u53ef\u80fd\u91cd\u8981\u4e5f\u53ef\u80fd\u4e0d\u91cd\u8981\u3002RNN\u4ee5\u81ea\u56de\u5f52\u65b9\u5f0f\u5904\u7406\u5e8f\u5217\u3002\u5e26\u4f4d\u7f6e\u7f16\u7801\u7684Transformer\u53ef\u4ee5\u5173\u6ce8\u4efb\u4f55\u4f4d\u7f6e\uff0c\u5176\u81ea\u6ce8\u610f\u529b\u5728\u52a0\u5165\u4f4d\u7f6e\u7f16\u7801\u4e4b\u524d\u662f\u7f6e\u6362\u7b49\u53d8\u7684\u3002\u8fd9\u5c31\u662fTransformer\u6cdb\u5316\u80fd\u529b\u5982\u6b64\u4e4b\u5f3a\u7684\u539f\u56e0\uff1a\u5b83\u4eec\u4ece\u7f6e\u6362\u7b49\u53d8\u5f00\u59cb\uff0c\u7136\u540e\u4ec5\u6dfb\u52a0\u5fc5\u8981\u7684\u4f4d\u7f6e\u7ed3\u6784\u3002</p> </li> <li> <p>4. \u56fe\uff08\u5173\u7cfb\u6570\u636e\uff09\uff1a\u793e\u4ea4\u7f51\u7edc\u3001\u5206\u5b50\u3001\u77e5\u8bc6\u56fe\u8c31\u3002\u5bf9\u79f0\u6027\u662f\u8282\u70b9\u7684\u7f6e\u6362\uff1a\u91cd\u65b0\u6807\u8bb0\u8282\u70b9\u4e0d\u5e94\u6539\u53d8\u56fe\u7684\u6027\u8d28\u3002\u67b6\u6784\u662fGNN\uff1a\u8fde\u63a5\u8282\u70b9\u4e4b\u95f4\u4f20\u9012\u6d88\u606f\uff0c\u4f7f\u7528\u4e0d\u4f9d\u8d56\u4e8e\u8282\u70b9\u987a\u5e8f\u7684\u5171\u4eab\u51fd\u6570\u3002\u8fd9\u662f\u672c\u7ae0\u5269\u4f59\u90e8\u5206\u7684\u91cd\u70b9\u3002</p> </li> <li> <p>5. \u6d41\u5f62\u548c\u7f51\u683c\uff1a\u66f2\u9762\u30013D\u5f62\u72b6\u3002\u5bf9\u79f0\u6027\u5305\u62ec\u5fae\u5206\u540c\u80da\uff08\u5149\u6ed1\u53d8\u5f62\uff09\u3002\u67b6\u6784\u4f7f\u7528\u5185\u5728\u7b97\u5b50\uff08\u4f8b\u5982\u62c9\u666e\u62c9\u65af-\u8d1d\u5c14\u7279\u62c9\u7c73\u7b97\u5b50\uff09\uff0c\u8fd9\u4e9b\u7b97\u5b50\u7531\u66f2\u9762\u51e0\u4f55\u672c\u8eab\u5b9a\u4e49\uff0c\u4e0e\u66f2\u9762\u5728\u7a7a\u95f4\u4e2d\u7684\u5d4c\u5165\u65b9\u5f0f\u65e0\u5173\u3002\u8fd9\u8054\u7cfb\u5230\u5fae\u5206\u51e0\u4f55\uff0c\u5e76\u9002\u7528\u4e8e\u5f62\u72b6\u5206\u6790\u3001\u7403\u9762\u4e0a\u7684\u6c14\u5019\u5efa\u6a21\u548c\u86cb\u767d\u8d28\u8868\u9762\u5206\u6790\u3002</p> </li> <li> <p>\u8fd9\u4e2a\u6846\u67b6\u7684\u5f3a\u5927\u4e4b\u5904\u5728\u4e8e\u5176\u7edf\u4e00\u6027\u3002CNN\u662f\u7f51\u683c\u56fe\u4e0a\u7684GNN\u3002Transformer\u662f\u5b8c\u5168\u8fde\u63a5\u56fe\u4e0a\u7684GNN\u3002DeepSets\u662f\u6ca1\u6709\u8fb9\u7684GNN\u3002\u5c06\u8fd9\u4e9b\u89c6\u4e3a\u540c\u4e00\u539f\u7406\u7684\u5b9e\u4f8b\uff0c\u6307\u5bfc\u7740\u65b0\u67b6\u6784\u7684\u8bbe\u8ba1\uff1a\u8bc6\u522b\u6570\u636e\u7684\u5bf9\u79f0\u6027\uff0c\u7136\u540e\u6784\u5efa\u4e00\u4e2a\u5c0a\u91cd\u5b83\u7684\u7f51\u7edc\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/01.%20geometric%20deep%20learning/#_5","title":"\u5c3a\u5ea6\u5206\u79bb\u4e0e\u7c97\u5316","text":"<ul> <li> <p>\u771f\u5b9e\u4e16\u754c\u7684\u6570\u636e\u5177\u6709\u591a\u5c3a\u5ea6\u7ed3\u6784\u3002\u4e00\u5e45\u56fe\u50cf\u6709\u7ec6\u7c92\u5ea6\u7eb9\u7406\uff08\u50cf\u7d20\u7ea7\uff09\u3001\u5c40\u90e8\u6a21\u5f0f\uff08\u8fb9\u7f18\u3001\u89d2\u70b9\uff09\u3001\u7269\u4f53\u90e8\u4ef6\uff08\u8f66\u8f6e\u3001\u7a97\u6237\uff09\u548c\u5168\u5c40\u7ed3\u6784\uff08\u6574\u4e2a\u573a\u666f\uff09\u3002\u4e00\u4e2a\u5206\u5b50\u6709\u539f\u5b50\u7ea7\u7279\u5f81\u3001\u5b98\u80fd\u56e2\u548c\u6574\u4f53\u5206\u5b50\u5f62\u72b6\u3002</p> </li> <li> <p>\u5c3a\u5ea6\u5206\u79bb\u662f\u8fd9\u6837\u4e00\u4e2a\u539f\u7406\uff1a\u8fd9\u4e9b\u7ec6\u8282\u5c42\u6b21\u53ef\u4ee5\u5206\u5c42\u5904\u7406\u2014\u2014\u5148\u6355\u83b7\u5c40\u90e8\u7ed3\u6784\uff0c\u7136\u540e\u9010\u6b65\u805a\u5408\u6210\u66f4\u7c97\u7c92\u5ea6\u7684\u8868\u793a\u3002\u8fd9\u5c31\u662f\u7c97\u5316\u6216\u6c60\u5316\u3002</p> </li> <li> <p>\u5728CNN\u4e2d\uff0c\u6c60\u5316\u5c42\uff08\u6700\u5927\u6c60\u5316\u3001\u5e73\u5747\u6c60\u5316\uff09\u5bf9\u7a7a\u95f4\u5206\u8fa8\u7387\u8fdb\u884c\u4e0b\u91c7\u6837\uff0c\u8feb\u4f7f\u9ad8\u5c42\u6355\u83b7\u66f4\u5927\u5c3a\u5ea6\u7684\u6a21\u5f0f\u3002\u5728\u611f\u53d7\u91ce\u89c6\u89d2\uff08\u7b2c8\u7ae0\uff09\u4e2d\uff0c\u66f4\u6df1\u5c42\u80fd\"\u770b\u5230\"\u66f4\u591a\u7684\u56fe\u50cf\u3002\u8fd9\u5c31\u662f\u5c3a\u5ea6\u5206\u79bb\u7684\u5b9e\u9645\u5e94\u7528\u3002</p> </li> <li> <p>\u5728\u56fe\uff08graph\uff09\u4e2d\uff0c\u7c97\u5316\u610f\u5473\u7740\u5c06\u8282\u70b9\u7fa4\u805a\u4e3a\"\u8d85\u8282\u70b9\"\uff0c\u751f\u6210\u4e00\u4e2a\u4fdd\u7559\u57fa\u672c\u7ed3\u6784\u7684\u66f4\u5c0f\u56fe\u3002\u8fd9\u5c31\u662f\u56fe\u6c60\u5316\uff0c\u6211\u4eec\u5c06\u5728\u6587\u4ef63\u4e2d\u8be6\u7ec6\u8ba8\u8bba\u3002\u5b83\u4e0e\u56fe\u50cf\u6c60\u5316\u76f4\u63a5\u7c7b\u4f3c\uff1a\u964d\u4f4e\u5206\u8fa8\u7387\u7684\u540c\u65f6\u4fdd\u7559\u91cd\u8981\u7279\u5f81\u3002</p> </li> <li> <p>\u5728\u5e8f\u5217\u4e2d\uff0c\u5206\u5c42\u5904\u7406\uff08\u4f8b\u5982\u53e5\u5b50\u2192\u6bb5\u843d\u2192\u6587\u6863\uff09\u5728\u4e0d\u540c\u65f6\u95f4\u6216\u8bed\u4e49\u5c3a\u5ea6\u6355\u83b7\u7ed3\u6784\u3002Swin Transformer\uff08\u7b2c8\u7ae0\uff09\u901a\u8fc7\u5176\u79fb\u4f4d\u7a97\u53e3\u5c42\u6b21\u7ed3\u6784\u5c06\u8fd9\u4e00\u601d\u60f3\u5e94\u7528\u4e8e\u56fe\u50cf\u3002</p> </li> <li> <p>\u6570\u5b66\u4e0a\uff0c\u7c97\u5316\u5b9a\u4e49\u4e86\u4e00\u4e2a\u9010\u6e10\u62bd\u8c61\u7684\u8868\u793a\u5c42\u6b21\uff1a</p> </li> </ul> \\[x \\xrightarrow{\\text{\u5c40\u90e8\u7279\u5f81}} h^{(1)} \\xrightarrow{\\text{\u7c97\u5316}} h^{(2)} \\xrightarrow{\\text{\u7c97\u5316}} \\cdots \\xrightarrow{\\text{\u5168\u5c40}} y\\] <ul> <li> <p>\u5728\u6bcf\u4e2a\u5c42\u6b21\uff0c\u8868\u793a\u76f8\u5bf9\u4e8e\u8be5\u5c42\u6b21\u7684\u5bf9\u79f0\u7fa4\u662f\u7b49\u53d8\u7684\u3002\u6700\u540e\u7684\u5168\u5c40\u8868\u793a\u662f\u4e0d\u53d8\u7684\uff0c\u6355\u83b7\u4e86\u8f93\u5165\u7684\u672c\u8d28\u800c\u4e0d\u53d7\u65e0\u5173\u53d8\u6362\u7684\u5f71\u54cd\u3002</p> </li> <li> <p>\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48\u5bf9\u4e8e\u7ed3\u6784\u5316\u6570\u636e\uff0c\u6df1\u5c42\u7f51\u7edc\u6bd4\u6d45\u5c42\u7f51\u7edc\u6548\u679c\u66f4\u597d\uff1a\u6bcf\u4e00\u5c42\u589e\u52a0\u4e00\u4e2a\u62bd\u8c61\u5c42\u6b21\uff0c\u591a\u4e2a\u7b49\u53d8\u5c42\u7684\u7ec4\u5408\u4ece\u7b80\u5355\u7684\u5c40\u90e8\u7279\u5f81\u6784\u5efa\u51fa\u590d\u6742\u7684\u4e0d\u53d8\u7279\u5f81\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/01.%20geometric%20deep%20learning/#colabnotebook","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216notebook\uff09","text":"<ol> <li> <p>\u9a8c\u8bc1\u5377\u79ef\u7684\u5e73\u79fb\u7b49\u53d8\u6027\u3002\u5bf9\u56fe\u50cf\u5e94\u7528\u5377\u79ef\uff0c\u7136\u540e\u5e73\u79fb\u56fe\u50cf\u518d\u6b21\u5377\u79ef\u3002\u68c0\u67e5\u8f93\u51fa\u662f\u5426\u4e92\u4e3a\u5e73\u79fb\u7248\u672c\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\n# \u4e00\u7ef4\u4fe1\u53f7\u548c\u4e00\u4e2a\u7b80\u5355\u6ee4\u6ce2\u5668\nsignal = jnp.array([0, 0, 0, 1, 2, 3, 2, 1, 0, 0, 0], dtype=float)\nkernel = jnp.array([1, 0, -1], dtype=float)\n\n# \u5148\u5377\u79ef\u518d\u5e73\u79fb\nconv_result = jnp.convolve(signal, kernel, mode=\"same\")\nshifted_signal = jnp.roll(signal, 3)\nconv_shifted = jnp.convolve(shifted_signal, kernel, mode=\"same\")\nshifted_conv = jnp.roll(conv_result, 3)\n\nprint(f\"\u5148\u5377\u79ef\u518d\u5e73\u79fb:  {shifted_conv}\")\nprint(f\"\u5148\u5e73\u79fb\u518d\u5377\u79ef:  {conv_shifted}\")\nprint(f\"\u7b49\u53d8\u6027: {jnp.allclose(shifted_conv, conv_shifted, atol=1e-5)}\")\n</code></pre></p> </li> <li> <p>\u9a8c\u8bc1DeepSets\u98ce\u683c\u805a\u5408\u7684\u7f6e\u6362\u4e0d\u53d8\u6027\u3002\u5bf9\u96c6\u5408\u4e2d\u7684\u6bcf\u4e2a\u5143\u7d20\u5e94\u7528\u5171\u4eab\u51fd\u6570\uff0c\u6c42\u548c\u7ed3\u679c\uff0c\u5e76\u68c0\u67e5\u8f93\u51fa\u662f\u5426\u4e0d\u4f9d\u8d56\u4e8e\u5143\u7d20\u987a\u5e8f\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\n# 4\u4e2a\u5411\u91cf\u7684\"\u96c6\u5408\"\uff08\u987a\u5e8f\u5e94\u65e0\u5173\u7d27\u8981\uff09\nx = jnp.array([[1.0, 2.0], [3.0, 4.0], [5.0, 6.0], [7.0, 8.0]])\n\n# \u7b80\u5355\u7684\u5171\u4eab\u51fd\u6570\uff1a\u9010\u5143\u7d20\u5e73\u65b9\npsi = lambda v: v ** 2\n\n# \u901a\u8fc7\u6c42\u548c\u805a\u5408\ndef deepsets(points):\n    return jnp.sum(jax.vmap(psi)(points), axis=0)\n\n# \u539f\u59cb\u987a\u5e8f\nresult1 = deepsets(x)\n\n# \u7f6e\u6362\u540e\u7684\u987a\u5e8f\nperm = jnp.array([2, 0, 3, 1])\nresult2 = deepsets(x[perm])\n\nprint(f\"\u539f\u59cb\u987a\u5e8f:  {result1}\")\nprint(f\"\u7f6e\u6362\u987a\u5e8f:  {result2}\")\nprint(f\"\u4e0d\u53d8\u6027: {jnp.allclose(result1, result2)}\")\n</code></pre></p> </li> <li> <p>\u63a2\u7d22\u7fa4\u7ed3\u6784\u3002\u901a\u8fc7\u68c0\u67e5\u5c01\u95ed\u6027\u3001\u7ed3\u5408\u5f8b\u3001\u5355\u4f4d\u5143\u548c\u9006\u5143\uff0c\u9a8c\u8bc1\u4e8c\u7ef4\u65cb\u8f6c\u77e9\u9635\u6784\u6210\u7fa4\u3002 <pre><code>import jax.numpy as jnp\n\ndef rot2d(theta):\n    return jnp.array([[jnp.cos(theta), -jnp.sin(theta)],\n                       [jnp.sin(theta),  jnp.cos(theta)]])\n\nR1 = rot2d(jnp.pi / 6)\nR2 = rot2d(jnp.pi / 4)\nR3 = rot2d(jnp.pi / 3)\n\n# \u5c01\u95ed\u6027\uff1a\u4e24\u4e2a\u65cb\u8f6c\u7684\u4e58\u79ef\u8fd8\u662f\u4e00\u4e2a\u65cb\u8f6c\nR12 = R1 @ R2\nprint(f\"\u5c01\u95ed\u6027 (\u884c\u5217\u5f0f=1, \u6b63\u4ea4): det={jnp.linalg.det(R12):.4f}, \"\n      f\"R^T R = I: {jnp.allclose(R12.T @ R12, jnp.eye(2), atol=1e-5)}\")\n\n# \u7ed3\u5408\u5f8b\nprint(f\"\u7ed3\u5408\u5f8b: {jnp.allclose((R1 @ R2) @ R3, R1 @ (R2 @ R3), atol=1e-5)}\")\n\n# \u5355\u4f4d\u5143\nI = rot2d(0.0)\nprint(f\"\u5355\u4f4d\u5143: {jnp.allclose(R1 @ I, R1, atol=1e-5)}\")\n\n# \u9006\u5143\nR1_inv = rot2d(-jnp.pi / 6)\nprint(f\"\u9006\u5143: {jnp.allclose(R1 @ R1_inv, jnp.eye(2), atol=1e-5)}\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/02.%20graph%20theory/","title":"\u56fe\u8bba","text":"<p>\u56fe\u8bba\u4e3a\u63cf\u8ff0\u5b9e\u4f53\u95f4\u5173\u7cfb\u63d0\u4f9b\u4e86\u6570\u5b66\u8bed\u8a00\u3002\u672c\u7ae0\u6db5\u76d6\u8282\u70b9\u3001\u8fb9\u3001\u90bb\u63a5\u77e9\u9635\u3001\u56fe\u7c7b\u578b\u3001\u5ea6\u548c\u8fde\u901a\u6027\u3001\u56fe\u62c9\u666e\u62c9\u65af\u7b97\u5b50\u3001\u8c31\u56fe\u7406\u8bba\u4ee5\u53ca\u73b0\u5b9e\u4e16\u754c\u7684\u56fe\u5e94\u7528\u3002\u6211\u4eec\u5c06\u5728\u7eaf\u8ba1\u7b97\u673a\u79d1\u5b66\u7ae0\u8282\u4e2d\u66f4\u6df1\u5165\u5730\u8ba8\u8bba\u56fe</p> <ul> <li> <p>\u5230\u76ee\u524d\u4e3a\u6b62\uff0c\u672c\u4e66\u4e2d\u7684\u6570\u636e\u90fd\u5b58\u5728\u4e8e\u89c4\u5219\u7ed3\u6784\u4e0a\uff1a\\(\\mathbb{R}^n\\) \u4e2d\u7684\u5411\u91cf\uff08\u7b2c1\u7ae0\uff09\u3001\u6570\u5b57\u7f51\u683c\u5f62\u5f0f\u7684\u77e9\u9635\uff08\u7b2c2\u7ae0\uff09\u3001\u50cf\u7d20\u7f51\u683c\u5f62\u5f0f\u7684\u56fe\u50cf\uff08\u7b2c8\u7ae0\uff09\u3001\u6709\u5e8f\u5217\u8868\u5f62\u5f0f\u7684\u5e8f\u5217\uff08\u7b2c7\u7ae0\uff09\u3002\u4f46\u8bb8\u591a\u73b0\u5b9e\u4e16\u754c\u7684\u7cfb\u7edf\u662f\u4e0d\u89c4\u5219\u7684\uff1a\u793e\u4ea4\u7f51\u7edc\u6ca1\u6709\u7f51\u683c\u7ed3\u6784\uff0c\u5206\u5b50\u6ca1\u6709\u4ece\u5de6\u5230\u53f3\u7684\u987a\u5e8f\uff0c\u9053\u8def\u7f51\u7edc\u4e5f\u4e0d\u80fd\u6574\u9f50\u5730\u5e73\u94fa\u6210\u884c\u548c\u5217\u3002</p> </li> <li> <p>\u56fe\uff08Graph\uff09 \u662f\u8868\u793a\u8fd9\u4e9b\u4e0d\u89c4\u5219\u5173\u7cfb\u7ed3\u6784\u7684\u6570\u5b66\u5de5\u5177\u3002\u56fe\u6355\u83b7\u4e86\u5b9e\u4f53\uff08\u8282\u70b9\uff09\u53ca\u5b83\u4eec\u4e4b\u95f4\u7684\u5173\u7cfb\uff08\u8fb9\uff09\u3002\u4e00\u65e6\u6570\u636e\u88ab\u8868\u793a\u4e3a\u56fe\uff0c\u6211\u4eec\u5c31\u53ef\u4ee5\u5e94\u7528\u6587\u4ef61\u4e2d\u7684\u51e0\u4f55\u6df1\u5ea6\u5b66\u4e60\u539f\u7406\u6765\u4ece\u4e2d\u5b66\u4e60\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/02.%20graph%20theory/#_2","title":"\u8282\u70b9\u3001\u8fb9\u548c\u90bb\u63a5","text":"<ul> <li> <p>\u4e00\u4e2a\u56fe \\(G = (V, E)\\) \u7531\u4e00\u7ec4\u8282\u70b9\uff08\u6216\u9876\u70b9\uff09\\(V = \\{v_1, v_2, \\ldots, v_n\\}\\) \u548c\u4e00\u7ec4\u8fde\u63a5\u8282\u70b9\u5bf9\u7684\u8fb9 \\(E \\subseteq V \\times V\\) \u7ec4\u6210\u3002</p> </li> <li> <p>\u8282\u70b9\u4ee3\u8868\u5b9e\u4f53\uff1a\u4eba\u3001\u539f\u5b50\u3001\u57ce\u5e02\u3001\u7f51\u9875\u3001\u795e\u7ecf\u5143\u3002\u8fb9\u4ee3\u8868\u5173\u7cfb\uff1a\u53cb\u8c0a\u3001\u5316\u5b66\u952e\u3001\u9053\u8def\u3001\u8d85\u94fe\u63a5\u3001\u7a81\u89e6\u3002</p> </li> <li> <p>\u90bb\u63a5\u77e9\u9635 \\(A\\) \u662f\u56fe\u7684\u77e9\u9635\u8868\u793a\u3002\u5bf9\u4e8e\u4e00\u4e2a\u6709 \\(n\\) \u4e2a\u8282\u70b9\u7684\u56fe\uff0c\\(A\\) \u662f\u4e00\u4e2a \\(n \\times n\\) \u77e9\u9635\uff0c\u5176\u4e2d\u5982\u679c\u5b58\u5728\u4ece\u8282\u70b9 \\(i\\) \u5230\u8282\u70b9 \\(j\\) \u7684\u8fb9\uff0c\u5219 \\(A_{ij} = 1\\)\uff0c\u5426\u5219 \\(A_{ij} = 0\\)\u3002</p> </li> <li> <p>\u4f8b\u5982\uff0c\u4e00\u4e2a\u4e09\u89d2\u5f62\u56fe\uff083\u4e2a\u8282\u70b9\uff0c\u5168\u90e8\u76f8\u8fde\uff09\uff1a</p> </li> </ul> \\[ A = \\begin{bmatrix} 0 &amp; 1 &amp; 1 \\\\ 1 &amp; 0 &amp; 1 \\\\ 1 &amp; 1 &amp; 0 \\end{bmatrix} \\] <p></p> <ul> <li> <p>\u5bf9\u89d2\u7ebf\u4e3a\u96f6\uff0c\u56e0\u4e3a\u8282\u70b9\u9ed8\u8ba4\u4e0d\u4e0e\u81ea\u8eab\u76f8\u8fde\uff08\u65e0\u81ea\u73af\uff09\u3002\u90bb\u63a5\u77e9\u9635\u662f\u6211\u4eec\u5728\u7b2c2\u7ae0\u4e2d\u7814\u7a76\u7684\u5e03\u5c14\u77e9\u9635\u7684\u76f4\u63a5\u5e94\u7528\uff1a\u6bcf\u4e2a\u6761\u76ee\u90fd\u662f\u4e00\u4e2a\u4e8c\u5143\u5173\u7cfb\u3002</p> </li> <li> <p>\u90bb\u63a5\u77e9\u9635\u5b8c\u6574\u5730\u7f16\u7801\u4e86\u56fe\u7684\u7ed3\u6784\u3002\u5bf9 \\(A\\) \u7684\u77e9\u9635\u8fd0\u7b97\u63ed\u793a\u4e86\u56fe\u7684\u6027\u8d28\uff1a\\(A^2_{ij}\\) \u8ba1\u7b97\u8282\u70b9 \\(i\\) \u548c \\(j\\) \u4e4b\u95f4\u957f\u5ea6\u4e3a2\u7684\u8def\u5f84\u6570\u91cf\uff08\u56de\u987e\u7b2c2\u7ae0\u4e2d\u7684\u77e9\u9635\u4e58\u6cd5\uff1a\u6bcf\u4e2a\u6761\u76ee\u662f\u7ecf\u8fc7\u4e2d\u95f4\u8282\u70b9\u7684\u4e58\u79ef\u4e4b\u548c\uff09\u3002\u66f4\u4e00\u822c\u5730\uff0c\\(A^k_{ij}\\) \u8ba1\u7b97\u957f\u5ea6\u4e3a \\(k\\) \u7684\u8def\u5f84\u6570\u91cf\u3002</p> </li> <li> <p>\u6bcf\u4e2a\u8282\u70b9\u53ef\u4ee5\u643a\u5e26\u4e00\u4e2a\u7279\u5f81\u5411\u91cf \\(\\mathbf{x}_i \\in \\mathbb{R}^d\\)\u3002\u5bf9\u4e8e\u793e\u4ea4\u7f51\u7edc\uff0c\u8fd9\u53ef\u80fd\u662f\u7528\u6237\u7684\u4e2a\u4eba\u4fe1\u606f\u3002\u5bf9\u4e8e\u5206\u5b50\uff0c\u5b83\u7f16\u7801\u539f\u5b50\u7c7b\u578b\u3001\u7535\u8377\u548c\u5176\u4ed6\u5c5e\u6027\u3002\u5168\u90e8\u8282\u70b9\u7279\u5f81\u7684\u96c6\u5408\u662f\u4e00\u4e2a\u77e9\u9635 \\(X \\in \\mathbb{R}^{n \\times d}\\)\uff0c\u5176\u4e2d\u6bcf\u4e00\u884c\u662f\u4e00\u4e2a\u8282\u70b9\u7684\u7279\u5f81\u3002</p> </li> <li> <p>\u8fb9\u4e5f\u53ef\u4ee5\u643a\u5e26\u7279\u5f81\uff1a\u5206\u5b50\u4e2d\u7684\u952e\u7c7b\u578b\u3001\u7a7a\u95f4\u56fe\u4e2d\u7684\u8ddd\u79bb\u3001\u77e5\u8bc6\u56fe\u8c31\u4e2d\u7684\u5173\u7cfb\u7c7b\u578b\u3002\u8fb9 \\((i, j)\\) \u7684\u8fb9\u7279\u5f81\u662f\u4e00\u4e2a\u5411\u91cf \\(\\mathbf{e}_{ij} \\in \\mathbb{R}^{d_e}\\)\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/02.%20graph%20theory/#_3","title":"\u56fe\u7c7b\u578b","text":"<ul> <li> <p>\u65e0\u5411\u56fe\u5177\u6709\u5bf9\u79f0\u7684\u8fb9\uff1a\u5982\u679c \\(i\\) \u8fde\u63a5\u5230 \\(j\\)\uff0c\u5219 \\(j\\) \u4e5f\u8fde\u63a5\u5230 \\(i\\)\u3002\u90bb\u63a5\u77e9\u9635\u662f\u5bf9\u79f0\u7684\uff1a\\(A = A^T\\)\uff08\u4e00\u4e2a\u5bf9\u79f0\u77e9\u9635\uff0c\u89c1\u7b2c2\u7ae0\uff09\u3002\u53cb\u8c0a\u548c\u5316\u5b66\u952e\u662f\u65e0\u5411\u7684\u3002</p> </li> <li> <p>\u6709\u5411\u56fe\uff08digraph\uff09\u5177\u6709\u5e26\u65b9\u5411\u7684\u8fb9\uff1a\u4ece \\(i\\) \u5230 \\(j\\) \u7684\u8fb9\u4e0d\u610f\u5473\u7740\u4ece \\(j\\) \u5230 \\(i\\) \u7684\u8fb9\u3002\u90bb\u63a5\u77e9\u9635\u662f\u975e\u5bf9\u79f0\u7684\u3002Twitter\u5173\u6ce8\u3001\u7f51\u9875\u8d85\u94fe\u63a5\u548c\u5f15\u6587\u7f51\u7edc\u662f\u6709\u5411\u7684\u3002</p> </li> <li> <p>\u52a0\u6743\u56fe\u4e3a\u6bcf\u6761\u8fb9\u5206\u914d\u4e00\u4e2a\u6570\u503c\u6743\u91cd\u3002\u90bb\u63a5\u77e9\u9635\u5177\u6709\u5b9e\u6570\u503c\u800c\u975e\u4e8c\u8fdb\u5236\u503c\uff1a\\(A_{ij} = w_{ij}\\)\u3002\u9053\u8def\u7f51\u7edc\u4e2d\u7684\u8ddd\u79bb\u3001\u5927\u8111\u8fde\u901a\u6027\u4e2d\u7684\u76f8\u5173\u5f3a\u5ea6\u4ee5\u53ca\u793e\u4ea4\u7f51\u7edc\u4e2d\u7684\u4ea4\u4e92\u9891\u7387\u662f\u52a0\u6743\u7684\u3002</p> </li> <li> <p>\u4e8c\u5206\u56fe\u5177\u6709\u4e24\u4e2a\u4e0d\u76f8\u4ea4\u7684\u8282\u70b9\u96c6\u5408\uff0c\u8fb9\u53ea\u5b58\u5728\u4e8e\u96c6\u5408\u4e4b\u95f4\uff08\u96c6\u5408\u5185\u90e8\u6ca1\u6709\u8fb9\uff09\u3002\u7528\u6237\u548c\u4ea7\u54c1\u6784\u6210\u4e00\u4e2a\u4e8c\u5206\u56fe\uff1a\u7528\u6237\u8bc4\u4ef7\u4ea7\u54c1\uff0c\u4f46\u7528\u6237\u4e4b\u95f4\u4e0d\u76f8\u4e92\u8bc4\u4ef7\u3002\u4e8c\u5206\u56fe\u7684\u90bb\u63a5\u77e9\u9635\u5177\u6709\u5757\u7ed3\u6784\uff1a</p> </li> </ul> \\[ A = \\begin{bmatrix} 0 &amp; B \\\\ B^T &amp; 0 \\end{bmatrix} \\] <ul> <li> <p>\u5176\u4e2d \\(B\\) \u662f\u4e24\u4e2a\u8282\u70b9\u96c6\u4e4b\u95f4\u7684\u4e8c\u5206\u90bb\u63a5\u77e9\u9635\u3002</p> </li> <li> <p>\u591a\u91cd\u56fe\u5141\u8bb8\u540c\u4e00\u5bf9\u8282\u70b9\u4e4b\u95f4\u5b58\u5728\u591a\u6761\u8fb9\u548c/\u6216\u81ea\u73af\u3002\u77e5\u8bc6\u56fe\u8c31\u901a\u5e38\u662f\u591a\u91cd\u56fe\uff1a\u4e24\u4e2a\u5b9e\u4f53\u4e4b\u95f4\u53ef\u4ee5\u6709\u591a\u79cd\u5173\u7cfb\uff08\u4f8b\u5982\"\u51fa\u751f\u4e8e\"\u3001\"\u5c45\u4f4f\u4e8e\"\u3001\"\u5de5\u4f5c\u4e8e\"\uff09\u3002</p> </li> <li> <p>\u8d85\u56fe\u5c06\u8fb9\u63a8\u5e7f\u4e3a\u4e00\u6b21\u8fde\u63a5\u4e24\u4e2a\u4ee5\u4e0a\u8282\u70b9\u3002\u4e00\u6761\u8d85\u8fb9\u8fde\u63a5\u4e00\u7ec4\u8282\u70b9\uff0c\u8868\u793a\u9ad8\u9636\u5173\u7cfb\u3002\u4e00\u7bc7\u7531\u4e94\u4eba\u5408\u8457\u7684\u7814\u7a76\u8bba\u6587\u662f\u4e00\u6761\u8fde\u63a5\u4e94\u4e2a\u4f5c\u8005\u8282\u70b9\u7684\u8d85\u8fb9\u3002</p> </li> <li> <p>\u5b8c\u5168\u56fe \\(K_n\\) \u5728\u6bcf\u4e00\u5bf9\u8282\u70b9\u4e4b\u95f4\u90fd\u6709\u8fb9\u3002\u8fd9\u662f\u5168\u8fde\u63a5\u5c42\u7684\u56fe\u7c7b\u6bd4\uff0c\u4e5f\u662fTransformer\u64cd\u4f5c\u7684\u7ed3\u6784\uff08\u6bcf\u4e2a\u6807\u8bb0\u5173\u6ce8\u6bcf\u4e2a\u5176\u4ed6\u6807\u8bb0\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/02.%20graph%20theory/#_4","title":"\u5ea6\u3001\u8def\u5f84\u548c\u8fde\u901a\u6027","text":"<ul> <li> <p>\u4e00\u4e2a\u8282\u70b9\u7684\u5ea6\u662f\u4e0e\u5b83\u76f8\u8fde\u7684\u8fb9\u7684\u6570\u91cf\u3002\u5728\u65e0\u5411\u56fe\u4e2d\uff0c\u8282\u70b9 \\(i\\) \u7684\u5ea6\u4e3a \\(d_i = \\sum_j A_{ij}\\)\u3002\u9ad8\u5ea6\u8282\u70b9\u662f\u62e5\u6709\u5927\u91cf\u8fde\u63a5\u7684\"\u67a2\u7ebd\"\u3002</p> </li> <li> <p>\u5ea6\u77e9\u9635 \\(D\\) \u662f\u4e00\u4e2a\u5bf9\u89d2\u7ebf\u5143\u7d20\u4e3a\u5ea6\u7684\u5bf9\u89d2\u77e9\u9635\uff1a\\(D_{ii} = d_i\\)\u3002\u8fd9\u4e2a\u77e9\u9635\u51fa\u73b0\u5728\u6574\u4e2a\u56fe\u8bba\u548cGNN\u516c\u5f0f\u4e2d\u3002</p> </li> <li> <p>\u4e24\u4e2a\u8282\u70b9\u4e4b\u95f4\u7684\u8def\u5f84\u662f\u8fde\u63a5\u5b83\u4eec\u7684\u8fb9\u5e8f\u5217\u3002\\(i\\) \u548c \\(j\\) \u4e4b\u95f4\u7684\u6700\u77ed\u8def\u5f84\uff08\u6216\u6d4b\u5730\u7ebf\uff09\u662f\u8fb9\u6570\u6700\u5c11\uff08\u6216\u5728\u52a0\u6743\u56fe\u4e2d\u603b\u6743\u91cd\u6700\u5c0f\uff09\u7684\u8def\u5f84\u3002\u8fea\u6770\u65af\u7279\u62c9\u7b97\u6cd5\uff08Dijkstra's algorithm\uff09\u5728 \\(O((|V| + |E|) \\log |V|)\\) \u65f6\u95f4\u5185\u627e\u5230\u6700\u77ed\u8def\u5f84\u3002</p> </li> <li> <p>\u5982\u679c\u6bcf\u5bf9\u8282\u70b9\u4e4b\u95f4\u90fd\u5b58\u5728\u8def\u5f84\uff0c\u5219\u56fe\u662f\u8fde\u901a\u7684\u3002\u5426\u5219\uff0c\u56fe\u6709\u591a\u4e2a\u8fde\u901a\u5206\u91cf\uff1a\u76f8\u4e92\u4e4b\u95f4\u6ca1\u6709\u8fb9\u7684\u5b64\u7acb\u5b50\u56fe\u3002</p> </li> <li> <p>\u56fe\u7684\u76f4\u5f84\u662f\u4efb\u610f\u4e00\u5bf9\u8282\u70b9\u4e4b\u95f4\u6700\u957f\u6700\u77ed\u8def\u5f84\u7684\u957f\u5ea6\u3002\u5b83\u8861\u91cf\u56fe\"\u5206\u6563\"\u7684\u7a0b\u5ea6\u3002\u793e\u4ea4\u7f51\u7edc\u4ee5\u76f4\u5f84\u5c0f\u800c\u95fb\u540d\uff08\"\u516d\u5ea6\u5206\u9694\"\uff09\u3002</p> </li> <li> <p>\u73af\u662f\u8d77\u70b9\u548c\u7ec8\u70b9\u5728\u540c\u4e00\u8282\u70b9\u7684\u8def\u5f84\u3002\u6ca1\u6709\u73af\u7684\u56fe\u662f\u6811\u3002\u6811\u662f\u6700\u7b80\u5355\u7684\u8fde\u901a\u56fe\uff1a\\(n\\) \u4e2a\u8282\u70b9\u548c\u6070\u597d \\(n-1\\) \u6761\u8fb9\u3002</p> </li> <li> <p>\u4e2d\u5fc3\u6027\u8861\u91cf\u8282\u70b9\u7684\u91cd\u8981\u6027\u3002\u5ea6\u4e2d\u5fc3\u6027\u5c31\u662f\u5ea6\u6570\u3002\u4ecb\u6570\u4e2d\u5fc3\u6027\u8ba1\u7b97\u901a\u8fc7\u4e00\u4e2a\u8282\u70b9\u7684\u6700\u77ed\u8def\u5f84\u6570\u91cf\u3002\u7279\u5f81\u5411\u91cf\u4e2d\u5fc3\u6027\u6839\u636e\u8282\u70b9\u90bb\u5c45\u7684\u91cd\u8981\u6027\u5206\u914d\u91cd\u8981\u6027\uff0c\u5f97\u5230\u7279\u5f81\u5411\u91cf\u65b9\u7a0b \\(A\\mathbf{x} = \\lambda \\mathbf{x}\\)\uff08\u7b2c2\u7ae0\uff09\u3002\u8c37\u6b4c\u7684PageRank\u662f\u7279\u5f81\u5411\u91cf\u4e2d\u5fc3\u6027\u5728\u6709\u5411\u56fe\u4e0a\u7684\u53d8\u4f53\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/02.%20graph%20theory/#_5","title":"\u56fe\u62c9\u666e\u62c9\u65af\u7b97\u5b50","text":"<ul> <li>\u56fe\u62c9\u666e\u62c9\u65af\u7b97\u5b50\u4e5f\u8bb8\u662f\u56fe\u8bba\u4e2d\u6700\u91cd\u8981\u7684\u77e9\u9635\u3002\u5b9a\u4e49\u5982\u4e0b\uff1a</li> </ul> \\[L = D - A\\] <ul> <li>\u5176\u4e2d \\(D\\) \u662f\u5ea6\u77e9\u9635\uff0c\\(A\\) \u662f\u90bb\u63a5\u77e9\u9635\u3002\u5bf9\u4e8e\u6211\u4eec\u7684\u4e09\u89d2\u5f62\u793a\u4f8b\uff1a</li> </ul> \\[ L = \\begin{bmatrix} 2 &amp; 0 &amp; 0 \\\\ 0 &amp; 2 &amp; 0 \\\\ 0 &amp; 0 &amp; 2 \\end{bmatrix} - \\begin{bmatrix} 0 &amp; 1 &amp; 1 \\\\ 1 &amp; 0 &amp; 1 \\\\ 1 &amp; 1 &amp; 0 \\end{bmatrix} = \\begin{bmatrix} 2 &amp; -1 &amp; -1 \\\\ -1 &amp; 2 &amp; -1 \\\\ -1 &amp; -1 &amp; 2 \\end{bmatrix} \\] <ul> <li> <p>\u62c9\u666e\u62c9\u65af\u7b97\u5b50\u5177\u6709\u663e\u8457\u7684\u6027\u8d28\uff1a</p> <ul> <li>\u5b83\u59cb\u7ec8\u662f\u5bf9\u79f0\u7684\u4e14\u534a\u6b63\u5b9a\u7684\uff08\u56de\u987e\u7b2c2\u7ae0\uff1a\u6240\u6709\u7279\u5f81\u503c \\(\\geq 0\\)\uff09\u3002\u5bf9\u4e8e\u4efb\u610f\u5411\u91cf \\(\\mathbf{x}\\)\uff1a</li> </ul> </li> </ul> \\[\\mathbf{x}^T L \\mathbf{x} = \\sum_{(i,j) \\in E} (x_i - x_j)^2\\] <p></p> <pre><code>- \u8fd9\u4e2a\u4e8c\u6b21\u5f62\u5f0f\u5ea6\u91cf\u56fe\u4e0a\u7684\u4fe1\u53f7 $\\mathbf{x}$ \u5728\u8fb9\u4e0a\u7684\u53d8\u5316\u7a0b\u5ea6\u3002\u5982\u679c\u76f8\u90bb\u8282\u70b9\u503c\u76f8\u8fd1\uff0c\u5219 $\\mathbf{x}^T L \\mathbf{x}$ \u8f83\u5c0f\u3002\u5982\u679c\u5b83\u4eec\u5dee\u5f02\u5f88\u5927\uff0c\u5219\u8f83\u5927\u3002\u62c9\u666e\u62c9\u65af\u7b97\u5b50\u5ea6\u91cf\u56fe\u4e0a\u4fe1\u53f7\u7684**\u5e73\u6ed1\u5ea6**\u3002\n\n- \u6700\u5c0f\u7279\u5f81\u503c\u59cb\u7ec8\u4e3a0\uff0c\u7279\u5f81\u5411\u91cf\u4e3a $\\mathbf{1} = [1, 1, \\ldots, 1]^T$\uff08\u5e38\u6570\u4fe1\u53f7\u6ca1\u6709\u53d8\u5316\uff09\u3002\u96f6\u7279\u5f81\u503c\u7684\u6570\u91cf\u7b49\u4e8e\u8fde\u901a\u5206\u91cf\u7684\u6570\u91cf\u3002\n\n- \u7b2c\u4e8c\u5c0f\u7279\u5f81\u503c $\\lambda_2$ \u662f**\u4ee3\u6570\u8fde\u901a\u5ea6**\uff08Fiedler\u503c\uff09\u3002\u5b83\u8861\u91cf\u56fe\u7684\u8fde\u901a\u7a0b\u5ea6\uff1a$\\lambda_2 = 0$ \u8868\u793a\u56fe\u4e0d\u8fde\u901a\uff0c\u5927\u7684 $\\lambda_2$ \u8868\u793a\u56fe\u7d27\u5bc6\u8fde\u901a\u3002\n</code></pre> <ul> <li>\u5f52\u4e00\u5316\u62c9\u666e\u62c9\u65af\u7b97\u5b50\u901a\u8fc7\u5ea6\u8fdb\u884c\u7f29\u653e\uff1a</li> </ul> \\[\\hat{L} = D^{-1/2} L D^{-1/2} = I - D^{-1/2} A D^{-1/2}\\] <ul> <li>\u8fd9\u79cd\u5f52\u4e00\u5316\u786e\u4fdd\u62c9\u666e\u62c9\u65af\u7b97\u5b50\u7684\u6027\u8d28\u4e0d\u4f9d\u8d56\u4e8e\u8282\u70b9\u5ea6\u7684\u7edd\u5bf9\u5c3a\u5ea6\u3002\u9879 \\(D^{-1/2} A D^{-1/2}\\) \u662f\u5bf9\u79f0\u5f52\u4e00\u5316\u90bb\u63a5\u77e9\u9635\uff0c\u5b83\u76f4\u63a5\u51fa\u73b0\u5728GCN\u516c\u5f0f\u4e2d\uff08\u6587\u4ef63\uff09\u3002</li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/02.%20graph%20theory/#_6","title":"\u8c31\u56fe\u7406\u8bba","text":"<ul> <li> <p>\u56fe\u62c9\u666e\u62c9\u65af\u7b97\u5b50\u7684\u7279\u5f81\u503c\u548c\u7279\u5f81\u5411\u91cf\u5b9a\u4e49\u4e86\u56fe\u7684\u8c31\uff0c\u5b83\u4eec\u5145\u5f53\u56fe\u4e0a\u7684\u5085\u91cc\u53f6\u53d8\u6362\u7684\u7c7b\u4f3c\u7269\u3002</p> </li> <li> <p>\u5728\u7ecf\u5178\u4fe1\u53f7\u5904\u7406\u4e2d\uff0c\u5085\u91cc\u53f6\u53d8\u6362\u5c06\u4fe1\u53f7\u5206\u89e3\u4e3a\u9891\u7387\u5206\u91cf\uff08\u6b63\u5f26\u548c\u4f59\u5f26\uff09\u3002\u5728\u56fe\u4e0a\uff0c\u62c9\u666e\u62c9\u65af\u7b97\u5b50\u7684\u7279\u5f81\u5411\u91cf\u626e\u6f14\u8fd9\u4e9b\u9891\u7387\u57fa\u7684\u89d2\u8272\u3002\u5c0f\u7279\u5f81\u503c\u7684\u7279\u5f81\u5411\u91cf\u5728\u56fe\u4e0a\u53d8\u5316\u7f13\u6162\uff08\u4f4e\u9891\u3001\u5e73\u6ed1\uff09\uff0c\u800c\u5927\u7279\u5f81\u503c\u7684\u7279\u5f81\u5411\u91cf\u53d8\u5316\u8fc5\u901f\uff08\u9ad8\u9891\u3001\u632f\u8361\uff09\u3002</p> </li> <li> <p>\u4fe1\u53f7 \\(\\mathbf{x}\\) \u5728\u56fe\u4e0a\u7684\u56fe\u5085\u91cc\u53f6\u53d8\u6362\uff08GFT\uff09 \u4e3a\uff1a</p> </li> </ul> \\[\\hat{\\mathbf{x}} = U^T \\mathbf{x}\\] <ul> <li> <p>\u5176\u4e2d \\(U\\) \u662f\u62c9\u666e\u62c9\u65af\u7b97\u5b50\u7279\u5f81\u5411\u91cf\u7684\u77e9\u9635\uff08\u56de\u987e\u7b2c2\u7ae0\u4e2d\u7684\u7279\u5f81\u5206\u89e3\uff1a\\(L = U \\Lambda U^T\\)\uff09\u3002\u9006\u53d8\u6362\u4e3a \\(\\mathbf{x} = U \\hat{\\mathbf{x}}\\)\u3002</p> </li> <li> <p>\u8c31\u57df\u4e2d\u7684\u56fe\u5377\u79ef\u662f\u9891\u57df\u4e2d\u7684\u9010\u70b9\u4e58\u6cd5\uff0c\u6b63\u5982\u7a7a\u95f4\u57df\u4e2d\u7684\u5377\u79ef\u5bf9\u5e94\u4e8e\u5085\u91cc\u53f6\u57df\u4e2d\u7684\u4e58\u6cd5\uff08\u5377\u79ef\u5b9a\u7406\uff0c\u89c1\u7b2c8\u7ae0\uff09\uff1a</p> </li> </ul> \\[g_\\theta \\star \\mathbf{x} = U \\left( (U^T g_\\theta) \\odot (U^T \\mathbf{x}) \\right) = U \\, \\text{diag}(\\hat{g}_\\theta) \\, U^T \\mathbf{x}\\] <ul> <li> <p>\u6ee4\u6ce2\u5668 \\(\\hat{g}_\\theta\\) \u662f\u7279\u5f81\u503c\u7684\u53ef\u5b66\u4e60\u51fd\u6570\u3002\u8fd9\u662f\u8c31\u57dfGNN\u7684\u57fa\u7840\uff0c\u6211\u4eec\u5c06\u5728\u6587\u4ef63\u4e2d\u5c06\u5176\u7b80\u5316\u4e3a\u5b9e\u7528\u7684GCN\u3002</p> </li> <li> <p>\u8ba1\u7b97\u74f6\u9888\u662f\u5bf9 \\(L\\) \u8fdb\u884c\u7279\u5f81\u5206\u89e3\uff0c\u5bf9\u4e8e\u6709 \\(n\\) \u4e2a\u8282\u70b9\u7684\u56fe\u9700\u8981 \\(O(n^3)\\) \u65f6\u95f4\u3002\u8fd9\u5bf9\u4e8e\u5927\u578b\u56fe\uff08\u6570\u767e\u4e07\u8282\u70b9\uff09\u662f\u4e0d\u53ef\u884c\u7684\u3002\u591a\u9879\u5f0f\u8fd1\u4f3c\uff08\u5207\u6bd4\u96ea\u592b\u591a\u9879\u5f0f\uff09\u5b8c\u5168\u907f\u514d\u4e86\u7279\u5f81\u5206\u89e3\uff0c\u800c\u8fd9\u79cd\u8fd1\u4f3c\u76f4\u63a5\u5bfc\u81f4\u4e86GCN\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/02.%20graph%20theory/#_7","title":"\u793e\u533a\u68c0\u6d4b","text":"<ul> <li> <p>\u8bb8\u591a\u73b0\u5b9e\u4e16\u754c\u7684\u56fe\u5177\u6709\u793e\u533a\u7ed3\u6784\uff1a\u7d27\u5bc6\u8fde\u63a5\u7684\u8282\u70b9\u7c07\uff0c\u7c07\u4e4b\u95f4\u8fde\u63a5\u7a00\u758f\u3002\u793e\u4ea4\u7f51\u7edc\u6709\u597d\u53cb\u7fa4\u7ec4\uff0c\u751f\u7269\u7f51\u7edc\u6709\u529f\u80fd\u6a21\u5757\uff0c\u5f15\u6587\u7f51\u7edc\u6709\u7814\u7a76\u9886\u57df\u3002</p> </li> <li> <p>\u8c31\u805a\u7c7b\u4f7f\u7528\u62c9\u666e\u62c9\u65af\u7b97\u5b50\u7279\u5f81\u5411\u91cf\u6765\u5bfb\u627e\u793e\u533a\u3002\u601d\u8def\uff1a\u4f7f\u7528 \\(L\\) \u7684 \\(k\\) \u4e2a\u6700\u5c0f\u7684\u975e\u5e73\u51e1\u7279\u5f81\u5411\u91cf\u5bf9\u6bcf\u4e2a\u8282\u70b9\u8fdb\u884c\u5d4c\u5165\uff0c\u7136\u540e\u5728\u8fd9\u4e2a\u5d4c\u5165\u7a7a\u95f4\u4e2d\u5e94\u7528k-means\uff08\u7b2c6\u7ae0\uff09\u3002\u540c\u4e00\u793e\u533a\u4e2d\u7684\u8282\u70b9\u5728\u8c31\u5d4c\u5165\u4e2d\u6700\u7ec8\u5f7c\u6b64\u9760\u8fd1\u3002</p> </li> <li> <p>\u8fd9\u662f\u53ef\u884c\u7684\uff0c\u56e0\u4e3aFiedler\u5411\u91cf\uff08\\(\\lambda_2\\) \u7684\u7279\u5f81\u5411\u91cf\uff09\u81ea\u7136\u5730\u5c06\u56fe\u5206\u6210\u4e24\u7ec4\uff1a\u6b63\u503c\u7684\u8282\u70b9\u548c\u8d1f\u503c\u7684\u8282\u70b9\uff0c\u6cbf\u7740\u6700\u7a00\u758f\u7684\u8fde\u63a5\u5207\u5f00\u3002\u66f4\u9ad8\u7684\u7279\u5f81\u5411\u91cf\u8fdb\u4e00\u6b65\u7ec6\u5206\u4e3a\u66f4\u591a\u7ec4\u3002</p> </li> <li> <p>\u6a21\u5757\u5ea6 \\(Q\\) \u8861\u91cf\u793e\u533a\u5212\u5206\u7684\u8d28\u91cf\u3002\u5b83\u5c06\u793e\u533a\u5185\u8fb9\u7684\u6570\u91cf\u4e0e\u968f\u673a\u56fe\u4e2d\u7684\u671f\u671b\u6570\u91cf\u8fdb\u884c\u6bd4\u8f83\uff1a</p> </li> </ul> \\[Q = \\frac{1}{2|E|} \\sum_{ij} \\left( A_{ij} - \\frac{d_i d_j}{2|E|} \\right) \\delta(c_i, c_j)\\] <ul> <li>\u5176\u4e2d \\(c_i\\) \u662f\u8282\u70b9 \\(i\\) \u7684\u793e\u533a\u5206\u914d\uff0c\u5982\u679c\u8282\u70b9\u5728\u540c\u4e00\u4e2a\u793e\u533a\u5219 \\(\\delta\\) \u4e3a1\u3002\\(Q\\) \u7684\u8303\u56f4\u4ece \\(-0.5\\) \u5230 \\(1\\)\uff0c\u503c\u8d8a\u9ad8\u8868\u793a\u793e\u533a\u7ed3\u6784\u8d8a\u5f3a\u3002</li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/02.%20graph%20theory/#_8","title":"\u73b0\u5b9e\u4e16\u754c\u4e2d\u7684\u56fe","text":"<ul> <li> <p>\u793e\u4ea4\u7f51\u7edc\uff1a\u8282\u70b9\u662f\u4eba\uff0c\u8fb9\u662f\u53cb\u8c0a\u6216\u4e92\u52a8\u3002Facebook\u6709\u6570\u5341\u4ebf\u8282\u70b9\u548c\u6570\u5343\u4ebf\u6761\u8fb9\u3002\u8fd9\u4e9b\u56fe\u901a\u5e38\u662f\u7a00\u758f\u7684\uff08\u6bcf\u4e2a\u4eba\u6709\u51e0\u767e\u4e2a\u670b\u53cb\uff0c\u800c\u4e0d\u662f\u51e0\u5341\u4ebf\uff09\uff0c\u5177\u6709\u5c0f\u4e16\u754c\u6027\u8d28\uff08\u77ed\u7684\u5e73\u5747\u8def\u5f84\u957f\u5ea6\uff09\uff0c\u4ee5\u53ca\u91cd\u5c3e\u5ea6\u5206\u5e03\uff08\u5c11\u6570\u62e5\u6709\u6570\u767e\u4e07\u8fde\u63a5\u7684\u67a2\u7ebd\u8282\u70b9\uff09\u3002</p> </li> <li> <p>\u5206\u5b50\u56fe\uff1a\u8282\u70b9\u662f\u539f\u5b50\uff0c\u8fb9\u662f\u5316\u5b66\u952e\u3002\u6bcf\u4e2a\u539f\u5b50\u6709\u7279\u5f81\uff08\u5143\u7d20\u7c7b\u578b\u3001\u7535\u8377\u3001\u6742\u5316\u65b9\u5f0f\uff09\uff0c\u6bcf\u6761\u952e\u6709\u7279\u5f81\uff08\u5355\u952e\u3001\u53cc\u952e\u3001\u4e09\u952e\u3001\u82b3\u9999\u952e\uff09\u3002\u5206\u5b50\u56fe\u5f88\u5c0f\uff08\u6570\u5341\u5230\u6570\u767e\u4e2a\u8282\u70b9\uff09\u4f46\u9ad8\u5ea6\u7ed3\u6784\u5316\u3002\u4ece\u56fe\u7ed3\u6784\u9884\u6d4b\u5206\u5b50\u6027\u8d28\u662fGNN\u7684\u4e00\u4e2a\u91cd\u8981\u5e94\u7528\u3002</p> </li> <li> <p>\u77e5\u8bc6\u56fe\u8c31\uff1a\u8282\u70b9\u662f\u5b9e\u4f53\uff08\u4eba\u3001\u5730\u70b9\u3001\u6982\u5ff5\uff09\uff0c\u8fb9\u662f\u7c7b\u578b\u5316\u7684\u5173\u7cfb\uff08\"\u51fa\u751f\u4e8e\"\u3001\"\u9996\u90fd\u662f\"\u3001\"\u662f\u2026\u2026\u7684\u5b9e\u4f8b\"\uff09\u3002\u77e5\u8bc6\u56fe\u8c31\u4e3a\u641c\u7d22\u5f15\u64ce\u3001\u63a8\u8350\u7cfb\u7edf\u548c\u95ee\u7b54\u7cfb\u7edf\u63d0\u4f9b\u652f\u6301\u3002\u5b83\u4eec\u901a\u5e38\u662f\u5177\u6709\u6570\u767e\u4e07\u5b9e\u4f53\u548c\u6570\u5341\u4ebf\u5173\u7cfb\u7684\u6709\u591a\u91cd\u56fe\u3002</p> </li> <li> <p>\u5f15\u6587\u7f51\u7edc\uff1a\u8282\u70b9\u662f\u8bba\u6587\uff0c\u8fb9\u662f\u5f15\u7528\uff08\u6709\u5411\u7684\uff09\u3002\u805a\u7c7b\u63ed\u793a\u7814\u7a76\u793e\u533a\u3002\u8282\u70b9\u7279\u5f81\u5305\u62ec\u6807\u9898\u3001\u6458\u8981\u548c\u51fa\u7248\u5e74\u4efd\u3002</p> </li> <li> <p>\u86cb\u767d\u8d28\u76f8\u4e92\u4f5c\u7528\u7f51\u7edc\uff1a\u8282\u70b9\u662f\u86cb\u767d\u8d28\uff0c\u8fb9\u8868\u793a\u7269\u7406\u76f8\u4e92\u4f5c\u7528\u6216\u529f\u80fd\u5173\u8054\u3002\u7406\u89e3\u8fd9\u4e9b\u56fe\u6709\u52a9\u4e8e\u8bc6\u522b\u836f\u7269\u9776\u70b9\u548c\u75be\u75c5\u673a\u5236\u3002</p> </li> <li> <p>\u9053\u8def\u7f51\u7edc\u4e0e\u4ea4\u901a\uff1a\u8282\u70b9\u662f\u4ea4\u53c9\u8def\u53e3\uff0c\u8fb9\u662f\u5177\u6709\u8ddd\u79bb/\u65f6\u95f4\u6743\u91cd\u7684\u9053\u8def\u6bb5\u3002\u8fd9\u4e9b\u56fe\u4e0a\u7684\u6700\u77ed\u8def\u5f84\u7b97\u6cd5\u4e3a\u5bfc\u822a\u7cfb\u7edf\u63d0\u4f9b\u52a8\u529b\u3002\u81ea\u52a8\u9a7e\u9a76\u8fd0\u52a8\u9884\u6d4b\uff08\u7b2c11\u7ae0\uff09\u5c06\u667a\u80fd\u4f53\u4ea4\u4e92\u8868\u793a\u4e3a\u56fe\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/02.%20graph%20theory/#colabnotebook","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216notebook\uff09","text":"<ol> <li> <p>\u6784\u5efa\u4e00\u4e2a\u5c0f\u578b\u56fe\u7684\u90bb\u63a5\u77e9\u9635\uff0c\u8ba1\u7b97\u57fa\u672c\u6027\u8d28\uff1a\u6bcf\u4e2a\u8282\u70b9\u7684\u5ea6\u3001\u957f\u5ea6\u4e3a2\u7684\u8def\u5f84\u6570\u91cf\u4ee5\u53ca\u56fe\u662f\u5426\u8fde\u901a\u3002 <pre><code>import jax.numpy as jnp\n\n# \u4e00\u4e2a\u7b80\u5355\u56fe\uff1a5\u4e2a\u8282\u70b9\n# 0-1, 0-2, 1-2, 2-3, 3-4\nA = jnp.array([[0, 1, 1, 0, 0],\n               [1, 0, 1, 0, 0],\n               [1, 1, 0, 1, 0],\n               [0, 0, 1, 0, 1],\n               [0, 0, 0, 1, 0]], dtype=float)\n\n# \u5ea6\ndegrees = A.sum(axis=1)\nprint(f\"\u5ea6\u6570: {degrees}\")\n\n# \u957f\u5ea6\u4e3a2\u7684\u8def\u5f84\nA2 = A @ A\nprint(f\"\u957f\u5ea6\u4e3a2\u7684\u8def\u5f84\uff08\u8282\u70b90\u52303\uff09: {int(A2[0, 3])}\")\n\n# \u662f\u5426\u8fde\u901a\uff1f\u68c0\u67e5 A^(n-1) \u662f\u5426\u6240\u6709\u6761\u76ee\u975e\u96f6\nAn = jnp.linalg.matrix_power(A + jnp.eye(5), 4)  # (A+I)^4 \u7528\u4e8e\u53ef\u8fbe\u6027\nconnected = jnp.all(An &gt; 0)\nprint(f\"\u8fde\u901a: {connected}\")\n</code></pre></p> </li> <li> <p>\u8ba1\u7b97\u56fe\u62c9\u666e\u62c9\u65af\u7b97\u5b50\u53ca\u5176\u7279\u5f81\u503c\u3002\u9a8c\u8bc1\u6700\u5c0f\u7279\u5f81\u503c\u4e3a0\u4e14\u5bf9\u5e94\u7684\u7279\u5f81\u5411\u91cf\u4e3a\u5e38\u6570\u3002 <pre><code>import jax.numpy as jnp\n\nA = jnp.array([[0, 1, 1, 0, 0],\n               [1, 0, 1, 0, 0],\n               [1, 1, 0, 1, 0],\n               [0, 0, 1, 0, 1],\n               [0, 0, 0, 1, 0]], dtype=float)\n\nD = jnp.diag(A.sum(axis=1))\nL = D - A\n\neigenvalues, eigenvectors = jnp.linalg.eigh(L)\nprint(f\"\u7279\u5f81\u503c: {eigenvalues}\")\nprint(f\"\u6700\u5c0f\u7279\u5f81\u5411\u91cf: {eigenvectors[:, 0]}\")\nprint(f\"Fiedler\u503c\uff08\u4ee3\u6570\u8fde\u901a\u5ea6\uff09: {eigenvalues[1]:.4f}\")\n\n# \u9a8c\u8bc1: x^T L x \u5ea6\u91cf\u5e73\u6ed1\u5ea6\nx = jnp.array([1.0, 1.0, 1.0, -1.0, -1.0])  # \u4e24\u4e2a\u7ec4\nsmoothness = x @ L @ x\nprint(f\"\u4e24\u7ec4\u4fe1\u53f7\u7684\u5e73\u6ed1\u5ea6: {smoothness:.2f}\")\n</code></pre></p> </li> <li> <p>\u5bf9\u5177\u6709\u4e24\u4e2a\u793e\u533a\u7684\u56fe\u6267\u884c\u8c31\u805a\u7c7b\u3002\u4f7f\u7528Fiedler\u5411\u91cf\u5d4c\u5165\u8282\u70b9\uff0c\u5e76\u6309\u7b26\u53f7\u5206\u79bb\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u4e24\u4e2a\u793e\u533a\uff0c\u54045\u4e2a\u8282\u70b9\uff0c\u5f31\u8fde\u63a5\nA = jnp.zeros((10, 10))\n# \u793e\u533a1\uff1a\u8282\u70b90-4\uff08\u5bc6\u96c6\uff09\nfor i in range(5):\n    for j in range(i+1, 5):\n        A = A.at[i, j].set(1).at[j, i].set(1)\n# \u793e\u533a2\uff1a\u8282\u70b95-9\uff08\u5bc6\u96c6\uff09\nfor i in range(5, 10):\n    for j in range(i+1, 10):\n        A = A.at[i, j].set(1).at[j, i].set(1)\n# \u4e00\u6761\u6865\u63a5\u8fb9\nA = A.at[2, 7].set(1).at[7, 2].set(1)\n\nD = jnp.diag(A.sum(axis=1))\nL = D - A\neigenvalues, eigenvectors = jnp.linalg.eigh(L)\n\n# Fiedler\u5411\u91cf\uff08\u7b2c\u4e8c\u5c0f\u7279\u5f81\u503c\uff09\nfiedler = eigenvectors[:, 1]\ncommunities = (fiedler &gt; 0).astype(int)\n\nprint(f\"Fiedler\u5411\u91cf: {fiedler}\")\nprint(f\"\u805a\u7c7b: {communities}\")\n\nplt.bar(range(10), fiedler, color=[\"#3498db\" if c == 0 else \"#e74c3c\" for c in communities])\nplt.xlabel(\"\u8282\u70b9\"); plt.ylabel(\"Fiedler\u5411\u91cf\u503c\")\nplt.title(\"\u901a\u8fc7Fiedler\u5411\u91cf\u8fdb\u884c\u8c31\u805a\u7c7b\")\nplt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/03.%20graph%20neural%20networks/","title":"\u56fe\u795e\u7ecf\u7f51\u7edc","text":"<p>\u56fe\u795e\u7ecf\u7f51\u7edc\u901a\u8fc7\u5728\u8fde\u63a5\u8282\u70b9\u4e4b\u95f4\u4f20\u9012\u6d88\u606f\u6765\u5b66\u4e60\u56fe\u7ed3\u6784\u6570\u636e\u3002\u672c\u7ae0\u6db5\u76d6\u6d88\u606f\u4f20\u9012\u6846\u67b6\u3001GCN\u3001GraphSAGE\u3001GIN\u3001\u8fc7\u5e73\u6ed1\u3001\u56fe\u6c60\u5316\u4ee5\u53ca\u8282\u70b9/\u8fb9/\u56fe\u7ea7\u522b\u7684\u4efb\u52a1\uff1b\u652f\u6491\u5206\u5b50\u6027\u8d28\u9884\u6d4b\u3001\u793e\u4ea4\u7f51\u7edc\u5206\u6790\u548c\u63a8\u8350\u7cfb\u7edf\u7684\u6838\u5fc3\u67b6\u6784\u3002</p> <ul> <li> <p>\u5728\u524d\u9762\u7684\u6587\u4ef6\u4e2d\uff0c\u6211\u4eec\u5efa\u7acb\u4e86\u6570\u5b66\u57fa\u7840\uff1a\u51e0\u4f55\u6df1\u5ea6\u5b66\u4e60\uff08\u6587\u4ef61\uff09\u544a\u8bc9\u6211\u4eec\u5229\u7528\u5bf9\u79f0\u6027\uff0c\u56fe\u8bba\uff08\u6587\u4ef62\uff09\u63d0\u4f9b\u4e86\u8282\u70b9\u3001\u8fb9\u548c\u90bb\u63a5\u7684\u8bed\u8a00\u3002\u73b0\u5728\u6211\u4eec\u6784\u5efa\u76f4\u63a5\u5728\u56fe\uff08graph\uff09\u4e0a\u64cd\u4f5c\u7684\u795e\u7ecf\u7f51\u7edc\u3002</p> </li> <li> <p>\u6838\u5fc3\u6311\u6218\uff1a\u56fe\u6570\u636e\u662f\u4e0d\u89c4\u5219\u7684\u3002\u4e0e\u56fe\u50cf\uff08\u56fa\u5b9a\u7f51\u683c\uff09\u6216\u5e8f\u5217\uff08\u56fa\u5b9a\u987a\u5e8f\uff09\u4e0d\u540c\uff0c\u56fe\u5177\u6709\u53ef\u53d8\u6570\u91cf\u7684\u8282\u70b9\u3001\u53ef\u53d8\u7684\u8fde\u901a\u6027\uff0c\u5e76\u4e14\u6ca1\u6709\u89c4\u8303\u7684\u8282\u70b9\u987a\u5e8f\u3002\u7528\u4e8e\u56fe\u7684\u795e\u7ecf\u7f51\u7edc\u5fc5\u987b\u5904\u7406\u6240\u6709\u8fd9\u4e9b\u60c5\u51b5\uff0c\u540c\u65f6\u4fdd\u6301\u7f6e\u6362\u7b49\u53d8\u6027\uff08\u91cd\u65b0\u6807\u8bb0\u8282\u70b9\u4e0d\u5e94\u6539\u53d8\u8f93\u51fa\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/03.%20graph%20neural%20networks/#_2","title":"\u6d88\u606f\u4f20\u9012\u6846\u67b6","text":"<ul> <li> <p>\u51e0\u4e4e\u6240\u6709\u7684GNN\u90fd\u9075\u5faa\u540c\u6837\u7684\u6a21\u5f0f\uff0c\u79f0\u4e3a\u6d88\u606f\u4f20\u9012\uff08\u4e5f\u79f0\u4e3a\u90bb\u57df\u805a\u5408\uff09\u3002\u8fd9\u4e2a\u60f3\u6cd5\u7b80\u5355\u800c\u4f18\u96c5\uff1a\u6bcf\u4e2a\u8282\u70b9\u901a\u8fc7\u4ece\u90bb\u5c45\u6536\u96c6\u4fe1\u606f\u6765\u66f4\u65b0\u5176\u8868\u793a\u3002</p> </li> <li> <p>\u5728\u6bcf\u4e2a\u5c42 \\(l\\)\uff0c\u6bcf\u4e2a\u8282\u70b9 \\(i\\) \u505a\u4e09\u4ef6\u4e8b\uff1a</p> <ol> <li>\u6d88\u606f\uff1a\u8282\u70b9 \\(i\\) \u7684\u6bcf\u4e2a\u90bb\u5c45 \\(j\\) \u57fa\u4e8e\u5176\u5f53\u524d\u7279\u5f81\u8ba1\u7b97\u4e00\u6761\u6d88\u606f \\(\\mathbf{m}_{j \\to i}\\)\u3002</li> <li>\u805a\u5408\uff1a\u8282\u70b9 \\(i\\) \u6536\u96c6\u6240\u6709\u4f20\u5165\u6d88\u606f\uff0c\u5e76\u4f7f\u7528\u7f6e\u6362\u4e0d\u53d8\u51fd\u6570\uff08\u6c42\u548c\u3001\u5747\u503c\u6216\u53d6\u6700\u5927\u503c\uff09\u5c06\u5b83\u4eec\u7ec4\u5408\u3002</li> <li>\u66f4\u65b0\uff1a\u8282\u70b9 \\(i\\) \u5c06\u805a\u5408\u7684\u6d88\u606f\u4e0e\u5176\u81ea\u8eab\u7279\u5f81\u7ed3\u5408\uff0c\u4ea7\u751f\u4e00\u4e2a\u65b0\u7684\u8868\u793a\u3002</li> </ol> </li> <li> <p>\u5f62\u5f0f\u4e0a\uff1a</p> </li> </ul> \\[\\mathbf{m}_i^{(l)} = \\bigoplus_{j \\in \\mathcal{N}(i)} \\phi^{(l)}\\left(\\mathbf{h}_i^{(l)}, \\mathbf{h}_j^{(l)}, \\mathbf{e}_{ij}\\right)\\] \\[\\mathbf{h}_i^{(l+1)} = \\psi^{(l)}\\left(\\mathbf{h}_i^{(l)}, \\mathbf{m}_i^{(l)}\\right)\\] <ul> <li>\u5176\u4e2d \\(\\mathcal{N}(i)\\) \u662f\u8282\u70b9 \\(i\\) \u7684\u90bb\u5c45\u96c6\u5408\uff0c\\(\\bigoplus\\) \u662f\u4e00\u4e2a\u7f6e\u6362\u4e0d\u53d8\u7684\u805a\u5408\u64cd\u4f5c\uff08\u6c42\u548c\u3001\u5747\u503c\u3001\u53d6\u6700\u5927\u503c\uff09\uff0c\\(\\phi\\) \u662f\u6d88\u606f\u51fd\u6570\uff0c\\(\\psi\\) \u662f\u66f4\u65b0\u51fd\u6570\uff0c\\(\\mathbf{e}_{ij}\\) \u662f\u53ef\u9009\u7684\u8fb9\u7279\u5f81\u3002</li> </ul> <p></p> <ul> <li> <p>\u805a\u5408\u64cd\u4f5c \\(\\bigoplus\\) \u5fc5\u987b\u662f\u7f6e\u6362\u4e0d\u53d8\u7684\uff08\u90bb\u5c45\u5904\u7406\u7684\u987a\u5e8f\u65e0\u5173\u7d27\u8981\uff09\uff0c\u4ee5\u786e\u4fdd\u6574\u4e2a\u51fd\u6570\u662f\u7f6e\u6362\u7b49\u53d8\u7684\u3002\u8fd9\u76f4\u63a5\u5b9e\u73b0\u4e86\u6587\u4ef61\u4e2d\u7684\u5bf9\u79f0\u6027\u539f\u7406\u3002</p> </li> <li> <p>\u7ecf\u8fc7 \\(k\\) \u5c42\u6d88\u606f\u4f20\u9012\u540e\uff0c\u6bcf\u4e2a\u8282\u70b9\u7684\u8868\u793a\u7f16\u7801\u4e86\u5176 \\(k\\) \u8df3\u90bb\u57df\u7684\u4fe1\u606f\uff1a\u6240\u6709\u5728 \\(k\\) \u6761\u8fb9\u5185\u53ef\u8fbe\u7684\u8282\u70b9\u3002\u7b2c1\u5c42\u770b\u5230\u76f4\u63a5\u90bb\u5c45\uff0c\u7b2c2\u5c42\u770b\u5230\u90bb\u5c45\u7684\u90bb\u5c45\uff0c\u4f9d\u6b64\u7c7b\u63a8\u3002\u8fd9\u5c31\u662f\u5c40\u90e8\u4fe1\u606f\u4f20\u64ad\u4ee5\u5efa\u7acb\u5168\u5c40\u7406\u89e3\u7684\u65b9\u5f0f\u3002</p> </li> <li> <p>GNN\u7684\u611f\u53d7\u91ce\u968f\u6df1\u5ea6\u589e\u957f\uff0c\u5c31\u50cfCNN\u7684\u611f\u53d7\u91ce\u968f\u5c42\u6570\u589e\u957f\u4e00\u6837\uff08\u7b2c8\u7ae0\uff09\u3002\u4f46\u4e0e\u89c4\u5219\u7f51\u683c\u4e0a\u7684CNN\u4e0d\u540c\uff0c\u611f\u53d7\u91ce\u7684\u5f62\u72b6\u6839\u636e\u56fe\u62d3\u6251\u7ed3\u6784\u5728\u6bcf\u4e2a\u8282\u70b9\u4e0a\u6709\u6240\u4e0d\u540c\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/03.%20graph%20neural%20networks/#gcn","title":"\u56fe\u5377\u79ef\u7f51\u7edc\uff08GCN\uff09","text":"<ul> <li> <p>GCN\uff08Kipf &amp; Welling\uff0c2017\uff09\u662f\u57fa\u7840\u6027\u7684GNN\u67b6\u6784\u3002\u5b83\u5c06\u8c31\u57df\u56fe\u5377\u79ef\uff08\u6765\u81ea\u6587\u4ef62\uff09\u7b80\u5316\u4e3a\u4e00\u4e2a\u4f18\u96c5\u3001\u9ad8\u6548\u7684\u516c\u5f0f\u3002</p> </li> <li> <p>\u4ece\u8c31\u57df\u5377\u79ef \\(g_\\theta \\star \\mathbf{x} = U \\, \\text{diag}(\\hat{g}_\\theta) \\, U^T \\mathbf{x}\\) \u51fa\u53d1\uff0cKipf\u548cWelling\u7528\u4e00\u9636\u5207\u6bd4\u96ea\u592b\u591a\u9879\u5f0f\u8fd1\u4f3c\u8c31\u57df\u6ee4\u6ce2\u5668\uff0c\u8fd9\u5b8c\u5168\u907f\u514d\u4e86\u8ba1\u7b97\u7279\u5f81\u5206\u89e3\u3002\u7b80\u5316\u540e\uff0c\u9010\u5c42\u66f4\u65b0\u53d8\u4e3a\uff1a</p> </li> </ul> \\[H^{(l+1)} = \\sigma\\left(\\hat{A} H^{(l)} W^{(l)}\\right)\\] <ul> <li> <p>\u5176\u4e2d\uff1a</p> <ul> <li>\\(H^{(l)} \\in \\mathbb{R}^{n \\times d}\\) \u662f\u7b2c \\(l\\) \u5c42\u7684\u8282\u70b9\u7279\u5f81\u77e9\u9635</li> <li>\\(W^{(l)} \\in \\mathbb{R}^{d \\times d'}\\) \u662f\u53ef\u5b66\u4e60\u7684\u6743\u91cd\u77e9\u9635</li> <li>\\(\\hat{A} = \\tilde{D}^{-1/2} \\tilde{A} \\tilde{D}^{-1/2}\\) \u662f\u5e26\u81ea\u73af\u7684\u5bf9\u79f0\u5f52\u4e00\u5316\u90bb\u63a5\u77e9\u9635</li> <li>\\(\\tilde{A} = A + I\\) \u6dfb\u52a0\u4e86\u81ea\u73af\uff08\u56e0\u6b64\u6bcf\u4e2a\u8282\u70b9\u4e5f\u63a5\u6536\u81ea\u5df1\u7684\u6d88\u606f\uff09</li> <li>\\(\\tilde{D}\\) \u662f \\(\\tilde{A}\\) \u7684\u5ea6\u77e9\u9635</li> <li>\\(\\sigma\\) \u662f\u4e00\u4e2a\u975e\u7ebf\u6027\u6fc0\u6d3b\u51fd\u6570\uff08ReLU\uff0c\u5982\u7b2c6\u7ae0\u6240\u8ff0\uff09</li> </ul> </li> <li> <p>\u77e9\u9635\u4e58\u6cd5 \\(\\hat{A} H^{(l)}\\) \u662f\u805a\u5408\u6b65\u9aa4\uff1a\u5bf9\u4e8e\u6bcf\u4e2a\u8282\u70b9\uff0c\u5b83\u8ba1\u7b97\u5176\u90bb\u5c45\u7279\u5f81\uff08\u52a0\u4e0a\u81ea\u8eab\u7279\u5f81\uff0c\u901a\u8fc7\u81ea\u73af\uff09\u7684\u52a0\u6743\u5e73\u5747\u3002\u6743\u91cd\u77e9\u9635 \\(W^{(l)}\\) \u662f\u53ef\u5b66\u4e60\u7684\u53d8\u6362\uff0c\u5728\u6240\u6709\u8282\u70b9\u95f4\u5171\u4eab\u3002\u6fc0\u6d3b\u51fd\u6570\u589e\u52a0\u4e86\u975e\u7ebf\u6027\u3002</p> </li> <li> <p>\u8fd9\u975e\u5e38\u7b80\u5355\uff1a\u5b83\u53ea\u662f\u77e9\u9635\u4e58\u6cd5\u540e\u63a5\u4e00\u4e2a\u5b66\u4e60\u5230\u7684\u7ebf\u6027\u6620\u5c04\u548c\u6fc0\u6d3b\u51fd\u6570\u3002\u6574\u4e2aGCN\u5c42\u53ef\u4ee5\u7528\u4e00\u884c\u4ee3\u7801\u5b9e\u73b0\u3002\u901a\u8fc7 \\(\\tilde{D}^{-1/2}\\) \u7684\u5f52\u4e00\u5316\u9632\u6b62\u5177\u6709\u8bb8\u591a\u90bb\u5c45\u7684\u8282\u70b9\u5360\u4e3b\u5bfc\u5730\u4f4d\uff1a\u9ad8\u5ea6\u8282\u70b9\u7684\u6d88\u606f\u88ab\u6309\u6bd4\u4f8b\u7f29\u5c0f\u3002</p> </li> <li> <p>\u5728\u6d88\u606f\u4f20\u9012\u6846\u67b6\u4e2d\uff0cGCN\u4f7f\u7528\uff1a</p> <ul> <li>\u6d88\u606f\uff1a\\(\\phi(\\mathbf{h}_j) = \\mathbf{h}_j\\)\uff08\u53ea\u53d1\u9001\u4f60\u7684\u7279\u5f81\uff09</li> <li>\u805a\u5408\uff1a\u5f52\u4e00\u5316\u548c\uff08\u6309\u5ea6\u52a0\u6743\uff09</li> <li>\u66f4\u65b0\uff1a\u7ebf\u6027\u53d8\u6362 + \u6fc0\u6d3b\u51fd\u6570</li> </ul> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/03.%20graph%20neural%20networks/#graphsage","title":"GraphSAGE","text":"<ul> <li> <p>GCN\u662f\u76f4\u63a8\u5f0f\u7684\uff1a\u5b83\u5728\u8bad\u7ec3\u65f6\u9700\u8981\u5b8c\u6574\u7684\u56fe\uff0c\u65e0\u6cd5\u5904\u7406\u65b0\u51fa\u73b0\u7684\u672a\u77e5\u8282\u70b9\u3002\u5982\u679c\u65b0\u7528\u6237\u52a0\u5165\u793e\u4ea4\u7f51\u7edc\uff0cGCN\u5fc5\u987b\u5bf9\u6574\u4e2a\u56fe\u91cd\u65b0\u8bad\u7ec3\u3002GraphSAGE\uff08Hamilton\u7b49\uff0c2017\uff09\u901a\u8fc7\u5f52\u7eb3\u5f0f\u65b9\u6cd5\u89e3\u51b3\u4e86\u8fd9\u4e2a\u95ee\u9898\u3002</p> </li> <li> <p>\u5173\u952e\u601d\u60f3\u662f\u90bb\u57df\u91c7\u6837\uff1a\u4e0d\u662f\u4f7f\u7528\u6240\u6709\u90bb\u5c45\uff0c\u800c\u662f\u91c7\u6837\u4e00\u4e2a\u56fa\u5b9a\u5927\u5c0f\u7684\u5b50\u96c6\u3002\u8fd9\u4f7f\u5f97\u8ba1\u7b97\u72ec\u7acb\u4e8e\u5b8c\u6574\u7684\u56fe\u7ed3\u6784\uff0c\u5e76\u5141\u8bb8\u63a8\u5e7f\u5230\u672a\u89c1\u8fc7\u7684\u8282\u70b9\u548c\u56fe\u3002</p> </li> <li> <p>\u8282\u70b9 \\(i\\) \u7684GraphSAGE\u66f4\u65b0\uff1a</p> </li> </ul> \\[\\mathbf{h}_i^{(l+1)} = \\sigma\\left(W^{(l)} \\cdot \\text{CONCAT}\\left(\\mathbf{h}_i^{(l)}, \\text{AGG}\\left(\\{\\mathbf{h}_j^{(l)} : j \\in \\mathcal{S}(i)\\}\\right)\\right)\\right)\\] <ul> <li> <p>\u5176\u4e2d \\(\\mathcal{S}(i)\\) \u662f\u4e00\u4e2a\u91c7\u6837\u7684\u90bb\u5c45\u5b50\u96c6\uff08\u4f8b\u5982\uff0c\u4ece500\u4e2a\u90bb\u5c45\u4e2d\u968f\u673a\u91c7\u683710\u4e2a\uff09\u3002CONCAT\u64cd\u4f5c\u663e\u5f0f\u5730\u5c06\u8282\u70b9\u81ea\u8eab\u7684\u7279\u5f81\u4e0e\u805a\u5408\u540e\u7684\u90bb\u5c45\u7279\u5f81\u5206\u5f00\uff0c\u8ba9\u7f51\u7edc\u5b66\u4e60\"\u81ea\u8eab\"\u548c\"\u90bb\u57df\"\u7684\u4e0d\u540c\u53d8\u6362\u3002</p> </li> <li> <p>GraphSAGE\u652f\u6301\u591a\u79cd\u805a\u5408\u51fd\u6570\uff1a</p> <ul> <li>\u5747\u503c\uff08Mean\uff09\uff1a\\(\\text{AGG} = \\frac{1}{|\\mathcal{S}|} \\sum_{j \\in \\mathcal{S}} \\mathbf{h}_j\\)\uff08\u7b80\u5355\uff0c\u6709\u6548\uff09</li> <li>LSTM\uff1a\u5c06\u91c7\u6837\u7684\u90bb\u5c45\u901a\u8fc7LSTM\uff08\u4f46\u8fd9\u5f15\u5165\u4e86\u987a\u5e8f\u4f9d\u8d56\uff0c\u4e00\u5b9a\u7a0b\u5ea6\u4e0a\u8fdd\u53cd\u4e86\u7f6e\u6362\u4e0d\u53d8\u6027\uff09</li> <li>\u6c60\u5316\uff08Pool\uff09\uff1a\\(\\text{AGG} = \\max(\\{\\sigma(W_{\\text{pool}} \\mathbf{h}_j + \\mathbf{b})\\})\\)\uff08\u975e\u7ebf\u6027\u53d8\u6362\u540e\u53d6\u6700\u5927\u503c\uff09</li> </ul> </li> <li> <p>\u91c7\u6837\u7b56\u7565\u4f7fGraphSAGE\u53ef\u6269\u5c55\u5230\u975e\u5e38\u5927\u7684\u56fe\u3002\u8bad\u7ec3\u4f7f\u7528\u8282\u70b9\u7684\u5c0f\u6279\u91cf\uff1a\u5bf9\u4e8e\u6bcf\u4e2a\u76ee\u6807\u8282\u70b9\uff0c\u5728\u7b2c1\u5c42\u91c7\u6837 \\(k_1\\) \u4e2a\u90bb\u5c45\uff0c\u7136\u540e\u5bf9\u4e8e\u5176\u4e2d\u6bcf\u4e2a\u90bb\u5c45\u5728\u7b2c2\u5c42\u91c7\u6837 \\(k_2\\) \u4e2a\u90bb\u5c45\u3002\u4f7f\u7528 \\(k_1 = k_2 = 10\\) \u548c2\u5c42\uff0c\u6bcf\u4e2a\u8282\u70b9\u7684\u8ba1\u7b97\u6811\u6700\u591a\u6709 \\(10 \\times 10 = 100\\) \u4e2a\u8282\u70b9\uff0c\u4e0e\u56fe\u7684\u5927\u5c0f\u65e0\u5173\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/03.%20graph%20neural%20networks/#gin","title":"\u56fe\u540c\u6784\u7f51\u7edc\uff08GIN\uff09","text":"<ul> <li> <p>\u4e0d\u540c\u7684GNN\u67b6\u6784\u5177\u6709\u4e0d\u540c\u7684\u8868\u8fbe\u80fd\u529b\uff1a\u5b83\u4eec\u533a\u5206\u7ed3\u6784\u4e0d\u540c\u4e4b\u56fe\u7684\u80fd\u529b\u3002GCN\u548cGraphSAGE\u867d\u7136\u5728\u5b9e\u8df5\u4e2d\u6709\u6548\uff0c\u4f46\u7406\u8bba\u4e0a\u5728\u80fd\u533a\u5206\u54ea\u4e9b\u56fe\u7ed3\u6784\u65b9\u9762\u662f\u53d7\u9650\u7684\u3002</p> </li> <li> <p>\u8861\u91cfGNN\u8868\u8fbe\u80fd\u529b\u7684\u7406\u8bba\u5de5\u5177\u662fWeisfeiler-Lehman\uff08WL\uff09\u6d4b\u8bd5\uff0c\u8fd9\u662f\u4e00\u4e2a\u7528\u4e8e\u6d4b\u8bd5\u56fe\u540c\u6784\uff08\u4e24\u4e2a\u56fe\u662f\u5426\u7ed3\u6784\u76f8\u540c\uff09\u7684\u7ecf\u5178\u7b97\u6cd5\u3002WL\u6d4b\u8bd5\u901a\u8fc7\u5c06\u6bcf\u4e2a\u8282\u70b9\u7684\u6807\u7b7e\u4e0e\u5176\u90bb\u5c45\u6807\u7b7e\u7684\u591a\u91cd\u96c6\u4e00\u8d77\u54c8\u5e0c\uff0c\u8fed\u4ee3\u5730\u7cbe\u70bc\u8282\u70b9\u6807\u7b7e\u3002</p> </li> <li> <p>GIN\uff08Xu\u7b49\uff0c2019\uff09\u88ab\u8bbe\u8ba1\u4e3a\u5177\u6709\u4e0eWL\u6d4b\u8bd5\u540c\u7b49\u7684\u8868\u8fbe\u80fd\u529b\uff0c\u4f7f\u5176\u6210\u4e3a\u6700\u5f3a\u5927\u7684\u6d88\u606f\u4f20\u9012GNN\uff08\u5728\u6d88\u606f\u4f20\u9012\u7684\u7406\u8bba\u9650\u5236\u5185\uff09\u3002\u5173\u952e\u6d1e\u5bdf\uff1a\u805a\u5408\u51fd\u6570\u5fc5\u987b\u5728\u591a\u91cd\u96c6\u4e0a\u662f\u5355\u5c04\u7684\uff08\u4e0d\u540c\u7684\u90bb\u5c45\u7279\u5f81\u591a\u91cd\u96c6\u5fc5\u987b\u4ea7\u751f\u4e0d\u540c\u7684\u805a\u5408\u503c\uff09\u3002</p> </li> <li> <p>\u6c42\u548c\u805a\u5408\u5728\u591a\u91cd\u96c6\u4e0a\u662f\u5355\u5c04\u7684\uff08\u6c42\u548c \\(\\{1, 1, 2\\}\\) \u5f97\u52304\uff0c\u800c \\(\\{1, 3\\}\\) \u4e5f\u5f97\u52304\uff0c\u4f46\u5728\u5177\u6709\u8db3\u591f\u7ef4\u5ea6\u7684\u7279\u5f81\u5411\u91cf\u4e0a\uff0c\u4e0d\u540c\u591a\u91cd\u96c6\u7684\u548c\u4e00\u822c\u800c\u8a00\u662f\u4e0d\u540c\u7684\uff09\u3002\u5747\u503c\u548c\u53d6\u6700\u5927\u503c\u4e0d\u662f\u5355\u5c04\u7684\uff1a\u5747\u503c\u65e0\u6cd5\u533a\u5206 \\(\\{1, 1\\}\\) \u548c \\(\\{2, 2\\}\\)\uff0c\u53d6\u6700\u5927\u503c\u65e0\u6cd5\u533a\u5206 \\(\\{1, 2, 3\\}\\) \u548c \\(\\{1, 1, 3\\}\\)\u3002</p> </li> <li> <p>GIN\u66f4\u65b0\uff1a</p> </li> </ul> \\[\\mathbf{h}_i^{(l+1)} = \\text{MLP}^{(l)}\\left((1 + \\epsilon^{(l)}) \\cdot \\mathbf{h}_i^{(l)} + \\sum_{j \\in \\mathcal{N}(i)} \\mathbf{h}_j^{(l)}\\right)\\] <ul> <li>\u5176\u4e2d \\(\\epsilon\\) \u662f\u4e00\u4e2a\u53ef\u5b66\u4e60\u7684\u6807\u91cf\uff08\u6216\u56fa\u5b9a\u4e3a0\uff09\uff0cMLP\u63d0\u4f9b\u975e\u7ebf\u6027\u3001\u5355\u5c04\u7684\u6620\u5c04\u3002\u6c42\u548c\u805a\u5408\u4fdd\u7559\u4e86\u591a\u91cd\u96c6\u7ed3\u6784\uff0cMLP\u53ef\u4ee5\u5b66\u4f1a\u533a\u5206\u4efb\u610f\u4e24\u4e2a\u4e0d\u540c\u7684\u805a\u5408\u503c\u3002</li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/03.%20graph%20neural%20networks/#_3","title":"\u8fc7\u5e73\u6ed1","text":"<ul> <li>GNN\u7684\u4e00\u4e2a\u4e3b\u8981\u6311\u6218\u662f\u8fc7\u5e73\u6ed1\uff1a\u968f\u7740\u5c42\u6570\u589e\u52a0\uff0c\u6240\u6709\u8282\u70b9\u8868\u793a\u6536\u655b\u5230\u76f8\u540c\u7684\u503c\uff0c\u5931\u53bb\u533a\u5206\u4e0d\u540c\u8282\u70b9\u7684\u80fd\u529b\u3002</li> </ul> <ul> <li> <p>\u5176\u673a\u5236\u662f\u76f4\u89c2\u7684\u3002\u6bcf\u4e2a\u6d88\u606f\u4f20\u9012\u5c42\u5c06\u8282\u70b9\u7684\u7279\u5f81\u4e0e\u5176\u90bb\u5c45\u7684\u7279\u5f81\u8fdb\u884c\u5e73\u5747\u3002\u7ecf\u8fc7\u591a\u8f6e\u5e73\u5747\u540e\uff0c\u6bcf\u4e2a\u8282\u70b9\u5df2\u7ecf\"\u770b\u5230\"\uff08\u5e76\u6df7\u5408\u4e86\uff09\u5176\u8fde\u901a\u5206\u91cf\u4e2d\u7684\u6bcf\u4e2a\u5176\u4ed6\u8282\u70b9\u3002\u8fd9\u4e9b\u7279\u5f81\u53d8\u6210\u4e86\u7edf\u4e00\u7684\u5e73\u5747\u503c\uff0c\u76f8\u5f53\u4e8e\u5c06\u56fe\u50cf\u6a21\u7cca\u592a\u591a\u6b21\u76f4\u5230\u53d8\u6210\u7eaf\u8272\u7684\u56fe\u7c7b\u6bd4\u3002</p> </li> <li> <p>\u5f62\u5f0f\u4e0a\uff0c\u91cd\u590d\u5e94\u7528\u5f52\u4e00\u5316\u90bb\u63a5\u77e9\u9635 \\(\\hat{A}\\) \u6536\u655b\u5230\u4e00\u4e2a\u79e9\u4e3a1\u7684\u77e9\u9635\uff08\u6bcf\u4e00\u884c\u90fd\u53d8\u5f97\u4e0e\u56fe\u4e0a\u968f\u673a\u6e38\u8d70\u7684\u5e73\u7a33\u5206\u5e03\u6210\u6b63\u6bd4\uff09\u3002\u8fd9\u4e0e\u5e42\u8fed\u4ee3\u6536\u655b\u5230\u4e3b\u7279\u5f81\u5411\u91cf\u7684\u8fc7\u7a0b\u76f8\u540c\uff08\u7b2c2\u7ae0\uff09\u3002</p> </li> <li> <p>\u8fc7\u5e73\u6ed1\u5c06GNN\u9650\u5236\u5728\u5f88\u6d45\u7684\u6df1\u5ea6\uff08\u901a\u5e382-4\u5c42\uff09\uff0c\u800cCNN\u548cTransformer\u53ef\u4ee5\u4ece\u51e0\u5341\u6216\u6570\u767e\u5c42\u4e2d\u53d7\u76ca\u3002\u8fd9\u610f\u5473\u7740\u6bcf\u4e2a\u8282\u70b9\u53ea\u80fd\u770b\u5230\u6709\u9650\u7684\u90bb\u57df\uff0c\u8fd9\u5bf9\u4e8e\u9700\u8981\u957f\u8ddd\u79bb\u4fe1\u606f\u7684\u4efb\u52a1\u6765\u8bf4\u662f\u6709\u95ee\u9898\u7684\u3002</p> </li> <li> <p>\u7f13\u89e3\u65b9\u6cd5\u5305\u62ec\uff1a</p> <ul> <li>\u6b8b\u5dee\u8fde\u63a5\uff08\u6765\u81eaResNet\uff0c\u7b2c8\u7ae0\uff09\uff1a\\(\\mathbf{h}_i^{(l+1)} = \\mathbf{h}_i^{(l+1)} + \\mathbf{h}_i^{(l)}\\)\uff0c\u4fdd\u7559\u6765\u81ea\u8f83\u65e9\u5c42\u7684\u4fe1\u606f\u3002</li> <li>\u8df3\u8dc3\u77e5\u8bc6\uff08Jumping Knowledge\uff09\uff1a\u62fc\u63a5\u6216\u6ce8\u610f\u529b\u6c60\u5316\u6765\u81ea\u6240\u6709\u5c42\u7684\u8868\u793a\uff0c\u800c\u4e0d\u4ec5\u4ec5\u662f\u6700\u540e\u4e00\u5c42\u3002</li> <li>DropEdge\uff1a\u8bad\u7ec3\u671f\u95f4\u968f\u673a\u79fb\u9664\u8fb9\uff0c\u51cf\u7f13\u4fe1\u606f\u4f20\u64ad\u3002</li> <li>\u56feTransformer\uff08Graph Transformer\uff09\uff08\u6587\u4ef64\uff09\uff1a\u7528\u5168\u5c40\u6ce8\u610f\u529b\u7ed5\u8fc7\u5c40\u90e8\u6d88\u606f\u4f20\u9012\u7684\u74f6\u9888\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/03.%20graph%20neural%20networks/#_4","title":"\u56fe\u6c60\u5316","text":"<ul> <li> <p>\u5bf9\u4e8e\u56fe\u7ea7\u522b\u4efb\u52a1\uff08\u9884\u6d4b\u6574\u4e2a\u56fe\u7684\u5c5e\u6027\uff0c\u5982\u5206\u5b50\u7684\u6bd2\u6027\uff09\uff0c\u6211\u4eec\u9700\u8981\u5c06\u6240\u6709\u8282\u70b9\u8868\u793a\u6298\u53e0\u6210\u4e00\u4e2a\u5355\u4e00\u7684\u56fe\u7ea7\u522b\u5411\u91cf\u3002\u8fd9\u5c31\u662f\u56fe\u6c60\u5316\uff0c\u662fCNN\u4e2d\u5168\u5c40\u5e73\u5747\u6c60\u5316\u7684\u56fe\u7c7b\u6bd4\uff08\u7b2c8\u7ae0\uff09\u3002</p> </li> <li> <p>\u6700\u7b80\u5355\u7684\u65b9\u6cd5\u662f\u8bfb\u51fa\uff08readout\uff09\uff1a\u5bf9\u6240\u6709\u8282\u70b9\u7279\u5f81\u5e94\u7528\u4e00\u4e2a\u7f6e\u6362\u4e0d\u53d8\u51fd\u6570\uff1a</p> </li> </ul> \\[\\mathbf{h}_G = \\text{READOUT}(\\{\\mathbf{h}_i^{(L)} : i \\in V\\}) = \\sum_i \\mathbf{h}_i^{(L)} \\quad \\text{\u6216} \\quad \\frac{1}{|V|} \\sum_i \\mathbf{h}_i^{(L)} \\quad \\text{\u6216} \\quad \\max_i \\mathbf{h}_i^{(L)}\\] <ul> <li> <p>\u8fd9\u5c31\u662f\u6587\u4ef61\u4e2d\u7684DeepSets\u805a\u5408\uff0c\u5e94\u7528\u4e8e\u6700\u7ec8\u7684GNN\u5c42\u4e4b\u540e\u3002\u6c42\u548c\u4fdd\u7559\u4e86\u5927\u5c0f\u4fe1\u606f\uff08\u4e00\u4e2a\u6709100\u4e2a\u8282\u70b9\u7684\u56fe\u4f1a\u6bd4\u53ea\u670910\u4e2a\u8282\u70b9\u7684\u56fe\u5177\u6709\u66f4\u5927\u7684\u548c\uff09\uff0c\u800c\u5747\u503c\u5bf9\u5927\u5c0f\u8fdb\u884c\u4e86\u5f52\u4e00\u5316\u3002</p> </li> <li> <p>\u5206\u5c42\u6c60\u5316\u9010\u6b65\u7c97\u5316\u56fe\uff0c\u6a21\u4effCNN\u9010\u6b65\u4e0b\u91c7\u6837\u56fe\u50cf\u7684\u65b9\u5f0f\u3002\u5728\u6bcf\u4e2a\u5c42\u7ea7\uff0c\u8282\u70b9\u7ec4\u88ab\u5408\u5e76\u4e3a\"\u8d85\u8282\u70b9\"\uff1a</p> </li> <li> <p>DiffPool\uff08\u53ef\u5fae\u5206\u6c60\u5316\uff09\u5b66\u4e60\u4e00\u4e2a\u8f6f\u5206\u914d\u77e9\u9635 \\(S^{(l)} \\in \\mathbb{R}^{n_l \\times n_{l+1}}\\)\uff0c\u5c06\u6bcf\u4e2a\u8282\u70b9\u5206\u914d\u5230\u4e00\u4e2a\u7c07\uff1a</p> </li> </ul> \\[X^{(l+1)} = S^{(l)T} H^{(l)}, \\quad A^{(l+1)} = S^{(l)T} A^{(l)} S^{(l)}\\] <ul> <li> <p>\u5206\u914d\u77e9\u9635\u7531\u4e00\u4e2a\u5355\u72ec\u7684GNN\u9884\u6d4b\uff0c\u4f7f\u805a\u7c7b\u53d8\u5f97\u7aef\u5230\u7aef\u53ef\u5fae\u5206\u3002\u8fd9\u521b\u5efa\u4e86\u4e00\u4e2a\u5c42\u6b21\u7ed3\u6784\uff1a\u539f\u59cb\u56fe \u2192 \u5177\u6709\u8f83\u5c11\u8282\u70b9\u7684\u7c97\u5316\u56fe \u2192 \u66f4\u7c97\u7684\u56fe \u2192 \u5355\u4e2a\u8282\u70b9\uff08\u56fe\u8868\u793a\uff09\u3002</p> </li> <li> <p>TopKPool\u91c7\u7528\u66f4\u7b80\u5355\u7684\u65b9\u6cd5\uff1a\u4e3a\u6bcf\u4e2a\u8282\u70b9\u5b66\u4e60\u4e00\u4e2a\u6807\u91cf\u5206\u6570\uff0c\u4fdd\u7559\u5f97\u5206\u6700\u9ad8\u7684 top-\\(k\\) \u4e2a\u8282\u70b9\uff0c\u4e22\u5f03\u5176\u4f59\u8282\u70b9\u3002\u8fd9\u662f\u4e00\u79cd\u786c\u9009\u62e9\uff08\u800c\u975e\u8f6f\u5206\u914d\uff09\uff0c\u8ba1\u7b97\u4e0a\u6bd4DiffPool\u66f4\u5ec9\u4ef7\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/03.%20graph%20neural%20networks/#_5","title":"\u5f02\u6784\u56fe","text":"<ul> <li> <p>\u622a\u81f3\u76ee\u524d\u7684\u6240\u6709GNN\u90fd\u5047\u8bbe\u4e00\u4e2a\u540c\u6784\u56fe\uff1a\u4e00\u79cd\u8282\u70b9\u7c7b\u578b\uff0c\u4e00\u79cd\u8fb9\u7c7b\u578b\u3002\u4f46\u5927\u591a\u6570\u73b0\u5b9e\u4e16\u754c\u7684\u56fe\u662f\u5f02\u6784\u7684\uff1a\u591a\u79cd\u8282\u70b9\u7c7b\u578b\u548c\u591a\u79cd\u8fb9\u7c7b\u578b\u3002\u77e5\u8bc6\u56fe\u8c31\u6709\u4eba\u7269\u8282\u70b9\u3001\u7ec4\u7ec7\u8282\u70b9\u548c\u4f4d\u7f6e\u8282\u70b9\uff0c\u7531\"\u5de5\u4f5c\u4e8e\"\u3001\"\u51fa\u751f\u4e8e\"\u548c\"\u4f4d\u4e8e\"\u8fb9\u8fde\u63a5\u3002\u63a8\u8350\u7cfb\u7edf\u6709\u7528\u6237\u8282\u70b9\u548c\u7269\u54c1\u8282\u70b9\uff0c\u7531\"\u5df2\u8d2d\u4e70\"\u3001\"\u5df2\u6d4f\u89c8\"\u548c\"\u5df2\u8bc4\u4ef7\"\u8fb9\u8fde\u63a5\u3002</p> </li> <li> <p>\u5f02\u6784\u56fe\u6709\u4e00\u4e2a\u6a21\u5f0f\uff08\u4e5f\u79f0\u4e3a\u5143\u56fe\uff09\uff0c\u5b9a\u4e49\u4e86\u5141\u8bb8\u7684\u8282\u70b9\u7c7b\u578b\u548c\u8fb9\u7c7b\u578b\u3002\u6bcf\u4e2a\u8fb9\u7c7b\u578b\u8fde\u63a5\u7279\u5b9a\u7684\u6e90\u7c7b\u578b\u5230\u7279\u5b9a\u7684\u76ee\u6807\u7c7b\u578b\u3002\u4f8b\u5982\uff0c\"\u5de5\u4f5c\u4e8e\"\u8fde\u63a5 Person \u2192 Organisation\u3002</p> </li> <li> <p>\u5173\u7cfbGCN\uff08R-GCN\uff09\uff08Schlichtkrull\u7b49\uff0c2018\uff09\u901a\u8fc7\u4e3a\u6bcf\u79cd\u8fb9\u7c7b\u578b\u4f7f\u7528\u5355\u72ec\u7684\u6743\u91cd\u77e9\u9635\u6765\u5904\u7406\u5f02\u6784\u8fb9\uff1a</p> </li> </ul> \\[\\mathbf{h}_i^{(l+1)} = \\sigma\\left(\\sum_{r \\in \\mathcal{R}} \\sum_{j \\in \\mathcal{N}_r(i)} \\frac{1}{|\\mathcal{N}_r(i)|} W_r^{(l)} \\mathbf{h}_j^{(l)} + W_0^{(l)} \\mathbf{h}_i^{(l)}\\right)\\] <ul> <li> <p>\u5176\u4e2d \\(\\mathcal{R}\\) \u662f\u8fb9\u7c7b\u578b\u7684\u96c6\u5408\uff0c\\(\\mathcal{N}_r(i)\\) \u662f\u901a\u8fc7\u5173\u7cfb \\(r\\) \u8fde\u63a5\u5230\u8282\u70b9 \\(i\\) \u7684\u90bb\u5c45\u96c6\u5408\uff0c\\(W_r\\) \u662f\u5173\u7cfb \\(r\\) \u7279\u6709\u7684\u6743\u91cd\u77e9\u9635\u3002\u81ea\u8fde\u63a5 \\(W_0\\) \u5355\u72ec\u5904\u7406\u8282\u70b9\u81ea\u8eab\u7684\u7279\u5f81\u3002</p> </li> <li> <p>\u95ee\u9898\uff1a\u5f53\u5173\u7cfb\u7c7b\u578b\u5f88\u591a\u65f6\uff0c\u53c2\u6570\u6570\u91cf\u7206\u70b8\uff08\u6bcf\u79cd\u5173\u7cfb\u4e00\u4e2a \\(d \\times d\\) \u77e9\u9635\uff09\u3002R-GCN\u901a\u8fc7\u57fa\u5206\u89e3\u7f13\u89e3\u8fd9\u4e00\u95ee\u9898\uff1a\\(W_r = \\sum_{b=1}^{B} a_{rb} V_b\\)\uff0c\u5176\u4e2d \\(V_b\\) \u662f\u5171\u4eab\u7684\u57fa\u77e9\u9635\uff0c\\(a_{rb}\\) \u662f\u6bcf\u4e2a\u5173\u7cfb\u7684\u6807\u91cf\u7cfb\u6570\u3002\u8fd9\u7c7b\u4f3c\u4e8e\u4f4e\u79e9\u5206\u89e3\uff08\u7b2c2\u7ae0\uff09\uff1a\u5173\u7cfb\u7279\u5b9a\u7684\u77e9\u9635\u751f\u6d3b\u5728\u4e00\u4e2a\u4f4e\u7ef4\u5b50\u7a7a\u95f4\u4e2d\u3002</p> </li> <li> <p>\u5f02\u6784\u56fe\u8868Transformer\uff08HGT\uff09\uff08Hu\u7b49\uff0c2020\uff09\u5c06\u6ce8\u610f\u529b\u673a\u5236\u5e94\u7528\u4e8e\u5f02\u6784\u56fe\u3002\u5173\u952e\u6d1e\u5bdf\uff1a\u6ce8\u610f\u529b\u5e94\u540c\u65f6\u4f9d\u8d56\u4e8e\u8282\u70b9\u7c7b\u578b\u548c\u8fde\u63a5\u5b83\u4eec\u7684\u8fb9\u7c7b\u578b\u3002HGT\u4e3a\u67e5\u8be2\u3001\u952e\u548c\u503c\u4f7f\u7528\u7c7b\u578b\u7279\u5b9a\u7684\u6295\u5f71\u77e9\u9635\uff1a</p> </li> </ul> \\[\\text{Attention}(i, j) = \\left(W_{\\tau(i)}^Q \\mathbf{h}_i\\right)^T \\cdot \\frac{W_{\\phi(i,j)}^{\\text{ATT}}}{\\sqrt{d}} \\cdot \\left(W_{\\tau(j)}^K \\mathbf{h}_j\\right)\\] <ul> <li> <p>\u5176\u4e2d \\(\\tau(i)\\) \u662f\u8282\u70b9 \\(i\\) \u7684\u7c7b\u578b\uff0c\\(\\phi(i,j)\\) \u662f\u5b83\u4eec\u4e4b\u95f4\u7684\u8fb9\u7c7b\u578b\u3002\u8fd9\u786e\u4fdd\u4e86\u6a21\u578b\u5bf9\u4e0d\u540c\u7684\u5173\u7cfb\u7c7b\u578b\u4f7f\u7528\u4e0d\u540c\u7684\u6ce8\u610f\u529b\u6743\u91cd\uff1a\u4e00\u7bc7\u8bba\u6587\u5173\u6ce8\u5176\u4f5c\u8005\u65f6\uff0c\u5e94\u4f7f\u7528\u4e0e\u5173\u6ce8\u5176\u53c2\u8003\u6587\u732e\u65f6\u4e0d\u540c\u7684\u6ce8\u610f\u529b\u6743\u91cd\u3002</p> </li> <li> <p>\u57fa\u4e8e\u5143\u8def\u5f84\u7684\u65b9\u6cd5\u5b9a\u4e49\u901a\u8fc7\u6a21\u5f0f\u7684\u542b\u4e49\u8def\u5f84\uff08\u4f8b\u5982\uff0c\u4f5c\u8005 \u2192 \u8bba\u6587 \u2192 \u4f5c\u8005\u8868\u793a\u5408\u8457\u5173\u7cfb\uff09\uff0c\u5e76\u6cbf\u7740\u8fd9\u4e9b\u8def\u5f84\u805a\u5408\u4fe1\u606f\u3002HAN\uff08\u5f02\u6784\u56fe\u6ce8\u610f\u529b\u7f51\u7edc\uff09\u5728\u4e24\u4e2a\u5c42\u6b21\u5e94\u7528\u6ce8\u610f\u529b\uff1a\u5728\u6bcf\u4e2a\u5143\u8def\u5f84\u5185\uff08\u6cbf\u6b64\u8def\u5f84\u54ea\u4e9b\u90bb\u5c45\u91cd\u8981\uff1f\uff09\u548c\u8de8\u5143\u8def\u5f84\uff08\u54ea\u4e9b\u5173\u7cfb\u6a21\u5f0f\u91cd\u8981\uff1f\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/03.%20graph%20neural%20networks/#_6","title":"\u94fe\u63a5\u9884\u6d4b\u4e0e\u77e5\u8bc6\u56fe\u8c31\u8865\u5168","text":"<ul> <li> <p>\u94fe\u63a5\u9884\u6d4b\u63d0\u51fa\u7684\u95ee\u9898\u662f\uff1a\u7ed9\u5b9a\u73b0\u6709\u8fb9\uff0c\u54ea\u4e9b\u7f3a\u5931\u7684\u8fb9\u53ef\u80fd\u5b58\u5728\uff1f\u8fd9\u662f\u77e5\u8bc6\u56fe\u8c31\u8865\u5168\uff08\u9884\u6d4b\u7f3a\u5931\u7684\u4e8b\u5b9e\uff09\u3001\u63a8\u8350\uff08\u9884\u6d4b\u7528\u6237\u4f1a\u559c\u6b22\u54ea\u4e9b\u7269\u54c1\uff09\u548c\u793e\u4ea4\u7f51\u7edc\u5206\u6790\uff08\u9884\u6d4b\u672a\u6765\u7684\u53cb\u8c0a\uff09\u7684\u6838\u5fc3\u4efb\u52a1\u3002</p> </li> <li> <p>\u57fa\u4e8e\u5d4c\u5165\u7684\u65b9\u6cd5\u4e3a\u6bcf\u4e2a\u5b9e\u4f53\u5b66\u4e60\u4e00\u4e2a\u5411\u91cf\uff0c\u4e3a\u6bcf\u4e2a\u5173\u7cfb\u5b66\u4e60\u4e00\u4e2a\u53d8\u6362\uff0c\u7136\u540e\u901a\u8fc7\u5b9e\u4f53\u548c\u5173\u7cfb\u7684\u5339\u914d\u7a0b\u5ea6\u5bf9\u6f5c\u5728\u8fb9\u8fdb\u884c\u8bc4\u5206\uff1a</p> </li> <li> <p>TransE\u5c06\u5173\u7cfb\u5efa\u6a21\u4e3a\u5d4c\u5165\u7a7a\u95f4\u4e2d\u7684\u5e73\u79fb\uff1a\u5982\u679c \\((h, r, t)\\) \u662f\u4e00\u4e2a\u6709\u6548\u7684\u4e09\u5143\u7ec4\uff08\u5934\u5b9e\u4f53\uff0c\u5173\u7cfb\uff0c\u5c3e\u5b9e\u4f53\uff09\uff0c\u90a3\u4e48 \\(\\mathbf{h} + \\mathbf{r} \\approx \\mathbf{t}\\)\u3002\u8bc4\u5206\u51fd\u6570\u4e3a \\(f(h, r, t) = -\\|\\mathbf{h} + \\mathbf{r} - \\mathbf{t}\\|\\)\u3002\u76f4\u89c2\u5730\u8bf4\uff0c\u5173\u7cfb\u5411\u91cf\u5728\u5d4c\u5165\u7a7a\u95f4\u4e2d\u5c06\u5934\u5b9e\u4f53\"\u79fb\u52a8\"\u5230\u5c3e\u5b9e\u4f53\u3002</p> </li> <li> <p>RotatE\u5c06\u5173\u7cfb\u5efa\u6a21\u4e3a\u590d\u7a7a\u95f4\u4e2d\u7684\u65cb\u8f6c\uff1a\\(\\mathbf{t} = \\mathbf{h} \\circ \\mathbf{r}\\)\uff0c\u5176\u4e2d \\(\\circ\\) \u662f\u9010\u5143\u7d20\u590d\u6570\u4e58\u6cd5\uff0c\\(|\\mathbf{r}_i| = 1\\)\uff08\u5355\u4f4d\u590d\u6570\u5c31\u662f\u65cb\u8f6c\uff09\u3002\u8fd9\u53ef\u4ee5\u5efa\u6a21TransE\u65e0\u6cd5\u5904\u7406\u7684\u5bf9\u79f0\u6027\u3001\u53cd\u5bf9\u79f0\u6027\u3001\u53cd\u8f6c\u548c\u590d\u5408\u6a21\u5f0f\u3002</p> </li> <li> <p>ComplEx\u4f7f\u7528\u590d\u6570\u503c\u5d4c\u5165\u548c\u57c3\u5c14\u7c73\u7279\u70b9\u79ef\uff0c\u4f7f\u5176\u80fd\u591f\u5efa\u6a21\u975e\u5bf9\u79f0\u5173\u7cfb\uff08\u5982\u679cA\u662fB\u7684\u8001\u677f\uff0cB\u4e0d\u662fA\u7684\u8001\u677f\uff09\u3002</p> </li> <li> <p>\u57fa\u4e8eGNN\u7684\u94fe\u63a5\u9884\u6d4b\u901a\u8fc7\u6d88\u606f\u4f20\u9012\u8ba1\u7b97\u8282\u70b9\u5d4c\u5165\uff0c\u7136\u540e\u4f7f\u7528\u7aef\u70b9\u5d4c\u5165\u5bf9\u8fb9\u8fdb\u884c\u8bc4\u5206\u3002\u8fd9\u7ed3\u5408\u4e86GNN\u7684\u7ed3\u6784\u63a8\u7406\u80fd\u529b\u548c\u5d4c\u5165\u65b9\u6cd5\u7684\u5173\u7cfb\u5efa\u6a21\u80fd\u529b\u3002GNN\u7f16\u7801\u5668\u6355\u83b7\u4e86\u5355\u5d4c\u5165\u65b9\u6cd5\u6240\u9057\u6f0f\u7684\u591a\u8df3\u90bb\u57df\u7ed3\u6784\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/03.%20graph%20neural%20networks/#_7","title":"\u4efb\u52a1\u7c7b\u578b","text":"<ul> <li> <p>GNN\u89e3\u51b3\u4e09\u7c7b\u4efb\u52a1\uff1a</p> </li> <li> <p>\u8282\u70b9\u7ea7\u522b\u4efb\u52a1\uff1a\u4e3a\u6bcf\u4e2a\u8282\u70b9\u9884\u6d4b\u4e00\u4e2a\u5c5e\u6027\u3002\u793a\u4f8b\uff1a\u5bf9\u793e\u4ea4\u7f51\u7edc\u4e2d\u7684\u7528\u6237\u8fdb\u884c\u5206\u7c7b\uff08\u673a\u5668\u4eba\u8fd8\u662f\u4eba\u7c7b\uff09\uff0c\u9884\u6d4b\u76f8\u4e92\u4f5c\u7528\u7f51\u7edc\u4e2d\u6bcf\u4e2a\u86cb\u767d\u8d28\u7684\u529f\u80fd\uff0c\u534a\u76d1\u7763\u8282\u70b9\u5206\u7c7b\uff08\u6807\u8bb0\u5c11\u6570\u8282\u70b9\uff0c\u9884\u6d4b\u5176\u4f59\u8282\u70b9\uff09\u3002\u8f93\u51fa\u662f\u8282\u70b9\u5d4c\u5165 \\(\\mathbf{h}_i^{(L)}\\) \u7ecf\u8fc7\u4e00\u4e2a\u5206\u7c7b\u5668\u3002</p> </li> <li> <p>\u8fb9\u7ea7\u522b\u4efb\u52a1\uff1a\u4e3a\u6bcf\u6761\u8fb9\u9884\u6d4b\u4e00\u4e2a\u5c5e\u6027\u6216\u9884\u6d4b\u8fb9\u662f\u5426\u5b58\u5728\u3002\u793a\u4f8b\uff1a\u94fe\u63a5\u9884\u6d4b\uff08\u8fd9\u4e24\u4e2a\u7528\u6237\u4f1a\u6210\u4e3a\u670b\u53cb\u5417\uff1f\uff09\uff0c\u77e5\u8bc6\u56fe\u8c31\u8865\u5168\uff08\u8fd9\u4e2a\u5173\u7cfb\u5728\u8fd9\u4e9b\u5b9e\u4f53\u95f4\u6210\u7acb\u5417\uff1f\uff09\uff0c\u836f\u7269-\u836f\u7269\u76f8\u4e92\u4f5c\u7528\u9884\u6d4b\u3002\u8f93\u51fa\u901a\u5e38\u4f7f\u7528\u4e24\u4e2a\u7aef\u70b9\u8282\u70b9\u7684\u5d4c\u5165\uff1a\\(\\hat{y}_{ij} = f(\\mathbf{h}_i, \\mathbf{h}_j)\\)\uff0c\u5176\u4e2d \\(f\\) \u662f\u70b9\u79ef\u3001\u62fc\u63a5+MLP\u6216\u5176\u4ed6\u7ec4\u5408\u3002</p> </li> <li> <p>\u56fe\u7ea7\u522b\u4efb\u52a1\uff1a\u4e3a\u6574\u4e2a\u56fe\u9884\u6d4b\u4e00\u4e2a\u5c5e\u6027\u3002\u793a\u4f8b\uff1a\u5206\u5b50\u6027\u8d28\u9884\u6d4b\uff08\u8fd9\u4e2a\u5206\u5b50\u6709\u6bd2\u5417\uff1f\uff09\uff0c\u56fe\u5206\u7c7b\uff08\u8fd9\u4e2a\u793e\u4ea4\u7f51\u7edc\u662f\u673a\u5668\u4eba\u7f51\u7edc\u5417\uff1f\uff09\uff0c\u56fe\u751f\u6210\uff08\u8bbe\u8ba1\u4e00\u4e2a\u5177\u6709\u671f\u671b\u6027\u8d28\u7684\u5206\u5b50\uff09\u3002\u8f93\u51fa\u4f7f\u7528\u56fe\u6c60\u5316\u4ea7\u751f \\(\\mathbf{h}_G\\)\uff0c\u7136\u540e\u8fdb\u884c\u5206\u7c7b\u6216\u56de\u5f52\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/03.%20graph%20neural%20networks/#colabnotebook","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216notebook\uff09","text":"<ol> <li> <p>\u4f7f\u7528\u5f52\u4e00\u5316\u90bb\u63a5\u77e9\u9635\u4ece\u5934\u5b9e\u73b0\u4e00\u4e2a\u5355\u5c42GCN\u3002\u5e94\u7528\u4e8e\u4e00\u4e2a\u5c0f\u578b\u56fe\uff0c\u89c2\u5bdf\u8282\u70b9\u7279\u5f81\u5982\u4f55\u88ab\u5e73\u6ed1\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\n# \u56fe\uff1a5\u4e2a\u8282\u70b9\uff0c\u7b80\u5355\u94fe\u5e26\u5206\u652f\nA = jnp.array([[0, 1, 0, 0, 0],\n               [1, 0, 1, 0, 0],\n               [0, 1, 0, 1, 1],\n               [0, 0, 1, 0, 0],\n               [0, 0, 1, 0, 0]], dtype=float)\n\n# \u6dfb\u52a0\u81ea\u73af\nA_hat = A + jnp.eye(5)\nD_hat = jnp.diag(A_hat.sum(axis=1))\nD_inv_sqrt = jnp.diag(1.0 / jnp.sqrt(A_hat.sum(axis=1)))\nA_norm = D_inv_sqrt @ A_hat @ D_inv_sqrt\n\n# \u8282\u70b9\u7279\u5f81\uff1aone-hot \u5355\u4f4d\u9635\nH = jnp.eye(5)\n\n# \u6743\u91cd\u77e9\u9635\uff08\u968f\u673a\u521d\u59cb\u5316\uff09\nrng = jax.random.PRNGKey(0)\nW = jax.random.normal(rng, (5, 3)) * 0.5\n\n# GCN\u5c42\uff1aH' = ReLU(A_norm @ H @ W)\nH_new = jax.nn.relu(A_norm @ H @ W)\n\nprint(\"\u539f\u59cb\u7279\u5f81\uff08one-hot\uff09:\")\nprint(H)\nprint(\"\\n\u7ecf\u8fc7GCN\u5c42\u540e:\")\nprint(jnp.round(H_new, 3))\nprint(\"\\n\u6ce8\u610f\uff1a\u8fde\u63a5\u7684\u8282\u70b9\u73b0\u5728\u5177\u6709\u76f8\u4f3c\u7684\u8868\u793a\")\n</code></pre></p> </li> <li> <p>\u5b9e\u73b0\u5177\u6709\u6c42\u548c\u805a\u5408\uff08GIN\u98ce\u683c\uff09\u548c\u5747\u503c\u805a\u5408\uff08GCN\u98ce\u683c\uff09\u7684\u6d88\u606f\u4f20\u9012\u3002\u5c55\u793a\u6c42\u548c\u80fd\u533a\u5206\u5747\u503c\u65e0\u6cd5\u533a\u5206\u7684\u591a\u91cd\u96c6\u3002 <pre><code>import jax.numpy as jnp\n\n# \u4e24\u4e2a\u5177\u6709\u76f8\u540c\u5747\u503c\u7684\u4e0d\u540c\u90bb\u5c45\u591a\u91cd\u96c6\n# \u8282\u70b9A\uff1a\u90bb\u5c45\u7279\u5f81\u4e3a [1, 1, 1, 1]  \uff08\u56db\u4e2a\u90bb\u5c45\uff0c\u90fd\u662f1\uff09\n# \u8282\u70b9B\uff1a\u90bb\u5c45\u7279\u5f81\u4e3a [2, 2]          \uff08\u4e24\u4e2a\u90bb\u5c45\uff0c\u90fd\u662f2\uff09\n\nneighbours_A = jnp.array([[1.0], [1.0], [1.0], [1.0]])\nneighbours_B = jnp.array([[2.0], [2.0]])\n\n# \u5747\u503c\u805a\u5408\nmean_A = neighbours_A.mean(axis=0)\nmean_B = neighbours_B.mean(axis=0)\nprint(f\"\u5747\u503c A: {mean_A}, \u5747\u503c B: {mean_B}, \u76f8\u540c: {jnp.allclose(mean_A, mean_B)}\")\n\n# \u6c42\u548c\u805a\u5408\nsum_A = neighbours_A.sum(axis=0)\nsum_B = neighbours_B.sum(axis=0)\nprint(f\"\u6c42\u548c A:  {sum_A},  \u6c42\u548c B:  {sum_B},  \u76f8\u540c: {jnp.allclose(sum_A, sum_B)}\")\nprint(\"\\n\u6c42\u548c\u80fd\u533a\u5206\u8fd9\u4e9b\u591a\u91cd\u96c6\uff1b\u5747\u503c\u4e0d\u80fd\uff01\")\n</code></pre></p> </li> <li> <p>\u6f14\u793a\u8fc7\u5e73\u6ed1\u3002\u91cd\u590d\u5e94\u7528\u5f52\u4e00\u5316\u90bb\u63a5\u77e9\u9635\uff0c\u89c2\u5bdf\u8282\u70b9\u7279\u5f81\u6536\u655b\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u968f\u673a\u56fe\nA = jnp.array([[0,1,1,0,0,0],\n               [1,0,1,0,0,0],\n               [1,1,0,1,0,0],\n               [0,0,1,0,1,1],\n               [0,0,0,1,0,1],\n               [0,0,0,1,1,0]], dtype=float)\n\nA_hat = A + jnp.eye(6)\nD_inv_sqrt = jnp.diag(1.0 / jnp.sqrt(A_hat.sum(axis=1)))\nA_norm = D_inv_sqrt @ A_hat @ D_inv_sqrt\n\n# \u521d\u59cb\u7279\u5f81\uff1a\u6bcf\u4e2a\u8282\u70b9\u5404\u4e0d\u76f8\u540c\nH = jnp.array([[1,0], [0,1], [1,1], [-1,0], [0,-1], [-1,-1]], dtype=float)\n\ndistances = []\nfor k in range(20):\n    H = A_norm @ H\n    # \u8861\u91cf\u7279\u5f81\u7684\u533a\u522b\u7a0b\u5ea6\uff08\u8282\u70b9\u95f4\u7684\u6807\u51c6\u5dee\uff09\n    spread = jnp.std(H, axis=0).mean()\n    distances.append(float(spread))\n\nplt.plot(distances, \"o-\")\nplt.xlabel(\"\u6d88\u606f\u4f20\u9012\u8f6e\u6570\")\nplt.ylabel(\"\u7279\u5f81\u5206\u6563\u5ea6\uff08\u8282\u70b9\u95f4\u6807\u51c6\u5dee\uff09\")\nplt.title(\"\u8fc7\u5e73\u6ed1\uff1a\u7279\u5f81\u968f\u6df1\u5ea6\u589e\u52a0\u800c\u6536\u655b\")\nplt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/04.%20graph%20attention%20networks/","title":"\u56fe\u6ce8\u610f\u529b\u7f51\u7edc","text":"<p>\u56fe\u6ce8\u610f\u529b\u7f51\u7edc\u5c06\u5747\u5300\u7684\u90bb\u5c45\u805a\u5408\u66ff\u6362\u4e3a\u5b66\u4e60\u5230\u7684\u3001\u4f9d\u8d56\u6570\u636e\u7684\u52a0\u6743\u3002\u672c\u7ae0\u6db5\u76d6GAT\u3001\u591a\u5934\u56fe\u6ce8\u610f\u529b\u3001GATv2\u3001\u56feTransformer\u3001\u4f4d\u7f6e\u548c\u7ed3\u6784\u7f16\u7801\u4ee5\u53ca\u53ef\u6269\u5c55\u6027</p> <ul> <li> <p>\u5728GCN\uff08\u6587\u4ef63\uff09\u4e2d\uff0c\u6bcf\u4e2a\u8282\u70b9\u4f7f\u7528\u7531\u56fe\u7ed3\u6784\u786e\u5b9a\u7684\u56fa\u5b9a\u6743\u91cd\uff08\u5f52\u4e00\u5316\u90bb\u63a5\u77e9\u9635\uff09\u805a\u5408\u5176\u90bb\u5c45\u7279\u5f81\u3002\u4e00\u4e2a\u6709\u4e09\u4e2a\u90bb\u5c45\u7684\u8282\u70b9\u4f1a\u7ed9\u6bcf\u4e2a\u90bb\u5c45\u5927\u81f4\u76f8\u7b49\u7684\u6743\u91cd\uff08\\(\\approx 1/3\\)\uff09\u3002\u4f46\u5e76\u975e\u6240\u6709\u90bb\u5c45\u90fd\u540c\u7b49\u91cd\u8981\uff1a\u6765\u81ea\u5bc6\u5207\u5408\u4f5c\u8005\u7684\u6d88\u606f\u5e94\u6bd4\u6765\u81ea\u8fdc\u65b9\u719f\u4eba\u7684\u6d88\u606f\u66f4\u91cd\u8981\u3002</p> </li> <li> <p>\u56fe\u6ce8\u610f\u529b\u7f51\u7edc\u901a\u8fc7\u4f7f\u7528\u4e0eTransformer\uff08\u7b2c7\u7ae0\uff09\u76f8\u540c\u7684\u6ce8\u610f\u529b\u673a\u5236\u6765\u5b66\u4e60\u5173\u6ce8\u54ea\u4e9b\u90bb\u5c45\uff0c\u4ece\u800c\u89e3\u51b3\u4e86\u8fd9\u4e00\u95ee\u9898\u3002\u4e0e\u56fa\u5b9a\u7684\u3001\u57fa\u4e8e\u7ed3\u6784\u7684\u6743\u91cd\u4e0d\u540c\uff0c\u6bcf\u4e2a\u8282\u70b9\u5728\u5176\u90bb\u5c45\u4e0a\u8ba1\u7b97\u52a8\u6001\u7684\u3001\u57fa\u4e8e\u5185\u5bb9\u7684\u6ce8\u610f\u529b\u5206\u6570\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/04.%20graph%20attention%20networks/#gat","title":"GAT\uff1a\u56fe\u6ce8\u610f\u529b\u7f51\u7edc","text":"<ul> <li>GAT\uff08Veli\u010dkovi\u0107\u7b49\uff0c2018\uff09\u8ba1\u7b97\u6bcf\u4e2a\u8282\u70b9\u4e0e\u5176\u90bb\u5c45\u4e4b\u95f4\u7684\u6ce8\u610f\u529b\u7cfb\u6570\u3002\u5bf9\u4e8e\u8282\u70b9 \\(i\\) \u548c\u90bb\u5c45 \\(j\\)\uff1a</li> </ul> \\[e_{ij} = \\text{LeakyReLU}\\left(\\mathbf{a}^T \\left[W\\mathbf{h}_i \\| W\\mathbf{h}_j\\right]\\right)\\] <ul> <li> <p>\u5176\u4e2d \\(W \\in \\mathbb{R}^{d' \\times d}\\) \u662f\u5171\u4eab\u7684\u7ebf\u6027\u53d8\u6362\uff0c\\(\\|\\) \u8868\u793a\u62fc\u63a5\uff0c\\(\\mathbf{a} \\in \\mathbb{R}^{2d'}\\) \u662f\u53ef\u5b66\u4e60\u7684\u6ce8\u610f\u529b\u5411\u91cf\u3002\u5206\u6570 \\(e_{ij}\\) \u8861\u91cf\u8282\u70b9 \\(j\\) \u7684\u7279\u5f81\u5bf9\u8282\u70b9 \\(i\\) \u7684\u91cd\u8981\u7a0b\u5ea6\u3002</p> </li> <li> <p>\u539f\u59cb\u5206\u6570\u4f7f\u7528softmax\u5728\u6240\u6709\u90bb\u5c45\u4e4b\u95f4\u8fdb\u884c\u5f52\u4e00\u5316\uff1a</p> </li> </ul> \\[\\alpha_{ij} = \\text{softmax}_j(e_{ij}) = \\frac{\\exp(e_{ij})}{\\sum_{k \\in \\mathcal{N}(i)} \\exp(e_{ik})}\\] <ul> <li>\u8fd9\u786e\u4fdd\u4e86\u6bcf\u4e2a\u8282\u70b9\u90bb\u57df\u4e0a\u7684\u6ce8\u610f\u529b\u6743\u91cd\u4e4b\u548c\u4e3a1\uff0c\u5c31\u50cfTransformer\u6ce8\u610f\u529b\u4e00\u6837\uff08\u7b2c7\u7ae0\uff09\u3002\u8282\u70b9\u66f4\u65b0\u540e\u7684\u7279\u5f81\u4e3a\uff1a</li> </ul> \\[\\mathbf{h}_i' = \\sigma\\left(\\sum_{j \\in \\mathcal{N}(i)} \\alpha_{ij} W\\mathbf{h}_j\\right)\\] <p></p> <ul> <li> <p>\u4e0eGCN\u7684\u5173\u952e\u533a\u522b\uff1a\u6743\u91cd \\(\\alpha_{ij}\\) \u662f\u4ece\u6570\u636e\u4e2d\u5b66\u4e60\u7684\uff0c\u800c\u975e\u7531\u56fe\u7ed3\u6784\u56fa\u5b9a\u3002\u8282\u70b9\u53ef\u4ee5\u5b66\u4f1a\u5173\u6ce8\u4fe1\u606f\u91cf\u6700\u5927\u7684\u90bb\u5c45\uff0c\u540c\u65f6\u5ffd\u7565\u566a\u58f0\u6216\u65e0\u5173\u7684\u90bb\u5c45\u3002</p> </li> <li> <p>\u6ce8\u610f\uff0c\u6ce8\u610f\u529b\u4ec5\u5728\u8fb9\u4e0a\u8ba1\u7b97\uff08\u8282\u70b9 \\(i\\) \u53ea\u5173\u6ce8\u5176\u90bb\u5c45 \\(\\mathcal{N}(i)\\)\uff09\uff0c\u800c\u4e0d\u662f\u5728\u6240\u6709\u8282\u70b9\u5bf9\u4e4b\u95f4\u3002\u8fd9\u4f7f\u5f97\u8ba1\u7b97\u91cf\u4e0e\u8fb9\u7684\u6570\u91cf\u6210\u6b63\u6bd4\uff0c\u800c\u4e0d\u662f\u8282\u70b9\u6570\u7684\u5e73\u65b9\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/04.%20graph%20attention%20networks/#_2","title":"\u591a\u5934\u56fe\u6ce8\u610f\u529b","text":"<ul> <li>\u6b63\u5982\u5728Transformer\u4e2d\uff08\u7b2c7\u7ae0\uff09\uff0c\u591a\u5934\u6ce8\u610f\u529b\u5e76\u884c\u8fd0\u884c \\(K\\) \u4e2a\u72ec\u7acb\u7684\u6ce8\u610f\u529b\u673a\u5236\uff0c\u6bcf\u4e2a\u90fd\u6709\u81ea\u5df1\u7684\u53c2\u6570 \\(W^k\\) \u548c \\(\\mathbf{a}^k\\)\u3002\u7ed3\u679c\u5728\u4e2d\u95f4\u5c42\u8fdb\u884c\u62fc\u63a5\uff0c\u5728\u6700\u7ec8\u5c42\u53d6\u5e73\u5747\uff1a</li> </ul> \\[\\mathbf{h}_i' = \\Big\\|_{k=1}^{K} \\sigma\\left(\\sum_{j \\in \\mathcal{N}(i)} \\alpha_{ij}^k W^k \\mathbf{h}_j\\right)\\] <ul> <li> <p>\u6bcf\u4e2a\u5934\u53ef\u4ee5\u5173\u6ce8\u90bb\u57df\u7684\u4e0d\u540c\u65b9\u9762\uff1a\u4e00\u4e2a\u5934\u53ef\u80fd\u5173\u6ce8\u7ed3\u6784\u7279\u5f81\uff0c\u53e6\u4e00\u4e2a\u5173\u6ce8\u8bed\u4e49\u76f8\u4f3c\u6027\u3002\u8fd9\u4e0eTransformer\u4e2d\u591a\u5934\u6ce8\u610f\u529b\u7684\u52a8\u673a\u76f8\u540c\uff1a\u4e0d\u540c\u7684\u5934\u6355\u83b7\u4e0d\u540c\u7c7b\u578b\u7684\u5173\u7cfb\u3002</p> </li> <li> <p>\u4f7f\u7528 \\(K\\) \u4e2a\u5934\u548c\u6bcf\u4e2a\u5934\u8f93\u51fa\u7ef4\u5ea6 \\(d'\\)\uff0c\u62fc\u63a5\u540e\u7684\u8f93\u51fa\u7ef4\u5ea6\u4e3a \\(K \\times d'\\)\u3002\u6700\u540e\u4e00\u5c42\u901a\u5e38\u4f7f\u7528\u5e73\u5747\u800c\u4e0d\u662f\u62fc\u63a5\u6765\u4ea7\u751f\u56fa\u5b9a\u5927\u5c0f\u7684\u8f93\u51fa\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/04.%20graph%20attention%20networks/#gatv2","title":"GATv2\uff1a\u4fee\u590d\u9759\u6001\u6ce8\u610f\u529b","text":"<ul> <li> <p>\u539f\u59cbGAT\u6709\u4e00\u4e2a\u5fae\u5999\u7684\u9650\u5236\uff1a\u5176\u6ce8\u610f\u529b\u51fd\u6570\u662f\u9759\u6001\u7684\uff08\u4e5f\u79f0\u4e3a\u57fa\u4e8e\u6392\u5e8f\u7684\uff09\u3002\u6ce8\u610f\u529b\u5206\u6570\u53d6\u51b3\u4e8e\u62fc\u63a5 \\([W\\mathbf{h}_i \\| W\\mathbf{h}_j]\\)\uff0c\u4f46\u7531\u4e8e\u6ce8\u610f\u529b\u5411\u91cf \\(\\mathbf{a}\\) \u5728\u62fc\u63a5\u4e4b\u540e\u5e94\u7528\uff0c\u5b83\u53ef\u4ee5\u5206\u89e3\u4e3a\u4e24\u4e2a\u72ec\u7acb\u7684\u5206\u91cf\uff1a\\(\\mathbf{a}^T [W\\mathbf{h}_i \\| W\\mathbf{h}_j] = \\mathbf{a}_1^T W\\mathbf{h}_i + \\mathbf{a}_2^T W\\mathbf{h}_j\\)\u3002</p> </li> <li> <p>\u8fd9\u610f\u5473\u7740\u5bf9\u4e8e\u7ed9\u5b9a\u8282\u70b9 \\(i\\)\uff0c\u90bb\u5c45\u7684\u6392\u5e8f\u5b8c\u5168\u7531\u90bb\u5c45\u7684\u7279\u5f81 \\(\\mathbf{h}_j\\) \u51b3\u5b9a\uff08\u9879 \\(\\mathbf{a}_1^T W\\mathbf{h}_i\\) \u5728 \\(i\\) \u7684\u6240\u6709\u90bb\u5c45\u4e2d\u662f\u5e38\u6570\uff09\u3002\u6ce8\u610f\u529b\u6392\u540d\u5e76\u4e0d\u771f\u6b63\u4f9d\u8d56\u4e8e\u67e5\u8be2\u8282\u70b9\u7684\u7279\u5f81\u3002\u8282\u70b9 \\(i\\) \u548c\u8282\u70b9 \\(k\\) \u5c06\u4ee5\u5b8c\u5168\u76f8\u540c\u7684\u65b9\u5f0f\u5bf9\u540c\u4e00\u7ec4\u90bb\u5c45\u8fdb\u884c\u6392\u5e8f\uff0c\u8fd9\u9650\u5236\u4e86\u8868\u8fbe\u80fd\u529b\u3002</p> </li> <li> <p>GATv2\uff08Brody\u7b49\uff0c2022\uff09\u901a\u8fc7\u5728\u6ce8\u610f\u529b\u5411\u91cf\u4e4b\u524d\u5e94\u7528\u975e\u7ebf\u6027\u51fd\u6570\u6765\u4fee\u590d\u8fd9\u4e2a\u95ee\u9898\uff1a</p> </li> </ul> \\[e_{ij} = \\mathbf{a}^T \\text{LeakyReLU}\\left(W \\left[\\mathbf{h}_i \\| \\mathbf{h}_j\\right]\\right)\\] <ul> <li>\u5c06LeakyReLU\u79fb\u5230\u8ba1\u7b97\u5185\u90e8\u610f\u5473\u7740\u6ce8\u610f\u529b\u5206\u6570\u662f\u8054\u5408\u7279\u5f81\u7684\u975e\u7ebf\u6027\u51fd\u6570\uff0c\u4e0d\u80fd\u5206\u89e3\u4e3a\u72ec\u7acb\u9879\u3002\u8fd9\u4f7f\u5f97\u6ce8\u610f\u529b\u53d8\u4e3a\u52a8\u6001\uff1a\u90bb\u5c45\u7684\u6392\u5e8f\u73b0\u5728\u4f9d\u8d56\u4e8e\u7279\u5b9a\u7684\u67e5\u8be2\u8282\u70b9\u3002GATv2\u4e25\u683c\u6bd4GAT\u66f4\u5177\u8868\u8fbe\u80fd\u529b\uff0c\u4e14\u6ca1\u6709\u989d\u5916\u7684\u8ba1\u7b97\u6210\u672c\u3002</li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/04.%20graph%20attention%20networks/#transformer","title":"\u56feTransformer","text":"<ul> <li> <p>\u6807\u51c6\u6d88\u606f\u4f20\u9012GNN\u53d7\u5230\u56fe\u62d3\u6251\u7684\u9650\u5236\uff1a\u4e00\u4e2a\u8282\u70b9\u53ea\u80fd\u5173\u6ce8\u5176\u76f4\u63a5\u90bb\u5c45\u3002\u7ecf\u8fc7 \\(k\\) \u5c42\u540e\uff0c\u6765\u81ea \\(k\\) \u8df3\u90bb\u5c45\u7684\u4fe1\u606f\u5df2\u901a\u8fc7\u591a\u4e2a\u805a\u5408\u6b65\u9aa4\u6df7\u5408\uff0c\u5931\u53bb\u4e86\u4fdd\u771f\u5ea6\u3002\u8fd9\u79cd\u5c40\u90e8\u74f6\u9888\uff08\u518d\u52a0\u4e0a\u6587\u4ef63\u4e2d\u7684\u8fc7\u5e73\u6ed1\uff09\u9650\u5236\u4e86\u6355\u83b7\u957f\u8ddd\u79bb\u4f9d\u8d56\u5173\u7cfb\u7684\u80fd\u529b\u3002</p> </li> <li> <p>\u56feTransformer\u901a\u8fc7\u5c06\u5168\u5c40\u81ea\u6ce8\u610f\u529b\u5e94\u7528\u4e8e\u6240\u6709\u8282\u70b9\u5bf9\uff08\u65e0\u8bba\u5b83\u4eec\u4e4b\u95f4\u662f\u5426\u6709\u8fb9\uff09\u6765\u7a81\u7834\u8fd9\u4e2a\u74f6\u9888\u3002\u6bcf\u4e2a\u8282\u70b9\u53ef\u4ee5\u5728\u5355\u5c42\u4e2d\u5173\u6ce8\u6bcf\u4e2a\u5176\u4ed6\u8282\u70b9\uff0c\u5c31\u50cf\u6807\u51c6Transformer\u4e00\u6837\uff08\u7b2c7\u7ae0\uff09\u3002</p> </li> <li> <p>\u57fa\u672c\u601d\u60f3\uff1a\u5c06\u6240\u6709\u8282\u70b9\u89c6\u4e3a\u6807\u8bb0\uff08token\uff09\uff0c\u5e94\u7528Transformer\u81ea\u6ce8\u610f\u529b\uff1a</p> </li> </ul> \\[\\text{Attention}(Q, K, V) = \\text{softmax}\\left(\\frac{QK^T}{\\sqrt{d_k}}\\right)V\\] <ul> <li> <p>\u5176\u4e2d \\(Q = XW_Q\\)\uff0c\\(K = XW_K\\)\uff0c\\(V = XW_V\\) \u662f\u8282\u70b9\u7279\u5f81 \\(X\\) \u7684\u67e5\u8be2\u3001\u952e\u548c\u503c\u6295\u5f71\uff08\u4e0e\u7b2c7\u7ae0\u5b8c\u5168\u76f8\u540c\uff09\u3002\u8fd9\u662f\u5b8c\u5168\u8fde\u63a5\u56fe\uff08\u5b8c\u5168\u56fe \\(K_n\\)\uff0c\u6587\u4ef62\uff09\u4e0a\u7684GNN\u3002</p> </li> <li> <p>\u95ee\u9898\uff1a\u5b8c\u5168\u8fde\u63a5\u56fe\u5ffd\u7565\u4e86\u5b9e\u9645\u7684\u56fe\u7ed3\u6784\u3002\u8fb9\u4fe1\u606f\uff08\u8c01\u5b9e\u9645\u8fde\u63a5\u5230\u8c01\uff09\u4e22\u5931\u4e86\u3002\u4e24\u79cd\u65b9\u6cd5\u6062\u590d\u4e86\u8fd9\u4e00\u70b9\uff1a</p> </li> <li> <p>Graphormer\uff08Ying\u7b49\uff0c2021\uff09\u901a\u8fc7\u6ce8\u610f\u529b\u5206\u6570\u4e2d\u7684\u504f\u7f6e\u9879\u5c06\u56fe\u7ed3\u6784\u6ce8\u5165Transformer\uff1a</p> </li> </ul> \\[A_{ij} = \\frac{(\\mathbf{h}_i W_Q)(W_K^T \\mathbf{h}_j^T)}{\\sqrt{d_k}} + b_{\\text{spatial}}(i, j) + b_{\\text{edge}}(i, j)\\] <ul> <li> <p>\u7a7a\u95f4\u504f\u7f6e \\(b_{\\text{spatial}}\\) \u7f16\u7801\u8282\u70b9 \\(i\\) \u548c \\(j\\) \u4e4b\u95f4\u7684\u6700\u77ed\u8def\u5f84\u8ddd\u79bb\u3002\u8fb9\u504f\u7f6e \\(b_{\\text{edge}}\\) \u7f16\u7801\u6cbf\u6700\u77ed\u8def\u5f84\u7684\u8fb9\u7279\u5f81\u3002\u6b64\u5916\uff0cGraphormer\u4f7f\u7528\u4e2d\u5fc3\u6027\u7f16\u7801\uff0c\u5c06\u8282\u70b9\u7684\u5ea6\u6570\u6dfb\u52a0\u5230\u5176\u8f93\u5165\u5d4c\u5165\u4e2d\uff0c\u4e3a\u6a21\u578b\u63d0\u4f9b\u5173\u4e8e\u6bcf\u4e2a\u8282\u70b9\u7ed3\u6784\u89d2\u8272\u7684\u4fe1\u606f\u3002</p> </li> <li> <p>GPS\uff08\u901a\u7528\u3001\u5f3a\u5927\u3001\u53ef\u6269\u5c55\u7684\u56feTransformer\uff0cRamp\u00e1\u0161ek\u7b49\uff0c2022\uff09\u5728\u6bcf\u4e00\u5c42\u4e2d\u7ed3\u5408\u4e86\u5c40\u90e8\u6d88\u606f\u4f20\u9012\u548c\u5168\u5c40\u6ce8\u610f\u529b\uff1a</p> </li> </ul> \\[\\mathbf{h}_i' = \\text{MLP}\\left(\\mathbf{h}_i^{\\text{MPNN}} + \\mathbf{h}_i^{\\text{Attention}}\\right)\\] <ul> <li>\u6bcf\u4e00\u5c42\u540c\u65f6\u5e94\u7528\u6807\u51c6GNN\uff08\u7528\u4e8e\u5c40\u90e8\u7ed3\u6784\uff09\u548cTransformer\uff08\u7528\u4e8e\u5168\u5c40\u4e0a\u4e0b\u6587\uff09\uff0c\u7136\u540e\u7ec4\u5408\u7ed3\u679c\u3002\u8fd9\u83b7\u5f97\u4e86\u4e24\u4e2a\u4e16\u754c\u7684\u4f18\u70b9\uff1a\u6765\u81ea\u6d88\u606f\u4f20\u9012\u7684\u5c40\u90e8\u7ed3\u6784\u548c\u6765\u81ea\u6ce8\u610f\u529b\u7684\u957f\u8ddd\u79bb\u4f9d\u8d56\u5173\u7cfb\u3002</li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/04.%20graph%20attention%20networks/#_3","title":"\u4f4d\u7f6e\u7f16\u7801\u4e0e\u7ed3\u6784\u7f16\u7801","text":"<ul> <li> <p>\u5e8f\u5217\u4e0a\u7684Transformer\u4f7f\u7528\u4f4d\u7f6e\u7f16\u7801\uff08\u7b2c7\u7ae0\uff09\u6765\u6ce8\u5165\u987a\u5e8f\u4fe1\u606f\u3002\u56fe\u6ca1\u6709\u89c4\u8303\u7684\u987a\u5e8f\uff0c\u56e0\u6b64\u9700\u8981\u7279\u5b9a\u4e8e\u56fe\u7684\u7f16\u7801\u3002</p> </li> <li> <p>\u62c9\u666e\u62c9\u65af\u7279\u5f81\u5411\u91cf\u7f16\u7801\u4f7f\u7528\u56fe\u62c9\u666e\u62c9\u65af\u7b97\u5b50\uff08\u6587\u4ef62\uff09\u7684\u7279\u5f81\u5411\u91cf\u4f5c\u4e3a\u4f4d\u7f6e\u7279\u5f81\u3002\\(k\\) \u4e2a\u6700\u5c0f\u7684\u975e\u5e73\u51e1\u7279\u5f81\u5411\u91cf\u63d0\u4f9b\u4e86\u56fe\u7684\u8c31\u5d4c\u5165\uff1a\u5728\u56fe\u4e2d\"\u9644\u8fd1\"\u7684\u8282\u70b9\u5177\u6709\u76f8\u4f3c\u7684\u7279\u5f81\u5411\u91cf\u503c\u3002\u8fd9\u4e9b\u88ab\u62fc\u63a5\u5230\u8282\u70b9\u7279\u5f81\u4e2d\u3002</p> </li> <li> <p>\u4e00\u4e2a\u5fae\u5999\u4e4b\u5904\uff1a\u62c9\u666e\u62c9\u65af\u7279\u5f81\u5411\u91cf\u6709\u7b26\u53f7\u6a21\u7cca\u6027\uff08\u5982\u679c \\(\\mathbf{u}\\) \u662f\u7279\u5f81\u5411\u91cf\uff0c\\(-\\mathbf{u}\\) \u4e5f\u662f\uff09\u3002\u6a21\u578b\u5fc5\u987b\u5bf9\u8fd9\u4e9b\u7b26\u53f7\u7ffb\u8f6c\u4fdd\u6301\u4e0d\u53d8\u3002\u89e3\u51b3\u65b9\u6848\u5305\u62ec\u5728\u8bad\u7ec3\u671f\u95f4\u4f7f\u7528\u968f\u673a\u7b26\u53f7\u7ffb\u8f6c\u4f5c\u4e3a\u6570\u636e\u589e\u5f3a\uff0c\u6216\u5b66\u4e60\u7b26\u53f7\u4e0d\u53d8\u7684\u53d8\u6362\u3002</p> </li> <li> <p>\u968f\u673a\u6e38\u8d70\u7f16\u7801\u8ba1\u7b97\u4ece\u8282\u70b9 \\(i\\) \u5f00\u59cb\u7684\u968f\u673a\u6e38\u8d70\u7ecf\u8fc7 \\(k\\) \u6b65\u540e\u8fd4\u56de\u8282\u70b9 \\(i\\) \u7684\u6982\u7387\uff0c\u5bf9\u4e8e \\(k = 1, 2, \\ldots, K\\)\u3002\u8fd9\u4e9b\u6982\u7387\u7f16\u7801\u4e86\u5c40\u90e8\u7ed3\u6784\u4fe1\u606f\uff1a\u5bc6\u96c6\u7c07\u4e2d\u7684\u8282\u70b9\u5177\u6709\u9ad8\u7684\u8fd4\u56de\u6982\u7387\uff0c\u800c\u7a00\u758f\u533a\u57df\u4e2d\u7684\u8282\u70b9\u8fd4\u56de\u6982\u7387\u4f4e\u3002\u7740\u9646\u6982\u7387 \\(p_{ii}^{(k)} = (A_{\\text{rw}}^k)_{ii}\\)\uff0c\u5176\u4e2d \\(A_{\\text{rw}} = D^{-1}A\\) \u662f\u968f\u673a\u6e38\u8d70\u8f6c\u79fb\u77e9\u9635\u3002</p> </li> <li> <p>\u5ea6\u6570\u7f16\u7801\u7b80\u5355\u5730\u5c06\u8282\u70b9\u5ea6\u6570\u4f5c\u4e3a\u4e00\u4e2a\u7279\u5f81\u6dfb\u52a0\u3002\u8fd9\u51fa\u5947\u5730\u6709\u6548\uff0c\u56e0\u4e3a\u5ea6\u6570\u662f\u4e00\u4e2a\u5f3a\u5927\u7684\u7ed3\u6784\u4fe1\u53f7\uff1a\u53f6\u8282\u70b9\uff08\u5ea6\u6570\u4e3a1\uff09\u3001\u6865\u63a5\u8282\u70b9\u548c\u67a2\u7ebd\u8282\u70b9\u7684\u884c\u4e3a\u4e0d\u540c\u3002</p> </li> <li> <p>\u8fd9\u4e9b\u7f16\u7801\u63d0\u4f9b\u4e86\u666e\u901aTransformer\u6240\u7f3a\u4e4f\u7684\u7ed3\u6784\u4fe1\u606f\uff0c\u4f7f\u56feTransformer\u5728\u9700\u8981\u957f\u8ddd\u79bb\u63a8\u7406\u7684\u4efb\u52a1\u4e0a\u80fd\u591f\u8d85\u8d8a\u6807\u51c6\u6d88\u606f\u4f20\u9012GNN\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/04.%20graph%20attention%20networks/#_4","title":"\u53ef\u6269\u5c55\u6027","text":"<ul> <li> <p>GNN\u7684\u57fa\u672c\u53ef\u6269\u5c55\u6027\u6311\u6218\u5728\u4e8e\u56fe\u53ef\u80fd\u62e5\u6709\u6570\u767e\u4e07\u4e2a\u8282\u70b9\u548c\u6570\u5341\u4ebf\u6761\u8fb9\u3002\u5728\u5b8c\u6574\u56fe\u4e0a\u8bad\u7ec3GNN\u9700\u8981\u5c06\u6240\u6709\u8282\u70b9\u7279\u5f81\u548c\u6574\u4e2a\u90bb\u63a5\u77e9\u9635\u5b58\u50a8\u5728\u5185\u5b58\u4e2d\uff0c\u8fd9\u901a\u5e38\u662f\u4e0d\u53ef\u884c\u7684\u3002</p> </li> <li> <p>GNN\u7684\u5c0f\u6279\u91cf\u8bad\u7ec3\u6bd4\u56fe\u50cf\u6216\u5e8f\u5217\u66f4\u590d\u6742\uff0c\u56e0\u4e3a\u8282\u70b9\u4e4b\u95f4\u662f\u76f8\u4e92\u8fde\u63a5\u7684\u3002\u6734\u7d20\u5730\u91c7\u6837\u4e00\u6279\u8282\u70b9\u9700\u8981\u5b83\u4eec\u7684\u90bb\u5c45\uff08\u7b2c1\u5c42\uff09\u3001\u90bb\u5c45\u7684\u90bb\u5c45\uff08\u7b2c2\u5c42\uff09\uff0c\u4f9d\u6b64\u7c7b\u63a8\u3002\u8fd9\u79cd\u90bb\u57df\u7206\u70b8\u610f\u5473\u7740\u4e00\u4e2a\u5305\u542b1000\u4e2a\u76ee\u6807\u8282\u70b9\u7684\u5c0f\u6279\u91cf\u53ef\u80fd\u9700\u8981\u8ba1\u7b97\u56fe\u4e2d\u6570\u767e\u4e07\u4e2a\u8282\u70b9\u3002</p> </li> <li> <p>\u90bb\u57df\u91c7\u6837\uff08GraphSAGE\u98ce\u683c\uff0c\u6587\u4ef63\uff09\u901a\u8fc7\u6bcf\u5c42\u6bcf\u4e2a\u8282\u70b9\u91c7\u6837\u56fa\u5b9a\u6570\u91cf\u7684\u90bb\u5c45\u6765\u9650\u5236\u7206\u70b8\u3002\u4f7f\u75282\u5c42\u548c\u6bcf\u5c4215\u4e2a\u6837\u672c\uff0c\u6bcf\u4e2a\u76ee\u6807\u8282\u70b9\u7684\u5b50\u56fe\u6700\u591a\u6709 \\(15^2 = 225\\) \u4e2a\u8282\u70b9\uff0c\u4e0e\u5b8c\u6574\u56fe\u7684\u5927\u5c0f\u65e0\u5173\u3002</p> </li> <li> <p>Cluster-GCN\uff08Chiang\u7b49\uff0c2019\uff09\u4f7f\u7528\u56fe\u805a\u7c7b\u7b97\u6cd5\uff08\u4f8b\u5982METIS\uff09\u5c06\u56fe\u5212\u5206\u4e3a\u7c07\uff0c\u7136\u540e\u4e00\u6b21\u5728\u4e00\u4e2a\u7c07\u4e0a\u8bad\u7ec3\u3002\u7c07\u5185\u8fb9\u662f\u5bc6\u96c6\u7684\uff08\u5927\u591a\u6570\u90bb\u5c45\u5728\u540c\u4e00\u4e2a\u7c07\u5185\uff09\uff0c\u56e0\u6b64\u5b50\u56fe\u6355\u83b7\u4e86\u76f8\u5173\u7ed3\u6784\u3002\u8de8\u7c07\u8fb9\u901a\u8fc7\u5076\u5c14\u5305\u542b\u7c07\u4e4b\u95f4\u7684\u8fb9\u6765\u5904\u7406\u3002</p> </li> <li> <p>\u56feTransformer\u7684\u53ef\u6269\u5c55\u6027\u66f4\u56f0\u96be\uff0c\u56e0\u4e3a\u5168\u5c40\u6ce8\u610f\u529b\u662f \\(O(n^2)\\) \u7684\u3002\u5bf9\u4e8e\u5177\u6709\u6570\u767e\u4e07\u4e2a\u8282\u70b9\u7684\u56fe\uff0c\u5b8c\u6574\u7684\u6ce8\u610f\u529b\u662f\u4e0d\u53ef\u884c\u7684\u3002\u89e3\u51b3\u65b9\u6848\u5305\u62ec\uff1a</p> <ul> <li>\u7a00\u758f\u6ce8\u610f\u529b\u6a21\u5f0f\uff08\u53ea\u5173\u6ce8\u56fe\u4e2d\u8ddd\u79bb\u6700\u8fd1\u7684 \\(k\\) \u4e2a\u8282\u70b9\uff09</li> <li>\u7ebf\u6027\u6ce8\u610f\u529b\u8fd1\u4f3c</li> <li>\u5c06\u5c40\u90e8\u6d88\u606f\u4f20\u9012\uff08\u5ec9\u4ef7\uff0c\\(O(|E|)\\)\uff09\u4e0e\u7c97\u5316\u56fe\u4e0a\u7684\u5168\u5c40\u6ce8\u610f\u529b\uff08\u66f4\u5c11\u7684\u8282\u70b9\uff09\u76f8\u7ed3\u5408</li> </ul> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/04.%20graph%20attention%20networks/#_5","title":"\u65f6\u5e8f\u56fe\u4e0e\u52a8\u6001\u56fe","text":"<ul> <li> <p>\u6211\u4eec\u8fc4\u4eca\u4e3a\u6b62\u7814\u7a76\u7684\u56fe\u662f\u9759\u6001\u7684\uff1a\u8282\u70b9\u3001\u8fb9\u548c\u7279\u5f81\u90fd\u662f\u56fa\u5b9a\u7684\u3002\u4f46\u8bb8\u591a\u73b0\u5b9e\u4e16\u754c\u7684\u56fe\u4f1a\u968f\u65f6\u95f4\u6f14\u5316\uff1a\u65b0\u7528\u6237\u52a0\u5165\u793e\u4ea4\u7f51\u7edc\u3001\u91d1\u878d\u4ea4\u6613\u521b\u5efa\u8fb9\u3001\u4ea4\u901a\u6a21\u5f0f\u5168\u5929\u53d8\u5316\u3001\u5206\u5b50\u76f8\u4e92\u4f5c\u7528\u53d1\u751f\u6ce2\u52a8\u3002</p> </li> <li> <p>\u65f6\u5e8f\u56fe\u4e3a\u6bcf\u6761\u8fb9\u589e\u52a0\u4e00\u4e2a\u65f6\u95f4\u6233\uff1a\\((i, j, t)\\) \u8868\u793a\u8282\u70b9 \\(i\\) \u5728\u65f6\u95f4 \\(t\\) \u4e0e\u8282\u70b9 \\(j\\) \u53d1\u751f\u4e86\u4ea4\u4e92\u3002\u6311\u6218\u5728\u4e8e\u5b66\u4e60\u540c\u65f6\u6355\u83b7\u56fe\u7ed3\u6784\u548c\u65f6\u5e8f\u52a8\u6001\u7684\u8868\u793a\u3002</p> </li> <li> <p>\u5b58\u5728\u4e24\u79cd\u8303\u5f0f\uff1a</p> </li> <li> <p>\u79bb\u6563\u65f6\u95f4\u52a8\u6001\u56fe\uff08DTDG\uff09\uff1a\u56fe\u88ab\u8868\u793a\u4e3a\u4e00\u7cfb\u5217\u5feb\u7167 \\(G_1, G_2, \\ldots, G_T\\)\uff0c\u6bcf\u4e2a\u65f6\u95f4\u6b65\u4e00\u4e2a\u3002GNN\u5904\u7406\u6bcf\u4e2a\u5feb\u7167\uff0cRNN\u6216\u65f6\u5e8f\u6ce8\u610f\u529b\u673a\u5236\u6355\u83b7\u5feb\u7167\u95f4\u7684\u6f14\u5316\u3002\u8fd9\u5f88\u7b80\u5355\uff0c\u4f46\u4e22\u5931\u4e86\u7cbe\u7ec6\u7684\u65f6\u95f4\u4fe1\u606f\uff08\u5feb\u7167\u4e4b\u95f4\u7684\u4e8b\u4ef6\u4e22\u5931\u4e86\uff09\uff0c\u5e76\u4e14\u9700\u8981\u9009\u62e9\u5feb\u7167\u9891\u7387\u3002</p> </li> <li> <p>\u8fde\u7eed\u65f6\u95f4\u52a8\u6001\u56fe\uff08CTDG\uff09\uff1a\u4e8b\u4ef6\u88ab\u5efa\u6a21\u4e3a\u5e26\u65f6\u95f4\u6233\u7684\u4ea4\u4e92\u6d41\u3002\u6bcf\u4e2a\u4e8b\u4ef6 \\((i, j, t)\\) \u5728\u5176\u53d1\u751f\u7684\u51c6\u786e\u65f6\u95f4\u66f4\u65b0\u8282\u70b9 \\(i\\) \u548c \\(j\\) \u7684\u8868\u793a\u3002\u8fd9\u4fdd\u7559\u4e86\u6240\u6709\u65f6\u5e8f\u4fe1\u606f\u3002</p> </li> <li> <p>\u65f6\u5e8f\u56fe\u7f51\u7edc\uff08TGN\uff09\uff08Rossi\u7b49\uff0c2020\uff09\u662f\u9886\u5148\u7684CTDG\u67b6\u6784\u3002\u6bcf\u4e2a\u8282\u70b9\u7ef4\u62a4\u4e00\u4e2a\u8bb0\u5fc6\u72b6\u6001 \\(\\mathbf{s}_i(t)\\)\uff0c\u6bcf\u5f53\u8282\u70b9\u53c2\u4e0e\u4ea4\u4e92\u65f6\u66f4\u65b0\uff1a</p> </li> </ul> \\[\\mathbf{s}_i(t^+) = \\text{GRU}\\left(\\mathbf{s}_i(t^-), \\; \\mathbf{m}_i(t)\\right)\\] <ul> <li> <p>\u5176\u4e2d \\(\\mathbf{m}_i(t)\\) \u662f\u4ece\u4ea4\u4e92\u4e2d\u8ba1\u7b97\u51fa\u7684\u6d88\u606f\uff08\u7ed3\u5408\u4e86\u4e24\u4e2a\u8282\u70b9\u7684\u7279\u5f81\u3001\u8fb9\u7279\u5f81\u548c\u65f6\u95f4\u7f16\u7801\uff09\u3002GRU\uff08\u7b2c6\u7ae0\uff09\u9009\u62e9\u6027\u5730\u4fdd\u7559\u548c\u9057\u5fd8\u8fc7\u53bb\u7684\u4fe1\u606f\uff0c\u4f7f\u8bb0\u5fc6\u80fd\u591f\u6355\u83b7\u957f\u671f\u6a21\u5f0f\uff0c\u540c\u65f6\u9002\u5e94\u8fd1\u671f\u4e8b\u4ef6\u3002</p> </li> <li> <p>\u65f6\u95f4\u7f16\u7801\u8868\u793a\u81ea\u4e0a\u6b21\u4ea4\u4e92\u4ee5\u6765\u7ecf\u8fc7\u7684\u65f6\u95f4\uff0c\u7c7b\u4f3c\u4e8eTransformer\u4e2d\u7684\u4f4d\u7f6e\u7f16\u7801\uff08\u7b2c7\u7ae0\uff09\u3002\u5e38\u7528\u65b9\u6cd5\u4f7f\u7528\u53ef\u5b66\u4e60\u7684\u5085\u91cc\u53f6\u7279\u5f81\uff1a</p> </li> </ul> \\[\\Phi(t) = \\left[\\cos(\\omega_1 t), \\sin(\\omega_1 t), \\ldots, \\cos(\\omega_d t), \\sin(\\omega_d t)\\right]\\] <ul> <li> <p>\u8fd9\u4e3a\u6a21\u578b\u63d0\u4f9b\u4e86\u65f6\u95f4\u95f4\u9694\u7684\u4e30\u5bcc\u8868\u793a\uff1a\"\u8be5\u7528\u6237\u4e0a\u6b21\u6d3b\u8dc3\u662f5\u5206\u949f\u524d\"\u4e0e\"3\u4e2a\u6708\u524d\"\u4ee5\u4e0d\u540c\u7684\u65b9\u5f0f\u5d4c\u5165\u3002</p> </li> <li> <p>\u65f6\u5e8f\u56fe\u6ce8\u610f\u529b\uff08TGAT\uff09\u5728\u8282\u70b9\u7684\u65f6\u95f4\u90bb\u57df\u4e0a\u5e94\u7528\u81ea\u6ce8\u610f\u529b\uff1a\u4e00\u7ec4\u6700\u8fd1\u7684\u4ea4\u4e92\uff0c\u6bcf\u4e2a\u4ea4\u4e92\u540c\u65f6\u6309\u7279\u5f81\u76f8\u5173\u6027\uff08\u5982GAT\uff09\u548c\u65f6\u95f4\u8fd1\u5ea6\u52a0\u6743\u3002\u6765\u81ea\u9065\u8fdc\u8fc7\u53bb\u7684\u4ea4\u4e92\u81ea\u7136\u5730\u88ab\u964d\u4f4e\u6743\u91cd\u3002</p> </li> <li> <p>\u5e94\u7528\u5305\u62ec\u6b3a\u8bc8\u68c0\u6d4b\uff08\u91d1\u878d\u56fe\u4e2d\u7684\u5f02\u5e38\u4ea4\u6613\u6a21\u5f0f\uff09\u3001\u4ea4\u901a\u9884\u6d4b\uff08\u4ece\u5386\u53f2\u6d41\u91cf\u6a21\u5f0f\u9884\u6d4b\u62e5\u5835\uff09\u3001\u793e\u4ea4\u7f51\u7edc\u52a8\u6001\uff08\u9884\u6d4b\u75c5\u6bd2\u5185\u5bb9\u4f20\u64ad\uff09\u4ee5\u53ca\u968f\u65f6\u95f4\u63a8\u79fb\u7684\u836f\u7269\u76f8\u4e92\u4f5c\u7528\u9884\u6d4b\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/04.%20graph%20attention%20networks/#colabnotebook","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216notebook\uff09","text":"<ol> <li> <p>\u4ece\u5934\u5b9e\u73b0\u4e00\u4e2a\u5355\u5934GAT\u6ce8\u610f\u529b\u3002\u8ba1\u7b97\u8282\u70b9\u4e0e\u5176\u90bb\u5c45\u4e4b\u95f4\u7684\u6ce8\u610f\u529b\u6743\u91cd\uff0c\u5e76\u9a8c\u8bc1\u6743\u91cd\u4e4b\u548c\u4e3a1\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\nrng = jax.random.PRNGKey(0)\nk1, k2, k3 = jax.random.split(rng, 3)\n\nn_nodes, d_in, d_out = 5, 4, 3\n\n# \u968f\u673a\u8282\u70b9\u7279\u5f81\nH = jax.random.normal(k1, (n_nodes, d_in))\n\n# \u53ef\u5b66\u4e60\u53c2\u6570\nW = jax.random.normal(k2, (d_in, d_out)) * 0.5\na = jax.random.normal(k3, (2 * d_out,)) * 0.5\n\n# \u90bb\u63a5\uff08\u8282\u70b90\u8fde\u63a5\u52301, 2, 3\uff09\nneighbours_of_0 = [1, 2, 3]\n\n# \u53d8\u6362\u7279\u5f81\nWh = H @ W  # (n_nodes, d_out)\n\n# \u8ba1\u7b97\u8282\u70b90\u7684\u6ce8\u610f\u529b\u5206\u6570\nh_i = Wh[0]\nscores = []\nfor j in neighbours_of_0:\n    h_j = Wh[j]\n    e_ij = jnp.dot(a, jnp.concatenate([h_i, h_j]))\n    e_ij = jax.nn.leaky_relu(e_ij, negative_slope=0.2)\n    scores.append(float(e_ij))\n\nscores = jnp.array(scores)\nalpha = jax.nn.softmax(scores)\n\nprint(f\"\u539f\u59cb\u5206\u6570: {scores}\")\nprint(f\"\u6ce8\u610f\u529b\u6743\u91cd: {alpha}\")\nprint(f\"\u6743\u91cd\u4e4b\u548c: {alpha.sum():.4f}\")\n\n# \u52a0\u6743\u805a\u5408\nh_new = sum(alpha[k] * Wh[neighbours_of_0[k]] for k in range(len(neighbours_of_0)))\nprint(f\"\u66f4\u65b0\u540e\u7684\u8282\u70b90\u7279\u5f81: {h_new}\")\n</code></pre></p> </li> <li> <p>\u6bd4\u8f83GCN\uff08\u56fa\u5b9a\u6743\u91cd\uff09\u548cGAT\uff08\u5b66\u4e60\u6743\u91cd\uff09\u7684\u805a\u5408\u3002\u5c55\u793aGAT\u53ef\u4ee5\u4e3a\u90bb\u5c45\u5206\u914d\u4e0d\u540c\u7684\u6743\u91cd\uff0c\u800cGCN\u7edf\u4e00\u5bf9\u5f85\u5b83\u4eec\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\n# 4\u4e2a\u8282\u70b9\uff1a\u8282\u70b90\u8fde\u63a5\u52301, 2, 3\nA = jnp.array([[0,1,1,1],\n               [1,0,0,0],\n               [1,0,0,0],\n               [1,0,0,0]], dtype=float)\n\n# \u7279\u5f81\uff1a\u8282\u70b91\u975e\u5e38\u76f8\u5173\uff0c\u8282\u70b92\u662f\u566a\u58f0\uff0c\u8282\u70b93\u4e2d\u7b49\nH = jnp.array([[0.0, 0.0],   # \u8282\u70b90\n               [1.0, 0.0],   # \u8282\u70b91\uff08\u4fe1\u53f7\uff09\n               [0.0, 0.0],   # \u8282\u70b92\uff08\u566a\u58f0\uff09\n               [0.5, 0.0]])  # \u8282\u70b93\uff08\u4e2d\u7b49\uff09\n\n# GCN\uff1a\u5f52\u4e00\u5316\u90bb\u63a5\u6743\u91cd\nA_hat = A + jnp.eye(4)\nD_inv = jnp.diag(1.0 / A_hat.sum(axis=1))\ngcn_weights = (D_inv @ A_hat)[0]  # \u8282\u70b90\u7684\u6743\u91cd\nprint(f\"GCN\u4e2d\u8282\u70b90\u7684\u6743\u91cd: {gcn_weights}\")\nprint(\"  \u2192 \u6240\u6709\u90bb\u5c45\u83b7\u5f97\u5927\u81f4\u76f8\u7b49\u7684\u6743\u91cd\")\n\n# GAT\uff1a\u5b66\u4e60\u5230\u7684\u6ce8\u610f\u529b\uff08\u6a21\u62df\uff09\n# \u5047\u8bbe\u6ce8\u610f\u529b\u673a\u5236\u5b66\u4f1a\u5173\u6ce8\u8282\u70b91\ngat_weights = jnp.array([0.1, 0.7, 0.05, 0.15])  # \u5b66\u4e60\u5230\u7684\nprint(f\"\\nGAT\u4e2d\u8282\u70b90\u7684\u6743\u91cd: {gat_weights}\")\nprint(\"  \u2192 \u6700\u5177\u4fe1\u606f\u91cf\u7684\u8282\u70b91\u83b7\u5f97\u6700\u591a\u5173\u6ce8\")\n\ngcn_output = gcn_weights @ H\ngat_output = gat_weights @ H\nprint(f\"\\nGCN\u8f93\u51fa: {gcn_output}  \uff08\u88ab\u566a\u58f0\u7a00\u91ca\uff09\")\nprint(f\"GAT\u8f93\u51fa: {gat_output}  \uff08\u805a\u7126\u4e8e\u4fe1\u53f7\uff09\")\n</code></pre></p> </li> <li> <p>\u6f14\u793a\u4f4d\u7f6e\u7f16\u7801\u7684\u76ca\u5904\u3002\u8ba1\u7b97\u56fe\u7684\u62c9\u666e\u62c9\u65af\u7279\u5f81\u5411\u91cf\u7f16\u7801\uff0c\u5c55\u793a\u7ed3\u6784\u76f8\u4f3c\u7684\u8282\u70b9\u83b7\u5f97\u76f8\u4f3c\u7684\u7f16\u7801\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\n# \u6760\u94c3\u56fe\uff1a\u4e24\u4e2a\u56e2\u7531\u4e00\u6761\u6865\u8fde\u63a5\nn = 10\nA = jnp.zeros((n, n))\n# \u56e21\uff1a\u8282\u70b90-4\nfor i in range(5):\n    for j in range(i+1, 5):\n        A = A.at[i,j].set(1).at[j,i].set(1)\n# \u56e22\uff1a\u8282\u70b95-9\nfor i in range(5, 10):\n    for j in range(i+1, 10):\n        A = A.at[i,j].set(1).at[j,i].set(1)\n# \u6865\nA = A.at[4,5].set(1).at[5,4].set(1)\n\nD = jnp.diag(A.sum(axis=1))\nL = D - A\neigenvalues, eigenvectors = jnp.linalg.eigh(L)\n\n# \u4f7f\u7528\u524d3\u4e2a\u975e\u5e73\u51e1\u7279\u5f81\u5411\u91cf\u4f5c\u4e3a\u4f4d\u7f6e\u7f16\u7801\npe = eigenvectors[:, 1:4]\n\nprint(\"\u62c9\u666e\u62c9\u65af\u4f4d\u7f6e\u7f16\u7801:\")\nfor i in range(n):\n    group = \"\u56e21\" if i &lt; 5 else \"\u56e22\"\n    bridge = \" (\u6865)\" if i in [4, 5] else \"\"\n    print(f\"  \u8282\u70b9 {i} ({group}{bridge}): {pe[i]}\")\n\nplt.scatter(pe[:5, 0], pe[:5, 1], c=\"#3498db\", s=80, label=\"\u56e21\")\nplt.scatter(pe[5:, 0], pe[5:, 1], c=\"#e74c3c\", s=80, label=\"\u56e22\")\nplt.scatter(pe[[4,5], 0], pe[[4,5], 1], c=\"black\", s=120, marker=\"*\",\n            label=\"\u6865\u8282\u70b9\", zorder=5)\nplt.legend(); plt.grid(True)\nplt.title(\"\u62c9\u666e\u62c9\u65af\u7279\u5f81\u5411\u91cf\u4f4d\u7f6e\u7f16\u7801\")\nplt.xlabel(\"\u7279\u5f81\u5411\u91cf 1\"); plt.ylabel(\"\u7279\u5f81\u5411\u91cf 2\")\nplt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/05.%203d%20graph%20networks/","title":"3D\u56fe\u7f51\u7edc","text":"<p>3D\u56fe\u7f51\u7edc\u5c06GNN\u6269\u5c55\u5230\u5177\u6709\u7a7a\u95f4\u51e0\u4f55\u7684\u6570\u636e\uff0c\u5176\u4e2d\u5fc5\u987b\u6b63\u786e\u5904\u7406\u65cb\u8f6c\u548c\u5e73\u79fb\u3002\u672c\u7ae0\u6db5\u76d6\u51e0\u4f55\u56fe\u3001SE(3)/E(n)\u7b49\u53d8\u6027\u3001SchNet\u3001DimeNet\u3001EGNN\u3001\u5f20\u91cf\u573a\u7f51\u7edc\u4ee5\u53ca\u5206\u5b50\u6027\u8d28\u9884\u6d4b\u3001\u86cb\u767d\u8d28\u7ed3\u6784\u3001\u6750\u6599\u79d1\u5b66\u548c\u836f\u7269\u53d1\u73b0\u4e2d\u7684\u5e94\u7528\u2014\u2014\u4ece3D\u7269\u7406\u4e16\u754c\u4e2d\u5b66\u4e60\u7684\u67b6\u6784\u3002</p> <ul> <li> <p>\u6587\u4ef63\u548c4\u4e2d\u7684GNN\u64cd\u4f5c\u4e8e\u62bd\u8c61\u56fe\uff1a\u8282\u70b9\u6709\u7279\u5f81\uff0c\u8fb9\u7f16\u7801\u8fde\u63a5\u6027\uff0c\u4f46\u6ca1\u67093D\u7a7a\u95f4\u7684\u6982\u5ff5\u3002\u793e\u4ea4\u7f51\u7edc\u56fe\u6ca1\u6709\u51e0\u4f55\u7ed3\u6784\u3002\u4f46\u8bb8\u591a\u6700\u5177\u5f71\u54cd\u529b\u7684GNN\u5e94\u7528\u6d89\u53ca\u5b58\u5728\u4e8e\u7269\u74063D\u7a7a\u95f4\u4e2d\u7684\u6570\u636e\uff1a\u5206\u5b50\u3001\u86cb\u767d\u8d28\u3001\u6676\u4f53\u3001\u70b9\u4e91\u3002\u5bf9\u4e8e\u8fd9\u4e9b\u6570\u636e\uff0c\u8282\u70b9\u7684\u7a7a\u95f4\u4f4d\u7f6e\u643a\u5e26\u4e86\u62bd\u8c61GNN\u6240\u5ffd\u7565\u7684\u5173\u952e\u4fe1\u606f\u3002</p> </li> <li> <p>\u6311\u6218\u5728\u4e8e3D\u6570\u636e\u5177\u6709\u51e0\u4f55\u5bf9\u79f0\u6027\uff08\u6587\u4ef61\uff09\uff1a\u65cb\u8f6c\u5206\u5b50\u4e0d\u4f1a\u6539\u53d8\u5176\u6027\u8d28\uff0c\u5e73\u79fb\u4e5f\u662f\u5982\u6b64\u30023D GNN\u5fc5\u987b\u5c0a\u91cd\u8fd9\u4e9b\u5bf9\u79f0\u6027\u3002\u4e00\u4e2a\u4f1a\u5728\u65cb\u8f6c\u5206\u5b50\u65f6\u6539\u53d8\u7684\u80fd\u91cf\u9884\u6d4b\u5728\u7269\u7406\u4e0a\u662f\u9519\u8bef\u7684\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/05.%203d%20graph%20networks/#_1","title":"\u51e0\u4f55\u56fe","text":"<ul> <li> <p>\u51e0\u4f55\u56fe\u662f\u5d4c\u5165\u57283D\u7a7a\u95f4\u4e2d\u7684\u56fe\u3002\u6bcf\u4e2a\u8282\u70b9 \\(i\\) \u9664\u4e86\u5176\u7279\u5f81\u5411\u91cf \\(\\mathbf{h}_i\\) \u4e4b\u5916\uff0c\u8fd8\u6709\u4e00\u4e2a\u4f4d\u7f6e \\(\\mathbf{r}_i \\in \\mathbb{R}^3\\)\u3002\u8fb9\u53ef\u4ee5\u57fa\u4e8e\u7a7a\u95f4\u90bb\u8fd1\u6027\uff08\u8fde\u63a5\u8ddd\u79bb\u5728 \\(r_{\\text{cut}}\\) \u5185\u7684\u8282\u70b9\uff09\u800c\u4e0d\u662f\u57fa\u4e8e\u663e\u5f0f\u7684\u5316\u5b66\u952e\u6765\u5b9a\u4e49\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u5206\u5b50\uff0c\u51e0\u4f55\u56fe\u4ee5\u539f\u5b50\u4e3a\u8282\u70b9\uff08\u7279\u5f81\u5305\u62ec\uff1a\u5143\u7d20\u7c7b\u578b\u3001\u7535\u8377\u7b49\uff09\uff0c\u5316\u5b66\u952e\u4e3a\u8fb9\u30023D\u4f4d\u7f6e \\(\\mathbf{r}_i\\) \u662f\u539f\u5b50\u5750\u6807\uff0c\u7531\u91cf\u5b50\u529b\u5b66\u6216\u5b9e\u9a8c\u6d4b\u91cf\uff08X\u5c04\u7ebf\u6676\u4f53\u5b66\u3001\u51b7\u51bb\u7535\u955c\uff09\u786e\u5b9a\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u70b9\u4e91\uff08\u6765\u81eaLiDAR\u62163D\u626b\u63cf\u4eea\uff0c\u7b2c8\u7ae0\u548c\u7b2c11\u7ae0\uff09\uff0c\u6bcf\u4e2a\u70b9\u662f\u4e00\u4e2a\u8282\u70b9\uff0c\u5177\u6709\u4f4d\u7f6e\u548c\u53ef\u9009\u7279\u5f81\uff08\u989c\u8272\u3001\u5f3a\u5ea6\uff09\u3002\u8fb9\u8fde\u63a5\u9644\u8fd1\u7684\u70b9\uff0c\u5f62\u6210k\u6700\u8fd1\u90bb\uff08kNN\uff09\u56fe\u6216\u534a\u5f84\u56fe\u3002</p> </li> <li> <p>\u7528\u4e8e\u6d88\u606f\u4f20\u9012\u7684\u5173\u952e\u51e0\u4f55\u91cf\uff1a</p> <ul> <li> <p>\u539f\u5b50\u95f4\u8ddd\u79bb\uff1a\\(d_{ij} = \\|\\mathbf{r}_i - \\mathbf{r}_j\\|\\)\u3002\u8ddd\u79bb\u5bf9\u65cb\u8f6c\u548c\u5e73\u79fb\u4fdd\u6301\u4e0d\u53d8\u3002\u5177\u6709\u76f8\u540c\u539f\u5b50\u95f4\u8ddd\u79bb\u7684\u4e24\u4e2a\u5206\u5b50\u5177\u6709\u76f8\u540c\u7684\u5f62\u72b6\uff0c\u65e0\u8bba\u671d\u5411\u5982\u4f55\u3002</p> </li> <li> <p>\u952e\u89d2\uff1a\u8282\u70b9 \\(i\\) \u5904\u5411\u91cf \\(\\mathbf{r}_j - \\mathbf{r}_i\\) \u548c \\(\\mathbf{r}_k - \\mathbf{r}_i\\) \u4e4b\u95f4\u7684\u89d2\u5ea6 \\(\\theta_{ijk}\\)\u3002\u89d2\u5ea6\u6355\u83b7\u4e86\u8d85\u8d8a\u6210\u5bf9\u8ddd\u79bb\u7684\u5c40\u90e8\u51e0\u4f55\u7ed3\u6784\u3002</p> </li> <li> <p>\u4e8c\u9762\u89d2\uff08\u626d\u8f6c\u89d2\uff09\uff1a\u7531 \\((i, j, k)\\) \u548c \\((j, k, l)\\) \u5b9a\u4e49\u7684\u5e73\u9762\u4e4b\u95f4\u7684\u89d2\u5ea6 \\(\\phi_{ijkl}\\)\u3002\u4e8c\u9762\u89d2\u6355\u83b7\u7ed3\u6784\u57283D\u4e2d\u7684\u626d\u8f6c\u65b9\u5f0f\uff0c\u5bf9\u86cb\u767d\u8d28\u4e3b\u94fe\u51e0\u4f55\u7ed3\u6784\u81f3\u5173\u91cd\u8981\u3002</p> </li> <li> <p>\u76f8\u5bf9\u4f4d\u7f6e\u5411\u91cf\uff1a\\(\\mathbf{r}_{ij} = \\mathbf{r}_j - \\mathbf{r}_i\\)\u3002\u8fd9\u4e9b\u662f\u5e73\u79fb\u4e0d\u53d8\u7684\uff0c\u4f46\u4e0d\u662f\u65cb\u8f6c\u4e0d\u53d8\u7684\u3002\u4f7f\u7528\u5b83\u4eec\u9700\u8981\u7b49\u53d8\uff08\u800c\u4e0d\u4ec5\u4ec5\u662f\u4e0d\u53d8\uff09\u7684\u67b6\u6784\u3002</p> </li> </ul> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/05.%203d%20graph%20networks/#se3-en","title":"SE(3) \u548c E(n) \u7b49\u53d8\u6027","text":"<ul> <li> <p>3D\u7269\u7406\u6570\u636e\u7684\u5bf9\u79f0\u7fa4\u662f\u6b27\u51e0\u91cc\u5f97\u7fa4 \\(E(3)\\)\uff0c\u7531\u6240\u6709\u65cb\u8f6c\u3001\u53cd\u5c04\u548c\u5e73\u79fb\u7ec4\u6210\u3002\u5b50\u7fa4 \\(SE(3)\\)\uff08\u7279\u6b8a\u6b27\u51e0\u91cc\u5f97\u7fa4\uff09\u5305\u62ec\u65cb\u8f6c\u548c\u5e73\u79fb\uff0c\u4f46\u4e0d\u5305\u62ec\u53cd\u5c04\u3002</p> </li> <li> <p>3D GNN\u5e94\u8be5\u662f\uff1a</p> <ul> <li>\u5bf9\u6807\u91cf\u8f93\u51fa\uff08\u80fd\u91cf\u3001\u7ed3\u5408\u4eb2\u548c\u529b\uff09\u5e73\u79fb\u4e0d\u53d8\uff1a\u5c06\u6240\u6709\u539f\u5b50\u5e73\u79fb\u76f8\u540c\u5411\u91cf\u4e0d\u5e94\u6539\u53d8\u9884\u6d4b\u3002</li> <li>\u5bf9\u6807\u91cf\u8f93\u51fa\u65cb\u8f6c\u4e0d\u53d8\uff1a\u65cb\u8f6c\u5206\u5b50\u4e0d\u5e94\u6539\u53d8\u5176\u80fd\u91cf\u3002</li> <li>\u5bf9\u5411\u91cf/\u5f20\u91cf\u8f93\u51fa\uff08\u529b\u3001\u5076\u6781\u77e9\uff09\u65cb\u8f6c\u7b49\u53d8\uff1a\u65cb\u8f6c\u5206\u5b50\u5e94\u4f7f\u9884\u6d4b\u7684\u529b\u5411\u91cf\u6309\u76f8\u540c\u65cb\u8f6c\u65cb\u8f6c\u3002</li> </ul> </li> </ul> <p></p> <ul> <li>\u5f62\u5f0f\u4e0a\uff0c\u5bf9\u6807\u91cf\u9884\u6d4b \\(f\\) \u548c\u65cb\u8f6c \\(R \\in SO(3)\\)\uff1a</li> </ul> \\[f(R\\mathbf{r}_1, R\\mathbf{r}_2, \\ldots) = f(\\mathbf{r}_1, \\mathbf{r}_2, \\ldots) \\quad \\text{\uff08\u4e0d\u53d8\u6027\uff09}\\] <ul> <li>\u5bf9\u5411\u91cf\u9884\u6d4b \\(\\mathbf{F}\\)\uff1a</li> </ul> \\[\\mathbf{F}(R\\mathbf{r}_1, R\\mathbf{r}_2, \\ldots) = R \\cdot \\mathbf{F}(\\mathbf{r}_1, \\mathbf{r}_2, \\ldots) \\quad \\text{\uff08\u7b49\u53d8\u6027\uff09}\\] <ul> <li> <p>\u8fd9\u4e9b\u7ea6\u675f\u76f4\u63a5\u53cd\u6620\u4e86\u6587\u4ef61\u4e2d\u7684\u4e0d\u53d8\u6027/\u7b49\u53d8\u6027\u6846\u67b6\uff0c\u73b0\u5728\u4e13\u95e8\u5e94\u7528\u4e8e3D\u65cb\u8f6c\u548c\u5e73\u79fb\u7fa4\u3002</p> </li> <li> <p>\u5b58\u5728\u4e24\u79cd\u8bbe\u8ba1\u65b9\u6cd5\uff1a</p> <ol> <li>\u4e0d\u53d8\u67b6\u6784\uff1a\u53ea\u4f7f\u7528\u4e0d\u53d8\u51e0\u4f55\u7279\u5f81\uff08\u8ddd\u79bb\u3001\u89d2\u5ea6\uff09\u4f5c\u4e3a\u6d88\u606f\u4f20\u9012\u7684\u8f93\u5165\u3002\u5185\u90e8\u8868\u793a\u662f\u6807\u91cf\uff08\u4e0d\u53d8\u7684\uff09\u3002\u7b80\u5355\u9ad8\u6548\uff0c\u4f46\u4e0d\u80fd\u5728\u4e0d\u7834\u574f\u5bf9\u79f0\u6027\u7684\u60c5\u51b5\u4e0b\u4ea7\u751f\u5411\u91cf\u8f93\u51fa\u3002</li> <li>\u7b49\u53d8\u67b6\u6784\uff1a\u5728\u6574\u4e2a\u7f51\u7edc\u4e2d\u7ef4\u62a4\u5411\u91cf\uff08\u4ee5\u53ca\u66f4\u9ad8\u9636\u5f20\u91cf\uff09\u8868\u793a\uff0c\u786e\u4fdd\u6bcf\u4e00\u5c42\u662f\u7b49\u53d8\u7684\u3002\u8868\u8fbe\u80fd\u529b\u66f4\u5f3a\uff0c\u53ef\u4ee5\u81ea\u7136\u5730\u9884\u6d4b\u5411\u91cf\u548c\u5f20\u91cf\uff0c\u4f46\u66f4\u52a0\u590d\u6742\u3002</li> </ol> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/05.%203d%20graph%20networks/#schnet","title":"SchNet\uff1a\u57fa\u4e8e\u8ddd\u79bb\u7684\u6d88\u606f\u4f20\u9012","text":"<ul> <li> <p>SchNet\uff08Sch\u00fctt\u7b49\uff0c2017\uff09\u662f\u57fa\u7840\u6027\u7684\u4e0d\u53d83D GNN\u3002\u5176\u5173\u952e\u521b\u65b0\u662f\u8fde\u7eed\u6ee4\u6ce2\u5668\u5377\u79ef\uff1a\u4e0d\u662f\u4f7f\u7528\u56fa\u5b9a\u7684\u8fb9\u7c7b\u578b\u96c6\u5408\uff08\u5982\u5206\u5b50GNN\u4e2d\u7684\u952e\u7c7b\u578b\uff09\uff0cSchNet\u76f4\u63a5\u4ece\u539f\u5b50\u95f4\u8ddd\u79bb\u751f\u6210\u6d88\u606f\u6ee4\u6ce2\u5668\u3002</p> </li> <li> <p>\u8ddd\u79bb \\(d_{ij}\\) \u9996\u5148\u4f7f\u7528\u5f84\u5411\u57fa\u51fd\u6570\uff08RBF\uff09\u6269\u5c55\u4e3a\u7279\u5f81\u5411\u91cf\uff1a</p> </li> </ul> \\[\\text{RBF}(d_{ij}) = \\left[\\exp\\left(-\\gamma_1 (d_{ij} - \\mu_1)^2\\right), \\ldots, \\exp\\left(-\\gamma_K (d_{ij} - \\mu_K)^2\\right)\\right]\\] <ul> <li> <p>\u6bcf\u4e2a\u57fa\u51fd\u6570\u662f\u4e00\u4e2a\u4ee5 \\(\\mu_k\\) \u4e3a\u4e2d\u5fc3\u3001\u5bbd\u5ea6\u4e3a \\(\\gamma_k\\) \u7684\u9ad8\u65af\u51fd\u6570\u3002\u8fd9\u7c7b\u4f3c\u4e8e\u8ddd\u79bb\u7684\u53ef\u5b66\u4e60\u4f4d\u7f6e\u7f16\u7801\uff1a\u8fde\u7eed\u8ddd\u79bb\u88ab\u6620\u5c04\u5230\u4e00\u4e2a\u9ad8\u7ef4\u7279\u5f81\u7a7a\u95f4\uff0c\u7f51\u7edc\u53ef\u4ee5\u5728\u5176\u4e2d\u5b66\u4e60\u8ddd\u79bb\u76f8\u5173\u7684\u4ea4\u4e92\u3002\u4e2d\u5fc3 \\(\\mu_k\\) \u901a\u5e38\u4ece0\u5230\u622a\u6b62\u534a\u5f84\u5747\u5300\u5206\u5e03\u3002</p> </li> <li> <p>SchNet\u4ece\u8282\u70b9 \\(j\\) \u5230\u8282\u70b9 \\(i\\) \u7684\u6d88\u606f\u4e3a\uff1a</p> </li> </ul> \\[\\mathbf{m}_{j \\to i} = \\mathbf{h}_j \\odot W_{\\text{filter}}(\\text{RBF}(d_{ij}))\\] <ul> <li> <p>\u5176\u4e2d \\(W_{\\text{filter}}\\) \u662f\u4e00\u4e2a\u5c06RBF\u6269\u5c55\u6620\u5c04\u5230\u6ee4\u6ce2\u5668\u5411\u91cf\u7684MLP\uff0c\\(\\odot\\) \u662f\u9010\u5143\u7d20\u4e58\u6cd5\uff08Hadamard\u4e58\u79ef\uff0c\u7b2c2\u7ae0\uff09\u3002\u6ee4\u6ce2\u5668\u4f9d\u8d56\u4e8e\u8ddd\u79bb\uff0c\u56e0\u6b64\u9644\u8fd1\u7684\u539f\u5b50\u4e0e\u8fdc\u5904\u7684\u539f\u5b50\u4ea7\u751f\u4e0d\u540c\u7684\u4ea4\u4e92\u3002\u9010\u5143\u7d20\u4e58\u6cd5\u7c7b\u4f3c\u4e8e\u95e8\u63a7\u673a\u5236\uff08\u7b2c6\u7ae0\uff09\uff1a\u4f9d\u8d56\u4e8e\u8ddd\u79bb\u7684\u6ee4\u6ce2\u5668\u63a7\u5236\u6bcf\u4e2a\u7279\u5f81\u7ef4\u5ea6\u6709\u591a\u5c11\u901a\u8fc7\u3002</p> </li> <li> <p>\u7531\u4e8eSchNet\u53ea\u4f7f\u7528\u8ddd\u79bb\uff08\u4e0d\u53d8\u7684\uff09\uff0c\u6574\u4e2a\u6a21\u578b\u81ea\u52a8\u5bf9\u65cb\u8f6c\u548c\u5e73\u79fb\u4fdd\u6301\u4e0d\u53d8\u3002\u9664\u4e86\u8fd9\u4e2a\u8bbe\u8ba1\u9009\u62e9\u4e4b\u5916\uff0c\u4e0d\u9700\u8981\u5bf9\u5bf9\u79f0\u6027\u8fdb\u884c\u7279\u6b8a\u5904\u7406\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/05.%203d%20graph%20networks/#dimenetspherenet","title":"DimeNet\u548cSphereNet\uff1a\u89d2\u5ea6\u548c\u4e8c\u9762\u89d2","text":"<ul> <li> <p>\u4ec5\u51ed\u8ddd\u79bb\u4e0d\u80fd\u5b8c\u5168\u786e\u5b9a3D\u7ed3\u6784\u3002\u4e24\u4e2a\u4e0d\u540c\u7684\u5206\u5b50\u6784\u8c61\u53ef\u4ee5\u5177\u6709\u76f8\u540c\u7684\u6210\u5bf9\u8ddd\u79bb\u4f46\u4e0d\u540c\u7684\u952e\u89d2\uff08\u8fd9\u5c31\u662f\"\u8ddd\u79bb\u51e0\u4f55\u6b67\u4e49\"\u95ee\u9898\uff09\u3002DimeNet\uff08Gasteiger\u7b49\uff0c2020\uff09\u5c06\u952e\u89d2\u7eb3\u5165\u6d88\u606f\u4f20\u9012\u3002</p> </li> <li> <p>DimeNet\u4f7f\u7528\u5b9a\u5411\u6d88\u606f\u4f20\u9012\uff1a\u6d88\u606f\u6cbf\u6709\u5411\u8fb9\u6d41\u52a8\uff0c\u8fb9 \\((j \\to i)\\) \u4e0a\u7684\u6d88\u606f\u53d7\u8fb9 \\((k \\to j)\\) \u548c \\((j \\to i)\\) \u4e4b\u95f4\u7684\u89d2\u5ea6\u5f71\u54cd\uff1a</p> </li> </ul> \\[\\mathbf{m}_{kj \\to ji} = f\\left(\\mathbf{m}_{kj}, d_{ji}, \\theta_{kji}\\right)\\] <ul> <li> <p>\u89d2\u5ea6 \\(\\theta_{kji}\\) \u4f7f\u7528\u7403\u8d1d\u585e\u5c14\u51fd\u6570\u548c\u7403\u8c10\u51fd\u6570\uff08\u7403\u9762\u4e0a\u89d2\u5ea6\u4fe1\u606f\u7684\u81ea\u7136\u57fa\uff0c\u7c7b\u4f3c\u4e8e\u8ddd\u79bb\u7684RBF\uff09\u8fdb\u884c\u6269\u5c55\u3002\u8fd9\u4f7f\u6a21\u578b\u5728\u4fdd\u6301\u4e0d\u53d8\u6027\u7684\u540c\u65f6\u80fd\u591f\u8bbf\u95ee\u65b9\u5411\u4fe1\u606f\u3002</p> </li> <li> <p>SphereNet\uff08Liu\u7b49\uff0c2022\uff09\u66f4\u8fdb\u4e00\u6b65\uff0c\u5305\u542b\u4e8c\u9762\u89d2 \\(\\phi_{lkji}\\)\uff0c\u6355\u83b7\u5b8c\u6574\u76843D\u626d\u8f6c\u7ed3\u6784\u3002\u5c42\u6b21\u7ed3\u6784\u4e3a\uff1a</p> <ul> <li>\u8ddd\u79bb \u2192 \u6355\u83b7\u6210\u5bf9\u90bb\u8fd1\u6027</li> <li>\u89d2\u5ea6 \u2192 \u6355\u83b7\u5c40\u90e8\u51e0\u4f55\u7ed3\u6784\uff08\u5f2f\u66f2 vs. \u7ebf\u6027\uff09</li> <li>\u4e8c\u9762\u89d2 \u2192 \u6355\u83b73D\u626d\u8f6c\uff08\u5bf9\u86cb\u767d\u8d28\u4e3b\u94fe\u3001\u836f\u7269\u7ed3\u5408\u81f3\u5173\u91cd\u8981\uff09</li> </ul> </li> <li> <p>\u6bcf\u4e2a\u5c42\u6b21\u589e\u52a0\u4e86\u51e0\u4f55\u5206\u8fa8\u7387\uff0c\u4f46\u8ba1\u7b97\u590d\u6742\u5ea6\u4e5f\u968f\u4e4b\u589e\u52a0\uff08\u8ddd\u79bb\u4e3a \\(O(|E|)\\)\uff0c\u89d2\u5ea6\u4e3a \\(O(|E| \\cdot k)\\)\uff0c\u4e8c\u9762\u89d2\u4e3a \\(O(|E| \\cdot k^2)\\)\uff0c\u5176\u4e2d \\(k\\) \u662f\u5e73\u5747\u5ea6\u6570\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/05.%203d%20graph%20networks/#engnnegnn","title":"E(n)\u7b49\u53d8GNN\uff08EGNN\uff09","text":"<ul> <li> <p>EGNN\uff08Satorras\u7b49\uff0c2021\uff09\u91c7\u7528\u7b49\u53d8\u65b9\u6cd5\uff1a\u5b83\u4e0d\u53ea\u4f7f\u7528\u4e0d\u53d8\u7279\u5f81\uff0c\u800c\u662f\u5728\u6bcf\u4e00\u5c42\u540c\u65f6\u66f4\u65b0\u8282\u70b9\u7279\u5f81\u548c\u8282\u70b9\u4f4d\u7f6e\uff0c\u5728\u6574\u4e2a\u8fc7\u7a0b\u4e2d\u4fdd\u6301\u7b49\u53d8\u6027\u3002</p> </li> <li> <p>\u8282\u70b9 \\(i\\) \u7684EGNN\u66f4\u65b0\uff1a</p> </li> </ul> \\[\\mathbf{m}_{ij} = \\phi_e\\left(\\mathbf{h}_i, \\mathbf{h}_j, d_{ij}^2, a_{ij}\\right)\\] \\[\\mathbf{r}_i' = \\mathbf{r}_i + C \\sum_{j \\neq i} (\\mathbf{r}_i - \\mathbf{r}_j) \\cdot \\phi_r(\\mathbf{m}_{ij})\\] \\[\\mathbf{h}_i' = \\phi_h\\left(\\mathbf{h}_i, \\sum_j \\mathbf{m}_{ij}\\right)\\] <ul> <li> <p>\u5173\u952e\u5728\u4e8e\u4f4d\u7f6e\u66f4\u65b0\uff1a\u8282\u70b9\u4f4d\u7f6e\u901a\u8fc7\u76f8\u5bf9\u4f4d\u7f6e\u5411\u91cf \\((\\mathbf{r}_i - \\mathbf{r}_j)\\) \u7684\u52a0\u6743\u548c\u8fdb\u884c\u8c03\u6574\u3002\u6743\u91cd\u6765\u81ea\u6d88\u606f\u51fd\u6570 \\(\\phi_r\\)\uff0c\u8be5\u51fd\u6570\u4ec5\u4f9d\u8d56\u4e8e\u4e0d\u53d8\u7684\u91cf\uff08\u7279\u5f81\u548c\u8ddd\u79bb\uff09\u3002\u8fd9\u79cd\u6784\u9020\u662f\u53ef\u8bc1\u660e\u7b49\u53d8\u7684\uff1a\u5982\u679c\u6240\u6709\u8f93\u5165\u4f4d\u7f6e\u88ab\u65cb\u8f6c \\(R\\)\uff0c\u5219\u6240\u6709\u8f93\u51fa\u4f4d\u7f6e\u88ab\u76f8\u540c\u7684 \\(R\\) \u65cb\u8f6c\u3002</p> </li> <li> <p>EGNN\u7684\u4f18\u96c5\u4e4b\u5904\u5728\u4e8e\u5b83\u4e0d\u663e\u5f0f\u4f7f\u7528\u7403\u8c10\u51fd\u6570\u6216\u4e0d\u53ef\u7ea6\u8868\u793a\u5c31\u5b9e\u73b0\u4e86\u7b49\u53d8\u6027\u3002\u76f8\u5bf9\u4f4d\u7f6e\u5411\u91cf\u643a\u5e26\u65b9\u5411\u4fe1\u606f\uff0c\u4e0d\u53d8\u7684\u6d88\u606f\u51fd\u6570\u63a7\u5236\u5982\u4f55\u4f7f\u7528\u8be5\u65b9\u5411\u4fe1\u606f\u3002</p> </li> <li> <p>\u8fd9\u79cd\u7b80\u6d01\u6027\u662f\u6709\u4ee3\u4ef7\u7684\uff1aEGNN\u53ea\u4f7f\u7528\u5411\u91cf\u8868\u793a\uff081\u9636\uff09\u3002\u5b83\u65e0\u6cd5\u5728\u672a\u7ecf\u6269\u5c55\u7684\u60c5\u51b5\u4e0b\u8868\u793a\u66f4\u9ad8\u9636\u7684\u5f20\u91cf\uff0c\u5982\u56db\u6781\u77e9\u6216\u5e94\u529b\u5f20\u91cf\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/05.%203d%20graph%20networks/#_2","title":"\u5f20\u91cf\u573a\u7f51\u7edc\u4e0e\u9ad8\u9636\u8868\u793a","text":"<ul> <li> <p>\u5f20\u91cf\u573a\u7f51\u7edc\uff08Thomas\u7b49\uff0c2018\uff09\u53ca\u5176\u540e\u7ee7\u8005\uff08SE(3)-Transformers\u3001MACE\u3001Equiformer\uff09\u4f7f\u7528\u65cb\u8f6c\u7fa4\u7684\u4e0d\u53ef\u7ea6\u8868\u793a\u7684\u5b8c\u6574\u673a\u5236\u6765\u6784\u5efa\u7b49\u53d8\u5c42\u3002</p> </li> <li> <p>\u5728\u8868\u793a\u8bba\u4e2d\uff08\u8054\u7cfb\u5230\u7b2c2\u7ae0\u7684\u7ebf\u6027\u4ee3\u6570\uff09\uff0c3D\u4e2d\u7684\u65cb\u8f6c\u53ef\u4ee5\u5206\u89e3\u4e3a\u4ee5\u6574\u6570\u9636 \\(\\ell\\) \u4e3a\u7279\u5f81\u7684\u4e0d\u53ef\u7ea6\u5206\u91cf\uff1a</p> <ul> <li>\\(\\ell = 0\\)\uff1a\u6807\u91cf\uff081\u4e2a\u5206\u91cf\uff0c\u4e0d\u53d8\uff09\u3002\u80fd\u91cf\u3001\u7535\u8377\u3002</li> <li>\\(\\ell = 1\\)\uff1a\u5411\u91cf\uff083\u4e2a\u5206\u91cf\uff0c\u50cf\u4f4d\u7f6e\u5411\u91cf\u4e00\u6837\u65cb\u8f6c\uff09\u3002\u529b\u3001\u5076\u6781\u77e9\u3002</li> <li>\\(\\ell = 2\\)\uff1a\u79e92\u5bf9\u79f0\u65e0\u8ff9\u5f20\u91cf\uff085\u4e2a\u5206\u91cf\uff09\u3002\u56db\u6781\u77e9\u3001\u5e94\u529b\u5f20\u91cf\u3002</li> <li>\u66f4\u9ad8\u7684 \\(\\ell\\)\uff1a\u6355\u83b7\u8d8a\u6765\u8d8a\u590d\u6742\u7684\u89d2\u7ed3\u6784\u3002</li> </ul> </li> <li> <p>\u8fd9\u4e9b\u88ab\u79f0\u4e3a\u7403\u9762\u5f20\u91cf\uff0c\u5b83\u4eec\u901a\u8fc7Wigner-D\u77e9\u9635 \\(D^\\ell(R)\\) \u5728\u65cb\u8f6c \\(R\\) \u4e0b\u53d8\u6362\uff1a\u6807\u91cf\u4e0d\u53d8\uff0c\u5411\u91cf\u7531 \\(R\\) \u65cb\u8f6c\uff0c\u79e92\u5f20\u91cf\u7531\u66f4\u590d\u6742\u7684\u77e9\u9635\u65cb\u8f6c\u3002</p> </li> <li> <p>\u4f7f\u7528\u7403\u9762\u5f20\u91cf\u7684\u7b49\u53d8\u6d88\u606f\u4f20\u9012\u4f7f\u7528Clebsch-Gordan\u5f20\u91cf\u79ef\u6765\u7ec4\u5408\u4e0d\u540c\u9636\u7684\u7279\u5f81\uff1a</p> </li> </ul> \\[(\\mathbf{f}^{\\ell_1} \\otimes \\mathbf{f}^{\\ell_2})^{\\ell_{\\text{out}}} = \\sum_{m_1, m_2} C^{\\ell_{\\text{out}}, m_{\\text{out}}}_{\\ell_1, m_1, \\ell_2, m_2} \\cdot f^{\\ell_1}_{m_1} \\cdot f^{\\ell_2}_{m_2}\\] <ul> <li> <p>Clebsch-Gordan\u7cfb\u6570 \\(C\\) \u662f\u56fa\u5b9a\u7684\u6570\u5b66\u5e38\u6570\uff0c\u786e\u4fdd\u5f20\u91cf\u79ef\u662f\u7b49\u53d8\u7684\u3002\u8fd9\u662fSO(3)\u7b49\u53d8\u7248\u672c\u7684\u77e9\u9635\u4e58\u6cd5\u3002</p> </li> <li> <p>MACE\uff08Batatia\u7b49\uff0c2022\uff09\u4f7f\u7528\u9ad8\u9636\u6d88\u606f\uff08\u591a\u4e2a\u90bb\u5c45\u7279\u5f81\u7684\u4e58\u79ef\uff09\u4ee5\u66f4\u5c11\u7684\u6d88\u606f\u4f20\u9012\u5c42\u8fbe\u5230\u9ad8\u7cbe\u5ea6\u3002\u901a\u8fc7\u6784\u5efa\u4f53\u5e8f\u76f8\u4e92\u4f5c\u7528\uff08\u8ddd\u79bb\u76842\u4f53\u3001\u89d2\u5ea6\u76843\u4f53\u3001\u5f20\u91cf\u79ef\u7684\u591a\u4f53\uff09\uff0cMACE\u9ad8\u6548\u5730\u6355\u83b7\u4e86\u590d\u6742\u7684\u539f\u5b50\u95f4\u76f8\u4e92\u4f5c\u7528\u3002</p> </li> <li> <p>Equiformer\uff08Liao &amp; Smidt\uff0c2023\uff09\u5c06\u7b49\u53d8\u7403\u9762\u5f20\u91cf\u7279\u5f81\u4e0eTransformer\u6ce8\u610f\u529b\u673a\u5236\uff08\u6587\u4ef64\uff09\u76f8\u7ed3\u5408\uff0c\u521b\u5efa\u4e86SE(3)\u7b49\u53d8\u7684\u56feTransformer\u3002\u6ce8\u610f\u529b\u5206\u6570\u4ece\u4e0d\u53d8\u91cf\u7279\u5f81\u8ba1\u7b97\uff0c\u800c\u503c\u805a\u5408\u5728\u7b49\u53d8\u5f20\u91cf\u7279\u5f81\u4e0a\u8fdb\u884c\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/05.%203d%20graph%20networks/#_3","title":"\u5e94\u7528","text":"<ul> <li> <p>\u5206\u5b50\u6027\u8d28\u9884\u6d4b\uff1a\u7ed9\u5b9a\u5206\u5b50\u76843D\u7ed3\u6784\uff0c\u9884\u6d4b\u6027\u8d28\u5982\u80fd\u91cf\u3001\u529b\u3001\u5076\u6781\u77e9\u3001HOMO-LUMO\u80fd\u9699\u3001\u6bd2\u6027\u3001\u6eb6\u89e3\u5ea6\u3002\u8fd9\u662f3D GNN\u6700\u6210\u719f\u7684\u5e94\u7528\u3002\u5728\u91cf\u5b50\u5316\u5b66\u6570\u636e\u96c6\uff08QM9\u3001OC20\uff09\u4e0a\u8bad\u7ec3\u7684\u6a21\u578b\u5728\u8bb8\u591a\u6027\u8d28\u4e0a\u8fbe\u5230\u4e86\u5316\u5b66\u7cbe\u5ea6\uff0c\u5b9e\u73b0\u4e86\u5bf9\u6570\u767e\u4e07\u5019\u9009\u5206\u5b50\u7684\u865a\u62df\u7b5b\u9009\u3002</p> </li> <li> <p>\u5206\u5b50\u52a8\u529b\u5b66\u52a0\u901f\uff1a\u4f7f\u7528\u91cf\u5b50\u529b\u5b66\uff08\u5bc6\u5ea6\u6cdb\u51fd\u7406\u8bba\uff0cDFT\uff09\u8ba1\u7b97\u539f\u5b50\u95f4\u7684\u529b\u6781\u5176\u6602\u8d35\uff08\u5bf9 \\(n\\) \u4e2a\u7535\u5b50\u4e3a \\(O(n^3)\\)\uff09\u3002\u8bad\u7ec3\u7528\u4e8e\u9884\u6d4b\u529b\u76843D GNN\u53ef\u4ee5\u5728\u5206\u5b50\u52a8\u529b\u5b66\u6a21\u62df\u671f\u95f4\u66ff\u4ee3DFT\uff0c\u5b9e\u73b0 \\(10^3\\)\u2013\\(10^6\\) \u7684\u52a0\u901f\uff0c\u540c\u65f6\u4fdd\u6301\u63a5\u8fd1DFT\u7684\u7cbe\u5ea6\u3002\u8fd9\u4f7f\u5f97\u80fd\u591f\u6a21\u62df\u66f4\u5927\u7684\u7cfb\u7edf\u548c\u66f4\u957f\u7684\u65f6\u95f4\u5c3a\u5ea6\uff0c\u63ed\u793a\u4f20\u7edf\u65b9\u6cd5\u65e0\u6cd5\u89c2\u6d4b\u7684\u73b0\u8c61\u3002</p> </li> <li> <p>\u86cb\u767d\u8d28\u7ed3\u6784\uff1a\u86cb\u767d\u8d28\u662f\u6298\u53e0\u6210\u590d\u67423D\u7ed3\u6784\u7684\u6c28\u57fa\u9178\u94fe\u3002\u86cb\u767d\u8d28\u4e3b\u94fe\u662f\u4e00\u4e2a\u51e0\u4f55\u56fe\uff0c\u5176\u4e2d\u8282\u70b9\u662f\u6b8b\u57fa\uff0c\u8fb9\u8fde\u63a5\u7a7a\u95f4\u4e0a\u90bb\u8fd1\u7684\u6b8b\u57fa\u30023D GNN\u7528\u4e8e\u86cb\u767d\u8d28\u529f\u80fd\u9884\u6d4b\u3001\u7ed3\u5408\u4f4d\u70b9\u8bc6\u522b\u548c\u86cb\u767d\u8d28\u8bbe\u8ba1\uff08\u9006\u6298\u53e0\uff1a\u7ed9\u5b9a\u671f\u671b\u7ed3\u6784\uff0c\u9884\u6d4b\u6c28\u57fa\u9178\u5e8f\u5217\uff09\u3002AlphaFold\u4f7f\u7528\u51e0\u4f55\u548c\u57fa\u4e8e\u56fe\u7684\u63a8\u7406\u4ece\u5e8f\u5217\u9884\u6d4b\u86cb\u767d\u8d28\u7ed3\u6784\u3002</p> </li> <li> <p>\u6750\u6599\u79d1\u5b66\u4e0e\u50ac\u5316\uff1a\u6676\u4f53\u6750\u6599\u5177\u6709\u5468\u671f\u6027\u76843D\u7ed3\u6784\u3002GNN\u5bf9\u91cd\u590d\u6676\u80de\u8fdb\u884c\u5efa\u6a21\u5e76\u9884\u6d4b\u6750\u6599\u6027\u8d28\uff1a\u5e26\u9699\u3001\u5f62\u6210\u80fd\u3001\u673a\u68b0\u5f3a\u5ea6\u3002\u5f00\u653e\u50ac\u5316\u5242\u9879\u76ee\uff08OC20/OC22\uff09\u5bf9GNN\u8fdb\u884c\u57fa\u51c6\u6d4b\u8bd5\uff0c\u9884\u6d4b\u50ac\u5316\u8868\u9762\u4e0a\u7684\u5438\u9644\u80fd\uff0c\u52a0\u901f\u5bfb\u627e\u7528\u4e8e\u53ef\u518d\u751f\u80fd\u6e90\u7684\u65b0\u578b\u50ac\u5316\u5242\u3002</p> </li> <li> <p>\u836f\u7269\u53d1\u73b0\uff1a3D GNN\u9884\u6d4b\u836f\u7269\u5206\u5b50\u5982\u4f55\u4e0e\u9776\u86cb\u767d\u7ed3\u5408\u3002\u7ed3\u5408\u4eb2\u548c\u529b\u53d6\u51b3\u4e8e\u836f\u7269\u4e0e\u86cb\u767d\u8d28\u7ed3\u5408\u53e3\u888b\u4e4b\u95f4\u76843D\u5f62\u72b6\u4e92\u8865\u6027\u548c\u5316\u5b66\u76f8\u4e92\u4f5c\u7528\u3002DiffDock\u7b49\u6a21\u578b\u4f7f\u7528\u7b49\u53d8GNN\u4e0e\u6269\u6563\u6a21\u578b\uff08\u7b2c8\u7ae0\uff09\u6765\u9884\u6d4b\u7ed3\u5408\u59ff\u6001\uff08\u836f\u7269\u5728\u86cb\u767d\u8d28\u53e3\u888b\u4e2d\u76843D\u671d\u5411\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/05.%203d%20graph%20networks/#_4","title":"\u56fe\u751f\u6210","text":"<ul> <li> <p>\u4e0a\u8ff0\u6240\u6709\u67b6\u6784\u5206\u6790\u73b0\u6709\u56fe\u3002\u56fe\u751f\u6210\u521b\u5efa\u65b0\u7684\u56fe\uff1a\u8bbe\u8ba1\u5177\u6709\u671f\u671b\u6027\u8d28\u7684\u5206\u5b50\u3001\u751f\u6210\u7528\u4e8e\u6d4b\u8bd5\u7684\u5408\u6210\u793e\u4ea4\u7f51\u7edc\u6216\u63d0\u51fa\u65b0\u7684\u86cb\u767d\u8d28\u7ed3\u6784\u3002\u8fd9\u662f\u56fe\u7ea7\u522b\u9884\u6d4b\u7684\u751f\u6210\u5bf9\u5e94\u4efb\u52a1\u3002</p> </li> <li> <p>\u6311\u6218\u5728\u4e8e\u56fe\u662f\u79bb\u6563\u7684\u3001\u5927\u5c0f\u53ef\u53d8\u4e14\u7ec4\u5408\u7684\u3002\u751f\u6210\u56fe\u610f\u5473\u7740\u51b3\u5b9a\u8981\u521b\u5efa\u591a\u5c11\u4e2a\u8282\u70b9\u3001\u5b83\u4eec\u5177\u6709\u4ec0\u4e48\u7279\u5f81\u4ee5\u53ca\u54ea\u4e9b\u5bf9\u8981\u8fde\u63a5\u3002\u53ef\u80fd\u7684\u56fe\u7a7a\u95f4\u968f\u8282\u70b9\u6570\u91cf\u8d85\u6307\u6570\u589e\u957f\u3002</p> </li> <li> <p>\u81ea\u56de\u5f52\u751f\u6210\u4e00\u6b21\u6784\u5efa\u4e00\u4e2a\u8282\u70b9\uff08\u6216\u4e00\u6761\u8fb9\uff09\u3002GraphRNN\uff08You\u7b49\uff0c2018\uff09\u987a\u5e8f\u5730\u751f\u6210\u56fe\uff1aRNN\u7ef4\u62a4\u4e00\u4e2a\u72b6\u6001\uff0c\u6bcf\u4e00\u6b65\u751f\u6210\u4e00\u4e2a\u65b0\u8282\u70b9\uff0c\u5e76\u51b3\u5b9a\u5c06\u5176\u8fde\u63a5\u5230\u54ea\u4e9b\u73b0\u6709\u8282\u70b9\u3002\u751f\u6210\u987a\u5e8f\u4e3a\u672c\u6765\u65e0\u5e8f\u7684\u56fe\u65bd\u52a0\u4e86\u4eba\u5de5\u5e8f\u5217\uff0c\u4f46BFS\u6392\u5e8f\u901a\u8fc7\u4fdd\u6301\u6700\u8fd1\u751f\u6210\u7684\u8282\u70b9\u76f8\u5173\u6027\u6765\u5e2e\u52a9\u89e3\u51b3\u95ee\u9898\u3002</p> </li> <li> <p>\u57fa\u4e8eVAE\u7684\u751f\u6210\u5c06\u56fe\u7f16\u7801\u5230\u8fde\u7eed\u6f5c\u5728\u7a7a\u95f4\uff08\u4f7f\u7528GNN\u7f16\u7801\u5668\uff09\uff0c\u7136\u540e\u4ece\u91c7\u6837\u7684\u6f5c\u5728\u5411\u91cf\u89e3\u7801\u65b0\u56fe\u3002GraphVAE\u4e00\u6b21\u6027\u751f\u6210\u4e00\u4e2a\u6982\u7387\u90bb\u63a5\u77e9\u9635 \\(\\hat{A} \\in [0, 1]^{n \\times n}\\)\uff0c\u4f46\u8fd9\u9700\u8981 \\(O(n^2)\\) \u89c4\u6a21\u5e76\u4ea7\u751f\u9700\u8981\u9608\u503c\u5316\u7684\u5bc6\u96c6\u8f93\u51fa\u3002\u6f5c\u5728\u7a7a\u95f4\u5141\u8bb8\u5e73\u6ed1\u63d2\u503c\uff1a\u5728\u4e24\u4e2a\u5206\u5b50\u5d4c\u5165\u4e4b\u95f4\u79fb\u52a8\u4f1a\u4ea7\u751f\u5316\u5b66\u4e0a\u6709\u6548\u7684\u4e2d\u95f4\u7ed3\u6784\u3002</p> </li> <li> <p>\u57fa\u4e8e\u6269\u6563\u7684\u751f\u6210\u5c06\u6269\u6563\u6846\u67b6\uff08\u7b2c8\u7ae0\uff09\u5e94\u7528\u4e8e\u56fe\u3002\u524d\u5411\u8fc7\u7a0b\u9010\u6e10\u5411\u8282\u70b9\u7279\u5f81\u548c\u8fb9\u7ed3\u6784\u6dfb\u52a0\u566a\u58f0\u3002\u53cd\u5411\u8fc7\u7a0b\u5b66\u4e60\u53bb\u566a\uff0c\u4ece\u566a\u58f0\u4e2d\u751f\u6210\u6709\u6548\u7684\u56fe\u3002DiGress\uff08Vignac\u7b49\uff0c2023\uff09\u5bf9\u8282\u70b9\u7c7b\u578b\u548c\u8fb9\u7c7b\u578b\u5e94\u7528\u79bb\u6563\u6269\u6563\uff0c\u81ea\u7136\u5730\u5904\u7406\u56fe\u6570\u636e\u7684\u5206\u7c7b\u6027\u8d28\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u5206\u5b50\u751f\u6210\uff0c\u5173\u952e\u7ea6\u675f\u662f\u5316\u5b66\u6709\u6548\u6027\uff1a\u751f\u6210\u7684\u5206\u5b50\u5fc5\u987b\u9075\u5b88\u5316\u5408\u4ef7\u89c4\u5219\uff08\u78b3\u5f62\u62104\u4e2a\u952e\uff0c\u6c27\u5f62\u62102\u4e2a\uff0c\u7b49\u7b49\uff09\u3002Junction Tree VAE\uff08JT-VAE\uff09\u7b49\u65b9\u5c06\u5206\u5b50\u5206\u89e3\u4e3a\u6709\u6548\u5b50\u7ed3\u6784\uff08\u73af\u3001\u94fe\u3001\u5b98\u80fd\u56e2\uff09\uff0c\u5e76\u901a\u8fc7\u7ec4\u88c5\u8fd9\u4e9b\u6784\u5efa\u5757\u6765\u751f\u6210\uff0c\u901a\u8fc7\u6784\u9020\u4fdd\u8bc1\u6709\u6548\u6027\u3002</p> </li> <li> <p>\u76ee\u6807\u5bfc\u5411\u751f\u6210\u4f18\u5316\u7279\u5b9a\u6027\u8d28\uff1a\u751f\u6210\u5bf9\u9776\u86cb\u767d\u5177\u6709\u9ad8\u7ed3\u5408\u4eb2\u548c\u529b\u3001\u4f4e\u6bd2\u6027\u548c\u826f\u597d\u6eb6\u89e3\u5ea6\u7684\u5206\u5b50\u3002\u8fd9\u5728\u4e00\u4e2a\u5faa\u73af\u4e2d\u7ed3\u5408\u4e86\u56fe\u751f\u6210\u4e0e\u6027\u8d28\u9884\u6d4b\uff08\u4f7f\u75283D GNN\u4f5c\u4e3a\u6027\u8d28\u8bc4\u4f30\u5668\uff09\uff1a\u751f\u6210 \u2192 \u8bc4\u4f30 \u2192 \u7cbe\u70bc\u3002\u5f3a\u5316\u5b66\u4e60\uff08\u7b2c6\u7ae0\uff09\u6216\u8d1d\u53f6\u65af\u4f18\u5316\u6307\u5bfc\u7740\u5316\u5b66\u7a7a\u95f4\u7684\u641c\u7d22\u3002</p> </li> <li> <p>DiffDock\uff08Corso\u7b49\uff0c2023\uff09\u4f7f\u7528SE(3)\u7b49\u53d8\u6269\u6563\u6765\u9884\u6d4b\u836f\u7269\u5206\u5b50\u5982\u4f55\u5bf9\u63a5\u5165\u86cb\u767d\u8d28\u7ed3\u5408\u53e3\u888b\u3002\u8be5\u6a21\u578b\u901a\u8fc7\u4ece\u968f\u673a\u4f4d\u7f6e\u53bb\u566a\u6765\u751f\u62103D\u7ed3\u5408\u59ff\u6001\uff08\u836f\u7269\u76f8\u5bf9\u4e8e\u86cb\u767d\u8d28\u7684\u4f4d\u7f6e\u548c\u671d\u5411\uff09\uff0c\u5c06\u672c\u6587\u4ef6\u4e2d\u76843D\u7b49\u53d8\u7f51\u7edc\u4e0e\u7b2c8\u7ae0\u7684\u6269\u6563\u6846\u67b6\u76f8\u7ed3\u5408\u3002</p> </li> </ul>"},{"location":"chapter%2012%3A%20graph%20neural%20networks/05.%203d%20graph%20networks/#colabnotebook","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216notebook\uff09","text":"<ol> <li> <p>\u6784\u5efa\u4e00\u4e2a\u4f7f\u7528\u539f\u5b50\u95f4\u8ddd\u79bb\u7684\u7b80\u5355\u4e0d\u53d83D\u6d88\u606f\u4f20\u9012\u5c42\u3002\u5c06\u5176\u5e94\u7528\u4e8e\u4e00\u4e2a\u5c0f\u5206\u5b50\uff08\u6c34\uff1aH-O-H\uff09\uff0c\u5e76\u9a8c\u8bc1\u8f93\u51fa\u5bf9\u65cb\u8f6c\u662f\u4e0d\u53d8\u7684\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\n# \u6c34\u5206\u5b50\uff1aO\u5728\u539f\u70b9\uff0c\u4e24\u4e2aH\u539f\u5b50\npositions = jnp.array([[0.0, 0.0, 0.0],     # O\n                        [0.96, 0.0, 0.0],    # H1\n                        [-0.24, 0.93, 0.0]])  # H2\n\n# \u8282\u70b9\u7279\u5f81\uff1a[\u539f\u5b50\u5e8f\u6570]\nfeatures = jnp.array([[8.0], [1.0], [1.0]])\n\n# \u8ba1\u7b97\u6210\u5bf9\u8ddd\u79bb\uff08\u4e0d\u53d8\u7684\uff09\ndef pairwise_distances(pos):\n    diff = pos[:, None, :] - pos[None, :, :]\n    return jnp.sqrt(jnp.sum(diff**2, axis=-1) + 1e-8)\n\n# \u7b80\u5355\u7684\u57fa\u4e8e\u8ddd\u79bb\u7684\u6d88\u606f\u4f20\u9012\ndef invariant_message_pass(features, positions):\n    dists = pairwise_distances(positions)\n    # \u5177\u67094\u4e2a\u4e2d\u5fc3\u7684RBF\u6269\u5c55\n    centres = jnp.array([0.5, 1.0, 1.5, 2.0])\n    rbf = jnp.exp(-5.0 * (dists[:, :, None] - centres[None, None, :]) ** 2)\n\n    # \u6d88\u606f\uff1a\u7531\u8ddd\u79bb\u76f8\u5173\u6ee4\u6ce2\u5668\u52a0\u6743\u7684\u7279\u5f81\n    messages = jnp.einsum(\"ij,jd-&gt;id\", rbf.sum(axis=-1), features)\n    return messages\n\noutput1 = invariant_message_pass(features, positions)\n\n# \u5c06\u5206\u5b50\u7ed5z\u8f74\u65cb\u8f6c90\u5ea6\nR = jnp.array([[0, -1, 0], [1, 0, 0], [0, 0, 1]], dtype=float)\nrotated_positions = (R @ positions.T).T\n\noutput2 = invariant_message_pass(features, rotated_positions)\n\nprint(f\"\u539f\u59cb\u8f93\u51fa:\\n{output1}\")\nprint(f\"\\n\u65cb\u8f6c\u540e\u8f93\u51fa:\\n{output2}\")\nprint(f\"\\n\u4e0d\u53d8\u6027: {jnp.allclose(output1, output2, atol=1e-5)}\")\n</code></pre></p> </li> <li> <p>\u8ba1\u7b97\u4e09\u4e2a\u539f\u5b50\u4e4b\u95f4\u7684\u952e\u89d2\uff0c\u5e76\u9a8c\u8bc1\u5176\u5bf9\u65cb\u8f6c\u4e0d\u53d8\u3002 <pre><code>import jax.numpy as jnp\n\ndef bond_angle(r_i, r_j, r_k):\n    \"\"\"\u8282\u70b9j\u5904\u8fb9j-&gt;i\u548cj-&gt;k\u4e4b\u95f4\u7684\u89d2\u5ea6\u3002\"\"\"\n    v1 = r_i - r_j\n    v2 = r_k - r_j\n    cos_angle = jnp.dot(v1, v2) / (jnp.linalg.norm(v1) * jnp.linalg.norm(v2))\n    return jnp.arccos(jnp.clip(cos_angle, -1, 1))\n\n# \u4e09\u4e2a\u539f\u5b50\nr1 = jnp.array([1.0, 0.0, 0.0])\nr2 = jnp.array([0.0, 0.0, 0.0])\nr3 = jnp.array([0.0, 1.0, 0.0])\n\nangle_original = bond_angle(r1, r2, r3)\nprint(f\"\u539f\u59cb\u89d2\u5ea6: {jnp.degrees(angle_original):.1f}\u00b0\")\n\n# \u5e94\u7528\u968f\u673a\u65cb\u8f6c\nR = jnp.array([[0.36, 0.48, -0.80],\n               [-0.80, 0.60, 0.00],\n               [0.48, 0.64, 0.60]])\nr1_rot, r2_rot, r3_rot = R @ r1, R @ r2, R @ r3\n\nangle_rotated = bond_angle(r1_rot, r2_rot, r3_rot)\nprint(f\"\u65cb\u8f6c\u540e\u89d2\u5ea6:  {jnp.degrees(angle_rotated):.1f}\u00b0\")\nprint(f\"\u4e0d\u53d8\u6027: {jnp.allclose(angle_original, angle_rotated, atol=1e-4)}\")\n</code></pre></p> </li> <li> <p>\u6f14\u793a\u7b49\u53d8\u4f4d\u7f6e\u66f4\u65b0\uff08EGNN\u98ce\u683c\uff09\u3002\u4f7f\u7528\u8ddd\u79bb\u52a0\u6743\u7684\u76f8\u5bf9\u5411\u91cf\u66f4\u65b0\u8282\u70b9\u4f4d\u7f6e\uff0c\u5e76\u9a8c\u8bc1\u7b49\u53d8\u6027\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\ndef egnn_position_update(positions, features):\n    \"\"\"\u7b80\u5355\u7684EGNN\u98ce\u683c\u7b49\u53d8\u4f4d\u7f6e\u66f4\u65b0\u3002\"\"\"\n    n = positions.shape[0]\n    new_positions = jnp.zeros_like(positions)\n\n    for i in range(n):\n        shift = jnp.zeros(3)\n        for j in range(n):\n            if i != j:\n                r_ij = positions[i] - positions[j]\n                d_ij = jnp.linalg.norm(r_ij)\n                # \u57fa\u4e8e\u8ddd\u79bb\u7684\u6743\u91cd\uff08\u7b80\u5355\uff1a\u53cd\u6bd4\u8ddd\u79bb\uff09\n                weight = 1.0 / (d_ij + 1.0)\n                # \u6309\u7279\u5f81\u76f8\u4f3c\u5ea6\u7f29\u653e\n                feat_sim = jnp.dot(features[i], features[j])\n                shift = shift + weight * feat_sim * r_ij\n        new_positions = new_positions.at[i].set(positions[i] + 0.1 * shift)\n\n    return new_positions\n\n# 3\u4e2a\u539f\u5b50\npos = jnp.array([[0.0, 0.0, 0.0], [1.0, 0.0, 0.0], [0.0, 1.0, 0.0]])\nfeat = jnp.array([[1.0, 0.5], [0.5, 1.0], [0.8, 0.3]])\n\n# \u66f4\u65b0\u4f4d\u7f6e\npos_new = egnn_position_update(pos, feat)\n\n# \u73b0\u5728\u65cb\u8f6c\u8f93\u5165\u3001\u66f4\u65b0\uff0c\u5e76\u68c0\u67e5\u8f93\u51fa\u662f\u5426\u4e00\u81f4\u5730\u65cb\u8f6c\nR = jnp.array([[0.0, -1.0, 0.0], [1.0, 0.0, 0.0], [0.0, 0.0, 1.0]])\npos_rot = (R @ pos.T).T\npos_new_from_rot = egnn_position_update(pos_rot, feat)\n\n# \u5e94\u4e0e\u65cb\u8f6c\u539f\u59cb\u8f93\u51fa\u76f8\u540c\npos_new_then_rot = (R @ pos_new.T).T\n\nprint(f\"\u5148\u66f4\u65b0\u518d\u65cb\u8f6c:\\n{jnp.round(pos_new_then_rot, 4)}\")\nprint(f\"\\n\u5148\u65cb\u8f6c\u518d\u66f4\u65b0:\\n{jnp.round(pos_new_from_rot, 4)}\")\nprint(f\"\\n\u7b49\u53d8\u6027: {jnp.allclose(pos_new_then_rot, pos_new_from_rot, atol=1e-4)}\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2013%3A%20computing%20and%20OS/01.%20discrete%20maths/","title":"\u79bb\u6563\u6570\u5b66","text":"<p>\u79bb\u6563\u6570\u5b66\u662f\u5173\u4e8e\u53ef\u6570\u3001\u5206\u79bb\u7ed3\u6784\u7684\u6570\u5b66\uff0c\u662f\u8ba1\u7b97\u6784\u5efa\u7684\u57fa\u7840\u3002\u672c\u6587\u6db5\u76d6\u547d\u9898\u903b\u8f91\u4e0e\u8c13\u8bcd\u903b\u8f91\u3001\u8bc1\u660e\u6280\u5de7\u3001\u96c6\u5408\u3001\u5173\u7cfb\u3001\u51fd\u6570\u3001\u56fe\u8bba\u57fa\u7840\u4ee5\u53ca\u9012\u63a8\u5173\u7cfb\u3002</p> <ul> <li> <p>\u5728\u524d\u9762\u7684\u7ae0\u8282\u4e2d\uff0c\u6211\u4eec\u7814\u7a76\u4e86\u8fde\u7eed\u6570\u5b66\uff1a\u5fae\u79ef\u5206\uff08\u7b2c3\u7ae0\uff09\u3001\u6982\u7387\u5206\u5e03\uff08\u7b2c5\u7ae0\uff09\u4ee5\u53ca\u5b9e\u503c\u53c2\u6570\u7684\u4f18\u5316\uff08\u7b2c6\u7ae0\uff09\u3002\u4f46\u8ba1\u7b97\u673a\u672c\u8d28\u4e0a\u662f\u79bb\u6563\u673a\u5668\u3002\u5b83\u4eec\u5b58\u50a8\u6bd4\u7279\uff080\u62161\uff09\uff0c\u5904\u7406\u6574\u6570\uff0c\u9075\u5faa\u5206\u652f\u903b\u8f91\uff0c\u5e76\u64cd\u4f5c\u6709\u9650\u6570\u636e\u7ed3\u6784\u3002\u79bb\u6563\u6570\u5b66\u63d0\u4f9b\u4e86\u63a8\u7406\u8fd9\u4e9b\u7ed3\u6784\u7684\u5f62\u5f0f\u5316\u8bed\u8a00\u3002</p> </li> <li> <p>\u672c\u7ae0\u6240\u6709\u5185\u5bb9\u90fd\u5efa\u7acb\u5728\u79bb\u6563\u6570\u5b66\u4e4b\u4e0a\uff1a\u5904\u7406\u5668\u903b\u8f91\u95e8\u662f\u5e03\u5c14\u4ee3\u6570\uff0c\u8c03\u5ea6\u7b97\u6cd5\u9700\u8981\u6b63\u786e\u6027\u8bc1\u660e\uff0c\u5185\u5b58\u7ba1\u7406\u4f7f\u7528\u96c6\u5408\u8fd0\u7b97\uff0c\u7b97\u6cd5\u5206\u6790\u9700\u8981\u9012\u63a8\u5173\u7cfb\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/01.%20discrete%20maths/#_2","title":"\u547d\u9898\u903b\u8f91","text":"<ul> <li> <p>\u547d\u9898\u903b\u8f91\u662f\u771f\u5047\u8bed\u53e5\u7684\u4ee3\u6570\u3002\u4e00\u4e2a\u547d\u9898\u662f\u4e00\u4e2a\u8981\u4e48\u4e3a\u771f\uff08T\uff09\u8981\u4e48\u4e3a\u5047\uff08F\uff09\u7684\u9648\u8ff0\uff0c\u7edd\u4e0d\u4f1a\u4e24\u8005\u517c\u6709\u3002\"\u5929\u5728\u4e0b\u96e8\"\u662f\u4e00\u4e2a\u547d\u9898\u3002\"\u73b0\u5728\u51e0\u70b9\u4e86\uff1f\"\u5219\u4e0d\u662f\uff08\u5b83\u662f\u4e00\u4e2a\u95ee\u53e5\uff0c\u4e0d\u662f\u5177\u6709\u771f\u503c\u7684\u9648\u8ff0\uff09\u3002</p> </li> <li> <p>\u547d\u9898\u53ef\u4ee5\u901a\u8fc7\u903b\u8f91\u8fde\u63a5\u8bcd\u8fdb\u884c\u7ec4\u5408\uff1a</p> <ul> <li>\u4e0e\uff08\u5408\u53d6\uff0c\\(p \\wedge q\\)\uff09\uff1a\u4ec5\u5f53\\(p\\)\u548c\\(q\\)\u90fd\u4e3a\u771f\u65f6\u4e3a\u771f\u3002</li> <li>\u6216\uff08\u6790\u53d6\uff0c\\(p \\vee q\\)\uff09\uff1a\u5f53\\(p\\)\u6216\\(q\\)\u81f3\u5c11\u4e00\u4e2a\u4e3a\u771f\u65f6\u4e3a\u771f\u3002</li> <li>\u975e\uff08\u5426\u5b9a\uff0c\\(\\neg p\\)\uff09\uff1a\u7ffb\u8f6c\u771f\u503c\u3002</li> <li>\u8574\u542b\uff08\u8574\u6db5\uff0c\\(p \\to q\\)\uff09\uff1a\u4ec5\u5f53\\(p\\)\u4e3a\u771f\u4e14\\(q\\)\u4e3a\u5047\u65f6\u4e3a\u5047\u3002\"\u5982\u679c\u4e0b\u96e8\uff0c\u5730\u5c31\u662f\u6e7f\u7684\"\u53ea\u6709\u5728\u4e0b\u4e86\u96e8\u800c\u5730\u5374\u662f\u5e72\u7684\u65f6\u5019\u624d\u88ab\u8fdd\u53cd\u3002</li> <li>\u5f53\u4e14\u4ec5\u5f53\uff08\u53cc\u6761\u4ef6\uff0c\\(p \\leftrightarrow q\\)\uff09\uff1a\u5f53\u4e24\u8005\u771f\u503c\u76f8\u540c\u65f6\u4e3a\u771f\u3002</li> </ul> </li> <li> <p>\u771f\u503c\u8868\u7a77\u4e3e\u5217\u51fa\u6240\u6709\u53ef\u80fd\u7684\u8f93\u5165\u7ec4\u5408\u53ca\u76f8\u5e94\u7684\u8f93\u51fa\u3002\u5bf9\u4e8e\\(n\\)\u4e2a\u547d\u9898\uff0c\u8be5\u8868\u6709\\(2^n\\)\u884c\u3002\u8fd9\u5c31\u662f\u6211\u4eec\u9a8c\u8bc1\u903b\u8f91\u7b49\u4ef7\u6027\u7684\u65b9\u5f0f\uff1a</p> </li> </ul> \\(p\\) \\(q\\) \\(p \\wedge q\\) \\(p \\vee q\\) \\(p \\to q\\) T T T T T T F F T F F T F T T F F F F T <ul> <li> <p>\u8574\u542b\u884c\u4e2d\\(p\\)\u4e3a\u5047\u7684\u60c5\u51b5\u503c\u5f97\u5173\u6ce8\uff1a\\(F \\to q\\)\u65e0\u8bba\\(q\\)\u4e3a\u4f55\u503c\u90fd\u4e3a\u771f\u3002\u8fd9\u5c31\u662f\u7a7a\u771f\u3002\"\u5982\u679c\u732a\u4f1a\u98de\uff0c\u90a3\u6211\u5c31\u662f\u82f1\u56fd\u56fd\u738b\"\u5728\u903b\u8f91\u4e0a\u4e3a\u771f\uff0c\u56e0\u4e3a\u524d\u63d0\u4e3a\u5047\u3002\u8fd9\u770b\u8d77\u6765\u8fdd\u53cd\u76f4\u89c9\uff0c\u4f46\u5bf9\u6570\u5b66\u63a8\u7406\u81f3\u5173\u91cd\u8981\u3002</p> </li> <li> <p>\u903b\u8f91\u7b49\u4ef7\u5f0f\u662f\u5bf9\u6240\u6709\u771f\u503c\u90fd\u6210\u7acb\u7684\u6052\u7b49\u5f0f\uff1a</p> <ul> <li> <p>\u5fb7\u6469\u6839\u5b9a\u5f8b\uff1a\\(\\neg(p \\wedge q) \\equiv \\neg p \\vee \\neg q\\) \u548c \\(\\neg(p \\vee q) \\equiv \\neg p \\wedge \\neg q\\)\u3002\u8981\u5426\u5b9a\u4e00\u4e2aAND\uff0c\u5206\u522b\u5426\u5b9a\u6bcf\u4e2a\u90e8\u5206\u5e76\u5207\u6362\u4e3aOR\uff08\u53cd\u4e4b\u4ea6\u7136\uff09\u3002\u8fd9\u4e9b\u76f4\u63a5\u51fa\u73b0\u5728\u7f16\u7a0b\u4e2d\uff1a<code>!(a &amp;&amp; b)</code> \u7b49\u4ef7\u4e8e <code>(!a || !b)</code>\u3002</p> </li> <li> <p>\u9006\u5426\u547d\u9898\uff1a\\(p \\to q \\equiv \\neg q \\to \\neg p\\)\u3002\"\u5982\u679c\u4e0b\u96e8\uff0c\u5730\u5c31\u662f\u6e7f\u7684\"\u7b49\u4ef7\u4e8e\"\u5982\u679c\u5730\u4e0d\u662f\u6e7f\u7684\uff0c\u90a3\u4e48\u5c31\u6ca1\u4e0b\u96e8\u3002\"\u8fd9\u662f\u4e00\u4e2a\u5f3a\u5927\u7684\u8bc1\u660e\u6280\u5de7\u3002</p> </li> <li> <p>\u53cc\u91cd\u5426\u5b9a\uff1a\\(\\neg(\\neg p) \\equiv p\\)\u3002</p> </li> <li> <p>\u5206\u914d\u5f8b\uff1a\\(p \\wedge (q \\vee r) \\equiv (p \\wedge q) \\vee (p \\wedge r)\\)\u3002</p> </li> </ul> </li> <li> <p>\u4e00\u4e2a\u603b\u662f\u4e3a\u771f\uff08\u5bf9\u6240\u6709\u771f\u503c\u6307\u6d3e\uff09\u7684\u516c\u5f0f\u662f\u91cd\u8a00\u5f0f\u3002\u603b\u662f\u4e3a\u5047\u7684\u516c\u5f0f\u662f\u77db\u76fe\u5f0f\u3002\u6709\u65f6\u771f\u6709\u65f6\u5047\u7684\u516c\u5f0f\u662f\u5076\u7136\u5f0f\u3002\u4f8b\u5982\uff0c\\(p \\vee \\neg p\\)\u662f\u91cd\u8a00\u5f0f\uff0c\\(p \\wedge \\neg p\\)\u662f\u77db\u76fe\u5f0f\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/01.%20discrete%20maths/#_3","title":"\u8c13\u8bcd\u903b\u8f91\u4e0e\u91cf\u8bcd","text":"<ul> <li> <p>\u547d\u9898\u903b\u8f91\u65e0\u6cd5\u8868\u8fbe\u5173\u4e8e\u96c6\u5408\u4e2d\u6240\u6709\u6216\u67d0\u4e9b\u5143\u7d20\u7684\u9648\u8ff0\u3002\"\u6bcf\u4e2a\u5927\u4e8e2\u7684\u7d20\u6570\u90fd\u662f\u5947\u6570\"\u9700\u8981\u8c13\u8bcd\u903b\u8f91\uff0c\u5b83\u7528\u53d8\u91cf\u3001\u8c13\u8bcd\u548c\u91cf\u8bcd\u6269\u5c55\u4e86\u547d\u9898\u903b\u8f91\u3002</p> </li> <li> <p>\u8c13\u8bcd\u662f\u4f9d\u8d56\u4e8e\u53d8\u91cf\u7684\u9648\u8ff0\uff1a\\(P(x)\\) = \"\\(x\\)\u662f\u5076\u6570\u3002\"\u5f53\u7ed9\u5b9a\\(x\\)\u4e00\u4e2a\u5177\u4f53\u503c\u65f6\uff0c\u5b83\u6210\u4e3a\u4e00\u4e2a\u547d\u9898\uff1a\\(P(4)\\)\u4e3a\u771f\uff0c\\(P(7)\\)\u4e3a\u5047\u3002</p> </li> <li> <p>\u91cf\u8bcd\u8868\u8fbe\u8303\u56f4\uff1a</p> <ul> <li>\u5168\u79f0\u91cf\u8bcd\uff08\\(\\forall\\)\uff09\uff1a\"\u5bf9\u4e8e\u6240\u6709\u3002\" \\(\\forall x \\, P(x)\\) \u8868\u793a\"\\(P(x)\\)\u5bf9\u8bba\u57df\u4e2d\u7684\u6bcf\u4e00\u4e2a\\(x\\)\u6210\u7acb\u3002\"</li> <li>\u5b58\u5728\u91cf\u8bcd\uff08\\(\\exists\\)\uff09\uff1a\"\u5b58\u5728\u3002\" \\(\\exists x \\, P(x)\\) \u8868\u793a\"\u81f3\u5c11\u5b58\u5728\u4e00\u4e2a\\(x\\)\u4f7f\u5f97\\(P(x)\\)\u4e3a\u771f\u3002\"</li> </ul> </li> <li> <p>\u5426\u5b9a\u91cf\u8bcd\u4f1a\u7ffb\u8f6c\u5b83\u4eec\uff1a\\(\\neg(\\forall x \\, P(x)) \\equiv \\exists x \\, \\neg P(x)\\)\u3002\"\u4e0d\u662f\u6240\u6709\u4eba\u90fd\u901a\u8fc7\u4e86\"\u610f\u5473\u7740\"\u6709\u4eba\u6ca1\u901a\u8fc7\u3002\"\u800c \\(\\neg(\\exists x \\, P(x)) \\equiv \\forall x \\, \\neg P(x)\\)\u3002\"\u6ca1\u6709\u5b8c\u7f8e\u7684\u7b97\u6cd5\"\u610f\u5473\u7740\"\u6bcf\u4e2a\u7b97\u6cd5\u90fd\u6709\u7f3a\u9677\u3002\"</p> </li> <li> <p>\u5d4c\u5957\u91cf\u8bcd\u8868\u8fbe\u590d\u6742\u5173\u7cfb\u3002\\(\\forall x \\, \\exists y \\, (y &gt; x)\\) \u8868\u793a\"\u5bf9\u4e8e\u6bcf\u4e2a\u6570\uff0c\u90fd\u6709\u4e00\u4e2a\u66f4\u5927\u7684\u6570\"\uff08\u5bf9\u6574\u6570\u6210\u7acb\uff09\u3002\u987a\u5e8f\u5f88\u91cd\u8981\uff1a\\(\\exists y \\, \\forall x \\, (y &gt; x)\\) \u8868\u793a\"\u5b58\u5728\u4e00\u4e2a\u6bd4\u6240\u6709\u5176\u4ed6\u6570\u90fd\u5927\u7684\u6570\"\uff08\u5bf9\u6574\u6570\u4e0d\u6210\u7acb\uff09\u3002</p> </li> <li> <p>\u8c13\u8bcd\u903b\u8f91\u662f\u5f62\u5f0f\u5316\u89c4\u7ea6\u7684\u8bed\u8a00\u3002\u5f53\u6211\u4eec\u8bf4\u4e00\u4e2a\u7b97\u6cd5\u662f\"\u6b63\u786e\"\u7684\uff0c\u610f\u5473\u7740 \\(\\forall \\text{\u8f93\u5165} \\, x, \\, \\text{\u8f93\u51fa}(x) = \\text{\u671f\u671b\u8f93\u51fa}(x)\\)\u3002\u5f53\u6211\u4eec\u8bf4\u5b83\"\u7ec8\u6b62\"\uff0c\u610f\u5473\u7740 \\(\\forall x \\, \\exists t \\, \\text{\u7ec8\u6b62}(x, t)\\)\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/01.%20discrete%20maths/#_4","title":"\u8bc1\u660e\u6280\u5de7","text":"<ul> <li> <p>\u8bc1\u660e\u662f\u786e\u7acb\u4e00\u4e2a\u9648\u8ff0\u771f\u7406\u6027\u3001\u6beb\u65e0\u7591\u4e49\u7684\u903b\u8f91\u8bba\u8bc1\u3002\u4e0e\u7ecf\u9a8c\u8bc1\u636e\uff08\u4ec5\u5c55\u793a\u5728\u67d0\u4e9b\u6d4b\u8bd5\u6848\u4f8b\u4e0b\u6709\u6548\uff09\u4e0d\u540c\uff0c\u8bc1\u660e\u4fdd\u8bc1\u5728\u6240\u6709\u60c5\u51b5\u4e0b\u6210\u7acb\u3002\u8fd9\u662f\u8ba1\u7b97\u673a\u79d1\u5b66\u4e2d\u6b63\u786e\u6027\u7684\u6807\u51c6\u3002</p> </li> <li> <p>\u76f4\u63a5\u8bc1\u660e\uff1a\u5047\u8bbe\u524d\u63d0\uff0c\u901a\u8fc7\u903b\u8f91\u6b65\u9aa4\u63a8\u5bfc\u51fa\u7ed3\u8bba\u3002\u8981\u8bc1\u660e\"\u5982\u679c\\(n\\)\u662f\u5076\u6570\uff0c\u90a3\u4e48\\(n^2\\)\u662f\u5076\u6570\"\uff1a\u5047\u8bbe\\(n = 2k\\)\u5bf9\u4e8e\u67d0\u4e2a\u6574\u6570\\(k\\)\uff0c\u5219\\(n^2 = 4k^2 = 2(2k^2)\\)\uff0c\u8fd9\u662f\u5076\u6570\u3002</p> </li> <li> <p>\u53cd\u8bc1\u6cd5\uff1a\u5047\u8bbe\u8be5\u9648\u8ff0\u4e3a\u5047\uff0c\u63a8\u5bfc\u51fa\u77db\u76fe\u3002\u8981\u8bc1\u660e\\(\\sqrt{2}\\)\u662f\u65e0\u7406\u6570\uff1a\u5047\u8bbe\\(\\sqrt{2} = a/b\\)\uff08\u5df2\u7ea6\u7b80\uff09\u3002\u90a3\u4e48\\(2 = a^2/b^2\\)\uff0c\u6240\u4ee5\\(a^2 = 2b^2\\)\uff0c\u610f\u5473\u7740\\(a^2\\)\u662f\u5076\u6570\uff0c\u6240\u4ee5\\(a\\)\u662f\u5076\u6570\uff0c\u8bbe\\(a = 2c\\)\u3002\u90a3\u4e48\\(4c^2 = 2b^2\\)\uff0c\u6240\u4ee5\\(b^2 = 2c^2\\)\uff0c\u610f\u5473\u7740\\(b\\)\u4e5f\u662f\u5076\u6570\u3002\u4f46\u6211\u4eec\u5df2\u7ecf\u5047\u8bbe\\(a/b\\)\u662f\u7ea6\u7b80\u5f62\u5f0f\u2014\u2014\u77db\u76fe\u3002</p> </li> <li> <p>\u5f52\u7eb3\u8bc1\u660e\uff1a\u901a\u8fc7\u8bc1\u660e\u4ee5\u4e0b\u4e24\u70b9\u6765\u8bc1\u660e\u4e00\u4e2a\u9648\u8ff0\u5bf9\u6240\u6709\u81ea\u7136\u6570\u6210\u7acb\uff1a\uff081\uff09\u57fa\u7840\u60c5\u5f62\u6210\u7acb\uff08\u901a\u5e38\\(n = 0\\)\u6216\\(n = 1\\)\uff09\uff0c\u548c\uff082\uff09\u5f52\u7eb3\u6b65\u9aa4\uff1a\u5982\u679c\u9648\u8ff0\u5bf9\\(n = k\\)\u6210\u7acb\uff08\u5f52\u7eb3\u5047\u8bbe\uff09\uff0c\u90a3\u4e48\u5b83\u5bf9\\(n = k + 1\\)\u4e5f\u6210\u7acb\u3002</p> </li> <li> <p>\u4f8b\u5982\uff0c\u8bc1\u660e \\(\\sum_{i=1}^{n} i = \\frac{n(n+1)}{2}\\)\uff1a</p> <ul> <li>\u57fa\u7840\u60c5\u5f62\uff1a\\(n = 1\\)\uff1a\\(1 = \\frac{1 \\cdot 2}{2} = 1\\)\u3002\u6210\u7acb\u3002</li> <li>\u5f52\u7eb3\u6b65\u9aa4\uff1a\u5047\u8bbe \\(\\sum_{i=1}^{k} i = \\frac{k(k+1)}{2}\\)\u3002\u90a3\u4e48 \\(\\sum_{i=1}^{k+1} i = \\frac{k(k+1)}{2} + (k+1) = \\frac{k(k+1) + 2(k+1)}{2} = \\frac{(k+1)(k+2)}{2}\\)\u3002\u8fd9\u6b63\u662f\\(n = k+1\\)\u65f6\u7684\u516c\u5f0f\u3002\u8bc1\u660e\u5b8c\u6210\u3002</li> </ul> </li> <li> <p>\u5f52\u7eb3\u6cd5\u662f\u8bc1\u660e\u9012\u5f52\u7b97\u6cd5\u548c\u6570\u636e\u7ed3\u6784\u6027\u8d28\u7684\u4e3b\u529b\u5de5\u5177\u3002\u6bcf\u4e2a\u9012\u5f52\u7b97\u6cd5\u90fd\u6697\u542b\u4e00\u4e2a\u5f52\u7eb3\u6b63\u786e\u6027\u8bc1\u660e\uff1a\u57fa\u7840\u60c5\u5f62\u662f\u7ec8\u6b62\u6761\u4ef6\uff0c\u5f52\u7eb3\u6b65\u9aa4\u662f\u9012\u5f52\u8c03\u7528\u3002</p> </li> <li> <p>\u5f3a\u5f52\u7eb3\u6cd5\u5047\u8bbe\u8be5\u9648\u8ff0\u5bf9\u6240\u6709\u4e0d\u5927\u4e8e\\(k\\)\u7684\u503c\u90fd\u6210\u7acb\uff08\u4e0d\u4ec5\u4ec5\u662f\\(k\\)\uff09\uff0c\u7136\u540e\u8bc1\u660e\u5b83\u5bf9\\(k + 1\\)\u6210\u7acb\u3002\u5f53\u9012\u5f52\u4f9d\u8d56\u4e8e\u591a\u4e2a\u4e4b\u524d\u7684\u503c\u65f6\uff0c\u8fd9\u5f88\u6709\u7528\u3002</p> </li> <li> <p>\u9e3d\u5de2\u539f\u7406\uff1a\u5982\u679c\u628a\\(n+1\\)\u4e2a\u7269\u4f53\u653e\u5165\\(n\\)\u4e2a\u76d2\u5b50\u4e2d\uff0c\u81f3\u5c11\u6709\u4e00\u4e2a\u76d2\u5b50\u5305\u542b\u4e24\u4e2a\u7269\u4f53\u3002\u7b80\u5355\u4f46\u51fa\u5947\u5730\u5f3a\u5927\u3002\u5b83\u8bc1\u660e\u4e86\u5728\u4efb\u4f5513\u4e2a\u4eba\u4e2d\uff0c\u81f3\u5c11\u6709\u4e24\u4e2a\u4eba\u51fa\u751f\u6708\u4efd\u76f8\u540c\u3002\u5728\u7f51\u7edc\u4e2d\uff0c\u5b83\u8bc1\u660e\u4e86\u5f53\u9879\u76ee\u6570\u8d85\u8fc7\u6876\u6570\u65f6\uff0c\u54c8\u5e0c\u51b2\u7a81\u662f\u4e0d\u53ef\u907f\u514d\u7684\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/01.%20discrete%20maths/#_5","title":"\u96c6\u5408","text":"<ul> <li> <p>\u96c6\u5408\u662f\u4e0d\u540c\u5143\u7d20\u7684\u65e0\u5e8f\u6536\u96c6\u3002\u96c6\u5408\u662f\u6570\u5b66\u4e2d\u6700\u539f\u59cb\u7684\u6570\u636e\u7ed3\u6784\uff0c\u652f\u6491\u7740\u4ece\u7c7b\u578b\u7cfb\u7edf\u5230\u6570\u636e\u5e93\u67e5\u8be2\u7684\u4e00\u5207\u3002</p> </li> <li> <p>\u96c6\u5408\u8fd0\u7b97\uff08\u8054\u7cfb\u7b2c5\u7ae0\uff0c\u6211\u4eec\u5728\u90a3\u91cc\u7528\u8fd9\u4e9b\u8fdb\u884c\u6982\u7387\u8ba1\u7b97\uff09\uff1a</p> <ul> <li>\u5e76\u96c6 \\(A \\cup B\\)\uff1a\u5728\\(A\\)\u6216\\(B\\)\u6216\u4e24\u8005\u4e2d\u7684\u5143\u7d20\u3002</li> <li>\u4ea4\u96c6 \\(A \\cap B\\)\uff1a\u540c\u65f6\u5728\\(A\\)\u548c\\(B\\)\u4e2d\u7684\u5143\u7d20\u3002</li> <li>\u8865\u96c6 \\(\\bar{A}\\)\uff1a\u4e0d\u5728\\(A\\)\u4e2d\u7684\u5143\u7d20\uff08\u76f8\u5bf9\u4e8e\u4e00\u4e2a\u5168\u96c6\uff09\u3002</li> <li>\u5dee\u96c6 \\(A \\setminus B\\)\uff1a\u5728\\(A\\)\u4e2d\u4f46\u4e0d\u5728\\(B\\)\u4e2d\u7684\u5143\u7d20\u3002</li> <li>\u7b1b\u5361\u5c14\u79ef \\(A \\times B\\)\uff1a\u6240\u6709\u6709\u5e8f\u5bf9\\((a, b)\\)\uff0c\u5176\u4e2d\\(a \\in A, b \\in B\\)\u3002</li> </ul> </li> <li> <p>\u5e42\u96c6 \\(\\mathcal{P}(A)\\) \u662f\\(A\\)\u7684\u6240\u6709\u5b50\u96c6\u6784\u6210\u7684\u96c6\u5408\u3002\u5982\u679c \\(|A| = n\\)\uff0c\u90a3\u4e48 \\(|\\mathcal{P}(A)| = 2^n\\)\u3002\u5bf9\u4e8e \\(A = \\{1, 2\\}\\)\uff1a\\(\\mathcal{P}(A) = \\{\\emptyset, \\{1\\}, \\{2\\}, \\{1, 2\\}\\}\\)\u3002</p> </li> <li> <p>\u57fa\u6570\u8861\u91cf\u96c6\u5408\u5927\u5c0f\u3002\u6709\u9650\u96c6\u5177\u6709\u6574\u6570\u57fa\u6570\u3002\u65e0\u9650\u96c6\u6709\u4e0d\u540c\u7684\u5927\u5c0f\uff1a\u81ea\u7136\u6570\\(\\mathbb{N}\\)\u548c\u6709\u7406\u6570\\(\\mathbb{Q}\\)\u662f\u53ef\u6570\u65e0\u7a77\uff08\u53ef\u4ee5\u5217\u4e3e\uff09\uff0c\u800c\u5b9e\u6570\\(\\mathbb{R}\\)\u662f\u4e0d\u53ef\u6570\u65e0\u7a77\uff08\u65e0\u6cd5\u5217\u4e3e\uff0c\u7531\u5eb7\u6258\u5c14\u7684\u5bf9\u89d2\u7ebf\u8bba\u8bc1\u8bc1\u660e\uff09\u3002\u8fd9\u79cd\u533a\u522b\u5728\u53ef\u8ba1\u7b97\u6027\u7406\u8bba\u4e2d\u5f88\u91cd\u8981\uff1a\u5b58\u5728\u4e0d\u53ef\u6570\u591a\u4e2a\u51fd\u6570\uff0c\u4f46\u53ea\u6709\u53ef\u6570\u591a\u4e2a\u7a0b\u5e8f\uff0c\u56e0\u6b64\u5927\u591a\u6570\u51fd\u6570\u662f\u4e0d\u53ef\u8ba1\u7b97\u7684\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/01.%20discrete%20maths/#_6","title":"\u5173\u7cfb","text":"<ul> <li> <p>\u96c6\u5408\\(A\\)\u4e0a\u7684\u5173\u7cfb\\(R\\)\u662f\\(A \\times A\\)\u7684\u4e00\u4e2a\u5b50\u96c6\uff1a\u6307\u5b9a\u54ea\u4e9b\u5143\u7d20\u76f8\u5173\u8054\u7684\u6709\u5e8f\u5bf9\u96c6\u5408\u3002\u4f8b\u5982\uff0c\u6574\u6570\u4e0a\u7684\\(\\leq\\)\u662f\u96c6\u5408 \\(\\{(a, b) : a \\leq b\\}\\)\u3002</p> </li> <li> <p>\u5173\u7cfb\u7684\u91cd\u8981\u6027\u8d28\uff1a</p> <ul> <li>\u81ea\u53cd\u6027\uff1a\u6bcf\u4e2a\u5143\u7d20\u4e0e\u81ea\u8eab\u76f8\u5173\u3002\u5bf9\u6240\u6709\\(a\\)\u6709\\(a R a\\)\u3002\u4f8b\uff1a\\(\\leq\\)\uff08\u6bcf\u4e2a\u6570\\(\\leq\\)\u81ea\u8eab\uff09\u3002</li> <li>\u5bf9\u79f0\u6027\uff1a\u5982\u679c\\(a R b\\)\u5219\\(b R a\\)\u3002\u4f8b\uff1a\"\u662f\u2026\u2026\u7684\u5144\u5f1f\u59d0\u59b9\u3002\"</li> <li>\u53cd\u5bf9\u79f0\u6027\uff1a\u5982\u679c\\(a R b\\)\u4e14\\(b R a\\)\u5219\\(a = b\\)\u3002\u4f8b\uff1a\\(\\leq\\)\u3002</li> <li>\u4f20\u9012\u6027\uff1a\u5982\u679c\\(a R b\\)\u4e14\\(b R c\\)\u5219\\(a R c\\)\u3002\u4f8b\uff1a\\(&lt;\\)\u3001\\(\\leq\\)\u3001\"\u662f\u2026\u2026\u7684\u7956\u5148\u3002\"</li> </ul> </li> <li> <p>\u7b49\u4ef7\u5173\u7cfb\u662f\u81ea\u53cd\u3001\u5bf9\u79f0\u4e14\u4f20\u9012\u7684\u3002\u5b83\u5c06\u96c6\u5408\u5212\u5206\u4e3a\u7b49\u4ef7\u7c7b\uff0c\u5176\u4e2d\u540c\u4e00\u7c7b\u4e2d\u7684\u6240\u6709\u5143\u7d20\u5f7c\u6b64\u76f8\u5173\uff0c\u4f46\u4e0e\u4e0d\u540c\u7c7b\u4e2d\u7684\u5143\u7d20\u65e0\u5173\u3002\u6a21\u8fd0\u7b97\u662f\u4e00\u4e2a\u7b49\u4ef7\u5173\u7cfb\uff1a\\(a \\equiv b \\pmod{n}\\) \u5c06\u6574\u6570\u5212\u5206\u4e3a\\(n\\)\u4e2a\u7c7b\u3002\u7f16\u7a0b\u8bed\u8a00\u4e2d\u7684\u7c7b\u578b\u7b49\u4ef7\u662f\u4e00\u4e2a\u7b49\u4ef7\u5173\u7cfb\u3002</p> </li> <li> <p>\u504f\u5e8f\u662f\u81ea\u53cd\u3001\u53cd\u5bf9\u79f0\u4e14\u4f20\u9012\u7684\u3002\u5b83\u5b9a\u4e49\u4e86\u4e00\u4e2a\"\u5c0f\u4e8e\u7b49\u4e8e\"\u7ed3\u6784\uff0c\u53ef\u80fd\u4f1a\u4f7f\u67d0\u4e9b\u5143\u7d20\u4e0d\u53ef\u6bd4\u8f83\u3002\u6587\u4ef6\u7cfb\u7edf\u76ee\u5f55\u6784\u6210\u4e00\u4e2a\u504f\u5e8f\uff08\u7236-\u5b50\uff09\uff0c\u4f46\u540c\u7ea7\u76ee\u5f55\u662f\u4e0d\u53ef\u6bd4\u8f83\u7684\u3002\u5168\u5e8f\u662f\u6bcf\u4e00\u5bf9\u5143\u7d20\u90fd\u53ef\u6bd4\u8f83\u7684\u504f\u5e8f\uff08\u5982\u6574\u6570\u4e0a\u7684\\(\\leq\\)\uff09\u3002</p> </li> <li> <p>\u504f\u5e8f\u5728\u5e76\u53d1\u4e2d\u81f3\u5173\u91cd\u8981\uff1a\u4e8b\u4ef6\u4e0a\u7684\"\u5148\u4e8e\u53d1\u751f\"\u5173\u7cfb\u662f\u4e00\u4e2a\u504f\u5e8f\u3002\u4e0d\u7531\u5148\u4e8e\u53d1\u751f\u5173\u7cfb\u6392\u5e8f\u7684\u4e8b\u4ef6\u662f\u5e76\u53d1\u7684\uff0c\u53ef\u80fd\u4ee5\u4efb\u610f\u76f8\u5bf9\u987a\u5e8f\u6267\u884c\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/01.%20discrete%20maths/#_7","title":"\u51fd\u6570","text":"<ul> <li> <p>\u51fd\u6570 \\(f: A \\to B\\) \u5c06\\(A\\)\uff08\u5b9a\u4e49\u57df\uff09\u4e2d\u7684\u6bcf\u4e2a\u5143\u7d20\u6620\u5c04\u5230\\(B\\)\uff08\u966a\u57df\uff09\u4e2d\u7684\u6070\u597d\u4e00\u4e2a\u5143\u7d20\u3002\u51fd\u6570\u662f\u786e\u5b9a\u6027\u8ba1\u7b97\u7684\u6570\u5b66\u6a21\u578b\uff1a\u7ed9\u5b9a\u4e00\u4e2a\u8f93\u5165\uff0c\u6070\u597d\u6709\u4e00\u4e2a\u8f93\u51fa\u3002</p> </li> <li> <p>\u5355\u5c04\uff08\u4e00\u5bf9\u4e00\uff09\uff1a\u4e0d\u540c\u7684\u8f93\u5165\u603b\u662f\u4ea7\u751f\u4e0d\u540c\u7684\u8f93\u51fa\u3002\\(f(a) = f(b) \\implies a = b\\)\u3002\u65e0\u635f\u538b\u7f29\u662f\u5355\u5c04\u7684\uff1a\u4e0d\u540c\u7684\u8f93\u5165\u5fc5\u987b\u538b\u7f29\u6210\u4e0d\u540c\u7684\u8f93\u51fa\uff08\u5426\u5219\u65e0\u6cd5\u552f\u4e00\u89e3\u538b\uff09\u3002</p> </li> <li> <p>\u6ee1\u5c04\uff08\u5230\u4e0a\uff09\uff1a\\(B\\)\u4e2d\u7684\u6bcf\u4e2a\u5143\u7d20\u90fd\u88ab\\(A\\)\u4e2d\u7684\u67d0\u4e2a\u5143\u7d20\u547d\u4e2d\u3002\u503c\u57df\u7b49\u4e8e\u966a\u57df\u3002\u5c06\u5b57\u7b26\u4e32\u6620\u5c04\u5230256\u4f4d\u54c8\u5e0c\u7684\u54c8\u5e0c\u51fd\u6570\uff0c\u5982\u679c\u5b57\u7b26\u4e32\u6570\u5c11\u4e8e\u53ef\u80fd\u7684\u54c8\u5e0c\u6570\uff0c\u5219\u4e0d\u662f\u6ee1\u5c04\u3002</p> </li> <li> <p>\u53cc\u5c04\uff1a\u65e2\u662f\u5355\u5c04\u53c8\u662f\u6ee1\u5c04\u3002\\(A\\)\u548c\\(B\\)\u4e4b\u95f4\u7684\u4e00\u4e00\u5bf9\u5e94\u3002\u53cc\u5c04\u5177\u6709\u9006\u51fd\u6570\u3002\u52a0\u5bc6\u5fc5\u987b\u662f\u53cc\u5c04\u7684\uff1a\u6bcf\u4e2a\u660e\u6587\u6620\u5c04\u5230\u552f\u4e00\u7684\u5bc6\u6587\uff0c\u800c\u89e3\u5bc6\u51fd\u6570\u5c31\u662f\u9006\u51fd\u6570\u3002</p> </li> <li> <p>\u590d\u5408 \\((g \\circ f)(x) = g(f(x))\\)\uff1a\u5148\u5e94\u7528\\(f\\)\uff0c\u518d\u5e94\u7528\\(g\\)\u3002\u51fd\u6570\u590d\u5408\u662f\u53ef\u7ed3\u5408\u7684\uff08\u7b2c2\u7ae0\uff1a\u5c31\u50cf\u77e9\u9635\u4e58\u6cd5\u662f\u53ef\u7ed3\u5408\u7684\u4e00\u6837\uff09\u3002\u8f6f\u4ef6\u4e2d\u7684\u7ba1\u9053\u5c31\u662f\u51fd\u6570\u590d\u5408\uff1a\u6570\u636e\u6d41\u7ecf\u4e00\u7cfb\u5217\u53d8\u6362\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/01.%20discrete%20maths/#_8","title":"\u56fe\u8bba\u57fa\u7840","text":"<ul> <li> <p>\u6211\u4eec\u5728\u7b2c12\u7ae0\uff08\u56fe\u795e\u7ecf\u7f51\u7edc\uff09\u4e2d\u5e7f\u6cdb\u4ecb\u7ecd\u4e86\u56fe\uff0c\u5305\u62ec\u90bb\u63a5\u77e9\u9635\u3001\u56fe\u7c7b\u578b\u3001\u62c9\u666e\u62c9\u65af\u77e9\u9635\u548c\u8c31\u7406\u8bba\u3002\u8fd9\u91cc\u6211\u4eec\u4e13\u6ce8\u4e8e\u4e0eCS\u76f8\u5173\u7684\u7b97\u6cd5\u548c\u7ed3\u6784\u6027\u8d28\u3002</p> </li> <li> <p>\u6811\u662f\u6ca1\u6709\u73af\u7684\u8fde\u901a\u56fe\u3002\u7b49\u4ef7\u5730\uff0c\u5b83\u6709\\(n\\)\u4e2a\u8282\u70b9\u548c\\(n-1\\)\u6761\u8fb9\u3002\u6811\u662f\u6587\u4ef6\u7cfb\u7edf\u3001XML/HTML\u6587\u6863\u3001\u51b3\u7b56\u8fc7\u7a0b\u548c\u9012\u5f52\u5206\u89e3\u7684\u7ed3\u6784\u3002\u6709\u6839\u6811\u6709\u4e00\u4e2a\u6307\u5b9a\u7684\u6839\u8282\u70b9\uff1b\u6bcf\u4e2a\u5176\u4ed6\u8282\u70b9\u6070\u597d\u6709\u4e00\u4e2a\u7236\u8282\u70b9\u3002</p> </li> <li> <p>\u56fe\\(G\\)\u7684\u751f\u6210\u6811\u662f\u5305\u542b\\(G\\)\u6240\u6709\u8282\u70b9\u5e76\u4f7f\u7528\u5176\u8fb9\u5b50\u96c6\u7684\u4e00\u68f5\u6811\u3002\u6700\u5c0f\u751f\u6210\u6811\uff08MST\uff09\u6700\u5c0f\u5316\u603b\u8fb9\u6743\u3002Kruskal\u7b97\u6cd5\uff08\u5bf9\u8fb9\u6392\u5e8f\uff0c\u8d2a\u5fc3\u5730\u6dfb\u52a0\u4e0d\u5f62\u6210\u73af\u7684\u6700\u8f7b\u8fb9\uff09\u548cPrim\u7b97\u6cd5\uff08\u4ece\u8d77\u59cb\u8282\u70b9\u5f00\u59cb\u6269\u5c55\u6811\uff0c\u603b\u662f\u6dfb\u52a0\u8fde\u63a5\u5230\u65b0\u8282\u70b9\u7684\u6700\u8f7b\u8fb9\uff09\u90fd\u80fd\u5728\\(O(|E| \\log |V|)\\)\u5185\u627e\u5230MST\u3002</p> </li> <li> <p>\u5e73\u9762\u6027\uff1a\u5982\u679c\u4e00\u4e2a\u56fe\u53ef\u4ee5\u753b\u5728\u5e73\u9762\u4e0a\u800c\u8fb9\u4e0d\u76f8\u4ea4\uff0c\u5219\u662f\u5e73\u9762\u56fe\u3002\u6839\u636e\u6b27\u62c9\u516c\u5f0f\uff0c\u5bf9\u4e8e\u8fde\u901a\u5e73\u9762\u56fe\uff1a\\(|V| - |E| + |F| = 2\\)\uff0c\u5176\u4e2d\\(|F|\\)\u662f\u9762\u7684\u6570\u91cf\uff08\u533a\u57df\uff0c\u5305\u62ec\u5916\u90e8\u9762\uff09\u3002\u8fd9\u610f\u5473\u7740\u5e73\u9762\u56fe\u7684\\(|E| \\leq 3|V| - 6\\)\uff0c\u56e0\u6b64\u5e73\u9762\u56fe\u662f\u7a00\u758f\u7684\u3002\u7535\u8def\u677f\u5e03\u7ebf\u548c\u5730\u56fe\u7740\u8272\u5229\u7528\u4e86\u5e73\u9762\u6027\u3002</p> </li> <li> <p>\u56fe\u7740\u8272\u4e3a\u8282\u70b9\u5206\u914d\u989c\u8272\uff0c\u4f7f\u5f97\u6ca1\u6709\u4e24\u4e2a\u76f8\u90bb\u8282\u70b9\u5171\u4eab\u76f8\u540c\u7684\u989c\u8272\u3002\u6240\u9700\u7684\u6700\u5c0f\u989c\u8272\u6570\u662f\u8272\u6570 \\(\\chi(G)\\)\u3002\u56db\u8272\u5b9a\u7406\u6307\u51fa\u4efb\u4f55\u5e73\u9762\u56fe\u7684 \\(\\chi(G) \\leq 4\\)\u3002\u5728CS\u4e2d\uff0c\u56fe\u7740\u8272\u6a21\u62df\u5bc4\u5b58\u5668\u5206\u914d\uff08\u5c06\u53d8\u91cf\u5206\u914d\u5230CPU\u5bc4\u5b58\u5668\uff0c\u4f7f\u5f97\u540c\u65f6\u6d3b\u8dc3\u7684\u53d8\u91cf\u83b7\u5f97\u4e0d\u540c\u7684\u5bc4\u5b58\u5668\uff09\u548c\u8c03\u5ea6\uff08\u5c06\u4efb\u52a1\u5206\u914d\u5230\u65f6\u95f4\u69fd\uff0c\u4f7f\u5f97\u51b2\u7a81\u7684\u4efb\u52a1\u4e0d\u91cd\u53e0\uff09\u3002</p> </li> <li> <p>\u6b27\u62c9\u8def\u5f84\u6070\u597d\u8bbf\u95ee\u6bcf\u6761\u8fb9\u4e00\u6b21\u3002\u5f53\u4e14\u4ec5\u5f53\u56fe\u4e2d\u6070\u597d\u67090\u4e2a\u62162\u4e2a\u5947\u6570\u5ea6\u8282\u70b9\u65f6\uff0c\u6b27\u62c9\u8def\u5f84\u5b58\u5728\u3002\u54c8\u5bc6\u987f\u8def\u5f84\u6070\u597d\u8bbf\u95ee\u6bcf\u4e2a\u8282\u70b9\u4e00\u6b21\u3002\u786e\u5b9a\u54c8\u5bc6\u987f\u8def\u5f84\u662f\u5426\u5b58\u5728\u662fNP\u5b8c\u5168\u7684\u2014\u2014\u8fd9\u662fCS\u4e2d\u7684\u7ecf\u5178\u96be\u9898\u4e4b\u4e00\u3002\u8fd9\u79cd\u5bf9\u6bd4\uff08\u6b27\u62c9\uff1a\u591a\u9879\u5f0f\uff0c\u54c8\u5bc6\u987f\uff1aNP\u5b8c\u5168\uff09\u8bf4\u660e\u4e86\u542c\u8d77\u6765\u76f8\u4f3c\u7684\u95ee\u9898\u53ef\u80fd\u5177\u6709\u622a\u7136\u4e0d\u540c\u7684\u8ba1\u7b97\u590d\u6742\u5ea6\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/01.%20discrete%20maths/#_9","title":"\u9012\u63a8\u5173\u7cfb","text":"<ul> <li> <p>\u9012\u63a8\u5173\u7cfb\u5b9a\u4e49\u4e00\u4e2a\u5e8f\u5217\uff0c\u5176\u4e2d\u6bcf\u4e00\u9879\u4f9d\u8d56\u4e8e\u524d\u9762\u7684\u9879\u3002\u5b83\u4eec\u81ea\u7136\u5730\u4ece\u9012\u5f52\u7b97\u6cd5\u4e2d\u4ea7\u751f\u3002</p> </li> <li> <p>\u6700\u7b80\u5355\u7684\u4f8b\u5b50\uff1a\\(T(n) = T(n-1) + 1\\)\uff0c\u5176\u4e2d \\(T(0) = 0\\)\u3002\u5c55\u5f00\uff1a\\(T(n) = T(n-1) + 1 = T(n-2) + 2 = \\cdots = n\\)\u3002\u8fd9\u662f\\(O(n)\\)\uff0c\u5373\u7b80\u5355\u5faa\u73af\u7684\u65f6\u95f4\u590d\u6742\u5ea6\u3002</p> </li> <li> <p>\u5f52\u5e76\u6392\u5e8f\u7ed9\u51fa \\(T(n) = 2T(n/2) + O(n)\\)\uff1a\u5c06\u6570\u7ec4\u5206\u6210\u4e24\u534a\uff08\u4e24\u4e2a\u5927\u5c0f\u4e3a\\(n/2\\)\u7684\u5b50\u95ee\u9898\uff09\uff0c\u9012\u5f52\u6392\u5e8f\u6bcf\u4e00\u534a\uff0c\u7136\u540e\u5408\u5e76\uff08\\(O(n)\\)\u5de5\u4f5c\uff09\u3002\u89e3\u4e3a \\(T(n) = O(n \\log n)\\)\u3002</p> </li> <li> <p>\u4e3b\u5b9a\u7406\u6c42\u89e3\u5f62\u5f0f\u4e3a \\(T(n) = aT(n/b) + O(n^d)\\) \u7684\u9012\u63a8\u5f0f\uff1a</p> <ul> <li>\u5982\u679c \\(d &gt; \\log_b a\\)\uff1a\\(T(n) = O(n^d)\\)\uff08\u6bcf\u5c42\u7684\u5de5\u4f5c\u5360\u4e3b\u5bfc\uff09</li> <li>\u5982\u679c \\(d = \\log_b a\\)\uff1a\\(T(n) = O(n^d \\log n)\\)\uff08\u5de5\u4f5c\u5728\u5404\u5c42\u95f4\u5e73\u8861\uff09</li> <li>\u5982\u679c \\(d &lt; \\log_b a\\)\uff1a\\(T(n) = O(n^{\\log_b a})\\)\uff08\u5b50\u95ee\u9898\u7684\u6570\u91cf\u5360\u4e3b\u5bfc\uff09</li> </ul> </li> <li> <p>\u5bf9\u4e8e\u5f52\u5e76\u6392\u5e8f\uff1a\\(a = 2, b = 2, d = 1\\)\u3002\u7531\u4e8e \\(d = \\log_2 2 = 1\\)\uff0c\u6211\u4eec\u5904\u4e8e\u5e73\u8861\u60c5\u51b5\uff1a\\(T(n) = O(n \\log n)\\)\u3002</p> </li> <li> <p>\u6590\u6ce2\u90a3\u5951\u9012\u63a8 \\(F(n) = F(n-1) + F(n-2)\\)\uff0c\u5176\u4e2d \\(F(0) = 0, F(1) = 1\\)\uff0c\u5c01\u95ed\u5f62\u5f0f\u89e3\u4e3a \\(F(n) = \\frac{\\phi^n - \\psi^n}{\\sqrt{5}}\\)\uff0c\u5176\u4e2d \\(\\phi = \\frac{1+\\sqrt{5}}{2}\\)\uff08\u9ec4\u91d1\u6bd4\u4f8b\uff09\u4e14 \\(\\psi = \\frac{1-\\sqrt{5}}{2}\\)\u3002\u8fd9\u8868\u660e\u6590\u6ce2\u90a3\u5951\u6570\u5217\u4ee5 \\(O(\\phi^n)\\) \u6307\u6570\u589e\u957f\uff0c\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48\u6734\u7d20\u9012\u5f52\u6590\u6ce2\u90a3\u5951\u6307\u6570\u7ea7\u6162\u3002</p> </li> <li> <p>\u7ec4\u5408\u6570\u5b66\uff08\u6392\u5217\u3001\u7ec4\u5408\u3001\u4e8c\u9879\u5f0f\u5b9a\u7406\u548c\u5bb9\u65a5\u539f\u7406\uff09\u5728\u7b2c5\u7ae0\uff08\u6982\u7387\uff09\u4e2d\u4ecb\u7ecd\u3002\u8fd9\u4e9b\u8ba1\u6570\u6280\u672f\u5bf9\u7b97\u6cd5\u5206\u6790\u81f3\u5173\u91cd\u8981\uff08\u6709\u591a\u5c11\u79cd\u53ef\u80fd\u7684\u8f93\u5165\uff1f\u9700\u8981\u591a\u5c11\u6b21\u6bd4\u8f83\uff1f\uff09\uff0c\u4f46\u6211\u4eec\u5728\u6b64\u4e0d\u518d\u91cd\u590d\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/01.%20discrete%20maths/#_10","title":"\u53ef\u8ba1\u7b97\u6027","text":"<ul> <li> <p>\u5e76\u975e\u6240\u6709\u4e8b\u60c5\u90fd\u80fd\u88ab\u8ba1\u7b97\u3002\u8fd9\u662f\u6574\u4e2a\u6570\u5b66\u4e2d\u6700\u6df1\u523b\u7684\u7ed3\u8bba\u4e4b\u4e00\uff0c\u5b83\u8bbe\u5b9a\u4e86\u8ba1\u7b97\u673a\u80fd\u529b\u7684\u57fa\u672c\u6781\u9650\u3002</p> </li> <li> <p>\u56fe\u7075\u673a\u662f\u8ba1\u7b97\u7684\u62bd\u8c61\u6a21\u578b\uff1a\u4e00\u6761\u65e0\u9650\u957f\u7684\u5355\u5143\u683c\u78c1\u5e26\uff08\u6bcf\u4e2a\u5355\u5143\u683c\u5305\u542b\u4e00\u4e2a\u7b26\u53f7\uff09\uff0c\u4e00\u4e2a\u8bfb\u5199\u5934\uff0c\u4ee5\u53ca\u4e00\u7ec4\u5e26\u8f6c\u79fb\u89c4\u5219\u7684\u6709\u9650\u72b6\u6001\u3002\u5c3d\u7ba1\u7b80\u5355\uff0c\u56fe\u7075\u673a\u53ef\u4ee5\u8ba1\u7b97\u4efb\u4f55\u5b9e\u9645\u8ba1\u7b97\u673a\u80fd\u8ba1\u7b97\u7684\u4efb\u4f55\u4e1c\u897f\u3002\u8fd9\u5c31\u662f\u90b1\u5947-\u56fe\u7075\u8bba\u9898\uff1a\u4efb\u4f55\u6709\u6548\u53ef\u8ba1\u7b97\u7684\u51fd\u6570\u90fd\u53ef\u4ee5\u7531\u56fe\u7075\u673a\u8ba1\u7b97\u3002</p> </li> <li> <p>\u6bcf\u79cd\u7f16\u7a0b\u8bed\u8a00\uff08Python\u3001C\u3001Haskell\uff09\u90fd\u662f\u56fe\u7075\u5b8c\u5907\u7684\uff1a\u5b83\u53ef\u4ee5\u6a21\u62df\u56fe\u7075\u673a\uff0c\u4ece\u800c\u8ba1\u7b97\u4efb\u4f55\u53ef\u8ba1\u7b97\u7684\u4e1c\u897f\u3002\u8bed\u8a00\u4e4b\u95f4\u7684\u533a\u522b\u5728\u4e8e\u4fbf\u5229\u6027\u3001\u901f\u5ea6\u548c\u5b89\u5168\u6027\uff0c\u800c\u4e0d\u5728\u4e8e\u5b83\u4eec\u6839\u672c\u4e0a\u80fd\u8ba1\u7b97\u4ec0\u4e48\u3002</p> </li> <li> <p>\u505c\u673a\u95ee\u9898\u8be2\u95ee\uff1a\u7ed9\u5b9a\u4e00\u4e2a\u7a0b\u5e8f\u548c\u4e00\u4e2a\u8f93\u5165\uff0c\u8be5\u7a0b\u5e8f\u6700\u7ec8\u4f1a\u505c\u6b62\uff0c\u8fd8\u662f\u6c38\u8fdc\u8fd0\u884c\uff1f\u56fe\u7075\uff081936\uff09\u8bc1\u660e\u4e0d\u5b58\u5728\u80fd\u666e\u904d\u89e3\u51b3\u8fd9\u4e2a\u95ee\u9898\u7684\u7b97\u6cd5\u3002\u8bc1\u660e\u91c7\u7528\u53cd\u8bc1\u6cd5\uff1a\u5047\u8bbe\u5b58\u5728\u4e00\u4e2a\u505c\u673a\u68c0\u6d4b\u5668 \\(H(P, x)\\)\u3002\u6784\u9020\u4e00\u4e2a\u7a0b\u5e8f \\(D\\)\uff0c\u5b83\u8fd0\u884c \\(H(D, D)\\) \u5e76\u505a\u4e0e \\(H\\) \u6240\u8bf4\u7684\u76f8\u53cd\u7684\u4e8b\u3002\u5982\u679c \\(H\\) \u8bf4 \\(D\\) \u505c\u673a\uff0c\\(D\\) \u5c31\u6c38\u8fdc\u5faa\u73af\u3002\u5982\u679c \\(H\\) \u8bf4 \\(D\\) \u5faa\u73af\uff0c\\(D\\) \u5c31\u505c\u673a\u3002\u77db\u76fe\u3002</p> </li> <li> <p>\u8fd9\u4e0d\u662f\u5f53\u524d\u6280\u672f\u7684\u5c40\u9650\uff1b\u8fd9\u662f\u4e00\u4e2a\u6570\u5b66\u4e0a\u7684\u4e0d\u53ef\u80fd\u6027\u3002\u65e0\u8bba\u591a\u5c11\u8ba1\u7b97\u3001\u591a\u5c11\u806a\u660e\u624d\u667a\u3001\u6216\u591a\u5c11\u4eba\u5de5\u667a\u80fd\uff0c\u90fd\u65e0\u6cd5\u666e\u904d\u89e3\u51b3\u505c\u673a\u95ee\u9898\u3002\u5b83\u662f\u54e5\u5fb7\u5c14\u4e0d\u5b8c\u5907\u5b9a\u7406\u5728\u8ba1\u7b97\u673a\u79d1\u5b66\u4e2d\u7684\u7c7b\u6bd4\u3002</p> </li> <li> <p>\u5b9e\u9645\u540e\u679c\uff1a\u4f60\u65e0\u6cd5\u7f16\u5199\u4e00\u4e2a\u5b8c\u7f8e\u7684\u6b7b\u9501\u68c0\u6d4b\u5668\u3001\u4e00\u4e2a\u5b8c\u7f8e\u7684\u75c5\u6bd2\u626b\u63cf\u5668\u6216\u4e00\u4e2a\u5b8c\u7f8e\u7684\u4f18\u5316\u7f16\u8bd1\u5668\u3002\u6bcf\u4e00\u4e2a\u90fd\u9700\u8981\u901a\u7528\u5730\u89e3\u51b3\u505c\u673a\u95ee\u9898\uff08\u6216\u4e00\u4e2a\u7b49\u4ef7\u7684\u4e0d\u5224\u5b9a\u95ee\u9898\uff09\u3002\u5b9e\u9645\u5de5\u5177\u4f7f\u7528\u542f\u53d1\u5f0f\u65b9\u6cd5\u548c\u8fd1\u4f3c\u65b9\u6cd5\uff0c\u5728\u5e38\u89c1\u60c5\u51b5\u4e0b\u6709\u6548\uff0c\u4f46\u4e0d\u80fd\u4fdd\u8bc1\u5bf9\u6240\u6709\u8f93\u5165\u90fd\u6b63\u786e\u3002</p> </li> <li> <p>\u5982\u679c\u4e00\u4e2a\u95ee\u9898\u5b58\u5728\u4e00\u4e2a\u603b\u662f\u80fd\u7ed9\u51fa\u6b63\u786e\u662f/\u5426\u7b54\u6848\u5e76\u7ec8\u6b62\u7684\u7b97\u6cd5\uff0c\u5219\u5b83\u662f\u53ef\u5224\u5b9a\u7684\u3002\u5982\u679c\u4e0d\u5b58\u5728\u8fd9\u6837\u7684\u7b97\u6cd5\uff0c\u5219\u662f\u4e0d\u53ef\u5224\u5b9a\u7684\u3002\u505c\u673a\u95ee\u9898\u662f\u4e0d\u53ef\u5224\u5b9a\u7684\u3002\u7d20\u6570\u6d4b\u8bd5\u662f\u53ef\u5224\u5b9a\u7684\u3002\u5927\u591a\u6570\u7f16\u7a0b\u8bed\u8a00\u4e2d\u7684\u7c7b\u578b\u68c0\u67e5\u662f\u53ef\u5224\u5b9a\u7684\uff08\u901a\u8fc7\u8bbe\u8ba1\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/01.%20discrete%20maths/#_11","title":"\u590d\u6742\u5ea6\u7406\u8bba","text":"<ul> <li>\u5373\u4f7f\u5728\u53ef\u8ba1\u7b97\u7684\u95ee\u9898\u4e2d\uff0c\u6709\u4e9b\u4e5f\u8fdc\u6bd4\u5176\u4ed6\u7684\u96be\u3002\u590d\u6742\u5ea6\u7406\u8bba\u6839\u636e\u89e3\u51b3\u95ee\u9898\u6240\u9700\u7684\u8d44\u6e90\uff08\u65f6\u95f4\u3001\u7a7a\u95f4\uff09\u968f\u8f93\u5165\u589e\u957f\u800c\u5206\u7c7b\u95ee\u9898\u3002</li> </ul> <ul> <li> <p>P\uff08\u591a\u9879\u5f0f\u65f6\u95f4\uff09\uff1a\u80fd\u5728 \\(O(n^k)\\) \u65f6\u95f4\u5185\u89e3\u51b3\u7684\u95ee\u9898\uff0c\\(k\\)\u4e3a\u67d0\u4e2a\u5e38\u6570\u3002\u6392\u5e8f\uff08\\(O(n \\log n)\\)\uff09\u3001\u6700\u77ed\u8def\u5f84\uff08\\(O(|V|^2)\\)\uff09\u3001\u77e9\u9635\u4e58\u6cd5\uff08\\(O(n^3)\\)\uff09\u3002\u8fd9\u4e9b\u88ab\u8ba4\u4e3a\u662f\"\u9ad8\u6548\"\u6216\"\u53ef\u5904\u7406\u7684\u3002\"</p> </li> <li> <p>NP\uff08\u975e\u786e\u5b9a\u6027\u591a\u9879\u5f0f\u65f6\u95f4\uff09\uff1a\u4e00\u4e2a\u62df\u8bae\u7684\u89e3\u7b54\u80fd\u5728\u591a\u9879\u5f0f\u65f6\u95f4\u5185\u9a8c\u8bc1\u7684\u95ee\u9898\uff0c\u5373\u4f7f\u627e\u5230\u89e3\u7b54\u53ef\u80fd\u9700\u8981\u6307\u6570\u65f6\u95f4\u3002\u4f8b\u5982\uff0c\u7ed9\u5b9a\u4e00\u4e2a\u58f0\u79f0\u7684\u54c8\u5bc6\u987f\u8def\u5f84\uff0c\u4f60\u53ef\u4ee5\u901a\u8fc7\u68c0\u67e5\u6bcf\u6761\u8fb9\u5728 \\(O(n)\\) \u65f6\u95f4\u5185\u9a8c\u8bc1\u5b83\u3002\u4f46\u627e\u5230\u4e00\u6761\u53ef\u80fd\u9700\u5c1d\u8bd5\u6307\u6570\u591a\u4e2a\u53ef\u80fd\u6027\u3002</p> </li> <li> <p>P\u4e2d\u7684\u6bcf\u4e2a\u95ee\u9898\u4e5f\u5728NP\u4e2d\uff08\u5982\u679c\u4f60\u80fd\u5feb\u901f\u89e3\u51b3\u5b83\uff0c\u4f60\u5f53\u7136\u80fd\u5feb\u901f\u9a8c\u8bc1\u4e00\u4e2a\u89e3\u7b54\uff09\u3002\u6838\u5fc3\u95ee\u9898\u662f \\(P = NP\\) \u662f\u5426\u6210\u7acb\uff1a\u6bcf\u4e2a\u80fd\u5feb\u901f\u9a8c\u8bc1\u89e3\u7b54\u7684\u95ee\u9898\u662f\u5426\u4e5f\u80fd\u5feb\u901f\u6c42\u89e3\uff1f\u8fd9\u662f\u8ba1\u7b97\u673a\u79d1\u5b66\u4e2d\u6700\u91cd\u8981\u7684\u5f00\u653e\u95ee\u9898\uff0c\u83b7\u5f97\u514b\u83b1\u6570\u5b66\u7814\u7a76\u6240100\u4e07\u7f8e\u5143\u7684\u5343\u79a7\u5e74\u5927\u5956\u3002</p> </li> <li> <p>\u5927\u591a\u6570\u4e13\u5bb6\u76f8\u4fe1 \\(P \\neq NP\\)\uff0c\u610f\u5473\u7740\u6709\u4e9b\u95ee\u9898\u672c\u8d28\u4e0a\u6bd4\u9a8c\u8bc1\u66f4\u96be\u89e3\u51b3\u3002\u5982\u679c \\(P = NP\\)\uff0c\u5bc6\u7801\u5b66\u5c06\u5d29\u6e83\uff08\u7834\u89e3\u52a0\u5bc6\u5c5e\u4e8eNP\uff09\uff0c\u800c\u4f18\u5316\u3001\u8c03\u5ea6\u548c\u836f\u7269\u8bbe\u8ba1\u5c06\u53d8\u5f97\u5f02\u5e38\u7b80\u5355\u3002</p> </li> <li> <p>NP\u5b8c\u5168\u95ee\u9898\u662fNP\u4e2d\u6700\u96be\u7684\u95ee\u9898\u3002\u4e00\u4e2a\u95ee\u9898\u5982\u679c\u662fNP\u5b8c\u5168\u7684\uff0c\u5219\uff1a\uff081\uff09\u5b83\u5728NP\u4e2d\uff0c\u4e14\uff082\uff09\u6240\u6709\u5176\u4ed6NP\u95ee\u9898\u53ef\u4ee5\u5728\u591a\u9879\u5f0f\u65f6\u95f4\u5185\u5f52\u7ea6\u5230\u5b83\u3002\u5982\u679c\u4f60\u80fd\u9ad8\u6548\u89e3\u51b3\u4efb\u4f55\u4e00\u4e2aNP\u5b8c\u5168\u95ee\u9898\uff0c\u4f60\u5c31\u80fd\u89e3\u51b3\u6240\u6709NP\u5b8c\u5168\u95ee\u9898\uff08\u4ece\u800c \\(P = NP\\)\uff09\u3002</p> </li> <li> <p>\u5f52\u7ea6\u5c06\u4e00\u4e2a\u95ee\u9898\u8f6c\u6362\u4e3a\u53e6\u4e00\u4e2a\u95ee\u9898\u3002\u5982\u679c\u95ee\u9898A\u5f52\u7ea6\u5230\u95ee\u9898B\uff0c\u90a3\u4e48B\u81f3\u5c11\u548cA\u4e00\u6837\u96be\u3002Cook\uff081971\uff09\u8bc1\u660e\u4e86SAT\uff08\u5e03\u5c14\u53ef\u6ee1\u8db3\u6027\uff1a\u7ed9\u5b9a\u4e00\u4e2a\u903b\u8f91\u516c\u5f0f\uff0c\u662f\u5426\u5b58\u5728\u4f7f\u516c\u5f0f\u4e3a\u771f\u7684\u53d8\u91cf\u8d4b\u503c\uff1f\uff09\u662fNP\u5b8c\u5168\u7684\u3002Karp\uff081972\uff09\u901a\u8fc7\u5c06SAT\u5f52\u7ea6\u5230\u6bcf\u4e2a\u95ee\u9898\uff0c\u8bc1\u660e\u4e86\u5176\u4ed621\u4e2a\u7ecf\u5178\u95ee\u9898\u662fNP\u5b8c\u5168\u7684\u3002</p> </li> <li> <p>\u8457\u540d\u7684NP\u5b8c\u5168\u95ee\u9898\uff1a</p> <ul> <li>\u65c5\u884c\u5546\u95ee\u9898\uff08TSP\uff09\uff1a\u627e\u5230\u8bbf\u95ee\u6240\u6709\u57ce\u5e02\u6070\u597d\u4e00\u6b21\u7684\u6700\u77ed\u8def\u7ebf\u3002</li> <li>\u56fe\u7740\u8272\uff1a\u7528\\(k\\)\u79cd\u989c\u8272\u4e3a\u8282\u70b9\u7740\u8272\uff0c\u4f7f\u5f97\u6ca1\u6709\u76f8\u90bb\u8282\u70b9\u5171\u4eab\u540c\u4e00\u989c\u8272\uff08\\(k \\geq 3\\)\uff09\u3002</li> <li>\u5b50\u96c6\u548c\u95ee\u9898\uff1a\u7ed9\u5b9a\u4e00\u7ec4\u6574\u6570\uff0c\u662f\u5426\u5b58\u5728\u4e00\u4e2a\u5b50\u96c6\u5176\u548c\u7b49\u4e8e\u76ee\u6807\u503c\uff1f</li> <li>\u5e03\u5c14\u53ef\u6ee1\u8db3\u6027\uff08SAT\uff09\uff1a\u662f\u5426\u5b58\u5728\u4f7f\u903b\u8f91\u516c\u5f0f\u4e3a\u771f\u7684\u771f\u503c\u8d4b\u503c\uff1f</li> <li>\u54c8\u5bc6\u987f\u8def\u5f84\uff08\u4e0a\u6587\u56fe\u8bba\u4e2d\u63d0\u5230\u7684\uff09\u3002</li> </ul> </li> <li> <p>\u5f53\u4f60\u5728\u5b9e\u8df5\u4e2d\u9047\u5230NP\u5b8c\u5168\u95ee\u9898\u65f6\uff0c\u4f60\u4e0d\u4f1a\u5bf9\u5927\u89c4\u6a21\u8f93\u5165\u7cbe\u786e\u6c42\u89e3\u3002\u76f8\u53cd\uff0c\u4f60\u4f7f\u7528\uff1a\u8fd1\u4f3c\u7b97\u6cd5\uff08\u627e\u5230\u4fdd\u8bc1\u5728\u6700\u4f18\u89e3\u4e00\u5b9a\u500d\u6570\u8303\u56f4\u5185\u7684\u89e3\uff09\u3001\u542f\u53d1\u5f0f\u65b9\u6cd5\uff08\u8d2a\u5fc3\u3001\u5c40\u90e8\u641c\u7d22\u3001\u6a21\u62df\u9000\u706b\uff09\u6216\u7279\u4f8b\u6c42\u89e3\u5668\uff08\u8bb8\u591aNP\u5b8c\u5168\u95ee\u9898\u5bf9\u53d7\u9650\u8f93\u5165\u5f88\u5bb9\u6613\uff09\u3002\u4f8b\u5982\uff0c\u73b0\u4ee3SAT\u6c42\u89e3\u5668\u5c3d\u7ba1\u5728\u6700\u574f\u60c5\u51b5\u4e0b\u662f\u6307\u6570\u590d\u6742\u5ea6\uff0c\u4f46\u901a\u8fc7\u5229\u7528\u5b9e\u9645\u5b9e\u4f8b\u4e2d\u7684\u7ed3\u6784\uff0c\u901a\u5e38\u80fd\u89e3\u51b3\u62e5\u6709\u6570\u767e\u4e07\u53d8\u91cf\u7684\u5b9e\u4f8b\u3002</p> </li> <li> <p>NP\u56f0\u96be\u95ee\u9898\u81f3\u5c11\u548cNP\u5b8c\u5168\u95ee\u9898\u4e00\u6837\u96be\uff0c\u4f46\u53ef\u80fd\u4e0d\u5728NP\u4e2d\uff08\u5b83\u4eec\u7684\u89e3\u751a\u81f3\u53ef\u80fd\u4e0d\u80fd\u5728\u591a\u9879\u5f0f\u65f6\u95f4\u5185\u9a8c\u8bc1\uff09\u3002NP\u5b8c\u5168\u95ee\u9898\u7684\u4f18\u5316\u7248\u672c\u901a\u5e38\u662fNP\u56f0\u96be\u7684\uff1a\"\u627e\u5230\u6700\u77edTSP\u8def\u7ebf\"\u662fNP\u56f0\u96be\u7684\uff0c\u800c\"\u662f\u5426\u5b58\u5728\u4e00\u6761\u957f\u5ea6\u5c0f\u4e8e\\(k\\)\u7684TSP\u8def\u7ebf\uff1f\"\u662fNP\u5b8c\u5168\u7684\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/01.%20discrete%20maths/#colab","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216\u7b14\u8bb0\u672c\uff09","text":"<ol> <li> <p>\u6784\u5efa\u4e00\u4e2a\u771f\u503c\u8868\u751f\u6210\u5668\u3002\u7ed9\u5b9a\u4e00\u4e2a\u903b\u8f91\u8868\u8fbe\u5f0f\uff0c\u679a\u4e3e\u6240\u6709\u8f93\u5165\u7ec4\u5408\u5e76\u8ba1\u7b97\u7ed3\u679c\u3002 <pre><code>import itertools\n\ndef truth_table(n_vars, expr_fn):\n    \"\"\"\u4e3a\u4e00\u4e2an_vars\u4e2a\u53d8\u91cf\u7684\u5e03\u5c14\u51fd\u6570\u751f\u6210\u771f\u503c\u8868\u3002\"\"\"\n    headers = [f\"p{i}\" for i in range(n_vars)]\n    print(\" | \".join(headers + [\"result\"]))\n    print(\"-\" * (len(headers) * 4 + 10))\n    for vals in itertools.product([False, True], repeat=n_vars):\n        result = expr_fn(*vals)\n        row = [str(v)[0] for v in vals] + [str(result)[0]]\n        print(\" | \".join(f\"{r:&gt;2}\" for r in row))\n\n# \u5fb7\u6469\u6839\u5b9a\u5f8b\uff1aNOT(p AND q) == (NOT p) OR (NOT q)\nprint(\"\u5fb7\u6469\u6839\u5b9a\u5f8b\u9a8c\u8bc1\uff1a\")\ntruth_table(2, lambda p, q: (not (p and q)) == ((not p) or (not q)))\n</code></pre></p> </li> <li> <p>\u901a\u8fc7\u5f52\u7eb3\u6cd5\u8bc1\u660e\u6c42\u548c\u516c\u5f0f\u2014\u2014\u5bf9\u591a\u4e2a\u503c\u8fdb\u884c\u6570\u503c\u9a8c\u8bc1\uff0c\u7136\u540e\u5b9e\u73b0\u5c01\u95ed\u5f62\u5f0f\u89e3\u3002 <pre><code>import jax.numpy as jnp\n\n# \u9a8c\u8bc1\u6c42\u548c\u516c\u5f0f\uff1asum(1..n) = n(n+1)/2\nfor n in [1, 5, 10, 100, 1000, 10000]:\n    brute = sum(range(1, n + 1))\n    formula = n * (n + 1) // 2\n    print(f\"n={n:5d}  sum={brute:&gt;10d}  formula={formula:&gt;10d}  match={brute == formula}\")\n</code></pre></p> </li> <li> <p>\u4f7f\u7528\u4e3b\u5b9a\u7406\u6c42\u89e3\u5f52\u5e76\u6392\u5e8f\u9012\u63a8\u5173\u7cfb\uff0c\u5e76\u901a\u8fc7\u8ba1\u6570\u64cd\u4f5c\u8fdb\u884c\u7ecf\u9a8c\u9a8c\u8bc1\u3002 <pre><code>import jax.numpy as jnp\n\ndef merge_sort_ops(n):\n    \"\"\"\u7edf\u8ba1\u5f52\u5e76\u6392\u5e8f\u4e2d\u7684\u6bd4\u8f83\u6b21\u6570\uff08\u9012\u63a8\uff1aT(n) = 2T(n/2) + n\uff09\u3002\"\"\"\n    if n &lt;= 1:\n        return 0\n    half = n // 2\n    return merge_sort_ops(half) + merge_sort_ops(n - half) + n\n\nfor n in [8, 64, 512, 4096, 32768]:\n    ops = merge_sort_ops(n)\n    predicted = n * jnp.log2(n)\n    ratio = ops / predicted\n    print(f\"n={n:5d}  ops={ops:&gt;10d}  n log n={int(predicted):&gt;10d}  ratio={ratio:.3f}\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2013%3A%20computing%20and%20OS/02.%20computer%20architecture/","title":"\u8ba1\u7b97\u673a\u4f53\u7cfb\u7ed3\u6784","text":"<p>\u8ba1\u7b97\u673a\u4f53\u7cfb\u7ed3\u6784\u662f\u5173\u4e8e\u5982\u4f55\u6784\u5efa\u6267\u884c\u6307\u4ee4\u7684\u673a\u5668\u3002\u672c\u6587\u6db5\u76d6\u6570\u5236\u3001\u903b\u8f91\u95e8\u3001CPU\u8bbe\u8ba1\u3001\u6307\u4ee4\u96c6\u67b6\u6784\u3001\u6d41\u6c34\u7ebf\u3001\u5b58\u50a8\u5668\u5c42\u6b21\u7ed3\u6784\u548c\u865a\u62df\u5185\u5b58\u2014\u2014\u6bcf\u4e2a\u7a0b\u5e8f\u3001\u6846\u67b6\u548cAI\u6a21\u578b\u6700\u7ec8\u8fd0\u884c\u5176\u4e0a\u7684\u786c\u4ef6\u57fa\u7840\u3002</p> <ul> <li>\u6bcf\u4e2a\u795e\u7ecf\u7f51\u7edc\u3001\u6bcf\u4e2a\u8bad\u7ec3\u5faa\u73af\u3001\u6bcf\u6b21\u63a8\u7406\u8c03\u7528\u6700\u7ec8\u90fd\u4f1a\u53d8\u6210\u6d41\u7ecf\u6676\u4f53\u7ba1\u7684\u7535\u4fe1\u53f7\u5e8f\u5217\u3002\u5bf9\u4e8e\u4e25\u8083\u7684\u673a\u5668\u5b66\u4e60\u4ece\u4e1a\u8005\u6765\u8bf4\uff0c\u7406\u89e3\u786c\u4ef6\u4e0d\u662f\u53ef\u9009\u7684\uff1a\u5b83\u89e3\u91ca\u4e86\u4e3a\u4ec0\u4e48\u77e9\u9635\u4e58\u6cd5\u5f88\u5feb\uff0c\u4e3a\u4ec0\u4e48\u5185\u5b58\u662f\u74f6\u9888\uff0c\u4e3a\u4ec0\u4e48GPU\u4e3b\u5bfcAI\u8bad\u7ec3\uff0c\u4ee5\u53ca\u4e3a\u4ec0\u4e48\u7f13\u5b58\u53cb\u597d\u7684\u4ee3\u7801\u53ef\u4ee5\u6bd4\u6734\u7d20\u4ee3\u7801\u5feb100\u500d\u3002</li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/02.%20computer%20architecture/#_2","title":"\u6570\u5236","text":"<ul> <li> <p>\u8ba1\u7b97\u673a\u5c06\u6240\u6709\u5185\u5bb9\u8868\u793a\u4e3a\u4e8c\u8fdb\u5236\uff08\u57fa2\uff09\uff1a0\u548c1\u7684\u5e8f\u5217\u3002\u6bcf\u4e2a\u6570\u5b57\u662f\u4e00\u4e2a\u6bd4\u7279\u30028\u4e2a\u6bd4\u7279\u4e3a\u4e00\u7ec4\u79f0\u4e3a\u4e00\u4e2a\u5b57\u8282\u3002\u4e8c\u8fdb\u5236\u6570 \\(b_{n-1} b_{n-2} \\ldots b_1 b_0\\) \u7684\u503c\u4e3a \\(\\sum_{i=0}^{n-1} b_i \\cdot 2^i\\)\u3002</p> </li> <li> <p>\u4f8b\u5982\uff0c\\(1011_2 = 1 \\cdot 8 + 0 \\cdot 4 + 1 \\cdot 2 + 1 \\cdot 1 = 11_{10}\\)\u3002</p> </li> <li> <p>\u5341\u516d\u8fdb\u5236\uff08\u57fa16\uff09\u662f\u4e8c\u8fdb\u5236\u7684\u7d27\u51d1\u8868\u793a\u6cd5\u3002\u6bcf\u4e2a\u5341\u516d\u8fdb\u5236\u6570\u5b57\u4ee3\u88684\u4e2a\u6bd4\u7279\uff1a\\(0\\text{-}9\\) \u6620\u5c04\u5230 \\(0000\\text{-}1001\\)\uff0c\\(A\\text{-}F\\) \u6620\u5c04\u5230 \\(1010\\text{-}1111\\)\u3002\u56e0\u6b64 \\(\\text{0xFF} = 1111\\,1111_2 = 255_{10}\\)\u3002\u5185\u5b58\u5730\u5740\u548c\u989c\u8272\u4ee3\u7801\u901a\u5e38\u7528\u5341\u516d\u8fdb\u5236\u4e66\u5199\u3002</p> </li> <li> <p>\u8865\u7801\u8868\u793a\u6709\u7b26\u53f7\u6574\u6570\u3002\u5bf9\u4e8e\\(n\\)\u4f4d\u6570\u5b57\uff0c\u6700\u9ad8\u6709\u6548\u4f4d\u7684\u6743\u91cd\u4e3a \\(-2^{n-1}\\) \u800c\u975e \\(+2^{n-1}\\)\u30028\u4f4d\u8865\u7801\u7684\u8303\u56f4\u4e3a \\(-128\\) \u5230 \\(+127\\)\u3002\u8981\u53d6\u4e00\u4e2a\u6570\u7684\u76f8\u53cd\u6570\uff1a\u7ffb\u8f6c\u6240\u6709\u4f4d\u7136\u540e\u52a01\u3002\u8fd9\u79cd\u8868\u793a\u4f7f\u52a0\u6cd5\u548c\u51cf\u6cd5\u4f7f\u7528\u76f8\u540c\u7684\u786c\u4ef6\u7535\u8def\uff0c\u8fd9\u5c31\u662f\u5b83\u88ab\u666e\u904d\u91c7\u7528\u7684\u539f\u56e0\u3002</p> </li> <li> <p>IEEE 754\u6d6e\u70b9\u6570\u5c06\u5b9e\u6570\u8868\u793a\u4e3a \\((-1)^s \\times 1.m \\times 2^{e-\\text{bias}}\\)\uff0c\u5176\u4e2d\\(s\\)\u662f\u7b26\u53f7\u4f4d\uff0c\\(m\\)\u662f\u5c3e\u6570\uff08\u5c0f\u6570\u90e8\u5206\uff09\uff0c\\(e\\)\u662f\u79fb\u7801\u6307\u6570\u3002</p> </li> </ul> <p></p> <pre><code>- **float32**\uff08\u5355\u7cbe\u5ea6\uff09\uff1a1\u4e2a\u7b26\u53f7 + 8\u4e2a\u6307\u6570 + 23\u4e2a\u5c3e\u6570 = 32\u4f4d\u3002\u8303\u56f4\uff1a$\\approx \\pm 3.4 \\times 10^{38}$\uff0c\u7cbe\u5ea6\uff1a$\\approx 7$\u4f4d\u5341\u8fdb\u5236\u6570\u5b57\u3002\n- **float64**\uff08\u53cc\u7cbe\u5ea6\uff09\uff1a1\u4e2a\u7b26\u53f7 + 11\u4e2a\u6307\u6570 + 52\u4e2a\u5c3e\u6570 = 64\u4f4d\u3002\u8303\u56f4\uff1a$\\approx \\pm 1.8 \\times 10^{308}$\uff0c\u7cbe\u5ea6\uff1a$\\approx 15$\u4f4d\u5341\u8fdb\u5236\u6570\u5b57\u3002\n- **float16**\uff08\u534a\u7cbe\u5ea6\uff09\uff1a1 + 5 + 10 = 16\u4f4d\u3002\u8303\u56f4\u548c\u7cbe\u5ea6\u6709\u9650\uff0c\u4f46\u4f7f\u7528\u4e00\u534a\u7684\u5185\u5b58\u548c\u5e26\u5bbd\u3002\u5e7f\u6cdb\u7528\u4e8eML\u8bad\u7ec3\uff08\u6df7\u5408\u7cbe\u5ea6\uff0c\u7b2c6\u7ae0\uff09\u3002\n- **bfloat16**\uff1a1 + 8 + 7 = 16\u4f4d\u3002\u4e0efloat32\u76f8\u540c\u7684\u6307\u6570\u8303\u56f4\u4f46\u7cbe\u5ea6\u66f4\u4f4e\u3002\u7531Google\u4e13\u95e8\u4e3aML\u8bbe\u8ba1\uff1a\u5b8c\u6574\u7684\u6307\u6570\u8303\u56f4\u53ef\u9632\u6b62\u8bad\u7ec3\u671f\u95f4\u6ea2\u51fa\uff0c\u964d\u4f4e\u7684\u7cbe\u5ea6\u5bf9\u68af\u5ea6\u66f4\u65b0\u662f\u53ef\u4ee5\u63a5\u53d7\u7684\u3002\n</code></pre> <ul> <li>\u6d6e\u70b9\u7b97\u672f\u4e0d\u7cbe\u786e\u3002\u5728float64\u4e2d\uff0c\\(0.1 + 0.2 \\neq 0.3\\)\uff08\u5b83\u7b49\u4e8e \\(0.30000000000000004\\)\uff09\u3002\u8fd9\u662f\u56e0\u4e3a\\(0.1\\)\u6ca1\u6709\u7cbe\u786e\u7684\u4e8c\u8fdb\u5236\u8868\u793a\uff0c\u5c31\u50cf\\(1/3\\)\u6ca1\u6709\u7cbe\u786e\u7684\u5341\u8fdb\u5236\u8868\u793a\u4e00\u6837\u3002\u5728\u6570\u767e\u4e07\u6b21\u64cd\u4f5c\uff08\u5982\u68af\u5ea6\u4e0b\u964d\uff09\u4e2d\u79ef\u7d2f\u8fd9\u4e9b\u8bef\u5dee\u53ef\u80fd\u5bfc\u81f4\u6570\u503c\u4e0d\u7a33\u5b9a\uff0c\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48\u5b58\u5728\u50cf\u635f\u5931\u7f29\u653e\uff08\u7b2c6\u7ae0\uff09\u548cKahan\u6c42\u548c\u6cd5\u8fd9\u6837\u7684\u6280\u672f\u3002</li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/02.%20computer%20architecture/#_3","title":"\u903b\u8f91\u95e8","text":"<ul> <li> <p>\u6240\u6709\u8ba1\u7b97\u90fd\u53ef\u4ee5\u5f52\u7ed3\u4e3a\u903b\u8f91\u95e8\uff1a\u5b9e\u73b0\u5e03\u5c14\u8fd0\u7b97\uff08\u6765\u81ea\u6587\u4ef61\u7684\u547d\u9898\u903b\u8f91\uff09\u7684\u7269\u7406\u7535\u8def\u3002</p> </li> <li> <p>\u57fa\u672c\u95e8\uff1a</p> <ul> <li>\u4e0e\u95e8\uff08AND\uff09\uff1a\u4ec5\u5f53\u4e24\u4e2a\u8f93\u5165\u90fd\u4e3a1\u65f6\u8f93\u51fa\u4e3a1\u3002</li> <li>\u6216\u95e8\uff08OR\uff09\uff1a\u81f3\u5c11\u4e00\u4e2a\u8f93\u5165\u4e3a1\u65f6\u8f93\u51fa\u4e3a1\u3002</li> <li>\u975e\u95e8\uff08NOT\uff0c\u53cd\u76f8\u5668\uff09\uff1a\u7ffb\u8f6c\u8f93\u5165\u3002</li> <li>\u4e0e\u975e\u95e8\uff08NAND\uff0cNOT-AND\uff09\uff1a\u901a\u7528\u95e8\u3002\u4efb\u4f55\u5176\u4ed6\u95e8\u90fd\u53ef\u4ee5\u4ec5\u7531\u4e0e\u975e\u95e8\u6784\u5efa\u3002\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48\u4e0e\u975e\u95e8\u662f\u6570\u5b57\u7535\u8def\u7684\u57fa\u672c\u6784\u5efa\u5757\u3002</li> <li>\u5f02\u6216\u95e8\uff08XOR\uff0c\u5f02\u6216\uff09\uff1a\u8f93\u5165\u4e0d\u540c\u65f6\u8f93\u51fa\u4e3a1\u3002\u5bf9\u4e8e\u52a0\u6cd5\uff08\u4e8c\u8fdb\u5236\u52a0\u6cd5\u7684\u548c\u4f4d\u5c31\u662fXOR\uff09\u548c\u52a0\u5bc6\u81f3\u5173\u91cd\u8981\u3002</li> </ul> </li> <li> <p>\u534a\u52a0\u5668\u4f7f\u7528XOR\uff08\u548c\uff09\u548cAND\uff08\u8fdb\u4f4d\uff09\u76f8\u52a0\u4e24\u4e2a\u5355\u6bd4\u7279\u3002\u5168\u52a0\u5668\u76f8\u52a0\u4e24\u4e2a\u6bd4\u7279\u52a0\u4e0a\u4e00\u4e2a\u8fdb\u4f4d\u8f93\u5165\uff0c\u53ef\u4ee5\u4e32\u8054\u8d77\u6765\u521b\u5efa\\(n\\)\u4f4d\u52a0\u6cd5\u5668\u3002\u8fd9\u5c31\u662fCPU\u6267\u884c\u6574\u6570\u52a0\u6cd5\u7684\u65b9\u5f0f\uff1a\u4e00\u7cfb\u5217\u7b80\u5355\u903b\u8f91\u95e8\u7684\u7ea7\u8054\u3002</p> </li> <li> <p>\u591a\u8def\u9009\u62e9\u5668\uff08MUX\uff09\u6839\u636e\u63a7\u5236\u4fe1\u53f7\u4ece\u591a\u4e2a\u8f93\u5165\u4e2d\u9009\u62e9\u4e00\u4e2a\u3002\u4f7f\u7528\\(n\\)\u4e2a\u63a7\u5236\u4f4d\uff0c\u53ef\u4ee5\u4ece\\(2^n\\)\u4e2a\u8f93\u5165\u4e2d\u9009\u62e9\u3002\u591a\u8def\u9009\u62e9\u5668\u662fif-else\u94fe\u7684\u786c\u4ef6\u7b49\u4ef7\u7269\uff0c\u5e7f\u6cdb\u7528\u4e8eCPU\u6570\u636e\u901a\u8def\u4e2d\u8def\u7531\u6570\u636e\u3002</p> </li> <li> <p>\u73b0\u4ee3\u5904\u7406\u5668\u5305\u542b\u6570\u5341\u4ebf\u4e2a\u6676\u4f53\u7ba1\uff0c\u6bcf\u4e2a\u6676\u4f53\u7ba1\u5145\u5f53\u4e00\u4e2a\u5fae\u5c0f\u7684\u5f00\u5173\u3002\u6676\u4f53\u7ba1\u8981\u4e48\u5bfc\u901a\uff08\u5bfc\u7535\uff0c\u8868\u793a1\uff09\uff0c\u8981\u4e48\u4e0d\u5bfc\u901a\uff08\u4e0d\u5bfc\u7535\uff0c\u8868\u793a0\uff09\u3002\u95e8\u7531\u6676\u4f53\u7ba1\u6784\u6210\uff0c\u52a0\u6cd5\u5668\u7531\u95e8\u6784\u6210\uff0cALU\u7531\u52a0\u6cd5\u5668\u6784\u6210\uff0cCPU\u7531ALU\u6784\u6210\u3002\u6574\u4e2a\u8ba1\u7b97\u5c42\u7ea7\u5c31\u5efa\u7acb\u5728\u8fd9\u4e2a\u57fa\u7840\u4e4b\u4e0a\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/02.%20computer%20architecture/#cpu","title":"CPU\u67b6\u6784","text":"<ul> <li> <p>\u4e2d\u592e\u5904\u7406\u5668\uff08CPU\uff09\u6267\u884c\u6307\u4ee4\u3002\u5176\u6838\u5fc3\u7ec4\u4ef6\uff1a</p> <ul> <li> <p>ALU\uff08\u7b97\u672f\u903b\u8f91\u5355\u5143\uff09\uff1a\u6267\u884c\u6574\u6570\u7b97\u672f\uff08\u52a0\u3001\u51cf\u3001\u4e58\uff09\u548c\u903b\u8f91\u8fd0\u7b97\uff08AND\u3001OR\u3001XOR\u3001\u79fb\u4f4d\uff09\u3002\u8fd9\u91cc\u662f\u5b9e\u9645\u8ba1\u7b97\u53d1\u751f\u7684\u5730\u65b9\uff0c\u7531\u4e0a\u8ff0\u903b\u8f91\u95e8\u6784\u5efa\u800c\u6210\u3002</p> </li> <li> <p>\u5bc4\u5b58\u5668\uff1aCPU\u5185\u90e8\u5fae\u5c0f\u3001\u8d85\u5feb\u7684\u5b58\u50a8\u4f4d\u7f6e\u3002\u73b0\u4ee3CPU\u6709\u6570\u5341\u4e2a\u901a\u7528\u5bc4\u5b58\u5668\uff0c\u6bcf\u4e2a\u5bc4\u5b58\u5668\u4fdd\u5b58\u4e00\u4e2a\u5b57\uff08\u572864\u4f4dCPU\u4e0a\u4e3a64\u4f4d\uff09\u3002\u5bc4\u5b58\u5668\u662f\u7cfb\u7edf\u4e2d\u901f\u5ea6\u6700\u5feb\u7684\u5b58\u50a8\u5668\uff1a\u8bbf\u95ee\u65f6\u95f4\u7ea6~0.3\u7eb3\u79d2\u3002</p> </li> <li> <p>\u7a0b\u5e8f\u8ba1\u6570\u5668\uff08PC\uff09\uff1a\u4fdd\u5b58\u4e0b\u4e00\u6761\u8981\u6267\u884c\u6307\u4ee4\u7684\u5185\u5b58\u5730\u5740\u3002</p> </li> <li> <p>\u63a7\u5236\u5355\u5143\uff1a\u89e3\u7801\u6307\u4ee4\u5e76\u7f16\u6392\u6570\u636e\u901a\u8def\uff0c\u544a\u8bc9ALU\u6267\u884c\u4ec0\u4e48\u64cd\u4f5c\u4ee5\u53ca\u4f7f\u7528\u54ea\u4e9b\u5bc4\u5b58\u5668\u3002</p> </li> </ul> </li> <li> <p>\u6307\u4ee4\u5468\u671f\uff08\u53d6\u6307-\u8bd1\u7801-\u6267\u884c\uff09\u6bcf\u79d2\u91cd\u590d\u6570\u5341\u4ebf\u6b21\uff1a</p> <ol> <li>\u53d6\u6307\uff1a\u4ecePC\u4e2d\u7684\u5730\u5740\u8bfb\u53d6\u6307\u4ee4\u3002</li> <li>\u8bd1\u7801\uff1a\u786e\u5b9a\u6307\u4ee4\u7684\u529f\u80fd\uff08\u52a0\u6cd5\uff1f\u4ece\u5185\u5b58\u52a0\u8f7d\uff1f\u5206\u652f\uff1f\uff09\u53ca\u5176\u4f7f\u7528\u7684\u64cd\u4f5c\u6570\u3002</li> <li>\u6267\u884c\uff1a\u6267\u884c\u64cd\u4f5c\uff08ALU\u8ba1\u7b97\u3001\u5185\u5b58\u8bbf\u95ee\u6216\u5206\u652f\uff09\u3002</li> <li>\u589e\u52a0PC\uff08\u9664\u975e\u6307\u4ee4\u662f\u5206\u652f/\u8df3\u8f6c\uff09\u3002</li> </ol> </li> <li> <p>\u8fd0\u884c\u57284 GHz\u7684CPU\u6bcf\u79d2\u6267\u884c40\u4ebf\u4e2a\u5468\u671f\u3002\u6bcf\u4e2a\u5468\u671f\u8017\u65f60.25\u7eb3\u79d2\u3002\u5728\u8fd9\u6bb5\u65f6\u95f4\u5185\uff0c\u5149\u4f20\u64ad\u7ea67.5\u5398\u7c73\uff0c\u8fd9\u5c31\u662f\u82af\u7247\u7269\u7406\u5927\u5c0f\u91cd\u8981\u7684\u539f\u56e0\uff1a\u4fe1\u53f7\u65e0\u6cd5\u5728\u4e00\u4e2a\u5468\u671f\u5185\u7a7f\u8fc7\u5927\u82af\u7247\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/02.%20computer%20architecture/#_4","title":"\u6307\u4ee4\u96c6\u67b6\u6784","text":"<ul> <li> <p>\u6307\u4ee4\u96c6\u67b6\u6784\uff08ISA\uff09\u662f\u786c\u4ef6\u548c\u8f6f\u4ef6\u4e4b\u95f4\u7684\u5951\u7ea6\uff1a\u5b83\u5b9a\u4e49\u4e86CPU\u80fd\u7406\u89e3\u7684\u6307\u4ee4\u3001\u5bc4\u5b58\u5668\u96c6\u3001\u5185\u5b58\u6a21\u578b\u548c\u7f16\u7801\u683c\u5f0f\u3002</p> </li> <li> <p>CISC\uff08\u590d\u6742\u6307\u4ee4\u96c6\u8ba1\u7b97\u673a\uff09\uff1a\u6307\u4ee4\u53ef\u4ee5\u590d\u6742\u3001\u53d8\u957f\uff0c\u5e76\u53ef\u4ee5\u76f4\u63a5\u8bbf\u95ee\u5185\u5b58\u3002\u4e00\u6761\u6307\u4ee4\u53ef\u4ee5\u4e58\u6cd5\u4e24\u4e2a\u5185\u5b58\u503c\u5e76\u5b58\u50a8\u7ed3\u679c\u3002x86\uff08Intel/AMD\uff09\u662f\u5360\u4e3b\u5bfc\u5730\u4f4d\u7684CISC ISA\uff0c\u9a71\u52a8\u7740\u5927\u591a\u6570\u684c\u9762\u548c\u670d\u52a1\u5668\u3002\u5176\u5411\u540e\u517c\u5bb9\u6027\uff08\u73b0\u4ee3x86 CPU\u4ecd\u7136\u8fd0\u884c1980\u5e74\u4ee3\u7684\u4ee3\u7801\uff09\u65e2\u662f\u4f18\u52bf\u4e5f\u662f\u8d1f\u62c5\u3002</p> </li> <li> <p>RISC\uff08\u7cbe\u7b80\u6307\u4ee4\u96c6\u8ba1\u7b97\u673a\uff09\uff1a\u6307\u4ee4\u7b80\u5355\u3001\u5b9a\u957f\uff0c\u4e14\u4ec5\u64cd\u4f5c\u5bc4\u5b58\u5668\u3002\u5185\u5b58\u8bbf\u95ee\u9700\u8981\u5355\u72ec\u7684\u52a0\u8f7d/\u5b58\u50a8\u6307\u4ee4\u3002\u66f4\u7b80\u5355\u7684\u6307\u4ee4\u53ef\u5b9e\u73b0\u66f4\u5feb\u7684\u65f6\u949f\u901f\u5ea6\u548c\u66f4\u6613\u5b9e\u73b0\u7684\u6d41\u6c34\u7ebf\u3002</p> <ul> <li>ARM\uff1a\u79fb\u52a8\u8bbe\u5907\u7684\u4e3b\u8981RISC ISA\uff0c\u5e76\u8d8a\u6765\u8d8a\u591a\u5730\u7528\u4e8e\u670d\u52a1\u5668\u548c\u7b14\u8bb0\u672c\u7535\u8111\uff08Apple M\u7cfb\u5217\u82af\u7247\u5c31\u662fARM\uff09\u3002ARM\u7684\u80fd\u6548\u4f7f\u5176\u975e\u5e38\u9002\u5408\u7535\u6c60\u4f9b\u7535\u548c\u70ed\u53d7\u9650\u8bbe\u5907\u3002</li> <li>RISC-V\uff1a\u4e00\u4e2a\u5f00\u6e90\u7684RISC ISA\u3002\u4efb\u4f55\u4eba\u90fd\u53ef\u4ee5\u8bbe\u8ba1RISC-V\u82af\u7247\u800c\u65e0\u9700\u8bb8\u53ef\u8d39\u3002\u5728\u5d4c\u5165\u5f0f\u7cfb\u7edf\u3001\u7814\u7a76\u548cAI\u52a0\u901f\u5668\u4e2d\u7684\u91c7\u7528\u6b63\u5728\u589e\u957f\u3002</li> </ul> </li> <li> <p>CISC\u4e0eRISC\u7684\u533a\u522b\u5df2\u7ecf\u6a21\u7cca\uff1a\u73b0\u4ee3x86 CPU\u5185\u90e8\u5c06\u590d\u6742\u7684CISC\u6307\u4ee4\u89e3\u7801\u4e3a\u66f4\u7b80\u5355\u7684\u5fae\u64cd\u4f5c\uff08\u672c\u8d28\u4e0a\u662f\u5185\u90e8RISC\uff09\uff0c\u4ece\u800c\u83b7\u5f97\u4e24\u65b9\u9762\u7684\u4f18\u52bf\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/02.%20computer%20architecture/#_5","title":"\u6d41\u6c34\u7ebf","text":"<ul> <li>\u6ca1\u6709\u6d41\u6c34\u7ebf\u65f6\uff0cCPU\u5b8c\u5168\u5b8c\u6210\u4e00\u6761\u6307\u4ee4\u540e\u624d\u5f00\u59cb\u4e0b\u4e00\u6761\u3002\u8fd9\u4f1a\u6d6a\u8d39\u786c\u4ef6\uff1a\u5f53ALU\u6267\u884c\u65f6\uff0c\u53d6\u6307\u548c\u8bd1\u7801\u5355\u5143\u5904\u4e8e\u7a7a\u95f2\u72b6\u6001\u3002</li> </ul> <ul> <li> <p>\u6d41\u6c34\u7ebf\u4f7f\u6307\u4ee4\u6267\u884c\u91cd\u53e0\uff0c\u5982\u540c\u88c5\u914d\u7ebf\u3002\u5f53\u6307\u4ee41\u5728\u6267\u884c\u65f6\uff0c\u6307\u4ee42\u5728\u8bd1\u7801\uff0c\u6307\u4ee43\u5728\u88ab\u53d6\u6307\u3002\u4e00\u4e2a5\u7ea7\u6d41\u6c34\u7ebf\uff08\u53d6\u6307\u3001\u8bd1\u7801\u3001\u6267\u884c\u3001\u8bbf\u5b58\u3001\u5199\u56de\uff09\u53ef\u4ee5\u540c\u65f6\u67095\u6761\u6307\u4ee4\u5728\u6267\u884c\u4e2d\u3002</p> </li> <li> <p>\u541e\u5410\u91cf\u63a5\u8fd1\u6bcf\u5468\u671f\u4e00\u6761\u6307\u4ee4\uff08\u5c3d\u7ba1\u6bcf\u6761\u6307\u4ee4\u9700\u89815\u4e2a\u5468\u671f\u624d\u80fd\u5b8c\u6210\uff09\u3002\u8fd9\u4e0eML\u4e2d\u7684\u6d41\u6c34\u7ebf\u539f\u7406\u76f8\u540c\uff1a\u6570\u636e\u5e76\u884c\u6027\u4f7f\u8ba1\u7b97\u548c\u901a\u4fe1\u91cd\u53e0\uff08\u7b2c6\u7ae0\uff09\u3002</p> </li> <li> <p>\u5192\u9669\u662f\u6d41\u6c34\u7ebf\u88ab\u7834\u574f\u7684\u60c5\u51b5\uff1a</p> <ul> <li> <p>\u6570\u636e\u5192\u9669\uff1a\u6307\u4ee42\u9700\u8981\u6307\u4ee41\u5c1a\u672a\u4ea7\u751f\u7684\u7ed3\u679c\u3002\"Add R1, R2, R3\"\u540e\u8ddf\"Sub R4, R1, R5\"\u2014\u2014\u7b2c\u4e8c\u6761\u6307\u4ee4\u9700\u8981R1\uff0c\u800c\u7b2c\u4e00\u6761\u6307\u4ee4\u4ecd\u5728\u8ba1\u7b97\u3002\u8f6c\u53d1\uff08\u65c1\u8def\uff09\u901a\u8fc7\u5c06\u7ed3\u679c\u76f4\u63a5\u4ece\u4e00\u7ea7\u6d41\u6c34\u7ebf\u8def\u7531\u5230\u53e6\u4e00\u7ea7\uff0c\u65e0\u9700\u7b49\u5f85\u5199\u56de\u9636\u6bb5\u6765\u89e3\u51b3\u8fd9\u4e2a\u95ee\u9898\u3002</p> </li> <li> <p>\u63a7\u5236\u5192\u9669\uff1a\u5206\u652f\u6307\u4ee4\uff08if-else\uff09\u610f\u5473\u7740CPU\u5728\u5206\u652f\u89e3\u6790\u4e4b\u524d\u4e0d\u77e5\u9053\u5e94\u8be5\u53d6\u6307\u54ea\u6761\u4e0b\u4e00\u6761\u6307\u4ee4\u3002\u5206\u652f\u9884\u6d4b\u731c\u6d4b\u5206\u652f\u5c06\u8d70\u54ea\u6761\u8def\u5f84\uff0c\u5e76\u63a8\u6d4b\u6027\u5730\u6cbf\u9884\u6d4b\u8def\u5f84\u53d6\u6307\u3002\u73b0\u4ee3\u9884\u6d4b\u5668\u51c6\u786e\u7387\u8d85\u8fc795%\uff0c\u4f7f\u7528\u5386\u53f2\u8868\u548c\u7c7b\u4f3c\u795e\u7ecf\u7f51\u7edc\u7684\u6a21\u5f0f\u5339\u914d\u3002\u4e00\u6b21\u9884\u6d4b\u9519\u8bef\u4ee3\u4ef7\u7ea6~15\u4e2a\u5468\u671f\uff08\u6d41\u6c34\u7ebf\u5fc5\u987b\u88ab\u6e05\u7a7a\u5e76\u91cd\u542f\uff09\u3002</p> </li> <li> <p>\u7ed3\u6784\u5192\u9669\uff1a\u4e24\u6761\u6307\u4ee4\u540c\u65f6\u9700\u8981\u76f8\u540c\u7684\u786c\u4ef6\u8d44\u6e90\uff08\u4f8b\u5982\uff0c\u90fd\u9700\u8981\u5185\u5b58\u7aef\u53e3\uff09\u3002\u901a\u8fc7\u590d\u5236\u8d44\u6e90\u6216\u63d2\u5165\u505c\u987f\u6765\u89e3\u51b3\u3002</p> </li> </ul> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/02.%20computer%20architecture/#_6","title":"\u5b58\u50a8\u5668\u5c42\u6b21\u7ed3\u6784","text":"<ul> <li>\u8ba1\u7b97\u673a\u5185\u5b58\u4e2d\u7684\u6839\u672c\u77db\u76fe\uff1a\u5feb\u901f\u5185\u5b58\u6602\u8d35\u4e14\u5bb9\u91cf\u5c0f\uff0c\u5ec9\u4ef7\u5185\u5b58\u7f13\u6162\u4f46\u5bb9\u91cf\u5927\u3002\u5b58\u50a8\u5668\u5c42\u6b21\u7ed3\u6784\u901a\u8fc7\u5229\u7528\u5c40\u90e8\u6027\u6765\u5f25\u5408\u8fd9\u4e00\u5dee\u8ddd\uff1a\u7a0b\u5e8f\u503e\u5411\u4e8e\u91cd\u590d\u8bbf\u95ee\u76f8\u540c\u7684\u6570\u636e\uff08\u65f6\u95f4\u5c40\u90e8\u6027\uff09\u5e76\u8bbf\u95ee\u9644\u8fd1\u7684\u6570\u636e\uff08\u7a7a\u95f4\u5c40\u90e8\u6027\uff09\u3002</li> </ul> <ul> <li> <p>\u5c42\u6b21\u7ed3\u6784\uff0c\u4ece\u6700\u5feb\u5230\u6700\u6162\uff1a</p> <ul> <li>\u5bc4\u5b58\u5668\uff1a~0.3 ns\u8bbf\u95ee\uff0c\u603b\u5bb9\u91cf~KB\u3002\u4f4d\u4e8eCPU\u5185\u3002</li> <li>L1\u7f13\u5b58\uff1a~1 ns\uff0c\u6bcf\u6838\u5fc332-64 KB\u3002\u5206\u4e3a\u6307\u4ee4\u7f13\u5b58\u548c\u6570\u636e\u7f13\u5b58\u3002</li> <li>L2\u7f13\u5b58\uff1a~4 ns\uff0c\u6bcf\u6838\u5fc3256 KB-1 MB\u3002</li> <li>L3\u7f13\u5b58\uff1a~10 ns\uff0c\u8de8\u6838\u5fc3\u5171\u4eab8-64 MB\u3002</li> <li>RAM\uff08DRAM\uff09\uff1a~50-100 ns\uff0c8-512 GB\u3002\u4e3b\u5185\u5b58\u3002</li> <li>SSD\uff1a~10-100 \u03bcs\uff0c256 GB-8 TB\u3002\u6301\u4e45\u5b58\u50a8\u3002</li> <li>HDD\uff1a~5-10 ms\uff0c1-20 TB\u3002\u673a\u68b0\u5f0f\uff0c\u968f\u673a\u8bbf\u95ee\u975e\u5e38\u6162\u3002</li> </ul> </li> <li> <p>\u5bc4\u5b58\u5668\u548cRAM\u4e4b\u95f4\u7684\u901f\u5ea6\u5dee\u8ddd\u7ea6\u4e3a300\u500d\u3002\u5bc4\u5b58\u5668\u548c\u78c1\u76d8\u4e4b\u95f4\u7ea6\u4e3a30,000,000\u500d\u3002\u7f13\u5b58\u5c42\u6b21\u7ed3\u6784\u9690\u85cf\u4e86\u8fd9\u4e00\u5dee\u8ddd\uff1a\u5982\u679cCPU\u9700\u8981\u7684\u6570\u636e\u5728L1\u7f13\u5b58\u4e2d\uff08\u7f13\u5b58\u547d\u4e2d\uff09\uff0c\u8bbf\u95ee\u5f88\u5feb\u3002\u5982\u679c\u4e0d\u5728\uff08\u7f13\u5b58\u672a\u547d\u4e2d\uff09\uff0cCPU\u505c\u987f\uff0c\u540c\u65f6\u4ece\u66f4\u6162\u7684\u5c42\u7ea7\u83b7\u53d6\u6570\u636e\u3002</p> </li> <li> <p>\u7f13\u5b58\u5173\u8054\u5ea6\u51b3\u5b9a\u5185\u5b58\u5730\u5740\u53ef\u4ee5\u5b58\u50a8\u5728\u7f13\u5b58\u4e2d\u7684\u4f4d\u7f6e\uff1a</p> <ul> <li>\u76f4\u63a5\u6620\u5c04\uff1a\u6bcf\u4e2a\u5730\u5740\u6620\u5c04\u5230\u6070\u597d\u4e00\u4e2a\u7f13\u5b58\u884c\u3002\u7b80\u5355\u4f46\u4f1a\u5bfc\u81f4\u51b2\u7a81\u3002</li> <li>\u5168\u5173\u8054\uff1a\u4efb\u4f55\u5730\u5740\u53ef\u4ee5\u653e\u5728\u4efb\u4f55\u4f4d\u7f6e\u3002\u7075\u6d3b\u4f46\u641c\u7d22\u6210\u672c\u9ad8\u3002</li> <li>\u7ec4\u5173\u8054\uff08\\(k\\)\u8def\uff09\uff1a\u6bcf\u4e2a\u5730\u5740\u6620\u5c04\u5230\u4e00\u7ec4\\(k\\)\u4e2a\u4f4d\u7f6e\u3002\u5b9e\u9645CPU\u4e2d\u4f7f\u7528\u7684\u5b9e\u7528\u6298\u8877\u65b9\u6848\uff08\u901a\u5e38\u4e3a4\u8def\u62168\u8def\uff09\u3002</li> </ul> </li> <li> <p>\u7f13\u5b58\u4e00\u81f4\u6027\u786e\u4fdd\u6240\u6709CPU\u6838\u5fc3\u770b\u5230\u4e00\u81f4\u7684\u5185\u5b58\u89c6\u56fe\u3002\u5f53\u6838\u5fc31\u5199\u5165\u4e00\u4e2a\u6838\u5fc32\u5df2\u7f13\u5b58\u7684\u5185\u5b58\u5730\u5740\u65f6\uff0c\u4e00\u81f4\u6027\u534f\u8bae\uff08\u5982MESI\uff09\u4f1a\u4f7f\u6838\u5fc32\u7684\u526f\u672c\u5931\u6548\u6216\u66f4\u65b0\u3002\u8fd9\u5bf9\u5e76\u53d1\u7f16\u7a0b\uff08\u6587\u4ef64\uff09\u81f3\u5173\u91cd\u8981\uff0c\u4e5f\u662f\u5171\u4eab\u5185\u5b58\u5e76\u884c\u6027\u56f0\u96be\u7684\u539f\u56e0\u4e4b\u4e00\u3002</p> </li> <li> <p>\u5bf9\u4e8eML\u4ece\u4e1a\u8005\uff0c\u5b58\u50a8\u5668\u5c42\u6b21\u7ed3\u6784\u89e3\u91ca\u4e86\u4e3a\u4ec0\u4e48\uff1a</p> <ul> <li>\u77e9\u9635\u8fd0\u7b97\u5e94\u6309\u987a\u5e8f\u8bbf\u95ee\u5185\u5b58\uff08\u884c\u4f18\u5148\u4e0e\u5217\u4f18\u5148\u7684\u5e03\u5c40\u5f88\u91cd\u8981\uff09\u3002</li> <li>\u6279\u91cf\u5927\u5c0f\u4f1a\u5f71\u54cd\u6027\u80fd\uff1a\u66f4\u5927\u7684\u6279\u6b21\u5206\u644a\u5185\u5b58\u5ef6\u8fdf\u3002</li> <li>\u6df7\u5408\u7cbe\u5ea6\uff08float16/bfloat16\uff09\u4f7f\u6709\u6548\u5185\u5b58\u5e26\u5bbd\u7ffb\u500d\uff0c\u800c\u5185\u5b58\u5e26\u5bbd\u5f80\u5f80\u662f\u74f6\u9888\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/02.%20computer%20architecture/#_7","title":"\u865a\u62df\u5185\u5b58","text":"<ul> <li> <p>\u865a\u62df\u5185\u5b58\u4f7f\u6bcf\u4e2a\u8fdb\u7a0b\u4eff\u4f5b\u62e5\u6709\u81ea\u5df1\u72ec\u7acb\u3001\u8fde\u7eed\u7684\u5927\u5185\u5b58\u7a7a\u95f4\uff0c\u5373\u4f7f\u7269\u7406RAM\u662f\u6709\u9650\u7684\u5e76\u5728\u8fdb\u7a0b\u95f4\u5171\u4eab\u3002</p> </li> <li> <p>\u5730\u5740\u7a7a\u95f4\u88ab\u5212\u5206\u4e3a\u56fa\u5b9a\u5927\u5c0f\u7684\u9875\uff08\u901a\u5e38\u4e3a4 KB\uff09\u3002\u9875\u8868\u5c06\u865a\u62df\u9875\u53f7\u6620\u5c04\u5230\u7269\u7406\u5e27\u53f7\u3002\u5f53\u7a0b\u5e8f\u8bbf\u95ee\u865a\u62df\u5730\u57400x1234\u65f6\uff0cCPU\u901a\u8fc7\u67e5\u627e\u9875\u8868\u5c06\u5176\u8f6c\u6362\u4e3a\u7269\u7406\u5730\u5740\u3002</p> </li> <li> <p>\u8f6c\u8bd1\u540e\u5907\u7f13\u51b2\u5668\uff08TLB\uff09\u662f\u9875\u8868\u9879\u7684\u7f13\u5b58\u3002\u7531\u4e8e\u9875\u8868\u4f4d\u4e8eRAM\u4e2d\uff08\u6162\u901f\uff09\uff0cTLB\u5728\u5feb\u901f\u786c\u4ef6\u4e2d\u5b58\u50a8\u6700\u8fd1\u4f7f\u7528\u7684\u8f6c\u8bd1\u7ed3\u679c\u3002TLB\u672a\u547d\u4e2d\u9700\u8981\u904d\u5386\u5185\u5b58\u4e2d\u7684\u9875\u8868\uff0c\u8017\u8d39\u6570\u767e\u4e2a\u5468\u671f\u3002</p> </li> <li> <p>\u5f53\u7a0b\u5e8f\u8bbf\u95ee\u4e00\u4e2a\u4e0d\u5728\u7269\u7406RAM\u4e2d\u7684\u9875\u65f6\uff0c\u53d1\u751f\u7f3a\u9875\u3002OS\u4ece\u78c1\u76d8\u52a0\u8f7d\u8be5\u9875\uff08\u4ea4\u6362\uff09\uff0c\u8017\u8d39\u6570\u767e\u4e07\u4e2a\u5468\u671f\u3002\u8fc7\u591a\u7684\u7f3a\u9875\uff08\u7cfb\u7edf\u98a0\u7c38\uff09\u4f1a\u4e25\u91cd\u635f\u5bb3\u6027\u80fd\u3002\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48ML\u8bad\u7ec3\u9700\u8981\u8db3\u591f\u7684RAM\u6765\u5bb9\u7eb3\u6a21\u578b\u3001\u4f18\u5316\u5668\u72b6\u6001\u548c\u5408\u7406\u7684\u6570\u636e\u6279\u6b21\u3002</p> </li> <li> <p>\u9875\u9762\u7f6e\u6362\u7b97\u6cd5\u51b3\u5b9a\u5f53RAM\u6ee1\u65f6\u5e94\u6362\u51fa\u54ea\u4e2a\u9875\u9762\uff1a</p> <ul> <li>LRU\uff08\u6700\u8fd1\u6700\u5c11\u4f7f\u7528\uff09\uff1a\u6362\u51fa\u6700\u957f\u65f6\u95f4\u672a\u88ab\u8bbf\u95ee\u7684\u9875\u9762\u3002\u5728\u5b9e\u8df5\u4e2d\u5bf9\u5927\u591a\u6570\u5de5\u4f5c\u8d1f\u8f7d\u6700\u4f18\u3002\u5728\u786c\u4ef6\u4e2d\u901a\u8fc7\u65f6\u949f\u7b97\u6cd5\uff08\u5e26\u5f15\u7528\u4f4d\u7684\u5faa\u73af\u94fe\u8868\uff09\u8fd1\u4f3c\u5b9e\u73b0\u3002</li> <li>FIFO\uff1a\u6362\u51fa\u6700\u65e7\u7684\u9875\u9762\u3002\u7b80\u5355\u4f46\u53ef\u80fd\u6362\u51fa\u9891\u7e41\u4f7f\u7528\u7684\u9875\u9762\u3002</li> <li>\u6700\u4f18\uff08B\u00e9l\u00e1dy\u7b97\u6cd5\uff09\uff1a\u6362\u51fa\u5c06\u5728\u6700\u957f\u65f6\u95f4\u5185\u4e0d\u88ab\u4f7f\u7528\u7684\u9875\u9762\u3002\u65e0\u6cd5\u5b9e\u73b0\uff08\u9700\u8981\u672a\u6765\u77e5\u8bc6\uff09\u4f46\u53ef\u4f5c\u4e3a\u7406\u8bba\u57fa\u51c6\u3002</li> </ul> </li> <li> <p>\u865a\u62df\u5185\u5b58\u8fd8\u63d0\u4f9b\u4e86\u9694\u79bb\uff1a\u6bcf\u4e2a\u8fdb\u7a0b\u90fd\u6709\u81ea\u5df1\u7684\u865a\u62df\u5730\u5740\u7a7a\u95f4\u3002\u4e00\u4e2a\u8fdb\u7a0b\u4e2d\u7684\u9519\u8bef\u4e0d\u4f1a\u7834\u574f\u53e6\u4e00\u4e2a\u8fdb\u7a0b\u7684\u5185\u5b58\uff0c\u56e0\u4e3a\u5b83\u4eec\u7684\u865a\u62df\u5730\u5740\u6620\u5c04\u5230\u4e0d\u540c\u7684\u7269\u7406\u5e27\u3002\u8fd9\u662fOS\u5b89\u5168\u6027\u548c\u7a33\u5b9a\u6027\u7684\u57fa\u7840\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/02.%20computer%20architecture/#iodma","title":"I/O\u3001\u4e2d\u65ad\u548cDMA","text":"<ul> <li> <p>CPU\u9700\u8981\u4e0e\u5916\u90e8\u4e16\u754c\u901a\u4fe1\uff1a\u78c1\u76d8\u3001\u7f51\u5361\u3001\u952e\u76d8\u3001GPU\u3002\u8fd9\u5c31\u662fI/O\u5b50\u7cfb\u7edf\u3002</p> </li> <li> <p>\u7a0b\u5e8f\u63a7\u5236I/O\uff08\u8f6e\u8be2\uff09\uff1aCPU\u5728\u4e00\u4e2a\u5faa\u73af\u4e2d\u53cd\u590d\u68c0\u67e5\u8bbe\u5907\u7684\u72b6\u6001\u5bc4\u5b58\u5668\uff0c\u7b49\u5f85\u6570\u636e\u5c31\u7eea\u3002\u7b80\u5355\u4f46\u6d6a\u8d39CPU\u5468\u671f\u505a\u7a7a\u8f6c\u800c\u4e0d\u662f\u6709\u7528\u5de5\u4f5c\u3002</p> </li> <li> <p>\u4e2d\u65ad\u9a71\u52a8I/O\uff1a\u8bbe\u5907\u5728\u6570\u636e\u5c31\u7eea\u65f6\u53d1\u9001\u4e00\u4e2a\u786c\u4ef6\u4e2d\u65ad\u3002CPU\u7ee7\u7eed\u6b63\u5e38\u6267\u884c\u76f4\u5230\u4e2d\u65ad\u5230\u8fbe\uff0c\u7136\u540e\u8fd0\u884c\u4e00\u4e2a\u4e2d\u65ad\u5904\u7406\u7a0b\u5e8f\uff08\u5185\u6838\u51fd\u6570\uff09\u6765\u5904\u7406\u6570\u636e\u3002\u8fd9\u6bd4\u8f6e\u8be2\u9ad8\u6548\u5f97\u591a\uff0c\u56e0\u4e3aCPU\u5728\u7b49\u5f85\u65f6\u4e0d\u4f1a\u7a7a\u95f2\u3002</p> </li> <li> <p>\u4e2d\u65ad\u673a\u5236\uff1a</p> <ol> <li>\u8bbe\u5907\u901a\u8fc7\u786c\u4ef6\u7ebf\u8def\u53d1\u51fa\u4e2d\u65ad\u4fe1\u53f7\u3002</li> <li>CPU\u5b8c\u6210\u5f53\u524d\u6307\u4ee4\uff0c\u5c06\u5f53\u524d\u72b6\u6001\uff08\u5bc4\u5b58\u5668\u3001\u7a0b\u5e8f\u8ba1\u6570\u5668\uff09\u4fdd\u5b58\u5230\u5806\u6808\u3002</li> <li>CPU\u5728\u4e2d\u65ad\u5411\u91cf\u8868\uff08\u6bcf\u4e2a\u4e2d\u65ad\u7c7b\u578b\u5bf9\u5e94\u4e00\u4e2a\u51fd\u6570\u6307\u9488\u7684\u8868\uff09\u4e2d\u67e5\u627e\u4e2d\u65ad\u5904\u7406\u7a0b\u5e8f\u5730\u5740\u3002</li> <li>\u5904\u7406\u7a0b\u5e8f\u5728\u5185\u6838\u6a21\u5f0f\u4e0b\u8fd0\u884c\uff0c\u5904\u7406I/O\uff0c\u7136\u540e\u8fd4\u56de\u3002</li> <li>CPU\u6062\u590d\u4fdd\u5b58\u7684\u72b6\u6001\u5e76\u6062\u590d\u88ab\u4e2d\u65ad\u7684\u7a0b\u5e8f\u3002</li> </ol> </li> <li> <p>\u8fd9\u4e0e\u4e0a\u4e0b\u6587\u5207\u6362\uff08\u6587\u4ef63\uff09\u7684\u4fdd\u5b58/\u6062\u590d\u6a21\u5f0f\u76f8\u540c\uff0c\u4f46\u7531\u786c\u4ef6\u800c\u975e\u5b9a\u65f6\u5668\u89e6\u53d1\u3002</p> </li> <li> <p>DMA\uff08\u76f4\u63a5\u5b58\u50a8\u5668\u8bbf\u95ee\uff09\uff1a\u5bf9\u4e8e\u5927\u6570\u636e\u4f20\u8f93\uff08\u78c1\u76d8\u8bfb\u53d6\u3001\u7f51\u7edc\u6570\u636e\u5305\u3001GPU\u5185\u5b58\u590d\u5236\uff09\uff0c\u8ba9CPU\u9010\u5b57\u8282\u590d\u5236\u6570\u636e\u662f\u6d6a\u8d39\u7684\u3002DMA\u63a7\u5236\u5668\u76f4\u63a5\u5728\u8bbe\u5907\u548cRAM\u4e4b\u95f4\u4f20\u8f93\u6570\u636e\uff0c\u65e0\u9700CPU\u53c2\u4e0e\u3002CPU\u8bbe\u7f6e\u4f20\u8f93\uff08\u6e90\u5730\u5740\u3001\u76ee\u6807\u5730\u5740\u3001\u5927\u5c0f\uff09\uff0cDMA\u63a7\u5236\u5668\u5904\u7406\u4f20\u8f93\uff0c\u5b8c\u6210\u540eCPU\u6536\u5230\u4e00\u4e2a\u4e2d\u65ad\u3002</p> </li> <li> <p>DMA\u5bf9ML\u81f3\u5173\u91cd\u8981\uff1a\u5f53\u4f60\u8c03\u7528 <code>model.to('cuda')</code> \u65f6\uff0c\u6570\u636e\u901a\u8fc7PCIe\u603b\u7ebf\u4e0a\u7684DMA\u4ece\u7cfb\u7edfRAM\u4f20\u8f93\u5230GPU\u5185\u5b58\u3002\u5728\u8bad\u7ec3\u671f\u95f4\uff0c\u8de8GPU\u7684\u68af\u5ea6\u540c\u6b65\u4f7f\u7528\u57fa\u4e8eDMA\u7684RDMA\uff08\u8fdc\u7a0bDMA\uff09\u8fdb\u884c\u9ad8\u5e26\u5bbd\u3001\u4f4e\u5ef6\u8fdf\u4f20\u8f93\uff08\u7b2c6\u7ae0\uff09\u3002</p> </li> <li> <p>\u603b\u7ebf\u5c06CPU\u8fde\u63a5\u5230\u5185\u5b58\u548cI/O\u8bbe\u5907\u3002\u73b0\u4ee3\u7cfb\u7edf\u4f7f\u7528PCIe\uff08\u5feb\u901f\u5916\u8bbe\u7ec4\u4ef6\u4e92\u8fde\uff09\u8fde\u63a5\u9ad8\u901f\u8bbe\u5907\uff08GPU\u3001NVMe SSD\u3001\u7f51\u5361\uff09\u3002PCIe 4.0\u5728\u6bcf\u4e2ax16\u63d2\u69fd\u4e0a\u63d0\u4f9b\u7ea6~32 GB/s\uff1bPCIe 5.0\u5c06\u5176\u7ffb\u500d\u3002\u603b\u7ebf\u5e26\u5bbd\u901a\u5e38\u662fGPU\u8bad\u7ec3\u7684\u74f6\u9888\uff1aGPU\u7684\u8ba1\u7b97\u901f\u5ea6\u53ef\u80fd\u5feb\u4e8e\u6570\u636e\u9001\u8fbe\u7684\u901f\u5ea6\u3002</p> </li> <li> <p>MMIO\uff08\u5185\u5b58\u6620\u5c04I/O\uff09\uff1a\u8bbe\u5907\u5bc4\u5b58\u5668\u88ab\u6620\u5c04\u5230\u5185\u5b58\u5730\u5740\u3002CPU\u4f7f\u7528\u666e\u901a\u7684\u52a0\u8f7d/\u5b58\u50a8\u6307\u4ee4\u5bf9\u8fd9\u4e9b\u5730\u5740\u8fdb\u884c\u8bfb\u5199\uff0c\u786c\u4ef6\u5c06\u8bbf\u95ee\u8def\u7531\u5230\u8bbe\u5907\u800c\u4e0d\u662fRAM\u3002\u8fd9\u7edf\u4e00\u4e86\u5185\u5b58\u548cI/O\u8bbf\u95ee\u4e3a\u4e00\u4e2a\u5355\u4e00\u673a\u5236\uff0c\u7b80\u5316\u4e86\u786c\u4ef6\u548c\u8f6f\u4ef6\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/02.%20computer%20architecture/#colab","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216\u7b14\u8bb0\u672c\uff09","text":"<ol> <li> <p>\u63a2\u7d22IEEE 754\u6d6e\u70b9\u6570\u8868\u793a\u3002\u5c06\u6d6e\u70b9\u6570\u8f6c\u6362\u4e3a\u4e8c\u8fdb\u5236\u8868\u793a\uff0c\u89c2\u5bdf\u7b26\u53f7\u3001\u6307\u6570\u548c\u5c3e\u6570\u5b57\u6bb5\u3002 <pre><code>import struct\n\ndef float_to_bits(f):\n    \"\"\"\u663e\u793afloat32\u7684IEEE 754\u4e8c\u8fdb\u5236\u8868\u793a\u3002\"\"\"\n    packed = struct.pack('&gt;f', f)\n    bits = ''.join(f'{byte:08b}' for byte in packed)\n    sign = bits[0]\n    exponent = bits[1:9]\n    mantissa = bits[9:]\n    return sign, exponent, mantissa\n\nfor val in [1.0, -1.0, 0.1, 0.5, 3.14, float('inf'), float('nan')]:\n    s, e, m = float_to_bits(val)\n    print(f\"{val:&gt;10}  sign={s}  exp={e} ({int(e, 2) - 127:&gt;4d})  mantissa={m[:10]}...\")\n</code></pre></p> </li> <li> <p>\u6a21\u62df\u76f4\u63a5\u6620\u5c04\u7f13\u5b58\u3002\u8ddf\u8e2a\u4e00\u7cfb\u5217\u5185\u5b58\u8bbf\u95ee\u7684\u547d\u4e2d\u4e0e\u672a\u547d\u4e2d\u3002 <pre><code>def simulate_cache(accesses, cache_size=8, block_size=1):\n    \"\"\"\u6a21\u62df\u76f4\u63a5\u6620\u5c04\u7f13\u5b58\u3002\"\"\"\n    cache = [None] * cache_size\n    hits, misses = 0, 0\n\n    for addr in accesses:\n        cache_line = addr % cache_size\n        if cache[cache_line] == addr:\n            hits += 1\n            status = \"HIT \"\n        else:\n            misses += 1\n            cache[cache_line] = addr\n            status = \"MISS\"\n        print(f\"  Access {addr:3d} \u2192 line {cache_line}: {status}\")\n\n    print(f\"\\nHits: {hits}, Misses: {misses}, Hit rate: {hits/(hits+misses):.1%}\")\n\n# \u987a\u5e8f\u8bbf\u95ee\uff08\u826f\u597d\u7684\u5c40\u90e8\u6027\uff09\nprint(\"\u987a\u5e8f\u8bbf\u95ee\uff1a\")\nsimulate_cache([0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3])\n\n# \u8de8\u6b65\u8bbf\u95ee\uff08\u51b2\u7a81\u672a\u547d\u4e2d\uff09\nprint(\"\\n\u8de8\u6b65\u8bbf\u95ee\uff08stride = cache size\uff09\uff1a\")\nsimulate_cache([0, 8, 0, 8, 0, 8])\n</code></pre></p> </li> <li> <p>\u6f14\u793a\u4e3a\u4ec0\u4e48\u6d6e\u70b9\u7b97\u672f\u4e0d\u6ee1\u8db3\u7ed3\u5408\u5f8b\u3002\u5c55\u793a \\((a + b) + c \\neq a + (b + c)\\) \u7684\u60c5\u51b5\u3002 <pre><code>import jax.numpy as jnp\n\na = jnp.float32(1e8)\nb = jnp.float32(1.0)\nc = jnp.float32(-1e8)\n\nleft = (a + b) + c   # (1e8 + 1) + (-1e8)\nright = a + (b + c)  # 1e8 + (1 + (-1e8))\n\nprint(f\"(a + b) + c = {left}\")   # \u5e94\u4e3a 1.0\nprint(f\"a + (b + c) = {right}\")  # \u53ef\u80fd\u4f1a\u4e22\u5931 1.0\nprint(f\"Equal: {left == right}\")\nprint(f\"\\n\u5f53 1.0 \u52a0\u5230 1e8 \u4e0a\u65f6\u88ab\u4e22\u5931\uff0c\u56e0\u4e3a float32 \u53ea\u6709\u7ea6 7 \u4f4d\u7cbe\u5ea6\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2013%3A%20computing%20and%20OS/03.%20operating%20systems/","title":"\u64cd\u4f5c\u7cfb\u7edf","text":"<p>\u64cd\u4f5c\u7cfb\u7edf\u662f\u786c\u4ef6\u4e0e\u5e94\u7528\u7a0b\u5e8f\u4e4b\u95f4\u7684\u8f6f\u4ef6\u5c42\uff0c\u8d1f\u8d23\u7ba1\u7406\u8d44\u6e90\u3001\u63d0\u4f9b\u62bd\u8c61\u5e76\u5b9e\u65bd\u9694\u79bb\u3002\u672c\u6587\u6db5\u76d6\u64cd\u4f5c\u7cfb\u7edf\u7684\u529f\u80fd\u3001\u8fdb\u7a0b\u3001\u7ebf\u7a0b\u3001CPU\u8c03\u5ea6\u3001\u5185\u5b58\u7ba1\u7406\u3001\u6587\u4ef6\u7cfb\u7edf\u548c\u7cfb\u7edf\u8c03\u7528\u3002</p> <ul> <li> <p>\u6ca1\u6709\u64cd\u4f5c\u7cfb\u7edf\u7684\u8ba1\u7b97\u673a\u5c31\u50cf\u4e00\u4e2a\u6ca1\u6709\u53a8\u5e08\u7684\u53a8\u623f\uff1a\u98df\u6750\uff08\u786c\u4ef6\uff09\u90fd\u5728\u90a3\u91cc\uff0c\u4f46\u6ca1\u6709\u4eba\u534f\u8c03\u8c01\u4f7f\u7528\u7089\u7076\u3001\u9910\u5177\u653e\u5728\u54ea\u91cc\u3001\u6216\u8005\u5982\u4f55\u9632\u6b62\u4e24\u4e2a\u4eba\u540c\u65f6\u6293\u540c\u4e00\u628a\u5200\u3002OS\u5c31\u662f\u90a3\u4e2a\u534f\u8c03\u8005\u3002</p> </li> <li> <p>\u5bf9\u4e8eML\u4ece\u4e1a\u8005\uff0c\u64cd\u4f5c\u7cfb\u7edf\u7684\u6982\u5ff5\u89e3\u91ca\u4e86\uff1a\u4e3a\u4ec0\u4e48 <code>nvidia-smi</code> \u663e\u793a\u6bcf\u4e2a\u8fdb\u7a0b\u7684GPU\u5185\u5b58\u4f7f\u7528\u91cf\u3001\u4e3a\u4ec0\u4e48\u8bad\u7ec3\u56e0\"\u5185\u5b58\u4e0d\u8db3\"\u800c\u5d29\u6e83\u3001\u4e3a\u4ec0\u4e48 <code>fork()</code> \u4f1a\u590d\u5236\u4f60\u7684Python\u8fdb\u7a0b\u3001\u4ee5\u53ca\u4e3a\u4ec0\u4e48Docker\u5bb9\u5668\u63d0\u4f9b\u9694\u79bb\u73af\u5883\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/03.%20operating%20systems/#_2","title":"\u64cd\u4f5c\u7cfb\u7edf\u505a\u4ec0\u4e48","text":"<ul> <li> <p>OS\u6709\u4e09\u4e2a\u6838\u5fc3\u804c\u8d23\uff1a</p> <ul> <li> <p>\u62bd\u8c61\uff1a\u5c06\u786c\u4ef6\u590d\u6742\u6027\u9690\u85cf\u5728\u7b80\u6d01\u7684\u63a5\u53e3\u4e4b\u540e\u3002\u7a0b\u5e8f\u8bfb\u5199\"\u6587\u4ef6\"\u800c\u65e0\u9700\u77e5\u9053\u5e95\u5c42\u5b58\u50a8\u662fSSD\u3001HDD\u8fd8\u662f\u7f51\u7edc\u9a71\u52a8\u5668\u3002\u5b83\u4eec\u5206\u914d\"\u5185\u5b58\"\u800c\u65e0\u9700\u7ba1\u7406\u7269\u7406RAM\u82af\u7247\u3002\u5b83\u4eec\u5728\"CPU\"\u4e0a\u8fd0\u884c\u800c\u65e0\u9700\u62c5\u5fc3\u4e2d\u65ad\u548c\u7f13\u5b58\u4e00\u81f4\u6027\u3002</p> </li> <li> <p>\u8d44\u6e90\u7ba1\u7406\uff1a\u591a\u4e2a\u7a0b\u5e8f\u5171\u4eabCPU\u3001\u5185\u5b58\u3001\u78c1\u76d8\u548c\u7f51\u7edc\u3002OS\u51b3\u5b9a\u8c01\u83b7\u5f97\u4ec0\u4e48\u8d44\u6e90\u3001\u4f55\u65f6\u83b7\u5f97\u3001\u83b7\u5f97\u591a\u4e45\u3002\u516c\u5e73\u9ad8\u6548\u7684\u5206\u914d\u7b56\u7565\u4fdd\u6301\u7cfb\u7edf\u7684\u54cd\u5e94\u6027\u3002</p> </li> <li> <p>\u9694\u79bb\u4e0e\u4fdd\u62a4\uff1a\u7a0b\u5e8f\u4e4b\u95f4\u4e0d\u5f97\u76f8\u4e92\u5e72\u6270\u3002\u6d4f\u89c8\u5668\u4e2d\u7684Bug\u4e0d\u5e94\u5bfc\u81f4\u5185\u6838\u5d29\u6e83\u3002\u6076\u610f\u7a0b\u5e8f\u4e0d\u5e94\u8bfb\u53d6\u53e6\u4e00\u4e2a\u7a0b\u5e8f\u7684\u5bc6\u7801\u3002OS\u5229\u7528\u786c\u4ef6\u652f\u6301\uff08\u7279\u6743\u7ea7\u3001\u865a\u62df\u5185\u5b58\uff09\u5f3a\u5236\u5b9e\u65bd\u8fb9\u754c\u3002</p> </li> </ul> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/03.%20operating%20systems/#_3","title":"\u8fdb\u7a0b","text":"<ul> <li> <p>\u8fdb\u7a0b\u662f\u6b63\u5728\u8fd0\u884c\u7684\u7a0b\u5e8f\u3002\u5b83\u662fOS\u7684\u57fa\u672c\u5de5\u4f5c\u5355\u5143\u3002\u6bcf\u4e2a\u8fdb\u7a0b\u90fd\u6709\uff1a</p> <ul> <li>\u4ee3\u7801\uff08\u7a0b\u5e8f\u6307\u4ee4\uff0c\u53ea\u8bfb\uff09\u3002</li> <li>\u6570\u636e\uff08\u5168\u5c40\u53d8\u91cf\uff0c\u5806\u5206\u914d\uff09\u3002</li> <li>\u5806\u6808\uff08\u51fd\u6570\u8c03\u7528\u5e27\uff0c\u5c40\u90e8\u53d8\u91cf\uff09\u3002</li> <li>\u72b6\u6001\uff08\u5bc4\u5b58\u5668\u503c\u3001\u7a0b\u5e8f\u8ba1\u6570\u5668\u3001\u6253\u5f00\u7684\u6587\u4ef6\u7b49\uff09\u3002</li> </ul> </li> <li> <p>\u8fdb\u7a0b\u63a7\u5236\u5757\uff08PCB\uff09\u662fOS\u7528\u4e8e\u8ddf\u8e2a\u8fdb\u7a0b\u7684\u6570\u636e\u7ed3\u6784\u3002\u5b83\u5b58\u50a8\u8fdb\u7a0bID\uff08PID\uff09\u3001\u72b6\u6001\u3001\u7a0b\u5e8f\u8ba1\u6570\u5668\u3001\u5bc4\u5b58\u5668\u5185\u5bb9\u3001\u5185\u5b58\u6620\u5c04\u3001\u6253\u5f00\u7684\u6587\u4ef6\u63cf\u8ff0\u7b26\u548c\u8c03\u5ea6\u4f18\u5148\u7ea7\u3002\u5f53OS\u4ece\u4e00\u4e2a\u8fdb\u7a0b\u5207\u6362\u5230\u53e6\u4e00\u4e2a\u8fdb\u7a0b\u65f6\uff0c\u5b83\u5c06\u5f53\u524d\u8fdb\u7a0b\u7684\u72b6\u6001\u4fdd\u5b58\u5230\u5176PCB\u4e2d\uff0c\u5e76\u52a0\u8f7d\u4e0b\u4e00\u4e2a\u8fdb\u7a0b\u7684\u72b6\u6001\u3002\u8fd9\u5c31\u662f\u4e0a\u4e0b\u6587\u5207\u6362\u3002</p> </li> <li> <p>\u4e0a\u4e0b\u6587\u5207\u6362\u4ee3\u4ef7\u9ad8\u6602\uff1a\u4fdd\u5b58\u548c\u6062\u590d\u5bc4\u5b58\u5668\u3001\u5237\u65b0\u7f13\u5b58\u3001\u4f7fTLB\u9879\u5931\u6548\u9700\u8981\u5fae\u79d2\u7ea7\u65f6\u95f4\u3002\u5728\u4e00\u4e2a\u8fd0\u884c\u6570\u5343\u4e2a\u8fdb\u7a0b\u7684\u7cfb\u7edf\u4e2d\uff0c\u5f00\u9500\u53ef\u80fd\u5f88\u5927\u3002\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48\u6bcf\u8fdb\u7a0b\u6bcf\u8bf7\u6c42\u7684\u670d\u52a1\u5668\u67b6\u6784\uff08\u5982\u8001\u5f0fApache\uff09\u88ab\u57fa\u4e8e\u7ebf\u7a0b\u6216\u4e8b\u4ef6\u9a71\u52a8\u7684\u67b6\u6784\u53d6\u4ee3\u3002</p> </li> <li> <p>Unix\u4e2d\u7684\u8fdb\u7a0b\u521b\u5efa\u4f7f\u7528 <code>fork()</code> \u548c <code>exec()</code>\uff1a</p> <ul> <li> <p><code>fork()</code> \u521b\u5efa\u5f53\u524d\u8fdb\u7a0b\u7684\u4e00\u4e2a\u526f\u672c\u3002\u5b50\u8fdb\u7a0b\u83b7\u5f97\u7236\u8fdb\u7a0b\u5185\u5b58\u3001\u6587\u4ef6\u63cf\u8ff0\u7b26\u548c\u72b6\u6001\u7684\u4e00\u4efd\u526f\u672c\u3002\u4e24\u4e2a\u8fdb\u7a0b\u4ece\u540c\u4e00\u70b9\u7ee7\u7eed\u6267\u884c\uff0c\u4f46 <code>fork()</code> \u5728\u5b50\u8fdb\u7a0b\u4e2d\u8fd4\u56de0\uff0c\u5728\u7236\u8fdb\u7a0b\u4e2d\u8fd4\u56de\u5b50\u8fdb\u7a0b\u7684PID\u3002</p> </li> <li> <p><code>exec()</code> \u7528\u65b0\u7a0b\u5e8f\u66ff\u6362\u5f53\u524d\u8fdb\u7a0b\u7684\u4ee3\u7801\u3002\u5728 <code>fork()</code> \u4e4b\u540e\uff0c\u5b50\u8fdb\u7a0b\u901a\u5e38\u8c03\u7528 <code>exec()</code> \u6765\u8fd0\u884c\u4e00\u4e2a\u4e0d\u540c\u7684\u7a0b\u5e8f\u3002</p> </li> <li> <p>\u8fd9\u79cd\u5148fork\u540eexec\u7684\u6a21\u578b\u5f88\u4f18\u96c5\uff1a\u521b\u5efa\u65b0\u8fdb\u7a0b\uff08fork\uff09\u548c\u52a0\u8f7d\u65b0\u7a0b\u5e8f\uff08exec\uff09\u662f\u72ec\u7acb\u7684\u64cd\u4f5c\uff0c\u53ef\u4ee5\u5404\u81ea\u5b9a\u5236\u3002\u5728fork\u548cexec\u4e4b\u95f4\uff0c\u5b50\u8fdb\u7a0b\u53ef\u4ee5\u91cd\u5b9a\u5411I/O\u3001\u66f4\u6539\u73af\u5883\u53d8\u91cf\u6216\u964d\u4f4e\u6743\u9650\u3002</p> </li> </ul> </li> </ul> <p></p> <ul> <li>\u8fdb\u7a0b\u72b6\u6001\uff1a\u4e00\u4e2a\u8fdb\u7a0b\u5904\u4e8e\u4ee5\u4e0b\u51e0\u79cd\u72b6\u6001\u4e4b\u4e00\uff1a<ul> <li>\u8fd0\u884c\uff1a\u5f53\u524d\u5728CPU\u6838\u5fc3\u4e0a\u6267\u884c\u3002</li> <li>\u5c31\u7eea\uff1a\u7b49\u5f85CPU\u6838\u5fc3\uff08\u53ef\u8fd0\u884c\u4f46\u5c1a\u672a\u88ab\u8c03\u5ea6\uff09\u3002</li> <li>\u963b\u585e\uff08\u7b49\u5f85\uff09\uff1a\u65e0\u6cd5\u7ee7\u7eed\uff0c\u76f4\u5230\u67d0\u4e2a\u4e8b\u4ef6\u53d1\u751f\uff08I/O\u5b8c\u6210\u3001\u9501\u83b7\u53d6\u3001\u5b9a\u65f6\u5668\u5230\u671f\uff09\u3002</li> <li>\u7ec8\u6b62\uff1a\u6267\u884c\u5b8c\u6bd5\uff0c\u7b49\u5f85\u7236\u8fdb\u7a0b\u6536\u96c6\u5176\u9000\u51fa\u72b6\u6001\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/03.%20operating%20systems/#_4","title":"\u7ebf\u7a0b","text":"<ul> <li> <p>\u7ebf\u7a0b\u662f\u8fdb\u7a0b\u5185\u7684\u8f7b\u91cf\u7ea7\u6267\u884c\u5355\u5143\u3002\u8fdb\u7a0b\u5185\u7684\u6240\u6709\u7ebf\u7a0b\u5171\u4eab\u76f8\u540c\u7684\u4ee3\u7801\u3001\u6570\u636e\u548c\u5806\uff0c\u4f46\u6bcf\u4e2a\u7ebf\u7a0b\u6709\u81ea\u5df1\u7684\u5806\u6808\u548c\u5bc4\u5b58\u5668\u72b6\u6001\u3002</p> </li> <li> <p>\u4e0e\u591a\u4e2a\u8fdb\u7a0b\u76f8\u6bd4\u7684\u4f18\u52bf\uff1a\u7ebf\u7a0b\u5171\u4eab\u5185\u5b58\uff0c\u56e0\u6b64\u5b83\u4eec\u4e4b\u95f4\u7684\u901a\u4fe1\u5f88\u5feb\uff08\u53ea\u9700\u8bfb\u5199\u5171\u4eab\u53d8\u91cf\uff09\u3002\u8fdb\u7a0b\u9700\u8981\u8fdb\u7a0b\u95f4\u901a\u4fe1\uff08\u7ba1\u9053\u3001\u5957\u63a5\u5b57\u3001\u5171\u4eab\u5185\u5b58\u6620\u5c04\uff09\uff0c\u8fd9\u66f4\u6162\u4e14\u66f4\u590d\u6742\u3002</p> </li> <li> <p>\u52a3\u52bf\uff1a\u5171\u4eab\u5185\u5b58\u662f\u5371\u9669\u7684\u3002\u4e24\u4e2a\u7ebf\u7a0b\u540c\u65f6\u5199\u5165\u540c\u4e00\u53d8\u91cf\u4f1a\u5bfc\u81f4\u7ade\u6001\u6761\u4ef6\uff08\u7ed3\u679c\u53d6\u51b3\u4e8e\u54ea\u4e2a\u7ebf\u7a0b\u5148\u8fd0\u884c\uff09\u3002\u8fd9\u5f15\u5bfc\u6211\u4eec\u8fdb\u5165\u540c\u6b65\u95ee\u9898\uff0c\u5728\u6587\u4ef64\u4e2d\u4ecb\u7ecd\u3002</p> </li> <li> <p>\u5185\u6838\u7ebf\u7a0b\u7531OS\u8c03\u5ea6\u5668\u7ba1\u7406\u3002\u6bcf\u4e2a\u7ebf\u7a0b\u72ec\u7acb\u5730\u88ab\u8c03\u5ea6\u5230CPU\u6838\u5fc3\u4e0a\u3002\u521b\u5efa\u548c\u5207\u6362\u5185\u6838\u7ebf\u7a0b\u6d89\u53ca\u7cfb\u7edf\u8c03\u7528\uff0c\u5f00\u9500\u4e0e\u8fdb\u7a0b\u4e0a\u4e0b\u6587\u5207\u6362\u7c7b\u4f3c\uff08\u4f46\u66f4\u5c0f\uff09\u3002</p> </li> <li> <p>\u7528\u6237\u7ebf\u7a0b\uff08\u7eff\u8272\u7ebf\u7a0b\uff09\u7531\u7528\u6237\u7a7a\u95f4\u7684\u8fd0\u884c\u65f6\u5e93\u7ba1\u7406\uff0c\u5bf9OS\u4e0d\u53ef\u89c1\u3002\u521b\u5efa\u548c\u5207\u6362\u5b83\u4eec\u7684\u6210\u672c\u66f4\u4f4e\uff08\u65e0\u9700\u7cfb\u7edf\u8c03\u7528\uff09\uff0c\u4f46\u4e00\u4e2a\u7528\u6237\u7ebf\u7a0b\u7684\u963b\u585e\u64cd\u4f5c\u4f1a\u963b\u585e\u8fdb\u7a0b\u4e2d\u7684\u6240\u6709\u7ebf\u7a0b\uff08\u56e0\u4e3aOS\u53ea\u770b\u5230\u4e00\u4e2a\u5185\u6838\u7ebf\u7a0b\uff09\u3002</p> </li> <li> <p>\u73b0\u4ee3\u7cfb\u7edf\u4f7f\u7528\u6df7\u5408\u6a21\u578b\uff1a\u8bb8\u591a\u7528\u6237\u7ebf\u7a0b\u6620\u5c04\u5230\u8f83\u5c11\u6570\u91cf\u7684\u5185\u6838\u7ebf\u7a0b\u4e0a\uff08M:N\u7ebf\u7a0b\uff09\u3002Go\u7684goroutine\u548cErlang\u7684\u8fdb\u7a0b\u662f\u7531\u8bed\u8a00\u8fd0\u884c\u65f6\u8c03\u5ea6\u5230OS\u7ebf\u7a0b\u4e0a\u7684\u7528\u6237\u7ea7\u7ebf\u7a0b\u3002</p> </li> <li> <p>\u7ebf\u7a0b\u6c60\u9884\u5148\u521b\u5efa\u56fa\u5b9a\u6570\u91cf\u7684\u7ebf\u7a0b\uff0c\u7b49\u5f85\u4efb\u52a1\u3002\u5f53\u4efb\u52a1\u5230\u8fbe\u65f6\uff0c\u5206\u914d\u7ed9\u4e00\u4e2a\u7a7a\u95f2\u7ebf\u7a0b\u3002\u8fd9\u907f\u514d\u4e86\u4e3a\u6bcf\u4e2a\u4efb\u52a1\u521b\u5efa\u548c\u9500\u6bc1\u7ebf\u7a0b\u7684\u5f00\u9500\u3002Web\u670d\u52a1\u5668\u3001\u6570\u636e\u5e93\u5f15\u64ce\u548cML\u63a8\u7406\u670d\u52a1\u5668\u90fd\u4f7f\u7528\u7ebf\u7a0b\u6c60\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/03.%20operating%20systems/#cpu","title":"CPU\u8c03\u5ea6","text":"<ul> <li> <p>\u8c03\u5ea6\u5668\u51b3\u5b9a\u6bcf\u4e2a\u65f6\u523b\u54ea\u4e2a\u8fdb\u7a0b/\u7ebf\u7a0b\u5728\u54ea\u4e2aCPU\u6838\u5fc3\u4e0a\u8fd0\u884c\u3002\u76ee\u6807\u662f\uff1a\u6700\u5927\u5316CPU\u5229\u7528\u7387\u3001\u6700\u5c0f\u5316\u54cd\u5e94\u65f6\u95f4\uff08\u5bf9\u4ea4\u4e92\u5f0f\u4efb\u52a1\uff09\u3001\u6700\u5927\u5316\u541e\u5410\u91cf\uff08\u5bf9\u6279\u5904\u7406\u4efb\u52a1\uff09\u3001\u5e76\u786e\u4fdd\u516c\u5e73\u6027\u3002</p> </li> <li> <p>\u5148\u6765\u5148\u670d\u52a1\uff08FCFS\uff09\uff1a\u8fdb\u7a0b\u6309\u5230\u8fbe\u987a\u5e8f\u8fd0\u884c\u3002\u7b80\u5355\u4f46\u5b58\u5728\u62a4\u822a\u6548\u5e94\uff1a\u4e00\u4e2a\u957f\u65f6\u95f4\u8fd0\u884c\u7684\u8fdb\u7a0b\u963b\u585e\u4e86\u540e\u9762\u6240\u6709\u8f83\u77ed\u7684\u8fdb\u7a0b\u3002</p> </li> <li> <p>\u6700\u77ed\u4f5c\u4e1a\u4f18\u5148\uff08SJF\uff09\uff1a\u8fd0\u884c\u6700\u77ed\u7684\u8fdb\u7a0b\u4f18\u5148\u3002\u53ef\u8bc1\u660e\u6700\u5c0f\u5316\u5e73\u5747\u7b49\u5f85\u65f6\u95f4\uff0c\u4f46\u9700\u8981\u9884\u5148\u77e5\u9053\u4f5c\u4e1a\u957f\u5ea6\uff08\u901a\u5e38\u4e0d\u53ef\u80fd\uff09\u3002\u5176\u62a2\u5360\u5f0f\u7248\u672c\u6700\u77ed\u5269\u4f59\u65f6\u95f4\u4f18\u5148\uff08SRTF\uff09\uff0c\u5982\u679c\u51fa\u73b0\u66f4\u77ed\u7684\u4f5c\u4e1a\u5219\u4e2d\u65ad\u6b63\u5728\u8fd0\u884c\u7684\u4f5c\u4e1a\u3002</p> </li> <li> <p>\u8f6e\u8f6c\uff08RR\uff09\uff1a\u6bcf\u4e2a\u8fdb\u7a0b\u83b7\u5f97\u4e00\u4e2a\u56fa\u5b9a\u7684\u65f6\u95f4\u7247\uff08\u598210 ms\uff09\uff0c\u7136\u540e\u88ab\u62a2\u5360\u5e76\u79fb\u5230\u961f\u5217\u672b\u5c3e\u3002\u516c\u5e73\u4e14\u54cd\u5e94\u6027\u597d\uff0c\u4f46\u65f6\u95f4\u7247\u5927\u5c0f\u5f88\u91cd\u8981\uff1a\u592a\u5c0f\u4f1a\u5bfc\u81f4\u8fc7\u591a\u4e0a\u4e0b\u6587\u5207\u6362\uff0c\u592a\u5927\u5219\u4f1a\u9000\u5316\u4e3aFCFS\u3002</p> </li> <li> <p>\u4f18\u5148\u7ea7\u8c03\u5ea6\uff1a\u6bcf\u4e2a\u8fdb\u7a0b\u6709\u4e00\u4e2a\u4f18\u5148\u7ea7\u3002\u9ad8\u4f18\u5148\u7ea7\u8fdb\u7a0b\u5148\u8fd0\u884c\u3002\u5371\u9669\u662f\u9965\u997f\uff1a\u5982\u679c\u9ad8\u4f18\u5148\u7ea7\u8fdb\u7a0b\u6e90\u6e90\u4e0d\u65ad\u5230\u6765\uff0c\u4f4e\u4f18\u5148\u7ea7\u8fdb\u7a0b\u53ef\u80fd\u6c38\u8fdc\u65e0\u6cd5\u8fd0\u884c\u3002\u8001\u5316\u89e3\u51b3\u8fd9\u4e2a\u95ee\u9898\uff1a\u8fdb\u7a0b\u7b49\u5f85\u65f6\u95f4\u8d8a\u957f\uff0c\u5176\u4f18\u5148\u7ea7\u5c31\u8d8a\u9ad8\u3002</p> </li> <li> <p>\u591a\u7ea7\u53cd\u9988\u961f\u5217\uff08MLFQ\uff09\uff1a\u5177\u6709\u4e0d\u540c\u4f18\u5148\u7ea7\u548c\u65f6\u95f4\u7247\u7684\u591a\u4e2a\u961f\u5217\u3002\u65b0\u8fdb\u7a0b\u4ece\u6700\u9ad8\u4f18\u5148\u7ea7\u961f\u5217\uff08\u77ed\u65f6\u95f4\u7247\uff09\u5f00\u59cb\u3002\u5982\u679c\u4e00\u4e2a\u8fdb\u7a0b\u7528\u5b8c\u5176\u65f6\u95f4\u7247\uff08CPU\u5bc6\u96c6\u578b\uff09\uff0c\u5b83\u88ab\u964d\u5230\u8f83\u4f4e\u4f18\u5148\u7ea7\u961f\u5217\uff08\u8f83\u957f\u65f6\u95f4\u7247\uff09\u3002\u4ea4\u4e92\u5f0f\u8fdb\u7a0b\u81ea\u7136\u505c\u7559\u5728\u9ad8\u4f18\u5148\u7ea7\u961f\u5217\u4e2d\uff08\u5b83\u4eec\u5728\u4f7f\u7528\u5b8c\u65f6\u95f4\u7247\u4e4b\u524d\u5c31\u56e0I/O\u963b\u585e\u4e86\uff09\u3002\u8fd9\u53ef\u4ee5\u9002\u5e94\u5de5\u4f5c\u8d1f\u8f7d\uff0c\u800c\u65e0\u9700\u9884\u5148\u4e86\u89e3\u4f5c\u4e1a\u7c7b\u578b\u3002</p> </li> <li> <p>\u5b8c\u5168\u516c\u5e73\u8c03\u5ea6\u5668\uff08CFS\uff09\uff1aLinux\u8c03\u5ea6\u5668\u3002\u5b83\u7ef4\u62a4\u4e00\u68f5\u7ea2\u9ed1\u6811\uff08\u5e73\u8861\u4e8c\u53c9\u641c\u7d22\u6811\uff09\uff0c\u8fdb\u7a0b\u6309\"\u865a\u62df\u8fd0\u884c\u65f6\u95f4\"\uff08\u5b83\u4eec\u5df2\u7ecf\u6d88\u8017\u7684CPU\u65f6\u95f4\uff09\u6392\u5e8f\u3002\u5177\u6709\u6700\u5c0f\u865a\u62df\u8fd0\u884c\u65f6\u95f4\u7684\u8fdb\u7a0b\u63a5\u4e0b\u6765\u8fd0\u884c\u3002\u8fd9\u786e\u4fdd\u4e86\u968f\u7740\u65f6\u95f4\u7684\u63a8\u79fb\uff0c\u6bcf\u4e2a\u8fdb\u7a0b\u83b7\u5f97\u5176\u516c\u5e73\u4efd\u989d\u3002CFS\u6bcf\u6b21\u8c03\u5ea6\u51b3\u7b56\u8fd0\u884c\u65f6\u95f4\u4e3a \\(O(\\log n)\\)\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/03.%20operating%20systems/#_5","title":"\u5185\u5b58\u7ba1\u7406","text":"<ul> <li> <p>OS\u7ba1\u7406\u7269\u7406RAM\uff0c\u5c06\u5176\u5206\u914d\u7ed9\u8fdb\u7a0b\u5e76\u5728\u4e0d\u518d\u9700\u8981\u65f6\u56de\u6536\u3002</p> </li> <li> <p>\u5206\u9875\uff08\u6765\u81ea\u6587\u4ef62\uff09\u5c06\u865a\u62df\u5185\u5b58\u5212\u5206\u4e3a\u56fa\u5b9a\u5927\u5c0f\u7684\u9875\uff0c\u7269\u7406\u5185\u5b58\u5212\u5206\u4e3a\u5e27\u3002\u9875\u8868\u5c06\u9875\u6620\u5c04\u5230\u5e27\u3002\u5206\u9875\u6d88\u9664\u4e86\u5916\u90e8\u788e\u7247\uff08\u5206\u914d\u4e4b\u95f4\u7684\u6d6a\u8d39\u7a7a\u95f4\uff09\uff0c\u56e0\u4e3a\u6240\u6709\u9875\u9762\u5927\u5c0f\u76f8\u540c\u3002</p> </li> <li> <p>\u8bf7\u6c42\u5206\u9875\u4ec5\u5728\u9996\u6b21\u8bbf\u95ee\u65f6\u5c06\u9875\u52a0\u8f7d\u5230RAM\u4e2d\uff08\u800c\u4e0d\u662f\u5728\u8fdb\u7a0b\u542f\u52a8\u65f6\uff09\u3002\u8fd9\u8282\u7701\u4e86\u5185\u5b58\uff1a\u4e00\u4e2a\u62e5\u67091 GB\u4ee3\u7801\u7684\u7a0b\u5e8f\u5728\u5178\u578b\u8fd0\u884c\u4e2d\u53ef\u80fd\u53ea\u4f7f\u752850 MB\u3002\u5176\u4f59\u90e8\u5206\u4ece\u672a\u88ab\u52a0\u8f7d\u3002</p> </li> <li> <p>\u5f53RAM\u6ee1\u4e14\u9700\u8981\u65b0\u9875\u65f6\uff0cOS\u5fc5\u987b\u6362\u51fa\u4e00\u4e2a\u73b0\u6709\u9875\u9762\u3002\u9875\u9762\u7f6e\u6362\u7b97\u6cd5\uff08LRU\u3001FIFO\u3001\u65f6\u949f\uff0c\u6765\u81ea\u6587\u4ef62\uff09\u51b3\u5b9a\u6362\u51fa\u54ea\u4e2a\u9875\u9762\u3002\u597d\u7684\u7f6e\u6362\u6700\u5c0f\u5316\u7f3a\u9875\u6b21\u6570\uff1b\u574f\u7684\u7f6e\u6362\u5bfc\u81f4\u7cfb\u7edf\u98a0\u7c38\u3002</p> </li> <li> <p>\u5206\u6bb5\u5c06\u5185\u5b58\u5212\u5206\u4e3a\u53ef\u53d8\u5927\u5c0f\u7684\u6bb5\uff08\u4ee3\u7801\u3001\u6570\u636e\u3001\u6808\u3001\u5806\uff09\uff0c\u6bcf\u4e2a\u6bb5\u6709\u81ea\u5df1\u7684\u57fa\u5730\u5740\u548c\u957f\u5ea6\u3002\u5206\u6bb5\u63d0\u4f9b\u903b\u8f91\u7ec4\u7ec7\uff0c\u800c\u5206\u9875\u63d0\u4f9b\u7269\u7406\u7ba1\u7406\u3002\u73b0\u4ee3\u7cfb\u7edf\u6700\u5c0f\u9650\u5ea6\u5730\u4f7f\u7528\u5206\u6bb5\uff08\u4e3b\u8981\u7528\u4e8e\u4fdd\u62a4\uff09\uff0c\u5e76\u4f9d\u8d56\u5206\u9875\u8fdb\u884c\u5185\u5b58\u7ba1\u7406\u3002</p> </li> <li> <p>\u5806\u662f\u52a8\u6001\u5206\u914d\u5185\u5b58\u6240\u5728\u7684\u5730\u65b9\uff08C\u4e2d\u7684<code>malloc</code>/<code>free</code>\uff0cJava\u4e2d\u7684<code>new</code>\uff0cPython\u4e2d\u9690\u5f0f\u7ba1\u7406\uff09\u3002OS\u5411\u8fdb\u7a0b\u63d0\u4f9b\u5927\u5757\u5185\u5b58\uff0c\u5185\u5b58\u5206\u914d\u5668\uff08\u5982 <code>glibc malloc</code>\u3001<code>jemalloc</code>\u3001<code>tcmalloc</code>\uff09\u5c06\u8fd9\u4e9b\u5927\u5757\u7ec6\u5206\u4e3a\u66f4\u5c0f\u7684\u5206\u914d\u3002\u5206\u914d\u5668\u8bbe\u8ba1\u5f71\u54cd\u6027\u80fd\uff1a\u788e\u7247\u6d6a\u8d39\u7a7a\u95f4\uff0c\u7ebf\u7a0b\u95f4\u7684\u4e89\u7528\u6d6a\u8d39\u65f6\u95f4\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/03.%20operating%20systems/#_6","title":"\u6587\u4ef6\u7cfb\u7edf","text":"<ul> <li> <p>\u6587\u4ef6\u7cfb\u7edf\u5c06\u6301\u4e45\u5b58\u50a8\uff08SSD\u3001HDD\uff09\u4e0a\u7684\u6570\u636e\u7ec4\u7ec7\u4e3a\u547d\u540d\u7684\u6587\u4ef6\u548c\u76ee\u5f55\u5c42\u6b21\u7ed3\u6784\u3002</p> </li> <li> <p>inode\uff08\u7d22\u5f15\u8282\u70b9\uff09\u5b58\u50a8\u6587\u4ef6\u7684\u5143\u6570\u636e\uff1a\u5927\u5c0f\u3001\u6240\u6709\u6743\u3001\u6743\u9650\u3001\u65f6\u95f4\u6233\u4ee5\u53ca\u6307\u5411\u78c1\u76d8\u4e0a\u6570\u636e\u5757\u7684\u6307\u9488\u3002\u6587\u4ef6\u540d\u5b58\u50a8\u5728\u76ee\u5f55\u4e2d\uff0c\u76ee\u5f55\u5c06\u540d\u79f0\u6620\u5c04\u5230inode\u7f16\u53f7\u3002\u8fd9\u79cd\u5206\u79bb\u610f\u5473\u7740\u4e00\u4e2a\u6587\u4ef6\u53ef\u4ee5\u6709\u591a\u4e2a\u540d\u79f0\uff08\u786c\u94fe\u63a5\uff09\u6307\u5411\u540c\u4e00\u4e2ainode\u3002</p> </li> <li> <p>FAT\uff08\u6587\u4ef6\u5206\u914d\u8868\uff09\uff1a\u4e00\u79cd\u7b80\u5355\u7684\u6587\u4ef6\u7cfb\u7edf\uff0c\u7528\u4e8eUSB\u9a71\u52a8\u5668\u548cSD\u5361\u3002\u4e00\u4e2a\u8868\u5c06\u6bcf\u4e2a\u7c07\uff08\u5757\uff09\u6620\u5c04\u5230\u6587\u4ef6\u4e2d\u7684\u4e0b\u4e00\u4e2a\u7c07\uff0c\u5f62\u6210\u4e00\u4e2a\u94fe\u8868\u3002\u7b80\u5355\u4f46\u4e0d\u597d\u652f\u6301\u6743\u9650\u3001\u65e5\u5fd7\u8bb0\u5f55\u6216\u5927\u6587\u4ef6\u3002</p> </li> <li> <p>ext4\uff1a\u9ed8\u8ba4\u7684Linux\u6587\u4ef6\u7cfb\u7edf\u3002\u4f7f\u7528\u5e26\u6709\u76f4\u63a5\u3001\u95f4\u63a5\u3001\u4e8c\u7ea7\u95f4\u63a5\u548c\u4e09\u7ea7\u95f4\u63a5\u5757\u6307\u9488\u7684inode\u6765\u5904\u7406\u4efb\u4f55\u5927\u5c0f\u7684\u6587\u4ef6\u3002\u652f\u6301\u533a\u6bb5\uff08\u5757\u7684\u8fde\u7eed\u8303\u56f4\uff09\u4ee5\u9ad8\u6548\u5904\u7406\u5927\u6587\u4ef6\u3002\u6700\u5927\u6587\u4ef6\u5927\u5c0f\uff1a16 TB\uff0c\u6700\u5927\u5206\u533a\uff1a1 EB\u3002</p> </li> <li> <p>\u65e5\u5fd7\u8bb0\u5f55\u9632\u6b62\u56e0\u5d29\u6e83\u800c\u635f\u574f\u3002\u5728\u4fee\u6539\u6587\u4ef6\u7cfb\u7edf\u7ed3\u6784\u4e4b\u524d\uff0c\u66f4\u6539\u88ab\u5199\u5165\u65e5\u5fd7\uff08journal\uff09\u3002\u5982\u679c\u7cfb\u7edf\u5728\u64cd\u4f5c\u4e2d\u95f4\u5d29\u6e83\uff0c\u91cd\u542f\u65f6\u4f1a\u91cd\u653e\u65e5\u5fd7\u4ee5\u5b8c\u6210\u6216\u64a4\u9500\u8be5\u64cd\u4f5c\u3002\u6ca1\u6709\u65e5\u5fd7\u8bb0\u5f55\uff0c\u5199\u5165\u671f\u95f4\u7684\u5d29\u6e83\u53ef\u80fd\u4f7f\u6587\u4ef6\u7cfb\u7edf\u5904\u4e8e\u4e0d\u4e00\u81f4\u72b6\u6001\uff08\u6587\u4ef6\u7684\u6570\u636e\u5757\u5df2\u66f4\u65b0\u4f46\u5176inode\u672a\u66f4\u65b0\uff0c\u53cd\u4e4b\u4ea6\u7136\uff09\u3002</p> </li> <li> <p>\u57fa\u4e8eB\u6811\u7684\u6587\u4ef6\u7cfb\u7edf\uff08Btrfs\u3001ZFS\uff09\u4f7f\u7528B\u6811\uff08\u5e73\u8861\u641c\u7d22\u6811\uff09\u6765\u7ec4\u7ec7\u6570\u636e\u548c\u5143\u6570\u636e\uff0c\u5b9e\u73b0\u9ad8\u6548\u641c\u7d22\u3001\u5199\u65f6\u590d\u5236\u5feb\u7167\u4ee5\u53ca\u7528\u4e8e\u6570\u636e\u5b8c\u6574\u6027\u7684\u5185\u7f6e\u6821\u9a8c\u548c\u3002\u8fd9\u4e9b\u4e0e\u6570\u636e\u5e93\u7d22\u5f15\u4e2d\u4f7f\u7528\u7684B\u6811\u76f8\u540c\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/03.%20operating%20systems/#_7","title":"\u7cfb\u7edf\u8c03\u7528\u4e0e\u5185\u6838\u6a21\u5f0f","text":"<ul> <li> <p>\u7cfb\u7edf\u8c03\u7528\u662f\u7528\u6237\u7a0b\u5e8f\u548cOS\u5185\u6838\u4e4b\u95f4\u7684\u63a5\u53e3\u3002\u5f53\u7a0b\u5e8f\u9700\u8981\u505a\u4e00\u4e9b\u7279\u6743\u64cd\u4f5c\uff08\u8bfb\u53d6\u6587\u4ef6\u3001\u5206\u914d\u5185\u5b58\u3001\u521b\u5efa\u8fdb\u7a0b\u3001\u53d1\u9001\u7f51\u7edc\u6570\u636e\u5305\uff09\u65f6\uff0c\u5b83\u4f1a\u8fdb\u884c\u7cfb\u7edf\u8c03\u7528\u3002</p> </li> <li> <p>CPU\u5728\u4e24\u79cd\u6a21\u5f0f\u4e0b\u8fd0\u884c\uff1a</p> <ul> <li>\u7528\u6237\u6a21\u5f0f\uff1a\u53d7\u9650\u5236\u3002\u7a0b\u5e8f\u53ef\u4ee5\u6267\u884c\u81ea\u5df1\u7684\u4ee3\u7801\u5e76\u8bbf\u95ee\u81ea\u5df1\u7684\u5185\u5b58\uff0c\u4f46\u4e0d\u80fd\u76f4\u63a5\u8bbf\u95ee\u786c\u4ef6\u3001\u5176\u4ed6\u8fdb\u7a0b\u7684\u5185\u5b58\u6216OS\u6570\u636e\u7ed3\u6784\u3002</li> <li>\u5185\u6838\u6a21\u5f0f\uff1a\u4e0d\u53d7\u9650\u5236\u3002OS\u5185\u6838\u53ef\u4ee5\u8bbf\u95ee\u6240\u6709\u786c\u4ef6\u548c\u5185\u5b58\u3002\u7cfb\u7edf\u8c03\u7528\u662f\u4ece\u7528\u6237\u6a21\u5f0f\u5230\u5185\u6838\u6a21\u5f0f\u7684\u53d7\u63a7\u901a\u9053\u3002</li> </ul> </li> <li> <p>\u5f53\u7a0b\u5e8f\u8c03\u7528 <code>read()</code> \u65f6\uff0c\u53d1\u751f\u4ee5\u4e0b\u8fc7\u7a0b\uff1a</p> <ol> <li>\u7a0b\u5e8f\u5c06\u53c2\u6570\u653e\u5165\u5bc4\u5b58\u5668\u5e76\u89e6\u53d1\u9677\u9631\uff08\u4e00\u79cd\u8f6f\u4ef6\u4e2d\u65ad\uff09\u3002</li> <li>CPU\u5207\u6362\u5230\u5185\u6838\u6a21\u5f0f\u5e76\u8df3\u8f6c\u5230\u7cfb\u7edf\u8c03\u7528\u5904\u7406\u7a0b\u5e8f\u3002</li> <li>\u5185\u6838\u9a8c\u8bc1\u53c2\u6570\uff0c\u6267\u884cI/O\u64cd\u4f5c\uff0c\u5c06\u6570\u636e\u590d\u5236\u5230\u7528\u6237\u7684\u7f13\u51b2\u533a\u3002</li> <li>\u5185\u6838\u5207\u6362\u56de\u7528\u6237\u6a21\u5f0f\u5e76\u8fd4\u56de\u7ed3\u679c\u3002</li> </ol> </li> <li> <p>\u5e38\u89c1\u7cfb\u7edf\u8c03\u7528\uff1a<code>open</code>\u3001<code>read</code>\u3001<code>write</code>\u3001<code>close</code>\uff08\u6587\u4ef6\uff09\uff0c<code>fork</code>\u3001<code>exec</code>\u3001<code>wait</code>\u3001<code>exit</code>\uff08\u8fdb\u7a0b\uff09\uff0c<code>mmap</code>\u3001<code>brk</code>\uff08\u5185\u5b58\uff09\uff0c<code>socket</code>\u3001<code>bind</code>\u3001<code>listen</code>\u3001<code>accept</code>\uff08\u7f51\u7edc\uff09\u3002</p> </li> <li> <p>\u4e2d\u65ad\u662f\u8feb\u4f7fCPU\u6682\u65f6\u505c\u6b62\u5f53\u524d\u64cd\u4f5c\u5e76\u8fd0\u884c\u4e2d\u65ad\u5904\u7406\u7a0b\u5e8f\uff08\u5728\u5185\u6838\u4e2d\uff09\u7684\u786c\u4ef6\u4fe1\u53f7\u3002\u4e00\u6b21\u952e\u76d8\u6309\u952e\u3001\u4e00\u4e2a\u7f51\u7edc\u6570\u636e\u5305\u5230\u8fbe\u6216\u4e00\u4e2a\u5b9a\u65f6\u5668\u6ef4\u7b54\u90fd\u4f1a\u4ea7\u751f\u4e2d\u65ad\u3002\u5b9a\u65f6\u5668\u4e2d\u65ad\u7279\u522b\u91cd\u8981\uff1a\u5b83\u4f7fOS\u80fd\u591f\u62a2\u5360\u6b63\u5728\u8fd0\u884c\u7684\u8fdb\u7a0b\u5e76\u5207\u6362\u5230\u53e6\u4e00\u4e2a\uff08\u62a2\u5360\u5f0f\u591a\u4efb\u52a1\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/03.%20operating%20systems/#_8","title":"\u7f51\u7edc\u57fa\u7840","text":"<ul> <li>\u7f51\u7edc\u6808\u662fOS\u7684\u4e00\u4e2a\u5b50\u7cfb\u7edf\uff0c\u5b9e\u73b0\u673a\u5668\u4e4b\u95f4\u7684\u901a\u4fe1\u3002\u7406\u89e3\u5b83\u89e3\u91ca\u4e86\u5206\u5e03\u5f0f\u8bad\u7ec3\u5982\u4f55\u540c\u6b65\u68af\u5ea6\u3001\u6a21\u578b\u670d\u52a1\u5982\u4f55\u5904\u7406\u8bf7\u6c42\u4ee5\u53ca\u4e3a\u4ec0\u4e48\u5ef6\u8fdf\u5f88\u91cd\u8981\u3002</li> </ul> <ul> <li> <p>TCP/IP\u6a21\u578b\u5c06\u7f51\u7edc\u7ec4\u7ec7\u4e3a\u5206\u5c42\u7ed3\u6784\uff0c\u6bcf\u5c42\u4e3a\u4e0a\u5c42\u63d0\u4f9b\u62bd\u8c61\uff1a</p> <ul> <li>\u94fe\u8def\u5c42\uff1a\u5904\u7406\u5355\u4e2a\u7269\u7406\u94fe\u8def\u4e0a\u7684\u901a\u4fe1\uff08\u4ee5\u592a\u7f51\u3001Wi-Fi\uff09\u3002\u5904\u7406MAC\u5730\u5740\u548c\u5e27\u3002</li> <li>\u7f51\u7edc\u5c42\uff08IP\uff09\uff1a\u5c06\u6570\u636e\u5305\u8de8\u591a\u4e2a\u7f51\u7edc\u4ece\u6e90\u8def\u7531\u5230\u76ee\u6807\u3002\u6bcf\u53f0\u673a\u5668\u6709\u4e00\u4e2aIP\u5730\u5740\uff08\u4f8b\u5982 IPv4 \u7684 192.168.1.1 \u6216 128\u4f4d\u7684IPv6\u5730\u5740\uff09\u3002\u8def\u7531\u5668\u57fa\u4e8e\u76ee\u6807IP\u9010\u8df3\u8f6c\u53d1\u6570\u636e\u5305\u3002</li> <li>\u4f20\u8f93\u5c42\uff08TCP/UDP\uff09\uff1a\u63d0\u4f9b\u5e94\u7528\u7a0b\u5e8f\u4e4b\u95f4\u7684\u7aef\u5230\u7aef\u901a\u4fe1\u3002</li> <li>\u5e94\u7528\u5c42\uff1aHTTP\u3001DNS\u3001gRPC\u7b49\u534f\u8bae\uff0c\u5e94\u7528\u7a0b\u5e8f\u76f4\u63a5\u4f7f\u7528\u3002</li> </ul> </li> <li> <p>TCP\uff08\u4f20\u8f93\u63a7\u5236\u534f\u8bae\uff09\u63d0\u4f9b\u53ef\u9760\u3001\u6709\u5e8f\u7684\u4ea4\u4ed8\u3002\u5b83\u5efa\u7acb\u4e00\u4e2a\u8fde\u63a5\uff08\u4e09\u6b21\u63e1\u624b\uff1aSYN\u3001SYN-ACK\u3001ACK\uff09\uff0c\u4fdd\u8bc1\u6240\u6709\u6570\u636e\u6309\u5e8f\u5230\u8fbe\uff08\u4f7f\u7528\u5e8f\u5217\u53f7\u548c\u786e\u8ba4\uff09\uff0c\u91cd\u4f20\u4e22\u5931\u7684\u6570\u636e\u5305\uff0c\u5e76\u63a7\u5236\u53d1\u9001\u901f\u7387\u4ee5\u907f\u514d\u7f51\u7edc\u8fc7\u8f7d\uff08\u62e5\u585e\u63a7\u5236\uff09\u3002\u4ee3\u4ef7\u662f\u5ef6\u8fdf\uff1a\u63e1\u624b\u589e\u52a0\u4e86\u4e00\u4e2a\u5f80\u8fd4\u65f6\u95f4\uff0c\u91cd\u4f20\u589e\u52a0\u4e86\u5ef6\u8fdf\u3002</p> </li> <li> <p>UDP\uff08\u7528\u6237\u6570\u636e\u62a5\u534f\u8bae\uff09\u63d0\u4f9b\u4e0d\u53ef\u9760\u3001\u65e0\u5e8f\u7684\u4ea4\u4ed8\u3002\u65e0\u9700\u63e1\u624b\u3001\u65e0\u9700\u91cd\u4f20\u3001\u65e0\u987a\u5e8f\u4fdd\u8bc1\u3002\u5ef6\u8fdf\u8fdc\u4f4e\u4e8eTCP\u3002\u7528\u4e8e\u901f\u5ea6\u6bd4\u53ef\u9760\u6027\u66f4\u91cd\u8981\u7684\u573a\u666f\uff1a\u89c6\u9891\u6d41\u3001\u5728\u7ebf\u6e38\u620f\u3001DNS\u67e5\u8be2\u3002\u5728ML\u4e2d\uff0c\u4e00\u4e9b\u68af\u5ea6\u540c\u6b65\u534f\u8bae\u4f7f\u7528\u57fa\u4e8eUDP\u7684RDMA\u4ee5\u83b7\u5f97\u66f4\u4f4e\u5ef6\u8fdf\u3002</p> </li> <li> <p>\u5957\u63a5\u5b57\u662f\u7528\u4e8e\u7f51\u7edc\u901a\u4fe1\u7684OS API\u3002\u4e00\u4e2a\u5957\u63a5\u5b57\u662f\u7531\uff08IP\u5730\u5740\uff0c\u7aef\u53e3\u53f7\uff09\u6807\u8bc6\u7684\u7aef\u70b9\u3002\u670d\u52a1\u5668\u521b\u5efa\u4e00\u4e2a\u5957\u63a5\u5b57\uff0c\u5c06\u5176\u7ed1\u5b9a\u5230\u4e00\u4e2a\u7aef\u53e3\uff08\u4f8b\u5982HTTP\u768480\uff09\uff0c\u76d1\u542c\u8fde\u63a5\uff0c\u5e76\u63a5\u53d7\u5b83\u4eec\u3002\u5ba2\u6237\u7aef\u521b\u5efa\u4e00\u4e2a\u5957\u63a5\u5b57\u5e76\u8fde\u63a5\u5230\u670d\u52a1\u5668\u7684\u5730\u5740:\u7aef\u53e3\u3002\u7136\u540e\u901a\u8fc7\u5957\u63a5\u5b57\u50cf\u6587\u4ef6\u4e00\u6837\u8bfb\u5199\u6570\u636e\u3002</p> </li> <li> <p>DNS\uff08\u57df\u540d\u7cfb\u7edf\uff09\u5c06\u4eba\u7c7b\u53ef\u8bfb\u7684\u540d\u79f0\uff08google.com\uff09\u7ffb\u8bd1\u4e3aIP\u5730\u5740\uff08142.250.80.46\uff09\u3002\u5b83\u662f\u4e00\u4e2a\u5206\u5e03\u5f0f\u7684\u3001\u5c42\u6b21\u5316\u7684\u6570\u636e\u5e93\uff1a\u4f60\u7684\u673a\u5668\u8be2\u95ee\u672c\u5730\u89e3\u6790\u5668\uff0c\u540e\u8005\u8be2\u95ee\u6839\u670d\u52a1\u5668\uff0c\u6839\u670d\u52a1\u5668\u59d4\u6258\u7ed9\u6bcf\u4e2a\u57df\u7684\u6743\u5a01\u670d\u52a1\u5668\u3002</p> </li> <li> <p>HTTP\uff08\u8d85\u6587\u672c\u4f20\u8f93\u534f\u8bae\uff09\u662fWeb\u7684\u8bf7\u6c42-\u54cd\u5e94\u534f\u8bae\u3002\u5ba2\u6237\u7aef\u53d1\u9001\u4e00\u4e2a\u8bf7\u6c42\uff08\u65b9\u6cd5 + URL + \u5934\u90e8 + \u53ef\u9009\u4f53\uff09\uff0c\u670d\u52a1\u5668\u53d1\u9001\u4e00\u4e2a\u54cd\u5e94\uff08\u72b6\u6001\u7801 + \u5934\u90e8 + \u4f53\uff09\u3002ML\u6a21\u578b\u670d\u52a1\uff08\u5982TensorFlow Serving\u3001Triton\uff09\u5c06\u6a21\u578b\u66b4\u9732\u4e3aHTTP\u6216gRPC\u7aef\u70b9\u3002</p> </li> <li> <p>\u5ef6\u8fdf vs \u5e26\u5bbd\uff1a\u5ef6\u8fdf\u662f\u4e00\u4e2a\u6570\u636e\u5305\u4ece\u6e90\u5230\u76ee\u6807\u6240\u9700\u7684\u65f6\u95f4\uff08\u7531\u7269\u7406\u8ddd\u79bb\u548c\u7f51\u7edc\u8df3\u6570\u51b3\u5b9a\uff09\u3002\u5e26\u5bbd\u662f\u6570\u636e\u4f20\u8f93\u901f\u7387\uff08\u6bcf\u79d2\u5b57\u8282\u6570\uff09\u3002\u9ad8\u5e26\u5bbd\u3001\u9ad8\u5ef6\u8fdf\u7684\u8fde\u63a5\uff08\u536b\u661f\u4e92\u8054\u7f51\uff09\u53ef\u4ee5\u4f20\u8f93\u5927\u91cf\u6570\u636e\uff0c\u4f46\u6bcf\u4e2a\u5b57\u8282\u9700\u8981\u5f88\u957f\u65f6\u95f4\u624d\u80fd\u5230\u8fbe\u3002\u5bf9\u4e8e\u5206\u5e03\u5f0f\u8bad\u7ec3\uff0c\u5ef6\u8fdf\u5bf9\u540c\u6b65\u5c4f\u969c\uff08\u6240\u6709GPU\u5fc5\u987b\u7b49\u5f85\u6700\u6162\u7684\u90a3\u4e2a\uff09\u5f88\u91cd\u8981\uff0c\u800c\u5e26\u5bbd\u5bf9\u4f20\u8f93\u5927\u7684\u68af\u5ea6\u5f20\u91cf\u5f88\u91cd\u8981\uff08\u7b2c6\u7ae0\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/03.%20operating%20systems/#_9","title":"\u865a\u62df\u5316\u4e0e\u5bb9\u5668","text":"<ul> <li> <p>\u865a\u62df\u5316\u5728\u5355\u4e2a\u7269\u7406\u673a\u4e0a\u8fd0\u884c\u591a\u4e2a\u64cd\u4f5c\u7cfb\u7edf\u3002\u865a\u62df\u673a\u76d1\u89c6\u5668\uff08VMware\u3001KVM\u3001Xen\uff09\u521b\u5efa\u865a\u62df\u673a\uff08VM\uff09\uff0c\u6bcf\u4e2a\u865a\u62df\u673a\u6709\u81ea\u5df1\u7684\u865a\u62dfCPU\u3001\u5185\u5b58\u3001\u78c1\u76d8\u548c\u7f51\u7edc\u63a5\u53e3\u3002\u6bcf\u4e2a\u865a\u62df\u673a\u8fd0\u884c\u4e00\u4e2a\u5b8c\u6574\u7684\u64cd\u4f5c\u7cfb\u7edf\uff08\u6765\u5bbeOS\uff09\uff0c\u5b83\u8ba4\u4e3a\u81ea\u5df1\u62e5\u6709\u4e13\u7528\u786c\u4ef6\u3002</p> </li> <li> <p>VM\u63d0\u4f9b\u5f3a\u9694\u79bb\uff08\u4e00\u4e2aVM\u5d29\u6e83\u4e0d\u5f71\u54cd\u5176\u4ed6VM\uff09\u548c\u7075\u6d3b\u6027\uff08\u5728\u540c\u4e00\u53f0\u673a\u5668\u4e0a\u8fd0\u884cLinux\u548cWindows\uff0c\u5728\u7269\u7406\u4e3b\u673a\u4e4b\u95f4\u8fc1\u79fbVM\uff09\u3002\u4ee3\u4ef7\u662f\u5f00\u9500\uff1a\u6bcf\u4e2aVM\u8fd0\u884c\u4e00\u4e2a\u5b8c\u6574\u7684OS\u5185\u6838\uff0c\u6d88\u8017\u5185\u5b58\u548cCPU\u6765\u6267\u884c\u4e0e\u5bbf\u4e3b\u673aOS\u5197\u4f59\u7684OS\u64cd\u4f5c\u3002</p> </li> </ul> <p></p> <ul> <li> <p>\u5bb9\u5668\uff08Docker\u3001Podman\uff09\u63d0\u4f9b\u4e86\u4e00\u79cd\u66f4\u8f7b\u91cf\u7684\u66ff\u4ee3\u65b9\u6848\u3002\u5bb9\u5668\u4e0d\u662f\u865a\u62df\u5316\u6574\u4e2a\u786c\u4ef6\uff0c\u800c\u662f\u5171\u4eab\u5bbf\u4e3b\u673aOS\u5185\u6838\uff0c\u5e76\u4f7f\u7528\u5185\u6838\u7279\u6027\u6765\u9694\u79bb\u8fdb\u7a0b\uff1a</p> <ul> <li> <p>\u547d\u540d\u7a7a\u95f4\u9694\u79bb\u8fdb\u7a0b\u53ef\u4ee5\u770b\u5230\u7684\u5185\u5bb9\uff1a\u6bcf\u4e2a\u5bb9\u5668\u62e5\u6709\u81ea\u5df1\u7684\u8fdb\u7a0b\u6811\u89c6\u56fe\uff08PID\u547d\u540d\u7a7a\u95f4\uff09\u3001\u7f51\u7edc\u63a5\u53e3\uff08\u7f51\u7edc\u547d\u540d\u7a7a\u95f4\uff09\u3001\u6587\u4ef6\u7cfb\u7edf\u6302\u8f7d\u70b9\uff08\u6302\u8f7d\u547d\u540d\u7a7a\u95f4\uff09\u548c\u4e3b\u673a\u540d\uff08UTS\u547d\u540d\u7a7a\u95f4\uff09\u3002\u5bb9\u5668\u5185\u7684\u8fdb\u7a0b\u4e0d\u80fd\u770b\u5230\u5176\u4ed6\u5bb9\u5668\u4e2d\u7684\u8fdb\u7a0b\u3002</p> </li> <li> <p>Cgroups\uff08\u63a7\u5236\u7ec4\uff09\u9650\u5236\u8fdb\u7a0b\u53ef\u4ee5\u4f7f\u7528\u7684\u5185\u5bb9\uff1aCPU\u65f6\u95f4\u3001\u5185\u5b58\u3001\u78c1\u76d8I/O\u3001\u7f51\u7edc\u5e26\u5bbd\u3002\u5bb9\u5668\u4e0d\u80fd\u6d88\u8017\u8d85\u8fc7\u5176cgroup\u5141\u8bb8\u7684\u8d44\u6e90\uff0c\u9632\u6b62\u4e00\u4e2a\u5bb9\u5668\u997f\u6b7b\u5176\u4ed6\u5bb9\u5668\u3002</p> </li> </ul> </li> <li> <p>\u5bb9\u5668\u5728\u6beb\u79d2\u5185\u542f\u52a8\uff08\u65e0\u9700OS\u542f\u52a8\uff09\uff0c\u4f7f\u7528\u6700\u5c0f\u5f00\u9500\uff08\u5171\u4eab\u5185\u6838\uff09\uff0c\u5e76\u901a\u8fc7Dockerfile\u5b9a\u4e49\uff0c\u8be5\u6587\u4ef6\u6307\u5b9a\u57fa\u7840\u955c\u50cf\u3001\u4f9d\u8d56\u9879\u548c\u547d\u4ee4\u3002\u8fd9\u4f7f\u5f97\u5b83\u4eec\u53ef\u590d\u73b0\uff1a<code>docker build</code> \u5728\u4efb\u4f55\u5730\u65b9\u4ea7\u751f\u76f8\u540c\u7684\u73af\u5883\u3002</p> </li> <li> <p>\u5bf9\u4e8eML\uff0c\u5bb9\u5668\u89e3\u51b3\u4e86\"\u5728\u6211\u673a\u5668\u4e0a\u80fd\u8fd0\u884c\"\u7684\u95ee\u9898\u3002\u5177\u6709\u7279\u5b9a\u7248\u672cCUDA\u3001cuDNN\u3001PyTorch\u548cPython\u7684\u8bad\u7ec3\u73af\u5883\u88ab\u6253\u5305\u4e3a\u5bb9\u5668\u955c\u50cf\u3002\u4efb\u4f55\u4eba\u90fd\u53ef\u4ee5\u5728\u4efb\u4f55\u673a\u5668\u4e0a\u590d\u73b0\u786e\u5207\u7684\u73af\u5883\u3002\u4e91\u8bad\u7ec3\u5e73\u53f0\uff08AWS SageMaker\u3001GCP Vertex AI\uff09\u5728\u5bb9\u5668\u4e2d\u8fd0\u884c\u8bad\u7ec3\u4efb\u52a1\u3002</p> </li> <li> <p>Kubernetes\uff08K8s\uff09\u5927\u89c4\u6a21\u7f16\u6392\u5bb9\u5668\uff1a\u5b83\u5c06\u5bb9\u5668\u8c03\u5ea6\u5230\u96c6\u7fa4\u4e2d\u7684\u591a\u53f0\u673a\u5668\u4e0a\uff0c\u91cd\u542f\u5931\u8d25\u7684\u5bb9\u5668\uff0c\u6839\u636e\u8d1f\u8f7d\u8fdb\u884c\u6269\u7f29\u5bb9\uff0c\u5e76\u7ba1\u7406\u5bb9\u5668\u4e4b\u95f4\u7684\u7f51\u7edc\u3002\u5927\u89c4\u6a21ML\u670d\u52a1\uff08\u6570\u5343\u4e2a\u6a21\u578b\u526f\u672c\u5904\u7406\u6570\u767e\u4e07\u8bf7\u6c42\uff09\u5728Kubernetes\u4e0a\u8fd0\u884c\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/03.%20operating%20systems/#_10","title":"\u5b89\u5168\u57fa\u7840","text":"<ul> <li> <p>OS\u901a\u8fc7\u591a\u79cd\u673a\u5236\u5b9e\u65bd\u5b89\u5168\uff1a</p> </li> <li> <p>\u6743\u9650\uff1a\u6bcf\u4e2a\u6587\u4ef6\u6709\u4e00\u4e2a\u6240\u6709\u8005\u3001\u4e00\u4e2a\u7ec4\u548c\u6743\u9650\u4f4d\uff08\u62e5\u6709\u8005\u3001\u7ec4\u548c\u5176\u4ed6\u4eba\u7684\u8bfb/\u5199/\u6267\u884c\uff09\u3002\u8fdb\u7a0b\u4ee5\u542f\u52a8\u5b83\u7684\u7528\u6237\u7684\u8eab\u4efd\uff08UID\uff09\u8fd0\u884c\uff0c\u53ea\u80fd\u8bbf\u95ee\u6743\u9650\u4f4d\u5141\u8bb8\u7684\u6587\u4ef6\u3002root\u7528\u6237\uff08UID 0\uff09\u7ed5\u8fc7\u6240\u6709\u6743\u9650\u68c0\u67e5\uff0c\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48\u4ee5root\u8eab\u4efd\u8fd0\u884c\u662f\u5371\u9669\u7684\u3002</p> </li> <li> <p>\u6743\u9650\u5206\u79bb\uff1a\u8fdb\u7a0b\u4ee5\u6240\u9700\u7684\u6700\u5c0f\u6743\u9650\u8fd0\u884c\u3002Web\u670d\u52a1\u5668\u4e0d\u9700\u8981root\u8bbf\u95ee\u6743\u9650\uff1b\u5b83\u5e94\u8be5\u4ee5\u4e00\u4e2a\u53d7\u9650\u7528\u6237\u8eab\u4efd\u8fd0\u884c\uff0c\u8be5\u7528\u6237\u53ea\u80fd\u8bfb\u53d6Web\u6587\u4ef6\u5e76\u7ed1\u5b9a\u5230\u7aef\u53e380\u3002\u5982\u679c\u670d\u52a1\u5668\u88ab\u653b\u7834\uff0c\u653b\u51fb\u8005\u7684\u8bbf\u95ee\u9650\u5236\u5728\u8be5\u53d7\u9650\u7528\u6237\u80fd\u505a\u7684\u8303\u56f4\u5185\u3002</p> </li> <li> <p>\u6c99\u7bb1\u5316\uff1a\u9650\u5236\u8fdb\u7a0b\u5728\u6587\u4ef6\u6743\u9650\u4e4b\u5916\u80fd\u505a\u7684\u4e8b\u60c5\u3002seccomp\uff08Linux\uff09\u9650\u5236\u8fdb\u7a0b\u53ef\u4ee5\u8fdb\u884c\u7684\u7cfb\u7edf\u8c03\u7528\u3002AppArmor\u548cSELinux\u5b9a\u4e49\u5f3a\u5236\u8bbf\u95ee\u63a7\u5236\u7b56\u7565\u3002\u5bb9\u5668\u7ed3\u5408\u4e86\u547d\u540d\u7a7a\u95f4\u3001cgroups\u548cseccomp\u8fdb\u884c\u591a\u5c42\u9694\u79bb\u3002</p> </li> <li> <p>\u5730\u5740\u7a7a\u95f4\u5e03\u5c40\u968f\u673a\u5316\uff08ASLR\uff09\uff1a\u6bcf\u6b21\u7a0b\u5e8f\u8fd0\u884c\u65f6\uff0c\u968f\u673a\u5316\u5806\u6808\u3001\u5806\u548c\u5e93\u7684\u5185\u5b58\u4f4d\u7f6e\u3002\u8fd9\u4f7f\u5f97\u653b\u51fb\u8005\u66f4\u96be\u5229\u7528\u5185\u5b58\u635f\u574f\u6f0f\u6d1e\uff08\u7f13\u51b2\u533a\u6ea2\u51fa\uff09\uff0c\u56e0\u4e3a\u4ed6\u4eec\u65e0\u6cd5\u9884\u6d4b\u4ee3\u7801\u6216\u6570\u636e\u5728\u5185\u5b58\u4e2d\u7684\u4f4d\u7f6e\u3002</p> </li> <li> <p>\u5b89\u5168\u662f\u4e00\u4e2a\u5168\u7cfb\u7edf\u5c42\u9762\u7684\u5173\u6ce8\uff1a\u94fe\u6761\u7684\u5f3a\u5ea6\u53d6\u51b3\u4e8e\u6700\u5f31\u7684\u4e00\u73af\u3002\u6a21\u578b\u670d\u52a1\u7cfb\u7edf\u9700\u8981\u5b89\u5168\u7684\u7f51\u7edc\u901a\u4fe1\uff08TLS/HTTPS\uff09\u3001\u7ecf\u8fc7\u8eab\u4efd\u9a8c\u8bc1\u7684API\u8bbf\u95ee\uff08API\u5bc6\u94a5\u3001OAuth\uff09\u3001\u8f93\u5165\u9a8c\u8bc1\uff08\u9632\u6b62\u5bf9\u6297\u6027\u8f93\u5165\uff09\u548c\u9694\u79bb\u6267\u884c\uff08\u5177\u6709\u6700\u5c0f\u6743\u9650\u7684\u5bb9\u5668\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/03.%20operating%20systems/#colab","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216\u7b14\u8bb0\u672c\uff09","text":"<ol> <li> <p>\u63a2\u7d22\u8fdb\u7a0b\u521b\u5efa\u3002\u4f7f\u7528Python\u7684 <code>os.fork()</code>\uff08\u4ec5Unix\uff09\u521b\u5efa\u4e00\u4e2a\u5b50\u8fdb\u7a0b\uff0c\u5e76\u89c2\u5bdf\u7236\u8fdb\u7a0b\u548c\u5b50\u8fdb\u7a0b\u5982\u4f55\u4ece\u540c\u4e00\u70b9\u7ee7\u7eed\u6267\u884c\u3002 <pre><code>import os\n\npid = os.fork()\n\nif pid == 0:\n    # \u5b50\u8fdb\u7a0b\n    print(f\"Child: my PID is {os.getpid()}, parent PID is {os.getppid()}\")\nelse:\n    # \u7236\u8fdb\u7a0b\n    print(f\"Parent: my PID is {os.getpid()}, child PID is {pid}\")\n    os.wait()  # \u7b49\u5f85\u5b50\u8fdb\u7a0b\u7ed3\u675f\n</code></pre></p> </li> <li> <p>\u6a21\u62df\u8f6e\u8f6c\u8c03\u5ea6\u3002\u7ed9\u5b9a\u4e00\u4e2a\u5e26\u6709\u6267\u884c\u65f6\u95f4\u7684\u8fdb\u7a0b\u5217\u8868\uff0c\u6a21\u62df\u8c03\u5ea6\u5e76\u8ba1\u7b97\u5e73\u5747\u7b49\u5f85\u65f6\u95f4\u3002 <pre><code>def round_robin(processes, quantum=3):\n    \"\"\"\u6a21\u62df\u8f6e\u8f6c\u8c03\u5ea6\u3002\n    processes: (name, burst_time) \u5143\u7ec4\u5217\u8868\u3002\n    \"\"\"\n    queue = [(name, burst, 0) for name, burst in processes]  # (name, remaining, wait)\n    time = 0\n    log = []\n\n    while queue:\n        name, remaining, waited = queue.pop(0)\n        waited += (time - waited - (processes[[p[0] for p in processes].index(name)][1] - remaining))\n        run_time = min(quantum, remaining)\n        log.append(f\"  t={time:3d}: {name} runs for {run_time} (remaining: {remaining - run_time})\")\n        time += run_time\n        remaining -= run_time\n\n        if remaining &gt; 0:\n            queue.append((name, remaining, time))\n        else:\n            log.append(f\"  t={time:3d}: {name} DONE (turnaround: {time})\")\n\n    for line in log:\n        print(line)\n\nprint(\"\u8f6e\u8f6c\u8c03\u5ea6 (quantum=3)\uff1a\")\nround_robin([(\"P1\", 10), (\"P2\", 4), (\"P3\", 6)], quantum=3)\n</code></pre></p> </li> <li> <p>\u6a21\u62dfLRU\u9875\u9762\u7f6e\u6362\u3002\u7ed9\u5b9a\u4e00\u4e2a\u9875\u9762\u8bbf\u95ee\u5e8f\u5217\u548c\u56fa\u5b9a\u6570\u91cf\u7684\u5e27\uff0c\u7edf\u8ba1\u7f3a\u9875\u6b21\u6570\u3002 <pre><code>def lru_page_replacement(pages, n_frames):\n    \"\"\"\u6a21\u62dfLRU\u9875\u9762\u7f6e\u6362\u3002\"\"\"\n    frames = []\n    faults = 0\n\n    for page in pages:\n        if page in frames:\n            frames.remove(page)\n            frames.append(page)  # \u79fb\u52a8\u5230\u6700\u8fd1\u4f7f\u7528\n            status = \"HIT \"\n        else:\n            faults += 1\n            if len(frames) &gt;= n_frames:\n                evicted = frames.pop(0)  # \u79fb\u9664\u6700\u8fd1\u6700\u5c11\u4f7f\u7528\n                status = f\"MISS (evict {evicted})\"\n            else:\n                status = \"MISS (cold)\"\n            frames.append(page)\n        print(f\"  Page {page}: {status}  frames={frames}\")\n\n    print(f\"\\nTotal faults: {faults}/{len(pages)} ({faults/len(pages):.0%})\")\n\nprint(\"LRU with 3 frames:\")\nlru_page_replacement([1, 2, 3, 4, 1, 2, 5, 1, 2, 3, 4, 5], n_frames=3)\n</code></pre></p> </li> </ol>"},{"location":"chapter%2013%3A%20computing%20and%20OS/04.%20concurrency%20and%20parallelism/","title":"\u5e76\u53d1\u4e0e\u5e76\u884c","text":"<p>\u5e76\u53d1\u4e0e\u5e76\u884c\u662f\u7a0b\u5e8f\u540c\u65f6\u5904\u7406\u591a\u4ef6\u4e8b\u60c5\u7684\u65b9\u5f0f\u3002\u672c\u6587\u6db5\u76d6\u5e76\u53d1\u4e0e\u5e76\u884c\u7684\u533a\u522b\u3001\u540c\u6b65\u539f\u8bed\u3001\u7ecf\u5178\u5e76\u53d1\u95ee\u9898\u3001\u6b7b\u9501\u3001\u65e0\u9501\u6570\u636e\u7ed3\u6784\u3001\u5e76\u884c\u7f16\u7a0b\u6a21\u578b\u3001\u5f02\u6b65\u7f16\u7a0b\u548c\u6269\u5c55\u5b9a\u5f8b\u2014\u2014\u8fd9\u4e9b\u6982\u5ff5\u652f\u6491\u7740\u591a\u7ebf\u7a0b\u670d\u52a1\u5668\u3001\u5206\u5e03\u5f0f\u8bad\u7ec3\u548c\u6bcf\u4e00\u4e2a\u73b0\u4ee3\u5e94\u7528\u7a0b\u5e8f\u3002</p> <ul> <li>\u5355\u4e2aCPU\u6838\u5fc3\u4e00\u6b21\u6267\u884c\u4e00\u6761\u6307\u4ee4\u3002\u4f46\u73b0\u4ee3\u7cfb\u7edf\u67098\u4e2a\u300164\u4e2a\u751a\u81f3\u6570\u5343\u4e2a\u6838\u5fc3\uff08GPU\uff09\u3002\u5373\u4f7f\u5728\u5355\u6838\u4e0a\uff0c\u6211\u4eec\u4e5f\u5e0c\u671b\u5904\u7406\u591a\u4e2a\u4efb\u52a1\uff1a\u4e00\u8fb9\u4e0b\u8f7d\u6587\u4ef6\u4e00\u8fb9\u6e32\u67d3\u754c\u9762\u4e00\u8fb9\u5904\u7406\u7528\u6237\u8f93\u5165\u3002\u5e76\u53d1\u548c\u5e76\u884c\u662f\u7ba1\u7406\u591a\u4e2a\u6d3b\u52a8\u7684\u4e24\u79cd\u7b56\u7565\u3002</li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/04.%20concurrency%20and%20parallelism/#vs","title":"\u5e76\u53d1 vs \u5e76\u884c","text":"<ul> <li> <p>\u5e76\u53d1\u662f\u5173\u4e8e\u7ba1\u7406\u591a\u4e2a\u4efb\u52a1\u3002\u4efb\u52a1\u901a\u8fc7\u4ea4\u9519\u8fdb\u884c\uff1a\u4efb\u52a1A\u8fd0\u884c\u4e00\u4f1a\u513f\uff0c\u7136\u540e\u4efb\u52a1B\uff0c\u7136\u540e\u56de\u5230A\u3002\u5728\u5355\u6838\u4e0a\uff0c\u5e76\u53d1\u521b\u9020\u4e86\u540c\u65f6\u6267\u884c\u7684\u5047\u8c61\u3002\u8fd9\u4e9b\u4efb\u52a1\u5e76\u975e\u771f\u6b63\u540c\u65f6\u6267\u884c\uff1b\u5b83\u4eec\u8f6e\u6d41\u8fdb\u884c\u3002</p> </li> <li> <p>\u5e76\u884c\u662f\u5173\u4e8e\u6267\u884c\u591a\u4e2a\u4efb\u52a1\u540c\u65f6\u8fdb\u884c\u3002\u6709\\(n\\)\u4e2a\u6838\u5fc3\uff0c\\(n\\)\u4e2a\u4efb\u52a1\u53ef\u4ee5\u771f\u6b63\u540c\u65f6\u8fd0\u884c\u3002\u5e76\u884c\u9700\u8981\u591a\u4e2a\u786c\u4ef6\u6267\u884c\u5355\u5143\u3002</p> </li> <li> <p>\u7c7b\u6bd4\uff1a\u5e76\u53d1\u662f\u4e00\u4e2a\u53a8\u5e08\u4ea4\u66ff\u5207\u83dc\u548c\u6405\u62cc\u9505\u3002\u5e76\u884c\u662f\u4e24\u4e2a\u53a8\u5e08\u5404\u81ea\u540c\u65f6\u505a\u4e00\u4e2a\u4efb\u52a1\u3002\u4e00\u4e2a\u7cfb\u7edf\u53ef\u4ee5\u662f\u5e76\u53d1\u4f46\u4e0d\u5e76\u884c\u7684\uff08\u5355\u6838\uff0c\u4efb\u52a1\u4ea4\u9519\uff09\uff0c\u5e76\u884c\u4f46\u4e0d\u5e76\u53d1\u7684\uff08\u591a\u6838\u8fd0\u884c\u72ec\u7acb\u7a0b\u5e8f\uff0c\u6ca1\u6709\u4ea4\u4e92\uff09\uff0c\u6216\u8005\u4e24\u8005\u517c\u6709\uff08\u591a\u6838\u8fd0\u884c\u4e92\u76f8\u4ea4\u9519\u4ea4\u4e92\u7684\u4efb\u52a1\uff09\u3002</p> </li> <li> <p>\u5728ML\u4e2d\uff0c\u5e76\u53d1\u51fa\u73b0\u5728\u6570\u636e\u52a0\u8f7d\u4e2d\uff08\u6570\u636e\u9884\u5904\u7406\u4e0eGPU\u8ba1\u7b97\u91cd\u53e0\uff09\uff0c\u800c\u5e76\u884c\u51fa\u73b0\u5728\u5206\u5e03\u5f0f\u8bad\u7ec3\u4e2d\uff08\u591a\u4e2aGPU\u540c\u65f6\u8ba1\u7b97\u68af\u5ea6\uff0c\u7b2c6\u7ae0\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/04.%20concurrency%20and%20parallelism/#_2","title":"\u540c\u6b65\u539f\u8bed","text":"<ul> <li> <p>\u5f53\u591a\u4e2a\u7ebf\u7a0b\u5171\u4eab\u6570\u636e\u65f6\uff0c\u540c\u6b65\u9632\u6b62\u7ade\u6001\u6761\u4ef6\u3002\u7ade\u6001\u6761\u4ef6\u53d1\u751f\u5728\u7ed3\u679c\u4f9d\u8d56\u4e8e\u7ebf\u7a0b\u6267\u884c\u7684\u4e0d\u53ef\u9884\u6d4b\u987a\u5e8f\u65f6\u3002</p> </li> <li> <p>\u8003\u8651\u4e24\u4e2a\u7ebf\u7a0b\u540c\u65f6\u589e\u52a0\u4e00\u4e2a\u5171\u4eab\u8ba1\u6570\u5668\uff1a<code>counter += 1</code>\u3002\u8fd9\u5b9e\u9645\u4e0a\u662f\u4e09\u4e2a\u64cd\u4f5c\uff1a\uff081\uff09\u8bfb\u53d6\u8ba1\u6570\u5668\uff0c\uff082\uff09\u52a01\uff0c\uff083\uff09\u5199\u5165\u8ba1\u6570\u5668\u3002\u5982\u679c\u4e24\u4e2a\u7ebf\u7a0b\u8bfb\u53d6\u76f8\u540c\u7684\u503c\uff08\u6bd4\u59825\uff09\uff0c\u90fd\u52a01\uff0c\u90fd\u5199\u51656\uff0c\u8ba1\u6570\u5668\u6700\u7ec8\u4e3a6\u800c\u4e0d\u662f\u6b63\u786e\u76847\u3002\u4e00\u6b21\u589e\u52a0\u4e22\u5931\u4e86\u3002</p> </li> <li> <p>\u4e92\u65a5\u9501\uff08\u4e92\u65a5\u6392\u65a5\u9501\uff09\u786e\u4fdd\u4e00\u6b21\u53ea\u6709\u4e00\u4e2a\u7ebf\u7a0b\u8bbf\u95ee\u4e34\u754c\u533a\u3002\u4e00\u4e2a\u7ebf\u7a0b\u5728\u8fdb\u5165\u4e34\u754c\u533a\u524d\u83b7\u53d6\u9501\uff0c\u4e4b\u540e\u91ca\u653e\u9501\u3002\u4efb\u4f55\u5176\u4ed6\u8bd5\u56fe\u83b7\u53d6\u5df2\u88ab\u6301\u6709\u9501\u7684\u7ebf\u7a0b\u5c06\u963b\u585e\u76f4\u5230\u9501\u88ab\u91ca\u653e\u3002</p> </li> </ul> <pre><code>lock.acquire()\ncounter += 1      # \u4e00\u6b21\u53ea\u6709\u4e00\u4e2a\u7ebf\u7a0b\u5728\u6b64\nlock.release()\n</code></pre> <ul> <li> <p>\u4e92\u65a5\u9501\u662f\u6b63\u786e\u7684\uff0c\u4f46\u4f1a\u5f15\u5165\u4e89\u7528\uff1a\u5982\u679c\u8bb8\u591a\u7ebf\u7a0b\u7ade\u4e89\u540c\u4e00\u4e2a\u9501\uff0c\u5b83\u4eec\u82b1\u8d39\u65f6\u95f4\u7b49\u5f85\u800c\u4e0d\u662f\u8ba1\u7b97\u3002\u8fd9\u9650\u5236\u4e86\u53ef\u6269\u5c55\u6027\u3002\u6781\u7aef\u60c5\u51b5\u4e0b\uff0c\u6240\u6709\u7ebf\u7a0b\u90fd\u60f3\u8981\u540c\u4e00\u4e2a\u9501\uff0c\u4f1a\u4f7f\u6574\u4e2a\u7a0b\u5e8f\u4e32\u884c\u5316\u3002</p> </li> <li> <p>\u4fe1\u53f7\u91cf\u6cdb\u5316\u4e86\u4e92\u65a5\u9501\u3002\u8ba1\u6570\u4fe1\u53f7\u91cf\u7ef4\u62a4\u4e00\u4e2a\u8ba1\u6570\u5668\uff1a<code>wait()</code> \u9012\u51cf\u8ba1\u6570\u5668\uff08\u5982\u679c\u4f1a\u53d8\u8d1f\u5219\u963b\u585e\uff09\uff0c<code>signal()</code> \u9012\u589e\u8ba1\u6570\u5668\u3002\u521d\u59cb\u5316\u4e3a1\u7684\u4fe1\u53f7\u91cf\u884c\u4e3a\u7c7b\u4f3c\u4e92\u65a5\u9501\u3002\u521d\u59cb\u5316\u4e3a\\(n\\)\u7684\u4fe1\u53f7\u91cf\u5141\u8bb8\u6700\u591a\\(n\\)\u4e2a\u7ebf\u7a0b\u540c\u65f6\u8fdb\u5165\u4e34\u754c\u533a\uff08\u9002\u7528\u4e8e\u8d44\u6e90\u6c60\u5982\u6570\u636e\u5e93\u8fde\u63a5\uff09\u3002</p> </li> <li> <p>\u6761\u4ef6\u53d8\u91cf\u8ba9\u4e00\u4e2a\u7ebf\u7a0b\u7b49\u5f85\u76f4\u5230\u67d0\u4e2a\u7279\u5b9a\u6761\u4ef6\u6ee1\u8db3\u3002\u8be5\u7ebf\u7a0b\u91ca\u653e\u4e00\u4e2a\u9501\uff0c\u5728\u6761\u4ef6\u53d8\u91cf\u4e0a\u7b49\u5f85\uff0c\u5f53\u53e6\u4e00\u4e2a\u7ebf\u7a0b\u53d1\u51fa\u8be5\u6761\u4ef6\u7684\u4fe1\u53f7\u65f6\u88ab\u5524\u9192\u3002\u8fd9\u907f\u514d\u4e86\u5fd9\u7b49\u5f85\uff08\u5728\u4e00\u4e2a\u5faa\u73af\u4e2d\u53cd\u590d\u68c0\u67e5\u6761\u4ef6\uff0c\u6d6a\u8d39CPU\uff09\u3002</p> </li> <li> <p>\u76d1\u89c6\u5668\u5c06\u4e92\u65a5\u9501\u4e0e\u6761\u4ef6\u53d8\u91cf\u548c\u5171\u4eab\u6570\u636e\u6346\u7ed1\u4e3a\u4e00\u4e2a\u5355\u4e00\u62bd\u8c61\u3002Java\u7684 <code>synchronized</code> \u5173\u952e\u5b57\u548cPython\u7684 <code>threading.Condition</code> \u5b9e\u73b0\u4e86\u7c7b\u4f3c\u76d1\u89c6\u5668\u7684\u8bed\u4e49\u3002</p> </li> <li> <p>\u8bfb\u5199\u9501\u533a\u5206\u8bfb\u7ebf\u7a0b\uff08\u53ef\u4ee5\u5171\u4eab\u8bbf\u95ee\uff0c\u56e0\u4e3a\u8bfb\u53d6\u4e0d\u4f1a\u4fee\u6539\u6570\u636e\uff09\u548c\u5199\u7ebf\u7a0b\uff08\u9700\u8981\u72ec\u5360\u8bbf\u95ee\uff09\u3002\u591a\u4e2a\u8bfb\u7ebf\u7a0b\u53ef\u4ee5\u540c\u65f6\u6301\u6709\u9501\uff0c\u4f46\u4e00\u4e2a\u5199\u7ebf\u7a0b\u4f1a\u963b\u585e\u6240\u6709\u8bfb\u7ebf\u7a0b\u548c\u5176\u4ed6\u5199\u7ebf\u7a0b\u3002\u5f53\u8bfb\u64cd\u4f5c\u8fdc\u591a\u4e8e\u5199\u64cd\u4f5c\u65f6\uff08\u4f8b\u5982\uff0c\u63d0\u4f9b\u9884\u6d4b\u7684\u7f13\u5b58\u6a21\u578b\uff09\uff0c\u8fd9\u662f\u6700\u4f18\u7684\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/04.%20concurrency%20and%20parallelism/#_3","title":"\u7ecf\u5178\u5e76\u53d1\u95ee\u9898","text":"<ul> <li> <p>\u751f\u4ea7\u8005-\u6d88\u8d39\u8005\uff08\u6709\u754c\u7f13\u51b2\u533a\uff09\uff1a\u751f\u4ea7\u8005\u751f\u6210\u9879\u76ee\u5e76\u5c06\u5176\u653e\u5165\u56fa\u5b9a\u5927\u5c0f\u7684\u7f13\u51b2\u533a\uff1b\u6d88\u8d39\u8005\u79fb\u9664\u9879\u76ee\u3002\u6311\u6218\uff1a\u7f13\u51b2\u533a\u6ee1\u65f6\u751f\u4ea7\u8005\u5fc5\u987b\u7b49\u5f85\uff0c\u7f13\u51b2\u533a\u7a7a\u65f6\u6d88\u8d39\u8005\u5fc5\u987b\u7b49\u5f85\uff0c\u4e14\u4e24\u8005\u5fc5\u987b\u9632\u6b62\u635f\u574f\u7f13\u51b2\u533a\u3002</p> </li> <li> <p>\u89e3\u51b3\u65b9\u6848\u4f7f\u7528\u4e24\u4e2a\u4fe1\u53f7\u91cf\uff08\u4e00\u4e2a\u8ba1\u6570\u7a7a\u4f4d\uff0c\u4e00\u4e2a\u8ba1\u6570\u6ee1\u4f4d\uff09\u52a0\u4e0a\u4e00\u4e2a\u7528\u4e8e\u7f13\u51b2\u533a\u672c\u8eab\u7684\u4e92\u65a5\u9501\u3002\u8fd9\u662f\u5927\u591a\u6570\u6d88\u606f\u961f\u5217\u3001\u65e5\u5fd7\u7cfb\u7edf\u548c\u6570\u636e\u7ba1\u9053\u80cc\u540e\u7684\u6a21\u5f0f\u3002</p> </li> <li> <p>\u8bfb\u8005-\u5199\u8005\uff1a\u591a\u4e2a\u8bfb\u8005\u53ef\u4ee5\u540c\u65f6\u8bfb\u53d6\uff0c\u4f46\u5199\u8005\u9700\u8981\u72ec\u5360\u8bbf\u95ee\u3002\u6311\u6218\u662f\u516c\u5e73\u6027\uff1a\u5982\u679c\u8bfb\u8005\u6e90\u6e90\u4e0d\u65ad\u5730\u5230\u6765\uff0c\u5199\u8005\u53ef\u80fd\u9965\u997f\uff08\u6c38\u8fdc\u5f97\u4e0d\u5230\u8bbf\u95ee\uff09\u3002\u89e3\u51b3\u65b9\u6848\u8981\u4e48\u4f18\u5148\u8003\u8651\u8bfb\u8005\uff0c\u8981\u4e48\u4f18\u5148\u8003\u8651\u5199\u8005\uff0c\u8981\u4e48\u516c\u5e73\u5730\u4ea4\u66ff\u3002</p> </li> <li> <p>\u54f2\u5b66\u5bb6\u5c31\u9910\u95ee\u9898\uff1a\u4e94\u4f4d\u54f2\u5b66\u5bb6\u56f4\u5750\u5728\u4e00\u5f20\u6709\u4e94\u4e2a\u53c9\u5b50\u7684\u684c\u5b50\u65c1\u3002\u6bcf\u4eba\u9700\u8981\u4e24\u628a\u53c9\u5b50\u624d\u80fd\u5403\u996d\u3002\u5982\u679c\u6240\u6709\u4e94\u4f4d\u540c\u65f6\u62ff\u8d77\u5de6\u8fb9\u7684\u53c9\u5b50\uff0c\u6ca1\u4eba\u80fd\u62ff\u8d77\u53f3\u8fb9\u7684\u53c9\u5b50\uff0c\u6240\u6709\u4eba\u90fd\u997f\u6b7b\uff08\u6b7b\u9501\uff09\u3002\u89e3\u51b3\u65b9\u6848\u5305\u62ec\uff1a\u540c\u65f6\u62ff\u8d77\u4e24\u628a\u53c9\u5b50\uff08\u539f\u5b50\u64cd\u4f5c\uff09\uff0c\u5f15\u5165\u4e0d\u5bf9\u79f0\u6027\uff08\u4e00\u4f4d\u54f2\u5b66\u5bb6\u5148\u62ff\u53f3\u8fb9\u7684\u53c9\u5b50\uff09\uff0c\u6216\u8005\u4f7f\u7528\u670d\u52a1\u5458\uff08\u9650\u5236\u7528\u9910\u4eba\u6570\u4e3a4\u7684\u4fe1\u53f7\u91cf\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/04.%20concurrency%20and%20parallelism/#_4","title":"\u6b7b\u9501","text":"<ul> <li>\u6b7b\u9501\u53d1\u751f\u5728\u4e00\u7ec4\u7ebf\u7a0b\u5404\u81ea\u7b49\u5f85\u96c6\u5408\u4e2d\u53e6\u4e00\u4e2a\u7ebf\u7a0b\u6301\u6709\u7684\u8d44\u6e90\uff0c\u5f62\u6210\u4e00\u4e2a\u4f9d\u8d56\u5faa\u73af\u3002\u6ca1\u6709\u4eba\u80fd\u7ee7\u7eed\u3002</li> </ul> <ul> <li> <p>\u6b7b\u9501\u7684\u56db\u4e2a\u5fc5\u8981\u6761\u4ef6\uff08\u5fc5\u987b\u540c\u65f6\u6ee1\u8db3\uff09\uff1a</p> <ol> <li>\u4e92\u65a5\uff1a\u8d44\u6e90\u4e00\u6b21\u53ea\u80fd\u88ab\u4e00\u4e2a\u7ebf\u7a0b\u6301\u6709\u3002</li> <li>\u6301\u6709\u5e76\u7b49\u5f85\uff1a\u4e00\u4e2a\u7ebf\u7a0b\u6301\u6709\u4e00\u4e2a\u8d44\u6e90\u7684\u540c\u65f6\u7b49\u5f85\u53e6\u4e00\u4e2a\u8d44\u6e90\u3002</li> <li>\u4e0d\u53ef\u5265\u593a\uff1a\u8d44\u6e90\u4e0d\u80fd\u88ab\u5f3a\u5236\u4ece\u7ebf\u7a0b\u4e2d\u62ff\u8d70\u3002</li> <li>\u5faa\u73af\u7b49\u5f85\uff1a\u7b49\u5f85\u56fe\u4e2d\u5b58\u5728\u4e00\u4e2a\u5faa\u73af\u3002</li> </ol> </li> <li> <p>\u6b7b\u9501\u9884\u9632\u6253\u7834\u56db\u4e2a\u6761\u4ef6\u4e4b\u4e00\uff1a</p> <ul> <li>\u6d88\u9664\u5faa\u73af\u7b49\u5f85\uff1a\u5bf9\u8d44\u6e90\u65bd\u52a0\u5168\u5e8f\u3002\u6240\u6709\u7ebf\u7a0b\u4ee5\u76f8\u540c\u7684\u987a\u5e8f\u83b7\u53d6\u8d44\u6e90\u3002\u5982\u679c\u6bcf\u4e2a\u7ebf\u7a0b\u603b\u662f\u5728\u83b7\u53d6\u9501A\u4e4b\u540e\u624d\u83b7\u53d6\u9501B\uff0c\u5219\u4e0d\u53ef\u80fd\u6709\u5faa\u73af\u3002</li> <li>\u6d88\u9664\u6301\u6709\u5e76\u7b49\u5f85\uff1a\u8981\u6c42\u7ebf\u7a0b\u4e00\u6b21\u6027\uff08\u539f\u5b50\u5730\uff09\u8bf7\u6c42\u6240\u6709\u8d44\u6e90\u3002</li> </ul> </li> <li> <p>\u6b7b\u9501\u907f\u514d\u52a8\u6001\u51b3\u5b9a\u662f\u5426\u6279\u51c6\u4e00\u4e2a\u8d44\u6e90\u8bf7\u6c42\u53ef\u80fd\u5bfc\u81f4\u6b7b\u9501\u3002\u94f6\u884c\u5bb6\u7b97\u6cd5\u7ef4\u62a4\u6bcf\u4e2a\u7ebf\u7a0b\u7684\u6700\u5927\u53ef\u80fd\u9700\u6c42\uff0c\u4ec5\u6279\u51c6\u4f7f\u7cfb\u7edf\u4fdd\u6301\"\u5b89\u5168\u72b6\u6001\"\uff08\u6240\u6709\u7ebf\u7a0b\u6700\u7ec8\u90fd\u80fd\u5b8c\u6210\u7684\u72b6\u6001\uff09\u7684\u8bf7\u6c42\u3002\u8be5\u7b97\u6cd5\u6bcf\u4e2a\u8bf7\u6c42 \\(O(n^2 m)\\)\uff08\\(n\\)\u4e2a\u7ebf\u7a0b\uff0c\\(m\\)\u79cd\u8d44\u6e90\u7c7b\u578b\uff09\uff0c\u5bf9\u5927\u591a\u6570\u5b9e\u9645\u7cfb\u7edf\u6765\u8bf4\u8fc7\u4e8e\u6602\u8d35\u3002</p> </li> <li> <p>\u6b7b\u9501\u68c0\u6d4b\u8ba9\u6b7b\u9501\u53d1\u751f\uff0c\u7136\u540e\u68c0\u6d4b\u5b83\u4eec\uff08\u901a\u8fc7\u5728\u7b49\u5f85\u56fe\u4e2d\u627e\u5230\u5faa\u73af\uff09\u5e76\u6062\u590d\uff08\u901a\u8fc7\u6740\u6b7b\u4e00\u4e2a\u7ebf\u7a0b\u6216\u56de\u6eda\u4e00\u4e2a\u4e8b\u52a1\uff09\u3002</p> </li> <li> <p>\u5728\u5b9e\u8df5\u4e2d\uff0c\u5927\u591a\u6570\u7cfb\u7edf\u5bf9\u5e38\u89c1\u60c5\u51b5\u4f7f\u7528\u9884\u9632\uff08\u8d44\u6e90\u6392\u5e8f\uff09\uff0c\u5bf9\u7f55\u89c1\u60c5\u51b5\u4f7f\u7528\u68c0\u6d4b\u3002\u6570\u636e\u5e93\u7cfb\u7edf\u662f\u7ecf\u5178\u4f8b\u5b50\uff1a\u5b83\u4eec\u68c0\u6d4b\u4e8b\u52a1\u4e4b\u95f4\u7684\u6b7b\u9501\u5e76\u4e2d\u6b62\u4e00\u4e2a\u6765\u6253\u7834\u5faa\u73af\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/04.%20concurrency%20and%20parallelism/#_5","title":"\u65e0\u9501\u548c\u514d\u7b49\u5f85\u6570\u636e\u7ed3\u6784","text":"<ul> <li> <p>\u9501\u5f15\u5165\u4e86\u4e89\u7528\u3001\u4f18\u5148\u7ea7\u53cd\u8f6c\u548c\u6b7b\u9501\u98ce\u9669\u3002\u65e0\u9501\u6570\u636e\u7ed3\u6784\u5b8c\u5168\u907f\u514d\u4f7f\u7528\u9501\uff0c\u4f7f\u7528\u786c\u4ef6\u63d0\u4f9b\u7684\u539f\u5b50\u64cd\u4f5c\u3002</p> </li> <li> <p>\u5173\u952e\u7684\u539f\u5b50\u64cd\u4f5c\u662f\u6bd4\u8f83\u5e76\u4ea4\u6362\uff08CAS\uff09\uff1a\u539f\u5b50\u5730\u68c0\u67e5\u4e00\u4e2a\u5185\u5b58\u4f4d\u7f6e\u662f\u5426\u5177\u6709\u671f\u671b\u7684\u503c\uff0c\u5982\u679c\u662f\uff0c\u5219\u5c06\u5176\u66ff\u6362\u4e3a\u65b0\u503c\u3002\u4f2a\u4ee3\u7801\uff1a</p> </li> </ul> <pre><code>CAS(address, expected, new_value):\n    if *address == expected:\n        *address = new_value\n        return true\n    else:\n        return false\n</code></pre> <ul> <li> <p>CAS\u5b9e\u73b0\u4e3a\u5355\u4e2a\u786c\u4ef6\u6307\u4ee4\uff0c\u56e0\u6b64\u5373\u4f7f\u6ca1\u6709\u9501\u4e5f\u662f\u539f\u5b50\u7684\u3002\u65e0\u9501\u7b97\u6cd5\u4f7f\u7528\u91cd\u8bd5\u5faa\u73af\u4e2d\u7684CAS\uff1a\u8bfb\u53d6\u5f53\u524d\u503c\uff0c\u8ba1\u7b97\u65b0\u503c\uff0c\u5c1d\u8bd5CAS\u3002\u5982\u679c\u53e6\u4e00\u4e2a\u7ebf\u7a0b\u5728\u6b64\u671f\u95f4\u4fee\u6539\u4e86\u8be5\u503c\uff0cCAS\u5931\u8d25\uff0c\u7ebf\u7a0b\u91cd\u8bd5\u3002</p> </li> <li> <p>\u65e0\u9501\uff1a\u81f3\u5c11\u4e00\u4e2a\u7ebf\u7a0b\u5728\u6709\u9650\u6b65\u9aa4\u5185\u53d6\u5f97\u8fdb\u5c55\uff08\u4e0d\u53ef\u80fd\u6b7b\u9501\uff0c\u4f46\u4e2a\u522b\u7ebf\u7a0b\u5728\u4e89\u7528\u4e0b\u53ef\u80fd\u65e0\u9650\u91cd\u8bd5\uff09\u3002</p> </li> <li> <p>\u514d\u7b49\u5f85\uff1a\u6bcf\u4e2a\u7ebf\u7a0b\u5728\u6709\u9650\u6b65\u9aa4\u5185\u53d6\u5f97\u8fdb\u5c55\uff08\u6700\u5f3a\u4fdd\u8bc1\uff0c\u4f46\u6700\u96be\u5b9e\u73b0\uff09\u3002</p> </li> <li> <p>\u65e0\u9501\u7684\u5806\u6808\u3001\u961f\u5217\u548c\u54c8\u5e0c\u6620\u5c04\u5e7f\u6cdb\u7528\u4e8e\u9ad8\u6027\u80fd\u7cfb\u7edf\u3002Java\u7684 <code>ConcurrentHashMap</code> \u548cGo\u7684\u539f\u5b50\u64cd\u4f5c\u90fd\u5efa\u7acb\u5728CAS\u4e4b\u4e0a\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/04.%20concurrency%20and%20parallelism/#_6","title":"\u5e76\u884c\u7f16\u7a0b\u6a21\u578b","text":"<ul> <li>\u5171\u4eab\u5185\u5b58\u5e76\u884c\uff1a\u6240\u6709\u7ebf\u7a0b\u8bbf\u95ee\u540c\u4e00\u5185\u5b58\u7a7a\u95f4\u3002\u540c\u6b65\u662f\u7a0b\u5e8f\u5458\u7684\u8d23\u4efb\u3002OpenMP\u63d0\u4f9b\u7f16\u8bd1\u5668\u6307\u4ee4\u6765\u5e76\u884c\u5316\u5faa\u73af\uff1a</li> </ul> <pre><code>#pragma omp parallel for\nfor (int i = 0; i &lt; n; i++) {\n    result[i] = compute(data[i]);\n}\n</code></pre> <ul> <li> <p>\u7f16\u8bd1\u5668\u5c06\u5faa\u73af\u8fed\u4ee3\u62c6\u5206\u5230\u53ef\u7528\u7684\u6838\u5fc3\u4e0a\u3002OpenMP\u5bf9\u6570\u636e\u5e76\u884c\u5de5\u4f5c\u8d1f\u8f7d\uff08\u5bf9\u8bb8\u591a\u6570\u636e\u70b9\u6267\u884c\u76f8\u540c\u64cd\u4f5c\uff09\u5f88\u6709\u6548\uff0c\u5e7f\u6cdb\u7528\u4e8e\u79d1\u5b66\u8ba1\u7b97\u3002</p> </li> <li> <p>\u6d88\u606f\u4f20\u9012\u5e76\u884c\uff1a\u6bcf\u4e2a\u8fdb\u7a0b\u6709\u81ea\u5df1\u7684\u5185\u5b58\u3002\u901a\u4fe1\u901a\u8fc7\u53d1\u9001\u548c\u63a5\u6536\u6d88\u606f\u5b9e\u73b0\u3002MPI\uff08\u6d88\u606f\u4f20\u9012\u63a5\u53e3\uff09\u662f\u8de8\u8282\u70b9\u5206\u5e03\u5f0f\u8ba1\u7b97\u7684\u6807\u51c6\uff1a</p> </li> </ul> <pre><code>MPI_Send(data, count, MPI_FLOAT, dest, tag, MPI_COMM_WORLD);\nMPI_Recv(data, count, MPI_FLOAT, src, tag, MPI_COMM_WORLD, &amp;status);\n</code></pre> <ul> <li> <p>MPI\u53ef\u6269\u5c55\u5230\u6570\u5343\u4e2a\u8282\u70b9\uff0c\u56e0\u4e3a\u6ca1\u6709\u9700\u8981\u540c\u6b65\u7684\u5171\u4eab\u72b6\u6001\u3002\u5206\u5e03\u5f0f\u6df1\u5ea6\u5b66\u4e60\uff08\u7b2c6\u7ae0\uff09\u4f7f\u7528\u96c6\u5408\u64cd\u4f5c\u5982 <code>MPI_AllReduce</code>\uff08\u73af\u72b6 all-reduce\uff09\u6765\u8de8GPU\u540c\u6b65\u68af\u5ea6\u3002</p> </li> <li> <p>GPU\u5e76\u884c\u9075\u5faaSIMT\uff08\u5355\u6307\u4ee4\u591a\u7ebf\u7a0b\uff09\u6a21\u578b\uff1a\u6570\u5343\u4e2a\u7ebf\u7a0b\u5728\u4e0d\u540c\u6570\u636e\u4e0a\u6267\u884c\u76f8\u540c\u7684\u6307\u4ee4\u3002\u8fd9\u975e\u5e38\u9002\u5408\u77e9\u9635\u8fd0\u7b97\uff08\u7b2c2\u7ae0\uff09\uff0c\u5176\u4e2d\u76f8\u540c\u7684\u4e58\u52a0\u64cd\u4f5c\u5e94\u7528\u4e8e\u6bcf\u4e2a\u5143\u7d20\u3002\u6211\u4eec\u5c06\u5728\u540e\u7eed\u7ae0\u8282\u4e2d\u8be6\u7ec6\u4ecb\u7ecdGPU\u7f16\u7a0b\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/04.%20concurrency%20and%20parallelism/#_7","title":"\u5f02\u6b65\u4e0e\u4e8b\u4ef6\u9a71\u52a8\u7f16\u7a0b","text":"<ul> <li> <p>\u5e76\u975e\u6240\u6709\u5e76\u53d1\u90fd\u9700\u8981\u7ebf\u7a0b\u3002\u5f02\u6b65\u7f16\u7a0b\u4f7f\u7528\u4e8b\u4ef6\u5faa\u73af\u5728\u5355\u4e2a\u7ebf\u7a0b\u4e2d\u5904\u7406\u8bb8\u591aI/O\u5bc6\u96c6\u578b\u4efb\u52a1\u3002</p> </li> <li> <p>\u4e8b\u4ef6\u5faa\u73af\u7ef4\u62a4\u4e00\u4e2a\u4efb\u52a1\u961f\u5217\u3002\u5f53\u4e00\u4e2a\u4efb\u52a1\u9700\u8981\u7b49\u5f85I/O\uff08\u7f51\u7edc\u54cd\u5e94\u3001\u6587\u4ef6\u8bfb\u53d6\uff09\u65f6\uff0c\u5b83\u6ce8\u518c\u4e00\u4e2a\u56de\u8c03\u5e76\u4ea4\u51fa\u63a7\u5236\u6743\u3002\u4e8b\u4ef6\u5faa\u73af\u9009\u53d6\u4e0b\u4e00\u4e2a\u5c31\u7eea\u7684\u4efb\u52a1\u3002\u5f53I/O\u5b8c\u6210\u65f6\uff0c\u56de\u8c03\u88ab\u6392\u961f\u5e76\u6700\u7ec8\u6267\u884c\u3002\u7b49\u5f85\u671f\u95f4\u6ca1\u6709\u7ebf\u7a0b\u88ab\u963b\u585e\u3002</p> </li> <li> <p>\u534f\u7a0b\u662f\u53ef\u4ee5\u6682\u505c\u548c\u6062\u590d\u7684\u51fd\u6570\u3002<code>async/await</code> \u8bed\u6cd5\uff08Python\u3001JavaScript\u3001Rust\uff09\u4f7f\u534f\u7a0b\u770b\u8d77\u6765\u50cf\u5e38\u89c4\u7684\u987a\u5e8f\u4ee3\u7801\uff1a</p> </li> </ul> <pre><code>async def fetch_data(url):\n    response = await http_get(url)  # \u5728\u6b64\u6682\u505c\uff0c\u4e8b\u4ef6\u5faa\u73af\u8fd0\u884c\u5176\u4ed6\u4efb\u52a1\n    return process(response)         # \u54cd\u5e94\u5230\u8fbe\u65f6\u6062\u590d\n</code></pre> <ul> <li> <p><code>await</code> \u5173\u952e\u5b57\u6682\u505c\u534f\u7a0b\u5e76\u5c06\u63a7\u5236\u6743\u8fd4\u56de\u7ed9\u4e8b\u4ef6\u5faa\u73af\u3002\u5f53\u7b49\u5f85\u7684\u64cd\u4f5c\u5b8c\u6210\u65f6\uff0c\u534f\u7a0b\u4ece\u4e2d\u65ad\u5904\u6062\u590d\u3002\u8fd9\u662f\u534f\u4f5c\u5f0f\u591a\u4efb\u52a1\uff1a\u534f\u7a0b\u81ea\u613f\u653e\u5f03\u63a7\u5236\uff0c\u4e0d\u540c\u4e8e\u62a2\u5360\u5f0f\u591a\u4efb\u52a1\u4e2dOS\u5f3a\u5236\u5207\u6362\u7ebf\u7a0b\u3002</p> </li> <li> <p>\u5f02\u6b65\u9002\u7528\u4e8e\u5177\u6709\u8bb8\u591a\u5e76\u53d1\u8fde\u63a5\u7684I/O\u5bc6\u96c6\u578b\u5de5\u4f5c\u8d1f\u8f7d\uff08\u5904\u7406\u6570\u5343\u4e2a\u5ba2\u6237\u7684Web\u670d\u52a1\u5668\uff09\u3002\u5b83\u4e0d\u9002\u7528\u4e8eCPU\u5bc6\u96c6\u578b\u5de5\u4f5c\uff08\u5355\u7ebf\u7a0b\u4e8b\u4ef6\u5faa\u73af\u65e0\u6cd5\u5229\u7528\u591a\u6838\uff09\u3002\u5bf9\u4e8eCPU\u5bc6\u96c6\u578b\u5de5\u4f5c\uff0c\u8bf7\u4f7f\u7528\u7ebf\u7a0b\u6216\u8fdb\u7a0b\u3002</p> </li> <li> <p>Python\u7684\u5168\u5c40\u89e3\u91ca\u5668\u9501\uff08GIL\uff09\u963b\u6b62\u7ebf\u7a0b\u771f\u6b63\u7684\u5e76\u884c\uff1a\u4e00\u6b21\u53ea\u6709\u4e00\u4e2a\u7ebf\u7a0b\u53ef\u4ee5\u6267\u884cPython\u5b57\u8282\u7801\u3002\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48Python\u5bf9CPU\u5e76\u884c\u4f7f\u7528\u591a\u5904\u7406\uff08\u72ec\u7acb\u7684\u8fdb\u7a0b\uff0c\u6bcf\u4e2a\u6709\u81ea\u5df1\u7684\u89e3\u91ca\u5668\uff09\uff0c\u5bf9I/O\u5e76\u53d1\u4f7f\u7528\u5f02\u6b65\u3002GIL\u6b63\u5728Python 3.13+\u4e2d\u88ab\u79fb\u9664\uff08\u81ea\u7531\u7ebf\u7a0bPython\uff09\uff0c\u8fd9\u5c06\u542f\u7528\u771f\u6b63\u7684\u591a\u7ebf\u7a0b\u5e76\u884c\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/04.%20concurrency%20and%20parallelism/#_8","title":"\u6269\u5c55\u5b9a\u5f8b","text":"<ul> <li>\u963f\u59c6\u8fbe\u5c14\u5b9a\u5f8b\u63cf\u8ff0\u4e86\u5e76\u884c\u5316\u7a0b\u5e8f\u7684\u7406\u8bba\u52a0\u901f\u3002\u5982\u679c\u7a0b\u5e8f\u7684\\(p\\)\u90e8\u5206\u662f\u53ef\u5e76\u884c\u7684\uff0c\u5176\u4f59 \\(1-p\\) \u90e8\u5206\u662f\u4e32\u884c\u7684\uff1a</li> </ul> \\[\\text{\u52a0\u901f\u6bd4}(n) = \\frac{1}{(1-p) + \\frac{p}{n}}\\] <ul> <li> <p>\u5176\u4e2d\\(n\\)\u662f\u5904\u7406\u5668\u6570\u91cf\u3002\u5f53 \\(n \\to \\infty\\) \u65f6\uff0c\u6700\u5927\u52a0\u901f\u6bd4\u8d8b\u8fd1\u4e8e \\(\\frac{1}{1-p}\\)\u3002\u5982\u679c95%\u7684\u7a0b\u5e8f\u662f\u5e76\u884c\u7684\uff0c\u6700\u5927\u52a0\u901f\u6bd4\u4e3a \\(\\frac{1}{0.05} = 20\\times\\)\uff0c\u65e0\u8bba\u4f60\u6dfb\u52a0\u591a\u5c11\u6838\u5fc3\u3002\u4e32\u884c\u90e8\u5206\u5c31\u662f\u74f6\u9888\u3002</p> </li> <li> <p>\u8fd9\u5bf9ML\u6709\u6df1\u8fdc\u5f71\u54cd\uff1a\u5982\u679c\u6570\u636e\u52a0\u8f7d\u82b1\u8d39\u8bad\u7ec3\u65f6\u95f4\u768410%\u5e76\u4e14\u662f\u4e32\u884c\u7684\uff0c\u589e\u52a0\u66f4\u591aGPU\u6700\u591a\u53ea\u80fd\u5c06\u8bad\u7ec3\u52a0\u901f10\u500d\u300210%\u7684\u4e32\u884c\u74f6\u9888\u9650\u5236\u4e86\u6240\u6709\u4e1c\u897f\uff08\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48\u9ad8\u6548\u7684\u6570\u636e\u7ba1\u9053\u548cI/O\u4e0e\u8ba1\u7b97\u91cd\u53e0\u5f88\u91cd\u8981\uff0c\u7b2c6\u7ae0\uff09\u3002</p> </li> <li> <p>\u53e4\u65af\u5854\u592b\u68ee\u5b9a\u5f8b\u63d0\u4f9b\u4e86\u66f4\u4e50\u89c2\u7684\u89c6\u89d2\u3002\u5b83\u4e0d\u662f\u5728\u56fa\u5b9a\u95ee\u9898\u89c4\u6a21\u5e76\u6dfb\u52a0\u5904\u7406\u5668\uff0c\u800c\u662f\u56fa\u5b9a\u603b\u65f6\u95f4\u5e76\u95ee\u53ef\u4ee5\u505a\u591a\u5c11\u989d\u5916\u5de5\u4f5c\u3002\u5982\u679c\u5e76\u884c\u90e8\u5206\u968f\u95ee\u9898\u89c4\u6a21\u6269\u5c55\uff1a</p> </li> </ul> \\[\\text{\u52a0\u901f\u6bd4}(n) = 1 - p + p \\cdot n\\] <ul> <li>\u8fd9\u662f\u5173\u4e8e\\(n\\)\u7ebf\u6027\u7684\u3002\u8bba\u8bc1\u662f\uff1a\u7528\u66f4\u591a\u5904\u7406\u5668\uff0c\u6211\u4eec\u89e3\u51b3\u66f4\u5927\u7684\u95ee\u9898\uff0c\u800c\u4e0d\u662f\u66f4\u5feb\u5730\u89e3\u51b3\u540c\u4e00\u95ee\u9898\u3002\u5728ML\u4e2d\uff0c\u8fd9\u5bf9\u5e94\u4e8e\u7528\u66f4\u591aGPU\u589e\u52a0\u6279\u91cf\u5927\u5c0f\uff08\u5f31\u6269\u5c55\uff09\uff0c\u800c\u4e0d\u662f\u4fdd\u6301\u6279\u91cf\u5927\u5c0f\u56fa\u5b9a\uff08\u5f3a\u6269\u5c55\uff09\u3002</li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/04.%20concurrency%20and%20parallelism/#colab","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216\u7b14\u8bb0\u672c\uff09","text":"<ol> <li> <p>\u6f14\u793a\u7ade\u6001\u6761\u4ef6\u3002\u4e24\u4e2a\u7ebf\u7a0b\u5728\u6ca1\u6709\u540c\u6b65\u7684\u60c5\u51b5\u4e0b\u589e\u52a0\u4e00\u4e2a\u5171\u4eab\u8ba1\u6570\u5668\uff0c\u89c2\u5bdf\u4e22\u5931\u7684\u66f4\u65b0\u3002 <pre><code>import threading\n\ncounter = 0\n\ndef increment(n):\n    global counter\n    for _ in range(n):\n        counter += 1  # \u4e0d\u662f\u539f\u5b50\u7684\uff1a\u8bfb\u3001\u52a0\u3001\u5199\n\nthreads = [threading.Thread(target=increment, args=(100000,)) for _ in range(4)]\nfor t in threads: t.start()\nfor t in threads: t.join()\n\nprint(f\"Expected: {4 * 100000}\")\nprint(f\"Actual:   {counter}\")\nprint(f\"Lost updates: {4 * 100000 - counter}\")\n</code></pre></p> </li> <li> <p>\u7528\u9501\u4fee\u590d\u7ade\u6001\u6761\u4ef6\u5e76\u6d4b\u91cf\u5f00\u9500\u3002 <pre><code>import threading\nimport time\n\nlock = threading.Lock()\ncounter = 0\n\ndef increment_locked(n):\n    global counter\n    for _ in range(n):\n        with lock:\n            counter += 1\n\nstart = time.time()\nthreads = [threading.Thread(target=increment_locked, args=(100000,)) for _ in range(4)]\nfor t in threads: t.start()\nfor t in threads: t.join()\nelapsed = time.time() - start\n\nprint(f\"Counter: {counter} (correct: {4 * 100000})\")\nprint(f\"Time with lock: {elapsed:.3f}s\")\n</code></pre></p> </li> <li> <p>\u53ef\u89c6\u5316\u963f\u59c6\u8fbe\u5c14\u5b9a\u5f8b\u3002\u7ed8\u5236\u4e0d\u540c\u5e76\u884c\u6bd4\u4f8b\u4e0b\u52a0\u901f\u6bd4\u4e0e\u5904\u7406\u5668\u6570\u91cf\u7684\u5173\u7cfb\u56fe\u3002 <pre><code>import jax.numpy as jnp\nimport matplotlib.pyplot as plt\n\nn_procs = jnp.arange(1, 65)\n\nfor p, color in [(0.5, \"#e74c3c\"), (0.9, \"#f39c12\"), (0.95, \"#27ae60\"), (0.99, \"#3498db\")]:\n    speedup = 1 / ((1 - p) + p / n_procs)\n    plt.plot(n_procs, speedup, color=color, linewidth=2, label=f\"p={p}\")\n    # \u6700\u5927\u52a0\u901f\u6bd4\u7ebf\n    plt.axhline(1 / (1 - p), color=color, linestyle=\"--\", alpha=0.3)\n\nplt.xlabel(\"\u5904\u7406\u5668\u6570\u91cf\")\nplt.ylabel(\"\u52a0\u901f\u6bd4\")\nplt.title(\"\u963f\u59c6\u8fbe\u5c14\u5b9a\u5f8b\uff1a\u4e32\u884c\u6bd4\u4f8b\u9650\u5236\u52a0\u901f\u6bd4\")\nplt.legend()\nplt.grid(True)\nplt.show()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2013%3A%20computing%20and%20OS/05.%20programming%20languages/","title":"\u7f16\u7a0b\u8bed\u8a00","text":"<p>\u7f16\u7a0b\u8bed\u8a00\u662f\u4eba\u7c7b\u610f\u56fe\u4e0e\u673a\u5668\u6267\u884c\u4e4b\u95f4\u7684\u63a5\u53e3\u3002\u672c\u6587\u6db5\u76d6\u8bed\u8a00\u8303\u5f0f\u3001\u7c7b\u578b\u7cfb\u7edf\u3001\u5185\u5b58\u7ba1\u7406\u7b56\u7565\u3001\u7f16\u8bd1\u6d41\u6c34\u7ebf\u3001\u89e3\u91ca\u4e0eJIT\u7f16\u8bd1\u3001\u5173\u952e\u8bed\u8a00\u7279\u6027\u3001\u9886\u57df\u7279\u5b9a\u8bed\u8a00\u4ee5\u53ca\u8bbe\u8ba1\u6743\u8861\u3002</p> <ul> <li>\u6bcf\u4e00\u4efd\u8f6f\u4ef6\u3001\u6bcf\u4e00\u4e2aML\u6a21\u578b\u3001\u6bcf\u4e00\u4e2a\u64cd\u4f5c\u7cfb\u7edf\u90fd\u662f\u7528\u7f16\u7a0b\u8bed\u8a00\u7f16\u5199\u7684\u3002\u4f46\u5b58\u5728\u6570\u767e\u79cd\u8bed\u8a00\uff0c\u6bcf\u79cd\u90fd\u6709\u4e0d\u540c\u7684\u4f18\u52bf\u3002\u4e3a\u4ec0\u4e48\uff1f\u56e0\u4e3a\u8bed\u8a00\u8bbe\u8ba1\u6d89\u53ca\u57fa\u672c\u7684\u6743\u8861\uff1a\u6027\u80fd vs \u5b89\u5168\u3001\u8868\u73b0\u529b vs \u7b80\u6d01\u6027\u3001\u63a7\u5236 vs \u62bd\u8c61\u3002\u7406\u89e3\u8fd9\u4e9b\u6743\u8861\u6709\u52a9\u4e8e\u4f60\u4e3a\u5de5\u4f5c\u9009\u62e9\u5408\u9002\u7684\u5de5\u5177\uff0c\u5e76\u7406\u89e3\u4f60\u6240\u5904\u7684\u7ea6\u675f\u3002</li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/05.%20programming%20languages/#_2","title":"\u8bed\u8a00\u8303\u5f0f","text":"<ul> <li> <p>\u8303\u5f0f\u662f\u4e00\u79cd\u7f16\u7a0b\u98ce\u683c\uff1a\u4e00\u5957\u6307\u5bfc\u4f60\u5982\u4f55\u7ec4\u7ec7\u4ee3\u7801\u548c\u601d\u8003\u95ee\u9898\u7684\u539f\u5219\u3002</p> </li> <li> <p>\u547d\u4ee4\u5f0f\u7f16\u7a0b\u5c06\u8ba1\u7b97\u63cf\u8ff0\u4e3a\u4e00\u7cfb\u5217\u6539\u53d8\u72b6\u6001\u7684\u547d\u4ee4\u3002\"\u8bbex\u4e3a5\u3002\u5c063\u52a0\u5230x\u3002\u5982\u679cx &gt; 7\uff0c\u6253\u5370\u5b83\u3002\"C\u3001Python\u548cJava\u672c\u8d28\u4e0a\u662f\u547d\u4ee4\u5f0f\u7684\u3002\u5fc3\u667a\u6a21\u578b\u662f\u4e00\u4e2a\u5e26\u6709\u5185\u5b58\u7684\u673a\u5668\uff0c\u4f60\u9010\u6b65\u4fee\u6539\u5b83\u3002</p> </li> <li> <p>\u9762\u5411\u5bf9\u8c61\uff08OOP\uff09\u7f16\u7a0b\u56f4\u7ed5\u5bf9\u8c61\u7ec4\u7ec7\u4ee3\u7801\uff1a\u6570\u636e\uff08\u5c5e\u6027\uff09\u548c\u884c\u4e3a\uff08\u65b9\u6cd5\uff09\u7684\u6346\u7ed1\u3002\u5bf9\u8c61\u901a\u8fc7\u76f8\u4e92\u53d1\u9001\u6d88\u606f\u6765\u4ea4\u4e92\u3002\u5173\u952e\u601d\u60f3\u662f\u5c01\u88c5\uff08\u5c06\u5185\u90e8\u72b6\u6001\u9690\u85cf\u5728\u516c\u5171\u63a5\u53e3\u4e4b\u540e\uff09\u3001\u7ee7\u627f\uff08\u901a\u8fc7\u6269\u5c55\u73b0\u6709\u7c7b\u521b\u5efa\u65b0\u7c7b\uff09\u548c\u591a\u6001\uff08\u901a\u8fc7\u5171\u4eab\u63a5\u53e3\u7edf\u4e00\u5904\u7406\u4e0d\u540c\u7c7b\u578b\uff09\u3002Java\u3001C++\u548cPython\u652f\u6301OOP\u3002</p> </li> <li> <p>\u51fd\u6570\u5f0f\u7f16\u7a0b\uff08FP\uff09\u5c06\u8ba1\u7b97\u89c6\u4e3a\u6570\u5b66\u51fd\u6570\u7684\u6c42\u503c\u3002\u6838\u5fc3\u539f\u5219\uff1a\u4e0d\u53ef\u53d8\u6027\uff08\u6570\u636e\u4e00\u65e6\u521b\u5efa\u5c31\u4e0d\u6539\u53d8\uff09\u3001\u7eaf\u51fd\u6570\uff08\u8f93\u51fa\u4ec5\u53d6\u51b3\u4e8e\u8f93\u5165\uff0c\u65e0\u526f\u4f5c\u7528\uff09\u548c\u4e00\u7b49\u51fd\u6570\uff08\u51fd\u6570\u662f\u53ef\u4ee5\u4f5c\u4e3a\u53c2\u6570\u4f20\u9012\u3001\u4ece\u5176\u4ed6\u51fd\u6570\u8fd4\u56de\u548c\u5b58\u50a8\u5728\u53d8\u91cf\u4e2d\u7684\u503c\uff09\u3002Haskell\u662f\u7eaf\u51fd\u6570\u5f0f\u7684\u3002Python\u3001JavaScript\u548cScala\u652f\u6301\u51fd\u6570\u5f0f\u98ce\u683c\u3002</p> </li> <li> <p>\u7eaf\u51fd\u6570\u6613\u4e8e\u63a8\u7406\u3001\u6d4b\u8bd5\u548c\u5e76\u884c\u5316\uff08\u6ca1\u6709\u5171\u4eab\u7684\u53ef\u53d8\u72b6\u6001\u610f\u5473\u7740\u6ca1\u6709\u7ade\u6001\u6761\u4ef6\uff09\u3002\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48\u51fd\u6570\u5f0f\u601d\u60f3\u8d8a\u6765\u8d8a\u591a\u5730\u7528\u4e8e\u5206\u5e03\u5f0f\u7cfb\u7edf\u548c\u6570\u636e\u7ba1\u9053\u3002JAX\uff08\u672c\u4e66\u4e2d\u4e00\u76f4\u5728\u4f7f\u7528\uff09\u662f\u51fd\u6570\u5f0f\u7684\uff1a<code>jax.grad</code> \u4e4b\u6240\u4ee5\u6709\u6548\uff0c\u662f\u56e0\u4e3aJAX\u51fd\u6570\u662f\u7eaf\u51fd\u6570\u3002</p> </li> <li> <p>\u903b\u8f91\u7f16\u7a0b\u63cf\u8ff0\u4ec0\u4e48\u5e94\u8be5\u4e3a\u771f\uff0c\u800c\u4e0d\u662f\u5982\u4f55\u8ba1\u7b97\u5b83\u3002\u4f60\u9648\u8ff0\u4e8b\u5b9e\u548c\u89c4\u5219\uff0c\u8fd0\u884c\u65f6\u627e\u5230\u89e3\u3002Prolog\u662f\u7ecf\u5178\u4f8b\u5b50\uff1a\u7ed9\u5b9a\"\u82cf\u683c\u62c9\u5e95\u662f\u4eba\"\u548c\"\u6240\u6709\u4eba\u90fd\u662f\u5fc5\u6b7b\u7684\"\uff0c\u5f15\u64ce\u63a8\u5bfc\u51fa\"\u82cf\u683c\u62c9\u5e95\u662f\u5fc5\u6b7b\u7684\u3002\"\u903b\u8f91\u7f16\u7a0b\u7528\u4e8eAI\u77e5\u8bc6\u5e93\u548c\u7c7b\u578b\u68c0\u67e5\u3002</p> </li> <li> <p>\u5927\u591a\u6570\u73b0\u4ee3\u8bed\u8a00\u662f\u591a\u8303\u5f0f\u7684\uff1aPython\u652f\u6301\u547d\u4ee4\u5f0f\u3001OOP\u548c\u51fd\u6570\u5f0f\u98ce\u683c\u3002Rust\u652f\u6301\u547d\u4ee4\u5f0f\u548c\u51fd\u6570\u5f0f\u3002\u8303\u5f0f\u662f\u4e00\u79cd\u5de5\u5177\uff0c\u4e0d\u662f\u4fe1\u4ef0\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/05.%20programming%20languages/#_3","title":"\u7c7b\u578b\u7cfb\u7edf","text":"<ul> <li> <p>\u7c7b\u578b\u5bf9\u503c\u8fdb\u884c\u5206\u7c7b\uff0c\u5e76\u786e\u5b9a\u54ea\u4e9b\u64cd\u4f5c\u662f\u6709\u6548\u7684\u3002\u6574\u65703\u548c\u5b57\u7b26\u4e32\"3\"\u662f\u4e0d\u540c\u7684\u7c7b\u578b\uff1a\u4f60\u53ef\u4ee5\u5bf9\u6574\u6570\u8fdb\u884c\u52a0\u6cd5\uff0c\u4f46\u4e0d\u80fd\u5bf9\u5b57\u7b26\u4e32\uff08\u597d\u5427\uff0c\u4f60\u53ef\u4ee5\u62fc\u63a5\u5b57\u7b26\u4e32\uff0c\u4f46\u90a3\u662f\u4e0d\u540c\u7684\u64cd\u4f5c\uff09\u3002</p> </li> <li> <p>\u9759\u6001\u7c7b\u578b\uff1a\u7c7b\u578b\u5728\u7f16\u8bd1\u65f6\u68c0\u67e5\uff0c\u5728\u7a0b\u5e8f\u8fd0\u884c\u4e4b\u524d\u3002\u7c7b\u578b\u9519\u8bef\u53ca\u65e9\u88ab\u53d1\u73b0\u3002C\u3001Java\u3001Rust\u548cGo\u662f\u9759\u6001\u7c7b\u578b\u7684\u3002\u4f60\u5fc5\u987b\u58f0\u660e\u7c7b\u578b\uff08\u6216\u8005\u7f16\u8bd1\u5668\u63a8\u65ad\u5b83\u4eec\uff09\uff1a</p> </li> </ul> <pre><code>let x: i32 = 5;     // Rust\uff1ax\u662f\u4e00\u4e2a32\u4f4d\u6574\u6570\nlet y: f64 = 3.14;  // y\u662f\u4e00\u4e2a64\u4f4d\u6d6e\u70b9\u6570\n// let z = x + y;    // \u7f16\u8bd1\u9519\u8bef\uff1a\u4e0d\u80fd\u52a0 i32 \u548c f64\n</code></pre> <ul> <li>\u52a8\u6001\u7c7b\u578b\uff1a\u7c7b\u578b\u5728\u8fd0\u884c\u65f6\u68c0\u67e5\uff0c\u5f53\u64cd\u4f5c\u5b9e\u9645\u6267\u884c\u65f6\u3002\u66f4\u7075\u6d3b\uff0c\u4f46\u7c7b\u578b\u9519\u8bef\u53ea\u6709\u5728\u4ee3\u7801\u8fd0\u884c\u65f6\u624d\u66b4\u9732\u3002Python\u3001JavaScript\u548cRuby\u662f\u52a8\u6001\u7c7b\u578b\u7684\uff1a</li> </ul> <pre><code>x = 5       # x\u662f\u4e00\u4e2aint\uff08\u76ee\u524d\uff09\nx = \"hello\" # \u73b0\u5728x\u662f\u4e00\u4e2a\u5b57\u7b26\u4e32\u2014\u2014\u6ca1\u6709\u9519\u8bef\n</code></pre> <ul> <li> <p>\u5f3a\u7c7b\u578b\uff1a\u8bed\u8a00\u963b\u6b62\u9690\u5f0f\u7c7b\u578b\u8f6c\u6362\u3002Python\u662f\u5f3a\u7c7b\u578b\u7684\uff1a<code>\"3\" + 5</code> \u5f15\u53d1TypeError\u3002\u5f31\u7c7b\u578b\uff1a\u8bed\u8a00\u9759\u9ed8\u5730\u8f6c\u6362\u7c7b\u578b\u3002JavaScript\u662f\u5f31\u7c7b\u578b\u7684\uff1a<code>\"3\" + 5</code> \u5f97\u5230 <code>\"35\"</code>\uff08\u6570\u5b57\u88ab\u5f3a\u5236\u8f6c\u6362\u4e3a\u5b57\u7b26\u4e32\uff09\u3002C\u662f\u5f31\u7c7b\u578b\u7684\uff1a\u4f60\u53ef\u4ee5\u5c06\u6307\u9488\u5f3a\u5236\u8f6c\u6362\u4e3a\u6574\u6570\u3002</p> </li> <li> <p>\u7c7b\u578b\u63a8\u65ad\u8ba9\u7f16\u8bd1\u5668\u63a8\u5bfc\u7c7b\u578b\u800c\u65e0\u9700\u663e\u5f0f\u6ce8\u89e3\uff1a</p> </li> </ul> <pre><code>let x = 5;        // \u7f16\u8bd1\u5668\u63a8\u65ad\uff1ai32\nlet y = x + 3.0;  // \u7f16\u8bd1\u9519\u8bef\uff1a\u6df7\u5408\u7c7b\u578b\uff0c\u5373\u4f7f\u6709\u63a8\u65ad\n</code></pre> <ul> <li>\u6cdb\u578b\uff08\u53c2\u6570\u5316\u591a\u6001\uff09\u8ba9\u4f60\u7f16\u5199\u9002\u7528\u4e8e\u4efb\u4f55\u7c7b\u578b\u7684\u4ee3\u7801\uff1a</li> </ul> <pre><code>fn largest&lt;T: PartialOrd&gt;(list: &amp;[T]) -&gt; &amp;T {\n    let mut max = &amp;list[0];\n    for item in &amp;list[1..] {\n        if item &gt; max { max = item; }\n    }\n    max\n}\n// \u9002\u7528\u4e8e\u6574\u6570\u3001\u6d6e\u70b9\u6570\u3001\u5b57\u7b26\u4e32\u2014\u2014\u4efb\u4f55\u652f\u6301\u6bd4\u8f83\u7684\u7c7b\u578b\n</code></pre> <ul> <li>\u5bf9\u4e8eML\uff1aPython\u7684\u52a8\u6001\u7c7b\u578b\u4f7f\u5b9e\u9a8c\u5feb\u901f\uff0c\u4f46\u9690\u85cf\u4e86\u9519\u8bef\u3002\u751f\u4ea7ML\u7cfb\u7edf\u8d8a\u6765\u8d8a\u591a\u5730\u4f7f\u7528\u7c7b\u578b\u63d0\u793a\uff08<code>def train(model: nn.Module, lr: float) -&gt; float</code>\uff09\u548c\u9759\u6001\u5206\u6790\u5de5\u5177\uff08mypy\uff09\u4ee5\u5728\u90e8\u7f72\u524d\u6355\u83b7\u9519\u8bef\u3002PyTorch\u548cJAX\u4f7f\u7528Python\u4ee5\u83b7\u5f97\u7075\u6d3b\u6027\uff1bTensorRT\u548cONNX Runtime\u4f7f\u7528C++\u4ee5\u83b7\u5f97\u6027\u80fd\u3002</li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/05.%20programming%20languages/#_4","title":"\u5185\u5b58\u7ba1\u7406","text":"<ul> <li>\u6bcf\u4e2a\u7a0b\u5e8f\u5206\u914d\u548c\u91ca\u653e\u5185\u5b58\u3002\u5982\u4f55\u7ba1\u7406\u8fd9\u662f\u6700\u5177\u5f71\u54cd\u529b\u7684\u8bed\u8a00\u8bbe\u8ba1\u51b3\u7b56\u4e4b\u4e00\u3002</li> </ul> <ul> <li> <p>\u5806\u6808\u5b58\u50a8\u5c40\u90e8\u53d8\u91cf\u548c\u51fd\u6570\u8c03\u7528\u5e27\u3002\u5206\u914d\u5f88\u7b80\u5355\uff08\u79fb\u52a8\u6808\u6307\u9488\uff09\uff0c\u91ca\u653e\u662f\u81ea\u52a8\u7684\uff08\u51fd\u6570\u8fd4\u56de\u65f6\u5f39\u51fa\u5e27\uff09\u3002\u5806\u6808\u8bbf\u95ee\u5f88\u5feb\uff0c\u56e0\u4e3a\u5b83\u603b\u5728\u7f13\u5b58\u4e2d\u3002\u4f46\u5806\u6808\u6709\u56fa\u5b9a\u5927\u5c0f\uff08\u901a\u5e381-8 MB\uff09\uff0c\u4e14\u4ec5\u652f\u6301LIFO\uff08\u540e\u8fdb\u5148\u51fa\uff09\u5206\u914d\u3002</p> </li> <li> <p>\u5806\u5b58\u50a8\u52a8\u6001\u5206\u914d\u7684\u6570\u636e\uff08\u7f16\u8bd1\u65f6\u5927\u5c0f\u672a\u77e5\u7684\u5bf9\u8c61\u3001\u6570\u7ec4\u3001\u5b57\u7b26\u4e32\uff09\u3002\u5806\u5206\u914d\u8f83\u6162\uff08\u9700\u8981\u627e\u5230\u4e00\u4e2a\u7a7a\u95f2\u5757\uff09\uff0c\u9700\u8981\u663e\u5f0f\u6216\u81ea\u52a8\u91ca\u653e\u3002\u5806\u53ef\u4ee5\u589e\u957f\u5230\u586b\u6ee1\u53ef\u7528\u5185\u5b58\u3002</p> </li> <li> <p>\u624b\u52a8\u5185\u5b58\u7ba1\u7406\uff08C\u3001C++\uff09\uff1a\u7a0b\u5e8f\u5458\u663e\u5f0f\u5206\u914d\uff08<code>malloc</code>\uff09\u548c\u91ca\u653e\uff08<code>free</code>\uff09\u5806\u5185\u5b58\u3002\u6700\u5927\u63a7\u5236\u548c\u6027\u80fd\uff0c\u4f46\u6781\u6613\u51fa\u9519\uff1a</p> <ul> <li>\u91ca\u653e\u540e\u4f7f\u7528\uff1a\u8bbf\u95ee\u5df2\u88ab\u91ca\u653e\u7684\u5185\u5b58\u3002\u5bfc\u81f4\u5d29\u6e83\u6216\u5b89\u5168\u6f0f\u6d1e\u3002</li> <li>\u53cc\u91cd\u91ca\u653e\uff1a\u91ca\u653e\u540c\u4e00\u5185\u5b58\u4e24\u6b21\u3002\u7834\u574f\u5206\u914d\u5668\u7684\u5185\u90e8\u6570\u636e\u7ed3\u6784\u3002</li> <li>\u5185\u5b58\u6cc4\u6f0f\uff1a\u5206\u914d\u4e86\u5185\u5b58\u4f46\u4ece\u672a\u91ca\u653e\u3002\u7a0b\u5e8f\u6162\u6162\u6d88\u8017\u6240\u6709\u53ef\u7528RAM\u3002</li> </ul> </li> <li> <p>\u5783\u573e\u56de\u6536\uff08GC\uff09\uff1a\u8fd0\u884c\u65f6\u81ea\u52a8\u68c0\u6d4b\u5e76\u91ca\u653e\u4e0d\u518d\u53ef\u8fbe\u7684\u5185\u5b58\u3002\u7a0b\u5e8f\u5458\u4ece\u4e0d\u8c03\u7528 <code>free</code>\u3002</p> <ul> <li> <p>\u8ddf\u8e2aGC\uff08Java\u3001Go\u3001Python\u7684\u5faa\u73af\u6536\u96c6\u5668\uff09\uff1a\u5b9a\u671f\u4ece\"\u6839\"\uff08\u5806\u6808\u53d8\u91cf\u3001\u5168\u5c40\u53d8\u91cf\uff09\u904d\u5386\u6240\u6709\u53ef\u8fbe\u5bf9\u8c61\uff0c\u91ca\u653e\u4e0d\u53ef\u8fbe\u5bf9\u8c61\u3002\u7b80\u5355\u4f46\u5bfc\u81f4GC\u6682\u505c\uff1a\u6536\u96c6\u5668\u8fd0\u884c\u65f6\u7a0b\u5e8f\u505c\u6b62\u3002\u73b0\u4ee3\u6536\u96c6\u5668\uff08Go\u7684\u5e76\u53d1GC\u3001Java\u7684ZGC\uff09\u5c06\u6682\u505c\u65f6\u95f4\u6700\u5c0f\u5316\u5230\u4e9a\u6beb\u79d2\u7ea7\u3002</p> </li> <li> <p>\u5f15\u7528\u8ba1\u6570\uff08Python\u7684\u4e3b\u8981\u673a\u5236\u3001Swift\u3001Objective-C\uff09\uff1a\u6bcf\u4e2a\u5bf9\u8c61\u8ddf\u8e2a\u6709\u591a\u5c11\u5f15\u7528\u6307\u5411\u5b83\u3002\u5f53\u8ba1\u6570\u964d\u52300\u65f6\uff0c\u5bf9\u8c61\u88ab\u7acb\u5373\u91ca\u653e\u3002\u65e0\u6682\u505c\uff0c\u4f46\u65e0\u6cd5\u5904\u7406\u5faa\u73af\uff08A\u5f15\u7528B\uff0cB\u5f15\u7528A\uff0c\u4e24\u8005\u8ba1\u6570\u90fd &gt; 0 \u4f46\u90fd\u4e0d\u53ef\u8fbe\uff09\u3002Python\u4f7f\u7528\u5355\u72ec\u7684\u5faa\u73af\u68c0\u6d4b\u5668\u6765\u5904\u7406\u6b64\u95ee\u9898\u3002</p> </li> </ul> </li> <li> <p>\u6240\u6709\u6743\uff08Rust\uff09\uff1a\u7f16\u8bd1\u5668\u5728\u7f16\u8bd1\u65f6\u5f3a\u5236\u5b9e\u65bd\u5185\u5b58\u5b89\u5168\u89c4\u5219\uff0c\u96f6\u8fd0\u884c\u65f6\u5f00\u9500\u3002</p> <ul> <li>\u6bcf\u4e2a\u503c\u6709\u4e14\u4ec5\u6709\u4e00\u4e2a\u6240\u6709\u8005\u3002\u5f53\u6240\u6709\u8005\u8d85\u51fa\u4f5c\u7528\u57df\u65f6\uff0c\u8be5\u503c\u88ab\u4e22\u5f03\uff08\u91ca\u653e\uff09\u3002</li> <li>\u503c\u53ef\u4ee5\u88ab\u501f\u7528\uff08\u5f15\u7528\uff09\uff0c\u4f46\u7f16\u8bd1\u5668\u5f3a\u5236\uff1a\u8981\u4e48\u4e00\u4e2a\u53ef\u53d8\u5f15\u7528\uff0c\u8981\u4e48\u4efb\u610f\u6570\u91cf\u7684\u4e0d\u53ef\u53d8\u5f15\u7528\uff0c\u6c38\u8fdc\u4e0d\u80fd\u540c\u65f6\u5b58\u5728\u3002</li> <li>\u8fd9\u963b\u6b62\u4e86\u91ca\u653e\u540e\u4f7f\u7528\u3001\u53cc\u91cd\u91ca\u653e\u3001\u6570\u636e\u7ade\u4e89\u548c\u60ac\u5782\u6307\u9488\uff0c\u5168\u90e8\u5728\u7f16\u8bd1\u65f6\u5b8c\u6210\u3002\u65e0\u9700GC\uff0c\u65e0\u8fd0\u884c\u65f6\u5f00\u9500\u3002</li> </ul> </li> <li> <p>\u501f\u7528\u68c0\u67e5\u5668\u662fRust\u7684\u6740\u624b\u7ea7\u7279\u6027\uff0c\u4e5f\u662f\u5176\u6700\u9661\u5ced\u7684\u5b66\u4e60\u66f2\u7ebf\u3002\u5b83\u4fdd\u8bc1\u4e86\u5185\u5b58\u5b89\u5168\u548c\u7ebf\u7a0b\u5b89\u5168\uff0c\u4e14\u6ca1\u6709\u5783\u573e\u56de\u6536\uff0c\u8fd9\u5c31\u662fRust\u8d8a\u6765\u8d8a\u591a\u5730\u7528\u4e8e\u6027\u80fd\u5173\u952e\u7cfb\u7edf\uff08OS\u5185\u6838\u3001\u6e38\u620f\u5f15\u64ce\u3001ML\u63a8\u7406\u8fd0\u884c\u65f6\u5982Candle\u548cBurn\uff09\u7684\u539f\u56e0\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/05.%20programming%20languages/#_5","title":"\u7f16\u8bd1\u6d41\u6c34\u7ebf","text":"<ul> <li>\u7f16\u8bd1\u5668\u5728\u7a0b\u5e8f\u8fd0\u884c\u4e4b\u524d\u5c06\u6e90\u4ee3\u7801\u8f6c\u6362\u4e3a\u673a\u5668\u7801\uff08\u6216\u5176\u4ed6\u76ee\u6807\u8bed\u8a00\uff09\u3002\u8be5\u6d41\u6c34\u7ebf\u6709\u51e0\u4e2a\u9636\u6bb5\uff1a</li> </ul> <ol> <li> <p>\u8bcd\u6cd5\u5206\u6790\uff08\u5206\u8bcd\uff09\uff1a\u5c06\u6e90\u6587\u672c\u8f6c\u6362\u4e3a\u4ee4\u724c\u6d41\u3002<code>x = 3 + y</code> \u53d8\u4e3a <code>[IDENT(\"x\"), EQUALS, INT(3), PLUS, IDENT(\"y\")]</code>\u3002\u8bcd\u6cd5\u5206\u6790\u5668\u53bb\u9664\u7a7a\u767d\u548c\u6ce8\u91ca\u3002</p> </li> <li> <p>\u8bed\u6cd5\u5206\u6790\uff1a\u4ece\u4ee4\u724c\u6d41\u6784\u5efa\u62bd\u8c61\u8bed\u6cd5\u6811\uff08AST\uff09\u3002AST\u8868\u793a\u7a0b\u5e8f\u7684\u5c42\u6b21\u7ed3\u6784\u3002<code>3 + y * 2</code> \u89e3\u6790\u4e3a <code>Add(3, Mul(y, 2))</code>\uff08\u4e58\u6cd5\u4f18\u5148\u7ea7\u66f4\u9ad8\uff09\u3002\u89e3\u6790\u5668\u68c0\u67e5\u8bed\u6cd5\uff1a\u62ec\u53f7\u4e0d\u5339\u914d\u548c\u7f3a\u5c11\u5206\u53f7\u5728\u6b64\u88ab\u6355\u83b7\u3002</p> </li> <li> <p>\u8bed\u4e49\u5206\u6790\uff1a\u68c0\u67e5\u7c7b\u578b\u3001\u89e3\u6790\u53d8\u91cf\u540d\u3001\u9a8c\u8bc1\u51fd\u6570\u8c03\u7528\u53c2\u6570\u662f\u5426\u6b63\u786e\u3002\u9759\u6001\u7c7b\u578b\u68c0\u67e5\u5728\u6b64\u53d1\u751f\u3002\u8f93\u51fa\u662f\u5e26\u7c7b\u578b\u6ce8\u89e3\u7684AST\u3002</p> </li> <li> <p>\u4f18\u5316\uff1a\u5728\u4e0d\u6539\u53d8\u884c\u4e3a\u7684\u60c5\u51b5\u4e0b\u8f6c\u6362\u7a0b\u5e8f\u4ee5\u4f7f\u5176\u8fd0\u884c\u66f4\u5feb\u3002\u5e38\u89c1\u4f18\u5316\uff1a</p> <ul> <li>\u5e38\u91cf\u6298\u53e0\uff1a\u5728\u7f16\u8bd1\u65f6\u8ba1\u7b97 <code>3 + 5</code>\uff0c\u66ff\u6362\u4e3a <code>8</code>\u3002</li> <li>\u6b7b\u4ee3\u7801\u6d88\u9664\uff1a\u79fb\u9664\u6c38\u8fdc\u65e0\u6cd5\u6267\u884c\u7684\u4ee3\u7801\u3002</li> <li>\u5faa\u73af\u5c55\u5f00\uff1a\u7528\u91cd\u590d\u7684\u5185\u8054\u4ee3\u7801\u66ff\u6362\u5faa\u73af\u4ee5\u51cf\u5c11\u5206\u652f\u5f00\u9500\u3002</li> <li>\u5185\u8054\uff1a\u7528\u51fd\u6570\u4f53\u66ff\u6362\u51fd\u6570\u8c03\u7528\uff0c\u6d88\u9664\u8c03\u7528\u5f00\u9500\u3002</li> </ul> </li> <li> <p>\u4ee3\u7801\u751f\u6210\uff1a\u5c06\u4f18\u5316\u540e\u7684\u8868\u793a\u8f6c\u6362\u4e3a\u76ee\u6807\u673a\u5668\u7801\uff08x86\u3001ARM\uff09\u6216\u4e2d\u95f4\u8868\u793a\u3002</p> </li> <li> <p>LLVM\u662f\u4e3b\u6d41\u7684\u7f16\u8bd1\u5668\u57fa\u7840\u8bbe\u65bd\u3002\u5b83\u63d0\u4f9b\u4e86\u4e00\u4e2a\u901a\u7528\u4e2d\u95f4\u8868\u793a\uff08LLVM IR\uff09\uff0c\u8bb8\u591a\u8bed\u8a00\u53ef\u4ee5\u7f16\u8bd1\u5230\u8be5\u8868\u793a\u4e0a\u3002LLVM\u7684\u4f18\u5316\u5668\u5728\u8fd9\u4e2aIR\u4e0a\u5de5\u4f5c\uff0c\u5176\u540e\u7aef\u4e3a\u8bb8\u591a\u76ee\u6807\u751f\u6210\u673a\u5668\u7801\u3002Clang\uff08C/C++\uff09\u3001Rust\u3001Swift\u3001Julia\u548c\u8bb8\u591a\u5176\u4ed6\u8bed\u8a00\u4f7f\u7528LLVM\u3002\u8fd9\u610f\u5473\u7740LLVM\u4f18\u5316\u5668\u7684\u6539\u8fdb\u540c\u65f6\u60e0\u53ca\u6240\u6709\u8fd9\u4e9b\u8bed\u8a00\u3002</p> </li> </ol>"},{"location":"chapter%2013%3A%20computing%20and%20OS/05.%20programming%20languages/#jit","title":"\u89e3\u91ca\u4e0eJIT\u7f16\u8bd1","text":"<ul> <li> <p>\u89e3\u91ca\u5668\u9010\u884c\uff08\u6216\u9010\u8bed\u53e5\uff09\u6267\u884c\u7a0b\u5e8f\u800c\u4e0d\u4ea7\u751f\u673a\u5668\u7801\u3002\u8fd9\u4f7f\u5f97\u542f\u52a8\u5feb\u901f\u4e14\u5f00\u53d1\u4ea4\u4e92\u5f0f\uff0c\u4f46\u6267\u884c\u8f83\u6162\uff08\u6bcf\u884c\u6bcf\u6b21\u8fd0\u884c\u65f6\u90fd\u8981\u91cd\u65b0\u5206\u6790\uff09\u3002</p> </li> <li> <p>\u5927\u591a\u6570\u89e3\u91ca\u578b\u8bed\u8a00\u5b9e\u9645\u4e0a\u7f16\u8bd1\u4e3a\u5b57\u8282\u7801\uff1a\u4e00\u79cd\u6bd4\u6e90\u4ee3\u7801\u66f4\u7b80\u5355\u4f46\u4e0d\u7279\u5b9a\u4e8e\u673a\u5668\u7684\u4e2d\u95f4\u8868\u793a\u3002\u5b57\u8282\u7801\u5728\u865a\u62df\u673a\uff08VM\uff09\u4e0a\u8fd0\u884c\u3002</p> <ul> <li> <p>CPython\uff08\u6807\u51c6Python\u5b9e\u73b0\uff09\u5c06Python\u6e90\u4ee3\u7801\u7f16\u8bd1\u4e3a\u5b57\u8282\u7801\uff08<code>.pyc</code> \u6587\u4ef6\uff09\uff0c\u7531CPython VM\u6267\u884c\u3002VM\u9010\u6761\u6307\u4ee4\u89e3\u91ca\u5b57\u8282\u7801\u3002\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48Python\u5728\u8ba1\u7b97\u5bc6\u96c6\u578b\u4ee3\u7801\u4e0a\u6bd4C\u6162\u7ea6~100\u500d\u3002</p> </li> <li> <p>JVM\uff08Java\u865a\u62df\u673a\uff09\uff1aJava\u7f16\u8bd1\u4e3aJVM\u5b57\u8282\u7801\uff08<code>.class</code> \u6587\u4ef6\uff09\u3002JVM\u6700\u521d\u89e3\u91ca\u5b57\u8282\u7801\uff0c\u7136\u540eJIT\u7f16\u8bd1\u9891\u7e41\u6267\u884c\u7684\u4ee3\u7801\u8def\u5f84\uff08\"\u70ed\u70b9\"\uff09\u4e3a\u672c\u673a\u673a\u5668\u7801\u3002\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48Java\u542f\u52a8\u6bd4C\u6162\uff08\u89e3\u91ca\u5f00\u9500\uff09\uff0c\u4f46\u5bf9\u4e8e\u957f\u65f6\u95f4\u8fd0\u884c\u7684\u7a0b\u5e8f\uff08JIT\u4f18\u5316\u7684\u70ed\u8def\u5f84\uff09\u63a5\u8fd1C\u7684\u901f\u5ea6\u3002</p> </li> </ul> </li> <li> <p>JIT\uff08\u5373\u65f6\uff09\u7f16\u8bd1\u5728\u8fd0\u884c\u65f6\u5c06\u4ee3\u7801\u7f16\u8bd1\u4e3a\u673a\u5668\u7801\uff0c\u4f7f\u7528\u4ec5\u5728\u6267\u884c\u671f\u95f4\u53ef\u7528\u7684\u4fe1\u606f\u3002JIT\u53ef\u4ee5\u6839\u636e\u5b9e\u9645\u8fd0\u884c\u65f6\u6570\u636e\u8fdb\u884c\u4f18\u5316\uff1a\u5982\u679c\u4e00\u4e2a\u51fd\u6570\u603b\u662f\u7528\u6574\u6570\u53c2\u6570\u8c03\u7528\uff0cJIT\u751f\u6210\u4e13\u95e8\u5316\u7684\u4ec5\u6574\u6570\u673a\u5668\u7801\uff0c\u8df3\u8fc7\u7c7b\u578b\u68c0\u67e5\u3002</p> </li> <li> <p>PyPy\u662f\u53e6\u4e00\u4e2a\u5e26\u6709JIT\u7f16\u8bd1\u5668\u7684Python\u5b9e\u73b0\u3002\u5b83\u901a\u8fc7\u5c06\u70ed\u70b9\u5faa\u73afJIT\u7f16\u8bd1\u4e3a\u673a\u5668\u7801\uff0c\u4f7f\u5927\u591a\u6570Python\u4ee3\u7801\u8fd0\u884c\u901f\u5ea6\u6bd4CPython\u5feb5-10\u500d\u3002\u7136\u800c\uff0c\u5b83\u4e0eC\u6269\u5c55\u6a21\u5757\uff08NumPy\u3001PyTorch\uff09\u7684\u517c\u5bb9\u6027\u6709\u9650\uff0c\u8fd9\u9650\u5236\u4e86\u5b83\u5728ML\u4e2d\u7684\u4f7f\u7528\u3002</p> </li> <li> <p>\u4ece\u89e3\u91ca\u5230\u7f16\u8bd1\u7684\u8303\u56f4\u4e0d\u662f\u4e8c\u5143\u7684\uff1a</p> <ul> <li>\u7eaf\u89e3\u91ca\uff1aBash shell\u811a\u672c\u3002</li> <li>\u5b57\u8282\u7801\u89e3\u91ca\uff1aCPython\u3002</li> <li>\u5b57\u8282\u7801 + JIT\uff1aJVM\u3001.NET CLR\u3001LuaJIT\u3001PyPy\u3002</li> <li>\u63d0\u524d\uff08AOT\uff09\u7f16\u8bd1\uff1aC\u3001C++\u3001Rust\u3001Go\u3002</li> <li>AOT + \u8fd0\u884c\u65f6\u4ee3\u7801\u751f\u6210\uff1aJAX\u7684 <code>jax.jit</code> \u5728\u9996\u6b21\u8c03\u7528\u65f6\u7f16\u8bd1Python\u51fd\u6570\u4e3a\u4f18\u5316\u7684XLA\u4ee3\u7801\uff0c\u7136\u540e\u7f13\u5b58\u7f16\u8bd1\u540e\u7684\u7248\u672c\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/05.%20programming%20languages/#_6","title":"\u5173\u952e\u8bed\u8a00\u7279\u6027","text":"<ul> <li>\u95ed\u5305\uff1a\u6355\u83b7\u5176\u5305\u56f4\u4f5c\u7528\u57df\u4e2d\u53d8\u91cf\u7684\u51fd\u6570\u3002\u8be5\u51fd\u6570\"\u95ed\u5408\"\u5176\u5b9a\u4e49\u65f6\u7684\u73af\u5883\uff1a</li> </ul> <pre><code>def make_adder(n):\n    def add(x):\n        return x + n  # n \u4ece\u5305\u56f4\u4f5c\u7528\u57df\u6355\u83b7\n    return add\n\nadd5 = make_adder(5)\nprint(add5(3))  # 8\n</code></pre> <ul> <li> <p>\u95ed\u5305\u662f\u56de\u8c03\u3001\u88c5\u9970\u5668\u548c\u90e8\u5206\u5e94\u7528\u80cc\u540e\u7684\u673a\u5236\u3002\u5b83\u4eec\u5bf9\u51fd\u6570\u5f0f\u7f16\u7a0b\u81f3\u5173\u91cd\u8981\u3002</p> </li> <li> <p>\u6a21\u5f0f\u5339\u914d\uff1a\u4e00\u79cd\u5f3a\u5927\u7684\u63a7\u5236\u6d41\u673a\u5236\uff0c\u89e3\u6784\u6570\u636e\u5e76\u6839\u636e\u5176\u5f62\u72b6\u8fdb\u884c\u5206\u652f\uff1a</p> </li> </ul> <pre><code>match value {\n    Some(x) if x &gt; 0 =&gt; println!(\"Positive: {}\", x),\n    Some(0)           =&gt; println!(\"Zero\"),\n    Some(x)           =&gt; println!(\"Negative: {}\", x),\n    None              =&gt; println!(\"Nothing\"),\n}\n</code></pre> <ul> <li> <p>\u6a21\u5f0f\u5339\u914d\u6bd4if-else\u94fe\u66f4\u5177\u8868\u73b0\u529b\uff1a\u5b83\u68c0\u67e5\u6570\u636e\u7684\u7ed3\u6784\uff08\u662fSome\u8fd8\u662fNone\uff1f\u5b83\u5305\u542b\u7684\u503c\u662f\u5426\u7b26\u5408\u67d0\u4e2a\u6761\u4ef6\uff1f\uff09\uff0c\u800c\u4e0d\u4ec5\u4ec5\u662f\u76f8\u7b49\u6027\u3002Python\u57283.10\u4e2d\u589e\u52a0\u4e86\u7ed3\u6784\u6a21\u5f0f\u5339\u914d\uff08<code>match</code>/<code>case</code>\uff09\u3002</p> </li> <li> <p>\u4ee3\u6570\u6570\u636e\u7c7b\u578b\uff08ADT\uff09\uff1a\u53ef\u4ee5\u662f\u591a\u4e2a\u53d8\u4f53\u4e4b\u4e00\u7684\u7c7b\u578b\uff0c\u6bcf\u4e2a\u53d8\u4f53\u643a\u5e26\u4e0d\u540c\u7684\u6570\u636e\u3002<code>Result</code> \u7c7b\u578b\u8981\u4e48\u662f <code>Ok(value)</code> \u8981\u4e48\u662f <code>Err(error)</code>\u3002<code>Tree</code> \u8981\u4e48\u662f <code>Leaf(value)</code> \u8981\u4e48\u662f <code>Node(left, right)</code>\u3002ADT\u7ed3\u5408\u6a21\u5f0f\u5339\u914d\u53ef\u4ee5\u7a77\u5c3d\u5904\u7406\u6240\u6709\u60c5\u51b5\uff0c\u6d88\u9664\u6574\u7c7bbug\uff08\u7a7a\u6307\u9488\u5f02\u5e38\u3001\u672a\u5904\u7406\u7684\u9519\u8bef\u7801\uff09\u3002</p> </li> <li> <p>\u7279\u8d28\u4e0e\u63a5\u53e3\uff1a\u5b9a\u4e49\u4e00\u4e2a\u7c7b\u578b\u5fc5\u987b\u5b9e\u73b0\u7684\u4e00\u7ec4\u65b9\u6cd5\uff0c\u800c\u4e0d\u6307\u5b9a\u5982\u4f55\u5b9e\u73b0\u3002\u8fd9\u5b9e\u73b0\u4e86\u591a\u6001\uff1a\u4e00\u4e2a\u63a5\u53d7\"\u4efb\u4f55\u5b9e\u73b0\u4e86Display\u7279\u8d28\u7684\u7c7b\u578b\"\u7684\u51fd\u6570\u53ef\u4ee5\u5904\u7406\u6574\u6570\u3001\u5b57\u7b26\u4e32\u548c\u81ea\u5b9a\u4e49\u7c7b\u578b\u3002Rust\u4f7f\u7528\u7279\u8d28\uff0cJava\u4f7f\u7528\u63a5\u53e3\uff0cGo\u4f7f\u7528\u9690\u5f0f\u63a5\u53e3\uff0cPython\u4f7f\u7528\u9e2d\u5b50\u7c7b\u578b\uff08\"\u5982\u679c\u5b83\u8d70\u8def\u50cf\u9e2d\u5b50\u2026\u2026\"\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/05.%20programming%20languages/#_7","title":"\u9886\u57df\u7279\u5b9a\u8bed\u8a00","text":"<ul> <li> <p>\u9886\u57df\u7279\u5b9a\u8bed\u8a00\uff08DSL\uff09\u662f\u4e3a\u7279\u5b9a\u95ee\u9898\u57df\u8bbe\u8ba1\u7684\u8bed\u8a00\uff0c\u5728\u8be5\u9886\u57df\u5185\u7528\u901a\u7528\u6027\u6362\u53d6\u8868\u73b0\u529b\u3002</p> </li> <li> <p>SQL\uff1a\u5173\u7cfb\u6570\u636e\u5e93\u7684\u8bed\u8a00\u3002<code>SELECT name FROM users WHERE age &gt; 30</code> \u6bd4\u7b49\u4ef7\u7684\u547d\u4ee4\u5f0f\u5faa\u73af\u53ef\u8bfb\u6027\u5f3a\u5f97\u591a\u4e14\u66f4\u6613\u4f18\u5316\u3002\u6570\u636e\u5e93\u5f15\u64ce\u4f18\u5316\u67e5\u8be2\u6267\u884c\u8ba1\u5212\uff0c\u81ea\u52a8\u9009\u62e9\u8fde\u63a5\u7b56\u7565\u548c\u7d22\u5f15\u4f7f\u7528\u3002</p> </li> <li> <p>\u6b63\u5219\u8868\u8fbe\u5f0f\uff1a\u7528\u4e8e\u6587\u672c\u6a21\u5f0f\u5339\u914d\u7684\u5fae\u578b\u8bed\u8a00\u3002<code>\\d{3}-\\d{4}</code> \u5339\u914d\u50cf\"555-1234\"\u8fd9\u6837\u7684\u7535\u8bdd\u53f7\u7801\u3002\u6b63\u5219\u5f15\u64ce\u5c06\u6a21\u5f0f\u7f16\u8bd1\u4e3a\u6709\u9650\u81ea\u52a8\u673a\u4ee5\u5b9e\u73b0\u9ad8\u6548\u5339\u914d\u3002</p> </li> <li> <p>\u7740\u8272\u5668\u8bed\u8a00\uff08GLSL\u3001HLSL\u3001Metal Shading Language\uff09\uff1a\u5728GPU\u6838\u5fc3\u4e0a\u8fd0\u884c\u7684\u7a0b\u5e8f\uff0c\u7528\u4e8e\u8ba1\u7b97\u50cf\u7d20\u989c\u8272\u3001\u9876\u70b9\u4f4d\u7f6e\u6216\u8ba1\u7b97\u64cd\u4f5c\u3002\u7740\u8272\u5668\u662f\u6d77\u91cf\u5e76\u884c\u7684\uff1a\u6bcf\u6b21\u8c03\u7528\u72ec\u7acb\u5904\u7406\u4e00\u4e2a\u50cf\u7d20\u6216\u4e00\u4e2a\u5143\u7d20\u3002\u8fd9\u4e0eCUDA\u7528\u4e8eML\u8ba1\u7b97\u7684\u6267\u884c\u6a21\u578b\u76f8\u540c\u3002</p> </li> <li> <p>\u5728ML\u4e2d\uff0c\u50cfPyTorch\u548cJAX\u8fd9\u6837\u7684\u6846\u67b6\u672c\u8d28\u4e0a\u662f\u5d4c\u5165\u5728Python\u4e2d\u7684\u5f20\u91cf\u8ba1\u7b97DSL\u3002\u5b83\u4eec\u63d0\u4f9b\u9886\u57df\u7279\u5b9a\u7684\u62bd\u8c61\uff08\u5f20\u91cf\u3001\u81ea\u52a8\u5fae\u5206\u3001\u8bbe\u5907\u653e\u7f6e\uff09\uff0c\u540c\u65f6\u5229\u7528Python\u7684\u751f\u6001\u7cfb\u7edf\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/05.%20programming%20languages/#_8","title":"\u8bed\u8a00\u8bbe\u8ba1\u6743\u8861","text":"<ul> <li> <p>\u6ca1\u6709\u4e00\u79cd\u8bed\u8a00\u5728\u6240\u6709\u65b9\u9762\u90fd\u662f\u6700\u597d\u7684\u3002\u8bbe\u8ba1\u662f\u5173\u4e8e\u9009\u62e9\u54ea\u4e9b\u6743\u8861\uff1a</p> </li> <li> <p>\u6027\u80fd vs \u5b89\u5168\uff1aC\u63d0\u4f9b\u4e86\u539f\u59cb\u901f\u5ea6\u548c\u786c\u4ef6\u63a7\u5236\uff0c\u4f46\u4f1a\u8ba9\u4f60\u7834\u574f\u5185\u5b58\u3002Rust\u4ee5\u7f16\u8bd1\u65f6\u5185\u5b58\u5b89\u5168\u63d0\u4f9b\u76f8\u5f53\u7684\u901f\u5ea6\u3002Java\u63d0\u4f9b\u5185\u5b58\u5b89\u5168\u4f46\u6709\u5783\u573e\u56de\u6536\u5f00\u9500\u3002Python\u63d0\u4f9b\u6700\u5927\u7684\u5b89\u5168\u6027\u548c\u8868\u73b0\u529b\uff0c\u4f46\u6267\u884c\u901f\u5ea6\u6162100\u500d\u3002</p> </li> <li> <p>\u8868\u73b0\u529b vs \u7b80\u6d01\u6027\uff1aHaskell\u7684\u7c7b\u578b\u7cfb\u7edf\u53ef\u4ee5\u8868\u8fbe\u975e\u5e38\u7cbe\u786e\u7684\u7ea6\u675f\uff0c\u4f46\u6709\u9661\u5ced\u7684\u5b66\u4e60\u66f2\u7ebf\u3002Go\u6545\u610f\u7701\u7565\u4e86\u6cdb\u578b\uff08\u76f4\u5230\u6700\u8fd1\uff09\u3001\u7ee7\u627f\u548c\u5f02\u5e38\u4ee5\u8ffd\u6c42\u7b80\u6d01\u6027\u3002Python\u7684\"\u5e94\u8be5\u6709\u4e00\u79cd\u2014\u2014\u6700\u597d\u53ea\u6709\u4e00\u79cd\u2014\u2014\u663e\u800c\u6613\u89c1\u7684\u505a\u6cd5\"\u54f2\u5b66\u4fdd\u6301\u4e86\u8bed\u8a00\u7684\u53ef\u5b66\u4e60\u6027\u3002</p> </li> <li> <p>\u63a7\u5236 vs \u62bd\u8c61\uff1aC/C++\u8ba9\u4f60\u63a7\u5236\u5185\u5b58\u5e03\u5c40\u3001\u7f13\u5b58\u884c\u4e3a\u548c\u786c\u4ef6\u4ea4\u4e92\u3002Python\u9690\u85cf\u4e86\u6240\u6709\u8fd9\u4e9b\u3002\u5bf9\u4e8eML\u8bad\u7ec3\uff08GPU\u8ba1\u7b97\u5360\u4e3b\u5bfc\uff09\uff0cPython\u7684\u5f00\u9500\u53ef\u4ee5\u5ffd\u7565\u4e0d\u8ba1\u3002\u5bf9\u4e8eML\u63a8\u7406\uff08\u6bcf\u5fae\u79d2\u90fd\u5f88\u5173\u952e\uff09\uff0cC++\u6216Rust\u53ef\u80fd\u662f\u5fc5\u8981\u7684\u3002</p> </li> <li> <p>\u7f16\u8bd1\u901f\u5ea6 vs \u8fd0\u884c\u65f6\u901f\u5ea6\uff1aGo\u5728\u51e0\u79d2\u5185\u7f16\u8bd1\u5b8c\u6210\uff08\u7b80\u5355\u7684\u7c7b\u578b\u7cfb\u7edf\uff0c\u6700\u5c0f\u4f18\u5316\uff09\u3002Rust\u9700\u8981\u51e0\u5206\u949f\u7f16\u8bd1\uff08\u590d\u6742\u7684\u7c7b\u578b\u7cfb\u7edf\uff0c\u6fc0\u8fdb\u4f18\u5316\uff09\u3002\u6743\u8861\u7684\u662f\u5f00\u53d1\u8005\u8fed\u4ee3\u901f\u5ea6\u4e0e\u90e8\u7f72\u540e\u7684\u6027\u80fd\u3002</p> </li> <li> <p>ML\u751f\u6001\u7cfb\u7edf\u53cd\u6620\u4e86\u8fd9\u4e9b\u6743\u8861\uff1aPython\u7528\u4e8e\u5b9e\u9a8c\u548c\u8bad\u7ec3\uff08\u8868\u73b0\u529b\u53d6\u80dc\uff09\uff0cC++/CUDA\u7528\u4e8e\u5185\u6838\u548c\u63a8\u7406\uff08\u6027\u80fd\u53d6\u80dc\uff09\uff0cRust\u7528\u4e8e\u57fa\u7840\u8bbe\u65bd\u548c\u5b89\u5168\u5173\u952e\u7cfb\u7edf\uff08\u5b89\u5168\u53d6\u80dc\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2013%3A%20computing%20and%20OS/05.%20programming%20languages/#colab","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216\u7b14\u8bb0\u672c\uff09","text":"<ol> <li> <p>\u63a2\u7d22\u95ed\u5305\u548c\u9ad8\u9636\u51fd\u6570\u3002\u5b9e\u73b0\u4e00\u4e2a\u7b80\u5355\u7684\u51fd\u6570\u5de5\u5382\uff0c\u9a8c\u8bc1\u95ed\u5305\u6355\u83b7\u5176\u73af\u5883\u3002 <pre><code>def make_multiplier(factor):\n    \"\"\"\u8fd4\u56de\u4e00\u4e2a\u5c06\u8f93\u5165\u4e58\u4ee5 factor \u7684\u51fd\u6570\u3002\"\"\"\n    def multiply(x):\n        return x * factor\n    return multiply\n\ndouble = make_multiplier(2)\ntriple = make_multiplier(3)\n\nprint(f\"double(5) = {double(5)}\")  # 10\nprint(f\"triple(5) = {triple(5)}\")  # 15\n\n# \u95ed\u5305\u901a\u8fc7\u5f15\u7528\u6355\u83b7\uff0c\u800c\u4e0d\u662f\u901a\u8fc7\u503c\ndef make_counter():\n    count = [0]  # \u53ef\u53d8\u7684\u5bb9\u5668\u4ee5\u5141\u8bb8\u4fee\u6539\n    def increment():\n        count[0] += 1\n        return count[0]\n    return increment\n\ncounter = make_counter()\nprint(f\"counter() = {counter()}\")  # 1\nprint(f\"counter() = {counter()}\")  # 2\nprint(f\"counter() = {counter()}\")  # 3\n</code></pre></p> </li> <li> <p>\u6bd4\u8f83\u52a8\u6001\u4e0e\u9759\u6001\u7c7b\u578b\u884c\u4e3a\u3002\u5c55\u793aPython\u7684\u52a8\u6001\u7c7b\u578b\u5982\u4f55\u63d0\u4f9b\u7075\u6d3b\u6027\u4f46\u53ef\u80fd\u9690\u85cfbug\u3002 <pre><code>def add(a, b):\n    return a + b\n\n# \u9002\u7528\u4e8e\u4e0d\u540c\u7c7b\u578b\u2014\u2014\u7075\u6d3b\uff01\nprint(add(3, 5))           # 8 (int + int)\nprint(add(\"hello \", \"world\"))  # \"hello world\" (str + str)\nprint(add([1, 2], [3, 4]))    # [1, 2, 3, 4] (list + list)\n\n# \u4f46\u7c7b\u578b\u9519\u8bef\u4ec5\u5728\u8fd0\u884c\u65f6\u66b4\u9732\uff1a\ntry:\n    print(add(\"hello\", 5))  # TypeError\uff01str + int\nexcept TypeError as e:\n    print(f\"\u8fd0\u884c\u65f6\u9519\u8bef\uff1a{e}\")\n    print(\"\u9759\u6001\u7c7b\u578b\u68c0\u67e5\u5668\u4f1a\u5728\u8fd0\u884c\u524d\u6355\u83b7\u6b64\u95ee\u9898\")\n</code></pre></p> </li> <li> <p>\u6d4b\u91cf\u89e3\u91ca\u578bPython\u4e0e\u7f16\u8bd1/JIT\u65b9\u6cd5\u5728\u8ba1\u7b97\u5bc6\u96c6\u578b\u4efb\u52a1\u4e0a\u7684\u6027\u80fd\u5dee\u5f02\u3002 <pre><code>import time\nimport jax\nimport jax.numpy as jnp\n\nn = 1_000_000\n\n# \u7eafPython\u5faa\u73af\uff08\u89e3\u91ca\u578b\uff09\nstart = time.time()\ntotal = 0.0\nfor i in range(n):\n    total += i * i\npython_time = time.time() - start\n\n# JAX\uff08\u901a\u8fc7XLA\u7f16\u8bd1\uff09\n@jax.jit\ndef sum_squares_jax(n):\n    return jnp.sum(jnp.arange(n, dtype=jnp.float32) ** 2)\n\n_ = sum_squares_jax(10)  # \u9884\u70edJIT\nstart = time.time()\nresult = sum_squares_jax(n)\njax_time = time.time() - start\n\nprint(f\"Python loop: {python_time:.4f}s\")\nprint(f\"JAX (JIT):   {jax_time:.6f}s\")\nprint(f\"Speedup:     {python_time / jax_time:.0f}x\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/","title":"\u57fa\u7840\uff1a\u5927O\u8868\u793a\u6cd5\u3001\u9012\u5f52\u3001\u56de\u6eaf\u4e0e\u52a8\u6001\u89c4\u5212","text":"<p>\u5728\u6df1\u5165\u5b66\u4e60\u6570\u636e\u7ed3\u6784\u548c\u7b97\u6cd5\u4e4b\u524d\uff0c\u4f60\u9700\u8981\u638c\u63e1\u56db\u4e2a\u57fa\u7840\u6982\u5ff5\uff1a\u8861\u91cf\u6548\u7387\u7684\u5927O\u8868\u793a\u6cd5\u3001\u5c06\u95ee\u9898\u5206\u89e3\u4e3a\u5b50\u95ee\u9898\u7684\u9012\u5f52\u3001\u5e26\u526a\u679d\u7684\u7a77\u4e3e\u641c\u7d22\u2014\u2014\u56de\u6eaf\uff0c\u4ee5\u53ca\u907f\u514d\u5197\u4f59\u8ba1\u7b97\u7684\u52a8\u6001\u89c4\u5212\u3002\u672c\u6587\u4ef6\u4ece\u57fa\u672c\u539f\u7406\u51fa\u53d1\u9010\u4e00\u8bb2\u89e3\u3002</p> <ul> <li>\u672c\u7ae0\u540e\u7eed\u6587\u4ef6\u9ed8\u8ba4\u4f60\u5df2\u7ecf\u719f\u6089\u4e86\u8fd9\u56db\u4e2a\u6982\u5ff5\u3002\u5982\u679c\u4f60\u8df3\u8fc7\u672c\u6587\u4ef6\uff0c\u90a3\u4e48\u540e\u9762\u6587\u4ef6\u4e2d\u7684 \\(O(n \\log n)\\) \u6807\u6ce8\u3001\u9012\u5f52\u6811\u904d\u5386\u3001\u56de\u6eaf\u6a21\u677f\u548c DP \u72b6\u6001\u8f6c\u79fb\u5bf9\u4f60\u6765\u8bf4\u5c31\u4f1a\u50cf\u662f\u9b54\u6cd5\u800c\u975e\u5de5\u7a0b\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#_1","title":"\u4e3a\u4ec0\u4e48\u662f\u6a21\u5f0f\uff0c\u800c\u975e\u6b7b\u8bb0\u786c\u80cc","text":"<ul> <li> <p>LeetCode\u3001NeetCode \u548c HackerRank \u4e0a\u6709\u6210\u5343\u4e0a\u4e07\u7684\u7f16\u7a0b\u9898\u3002\u6ca1\u6709\u4eba\u80fd\u8bb0\u4f4f\u5168\u90e8\uff0c\u8bd5\u56fe\u8fd9\u4e48\u505a\u662f\u6ce8\u5b9a\u5931\u8d25\u7684\u7b56\u7565\u3002\u9762\u8bd5\u5b98\u4e0d\u4f1a\u4ece\u56fa\u5b9a\u9898\u5e93\u4e2d\u9009\u9898\u2014\u2014\u4ed6\u4eec\u4f1a\u4fee\u6539\u3001\u7ec4\u5408\u3001\u4f2a\u88c5\u3002\u80cc\u4e0b\u6765\u7684\"\u4e24\u6570\u4e4b\u548c\"\u89e3\u6cd5\uff0c\u5f53\u9762\u8bd5\u5b98\u95ee\u4f60\u4e00\u4e2a\u4ece\u672a\u89c1\u8fc7\u7684\u53d8\u4f53\u65f6\u6beb\u65e0\u7528\u5904\u3002</p> </li> <li> <p>\u597d\u6d88\u606f\u662f\uff1a\u6838\u5fc3\u6a21\u5f0f\u5927\u7ea6\u53ea\u6709 15-20 \u79cd\uff08\u53cc\u6307\u9488\u3001\u6ed1\u52a8\u7a97\u53e3\u3001BFS/DFS\u3001DP\u3001\u56de\u6eaf\u7b49\uff09\u3002\u6240\u6709\u95ee\u9898\uff0c\u65e0\u8bba\u8868\u9762\u591a\u65b0\u9896\uff0c\u6700\u7ec8\u90fd\u5f52\u7ed3\u4e3a\u8fd9\u4e9b\u6a21\u5f0f\u4e2d\u7684\u4e00\u4e2a\u6216\u51e0\u4e2a\u7ec4\u5408\u3002\u9762\u8bd5\u8003\u7684\u4e0d\u662f\u4f60\u662f\u5426\u89c1\u8fc7\u8fd9\u9053\u9898\uff0c\u800c\u662f\u4f60\u662f\u5426\u80fd\u5265\u79bb\u4e0a\u4e0b\u6587\u2014\u2014\u6545\u4e8b\u3001\u5177\u4f53\u6570\u636e\u7c7b\u578b\u3001\u8fb9\u754c\u60c5\u51b5\u2014\u2014\u8bc6\u522b\u51fa\u5e95\u5c42\u7684\u6a21\u5f0f\u3002</p> </li> <li> <p>\u8003\u8651\u8fd9\u4e09\u4e2a\u95ee\u9898\uff1a</p> <ul> <li>\"\u5728\u6570\u7ec4\u4e2d\u627e\u5230\u4e24\u4e2a\u6570\uff0c\u4f7f\u5176\u548c\u7b49\u4e8e\u4e00\u4e2a\u76ee\u6807\u503c\u3002\"</li> <li>\"\u627e\u5230\u4e24\u4e2a\u5206\u5b50\uff0c\u4f7f\u5176\u7ed3\u5408\u80fd\u4e4b\u548c\u7b49\u4e8e\u4e00\u4e2a\u9608\u503c\u3002\"</li> <li>\"\u7ed9\u5b9a\u4e00\u4e2a\u8d26\u6237\u4f59\u989d\u5217\u8868\uff0c\u627e\u5230\u4e24\u4e2a\u8d26\u6237\u7684\u4f59\u989d\u4e4b\u548c\u7b49\u4e8e\u4e00\u7b14\u503a\u52a1\u3002\"</li> </ul> </li> <li> <p>\u5b83\u4eec\u770b\u8d77\u6765\u622a\u7136\u4e0d\u540c\u3002\u4f46\u5b83\u4eec\u662f\u540c\u4e00\u4e2a\u95ee\u9898\uff1a\u4e24\u6570\u4e4b\u548c\u3002\u4e0a\u4e0b\u6587\uff08\u6570\u5b57\u3001\u5206\u5b50\u3001\u8d26\u6237\uff09\u65e0\u5173\u7d27\u8981\u3002\u5176\u7ed3\u6784\u662f\uff1a\u5728\u96c6\u5408\u4e2d\u641c\u7d22\u8865\u6570 \u2192 \u54c8\u5e0c\u8868\u67e5\u627e\u3002</p> </li> <li> <p>\u8fd9\u5c31\u662f\u672c\u7ae0\u901a\u8fc7\u76f4\u89c9\u6559\u6388\u6a21\u5f0f\u800c\u975e\u901a\u8fc7\u91cd\u590d\u6559\u6388\u89e3\u9898\u65b9\u6cd5\u7684\u539f\u56e0\u3002\u5bf9\u4e8e\u6bcf\u4e2a\u6a21\u5f0f\uff0c\u6211\u4eec\u90fd\u4f1a\u89e3\u91ca\uff1a</p> <ul> <li>\u95ee\u9898\u4e2d\u7684\u4ec0\u4e48\u7ed3\u6784\u7279\u5f81\u6307\u793a\u4e86\u8fd9\u4e2a\u6a21\u5f0f\uff08\u8f93\u5165\u5df2\u6392\u5e8f \u2192 \u53cc\u6307\u9488\uff1b\u5b50\u6570\u7ec4\u7ea6\u675f \u2192 \u6ed1\u52a8\u7a97\u53e3\uff1b\u6700\u4f18\u5b50\u7ed3\u6784 + \u91cd\u53e0\u5b50\u95ee\u9898 \u2192 DP\uff09\u3002</li> <li>\u4e3a\u4ec0\u4e48\u8fd9\u4e2a\u6a21\u5f0f\u6709\u6548\u2014\u2014\u6570\u5b66\u6216\u903b\u8f91\u63a8\u7406\uff0c\u800c\u4e0d\u4ec5\u4ec5\u662f\"\u5b83\u80fd\u7ed9\u51fa\u6b63\u786e\u7b54\u6848\"\u3002</li> <li>\u5982\u4f55\u9002\u914d\u5b83\u2014\u2014\u901a\u8fc7\u5c55\u793a\u7b80\u5355\u3001\u4e2d\u7b49\u548c\u56f0\u96be\u53d8\u4f53\uff0c\u5728\u8fd9\u4e9b\u53d8\u4f53\u4e2d\u76f8\u540c\u7684\u6838\u5fc3\u601d\u60f3\u5e94\u7528\u4e8e\u4e0d\u540c\u7684\u4e0a\u4e0b\u6587\u3002</li> </ul> </li> <li> <p>\u5f53\u4f60\u6df1\u5165\u7406\u89e3\u4e3a\u4ec0\u4e48\u6ed1\u52a8\u7a97\u53e3\u6709\u6548\uff08\u7ea6\u675f\u7684\u5355\u8c03\u6027\u610f\u5473\u7740\u6269\u5c55/\u6536\u7f29\u5c31\u8db3\u591f\u4e86\uff09\uff0c\u4f60\u5c31\u53ef\u4ee5\u5c06\u5176\u5e94\u7528\u5230\u4efb\u4f55\u5177\u6709\u8be5\u7ed3\u6784\u7684\u95ee\u9898\u4e0a\uff0c\u5373\u4f7f\u662f\u672a\u66fe\u89c1\u8fc7\u7684\u95ee\u9898\u3002\u5f53\u4f60\u53ea\u662f\u80cc\u4e0b\u4e86\"\u65e0\u91cd\u590d\u5b57\u7b26\u7684\u6700\u957f\u5b50\u4e32\"\u7684\u4ee3\u7801\uff0c\u4e00\u65e6\u95ee\u9898\u53d1\u751f\u53d8\u5316\uff0c\u4f60\u5c31\u4f1a\u675f\u624b\u65e0\u7b56\u3002</p> </li> <li> <p>\u5b9e\u8df5\u7b56\u7565\uff1a</p> <ol> <li>\u5b66\u4e60\u6a21\u5f0f\uff08\u672c\u7ae0\uff09\u3002</li> <li>\u7ec3\u4e60\u8bc6\u522b\u6a21\u5f0f\uff0c\u5728\u4f2a\u88c5\u7684\u95ee\u9898\u4e2d\uff08\u6bcf\u4e2a\u6587\u4ef6\u672b\u5c3e\u7684 NeetCode \u7ec3\u4e60\u9898\uff09\u3002</li> <li>\u7ec3\u4e60\u5b9e\u73b0\uff0c\u5728\u65f6\u95f4\u538b\u529b\u4e0b\u3002</li> <li>\u9762\u8bd5\u4e2d\uff1a\u9605\u8bfb\u9898\u76ee \u2192 \u5265\u79bb\u4e0a\u4e0b\u6587 \u2192 \u8bc6\u522b\u6a21\u5f0f \u2192 \u5b9e\u73b0\u3002</li> </ol> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#o_1","title":"\u5927O\u8868\u793a\u6cd5","text":"<ul> <li> <p>\u5f53\u6211\u4eec\u8bf4\u4e00\u4e2a\u7b97\u6cd5\"\u5feb\"\u6216\"\u6162\"\u65f6\uff0c\u9700\u8981\u4e00\u79cd\u7cbe\u786e\u7684\u8861\u91cf\u65b9\u5f0f\u3002\u5927O\u8868\u793a\u6cd5\u63cf\u8ff0\u4e86\u968f\u7740\u8f93\u5165\u89c4\u6a21 \\(n\\) \u7684\u589e\u957f\uff0c\u7b97\u6cd5\u7684\u8fd0\u884c\u65f6\u95f4\uff08\u6216\u7a7a\u95f4\u4f7f\u7528\u91cf\uff09\u5982\u4f55\u589e\u957f\uff0c\u5ffd\u7565\u4e86\u5e38\u6570\u56e0\u5b50\u548c\u4f4e\u9636\u9879\u3002</p> </li> <li> <p>\u5f62\u5f0f\u5316\u5b9a\u4e49\uff1a\\(f(n) = O(g(n))\\) \u610f\u5473\u7740\u5b58\u5728\u5e38\u6570 \\(c &gt; 0\\) \u548c \\(n_0\\)\uff0c\u4f7f\u5f97\u5bf9\u6240\u6709 \\(n \\geq n_0\\) \u6709 \\(f(n) \\leq c \\cdot g(n)\\)\u3002\u901a\u4fd7\u5730\u8bf4\uff1a\u5bf9\u4e8e\u5927\u89c4\u6a21\u8f93\u5165\uff0c\\(f\\) \u7684\u589e\u957f\u901f\u5ea6\u4e0d\u8d85\u8fc7 \\(g\\)\u3002</p> </li> <li> <p>\u4e3a\u4ec0\u4e48\u8981\u5ffd\u7565\u5e38\u6570\uff1f\u56e0\u4e3a \\(2n\\) \u7684\u7b97\u6cd5\u548c \\(5n\\) \u7684\u7b97\u6cd5\u90fd\u662f \\(O(n)\\)\uff1a\u5b83\u4eec\u7684\u6269\u5c55\u65b9\u5f0f\u76f8\u540c\u3002\u5728\u66f4\u5feb\u7684\u8ba1\u7b97\u673a\u4e0a\uff0c\u5e38\u6570\u4f1a\u53d8\uff0c\u4f46\u6269\u5c55\u6027\u4e0d\u4f1a\u3002\u5927O\u8868\u793a\u6cd5\u6355\u6349\u4e86\u95ee\u9898\u7684\u5185\u5728\u96be\u5ea6\uff0c\u4e0e\u786c\u4ef6\u65e0\u5173\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#_2","title":"\u589e\u957f\u7387\u5c42\u7ea7","text":"<ul> <li>\u4ece\u6700\u5feb\u5230\u6700\u6162\uff1a</li> </ul> \u5927O \u540d\u79f0 \u793a\u4f8b \\(n = 10^6\\) \u6b21\u64cd\u4f5c \\(O(1)\\) \u5e38\u6570\u7ea7 \u6570\u7ec4\u8bbf\u95ee\u3001\u54c8\u5e0c\u67e5\u627e 1 \\(O(\\log n)\\) \u5bf9\u6570\u7ea7 \u4e8c\u5206\u67e5\u627e 20 \\(O(n)\\) \u7ebf\u6027\u7ea7 \u7ebf\u6027\u626b\u63cf\u3001\u5355\u5faa\u73af \\(10^6\\) \\(O(n \\log n)\\) \u7ebf\u6027\u5bf9\u6570\u7ea7 \u5f52\u5e76\u6392\u5e8f\u3001\u9ad8\u6548\u6392\u5e8f \\(2 \\times 10^7\\) \\(O(n^2)\\) \u5e73\u65b9\u7ea7 \u5d4c\u5957\u5faa\u73af\u3001\u66b4\u529b\u914d\u5bf9 \\(10^{12}\\)\uff08\u592a\u6162\uff09 \\(O(n^3)\\) \u7acb\u65b9\u7ea7 \u4e09\u5c42\u5d4c\u5957\u5faa\u73af\u3001\u77e9\u9635\u4e58\u6cd5 \\(10^{18}\\)\uff08\u5b9e\u5728\u592a\u6162\uff09 \\(O(2^n)\\) \u6307\u6570\u7ea7 \u6240\u6709\u5b50\u96c6\u3001\u66b4\u529b\u56de\u6eaf \\(10^{301030}\\)\uff08\u4e0d\u53ef\u80fd\uff09 \\(O(n!)\\) \u9636\u4e58\u7ea7 \u6240\u6709\u6392\u5217 \u8352\u8c2c <ul> <li> <p>\u7ecf\u9a8c\u6cd5\u5219\uff1a\u73b0\u4ee3\u8ba1\u7b97\u673a\u6bcf\u79d2\u6267\u884c\u7ea6 \\(10^8\\)\u2013\\(10^9\\) \u6b21\u7b80\u5355\u64cd\u4f5c\u3002\u5bf9\u4e8e1\u79d2\u7684\u65f6\u95f4\u9650\u5236\uff1a</p> <ul> <li>\\(O(n)\\) \u9002\u7528\u4e8e \\(n \\leq 10^8\\)</li> <li>\\(O(n \\log n)\\) \u9002\u7528\u4e8e \\(n \\leq 10^7\\)</li> <li>\\(O(n^2)\\) \u9002\u7528\u4e8e \\(n \\leq 10^4\\)</li> <li>\\(O(2^n)\\) \u9002\u7528\u4e8e \\(n \\leq 25\\)</li> </ul> </li> <li> <p>\u8fd9\u5f20\u8868\u80fd\u7acb\u5373\u544a\u8bc9\u4f60\u5f53\u524d\u65b9\u6cd5\u662f\u5426\u8db3\u591f\u5feb\u3002\u5982\u679c \\(n = 10^5\\) \u800c\u4f60\u7684\u89e3\u6cd5\u662f \\(O(n^2)\\)\uff0c\u90a3\u5c31\u662f \\(10^{10}\\) \u6b21\u64cd\u4f5c\u2014\u2014\u592a\u6162\u4e86\u3002\u4f60\u9700\u8981\u4e00\u4e2a\u66f4\u597d\u7684\u7b97\u6cd5\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#o_2","title":"\u5982\u4f55\u5206\u6790\u5927O","text":"<ul> <li>\u5355\u5faa\u73af\u904d\u5386 \\(n\\) \u4e2a\u5143\u7d20\uff1a\\(O(n)\\)\u3002</li> </ul> <pre><code>total = 0\nfor x in arr:   # n \u6b21\u8fed\u4ee3\n    total += x   # \u6bcf\u6b21\u8fed\u4ee3 O(1)\n# \u603b\u8ba1\uff1aO(n)\n</code></pre> <ul> <li>\u5d4c\u5957\u5faa\u73af\uff1a\u8fed\u4ee3\u6b21\u6570\u76f8\u4e58\u3002</li> </ul> <pre><code>for i in range(n):       # n \u6b21\u8fed\u4ee3\n    for j in range(n):   # \u6bcf\u6b21 n \u6b21\u8fed\u4ee3\n        process(i, j)    # O(1)\n# \u603b\u8ba1\uff1aO(n^2)\n</code></pre> <ul> <li>\u6bcf\u6b21\u51cf\u534a\u7684\u5faa\u73af\uff1a\\(O(\\log n)\\)\u3002\u6bcf\u6b21\u8fed\u4ee3\u5c06\u95ee\u9898\u89c4\u6a21\u51cf\u534a\uff0c\u6240\u4ee5\u9700\u8981 \\(\\log_2 n\\) \u6b21\u8fed\u4ee3\u3002</li> </ul> <pre><code>i = n\nwhile i &gt; 0:\n    process(i)\n    i //= 2\n# \u603b\u8ba1\uff1aO(log n)\n</code></pre> <ul> <li>\u5185\u5faa\u73af\u4f9d\u8d56\u4e8e\u5916\u5faa\u73af\u7684\u5d4c\u5957\u5faa\u73af\uff1a</li> </ul> <pre><code>for i in range(n):\n    for j in range(i):   # j \u4ece 0 \u5230 i-1\n        process(i, j)\n# \u603b\u8ba1\uff1a0 + 1 + 2 + ... + (n-1) = n(n-1)/2 = O(n^2)\n</code></pre> <ul> <li>\u9012\u5f52\uff1a\u5199\u51fa\u9012\u63a8\u5173\u7cfb\u5e76\u6c42\u89e3\uff08\u7b2c13\u7ae0\u4ecb\u7ecd\u4e86\u4e3b\u5b9a\u7406\uff09\u3002\u4f8b\u5982\uff0c\u5f52\u5e76\u6392\u5e8f\uff1a\\(T(n) = 2T(n/2) + O(n) = O(n \\log n)\\)\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#_3","title":"\u5e38\u89c1\u9677\u9631","text":"<ul> <li>\u9690\u85cf\u7684\u5faa\u73af\uff1aPython \u4e2d <code>x in list</code> \u662f \\(O(n)\\)\uff08\u7ebf\u6027\u626b\u63cf\uff09\uff0c\u4f46 <code>x in set</code> \u662f \\(O(1)\\)\u3002\u5728\u5faa\u73af\u4e2d\u5bf9\u5217\u8868\u4f7f\u7528 <code>in</code> \u4f1a\u5f97\u5230 \\(O(n^2)\\)\uff0c\u800c\u4e0d\u662f \\(O(n)\\)\u3002</li> </ul> <pre><code># \u4e0d\u597d\uff1aO(n^2) \u2014 \u5bf9\u5217\u8868\u7528 \"in\" \u662f O(n)\nfor x in arr:\n    if x in another_list:\n        process(x)\n\n# \u597d\uff1aO(n) \u2014 \u5148\u8f6c\u6362\u4e3a set\nanother_set = set(another_list)\nfor x in arr:\n    if x in another_set:\n        process(x)\n</code></pre> <ul> <li> <p>\u5b57\u7b26\u4e32\u62fc\u63a5\uff1aPython \u4e2d <code>s += c</code> \u6bcf\u6b21\u90fd\u4f1a\u590d\u5236\u6574\u4e2a\u5b57\u7b26\u4e32\u3002\u5728 \\(n\\) \u6b21\u8fed\u4ee3\u7684\u5faa\u73af\u4e2d\uff1a\\(O(1 + 2 + \\cdots + n) = O(n^2)\\)\u3002</p> </li> <li> <p>\u6392\u5e8f\u4e3b\u5bfc\uff1a\u5982\u679c\u4f60\u7684\u7b97\u6cd5\u5148\u6392\u5e8f\uff08\\(O(n \\log n)\\)\uff09\u7136\u540e\u505a\u7ebf\u6027\u626b\u63cf\uff08\\(O(n)\\)\uff09\uff0c\u603b\u590d\u6742\u5ea6\u662f \\(O(n \\log n)\\)\u2014\u2014\u6392\u5e8f\u5360\u4e3b\u5bfc\u3002</p> </li> <li> <p>\u5e73\u644a\u590d\u6742\u5ea6\uff1a\u67d0\u4e9b\u64cd\u4f5c\u5076\u5c14\u5f88\u6602\u8d35\uff0c\u4f46\u5e73\u644a\u4e0b\u6765\u5f88\u4fbf\u5b9c\u3002\u52a8\u6001\u6570\u7ec4\u7684\u8ffd\u52a0\u64cd\u4f5c\u5e73\u644a\u590d\u6742\u5ea6\u4e3a \\(O(1)\\)\uff0c\u56e0\u4e3a\u7f55\u89c1\u7684 \\(O(n)\\) \u6269\u5bb9\u88ab\u5206\u644a\u5230 \\(n\\) \u6b21\u4fbf\u5b9c\u7684\u8ffd\u52a0\u64cd\u4f5c\u4e2d\u3002\u4e0d\u8981\u6df7\u6dc6\u5e73\u644a \\(O(1)\\) \u548c\u6700\u574f\u60c5\u51b5 \\(O(1)\\)\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#_4","title":"\u7a7a\u95f4\u590d\u6742\u5ea6","text":"<ul> <li> <p>\u7a7a\u95f4\u590d\u6742\u5ea6\u9075\u5faa\u540c\u6837\u7684\u5927O\u89c4\u5219\uff0c\u53ea\u662f\u5e94\u7528\u4e8e\u5185\u5b58\u4f7f\u7528\u800c\u975e\u65f6\u95f4\u3002</p> </li> <li> <p>\u539f\u5730\u7b97\u6cd5\u4f7f\u7528 \\(O(1)\\) \u989d\u5916\u7a7a\u95f4\uff08\u4e0d\u8ba1\u8f93\u5165\uff09\u3002\u5feb\u901f\u6392\u5e8f\u662f \\(O(\\log n)\\) \u7a7a\u95f4\uff08\u9012\u5f52\u6808\u6df1\u5ea6\uff09\u3002\u5f52\u5e76\u6392\u5e8f\u662f \\(O(n)\\)\uff08\u5408\u5e76\u65f6\u4f7f\u7528\u7684\u4e34\u65f6\u6570\u7ec4\uff09\u3002</p> </li> <li> <p>\u9012\u5f52\u6808\uff1a\u6bcf\u6b21\u9012\u5f52\u8c03\u7528\u90fd\u4f1a\u4f7f\u7528\u6808\u7a7a\u95f4\u3002\u6df1\u5ea6\u4e3a \\(n\\) \u7684\u9012\u5f52\u4f7f\u7528 \\(O(n)\\) \u7a7a\u95f4\uff0c\u5373\u4f7f\u6bcf\u6b21\u8c03\u7528\u6ca1\u6709\u5206\u914d\u989d\u5916\u5185\u5b58\u3002\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48\u5728\u5177\u6709 \\(n\\) \u4e2a\u8282\u70b9\u7684\u56fe\u4e0a\u8fdb\u884c\u9012\u5f52 DFS \u4f7f\u7528 \\(O(n)\\) \u7a7a\u95f4\u3002</p> </li> <li> <p>\u9762\u8bd5\u4e2d\uff0c\u59cb\u7ec8\u540c\u65f6\u8bf4\u660e\u65f6\u95f4\u548c\u7a7a\u95f4\u590d\u6742\u5ea6\u3002\\(O(n)\\) \u65f6\u95f4\u3001\\(O(n)\\) \u7a7a\u95f4\u7684\u89e3\u6cd5\u901a\u5e38\u53ef\u4ee5\u63a5\u53d7\uff0c\u4f46 \\(O(n)\\) \u65f6\u95f4\u3001\\(O(1)\\) \u7a7a\u95f4\u7684\u89e3\u6cd5\u66f4\u597d\u3002\u9762\u8bd5\u5b98\u53ef\u80fd\u4f1a\u8981\u6c42\u4f60\u4f18\u5316\u5176\u4e2d\u4e00\u4e2a\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#_5","title":"\u9012\u5f52","text":"<ul> <li> <p>\u9012\u5f52\u662f\u6307\u51fd\u6570\u8c03\u7528\u81ea\u8eab\u6765\u89e3\u51b3\u540c\u4e00\u95ee\u9898\u7684\u66f4\u5c0f\u5b9e\u4f8b\u3002\u5b83\u662f\u5904\u7406\u5177\u6709\u9012\u5f52\u7ed3\u6784\u7684\u95ee\u9898\u6700\u81ea\u7136\u7684\u65b9\u5f0f\uff1a\u6811\u3001\u5d4c\u5957\u6570\u636e\u3001\u5206\u6cbb\u6cd5\u548c\u6570\u5b66\u5e8f\u5217\u3002</p> </li> <li> <p>\u6bcf\u4e2a\u9012\u5f52\u51fd\u6570\u90fd\u6709\u4e24\u90e8\u5206\uff1a</p> <ol> <li>\u57fa\u672c\u60c5\u51b5\uff1a\u53ef\u4ee5\u76f4\u63a5\u89e3\u51b3\u7684\u6700\u5c0f\u7684\u5b9e\u4f8b\uff08\u65e0\u9700\u9012\u5f52\uff09\u3002\u8fd9\u662f\u9012\u5f52\u505c\u6b62\u7684\u6761\u4ef6\u3002</li> <li>\u9012\u5f52\u60c5\u51b5\uff1a\u5c06\u95ee\u9898\u5206\u89e3\u4e3a\u66f4\u5c0f\u7684\u5b50\u95ee\u9898\uff0c\u9012\u5f52\u6c42\u89e3\uff0c\u7136\u540e\u5408\u5e76\u7ed3\u679c\u3002</li> </ol> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#_6","title":"\u793a\u4f8b\uff1a\u9636\u4e58","text":"<pre><code>def factorial(n):\n    if n &lt;= 1:        # \u57fa\u672c\u60c5\u51b5\n        return 1\n    return n * factorial(n - 1)  # \u9012\u5f52\u60c5\u51b5\n</code></pre> <ul> <li> <p><code>factorial(4)</code> \u7684\u6267\u884c\u8fc7\u7a0b\uff1a</p> <ul> <li><code>factorial(4)</code> \u8c03\u7528 <code>factorial(3)</code></li> <li><code>factorial(3)</code> \u8c03\u7528 <code>factorial(2)</code></li> <li><code>factorial(2)</code> \u8c03\u7528 <code>factorial(1)</code></li> <li><code>factorial(1)</code> \u8fd4\u56de <code>1</code>\uff08\u57fa\u672c\u60c5\u51b5\uff09</li> <li><code>factorial(2)</code> \u8fd4\u56de <code>2 * 1 = 2</code></li> <li><code>factorial(3)</code> \u8fd4\u56de <code>3 * 2 = 6</code></li> <li><code>factorial(4)</code> \u8fd4\u56de <code>4 * 6 = 24</code></li> </ul> </li> <li> <p>\u6bcf\u6b21\u8c03\u7528\u90fd\u88ab\u538b\u5165\u8c03\u7528\u6808\u3002\u6808\u4e00\u76f4\u589e\u957f\u76f4\u5230\u5230\u8fbe\u57fa\u672c\u60c5\u51b5\uff0c\u7136\u540e\u968f\u7740\u6bcf\u6b21\u8c03\u7528\u7684\u8fd4\u56de\u800c\u5c55\u5f00\u3002\u5982\u679c\u9012\u5f52\u592a\u6df1\uff08\u4f8b\u5982 Python \u4e2d\u7684 <code>factorial(1000000)</code>\uff09\uff0c\u6808\u4f1a\u6ea2\u51fa\uff08<code>RecursionError</code>\uff09\u3002Python \u7684\u9ed8\u8ba4\u9012\u5f52\u9650\u5236\u662f 1000\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#_7","title":"\u5982\u4f55\u4ee5\u9012\u5f52\u65b9\u5f0f\u601d\u8003","text":"<ul> <li> <p>\u5173\u952e\u7684\u601d\u7ef4\u8f6c\u53d8\u662f\uff1a\u4fe1\u4efb\u9012\u5f52\u3002\u5728\u7f16\u5199\u9012\u5f52\u51fd\u6570\u65f6\uff0c\u5047\u8bbe\u9012\u5f52\u8c03\u7528\u5df2\u7ecf\u6b63\u786e\u8fd4\u56de\u4e86\u66f4\u5c0f\u5b50\u95ee\u9898\u7684\u7b54\u6848\u3002\u4f60\u53ea\u9700\u8981\uff1a</p> <ol> <li>\u5904\u7406\u57fa\u672c\u60c5\u51b5\u3002</li> <li>\u5c06\u95ee\u9898\u5206\u89e3\u4e3a\u66f4\u5c0f\u7684\u90e8\u5206\u3002</li> <li>\u5408\u5e76\u7ed3\u679c\u3002</li> </ol> </li> <li> <p>\u4f60\u4e0d\u9700\u8981\u5728\u8111\u4e2d\u8ddf\u8e2a\u6bcf\u4e00\u6b21\u9012\u5f52\u8c03\u7528\u3002\u8fd9\u5c31\u50cf\u8bd5\u56fe\u901a\u8fc7\u5728\u5fc3\u91cc\u6267\u884c\u6bcf\u6b21\u8fed\u4ee3\u6765\u7406\u89e3\u4e00\u4e2a\u5faa\u73af\u3002\u76f8\u53cd\uff0c\u9a8c\u8bc1\uff1a\"\u5982\u679c\u9012\u5f52\u8c03\u7528\u7ed9\u4e86\u6211\u66f4\u5c0f\u8f93\u5165\u7684\u6b63\u786e\u7ed3\u679c\uff0c\u90a3\u4e48\u6211\u7684\u7ec4\u5408\u6b65\u9aa4\u662f\u5426\u7ed9\u51fa\u4e86\u5b8c\u6574\u8f93\u5165\u7684\u6b63\u786e\u7ed3\u679c\uff1f\"</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#_8","title":"\u793a\u4f8b\uff1a\u94fe\u8868\u4e0a\u7684\u9012\u5f52","text":"<ul> <li>\u9012\u5f52\u53cd\u8f6c\u94fe\u8868\uff1a</li> </ul> <pre><code>def reverse(head):\n    if not head or not head.next:   # \u57fa\u672c\u60c5\u51b5\uff1a0 \u6216 1 \u4e2a\u8282\u70b9\n        return head\n\n    new_head = reverse(head.next)   # \u53cd\u8f6c\u5269\u4f59\u90e8\u5206\n    head.next.next = head           # \u5c06\u4e0b\u4e00\u4e2a\u8282\u70b9\u6307\u56de\u5f53\u524d\u8282\u70b9\n    head.next = None                # \u5f53\u524d\u8282\u70b9\u73b0\u5728\u6210\u4e3a\u5c3e\u8282\u70b9\n    return new_head\n</code></pre> <ul> <li>\u4fe1\u4efb\u9012\u5f52\uff1a<code>reverse(head.next)</code> \u6b63\u786e\u53cd\u8f6c\u4e86\u94fe\u8868\u7684\u5269\u4f59\u90e8\u5206\u5e76\u8fd4\u56de\u65b0\u7684\u5934\u8282\u70b9\u3002\u6211\u4eec\u53ea\u9700\u5c06\u5f53\u524d\u8282\u70b9\u9644\u52a0\u5230\u672b\u5c3e\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#_9","title":"\u793a\u4f8b\uff1a\u6811\u4e0a\u7684\u9012\u5f52","text":"<ul> <li>\u8ba1\u7b97\u4e8c\u53c9\u6811\u7684\u9ad8\u5ea6\uff1a</li> </ul> <pre><code>def height(root):\n    if not root:           # \u57fa\u672c\u60c5\u51b5\uff1a\u7a7a\u6811\u9ad8\u5ea6\u4e3a 0\n        return 0\n    left_h = height(root.left)    # \u5de6\u5b50\u6811\u9ad8\u5ea6\n    right_h = height(root.right)  # \u53f3\u5b50\u6811\u9ad8\u5ea6\n    return 1 + max(left_h, right_h)  # \u5f53\u524d\u8282\u70b9\u589e\u52a0 1 \u5c42\n</code></pre> <ul> <li>\u8fd9\u79cd\u6a21\u5f0f\u2014\u2014\"\u9012\u5f52\u5de6\u5b50\u6811\uff0c\u9012\u5f52\u53f3\u5b50\u6811\uff0c\u5408\u5e76\u7ed3\u679c\"\u2014\u2014\u89e3\u51b3\u4e86\u7edd\u5927\u591a\u6570\u6811\u7684\u95ee\u9898\uff08\u89c1\u6587\u4ef603\uff09\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#vs","title":"\u9012\u5f52 vs \u8fed\u4ee3","text":"<ul> <li> <p>\u6bcf\u4e2a\u9012\u5f52\u7b97\u6cd5\u90fd\u53ef\u4ee5\u8f6c\u6362\u4e3a\u8fed\u4ee3\u7b97\u6cd5\uff08\u4f7f\u7528\u663e\u5f0f\u6808\u6216\u5faa\u73af\uff09\u3002\u8fed\u4ee3\u907f\u514d\u4e86\u8c03\u7528\u6808\u5f00\u9500\u548c\u6808\u6ea2\u51fa\u98ce\u9669\u3002</p> </li> <li> <p>\u4f55\u65f6\u4f18\u5148\u4f7f\u7528\u9012\u5f52\uff1a\u95ee\u9898\u5177\u6709\u81ea\u7136\u7684\u9012\u5f52\u7ed3\u6784\uff08\u6811\u3001\u5d4c\u5957\u6570\u636e\u3001\u5206\u6cbb\u6cd5\uff09\u3002\u9012\u5f52\u89e3\u6cd5\u66f4\u7b80\u6d01\u3001\u66f4\u6613\u4e8e\u63a8\u7406\u3002</p> </li> <li> <p>\u4f55\u65f6\u4f18\u5148\u4f7f\u7528\u8fed\u4ee3\uff1a\u9012\u5f52\u6df1\u5ea6\u53ef\u80fd\u975e\u5e38\u5927\uff08\u4f8b\u5982\uff0c\u5904\u7406\u5305\u542b \\(10^6\\) \u4e2a\u8282\u70b9\u7684\u94fe\u8868\uff09\u3002\u8fed\u4ee3\u89e3\u6cd5\u907f\u514d\u4e86\u6808\u6ea2\u51fa\u3002</p> </li> <li> <p>\u5c3e\u9012\u5f52\uff1a\u5982\u679c\u9012\u5f52\u8c03\u7528\u662f\u51fd\u6570\u4e2d\u7684\u6700\u540e\u4e00\u4e2a\u64cd\u4f5c\uff08\u9012\u5f52\u8c03\u7528\u8fd4\u56de\u540e\u6ca1\u6709\u540e\u7eed\u5de5\u4f5c\uff09\uff0c\u5219\u8be5\u9012\u5f52\u8c03\u7528\u662f\"\u5c3e\u9012\u5f52\"\u7684\u3002\u67d0\u4e9b\u8bed\u8a00\uff08Scheme\u3001Scala\uff09\u4f1a\u5c06\u5c3e\u8c03\u7528\u4f18\u5316\u4e3a\u4f7f\u7528\u5e38\u6570\u6808\u7a7a\u95f4\u3002Python \u4e0d\u4f18\u5316\u5c3e\u8c03\u7528\uff0c\u56e0\u6b64 Python \u4e2d\u7684\u5c3e\u9012\u5f52\u4ecd\u7136\u4f7f\u7528 \\(O(n)\\) \u6808\u7a7a\u95f4\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#_10","title":"\u5e38\u89c1\u9677\u9631","text":"\u9677\u9631 \u793a\u4f8b \u4fee\u590d \u7f3a\u5c11\u57fa\u672c\u60c5\u51b5 \u65e0\u9650\u9012\u5f52 \u2192 \u6808\u6ea2\u51fa \u59cb\u7ec8\u5b9a\u4e49\u4f55\u65f6\u505c\u6b62 \u57fa\u672c\u60c5\u51b5\u9519\u8bef \u9012\u5f52\u5206\u89e3\u4e2d\u7684\u5dee\u4e00\u9519\u8bef \u7528\u6700\u5c0f\u7684\u8f93\u5165\u6d4b\u8bd5\uff080\u30011\u30012\uff09 \u95ee\u9898\u89c4\u6a21\u672a\u51cf\u5c0f <code>f(n)</code> \u8c03\u7528 <code>f(n)</code> \u800c\u975e <code>f(n-1)</code> \u786e\u4fdd\u5b50\u95ee\u9898\u4e25\u683c\u66f4\u5c0f \u5197\u4f59\u8ba1\u7b97 \u6590\u6ce2\u90a3\u5951\u6570\u5217\uff1a<code>f(n) = f(n-1) + f(n-2)</code> \u4ee5\u6307\u6570\u7ea7\u91cd\u590d\u8ba1\u7b97 \u4f7f\u7528\u8bb0\u5fc6\u5316\uff08\u2192 DP\uff09 Python \u9012\u5f52\u9650\u5236 <code>factorial(10000)</code> \u5d29\u6e83 \u4f7f\u7528 <code>sys.setrecursionlimit</code> \u6216\u8f6c\u4e3a\u8fed\u4ee3"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#_11","title":"\u56de\u6eaf","text":"<ul> <li> <p>\u56de\u6eaf\u662f\u4e00\u79cd\u7cfb\u7edf\u5730\u63a2\u7d22\u6240\u6709\u53ef\u80fd\u89e3\u6cd5\u7684\u65b9\u6cd5\uff0c\u901a\u8fc7\u9010\u6b65\u6784\u5efa\u89e3\u5e76\u5728\u53d1\u73b0\u90e8\u5206\u89e3\u4e0d\u53ef\u80fd\u5f97\u5230\u6709\u6548\u7b54\u6848\u65f6\u7acb\u5373\u653e\u5f03\u3002</p> </li> <li> <p>\u53ef\u4ee5\u628a\u5b83\u60f3\u8c61\u6210\u8d70\u8ff7\u5bab\u3002\u5728\u6bcf\u4e2a\u5c94\u8def\u53e3\uff0c\u4f60\u9009\u62e9\u4e00\u6761\u8def\u3002\u5982\u679c\u78b0\u5230\u6b7b\u80e1\u540c\uff0c\u4f60\u5c31\u56de\u5230\u4e0a\u4e00\u4e2a\u5c94\u8def\u53e3\u5c1d\u8bd5\u4e0d\u540c\u7684\u8def\u3002\u4f60\u4e0d\u4f1a\u4ece\u5934\u5f00\u59cb\u2014\u2014\u4f60\u56de\u6eaf\u5230\u6700\u8fd1\u7684\u4e00\u4e2a\u51b3\u7b56\u70b9\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#_12","title":"\u4e09\u4e2a\u6b65\u9aa4","text":"<p>\u6bcf\u4e2a\u56de\u6eaf\u7b97\u6cd5\u90fd\u9075\u5faa\u76f8\u540c\u7684\u6a21\u5f0f\uff1a</p> <ol> <li>\u9009\u62e9\uff1a\u9009\u62e9\u4e00\u4e2a\u5019\u9009\u6765\u6269\u5c55\u5f53\u524d\u7684\u90e8\u5206\u89e3\u3002</li> <li>\u63a2\u7d22\uff1a\u9012\u5f52\u5730\u5c1d\u8bd5\u4ece\u8fd9\u4e2a\u5019\u9009\u6784\u5efa\u4e00\u4e2a\u5b8c\u6574\u7684\u89e3\u3002</li> <li>\u64a4\u9500\uff1a\u64a4\u9500\u9009\u62e9\uff08\u56de\u6eaf\uff09\u5e76\u5c1d\u8bd5\u4e0b\u4e00\u4e2a\u5019\u9009\u3002</li> </ol> <pre><code>def backtrack(state, choices, result):\n    if is_complete(state):\n        result.append(state.copy())\n        return\n\n    for choice in choices:\n        if is_valid(choice, state):\n            state.add(choice)           # 1. \u9009\u62e9\n            backtrack(state, choices, result)  # 2. \u63a2\u7d22\n            state.remove(choice)        # 3. \u64a4\u9500\uff08\u56de\u6eaf\uff09\n</code></pre> <ul> <li>\u64a4\u9500\u6b65\u9aa4\u662f\u56de\u6eaf\u4e0e\u666e\u901a\u9012\u5f52\u7684\u533a\u522b\u6240\u5728\u3002\u6ca1\u6709\u5b83\uff0c\u72b6\u6001\u4f1a\u7d2f\u79ef\u6240\u6709\u9009\u62e9\uff0c\u4f60\u5c31\u65e0\u6cd5\u63a2\u7d22\u66ff\u4ee3\u8def\u5f84\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#_13","title":"\u4f55\u65f6\u4f7f\u7528\u56de\u6eaf","text":"<ul> <li>\u95ee\u9898\u8981\u6c42\u679a\u4e3e\u6240\u6709\u6709\u6548\u914d\u7f6e\uff1a\u6240\u6709\u6392\u5217\u3001\u6240\u6709\u5b50\u96c6\u3001\u6240\u6709\u6709\u6548\u6392\u5217\uff08\u5982 N \u7687\u540e\uff09\u3002</li> <li>\u95ee\u9898\u8981\u6c42\u5bfb\u627e\u4efb\u4f55\u6709\u6548\u914d\u7f6e\uff1a\u6570\u72ec\u6c42\u89e3\u3001\u8ff7\u5bab\u5bfb\u8def\u3002</li> <li>\u641c\u7d22\u7a7a\u95f4\u5f88\u5927\u4f46\u53ef\u4ee5\u526a\u679d\uff1a\u5927\u591a\u6570\u90e8\u5206\u89e3\u53ef\u4ee5\u5728\u5b8c\u5168\u63a2\u7d22\u4e4b\u524d\u88ab\u63d0\u524d\u62d2\u7edd\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#_14","title":"\u526a\u679d\u5982\u4f55\u4f7f\u5176\u53d8\u5feb","text":"<ul> <li>\u6ca1\u6709\u526a\u679d\u65f6\uff0c\u56de\u6eaf\u4f1a\u63a2\u7d22\u6240\u6709\u53ef\u80fd\u7684\u7ec4\u5408\u2014\u2014\u6307\u6570\u7ea7\u65f6\u95f4\u3002\u526a\u679d\u5219\u63d0\u524d\u780d\u6389\u5206\u652f\uff1a</li> </ul> <pre><code>for choice in choices:\n    if not is_valid(choice, state):\n        continue  # \u526a\u679d\uff1a\u8df3\u8fc7\u6574\u4e2a\u5b50\u6811\n\n    state.add(choice)\n    backtrack(state, choices, result)\n    state.remove(choice)\n</code></pre> <ul> <li>\u5728 N \u7687\u540e\u95ee\u9898\uff08\u6587\u4ef605\uff09\u4e2d\uff0c\u5728\u653e\u7f6e\u7687\u540e\u4e4b\u524d\u68c0\u67e5\u5217\u548c\u5bf9\u89d2\u7ebf\u51b2\u7a81\uff0c\u5c06\u641c\u7d22\u6811\u4ece \\(n^n\\) \u526a\u679d\u5230\u5927\u7ea6 \\(n!\\) \u4e2a\u5019\u9009\u3002\u5bf9\u4e8e \\(n = 8\\)\uff0c\u8fd9\u662f 1600 \u4e07 \u2192 40,000\u3002\u597d\u7684\u526a\u679d\u4f7f\u6307\u6570\u7ea7\u7b97\u6cd5\u5728\u4e2d\u7b49\u89c4\u6a21\u7684 \\(n\\) \u4e0b\u53d8\u5f97\u53ef\u884c\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#_15","title":"\u751f\u6210\u6240\u6709\u5b50\u96c6\uff08\u6700\u7b80\u5355\u7684\u56de\u6eaf\uff09","text":"<pre><code>def subsets(nums):\n    result = []\n\n    def backtrack(start, path):\n        result.append(path[:])  # \u6bcf\u4e2a\u90e8\u5206\u89e3\u90fd\u662f\u4e00\u4e2a\u6709\u6548\u7684\u5b50\u96c6\n\n        for i in range(start, len(nums)):\n            path.append(nums[i])        # \u9009\u62e9\n            backtrack(i + 1, path)       # \u63a2\u7d22\uff08i+1\uff1a\u4e0d\u5141\u8bb8\u91cd\u590d\u4f7f\u7528\uff09\n            path.pop()                   # \u64a4\u9500\n\n    backtrack(0, [])\n    return result\n</code></pre> <ul> <li> <p>\u5bf9\u4e8e <code>[1, 2, 3]</code>\uff0c\u9012\u5f52\u6811\uff1a</p> <ul> <li><code>[]</code> \u2192 <code>[1]</code> \u2192 <code>[1,2]</code> \u2192 <code>[1,2,3]</code>\uff08\u56de\u6eaf\uff09\u2192 <code>[1,3]</code>\uff08\u56de\u6eaf\uff09\u2192 <code>[2]</code> \u2192 <code>[2,3]</code>\uff08\u56de\u6eaf\uff09\u2192 <code>[3]</code></li> </ul> </li> <li> <p>\u6811\u4e2d\u7684\u6bcf\u4e2a\u8282\u70b9\u662f\u4e00\u6b21\u5bf9 <code>backtrack</code> \u7684\u8c03\u7528\u3002\u6bcf\u4e2a\u53f6\u5b50\u8282\u70b9\uff08\u4ee5\u53ca\u4e2d\u95f4\u8282\u70b9\uff09\u4ea7\u751f\u4e00\u4e2a\u5b50\u96c6\u3002\u603b\u5b50\u96c6\u6570\uff1a\\(2^n\\)\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#_16","title":"\u751f\u6210\u6240\u6709\u6392\u5217","text":"<pre><code>def permutations(nums):\n    result = []\n\n    def backtrack(path, remaining):\n        if not remaining:\n            result.append(path[:])\n            return\n\n        for i in range(len(remaining)):\n            path.append(remaining[i])                    # \u9009\u62e9\n            backtrack(path, remaining[:i] + remaining[i+1:])  # \u63a2\u7d22\n            path.pop()                                   # \u64a4\u9500\n\n    backtrack([], nums)\n    return result\n</code></pre> <ul> <li>\u603b\u6392\u5217\u6570\uff1a\\(n!\\)\u3002\u6bcf\u4e2a\u6392\u5217\u9700\u8981 \\(O(n)\\) \u5de5\u4f5c\u6765\u6784\u9020 <code>remaining</code>\uff0c\u6240\u4ee5\u603b\u590d\u6742\u5ea6\u4e3a \\(O(n \\cdot n!)\\)\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#_17","title":"\u5e38\u89c1\u9677\u9631","text":"\u9677\u9631 \u793a\u4f8b \u4fee\u590d \u5fd8\u8bb0\u590d\u5236\u8def\u5f84 <code>result.append(path)</code> \u2014\u2014 \u6240\u6709\u6761\u76ee\u5171\u4eab\u540c\u4e00\u4e2a\u5217\u8868 <code>result.append(path[:])</code> \u6216 <code>path.copy()</code> \u672a\u56de\u6eaf\uff08\u64a4\u9500\uff09 \u72b6\u6001\u4e0d\u65ad\u589e\u957f\uff0c\u540e\u9762\u7684\u5019\u9009\u770b\u5230\u8fc7\u65f6\u7684\u72b6\u6001 \u9012\u5f52\u8c03\u7528\u540e\u59cb\u7ec8\u6267\u884c <code>path.pop()</code> \u6216 <code>state.remove()</code> \u5faa\u73af\u8d77\u59cb\u4f4d\u7f6e\u9519\u8bef \u5b50\u96c6\u4e2d\u6709\u91cd\u590d\u9879\uff0c\u6216\u6392\u5217\u4e2d\u51fa\u73b0\u4e86\u4e0d\u5e94\u6709\u7684\u91cd\u590d\u4f7f\u7528 \u4f7f\u7528 <code>start</code> \u53c2\u6570\u907f\u514d\u91cd\u65b0\u8bbf\u95ee\u4e4b\u524d\u7684\u7d22\u5f15 \u8df3\u8fc7\u526a\u679d \u63a2\u7d22\u660e\u663e\u65e0\u6548\u7684\u5206\u652f \u5728\u9012\u5f52\u8c03\u7528\u524d\u6dfb\u52a0 <code>if not is_valid: continue</code>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#_18","title":"\u52a8\u6001\u89c4\u5212","text":"<ul> <li> <p>\u52a8\u6001\u89c4\u5212\uff08DP\uff09\u662f\u4e00\u79cd\u4f18\u5316\u6280\u672f\uff0c\u9002\u7528\u4e8e\u76f8\u540c\u5b50\u95ee\u9898\u88ab\u53cd\u590d\u6c42\u89e3\u7684\u60c5\u51b5\u3002DP \u4e0d\u91cd\u590d\u8ba1\u7b97\uff0c\u800c\u662f\u6bcf\u4e2a\u5b50\u95ee\u9898\u53ea\u89e3\u4e00\u6b21\u5e76\u5b58\u50a8\u7ed3\u679c\u3002</p> </li> <li> <p>DP \u9002\u7528\u4e8e\u5177\u6709\u4e24\u4e2a\u6027\u8d28\u7684\u95ee\u9898\uff1a</p> <ol> <li>\u6700\u4f18\u5b50\u7ed3\u6784\uff1a\u6700\u4f18\u89e3\u53ef\u4ee5\u7531\u5b50\u95ee\u9898\u7684\u6700\u4f18\u89e3\u6784\u5efa\u800c\u6210\u3002</li> <li>\u91cd\u53e0\u5b50\u95ee\u9898\uff1a\u76f8\u540c\u7684\u5b50\u95ee\u9898\u5728\u9012\u5f52\u4e2d\u591a\u6b21\u51fa\u73b0\u3002</li> </ol> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#_19","title":"\u6590\u6ce2\u90a3\u5951\u6570\u5217\u7684\u52a8\u673a","text":"<ul> <li>\u6734\u7d20\u9012\u5f52\u6590\u6ce2\u90a3\u5951\u6570\u5217\uff1a</li> </ul> <pre><code>def fib(n):\n    if n &lt;= 1:\n        return n\n    return fib(n - 1) + fib(n - 2)\n</code></pre> <ul> <li> <p>\u5bf9\u4e8e <code>fib(5)</code>\uff0c\u9012\u5f52\u6811\uff1a</p> <ul> <li><code>fib(5)</code> \u8c03\u7528 <code>fib(4)</code> \u548c <code>fib(3)</code></li> <li><code>fib(4)</code> \u8c03\u7528 <code>fib(3)</code> \u548c <code>fib(2)</code></li> <li><code>fib(3)</code> \u88ab\u8ba1\u7b97\u4e86\u4e24\u6b21\uff0c<code>fib(2)</code> \u88ab\u8ba1\u7b97\u4e86\u4e09\u6b21</li> </ul> </li> <li> <p>\u8fd9\u662f \\(O(2^n)\\)\uff0c\u56e0\u4e3a\u6811\u5728\u6bcf\u4e00\u5c42\u90fd\u5206\u652f\uff0c\u800c\u4e14\u5927\u591a\u6570\u5206\u652f\u91cd\u590d\u8ba1\u7b97\u76f8\u540c\u7684\u503c\u3002\u5bf9\u4e8e <code>fib(50)</code>\uff0c\u9700\u8981\u8d85\u8fc7 \\(10^{15}\\) \u6b21\u64cd\u4f5c\u2014\u2014\u4e0d\u53ef\u884c\u3002</p> </li> <li> <p>\u4f7f\u7528\u8bb0\u5fc6\u5316\uff08\u81ea\u9876\u5411\u4e0b DP\uff09\uff1a</p> </li> </ul> <pre><code>def fib_memo(n, memo={}):\n    if n in memo:\n        return memo[n]\n    if n &lt;= 1:\n        return n\n    memo[n] = fib_memo(n - 1, memo) + fib_memo(n - 2, memo)\n    return memo[n]\n</code></pre> <ul> <li> <p>\u73b0\u5728 <code>fib(3)</code> \u53ea\u8ba1\u7b97\u4e00\u6b21\uff0c\u5b58\u50a8\u8d77\u6765\uff0c\u540e\u7eed\u8c03\u7528\u76f4\u63a5\u67e5\u627e\u3002\u603b\u8ba1\uff1a\\(O(n)\\) \u65f6\u95f4\uff0c\\(O(n)\\) \u7a7a\u95f4\u3002</p> </li> <li> <p>\u4f7f\u7528\u5236\u8868\u6cd5\uff08\u81ea\u5e95\u5411\u4e0a DP\uff09\uff1a</p> </li> </ul> <pre><code>def fib_tab(n):\n    if n &lt;= 1:\n        return n\n    dp = [0] * (n + 1)\n    dp[1] = 1\n    for i in range(2, n + 1):\n        dp[i] = dp[i - 1] + dp[i - 2]\n    return dp[n]\n</code></pre> <ul> <li>\u540c\u6837 \\(O(n)\\) \u65f6\u95f4\uff0c\u4f46\u81ea\u5e95\u5411\u4e0a\u6784\u5efa\u89e3\uff0c\u65e0\u9700\u9012\u5f52\u3002\u53ef\u4ee5\u8fdb\u4e00\u6b65\u4f18\u5316\u5230 \\(O(1)\\) \u7a7a\u95f4\uff0c\u56e0\u4e3a\u6bcf\u4e2a\u503c\u53ea\u4f9d\u8d56\u4e8e\u524d\u4e24\u4e2a\u503c\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#dp","title":"DP \u914d\u65b9","text":"<p>\u5bf9\u4e8e\u4efb\u4f55 DP \u95ee\u9898\uff0c\u9075\u5faa\u4ee5\u4e0b\u6b65\u9aa4\uff1a</p> <ol> <li> <p>\u5b9a\u4e49\u72b6\u6001\uff1a<code>dp[i]</code>\uff08\u6216 <code>dp[i][j]</code>\uff09\u4ee3\u8868\u4ec0\u4e48\uff1f\u8fd9\u662f\u6700\u96be\u7684\u4e00\u6b65\u3002\u72b6\u6001\u5fc5\u987b\u6355\u83b7\u8db3\u591f\u7684\u4fe1\u606f\u4ee5\u505a\u51fa\u6700\u4f18\u51b3\u7b56\u3002</p> </li> <li> <p>\u5199\u51fa\u9012\u63a8\u5173\u7cfb\uff1a<code>dp[i]</code> \u5982\u4f55\u4e0e\u66f4\u5c0f\u7684\u5b50\u95ee\u9898\u5173\u8054\uff1f\u8fd9\u662f\u8f6c\u79fb\u516c\u5f0f\u3002</p> </li> <li> <p>\u786e\u5b9a\u57fa\u672c\u60c5\u51b5\uff1a\u54ea\u4e9b\u662f\u6700\u5c0f\u7684\u5b50\u95ee\u9898\uff0c\u53ef\u4ee5\u76f4\u63a5\u6c42\u89e3\uff1f</p> </li> <li> <p>\u786e\u5b9a\u8fed\u4ee3\u987a\u5e8f\uff1a\u54ea\u4e9b\u5b50\u95ee\u9898\u5fc5\u987b\u5148\u4e8e\u54ea\u4e9b\u5b50\u95ee\u9898\u6c42\u89e3\uff1f\u81ea\u5e95\u5411\u4e0a\uff1a\u6309\u7167\u786e\u4fdd\u4f9d\u8d56\u5173\u7cfb\u5df2\u89e3\u51b3\u7684\u987a\u5e8f\u8fed\u4ee3\u3002\u81ea\u9876\u5411\u4e0b\uff1a\u9012\u5f52\u4f1a\u81ea\u52a8\u5904\u7406\u3002</p> </li> <li> <p>\u4f18\u5316\u7a7a\u95f4\uff08\u53ef\u9009\uff09\uff1a\u5982\u679c <code>dp[i]</code> \u53ea\u4f9d\u8d56\u4e8e\u524d\u4e00\u884c\u6216\u524d\u51e0\u4e2a\u6761\u76ee\uff0c\u4f60\u5c31\u4e0d\u9700\u8981\u5b8c\u6574\u7684\u8868\u3002</p> </li> </ol>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#_20","title":"\u793a\u4f8b\uff1a\u601d\u8def\u8fc7\u7a0b","text":"<p>\u95ee\u9898\uff1a\u7ed9\u5b9a\u4e00\u4e2a\u6b63\u6574\u6570\u6570\u7ec4\uff0c\u6c42\u4e0d\u76f8\u90bb\u5143\u7d20\u7684\u6700\u5927\u548c\uff08\u6253\u5bb6\u52ab\u820d\uff09\u3002</p> <p>\u7b2c1\u6b65\u2014\u2014\u5b9a\u4e49\u72b6\u6001\uff1a<code>dp[i]</code> = \u8003\u8651\u5143\u7d20 <code>nums[0..i]</code> \u7684\u6700\u5927\u548c\u3002</p> <p>\u7b2c2\u6b65\u2014\u2014\u5199\u51fa\u9012\u63a8\u5173\u7cfb\uff1a\u5bf9\u4e8e\u5143\u7d20 \\(i\\)\uff0c\u6211\u4eec\u8981\u4e48\uff1a - \u8df3\u8fc7\u5b83\uff1a<code>dp[i] = dp[i-1]</code>\uff08\u4e0d\u542b\u5143\u7d20 \\(i\\) \u7684\u6700\u4f73\u548c\uff09\u3002 - \u53d6\u7528\u5b83\uff1a<code>dp[i] = dp[i-2] + nums[i]</code>\uff08\u5fc5\u987b\u8df3\u8fc7\u5143\u7d20 \\(i-1\\)\uff0c\u7136\u540e\u52a0\u4e0a\u5143\u7d20 \\(i\\)\uff09\u3002</p> <p>\u6240\u4ee5\uff1a<code>dp[i] = max(dp[i-1], dp[i-2] + nums[i])</code>\u3002</p> <p>\u7b2c3\u6b65\u2014\u2014\u57fa\u672c\u60c5\u51b5\uff1a<code>dp[0] = nums[0]</code>\uff0c<code>dp[1] = max(nums[0], nums[1])</code>\u3002</p> <p>\u7b2c4\u6b65\u2014\u2014\u8fed\u4ee3\u987a\u5e8f\uff1a\u4ece\u5de6\u5230\u53f3\uff08\u6bcf\u4e2a\u72b6\u6001\u4f9d\u8d56\u4e8e\u524d\u4e24\u4e2a\u72b6\u6001\uff09\u3002</p> <p>\u7b2c5\u6b65\u2014\u2014\u7a7a\u95f4\u4f18\u5316\uff1a\u53ea\u9700\u8981\u6700\u540e\u4e24\u4e2a\u503c\u3002</p> <pre><code>def rob(nums):\n    if len(nums) == 1:\n        return nums[0]\n\n    prev2, prev1 = nums[0], max(nums[0], nums[1])\n\n    for i in range(2, len(nums)):\n        curr = max(prev1, prev2 + nums[i])\n        prev2, prev1 = prev1, curr\n\n    return prev1\n</code></pre>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#dp_1","title":"\u5982\u4f55\u8bc6\u522b DP \u95ee\u9898","text":"<ul> <li>\u95ee\u9898\u8981\u6c42\u6700\u4f18\u503c\uff08\u6700\u5c0f\u6210\u672c\u3001\u6700\u5927\u5229\u6da6\u3001\u6700\u957f\u5e8f\u5217\uff09\u6216\u8ba1\u6570\uff08\u65b9\u6cd5\u6570\uff09\u3002</li> <li>\u95ee\u9898\u5728\u6bcf\u4e00\u6b65\u90fd\u6709\u9009\u62e9\uff08\u53d6/\u8df3\u8fc7\u3001\u5411\u5de6/\u5411\u53f3\u3001\u4f7f\u7528\u8fd9\u679a\u786c\u5e01\u4e0e\u5426\uff09\uff0c\u5e76\u4e14\u6574\u4f53\u6700\u4f18\u7b54\u6848\u4f9d\u8d56\u4e8e\u5b50\u95ee\u9898\u7684\u6700\u4f18\u7b54\u6848\u3002</li> <li>\u753b\u51fa\u9012\u5f52\u6811\u4f1a\u663e\u793a\u91cd\u590d\u7684\u5b50\u95ee\u9898\u3002</li> <li>\u66b4\u529b\u89e3\u6cd5\u662f\u6307\u6570\u7ea7\u7684\uff0c\u4f46\u4e0d\u540c\u7684\u72b6\u6001\u6bd4\u9012\u5f52\u8c03\u7528\u5c11\u5f97\u591a\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#dp_2","title":"DP \u7684\u5206\u7c7b","text":"<ul> <li> <p>1D DP\uff1a\u72b6\u6001\u4f9d\u8d56\u4e8e\u5355\u4e2a\u7d22\u5f15\u3002\u793a\u4f8b\uff1a\u722c\u697c\u68af\u3001\u6253\u5bb6\u52ab\u820d\u3001\u6700\u5927\u5b50\u6570\u7ec4\u3002</p> </li> <li> <p>2D DP\uff1a\u72b6\u6001\u4f9d\u8d56\u4e8e\u4e24\u4e2a\u7d22\u5f15\u3002\u793a\u4f8b\uff1a\u6700\u957f\u516c\u5171\u5b50\u5e8f\u5217\uff08<code>dp[i][j]</code> \u8868\u793a\u5b57\u7b26\u4e321\u7684\u524d \\(i\\) \u4e2a\u5b57\u7b26\u548c\u5b57\u7b26\u4e322\u7684\u524d \\(j\\) \u4e2a\u5b57\u7b26\uff09\u3001\u7f16\u8f91\u8ddd\u79bb\u3001\u7f51\u683c\u8def\u5f84\u95ee\u9898\u3002</p> </li> <li> <p>\u533a\u95f4 DP\uff1a\u72b6\u6001\u662f\u4e00\u4e2a\u533a\u95f4 <code>dp[i][j]</code>\uff0c\u8868\u793a <code>arr[i..j]</code> \u4e0a\u7684\u5b50\u95ee\u9898\u3002\u793a\u4f8b\uff1a\u77e9\u9635\u94fe\u4e58\u6cd5\u3001\u6233\u6c14\u7403\u3002</p> </li> <li> <p>\u80cc\u5305 DP\uff1a\u72b6\u6001\u662f\u7269\u54c1\u7d22\u5f15\u548c\u5bb9\u91cf\u3002\u793a\u4f8b\uff1a0/1 \u80cc\u5305\u3001\u96f6\u94b1\u5151\u6362\u3001\u5b50\u96c6\u548c\u3002</p> </li> <li> <p>\u4f4d\u63a9\u7801 DP\uff1a\u72b6\u6001\u5305\u542b\u4e00\u4e2a\u4f4d\u63a9\u7801\uff0c\u8868\u793a\u54ea\u4e9b\u5143\u7d20\u5df2\u88ab\u4f7f\u7528\u3002\u793a\u4f8b\uff1a\u65c5\u884c\u5546\u95ee\u9898\u3001\u5206\u914d\u95ee\u9898\u3002\u72b6\u6001\u7a7a\u95f4\u4e3a \\(O(2^n \\cdot n)\\)\uff0c\u5bf9\u4e8e \\(n \\leq 20\\) \u53ef\u884c\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#vs_1","title":"\u81ea\u9876\u5411\u4e0b vs \u81ea\u5e95\u5411\u4e0a","text":"\u81ea\u9876\u5411\u4e0b\uff08\u8bb0\u5fc6\u5316\uff09 \u81ea\u5e95\u5411\u4e0a\uff08\u5236\u8868\u6cd5\uff09 \u5b9e\u73b0 \u9012\u5f52 + \u7f13\u5b58 \u8fed\u4ee3 + \u8868 \u8ba1\u7b97 \u53ea\u8ba1\u7b97\u5b9e\u9645\u9700\u8981\u7684\u5b50\u95ee\u9898 \u8ba1\u7b97\u76f4\u5230\u76ee\u6807\u7684\u6240\u6709\u5b50\u95ee\u9898 \u6808\u6ea2\u51fa\u98ce\u9669 \u6709\uff08\u6df1\u5ea6\u9012\u5f52\uff09 \u65e0 \u7a7a\u95f4\u4f18\u5316 \u8f83\u96be \u8f83\u6613\uff08\u4f7f\u7528\u6eda\u52a8\u6570\u7ec4\uff09 \u7f16\u7801\u96be\u5ea6 \u901a\u5e38\u66f4\u81ea\u7136\uff08\u5199\u9012\u5f52\uff0c\u52a0\u7f13\u5b58\uff09 \u9700\u8981\u8003\u8651\u8fed\u4ee3\u987a\u5e8f <ul> <li>\u5728\u9762\u8bd5\u4e2d\uff0c\u81ea\u9876\u5411\u4e0b\u901a\u5e38\u7f16\u7801\u66f4\u5feb\u3002\u5728\u751f\u4ea7\u73af\u5883\u4e2d\uff0c\u81ea\u5e95\u5411\u4e0a\u901a\u5e38\u66f4\u53d7\u9752\u7750\uff08\u65e0\u9012\u5f52\u5f00\u9500\uff0c\u7f13\u5b58\u884c\u4e3a\u66f4\u597d\uff09\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#_21","title":"\u5e38\u89c1\u9677\u9631","text":"\u9677\u9631 \u793a\u4f8b \u4fee\u590d \u72b6\u6001\u5b9a\u4e49\u9519\u8bef <code>dp[i]</code> \u6ca1\u6709\u6355\u83b7\u8db3\u591f\u4fe1\u606f\u6765\u505a\u51b3\u7b56 \u589e\u52a0\u7ef4\u5ea6\uff08\u4f8b\u5982\u7528 <code>dp[i][j]</code> \u4ee3\u66ff <code>dp[i]</code>\uff09 \u7f3a\u5c11\u57fa\u672c\u60c5\u51b5 <code>dp[0]</code> \u9519\u8bef \u2192 \u6240\u6709\u540e\u7eed\u503c\u90fd\u9519 \u624b\u52a8\u9a8c\u8bc1\u57fa\u672c\u60c5\u51b5 \u8fed\u4ee3\u987a\u5e8f\u9519\u8bef \u5728\u4f9d\u8d56\u5173\u7cfb\u672a\u89e3\u51b3\u4e4b\u524d\u8ba1\u7b97 <code>dp[i]</code> \u753b\u51fa\u4f9d\u8d56\u7bad\u5934\u5e76\u76f8\u5e94\u8fed\u4ee3 \u672a\u6b63\u786e\u521d\u59cb\u5316 <code>dp</code> \u7528 0 \u800c\u5e94\u8be5\u7528\u65e0\u7a77\u5927\uff08\u6c42\u6700\u5c0f\u503c\u65f6\uff09 \u6700\u5c0f\u5316\u7528 <code>float('inf')</code>\uff0c\u6700\u5927\u5316\u7528 <code>float('-inf')</code> \u5fd8\u8bb0\u8003\u8651\"\u8df3\u8fc7\"\u9009\u9879 \u603b\u662f\u53d6\u5f53\u524d\u5143\u7d20 \u9012\u63a8\u5173\u7cfb\u901a\u5e38\u6709 <code>max(take, skip)</code> \u53ef\u53d8\u7684\u9ed8\u8ba4\u53c2\u6570 <code>def f(memo={})</code> \u5728\u8c03\u7528\u95f4\u5171\u4eab\u7f13\u5b58 <code>def f(memo=None): if memo is None: memo = {}</code> 2D DP \u4e2d\u7684\u5dee\u4e00\u9519\u8bef <code>dp</code> \u662f 1-indexed \u65f6\u8bbf\u95ee <code>text1[i]</code> <code>dp</code> \u5927\u5c0f\u4e3a <code>(m+1) x (n+1)</code>\uff0c\u8bbf\u95ee <code>text1[i-1]</code>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/00.%20foundations/#_22","title":"\u878d\u4f1a\u8d2f\u901a","text":"<ul> <li> <p>\u8fd9\u56db\u4e2a\u6982\u5ff5\u6784\u6210\u4e00\u4e2a\u9012\u8fdb\u5173\u7cfb\uff1a</p> <ol> <li>\u5927O\u8868\u793a\u6cd5\u544a\u8bc9\u4f60\u4e00\u4e2a\u65b9\u6cd5\u662f\u5426\u8db3\u591f\u5feb\u3002</li> <li>\u9012\u5f52\u5c06\u95ee\u9898\u5206\u89e3\u4e3a\u5b50\u95ee\u9898\u3002</li> <li>\u56de\u6eaf\u662f\u9012\u5f52 + \u9009\u62e9 + \u64a4\u9500\uff0c\u7528\u4e8e\u7a77\u4e3e\u641c\u7d22\u3002</li> <li>DP\u662f\u9012\u5f52 + \u7f13\u5b58\uff0c\u7528\u4e8e\u5177\u6709\u91cd\u53e0\u5b50\u95ee\u9898\u7684\u4f18\u5316\u3002</li> </ol> </li> <li> <p>\u5f53\u4f60\u9047\u5230\u4e00\u4e2a\u65b0\u95ee\u9898\u65f6\uff1a</p> <ul> <li>\u4f30\u8ba1\u8f93\u5165\u89c4\u6a21 \\(n\\)\u3002\u4ec0\u4e48\u6837\u7684 Big O \u662f\u53ef\u63a5\u53d7\u7684\uff1f</li> <li>\u5982\u679c\u66b4\u529b\u89e3\u6cd5\u662f\u6307\u6570\u7ea7\u7684\uff0c\u4e14\u95ee\u9898\u8981\u6c42\u679a\u4e3e/\u5bfb\u627e\u914d\u7f6e\uff1a\u56de\u6eaf\uff08\u914d\u5408\u526a\u679d\u4f7f\u5176\u53ef\u884c\uff09\u3002</li> <li>\u5982\u679c\u66b4\u529b\u89e3\u6cd5\u662f\u6307\u6570\u7ea7\u7684\uff0c\u4e14\u95ee\u9898\u8981\u6c42\u6700\u4f18\u503c\u6216\u8ba1\u6570\uff0c\u5e76\u4e14\u4f60\u770b\u5230\u91cd\u53e0\u5b50\u95ee\u9898\uff1aDP\u3002</li> <li>\u5982\u679c\u95ee\u9898\u5177\u6709\u51cf\u534a\u641c\u7d22\u7a7a\u95f4\u7684\u7ed3\u6784\uff1a\u4e8c\u5206\u67e5\u627e\u6216\u5206\u6cbb\u6cd5\u3002</li> <li>\u5982\u679c\u95ee\u9898\u6d89\u53ca\u5e8f\u5217\u4e14\u6709\u5b50\u6570\u7ec4\u7ea6\u675f\uff1a\u6ed1\u52a8\u7a97\u53e3\u6216\u53cc\u6307\u9488\u3002</li> <li>\u5982\u679c\u95ee\u9898\u9700\u8981\u5feb\u901f\u67e5\u627e\uff1a\u54c8\u5e0c\u8868\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/","title":"\u6570\u7ec4\u4e0e\u54c8\u5e0c","text":"<p>\u6570\u7ec4\u548c\u54c8\u5e0c\u8868\u662f\u7f16\u7a0b\u4e2d\u6700\u57fa\u7840\u7684\u4e24\u79cd\u6570\u636e\u7ed3\u6784\u3002\u672c\u6587\u4ef6\u6db5\u76d6\u5b83\u4eec\u5e95\u5c42\u7684\u8fd0\u884c\u673a\u5236\uff0c\u7136\u540e\u6784\u5efa\u5173\u952e\u7684\u95ee\u9898\u89e3\u51b3\u6a21\u5f0f\uff1a\u53cc\u6307\u9488\u3001\u6ed1\u52a8\u7a97\u53e3\u3001\u524d\u7f00\u548c\u4ee5\u53ca\u57fa\u4e8e\u54c8\u5e0c\u7684\u67e5\u627e\uff0c\u901a\u8fc7\u9010\u6b65\u589e\u52a0\u96be\u5ea6\u7684\u9898\u76ee\uff0c\u5e76\u5728\u6bcf\u4e00\u6b65\u6307\u51fa\u5e38\u89c1\u9677\u9631\u3002</p> <ul> <li> <p>\u5982\u679c\u4f60\u6df1\u5165\u7406\u89e3\u6570\u7ec4\u548c\u54c8\u5e0c\u8868\uff0c\u4f60\u53ef\u4ee5\u89e3\u51b3\u7ea640%\u7684\u7f16\u7801\u9762\u8bd5\u9898\u3002\u8fd9\u4e24\u79cd\u7ed3\u6784\u65e0\u5904\u4e0d\u5728\uff0c\u56e0\u4e3a\u5b83\u4eec\u63d0\u4f9b\u4e86\u7b97\u6cd5\u6700\u9700\u8981\u7684\u4e24\u6837\u4e1c\u897f\uff1a\u5feb\u901f\u7d22\u5f15\u8bbf\u95ee\uff08\u6570\u7ec4\uff09\u548c\u6309\u952e\u5feb\u901f\u67e5\u627e\uff08\u54c8\u5e0c\u8868\uff09\u3002</p> </li> <li> <p>\u672c\u6587\u4ef6\u6559\u6388\u7684\u662f\u6a21\u5f0f\uff0c\u800c\u975e\u89e3\u6cd5\u3002\u76ee\u6807\u662f\u5f53\u4f60\u770b\u5230\u4e00\u4e2a\u65b0\u95ee\u9898\u65f6\uff0c\u4f60\u80fd\u8bc6\u522b\u51fa\u9002\u7528\u54ea\u4e2a\u6a21\u5f0f\u4ee5\u53ca\u4e3a\u4ec0\u4e48\uff0c\u800c\u4e0d\u662f\u8bd5\u56fe\u56de\u5fc6\u4e00\u4e2a\u80cc\u4e0b\u6765\u7684\u89e3\u6cd5\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#_2","title":"\u6570\u7ec4","text":"<ul> <li> <p>\u6570\u7ec4\u662f\u4e00\u7247\u8fde\u7eed\u7684\u5185\u5b58\u5757\uff0c\u5143\u7d20\u4ee5\u56fa\u5b9a\u504f\u79fb\u91cf\u5b58\u50a8\u3002\u8bbf\u95ee\u5143\u7d20 \\(i\\) \u7684\u6210\u672c\u662f \\(O(1)\\)\uff0c\u56e0\u4e3a\u5730\u5740\u5c31\u662f <code>base + i * element_size</code>\u3002\u8fd9\u662f\u6700\u5feb\u7684\u6570\u636e\u8bbf\u95ee\u65b9\u5f0f\uff0c\u4e5f\u662f\u6570\u7ec4\u6210\u4e3a\u9ed8\u8ba4\u9009\u62e9\u7684\u539f\u56e0\u3002</p> </li> <li> <p>\u52a8\u6001\u6570\u7ec4\uff08Python \u7684 <code>list</code>\u3001Java \u7684 <code>ArrayList</code>\u3001C++ \u7684 <code>vector</code>\uff09\u5728\u6ee1\u65f6\u81ea\u52a8\u589e\u957f\u3002\u5176\u7b56\u7565\u662f\u5e73\u644a\u52a0\u500d\uff1a\u5f53\u6570\u7ec4\u6ee1\u65f6\uff0c\u5206\u914d\u4e00\u4e2a\u4e24\u500d\u5927\u5c0f\u7684\u65b0\u6570\u7ec4\u5e76\u5c06\u6240\u6709\u5143\u7d20\u590d\u5236\u8fc7\u53bb\u3002\u590d\u5236\u6210\u672c\u4e3a \\(O(n)\\)\uff0c\u4f46\u8fd9\u79cd\u60c5\u51b5\u5f88\u5c11\u53d1\u751f\uff08\u6bcf \\(n\\) \u6b21\u63d2\u5165\u4e00\u6b21\uff09\uff0c\u6240\u4ee5\u6bcf\u6b21\u63d2\u5165\u7684\u5e73\u644a\u6210\u672c\u662f \\(O(1)\\)\u3002</p> </li> <li> <p>\u7f13\u5b58\u5c40\u90e8\u6027\u662f\u6570\u7ec4\u5728\u5b9e\u8df5\u4e2d\u5f88\u5feb\u7684\u539f\u56e0\uff0c\u800c\u4e0d\u4ec5\u4ec5\u662f\u7406\u8bba\u4e0a\u3002\u56e0\u4e3a\u5143\u7d20\u662f\u8fde\u7eed\u5b58\u50a8\u7684\uff0c\u8bbf\u95ee\u4e00\u4e2a\u5143\u7d20\u4f1a\u5c06\u5176\u90bb\u8fd1\u5143\u7d20\u52a0\u8f7d\u5230 CPU \u7f13\u5b58\u4e2d\uff08\u7b2c13\u7ae0\uff09\u3002\u904d\u5386\u6570\u7ec4\u662f\u7f13\u5b58\u53cb\u597d\u7684\uff1b\u5728\u94fe\u8868\u4e2d\u8ddf\u968f\u6307\u9488\u5219\u4e0d\u662f\u3002\u8fd9\u4e2a\u5e38\u6570\u56e0\u5b50\u5dee\u5f02\u5728\u5b9e\u9645\u4e2d\u53ef\u80fd\u8fbe\u5230 10-100 \u500d\u3002</p> </li> </ul> \u64cd\u4f5c \u6570\u7ec4 \u52a8\u6001\u6570\u7ec4 \u6309\u7d22\u5f15\u8bbf\u95ee \\(O(1)\\) \\(O(1)\\) \u8ffd\u52a0 \u4e0d\u9002\u7528 \\(O(1)\\) \u5e73\u644a \u5728\u4f4d\u7f6e \\(i\\) \u63d2\u5165 \\(O(n)\\) \\(O(n)\\) \u5728\u4f4d\u7f6e \\(i\\) \u5220\u9664 \\(O(n)\\) \\(O(n)\\) \u641c\u7d22\uff08\u672a\u6392\u5e8f\uff09 \\(O(n)\\) \\(O(n)\\) <ul> <li>\u9677\u9631\uff1a\u5728\u6570\u7ec4\u4e2d\u95f4\u63d2\u5165\u6216\u5220\u9664\u662f \\(O(n)\\)\uff0c\u56e0\u4e3a\u6240\u6709\u540e\u7eed\u5143\u7d20\u90fd\u5fc5\u987b\u79fb\u52a8\u3002\u5982\u679c\u4f60\u9700\u8981\u9891\u7e41\u5728\u4e2d\u95f4\u63d2\u5165\uff0c\u8003\u8651\u4f7f\u7528\u94fe\u8868\u6216\u5176\u4ed6\u65b9\u6cd5\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#_3","title":"\u5b57\u7b26\u4e32","text":"<ul> <li>\u5b57\u7b26\u4e32\u662f\u4e00\u4e2a\u5b57\u7b26\u6570\u7ec4\u3002\u5728 Python \u4e2d\uff0c\u5b57\u7b26\u4e32\u662f\u4e0d\u53ef\u53d8\u7684\uff1a\u6bcf\u6b21\u62fc\u63a5\u90fd\u4f1a\u521b\u5efa\u4e00\u4e2a\u65b0\u7684\u5b57\u7b26\u4e32\u3002\u5728\u5faa\u73af\u4e2d\u9010\u5b57\u7b26\u6784\u5efa\u5b57\u7b26\u4e32\u662f \\(O(n^2)\\)\uff0c\u56e0\u4e3a\u6bcf\u6b21\u62fc\u63a5\u90fd\u4f1a\u590d\u5236\u5230\u76ee\u524d\u4e3a\u6b62\u7684\u6574\u4e2a\u5b57\u7b26\u4e32\u3002</li> </ul> <pre><code># \u4e0d\u597d\uff1aO(n^2) \u5b57\u7b26\u4e32\u62fc\u63a5\ns = \"\"\nfor c in characters:\n    s += c  # \u6bcf\u6b21\u590d\u5236\u6574\u4e2a\u5b57\u7b26\u4e32\n\n# \u597d\uff1aO(n) \u4f7f\u7528\u5217\u8868\u7136\u540e join\nparts = []\nfor c in characters:\n    parts.append(c)\ns = \"\".join(parts)\n</code></pre> <ul> <li> <p>\u9677\u9631\uff1a\u5728 Python \u4e2d\uff0c\u5faa\u73af\u5185\u7684 <code>s += c</code> \u662f\u6700\u5e38\u89c1\u7684\u6027\u80fd bug \u4e4b\u4e00\u3002\u59cb\u7ec8\u5148\u6536\u96c6\u5230\u5217\u8868\u4e2d\u518d <code>.join()</code>\u3002</p> </li> <li> <p>\u7f16\u7801\uff1aASCII \u4f7f\u7528 7 \u4f4d\uff08128 \u4e2a\u5b57\u7b26\uff09\u3002UTF-8 \u662f\u53ef\u53d8\u957f\u5ea6\u7684\uff1aASCII \u5b57\u7b26\u4f7f\u7528 1 \u5b57\u8282\uff0c\u5e26\u91cd\u97f3\u5b57\u7b26\u4f7f\u7528 2 \u5b57\u8282\uff0c\u4e2d\u6587/\u65e5\u6587\u5b57\u7b26\u4f7f\u7528 3 \u5b57\u8282\uff0c\u8868\u60c5\u7b26\u53f7\u4f7f\u7528 4 \u5b57\u8282\u3002\u5f53\u95ee\u9898\u8bf4\"\u5c0f\u5199\u82f1\u6587\u5b57\u6bcd\"\u65f6\uff0c\u5b57\u6bcd\u8868\u5927\u5c0f\u4e3a 26\uff0c\u8fd9\u610f\u5473\u7740\u4f60\u53ef\u4ee5\u4f7f\u7528\u56fa\u5b9a\u5927\u5c0f\u7684\u6570\u7ec4\u800c\u4e0d\u662f\u54c8\u5e0c\u8868\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#_4","title":"\u54c8\u5e0c\u8868","text":"<ul> <li> <p>\u54c8\u5e0c\u8868\u5c06\u952e\u6620\u5c04\u5230\u503c\uff0c\u5e73\u5747\u60c5\u51b5\u4e0b\u7684\u67e5\u627e\u3001\u63d2\u5165\u548c\u5220\u9664\u90fd\u662f \\(O(1)\\)\u3002\u5b83\u901a\u8fc7\u8ba1\u7b97\u4e00\u4e2a\u54c8\u5e0c\u51fd\u6570 \\(h(key)\\) \u5c06\u952e\u8f6c\u6362\u4e3a\u6570\u7ec4\u7d22\u5f15\u6765\u5b9e\u73b0\u3002</p> </li> <li> <p>\u54c8\u5e0c\u51fd\u6570\u5fc5\u987b\uff1a\u786e\u5b9a\u6027\u7684\uff08\u76f8\u540c\u952e\u603b\u662f\u5f97\u5230\u76f8\u540c\u54c8\u5e0c\u503c\uff09\u3001\u5747\u5300\u7684\uff08\u5c06\u952e\u5747\u5300\u5206\u5e03\u5230\u5404\u4e2a\u6876\u4e2d\uff09\u4e14\u8ba1\u7b97\u901f\u5ea6\u5feb\u3002</p> </li> <li> <p>\u51b2\u7a81\u53d1\u751f\u5728\u4e24\u4e2a\u4e0d\u540c\u7684\u952e\u54c8\u5e0c\u5230\u76f8\u540c\u7684\u7d22\u5f15\u65f6\u3002\u6709\u4e24\u79cd\u4e3b\u8981\u7b56\u7565\uff1a</p> <ul> <li> <p>\u94fe\u5730\u5740\u6cd5\uff1a\u6bcf\u4e2a\u6876\u5b58\u50a8\u4e00\u4e2a\u952e\u503c\u5bf9\u94fe\u8868\u3002\u53d1\u751f\u51b2\u7a81\u65f6\uff0c\u8ffd\u52a0\u5230\u94fe\u8868\u3002\u6700\u574f\u60c5\u51b5\uff08\u6240\u6709\u952e\u54c8\u5e0c\u5230\u540c\u4e00\u4e2a\u6876\uff09\uff1a\\(O(n)\\)\u3002\u4f7f\u7528\u597d\u7684\u54c8\u5e0c\u51fd\u6570\u65f6\u7684\u5e73\u5747\u60c5\u51b5\uff1a\\(O(1)\\)\u3002</p> </li> <li> <p>\u5f00\u653e\u5730\u5740\u6cd5\uff1a\u53d1\u751f\u51b2\u7a81\u65f6\uff0c\u63a2\u6d4b\u4e0b\u4e00\u4e2a\u7a7a\u69fd\u3002\u7ebf\u6027\u63a2\u6d4b\u68c0\u67e5\u4e0b\u4e00\u4e2a\u69fd\u4f4d\uff0c\u7136\u540e\u518d\u4e0b\u4e00\u4e2a\uff0c\u4ee5\u6b64\u7c7b\u63a8\u3002\u5b83\u7f13\u5b58\u53cb\u597d\uff0c\u4f46\u4f1a\u906d\u53d7\u805a\u96c6\u95ee\u9898\uff08\u957f\u4e32\u7684\u5df2\u5360\u7528\u69fd\u4f4d\uff09\u3002\u7f57\u5bbe\u6c49\u54c8\u5e0c\u901a\u8fc7\u5c06\"\u79bb\u5bb6\u8f83\u8fd1\"\u7684\u6761\u76ee\u79fb\u4f4d\u6765\u51cf\u5c11\u65b9\u5dee\u3002</p> </li> </ul> </li> <li> <p>\u8d1f\u8f7d\u56e0\u5b50 \\(\\alpha = n / m\\)\uff08\u5143\u7d20\u6570 / \u6876\u6570\uff09\u51b3\u5b9a\u4e86\u6027\u80fd\u3002\u5f53 \\(\\alpha\\) \u8d85\u8fc7\u9608\u503c\uff08\u901a\u5e38\u4e3a 0.75\uff09\u65f6\uff0c\u8868\u4f1a\u91cd\u65b0\u54c8\u5e0c\uff1a\u5206\u914d\u4e00\u4e2a\u66f4\u5927\u7684\u8868\u5e76\u91cd\u65b0\u63d2\u5165\u6240\u6709\u5143\u7d20\u3002\u8fd9\u9700\u8981 \\(O(n)\\) \u65f6\u95f4\uff0c\u4f46\u4e0d\u5e38\u53d1\u751f\u3002</p> </li> <li> <p>\u54c8\u5e0c\u6620\u5c04\uff08Python \u4e2d\u7684 <code>dict</code>\u3001Java \u4e2d\u7684 <code>HashMap</code>\uff09\u5b58\u50a8\u952e\u503c\u5bf9\u3002\u54c8\u5e0c\u96c6\u5408\uff08Python \u4e2d\u7684 <code>set</code>\u3001Java \u4e2d\u7684 <code>HashSet</code>\uff09\u53ea\u5b58\u50a8\u952e\uff08\u7528\u4e8e\u5feb\u901f\u6210\u5458\u6d4b\u8bd5\uff09\u3002</p> </li> </ul> \u64cd\u4f5c \u5e73\u5747 \u6700\u574f\u60c5\u51b5 \u67e5\u627e \\(O(1)\\) \\(O(n)\\) \u63d2\u5165 \\(O(1)\\) \\(O(n)\\) \u5220\u9664 \\(O(1)\\) \\(O(n)\\) <ul> <li> <p>\u5e03\u9686\u8fc7\u6ee4\u5668\u662f\u7a7a\u95f4\u9ad8\u6548\u7684\u6982\u7387\u6027\u96c6\u5408\u3002\u5b83\u53ef\u4ee5\u544a\u8bc9\u4f60\"\u80af\u5b9a\u4e0d\u5728\u96c6\u5408\u4e2d\"\u6216\"\u53ef\u80fd\u5728\u96c6\u5408\u4e2d\"\uff08\u5177\u6709\u53ef\u8c03\u7684\u5047\u9633\u6027\u7387\uff09\u3002\u5b83\u4f7f\u7528 \\(k\\) \u4e2a\u54c8\u5e0c\u51fd\u6570\u548c\u4e00\u4e2a\u4f4d\u6570\u7ec4\u3002\u7528\u4e8e\u6570\u636e\u5e93\uff08\u907f\u514d\u5bf9\u4e0d\u5b58\u5728\u7684\u952e\u8fdb\u884c\u78c1\u76d8\u8bfb\u53d6\uff09\u3001Web \u7f13\u5b58\u548c\u62fc\u5199\u68c0\u67e5\u5668\u3002</p> </li> <li> <p>\u4f55\u65f6\u4f7f\u7528\u54c8\u5e0c\u8868\uff1a\u6bcf\u5f53\u4f60\u9700\u8981\u7528 \\(O(1)\\) \u7684\u65f6\u95f4\u56de\u7b54\"\u6211\u4e4b\u524d\u89c1\u8fc7\u8fd9\u4e2a\u5417\uff1f\"\u6216\"\u4e0e\u8fd9\u4e2a\u952e\u5173\u8054\u7684\u8ba1\u6570/\u7d22\u5f15/\u503c\u662f\u4ec0\u4e48\uff1f\"\u65f6\u3002\u5982\u679c\u4f60\u6b63\u5728\u53cd\u590d\u8fdb\u884c\u7ebf\u6027\u626b\u63cf\u5bfb\u627e\u67d0\u7269\uff0c\u54c8\u5e0c\u8868\u51e0\u4e4e\u603b\u80fd\u4f7f\u5176\u66f4\u5feb\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#_5","title":"\u6a21\u5f0f\uff1a\u54c8\u5e0c\u8868\u67e5\u627e","text":"<ul> <li>\u6700\u57fa\u672c\u7684\u6a21\u5f0f\uff1a\u4f7f\u7528\u54c8\u5e0c\u8868\u5c06 \\(O(n)\\) \u626b\u63cf\u66ff\u6362\u4e3a \\(O(1)\\) \u67e5\u627e\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#_6","title":"\u7b80\u5355\uff1a\u4e24\u6570\u4e4b\u548c","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u7ed9\u5b9a\u4e00\u4e2a\u6574\u6570\u6570\u7ec4\u548c\u4e00\u4e2a\u76ee\u6807\u503c\uff0c\u8fd4\u56de\u4e24\u4e2a\u6570\u7684\u7d22\u5f15\uff0c\u4f7f\u5b83\u4eec\u7684\u548c\u7b49\u4e8e\u76ee\u6807\u503c\u3002</p> </li> <li> <p>\u66b4\u529b\u89e3\u6cd5 \\(O(n^2)\\)\uff1a\u68c0\u67e5\u6bcf\u4e00\u5bf9\u3002</p> </li> <li> <p>\u6a21\u5f0f\u6d1e\u5bdf\uff1a\u5bf9\u4e8e\u6bcf\u4e2a\u6570\u5b57 <code>num</code>\uff0c\u9700\u8981 <code>target - num</code> \u5b58\u5728\u4e8e\u6570\u7ec4\u4e2d\u7684\u67d0\u5904\u3002\u4e0e\u5176\u626b\u63cf\u6570\u7ec4\u5bfb\u627e\u5b83\uff0c\u4e0d\u5982\u5c06\u4e4b\u524d\u89c1\u8fc7\u7684\u6570\u5b57\u5b58\u50a8\u5728\u4e00\u4e2a\u54c8\u5e0c\u8868\u4e2d\u3002</p> </li> </ul> <pre><code>def two_sum(nums, target):\n    seen = {}  # \u503c -&gt; \u7d22\u5f15\n    for i, num in enumerate(nums):\n        complement = target - num\n        if complement in seen:\n            return [seen[complement], i]\n        seen[num] = i\n</code></pre> <ul> <li> <p>\u4e3a\u4ec0\u4e48\u6709\u6548\uff1a\u4e00\u6b21\u904d\u5386\u6570\u7ec4\u3002\u5bf9\u4e8e\u6bcf\u4e2a\u5143\u7d20\uff0c\u54c8\u5e0c\u8868\u67e5\u627e\u662f \\(O(1)\\)\u3002\u603b\u8ba1\uff1a\\(O(n)\\) \u65f6\u95f4\uff0c\\(O(n)\\) \u7a7a\u95f4\u3002</p> </li> <li> <p>\u9677\u9631\uff1a\u5728\u68c0\u67e5\u8865\u6570\u4e4b\u524d\u4e0d\u8981\u5c06\u5f53\u524d\u6570\u5b57\u6dfb\u52a0\u5230\u54c8\u5e0c\u8868\uff0c\u5426\u5219\u53ef\u80fd\u4f1a\u8ba9\u5143\u7d20\u4e0e\u81ea\u8eab\u5339\u914d\u3002\u4e0a\u9762\u4ee3\u7801\u4e2d\u7684\u987a\u5e8f\u662f\u6b63\u786e\u7684\uff1a\u5148\u68c0\u67e5\uff0c\u540e\u63d2\u5165\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#_7","title":"\u4e2d\u7b49\uff1a\u5b57\u6bcd\u5f02\u4f4d\u8bcd\u5206\u7ec4","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u7ed9\u5b9a\u4e00\u4e2a\u5b57\u7b26\u4e32\u5217\u8868\uff0c\u5c06\u5b57\u6bcd\u5f02\u4f4d\u8bcd\u5206\u7ec4\u5728\u4e00\u8d77\u3002\uff08\"eat\"\u3001\"tea\"\u3001\"ate\"\uff09\u662f\u4e00\u7ec4\u3002</p> </li> <li> <p>\u6a21\u5f0f\u6d1e\u5bdf\uff1a\u5f02\u4f4d\u8bcd\u5177\u6709\u76f8\u540c\u7684\u5b57\u7b26\u4f46\u987a\u5e8f\u4e0d\u540c\u3002\u5982\u679c\u5bf9\u6bcf\u4e2a\u5b57\u7b26\u4e32\u8fdb\u884c\u6392\u5e8f\uff0c\u5f02\u4f4d\u8bcd\u4f1a\u4ea7\u751f\u76f8\u540c\u7684\u6392\u5e8f\u540e\u952e\u3002\u4f7f\u7528\u8fd9\u4e2a\u6392\u5e8f\u540e\u7684\u952e\u4f5c\u4e3a\u54c8\u5e0c\u8868\u7684\u952e\u3002</p> </li> </ul> <pre><code>from collections import defaultdict\n\ndef group_anagrams(strs):\n    groups = defaultdict(list)\n    for s in strs:\n        key = tuple(sorted(s))  # \u6216\u4f7f\u7528\u5b57\u7b26\u8ba1\u6570\u5143\u7ec4\n        groups[key].append(s)\n    return list(groups.values())\n</code></pre> <ul> <li>\u4f18\u5316\uff1a\u5bf9\u6bcf\u4e2a\u5b57\u7b26\u4e32\u6392\u5e8f\u9700\u8981 \\(O(k \\log k)\\)\uff0c\u5176\u4e2d \\(k\\) \u662f\u5b57\u7b26\u4e32\u957f\u5ea6\u3002\u4e3a\u4e86\u66f4\u5feb\u7684\u952e\uff0c\u7edf\u8ba1\u5b57\u7b26\u9891\u7387\u5e76\u4f7f\u7528\u8ba1\u6570\u5143\u7ec4\u4f5c\u4e3a\u952e\uff1a</li> </ul> <pre><code>def group_anagrams_fast(strs):\n    groups = defaultdict(list)\n    for s in strs:\n        count = [0] * 26\n        for c in s:\n            count[ord(c) - ord('a')] += 1\n        groups[tuple(count)].append(s)\n    return list(groups.values())\n</code></pre> <ul> <li> <p>\u8fd9\u6837\u6bcf\u4e2a\u5b57\u7b26\u4e32\u662f \\(O(k)\\) \u800c\u4e0d\u662f \\(O(k \\log k)\\)\u3002\u5b57\u7b26\u8ba1\u6570\u5143\u7ec4\u662f\u4e00\u79cd\u89c4\u8303\u5f62\u5f0f\uff1a\u5bf9\u7ec4\u5185\u6240\u6709\u6210\u5458\u90fd\u76f8\u540c\u7684\u8868\u793a\u3002</p> </li> <li> <p>\u9677\u9631\uff1a\u5728 Python \u4e2d\uff0c\u5217\u8868\u4e0d\u53ef\u54c8\u5e0c\uff08\u4e0d\u80fd\u7528\u4f5c\u5b57\u5178\u952e\uff09\u3002\u4f60\u5fc5\u987b\u8f6c\u6362\u4e3a\u5143\u7ec4\u3002\u5f53\u4eba\u4eec\u5c1d\u8bd5 <code>groups[count].append(s)</code> \u65f6\u5c31\u4f1a\u51fa\u9519\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#_8","title":"\u56f0\u96be\uff1a\u6700\u957f\u8fde\u7eed\u5e8f\u5217","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u7ed9\u5b9a\u4e00\u4e2a\u672a\u6392\u5e8f\u7684\u6570\u7ec4\uff0c\u627e\u51fa\u6700\u957f\u8fde\u7eed\u5e8f\u5217\u7684\u957f\u5ea6\uff08\u4f8b\u5982\uff0c[100, 4, 200, 1, 3, 2] \u2192 4\uff0c\u56e0\u4e3a [1, 2, 3, 4]\uff09\u3002</p> </li> <li> <p>\u66b4\u529b\u89e3\u6cd5 \\(O(n \\log n)\\)\uff1a\u5bf9\u6570\u7ec4\u6392\u5e8f\uff0c\u7136\u540e\u626b\u63cf\u8fde\u7eed\u6bb5\u3002</p> </li> <li> <p>\u6a21\u5f0f\u6d1e\u5bdf\uff1a\u5c06\u6240\u6709\u6570\u5b57\u653e\u5165\u54c8\u5e0c\u96c6\u4ee5\u5b9e\u73b0 \\(O(1)\\) \u67e5\u627e\u3002\u5bf9\u4e8e\u6bcf\u4e2a\u6570\u5b57\uff0c\u68c0\u67e5\u5b83\u662f\u5426\u662f\u4e00\u4e2a\u5e8f\u5217\u7684\u8d77\u70b9\uff08\u5373 <code>num - 1</code> \u4e0d\u5728\u96c6\u5408\u4e2d\uff09\u3002\u5982\u679c\u662f\uff0c\u5219\u8ba1\u7b97\u8be5\u5e8f\u5217\u80fd\u5ef6\u4f38\u591a\u8fdc\u3002</p> </li> </ul> <pre><code>def longest_consecutive(nums):\n    num_set = set(nums)\n    best = 0\n\n    for num in num_set:\n        # \u53ea\u4ece\u5e8f\u5217\u7684\u5f00\u5934\u5f00\u59cb\u8ba1\u6570\n        if num - 1 not in num_set:\n            length = 1\n            while num + length in num_set:\n                length += 1\n            best = max(best, length)\n\n    return best\n</code></pre> <ul> <li> <p>\u4e3a\u4ec0\u4e48\u662f \\(O(n)\\)\uff1a\u5185\u90e8 <code>while</code> \u5faa\u73af\u5728\u6240\u6709\u8fed\u4ee3\u4e2d\u603b\u5171\u6700\u591a\u8fd0\u884c \\(n\\) \u6b21\uff08\u6bcf\u4e2a\u6570\u5b57\u6700\u591a\u88ab\u8bbf\u95ee\u4e24\u6b21\uff1a\u4e00\u6b21\u5728\u5916\u5c42\u5faa\u73af\uff0c\u4e00\u6b21\u5728 <code>while</code> \u6269\u5c55\u4e2d\uff09\u3002<code>if num - 1 not in num_set</code> \u5b88\u536b\u786e\u4fdd\u6211\u4eec\u53ea\u4ece\u5e8f\u5217\u8d77\u70b9\u5f00\u59cb\u8ba1\u6570\u3002</p> </li> <li> <p>\u9677\u9631\uff1a\u5982\u679c\u6ca1\u6709 <code>if num - 1 not in num_set</code> \u68c0\u67e5\uff0c\u4f60\u4f1a\u4ece\u6bcf\u4e2a\u5143\u7d20\u5f00\u59cb\u8ba1\u6570\uff0c\u5728\u6700\u574f\u60c5\u51b5\u4e0b\u4f1a\u53d8\u6210 \\(O(n^2)\\)\uff08\u4f8b\u5982\uff0c[1, 2, 3, ..., n] \u4f1a\u4ece\u6bcf\u4e2a\u8d77\u70b9\u626b\u63cf\u6574\u4e2a\u5e8f\u5217\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#_9","title":"\u6a21\u5f0f\uff1a\u53cc\u6307\u9488","text":"<ul> <li> <p>\u53cc\u6307\u9488\u6a21\u5f0f\u4f7f\u7528\u4e24\u4e2a\u7d22\u5f15\u5728\u6570\u7ec4\u4e2d\u79fb\u52a8\uff0c\u901a\u5e38\u4ece\u4e24\u7aef\u5411\u4e2d\u95f4\u6216\u4ece\u540c\u7aef\u4ee5\u4e0d\u540c\u901f\u5ea6\u79fb\u52a8\u3002\u5b83\u5728\u6570\u7ec4\u5df2\u6392\u5e8f\u6216\u9700\u8981\u6bd4\u8f83\u6210\u5bf9\u5143\u7d20\u65f6\u6709\u6548\u3002</p> </li> <li> <p>\u4f55\u65f6\u4f7f\u7528\uff1a\u95ee\u9898\u6d89\u53ca\u6210\u5bf9\u3001\u5b50\u6570\u7ec4\u6216\u5206\u533a\uff0c\u5e76\u4e14\u6570\u7ec4\u5df2\u6392\u5e8f\uff08\u6216\u53ef\u5728\u4e0d\u4e22\u5931\u6240\u9700\u4fe1\u606f\u7684\u60c5\u51b5\u4e0b\u6392\u5e8f\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#_10","title":"\u7b80\u5355\uff1a\u9a8c\u8bc1\u56de\u6587\u4e32","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u5224\u65ad\u4e00\u4e2a\u5b57\u7b26\u4e32\u662f\u5426\u662f\u56de\u6587\u4e32\uff0c\u53ea\u8003\u8651\u5b57\u6bcd\u6570\u5b57\u5b57\u7b26\u5e76\u5ffd\u7565\u5927\u5c0f\u5199\u3002</p> </li> <li> <p>\u6a21\u5f0f\uff1a\u4e00\u4e2a\u6307\u9488\u5728\u5f00\u5934\uff0c\u4e00\u4e2a\u5728\u7ed3\u5c3e\u3002\u5411\u4e2d\u95f4\u79fb\u52a8\uff0c\u6bd4\u8f83\u5b57\u7b26\u3002</p> </li> </ul> <pre><code>def is_palindrome(s):\n    left, right = 0, len(s) - 1\n\n    while left &lt; right:\n        # \u8df3\u8fc7\u975e\u5b57\u6bcd\u6570\u5b57\u5b57\u7b26\n        while left &lt; right and not s[left].isalnum():\n            left += 1\n        while left &lt; right and not s[right].isalnum():\n            right -= 1\n\n        if s[left].lower() != s[right].lower():\n            return False\n\n        left += 1\n        right -= 1\n\n    return True\n</code></pre> <ul> <li>\u9677\u9631\uff1a\u5fd8\u8bb0\u5185\u90e8 while \u5faa\u73af\u4e2d\u7684 <code>left &lt; right</code> \u68c0\u67e5\u3002\u6ca1\u6709\u5b83\uff0c\u5728\u50cf \"!!!\"\uff08\u5168\u90e8\u975e\u5b57\u6bcd\u6570\u5b57\uff09\u8fd9\u6837\u7684\u5b57\u7b26\u4e32\u4e0a\u6307\u9488\u53ef\u80fd\u8d8a\u754c\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#_11","title":"\u4e2d\u7b49\uff1a\u4e09\u6570\u4e4b\u548c","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u627e\u51fa\u6570\u7ec4\u4e2d\u6240\u6709\u552f\u4e00\u7684\u4e09\u5143\u7ec4\uff0c\u4f7f\u5176\u548c\u4e3a\u96f6\u3002</p> </li> <li> <p>\u6a21\u5f0f\uff1a\u5bf9\u6570\u7ec4\u6392\u5e8f\u3002\u56fa\u5b9a\u4e00\u4e2a\u5143\u7d20\uff0c\u7136\u540e\u5728\u5269\u4f59\u90e8\u5206\u4f7f\u7528\u53cc\u6307\u9488\u627e\u5230\u548c\u4e3a\u56fa\u5b9a\u5143\u7d20\u76f8\u53cd\u6570\u7684\u5bf9\u3002</p> </li> </ul> <pre><code>def three_sum(nums):\n    nums.sort()\n    result = []\n\n    for i in range(len(nums) - 2):\n        # \u8df3\u8fc7\u91cd\u590d\u7684\u56fa\u5b9a\u5143\u7d20\n        if i &gt; 0 and nums[i] == nums[i - 1]:\n            continue\n\n        left, right = i + 1, len(nums) - 1\n        target = -nums[i]\n\n        while left &lt; right:\n            total = nums[left] + nums[right]\n            if total &lt; target:\n                left += 1\n            elif total &gt; target:\n                right -= 1\n            else:\n                result.append([nums[i], nums[left], nums[right]])\n                # \u8df3\u8fc7\u91cd\u590d\u9879\n                while left &lt; right and nums[left] == nums[left + 1]:\n                    left += 1\n                while left &lt; right and nums[right] == nums[right - 1]:\n                    right -= 1\n                left += 1\n                right -= 1\n\n    return result\n</code></pre> <ul> <li> <p>\u4e3a\u4ec0\u4e48\u6709\u6548\uff1a\u6392\u5e8f\u662f \\(O(n \\log n)\\)\u3002\u5bf9\u4e8e\u6bcf\u4e2a\u56fa\u5b9a\u5143\u7d20\uff0c\u53cc\u6307\u9488\u626b\u63cf\u662f \\(O(n)\\)\u3002\u603b\u8ba1\uff1a\\(O(n^2)\\)\uff0c\u8fd9\u662f\u8be5\u95ee\u9898\u7684\u6700\u4f18\u89e3\uff08\u4f60\u5fc5\u987b\u8003\u8651\u6240\u6709\u6210\u5bf9\u7ec4\u5408\uff09\u3002</p> </li> <li> <p>\u9677\u9631\uff1a\u5904\u7406\u91cd\u590d\u9879\u662f\u6700\u96be\u7684\u90e8\u5206\u3002\u6ca1\u6709\u8df3\u8fc7\u91cd\u590d\u7684\u903b\u8f91\uff08\u5bf9\u56fa\u5b9a\u5143\u7d20\u548c\u53cc\u6307\u9488\u7ed3\u679c\u90fd\u662f\u5982\u6b64\uff09\uff0c\u4f60\u4f1a\u8fd4\u56de\u91cd\u590d\u7684\u4e09\u5143\u7ec4\u3002<code>if i &gt; 0 and nums[i] == nums[i-1]: continue</code> \u8fd9\u884c\u81f3\u5173\u91cd\u8981\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#_12","title":"\u56f0\u96be\uff1a\u63a5\u96e8\u6c34","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u7ed9\u5b9a\u4e00\u4e2a\u9ad8\u5ea6\u56fe\uff08\u975e\u8d1f\u6574\u6570\u6570\u7ec4\uff09\uff0c\u8ba1\u7b97\u4e0b\u96e8\u540e\u5b83\u80fd\u63a5\u4f4f\u591a\u5c11\u6c34\u3002</p> </li> <li> <p>\u6a21\u5f0f\u6d1e\u5bdf\uff1a\u5bf9\u4e8e\u6bcf\u4e2a\u4f4d\u7f6e\uff0c\u6c34\u4f4d\u7531\u5b83\u5de6\u8fb9\u6700\u5927\u9ad8\u5ea6\u548c\u53f3\u8fb9\u6700\u5927\u9ad8\u5ea6\u4e2d\u7684\u6700\u5c0f\u503c\u51cf\u53bb\u5f53\u524d\u9ad8\u5ea6\u51b3\u5b9a\u3002\u4ece\u4e24\u7aef\u5f00\u59cb\u7684\u53cc\u6307\u9488\u8ddf\u8e2a\u8fd9\u4e9b\u8fd0\u884c\u4e2d\u7684\u6700\u5927\u503c\u3002</p> </li> </ul> <pre><code>def trap(height):\n    left, right = 0, len(height) - 1\n    left_max, right_max = 0, 0\n    water = 0\n\n    while left &lt; right:\n        if height[left] &lt; height[right]:\n            if height[left] &gt;= left_max:\n                left_max = height[left]\n            else:\n                water += left_max - height[left]\n            left += 1\n        else:\n            if height[right] &gt;= right_max:\n                right_max = height[right]\n            else:\n                water += right_max - height[right]\n            right -= 1\n\n    return water\n</code></pre> <ul> <li> <p>\u4e3a\u4ec0\u4e48\u6709\u6548\uff1a\u5173\u952e\u7684\u6d1e\u5bdf\u662f\uff0c\u5982\u679c <code>height[left] &lt; height[right]</code>\uff0c\u90a3\u4e48\u4f4d\u7f6e <code>left</code> \u5904\u7684\u6c34\u7531 <code>left_max</code> \u9650\u5236\uff08\u6211\u4eec\u77e5\u9053\u53f3\u8fb9\u6709\u66f4\u9ad8\u7684\u67f1\u5b50\uff0c\u6240\u4ee5\u53f3\u8fb9\u4e0d\u53ef\u80fd\u662f\u74f6\u9888\uff09\u3002\u6211\u4eec\u5904\u7406\u8f83\u77ed\u7684\u4e00\u4fa7\uff0c\u4fdd\u8bc1\u53e6\u4e00\u4fa7\u6709\u66f4\u9ad8\u7684\u67f1\u5b50\u3002</p> </li> <li> <p>\u9677\u9631\uff1a\u5f88\u591a\u4eba\u8bd5\u56fe\u5148\u9884\u8ba1\u7b97 <code>left_max[i]</code> \u548c <code>right_max[i]</code> \u6570\u7ec4\uff08\u8fd9\u53ef\u884c\u4f46\u4f7f\u7528 \\(O(n)\\) \u7a7a\u95f4\uff09\u3002\u53cc\u6307\u9488\u65b9\u6cd5\u5b9e\u73b0\u4e86 \\(O(1)\\) \u7a7a\u95f4\u3002\u53e6\u5916\uff0c\u5728\u6700\u5927\u503c\u66f4\u65b0\u4e2d\u6df7\u6dc6 <code>&gt;=</code> \u548c <code>&gt;</code> \u4f1a\u5bfc\u81f4\u5dee\u4e00\u9519\u8bef\u7684\u6c34\u91cf\u8ba1\u7b97\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#_13","title":"\u6a21\u5f0f\uff1a\u6ed1\u52a8\u7a97\u53e3","text":"<ul> <li> <p>\u6ed1\u52a8\u7a97\u53e3\u6a21\u5f0f\u7ef4\u62a4\u4e00\u4e2a\u7a97\u53e3\uff08\u8fde\u7eed\u5b50\u6570\u7ec4\uff09\uff0c\u968f\u7740\u8fed\u4ee3\u6269\u5c55\u548c\u6536\u7f29\u3002\u5b83\u9002\u7528\u4e8e\u8be2\u95ee\u6ee1\u8db3\u67d0\u4e2a\u6761\u4ef6\u7684\u5b50\u6570\u7ec4\u6216\u5b50\u4e32\u7684\u95ee\u9898\u3002</p> </li> <li> <p>\u4f55\u65f6\u4f7f\u7528\uff1a\u95ee\u9898\u8981\u6c42\u6ee1\u8db3\u7ea6\u675f\u6761\u4ef6\u7684\u6700\u957f/\u6700\u77ed\u5b50\u6570\u7ec4\u6216\u5b50\u4e32\uff0c\u4e14\u6269\u5c55/\u6536\u7f29\u7a97\u53e3\u662f\u5355\u8c03\u7684\uff08\u6dfb\u52a0\u5143\u7d20\u53ea\u80fd\u4f7f\u7ea6\u675f\u66f4\u96be/\u66f4\u5bb9\u6613\u6ee1\u8db3\uff0c\u800c\u4e0d\u662f\u4e24\u8005\u517c\u6709\uff09\u3002</p> </li> <li> <p>\u6a21\u677f\uff1a</p> </li> </ul> <pre><code>def sliding_window(arr):\n    left = 0\n    state = ...  # \u7a97\u53e3\u72b6\u6001\uff08\u8ba1\u6570\u3001\u548c\u7b49\uff09\n    best = ...\n\n    for right in range(len(arr)):\n        # \u6269\u5c55\uff1a\u5c06 arr[right] \u6dfb\u52a0\u5230\u7a97\u53e3\u72b6\u6001\n        update_state(state, arr[right])\n\n        # \u6536\u7f29\uff1a\u5f53\u7ea6\u675f\u88ab\u8fdd\u53cd\u65f6\u4ece\u5de6\u4fa7\u7f29\u5c0f\n        while constraint_violated(state):\n            remove_from_state(state, arr[left])\n            left += 1\n\n        # \u66f4\u65b0\u7b54\u6848\n        best = max(best, right - left + 1)  # \u6216 min\uff0c\u53d6\u51b3\u4e8e\u95ee\u9898\n\n    return best\n</code></pre>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#_14","title":"\u7b80\u5355\uff1a\u4e70\u5356\u80a1\u7968\u7684\u6700\u4f73\u65f6\u673a","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u7ed9\u5b9a\u6bcf\u65e5\u4ef7\u683c\uff0c\u627e\u51fa\u4e00\u7b14\u4ea4\u6613\uff08\u5148\u4e70\u540e\u5356\uff09\u7684\u6700\u5927\u5229\u6da6\u3002</p> </li> <li> <p>\u6a21\u5f0f\uff1a\u8ddf\u8e2a\u5230\u76ee\u524d\u4e3a\u6b62\u7684\u6700\u5c0f\u4ef7\u683c\uff08\u7a97\u53e3\u7684\u5de6\u8fb9\u754c\uff09\uff0c\u5e76\u5728\u6bcf\u4e00\u5929\u8ba1\u7b97\u5229\u6da6\u3002</p> </li> </ul> <pre><code>def max_profit(prices):\n    min_price = float('inf')\n    max_profit = 0\n\n    for price in prices:\n        min_price = min(min_price, price)\n        max_profit = max(max_profit, price - min_price)\n\n    return max_profit\n</code></pre> <ul> <li>\u8fd9\u662f\u4e00\u4e2a\u9000\u5316\u7684\u6ed1\u52a8\u7a97\u53e3\uff1a\u5de6\u6307\u9488\uff08\u6700\u4f4e\u4ef7\u683c\uff09\u53ea\u5728\u627e\u5230\u65b0\u6700\u5c0f\u503c\u65f6\u5411\u524d\u79fb\u52a8\u3002\\(O(n)\\) \u65f6\u95f4\uff0c\\(O(1)\\) \u7a7a\u95f4\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#_15","title":"\u4e2d\u7b49\uff1a\u65e0\u91cd\u590d\u5b57\u7b26\u7684\u6700\u957f\u5b50\u4e32","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u627e\u51fa\u4e0d\u542b\u91cd\u590d\u5b57\u7b26\u7684\u6700\u957f\u5b50\u4e32\u7684\u957f\u5ea6\u3002</p> </li> <li> <p>\u6a21\u5f0f\uff1a\u901a\u8fc7\u79fb\u52a8 <code>right</code> \u6269\u5c55\u7a97\u53e3\u3002\u5f53\u53d1\u73b0\u91cd\u590d\u65f6\uff0c\u4ece\u5de6\u4fa7\u6536\u7f29\u76f4\u5230\u91cd\u590d\u88ab\u79fb\u9664\u3002</p> </li> </ul> <pre><code>def length_of_longest_substring(s):\n    char_index = {}  # \u5b57\u7b26 -&gt; \u5b83\u7684\u6700\u8fd1\u7d22\u5f15\n    left = 0\n    best = 0\n\n    for right, char in enumerate(s):\n        if char in char_index and char_index[char] &gt;= left:\n            left = char_index[char] + 1  # \u8df3\u8fc7\u91cd\u590d\u5b57\u7b26\n\n        char_index[char] = right\n        best = max(best, right - left + 1)\n\n    return best\n</code></pre> <ul> <li> <p>\u4e3a\u4ec0\u4e48\u9700\u8981 <code>char_index[char] &gt;= left</code>\uff1a\u8be5\u5b57\u7b26\u53ef\u80fd\u6765\u81ea\u5f53\u524d\u7a97\u53e3\u5f00\u59cb\u4e4b\u524d\u7684\u6620\u5c04\u3002\u6ca1\u6709\u8fd9\u4e2a\u68c0\u67e5\uff0c\u4f60\u4f1a\u9519\u8bef\u5730\u4e3a\u5f53\u524d\u7a97\u53e3\u4e2d\u5b9e\u9645\u4e0d\u5b58\u5728\u7684\u5b57\u7b26\u6536\u7f29\u7a97\u53e3\u3002</p> </li> <li> <p>\u9677\u9631\uff1a\u4f7f\u7528\u96c6\u5408\u5e76\u4ece\u5de6\u9010\u4e2a\u5220\u9664\u5b57\u7b26\u662f\u6b63\u786e\u7684\u4f46\u8f83\u6162\u3002\u54c8\u5e0c\u8868\u65b9\u6cd5\u76f4\u63a5\u8df3\u5230\u6b63\u786e\u7684\u4f4d\u7f6e\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#_16","title":"\u56f0\u96be\uff1a\u6700\u5c0f\u8986\u76d6\u5b50\u4e32","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u7ed9\u5b9a\u5b57\u7b26\u4e32 <code>s</code> \u548c <code>t</code>\uff0c\u5728 <code>s</code> \u4e2d\u627e\u5230\u5305\u542b <code>t</code> \u4e2d\u6240\u6709\u5b57\u7b26\u7684\u6700\u5c0f\u7a97\u53e3\u3002</p> </li> <li> <p>\u6a21\u5f0f\uff1a\u6269\u5c55\u7a97\u53e3\u4ee5\u5305\u542b\u6240\u6709\u5fc5\u9700\u7684\u5b57\u7b26\uff0c\u7136\u540e\u4ece\u5de6\u4fa7\u6536\u7f29\u4ee5\u627e\u5230\u6700\u5c0f\u6709\u6548\u7a97\u53e3\u3002</p> </li> </ul> <pre><code>from collections import Counter\n\ndef min_window(s, t):\n    if not t or not s:\n        return \"\"\n\n    need = Counter(t)       # \u6211\u4eec\u9700\u8981\u7684\u5b57\u7b26\u53ca\u5176\u8ba1\u6570\n    have = 0                # \u6211\u4eec\u5df2\u7ecf\u62e5\u6709\u8db3\u591f\u6570\u91cf\u7684\u552f\u4e00\u5b57\u7b26\u6570\n    required = len(need)    # \u6211\u4eec\u9700\u8981\u591a\u5c11\u79cd\u552f\u4e00\u5b57\u7b26\n\n    left = 0\n    best = (float('inf'), 0, 0)  # (\u957f\u5ea6, \u5de6, \u53f3)\n\n    window_counts = {}\n\n    for right in range(len(s)):\n        char = s[right]\n        window_counts[char] = window_counts.get(char, 0) + 1\n\n        # \u68c0\u67e5\u6b64\u5b57\u7b26\u7684\u8ba1\u6570\u662f\u5426\u6ee1\u8db3\u8981\u6c42\n        if char in need and window_counts[char] == need[char]:\n            have += 1\n\n        # \u5f53\u7a97\u53e3\u6709\u6548\u65f6\u4ece\u5de6\u4fa7\u6536\u7f29\n        while have == required:\n            # \u66f4\u65b0\u6700\u4f73\u503c\n            if (right - left + 1) &lt; best[0]:\n                best = (right - left + 1, left, right)\n\n            # \u79fb\u9664\u6700\u5de6\u8fb9\u7684\u5b57\u7b26\n            left_char = s[left]\n            window_counts[left_char] -= 1\n            if left_char in need and window_counts[left_char] &lt; need[left_char]:\n                have -= 1\n            left += 1\n\n    length, start, end = best\n    return s[start:end + 1] if length != float('inf') else \"\"\n</code></pre> <ul> <li> <p>\u9677\u9631\uff1a<code>have</code> \u8ba1\u6570\u5668\u662f\u5173\u952e\u4f18\u5316\u3002\u6ca1\u6709\u5b83\uff0c\u4f60\u9700\u8981\u5728\u6bcf\u4e00\u6b65\u6bd4\u8f83\u6574\u4e2a <code>window_counts</code> \u5b57\u5178\u4e0e <code>need</code>\uff0c\u6bcf\u6b21\u6bd4\u8f83\u662f \\(O(|\\text{unique chars}|)\\)\u3002<code>have</code> \u8ba1\u6570\u5668\u4f7f\u6709\u6548\u6027\u68c0\u67e5\u53d8\u4e3a \\(O(1)\\)\u3002</p> </li> <li> <p>\u9677\u9631\uff1a\u68c0\u67e5 <code>window_counts[char] == need[char]</code>\uff08\u800c\u4e0d\u662f <code>&gt;=</code>\uff09\u786e\u4fdd\u6211\u4eec\u6bcf\u4e2a\u5b57\u7b26\u53ea\u9012\u589e\u4e00\u6b21 <code>have</code>\u3002\u5982\u679c\u4f7f\u7528 <code>&gt;=</code>\uff0c\u6211\u4eec\u4f1a\u591a\u8ba1\u6570\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#_17","title":"\u6a21\u5f0f\uff1a\u524d\u7f00\u548c","text":"<ul> <li>\u524d\u7f00\u548c\u6570\u7ec4\u5b58\u50a8\u7d2f\u79ef\u548c\uff1a<code>prefix[i] = sum(arr[0:i])</code>\u3002\u4e00\u65e6\u5728 \\(O(n)\\) \u65f6\u95f4\u5185\u6784\u5efa\u5b8c\u6210\uff0c\u4efb\u4f55\u5b50\u6570\u7ec4\u548c\u90fd\u53ef\u4ee5\u5728 \\(O(1)\\) \u65f6\u95f4\u5185\u8ba1\u7b97\uff1a<code>sum(arr[l:r]) = prefix[r] - prefix[l]</code>\u3002</li> </ul> <pre><code>def build_prefix(arr):\n    prefix = [0] * (len(arr) + 1)\n    for i in range(len(arr)):\n        prefix[i + 1] = prefix[i] + arr[i]\n    return prefix\n\n# arr[l:r] \u7684\u548c\uff08\u5305\u542b l\uff0c\u4e0d\u5305\u542b r\uff09\ndef range_sum(prefix, l, r):\n    return prefix[r] - prefix[l]\n</code></pre> <ul> <li>\u4f55\u65f6\u4f7f\u7528\uff1a\u95ee\u9898\u6d89\u53ca\u591a\u4e2a\u5b50\u6570\u7ec4\u548c\u67e5\u8be2\uff0c\u6216\u5bfb\u627e\u5177\u6709\u7279\u5b9a\u548c\u7684\u5b50\u6570\u7ec4\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#_18","title":"\u7b80\u5355\uff1a\u533a\u95f4\u6c42\u548c\u67e5\u8be2","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u7ed9\u5b9a\u4e00\u4e2a\u6570\u7ec4\uff0c\u56de\u7b54\u591a\u4e2a\"\u4ece\u7d22\u5f15 \\(l\\) \u5230 \\(r\\) \u7684\u548c\u662f\u591a\u5c11\uff1f\"\u7684\u67e5\u8be2\u3002</p> </li> <li> <p>\u6ca1\u6709\u524d\u7f00\u548c\uff1a\u6bcf\u4e2a\u67e5\u8be2\u662f \\(O(n)\\)\u3002\u6709\u524d\u7f00\u548c\uff1a\\(O(n)\\) \u9884\u8ba1\u7b97\uff0c\u7136\u540e\u6bcf\u4e2a\u67e5\u8be2 \\(O(1)\\)\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#k","title":"\u4e2d\u7b49\uff1a\u548c\u4e3a K \u7684\u5b50\u6570\u7ec4","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u7edf\u8ba1\u6709\u591a\u5c11\u4e2a\u8fde\u7eed\u5b50\u6570\u7ec4\u7684\u548c\u7b49\u4e8e \\(k\\)\u3002</p> </li> <li> <p>\u6a21\u5f0f\u6d1e\u5bdf\uff1a\u4ece\u7d22\u5f15 \\(l\\) \u5230 \\(r\\) \u7684\u5b50\u6570\u7ec4\u548c\u7b49\u4e8e <code>prefix[r+1] - prefix[l]</code>\u3002\u6211\u4eec\u5e0c\u671b\u8fd9\u4e2a\u503c\u7b49\u4e8e \\(k\\)\uff0c\u6240\u4ee5 <code>prefix[l] = prefix[r+1] - k</code>\u3002\u5bf9\u4e8e\u6bcf\u4e2a\u4f4d\u7f6e\uff0c\u4f7f\u7528\u54c8\u5e0c\u8868\u7edf\u8ba1\u591a\u5c11\u4e2a\u66f4\u65e9\u7684\u524d\u7f00\u548c\u7b49\u4e8e <code>current_prefix - k</code>\u3002</p> </li> </ul> <pre><code>def subarray_sum(nums, k):\n    count = 0\n    prefix = 0\n    prefix_counts = {0: 1}  # \u7a7a\u524d\u7f00\u548c\n\n    for num in nums:\n        prefix += num\n        # \u6709\u591a\u5c11\u66f4\u65e9\u7684\u524d\u7f00\u548c\u7b49\u4e8e prefix - k\uff1f\n        count += prefix_counts.get(prefix - k, 0)\n        prefix_counts[prefix] = prefix_counts.get(prefix, 0) + 1\n\n    return count\n</code></pre> <ul> <li> <p>\u8fd9\u7ed3\u5408\u4e86\u524d\u7f00\u548c\u4e0e\u54c8\u5e0c\u8868\u67e5\u627e\uff1a\\(O(n)\\) \u65f6\u95f4\uff0c\\(O(n)\\) \u7a7a\u95f4\u3002</p> </li> <li> <p>\u9677\u9631\uff1a\u5fd8\u8bb0\u521d\u59cb\u5316 <code>prefix_counts = {0: 1}</code>\u3002\u7a7a\u524d\u7f00\uff08\u5728\u4efb\u4f55\u5143\u7d20\u4e4b\u524d\uff09\u7684\u548c\u4e3a 0\u3002\u6ca1\u6709\u5b83\uff0c\u4f60\u4f1a\u6f0f\u6389\u4ece\u7d22\u5f15 0 \u5f00\u59cb\u7684\u5b50\u6570\u7ec4\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#_19","title":"\u56f0\u96be\uff1a\u9664\u81ea\u8eab\u4ee5\u5916\u6570\u7ec4\u7684\u4e58\u79ef","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u7ed9\u5b9a\u4e00\u4e2a\u6570\u7ec4\uff0c\u8fd4\u56de\u4e00\u4e2a\u6570\u7ec4\uff0c\u5176\u4e2d\u6bcf\u4e2a\u5143\u7d20\u662f\u6240\u6709\u5176\u4ed6\u5143\u7d20\u7684\u4e58\u79ef\u3002\u4f60\u4e0d\u80fd\u4f7f\u7528\u9664\u6cd5\u3002</p> </li> <li> <p>\u6a21\u5f0f\uff1a\u4ece\u5de6\u4fa7\u6784\u5efa\u524d\u7f00\u4e58\u79ef\uff0c\u4ece\u53f3\u4fa7\u6784\u5efa\u540e\u7f00\u4e58\u79ef\u3002\u6bcf\u4e2a\u4f4d\u7f6e\u7684\u7b54\u6848\u662f <code>left_product * right_product</code>\u3002</p> </li> </ul> <pre><code>def product_except_self(nums):\n    n = len(nums)\n    result = [1] * n\n\n    # \u5de6\u5411\u904d\u5386\uff1aresult[i] = nums[0..i-1] \u7684\u4e58\u79ef\n    prefix = 1\n    for i in range(n):\n        result[i] = prefix\n        prefix *= nums[i]\n\n    # \u53f3\u5411\u904d\u5386\uff1a\u4e58\u4ee5 nums[i+1..n-1] \u7684\u4e58\u79ef\n    suffix = 1\n    for i in range(n - 1, -1, -1):\n        result[i] *= suffix\n        suffix *= nums[i]\n\n    return result\n</code></pre> <ul> <li> <p>\\(O(n)\\) \u65f6\u95f4\uff0c\\(O(1)\\) \u989d\u5916\u7a7a\u95f4\uff08\u8f93\u51fa\u6570\u7ec4\u4e0d\u8ba1\u5165\uff09\u3002\u5b83\u4f7f\u7528\u8f93\u51fa\u6570\u7ec4\u672c\u8eab\u6765\u5b58\u50a8\u4e2d\u95f4\u524d\u7f00\u4e58\u79ef\uff0c\u7136\u540e\u5728\u7b2c\u4e8c\u904d\u904d\u5386\u4e2d\u4e58\u5165\u540e\u7f00\u4e58\u79ef\u3002</p> </li> <li> <p>\u9677\u9631\uff1a\u5982\u679c\u6570\u7ec4\u5305\u542b\u96f6\uff0c\u57fa\u4e8e\u9664\u6cd5\u7684\u65b9\u6cd5\u4f1a\u5931\u8d25\u3002\u8fd9\u79cd\u524d\u7f00/\u540e\u7f00\u65b9\u6cd5\u6b63\u786e\u5904\u7406\u96f6\uff0c\u56e0\u4e3a\u5b83\u4ece\u4e0d\u505a\u9664\u6cd5\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#_20","title":"\u5e38\u89c1\u9677\u9631\u603b\u7ed3","text":"\u9677\u9631 \u793a\u4f8b \u4fee\u590d \u7a97\u53e3\u5927\u5c0f\u7684\u5dee\u4e00\u9519\u8bef <code>right - left</code> vs <code>right - left + 1</code> \u753b\u4e00\u4e2a2\u5143\u7d20\u793a\u4f8b Python \u4e2d\u7684\u53ef\u53d8\u9ed8\u8ba4\u503c <code>def f(seen={})</code> \u5728\u8c03\u7528\u95f4\u5171\u4eab\u72b6\u6001 \u4f7f\u7528 <code>def f(seen=None)</code> \u5faa\u73af\u4e2d\u7684\u5b57\u7b26\u4e32\u62fc\u63a5 <code>s += c</code> \u5728 Python \u4e2d\u662f \\(O(n^2)\\) \u4f7f\u7528 <code>list.append</code> + <code>\"\".join</code> \u524d\u7f00\u548c\u4e2d\u5fd8\u8bb0 <code>{0: 1}</code> \u6f0f\u6389\u4ece\u7d22\u5f15 0 \u5f00\u59cb\u7684\u5b50\u6570\u7ec4 \u59cb\u7ec8\u7528\u7a7a\u524d\u7f00\u521d\u59cb\u5316 \u68c0\u67e5\u524d\u6dfb\u52a0\u54c8\u5e0c\u8868 \u4e24\u6570\u4e4b\u548c\uff1a\u5728\u68c0\u67e5\u8865\u6570\u4e4b\u524d\u6dfb\u52a0\u4e86 <code>num</code> \u5148\u68c0\u67e5\uff0c\u540e\u63d2\u5165 \u672a\u5904\u7406\u91cd\u590d\u9879 \u4e09\u6570\u4e4b\u548c\u8fd4\u56de\u91cd\u590d\u7684\u4e09\u5143\u7ec4 \u8df3\u8fc7\u8fde\u7eed\u76f8\u7b49\u7684\u503c \u6574\u6570\u6ea2\u51fa C++/Java \u4e2d\u5927\u6570\u7ec4\u6c42\u548c \u4f7f\u7528 <code>long</code> \u6216\u68c0\u67e5\u8fb9\u754c"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#neetcode","title":"\u8bfe\u540e\u7ec3\u4e60\u9898\uff08NeetCode\uff09","text":"<p>\u6309\u987a\u5e8f\u7ec3\u4e60\u3002\u6bcf\u9053\u9898\u5f3a\u5316\u672c\u6587\u4ef6\u4e2d\u7684\u4e00\u4e2a\u6a21\u5f0f\u3002</p>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#_21","title":"\u54c8\u5e0c\u8868\u67e5\u627e","text":"<ul> <li>Contains Duplicate \u2014 \u70ed\u8eab\uff1a\u54c8\u5e0c\u96c6\u5224\u65ad\u662f\u5426\u89c1\u8fc7</li> <li>Two Sum \u2014 \u8865\u6570\u67e5\u627e</li> <li>Group Anagrams \u2014 \u89c4\u8303\u5f62\u5f0f\u4f5c\u4e3a\u952e</li> <li>Top K Frequent Elements \u2014 \u54c8\u5e0c\u8868 + \u6876\u6392\u5e8f</li> <li>Longest Consecutive Sequence \u2014 \u54c8\u5e0c\u96c6\u914d\u5408\u5e8f\u5217\u8d77\u70b9\u6280\u5de7</li> <li>Encode and Decode Strings \u2014 \u8bbe\u8ba1\u5e8f\u5217\u5316\u65b9\u6848</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#_22","title":"\u53cc\u6307\u9488","text":"<ul> <li>Valid Palindrome \u2014 \u5411\u5185\u6307\u9488</li> <li>Two Sum II (sorted) \u2014 \u6392\u5e8f\u6570\u7ec4\u4e0a\u7684\u53cc\u6307\u9488</li> <li>Three Sum \u2014 \u56fa\u5b9a + \u53cc\u6307\u9488 + \u53bb\u91cd</li> <li>Container With Most Water \u2014 \u8d2a\u5fc3\u53cc\u6307\u9488</li> <li>Trapping Rain Water \u2014 \u5e26\u8fd0\u884c\u6700\u5927\u503c\u7684\u53cc\u6307\u9488</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#_23","title":"\u6ed1\u52a8\u7a97\u53e3","text":"<ul> <li>Best Time to Buy and Sell Stock \u2014 \u9000\u5316\u7a97\u53e3</li> <li>Longest Substring Without Repeating Characters \u2014 \u6269\u5c55/\u6536\u7f29\u914d\u5408\u54c8\u5e0c\u8868</li> <li>Longest Repeating Character Replacement \u2014 \u7a97\u53e3 + \u6700\u5927\u9891\u7387\u6280\u5de7</li> <li>Minimum Window Substring \u2014 \u6269\u5c55\u5230\u6709\u6548\uff0c\u6536\u7f29\u5230\u6700\u5c0f</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/01.%20arrays%20and%20hashing/#_24","title":"\u524d\u7f00\u548c","text":"<ul> <li>Product of Array Except Self \u2014 \u524d\u7f00/\u540e\u7f00\u4e58\u79ef</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/02.%20linked%20lists%2C%20stacks%2C%20and%20queues/","title":"\u94fe\u8868\u3001\u6808\u548c\u961f\u5217","text":"<p>\u94fe\u8868\u3001\u6808\u548c\u961f\u5217\u662f\u66f4\u590d\u6742\u6570\u636e\u7ed3\u6784\u7684\u6784\u5efa\u6a21\u5757\u3002\u672c\u6587\u4ef6\u6db5\u76d6\u5b83\u4eec\u7684\u8fd0\u884c\u673a\u5236\uff0c\u7136\u540e\u6784\u5efa\u5173\u952e\u6a21\u5f0f\uff1a\u5feb\u6162\u6307\u9488\u3001\u5355\u8c03\u6808\u548c\u57fa\u4e8e\u5806\u7684\u4f18\u5148\u961f\u5217\uff0c\u901a\u8fc7\u9010\u6b65\u589e\u52a0\u96be\u5ea6\u7684\u9898\u76ee\uff0c\u5e76\u5728\u6bcf\u4e00\u6b65\u6307\u51fa\u5e38\u89c1\u9677\u9631\u3002</p> <ul> <li>\u6570\u7ec4\u63d0\u4f9b\u4e86\u5feb\u901f\u7684\u968f\u673a\u8bbf\u95ee\u4f46\u63d2\u5165\u4ee3\u4ef7\u9ad8\u3002\u94fe\u8868\u63d0\u4f9b\u4e86\u5feb\u901f\u63d2\u5165\u4f46\u6ca1\u6709\u968f\u673a\u8bbf\u95ee\u3002\u6808\u548c\u961f\u5217\u5c06\u8bbf\u95ee\u9650\u5236\u5728\u4e00\u7aef\u6216\u4e24\u7aef\uff0c\u800c\u6b63\u662f\u8fd9\u79cd\u9650\u5236\u4f7f\u5b83\u4eec\u5f3a\u5927\uff1a\u901a\u8fc7\u9650\u5236\u4f60\u80fd\u505a\u7684\u4e8b\u60c5\uff0c\u5b83\u4eec\u7b80\u5316\u4e86\u4f60\u9700\u8981\u8003\u8651\u7684\u4e8b\u60c5\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/02.%20linked%20lists%2C%20stacks%2C%20and%20queues/#_2","title":"\u94fe\u8868","text":"<ul> <li>\u5355\u5411\u94fe\u8868\u662f\u4e00\u4e2a\u8282\u70b9\u94fe\u3002\u6bcf\u4e2a\u8282\u70b9\u5b58\u50a8\u4e00\u4e2a\u503c\u548c\u4e00\u4e2a\u6307\u5411\u4e0b\u4e00\u4e2a\u8282\u70b9\u7684\u6307\u9488\u3002\u6700\u540e\u4e00\u4e2a\u8282\u70b9\u6307\u5411 <code>null</code>\u3002</li> </ul> <pre><code>class ListNode:\n    def __init__(self, val=0, next=None):\n        self.val = val\n        self.next = next\n</code></pre> <ul> <li> <p>\u76f8\u5bf9\u4e8e\u6570\u7ec4\u7684\u4f18\u52bf\uff1a\u5728\u5df2\u77e5\u4f4d\u7f6e\u63d2\u5165\u6216\u5220\u9664\u662f \\(O(1)\\)\uff08\u53ea\u9700\u91cd\u65b0\u6307\u5411\u6307\u9488\uff09\u3002\u65e0\u9700\u79fb\u52a8\u5143\u7d20\u3002</p> </li> <li> <p>\u52a3\u52bf\uff1a\u8bbf\u95ee\u5143\u7d20 \\(i\\) \u9700\u8981 \\(O(i)\\) \u6b21\u904d\u5386\uff08\u65e0\u968f\u673a\u8bbf\u95ee\uff09\u3002\u7f13\u5b58\u5c40\u90e8\u6027\u5dee\uff08\u8282\u70b9\u5206\u6563\u5728\u5185\u5b58\u4e2d\uff09\u3002</p> </li> <li> <p>\u53cc\u5411\u94fe\u8868\u589e\u52a0\u4e86\u4e00\u4e2a <code>prev</code> \u6307\u9488\uff0c\u652f\u6301\u5411\u540e\u904d\u5386\u3002\u7528\u4e8e LRU \u7f13\u5b58\uff08\u5e38\u6570\u65f6\u95f4\u5220\u9664\u4efb\u4f55\u8282\u70b9\uff09\u548c\u6d4f\u89c8\u5668\u5386\u53f2\uff08\u524d\u8fdb/\u540e\u9000\uff09\u3002</p> </li> </ul> \u64cd\u4f5c \u5355\u5411 \u53cc\u5411 \u6309\u7d22\u5f15\u8bbf\u95ee \\(O(n)\\) \\(O(n)\\) \u5728\u5934\u90e8\u63d2\u5165 \\(O(1)\\) \\(O(1)\\) \u5728\u5c3e\u90e8\u63d2\u5165 \\(O(n)\\) \u6216 \\(O(1)\\)* \\(O(1)\\) \u5220\u9664\u7ed9\u5b9a\u8282\u70b9 \\(O(n)\\)** \\(O(1)\\) \u641c\u7d22 \\(O(n)\\) \\(O(n)\\) <p>\u6709\u5c3e\u6307\u9488\u65f6\u3002*\u9700\u8981\u524d\u9a71\u8282\u70b9\uff0c\u9700\u8981\u904d\u5386\u3002</p> <ul> <li>\u54e8\u5175\u8282\u70b9\uff08\u865a\u62df\u5934/\u5c3e\u8282\u70b9\uff09\u7b80\u5316\u4e86\u8fb9\u754c\u60c5\u51b5\u3002\u6ca1\u6709\u865a\u62df\u5934\u8282\u70b9\u65f6\uff0c\u5728\u5934\u90e8\u63d2\u5165\u6216\u5220\u9664\u5934\u90e8\u9700\u8981\u7279\u6b8a\u4ee3\u7801\u3002\u6709\u4e86\u865a\u62df\u8282\u70b9\uff0c\u6bcf\u4e2a\u771f\u5b9e\u8282\u70b9\u90fd\u6709\u524d\u9a71\u3002</li> </ul> <pre><code># \u65e0\u865a\u62df\u8282\u70b9\uff1a\u5934\u90e8\u5220\u9664\u9700\u8981\u7279\u6b8a\u5904\u7406\ndef delete_head(head):\n    if not head:\n        return None\n    return head.next\n\n# \u6709\u865a\u62df\u8282\u70b9\uff1a\u7edf\u4e00\u903b\u8f91\ndummy = ListNode(0)\ndummy.next = head\n# \u73b0\u5728\u6bcf\u6b21\u5220\u9664\u90fd\u662f\uff1aprev.next = prev.next.next\n</code></pre> <ul> <li>\u9677\u9631\uff1a\u5fd8\u8bb0\u5904\u7406\u7a7a\u5217\u8868\uff08<code>head is None</code>\uff09\u6216\u5355\u5143\u7d20\u5217\u8868\u3002\u59cb\u7ec8\u6d4b\u8bd5\u8fd9\u4e9b\u8fb9\u754c\u60c5\u51b5\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/02.%20linked%20lists%2C%20stacks%2C%20and%20queues/#_3","title":"\u6a21\u5f0f\uff1a\u5feb\u6162\u6307\u9488\uff08\u5f17\u6d1b\u4f0a\u5fb7\u7b97\u6cd5\uff09","text":"<ul> <li>\u4f7f\u7528\u4e24\u4e2a\u4ee5\u4e0d\u540c\u901f\u5ea6\u79fb\u52a8\u7684\u6307\u9488\u6765\u68c0\u6d4b\u94fe\u8868\u7684\u5c5e\u6027\u3002\u6162\u6307\u9488\u4e00\u6b21\u79fb\u52a8\u4e00\u6b65\uff1b\u5feb\u6307\u9488\u4e00\u6b21\u79fb\u52a8\u4e24\u6b65\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/02.%20linked%20lists%2C%20stacks%2C%20and%20queues/#_4","title":"\u7b80\u5355\uff1a\u73af\u5f62\u94fe\u8868","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u5224\u65ad\u4e00\u4e2a\u94fe\u8868\u662f\u5426\u6709\u73af\u3002</p> </li> <li> <p>\u6a21\u5f0f\uff1a\u5982\u679c\u6709\u73af\uff0c\u5feb\u6307\u9488\u6700\u7ec8\u4f1a\u8ffd\u4e0a\u6162\u6307\u9488\uff08\u5b83\u4eec\u4f1a\u76f8\u9047\uff09\u3002\u5982\u679c\u6ca1\u6709\u73af\uff0c\u5feb\u6307\u9488\u4f1a\u5230\u8fbe <code>null</code>\u3002</p> </li> </ul> <pre><code>def has_cycle(head):\n    slow = fast = head\n    while fast and fast.next:\n        slow = slow.next\n        fast = fast.next.next\n        if slow == fast:\n            return True\n    return False\n</code></pre> <ul> <li> <p>\u4e3a\u4ec0\u4e48\u6709\u6548\uff1a\u5982\u679c\u73af\u7684\u957f\u5ea6\u4e3a \\(c\\)\uff0c\u5feb\u6307\u9488\u6bcf\u6b65\u7f29\u5c0f1\u4e2a\u8282\u70b9\u7684\u5dee\u8ddd\u3002\u5b83\u4eec\u5fc5\u5728\u6162\u6307\u9488\u8fdb\u5165\u73af\u540e\u7684 \\(c\\) \u6b65\u5185\u76f8\u9047\u3002</p> </li> <li> <p>\u9677\u9631\uff1a\u68c0\u67e5 <code>fast and fast.next</code>\uff08\u800c\u4e0d\u4ec5\u4ec5\u662f <code>fast.next</code>\uff09\u3002\u5982\u679c <code>fast</code> \u662f <code>None</code>\uff0c\u8c03\u7528 <code>fast.next</code> \u4f1a\u5d29\u6e83\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/02.%20linked%20lists%2C%20stacks%2C%20and%20queues/#_5","title":"\u4e2d\u7b49\uff1a\u5bfb\u627e\u94fe\u8868\u7684\u4e2d\u95f4\u8282\u70b9","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u8fd4\u56de\u4e2d\u95f4\u8282\u70b9\u3002</p> </li> <li> <p>\u6a21\u5f0f\uff1a\u5f53\u5feb\u6307\u9488\u5230\u8fbe\u672b\u5c3e\u65f6\uff0c\u6162\u6307\u9488\u5728\u4e2d\u95f4\u3002</p> </li> </ul> <pre><code>def find_middle(head):\n    slow = fast = head\n    while fast and fast.next:\n        slow = slow.next\n        fast = fast.next.next\n    return slow  # slow \u5728\u4e2d\u95f4\uff08\u5076\u6570\u957f\u5ea6\u65f6\u4e3a\u7b2c\u4e8c\u4e2a\u4e2d\u95f4\u8282\u70b9\uff09\n</code></pre>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/02.%20linked%20lists%2C%20stacks%2C%20and%20queues/#ii","title":"\u4e2d\u7b49\uff1a\u73af\u5f62\u94fe\u8868 II\uff08\u5bfb\u627e\u73af\u7684\u8d77\u70b9\uff09","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u8fd4\u56de\u73af\u5f00\u59cb\u7684\u8282\u70b9\u3002</p> </li> <li> <p>\u6a21\u5f0f\uff1a\u5728\u5feb\u6307\u9488\u548c\u6162\u6307\u9488\u76f8\u9047\u540e\uff0c\u5c06\u4e00\u4e2a\u6307\u9488\u91cd\u7f6e\u5230\u5934\u90e8\u3002\u4e24\u8005\u4ee5\u901f\u5ea61\u79fb\u52a8\u3002\u5b83\u4eec\u5728\u73af\u7684\u8d77\u70b9\u76f8\u9047\u3002</p> </li> </ul> <pre><code>def detect_cycle(head):\n    slow = fast = head\n    while fast and fast.next:\n        slow = slow.next\n        fast = fast.next.next\n        if slow == fast:\n            # \u5c06\u4e00\u4e2a\u6307\u9488\u91cd\u7f6e\u5230\u5934\u90e8\n            slow = head\n            while slow != fast:\n                slow = slow.next\n                fast = fast.next\n            return slow\n    return None\n</code></pre> <ul> <li>\u4e3a\u4ec0\u4e48\u6709\u6548\uff1a\u8bbe\u4ece\u5934\u5230\u73af\u8d77\u70b9\u7684\u8ddd\u79bb\u4e3a \\(a\\)\uff0c\u4ece\u73af\u8d77\u70b9\u5230\u76f8\u9047\u70b9\u7684\u8ddd\u79bb\u4e3a \\(b\\)\u3002\u6162\u6307\u9488\u8d70\u4e86 \\(a + b\\)\u3002\u5feb\u6307\u9488\u8d70\u4e86 \\(2(a + b)\\)\u3002\u5dee\u503c\u4e3a\u4e00\u6574\u5708\uff1a\\(a + b = c\\)\uff08\u73af\u957f\uff09\u3002\u6240\u4ee5 \\(a = c - b\\)\uff1a\u4ece\u5934\u5230\u73af\u8d77\u70b9\u7684\u8ddd\u79bb\u7b49\u4e8e\u4ece\u76f8\u9047\u70b9\u5230\u73af\u8d77\u70b9\u7684\u8ddd\u79bb\uff08\u6cbf\u73af\u5411\u524d\u8d70\uff09\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/02.%20linked%20lists%2C%20stacks%2C%20and%20queues/#k","title":"\u56f0\u96be\uff1aK\u4e2a\u4e00\u7ec4\u53cd\u8f6c\u94fe\u8868","text":"<ul> <li>\u95ee\u9898\uff1a\u53cd\u8f6c\u94fe\u8868\u4e2d\u6bcf \\(k\\) \u4e2a\u8fde\u7eed\u8282\u70b9\u3002</li> </ul> <pre><code>def reverse_k_group(head, k):\n    # \u68c0\u67e5\u662f\u5426\u8fd8\u6709 k \u4e2a\u8282\u70b9\n    node = head\n    for _ in range(k):\n        if not node:\n            return head\n        node = node.next\n\n    # \u53cd\u8f6c k \u4e2a\u8282\u70b9\n    prev, curr = None, head\n    for _ in range(k):\n        nxt = curr.next\n        curr.next = prev\n        prev = curr\n        curr = nxt\n\n    # \u5f53\u524d head \u73b0\u5728\u662f\u53cd\u8f6c\u540e\u7684\u7ec4\u7684\u5c3e\u8282\u70b9\n    # \u9012\u5f52\u5904\u7406\u5269\u4f59\u90e8\u5206\n    head.next = reverse_k_group(curr, k)\n    return prev  # prev \u662f\u8fd9\u7ec4\u7684\u65b0\u5934\u8282\u70b9\n</code></pre> <ul> <li>\u9677\u9631\uff1a\u539f\u5730\u53cd\u8f6c\u6a21\u5f0f\uff08<code>prev, curr, nxt</code>\uff09\u503c\u5f97\u8bb0\u4f4f\u3002\u753b\u51fa\u6765\uff1a\u6bcf\u4e00\u6b65\uff0c\u4f60\u5c06 <code>curr.next</code> \u6307\u56de <code>prev</code>\uff0c\u7136\u540e\u63a8\u8fdb\u6240\u6709\u4e09\u4e2a\u6307\u9488\u3002\u987a\u5e8f\u641e\u9519\u4f1a\u7834\u574f\u94fe\u8868\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/02.%20linked%20lists%2C%20stacks%2C%20and%20queues/#_6","title":"\u6808","text":"<ul> <li> <p>\u6808\u662f LIFO\uff08\u540e\u8fdb\u5148\u51fa\uff09\uff1a\u6700\u8fd1\u6dfb\u52a0\u7684\u5143\u7d20\u6700\u5148\u88ab\u79fb\u9664\u3002\u60f3\u8c61\u4e00\u5806\u76d8\u5b50\u3002</p> </li> <li> <p>\u64cd\u4f5c\uff1a<code>push(x)</code> \u6dfb\u52a0\u5230\u9876\u90e8\uff0c<code>pop()</code> \u4ece\u9876\u90e8\u79fb\u9664\uff0c<code>peek()</code> \u67e5\u770b\u9876\u90e8\u4e0d\u79fb\u9664\u3002\u5168\u90e8 \\(O(1)\\)\u3002</p> </li> <li> <p>\u6808\u662f\u9012\u5f52\uff08\u8c03\u7528\u6808\uff09\u3001\u8868\u8fbe\u5f0f\u6c42\u503c\uff08\u4e2d\u7f00\u8f6c\u540e\u7f00\uff09\u548c\u64a4\u9500\u64cd\u4f5c\uff08\u6bcf\u4e2a\u64cd\u4f5c\u88ab\u5165\u6808\uff0c\u64a4\u9500\u65f6\u5f39\u51fa\u6700\u540e\u4e00\u4e2a\uff09\u80cc\u540e\u7684\u9690\u5f0f\u7ed3\u6784\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/02.%20linked%20lists%2C%20stacks%2C%20and%20queues/#_7","title":"\u7b80\u5355\uff1a\u6709\u6548\u7684\u62ec\u53f7","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u7ed9\u5b9a\u4e00\u4e2a\u7531\u62ec\u53f7 <code>()[]{}</code> \u7ec4\u6210\u7684\u5b57\u7b26\u4e32\uff0c\u5224\u65ad\u5b83\u4eec\u662f\u5426\u5e73\u8861\u3002</p> </li> <li> <p>\u6a21\u5f0f\uff1a\u5c06\u5de6\u62ec\u53f7\u5165\u6808\u3002\u5f53\u770b\u5230\u53f3\u62ec\u53f7\u65f6\uff0c\u68c0\u67e5\u6808\u9876\u662f\u5426\u5339\u914d\u3002</p> </li> </ul> <pre><code>def is_valid(s):\n    stack = []\n    matching = {')': '(', ']': '[', '}': '{'}\n\n    for char in s:\n        if char in matching:\n            if not stack or stack[-1] != matching[char]:\n                return False\n            stack.pop()\n        else:\n            stack.append(char)\n\n    return len(stack) == 0\n</code></pre> <ul> <li>\u9677\u9631\uff1a\u5fd8\u8bb0\u6700\u540e\u68c0\u67e5 <code>len(stack) == 0</code>\u3002\u5b57\u7b26\u4e32 \"(((\" \u4e2d\u6ca1\u6709\u4e0d\u5339\u914d\u7684\u60c5\u51b5\uff0c\u4f46\u56e0\u4e3a\u6ca1\u6709\u95ed\u5408\u7684\u62ec\u53f7\uff0c\u5b83\u662f\u65e0\u6548\u7684\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/02.%20linked%20lists%2C%20stacks%2C%20and%20queues/#_8","title":"\u6a21\u5f0f\uff1a\u5355\u8c03\u6808","text":"<ul> <li> <p>\u5355\u8c03\u6808\u7ef4\u62a4\u6309\u6392\u5e8f\u987a\u5e8f\u6392\u5217\u7684\u5143\u7d20\uff08\u9012\u589e\u6216\u9012\u51cf\uff09\u3002\u5f53\u65b0\u5143\u7d20\u4f1a\u7834\u574f\u987a\u5e8f\u65f6\uff0c\u4f60\u5f39\u51fa\u5143\u7d20\u76f4\u5230\u987a\u5e8f\u6062\u590d\u3002</p> </li> <li> <p>\u4f55\u65f6\u4f7f\u7528\uff1a\u95ee\u9898\u8981\u6c42\"\u5bf9\u6bcf\u4e2a\u5143\u7d20\uff0c\u627e\u5230\u4e0b\u4e00\u4e2a/\u4e0a\u4e00\u4e2a\u66f4\u5927/\u66f4\u5c0f\u7684\u5143\u7d20\u3002\"\u6808\u7684\u603b\u65f6\u95f4\u590d\u6742\u5ea6\u4e3a \\(O(n)\\)\uff0c\u56e0\u4e3a\u6bcf\u4e2a\u5143\u7d20\u6700\u591a\u88ab\u5165\u6808\u548c\u51fa\u6808\u4e00\u6b21\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/02.%20linked%20lists%2C%20stacks%2C%20and%20queues/#_9","title":"\u4e2d\u7b49\uff1a\u6bcf\u65e5\u6e29\u5ea6","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u7ed9\u5b9a\u6bcf\u65e5\u6e29\u5ea6\uff0c\u5bf9\u4e8e\u6bcf\u4e00\u5929\uff0c\u627e\u5230\u9700\u8981\u7b49\u591a\u5c11\u5929\u624d\u4f1a\u5347\u6e29\u3002</p> </li> <li> <p>\u6a21\u5f0f\uff1a\u4f7f\u7528\u4e00\u4e2a\u7d22\u5f15\u6808\u3002\u5f53\u5f53\u524d\u6e29\u5ea6\u9ad8\u4e8e\u6808\u9876\u65f6\uff0c\u5f39\u51fa\u5e76\u8bb0\u5f55\u8ddd\u79bb\u3002</p> </li> </ul> <pre><code>def daily_temperatures(temperatures):\n    n = len(temperatures)\n    result = [0] * n\n    stack = []  # \u7d22\u5f15\u6808\uff0c\u6e29\u5ea6\u9012\u51cf\n\n    for i in range(n):\n        while stack and temperatures[i] &gt; temperatures[stack[-1]]:\n            prev = stack.pop()\n            result[prev] = i - prev\n        stack.append(i)\n\n    return result\n</code></pre> <ul> <li> <p>\u6bcf\u4e2a\u5143\u7d20\u88ab\u5165\u6808\u4e00\u6b21\uff0c\u6700\u591a\u51fa\u6808\u4e00\u6b21\uff1a\u603b\u8ba1 \\(O(n)\\)\u3002</p> </li> <li> <p>\u9677\u9631\uff1a\u5728\u6808\u4e2d\u5b58\u50a8\u7d22\u5f15\uff08\u800c\u975e\u503c\uff09\u3002\u4f60\u9700\u8981\u7d22\u5f15\u6765\u8ba1\u7b97\u8ddd\u79bb\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/02.%20linked%20lists%2C%20stacks%2C%20and%20queues/#_10","title":"\u56f0\u96be\uff1a\u67f1\u72b6\u56fe\u4e2d\u6700\u5927\u7684\u77e9\u5f62","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u7ed9\u5b9a\u4e00\u4e2a\u6761\u5f62\u9ad8\u5ea6\u6570\u7ec4\uff0c\u627e\u51fa\u6700\u5927\u77e9\u5f62\u7684\u9762\u79ef\u3002</p> </li> <li> <p>\u6a21\u5f0f\uff1a\u5bf9\u4e8e\u6bcf\u4e2a\u6761\u5f62\uff0c\u627e\u51fa\u5b83\u53ef\u4ee5\u5411\u5de6\u53f3\u5ef6\u4f38\u591a\u8fdc\uff08\u5373\uff0c\u6bcf\u4fa7\u6700\u8fd1\u7684\u66f4\u77ed\u6761\u5f62\uff09\u3002\u5355\u8c03\u9012\u589e\u6808\u9ad8\u6548\u5730\u8ffd\u8e2a\u8fd9\u4e2a\u4fe1\u606f\u3002</p> </li> </ul> <pre><code>def largest_rectangle(heights):\n    stack = []  # \u7d22\u5f15\u6808\uff0c\u9ad8\u5ea6\u9012\u589e\n    max_area = 0\n    heights.append(0)  # \u54e8\u5175\uff0c\u7528\u4e8e\u6700\u540e\u6e05\u7a7a\u6808\n\n    for i, h in enumerate(heights):\n        start = i\n        while stack and stack[-1][1] &gt; h:\n            idx, height = stack.pop()\n            max_area = max(max_area, height * (i - idx))\n            start = idx  # \u5f53\u524d\u6761\u5f62\u53ef\u4ee5\u5ef6\u4f38\u5230\u88ab\u5f39\u51fa\u6761\u5f62\u5f00\u59cb\u7684\u4f4d\u7f6e\n        stack.append((start, h))\n\n    heights.pop()  # \u79fb\u9664\u54e8\u5175\n    return max_area\n</code></pre> <ul> <li> <p>\u9677\u9631\uff1a<code>start = idx</code> \u8fd9\u884c\u5f88\u5fae\u5999\u3002\u5f53\u6211\u4eec\u5f39\u51fa\u4e00\u4e2a\u6bd4\u5f53\u524d\u6761\u5f62\u66f4\u9ad8\u7684\u6761\u5f62\u65f6\uff0c\u5f53\u524d\u6761\u5f62\u53ef\u4ee5\u5411\u540e\u5ef6\u4f38\u81f3\u88ab\u5f39\u51fa\u6761\u5f62\u5f00\u59cb\u7684\u4f4d\u7f6e\uff08\u56e0\u4e3a\u4e2d\u95f4\u7684\u6240\u6709\u6761\u5f62\u81f3\u5c11\u548c\u88ab\u5f39\u51fa\u6761\u5f62\u4e00\u6837\u9ad8\uff09\u3002\u7f3a\u5c11\u8fd9\u884c\u4f1a\u5f97\u5230\u9519\u8bef\u7684\u9762\u79ef\u3002</p> </li> <li> <p>\u9677\u9631\uff1a\u54e8\u5175 <code>heights.append(0)</code> \u786e\u4fdd\u6808\u4e2d\u6240\u6709\u5269\u4f59\u7684\u6761\u5f62\u88ab\u5904\u7406\u3002\u6ca1\u6709\u5b83\uff0c\u90a3\u4e9b\u53f3\u4fa7\u4ece\u672a\u9047\u5230\u66f4\u77ed\u6761\u5f62\u7684\u6761\u5f62\u4f1a\u88ab\u9057\u6f0f\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/02.%20linked%20lists%2C%20stacks%2C%20and%20queues/#_11","title":"\u961f\u5217","text":"<ul> <li> <p>\u961f\u5217\u662f FIFO\uff08\u5148\u8fdb\u5148\u51fa\uff09\uff1a\u5143\u7d20\u4ece\u540e\u9762\u6dfb\u52a0\uff0c\u4ece\u524d\u9762\u79fb\u9664\u3002\u60f3\u8c61\u5546\u5e97\u91cc\u6392\u961f\u3002</p> </li> <li> <p>\u53cc\u7aef\u961f\u5217\uff08deque\uff09\u652f\u6301\u5728\u4e24\u7aef \\(O(1)\\) \u63d2\u5165\u548c\u5220\u9664\u3002Python \u7684 <code>collections.deque</code> \u662f\u6807\u51c6\u5b9e\u73b0\u3002</p> </li> <li> <p>\u961f\u5217\u662f BFS\uff08\u5e7f\u5ea6\u4f18\u5148\u641c\u7d22\uff0c\u7b2c14\u7ae0\u6587\u4ef604\uff09\u3001\u4efb\u52a1\u8c03\u5ea6\u548c\u6d88\u606f\u4f20\u9012\u80cc\u540e\u7684\u7ed3\u6784\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/02.%20linked%20lists%2C%20stacks%2C%20and%20queues/#_12","title":"\u7b80\u5355\uff1a\u7528\u6808\u5b9e\u73b0\u961f\u5217","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u4ec5\u4f7f\u7528\u4e24\u4e2a\u6808\u5b9e\u73b0\u4e00\u4e2a\u961f\u5217\u3002</p> </li> <li> <p>\u6a21\u5f0f\uff1a\u4f7f\u7528\u4e00\u4e2a\u6808\u8fdb\u884c\u5165\u961f\u64cd\u4f5c\uff0c\u4e00\u4e2a\u6808\u8fdb\u884c\u51fa\u961f\u64cd\u4f5c\u3002\u5f53\u51fa\u961f\u6808\u4e3a\u7a7a\u65f6\uff0c\u5c06\u6240\u6709\u5143\u7d20\u4ece\u5165\u961f\u6808\u8f6c\u79fb\u5230\u51fa\u961f\u6808\uff08\u53cd\u8f6c\u987a\u5e8f\uff09\u3002</p> </li> </ul> <pre><code>class MyQueue:\n    def __init__(self):\n        self.push_stack = []\n        self.pop_stack = []\n\n    def push(self, x):\n        self.push_stack.append(x)\n\n    def pop(self):\n        if not self.pop_stack:\n            while self.push_stack:\n                self.pop_stack.append(self.push_stack.pop())\n        return self.pop_stack.pop()\n\n    def peek(self):\n        if not self.pop_stack:\n            while self.push_stack:\n                self.pop_stack.append(self.push_stack.pop())\n        return self.pop_stack[-1]\n\n    def empty(self):\n        return not self.push_stack and not self.pop_stack\n</code></pre> <ul> <li>\u6bcf\u6b21\u64cd\u4f5c\u7684\u5e73\u644a\u590d\u6742\u5ea6 \\(O(1)\\)\uff1a\u6bcf\u4e2a\u5143\u7d20\u6700\u591a\u5728\u4e24\u4e2a\u6808\u4e4b\u95f4\u79fb\u52a8\u4e00\u6b21\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/02.%20linked%20lists%2C%20stacks%2C%20and%20queues/#_13","title":"\u4f18\u5148\u961f\u5217\u548c\u5806","text":"<ul> <li> <p>\u4f18\u5148\u961f\u5217\u603b\u662f\u8fd4\u56de\u6700\u5c0f\uff08\u6216\u6700\u5927\uff09\u7684\u5143\u7d20\uff0c\u4e0d\u8bba\u63d2\u5165\u987a\u5e8f\u3002\u6807\u51c6\u5b9e\u73b0\u662f\u4e8c\u53c9\u5806\u3002</p> </li> <li> <p>\u6700\u5c0f\u5806\u662f\u4e00\u68f5\u5b8c\u5168\u4e8c\u53c9\u6811\uff0c\u5176\u4e2d\u6bcf\u4e2a\u7236\u8282\u70b9\u90fd\u5c0f\u4e8e\u5176\u5b50\u8282\u70b9\u3002\u6700\u5c0f\u503c\u603b\u662f\u5728\u6839\u8282\u70b9\u3002\u4ee5\u6570\u7ec4\u5f62\u5f0f\u5b58\u50a8\uff1a\u8282\u70b9 \\(i\\) \u7684\u5b50\u8282\u70b9\u5728\u4f4d\u7f6e \\(2i + 1\\) \u548c \\(2i + 2\\)\u3002</p> </li> </ul> \u64cd\u4f5c \u65f6\u95f4 \u63d2\u5165 \\(O(\\log n)\\) \u83b7\u53d6\u6700\u5c0f\u503c \\(O(1)\\) \u63d0\u53d6\u6700\u5c0f\u503c \\(O(\\log n)\\) \u4ece\u6570\u7ec4\u6784\u5efa\u5806 \\(O(n)\\) <ul> <li>Python \u7684 <code>heapq</code> \u6a21\u5757\u63d0\u4f9b\u4e86\u6700\u5c0f\u5806\u3002\u5bf9\u4e8e\u6700\u5927\u5806\uff0c\u5c06\u503c\u53d6\u53cd\u3002</li> </ul> <pre><code>import heapq\n\n# \u6700\u5c0f\u5806\nh = []\nheapq.heappush(h, 5)\nheapq.heappush(h, 2)\nheapq.heappush(h, 8)\nprint(heapq.heappop(h))  # 2\uff08\u6700\u5c0f\uff09\n\n# \u6700\u5927\u5806\u6280\u5de7\uff1a\u53d6\u53cd\nheapq.heappush(h, -10)\nprint(-heapq.heappop(h))  # 10\uff08\u6700\u5927\uff09\n</code></pre>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/02.%20linked%20lists%2C%20stacks%2C%20and%20queues/#k_1","title":"\u4e2d\u7b49\uff1a\u6570\u7ec4\u4e2d\u7684\u7b2c K \u4e2a\u6700\u5927\u5143\u7d20","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u627e\u5230\u7b2c k \u4e2a\u6700\u5927\u7684\u5143\u7d20\u3002</p> </li> <li> <p>\u6a21\u5f0f\uff1a\u7ef4\u62a4\u4e00\u4e2a\u5927\u5c0f\u4e3a \\(k\\) \u7684\u6700\u5c0f\u5806\u3002\u5806\u7684\u6839\u8282\u70b9\u5c31\u662f\u7b2c k \u5927\u7684\u5143\u7d20\u3002\u5982\u679c\u5806\u6709 \\(k\\) \u4e2a\u5143\u7d20\u4e14\u65b0\u5143\u7d20\u5927\u4e8e\u6839\u8282\u70b9\uff0c\u5219\u66ff\u6362\u6839\u8282\u70b9\u3002</p> </li> </ul> <pre><code>import heapq\n\ndef find_kth_largest(nums, k):\n    heap = nums[:k]\n    heapq.heapify(heap)  # O(k)\n\n    for num in nums[k:]:\n        if num &gt; heap[0]:\n            heapq.heapreplace(heap, num)  # \u5f39\u51fa\u6700\u5c0f\u503c\uff0c\u63a8\u5165 num\uff1aO(log k)\n\n    return heap[0]\n</code></pre> <ul> <li> <p>\\(O(n \\log k)\\) \u65f6\u95f4\uff0c\\(O(k)\\) \u7a7a\u95f4\u3002\u5f53 \\(k \\ll n\\) \u65f6\uff0c\u8fd9\u6bd4\u6392\u5e8f\uff08\\(O(n \\log n)\\)\uff09\u597d\u5f97\u591a\u3002</p> </li> <li> <p>\u9677\u9631\uff1a\u4f7f\u7528\u5927\u5c0f\u4e3a \\(n\\) \u7684\u6700\u5927\u5806\u5e76\u5f39\u51fa \\(k\\) \u6b21\u4e5f\u53ef\u884c\u4f46\u8f83\u6162\uff1a\\(O(n + k \\log n)\\)\u3002\u5927\u5c0f\u4e3a \\(k\\) \u7684\u6700\u5c0f\u5806\u662f\u6700\u4f18\u65b9\u6cd5\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/02.%20linked%20lists%2C%20stacks%2C%20and%20queues/#k_2","title":"\u56f0\u96be\uff1a\u5408\u5e76 K \u4e2a\u6392\u5e8f\u94fe\u8868","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u5408\u5e76 \\(k\\) \u4e2a\u5df2\u6392\u5e8f\u94fe\u8868\u4e3a\u4e00\u4e2a\u6392\u5e8f\u94fe\u8868\u3002</p> </li> <li> <p>\u6a21\u5f0f\uff1a\u4f7f\u7528\u4e00\u4e2a\u5305\u542b\u6bcf\u4e2a\u94fe\u8868\u5934\u8282\u70b9\u7684\u6700\u5c0f\u5806\u3002\u5f39\u51fa\u6700\u5c0f\u7684\u8282\u70b9\uff0c\u5c06\u5176\u6dfb\u52a0\u5230\u7ed3\u679c\u4e2d\uff0c\u5e76\u5c06\u5176\u4e0b\u4e00\u4e2a\u8282\u70b9\u63a8\u5165\u5806\u4e2d\u3002</p> </li> </ul> <pre><code>import heapq\n\ndef merge_k_lists(lists):\n    heap = []\n    for i, lst in enumerate(lists):\n        if lst:\n            heapq.heappush(heap, (lst.val, i, lst))\n\n    dummy = ListNode(0)\n    curr = dummy\n\n    while heap:\n        val, i, node = heapq.heappop(heap)\n        curr.next = node\n        curr = curr.next\n        if node.next:\n            heapq.heappush(heap, (node.next.val, i, node.next))\n\n    return dummy.next\n</code></pre> <ul> <li> <p>\\(O(n \\log k)\\)\uff0c\u5176\u4e2d \\(n\\) \u662f\u603b\u8282\u70b9\u6570\u3002\u5806\u4e2d\u6700\u591a\u6709 \\(k\\) \u4e2a\u5143\u7d20\u3002</p> </li> <li> <p>\u9677\u9631\uff1a\u5806\u5143\u7ec4\u4e2d\u7684 <code>i</code>\uff08\u7d22\u5f15\uff09\u662f\u7528\u4e8e\u6253\u7834\u5e73\u5c40\u7684\u3002\u6ca1\u6709\u5b83\uff0c\u5f53\u503c\u76f8\u7b49\u65f6 Python \u4f1a\u5c1d\u8bd5\u6bd4\u8f83 <code>ListNode</code> \u5bf9\u8c61\uff0c\u8fd9\u4f1a\u5d29\u6e83\u56e0\u4e3a <code>ListNode</code> \u4e0d\u652f\u6301 <code>&lt;</code>\u3002\u7d22\u786e\u4fdd\u4e86\u4e00\u6709\u6548\u7684\u6bd4\u8f83\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/02.%20linked%20lists%2C%20stacks%2C%20and%20queues/#_14","title":"\u5e38\u89c1\u9677\u9631\u603b\u7ed3","text":"\u9677\u9631 \u793a\u4f8b \u4fee\u590d <code>fast.next</code> \u4e0a\u7684\u7a7a\u6307\u9488 \u5faa\u73af\u68c0\u6d4b\u4e2d\u4f7f\u7528 <code>while fast.next</code> \u68c0\u67e5 <code>fast and fast.next</code> \u672a\u5904\u7406\u7a7a\u94fe\u8868 \u53cd\u8f6c <code>None</code> \u6dfb\u52a0 <code>if not head</code> \u5b88\u536b \u6808\u4e0b\u6ea2 \u4ece\u7a7a\u6808\u5f39\u51fa \u68c0\u67e5 <code>len(stack) &gt; 0</code> \u6216 <code>if stack</code> \u5fd8\u8bb0\u54e8\u5175 \u76f4\u65b9\u56fe\u9057\u6f0f\u4e86\u6700\u540e\u7684\u6761\u5f62 \u8ffd\u52a0 0 \u6765\u6e05\u7a7a\u6808 \u5806\u4e2d\u7f3a\u5c11\u5e73\u5c40\u6253\u7834 \u6bd4\u8f83\u4e0d\u53ef\u6bd4\u8f83\u7684\u5bf9\u8c61 \u5411\u5806\u5143\u7ec4\u6dfb\u52a0\u7d22\u5f15 \u904d\u5386\u65f6\u4fee\u6539\u94fe\u8868 \u904d\u5386\u65f6\u5220\u9664\u8282\u70b9 \u4f7f\u7528 prev/curr \u6a21\u5f0f\u6216\u865a\u62df\u5934\u8282\u70b9"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/02.%20linked%20lists%2C%20stacks%2C%20and%20queues/#neetcode","title":"\u8bfe\u540e\u7ec3\u4e60\u9898\uff08NeetCode\uff09","text":""},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/02.%20linked%20lists%2C%20stacks%2C%20and%20queues/#_15","title":"\u94fe\u8868","text":"<ul> <li>\u53cd\u8f6c\u94fe\u8868 \u2014 \u57fa\u7840\u7684\u539f\u5730\u53cd\u8f6c</li> <li>\u5408\u5e76\u4e24\u4e2a\u6709\u5e8f\u94fe\u8868 \u2014 \u53cc\u6307\u9488\u5408\u5e76</li> <li>\u73af\u5f62\u94fe\u8868 \u2014 \u5feb\u6162\u6307\u9488</li> <li>\u91cd\u6392\u94fe\u8868 \u2014 \u627e\u4e2d\u95f4 + \u53cd\u8f6c + \u5408\u5e76</li> <li>\u5220\u9664\u94fe\u8868\u7684\u5012\u6570\u7b2c N \u4e2a\u8282\u70b9 \u2014 \u95f4\u8ddd\u4e3a \\(n\\) \u7684\u53cc\u6307\u9488</li> <li>LRU \u7f13\u5b58 \u2014 \u54c8\u5e0c\u8868 + \u53cc\u5411\u94fe\u8868</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/02.%20linked%20lists%2C%20stacks%2C%20and%20queues/#_16","title":"\u6808","text":"<ul> <li>\u6709\u6548\u7684\u62ec\u53f7 \u2014 \u62ec\u53f7\u5339\u914d</li> <li>\u6700\u5c0f\u6808 \u2014 \u5728\u6bcf\u5c42\u8ddf\u8e2a\u6700\u5c0f\u503c</li> <li>\u9006\u6ce2\u5170\u8868\u8fbe\u5f0f\u6c42\u503c \u2014 \u57fa\u4e8e\u6808\u7684\u6c42\u503c</li> <li>\u6bcf\u65e5\u6e29\u5ea6 \u2014 \u5355\u8c03\u9012\u51cf\u6808</li> <li>\u67f1\u72b6\u56fe\u4e2d\u6700\u5927\u7684\u77e9\u5f62 \u2014 \u5355\u8c03\u9012\u589e\u6808</li> <li>\u8f66\u961f \u2014 \u5e26\u5230\u8fbe\u65f6\u95f4\u7684\u6808</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/02.%20linked%20lists%2C%20stacks%2C%20and%20queues/#_17","title":"\u5806 / \u4f18\u5148\u961f\u5217","text":"<ul> <li>\u6570\u636e\u6d41\u4e2d\u7684\u7b2c K \u5927\u5143\u7d20 \u2014 \u5927\u5c0f\u4e3a \\(k\\) \u7684\u6700\u5c0f\u5806</li> <li>\u6700\u540e\u4e00\u5757\u77f3\u5934\u7684\u91cd\u91cf \u2014 \u6700\u5927\u5806\u6a21\u62df</li> <li>\u6700\u63a5\u8fd1\u539f\u70b9\u7684 K \u4e2a\u70b9 \u2014 \u6309\u8ddd\u79bb\u6392\u5e8f\u7684\u6700\u5c0f\u5806</li> <li>\u4efb\u52a1\u8c03\u5ea6\u5668 \u2014 \u8d2a\u5fc3 + \u6700\u5927\u5806 + \u51b7\u5374\u65f6\u95f4</li> <li>\u6570\u636e\u6d41\u7684\u4e2d\u4f4d\u6570 \u2014 \u53cc\u5806\uff08\u4e0b\u534a\u90e8\u5206\u7528\u6700\u5927\u5806\uff0c\u4e0a\u534a\u90e8\u5206\u7528\u6700\u5c0f\u5806\uff09</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/03.%20trees/","title":"\u6811","text":"<p>\u6811\u662f\u5c42\u6b21\u5316\u6570\u636e\u7ed3\u6784\uff0c\u662f\u6587\u4ef6\u7cfb\u7edf\u3001\u6570\u636e\u5e93\u3001\u7f16\u8bd1\u5668\u548c\u65e0\u6570\u9762\u8bd5\u9898\u80cc\u540e\u7684\u57fa\u7840\u3002\u672c\u6587\u4ef6\u6db5\u76d6\u4e8c\u53c9\u6811\u3001\u4e8c\u53c9\u641c\u7d22\u6811\u3001\u5e73\u8861\u6811\u3001\u524d\u7f00\u6811\u3001\u7ebf\u6bb5\u6811\u3001\u6811\u72b6\u6570\u7ec4\u548c\u5e76\u67e5\u96c6\uff0c\u5305\u62ec\u904d\u5386\u6a21\u5f0f\u3001\u9012\u5f52\u601d\u7ef4\u4ee5\u53ca\u9010\u6b65\u589e\u52a0\u96be\u5ea6\u7684\u9898\u76ee\u3002</p> <ul> <li> <p>\u6811\u662f\u4e00\u4e2a\u8fde\u901a\u7684\u65e0\u73af\u56fe\uff08\u7b2c13\u7ae0\uff09\u3002\u6700\u91cd\u8981\u7684\u53d8\u4f53\u662f\u4e8c\u53c9\u6811\uff1a\u6bcf\u4e2a\u8282\u70b9\u6700\u591a\u6709\u4e24\u4e2a\u5b50\u8282\u70b9\uff08\u5de6\u548c\u53f3\uff09\u3002\u6811\u65e0\u5904\u4e0d\u5728\uff1a\u7f16\u8bd1\u5668\u4e2d\u7684\u89e3\u6790\u6811\u3001\u6d4f\u89c8\u5668\u4e2d\u7684 DOM \u6811\u3001\u673a\u5668\u5b66\u4e60\u4e2d\u7684\u51b3\u7b56\u6811\u4ee5\u53ca\u6570\u636e\u5e93\u4e2d\u7684 B \u6811\u3002</p> </li> <li> <p>\u89e3\u51b3\u6811\u95ee\u9898\u7684\u5173\u952e\u6d1e\u5bdf\uff1a\u5927\u591a\u6570\u6811\u95ee\u9898\u90fd\u53ef\u4ee5\u9012\u5f52\u89e3\u51b3\u3002\u7ed3\u6784\u662f\u9012\u5f52\u7684\uff08\u6811\u662f\u4e00\u4e2a\u6839\u8282\u70b9\u52a0\u4e0a\u4e24\u68f5\u5b50\u6811\uff09\uff0c\u56e0\u6b64\u89e3\u6cd5\u4e5f\u5e94\u662f\u9012\u5f52\u7684\u3002\u638c\u63e1\"\u89e3\u51b3\u5de6\u5b50\u6811\u3001\u89e3\u51b3\u53f3\u5b50\u6811\u3001\u5408\u5e76\u7ed3\u679c\"\u7684\u6a21\u5f0f\uff0c\u4f60\u5c31\u80fd\u89e3\u51b3\u5927\u591a\u6570\u6811\u95ee\u9898\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/03.%20trees/#_2","title":"\u4e8c\u53c9\u6811\u904d\u5386","text":"<ul> <li> <p>\u6709\u56db\u79cd\u6807\u51c6\u7684\u8bbf\u95ee\u6bcf\u4e2a\u8282\u70b9\u7684\u65b9\u5f0f\uff1a</p> <ul> <li>\u4e2d\u5e8f\u904d\u5386\uff08\u5de6\u3001\u6839\u3001\u53f3\uff09\uff1a\u5bf9\u4e8e BST\uff0c\u8fd9\u4f1a\u6309\u6392\u5e8f\u987a\u5e8f\u8bbf\u95ee\u8282\u70b9\u3002</li> <li>\u524d\u5e8f\u904d\u5386\uff08\u6839\u3001\u5de6\u3001\u53f3\uff09\uff1a\u7528\u4e8e\u5e8f\u5217\u5316\u548c\u590d\u5236\u6811\u3002</li> <li>\u540e\u5e8f\u904d\u5386\uff08\u5de6\u3001\u53f3\u3001\u6839\uff09\uff1a\u7528\u4e8e\u5220\u9664\u548c\u8ba1\u7b97\u5927\u5c0f\u3002</li> <li>\u5c42\u5e8f\u904d\u5386\uff08BFS\uff09\uff1a\u4f7f\u7528\u961f\u5217\u9010\u5c42\u8bbf\u95ee\u8282\u70b9\u3002</li> </ul> </li> </ul> <pre><code>class TreeNode:\n    def __init__(self, val=0, left=None, right=None):\n        self.val = val\n        self.left = left\n        self.right = right\n\ndef inorder(root):\n    if not root:\n        return []\n    return inorder(root.left) + [root.val] + inorder(root.right)\n\ndef preorder(root):\n    if not root:\n        return []\n    return [root.val] + preorder(root.left) + preorder(root.right)\n\ndef postorder(root):\n    if not root:\n        return []\n    return postorder(root.left) + postorder(root.right) + [root.val]\n\nfrom collections import deque\n\ndef level_order(root):\n    if not root:\n        return []\n    result, queue = [], deque([root])\n    while queue:\n        level = []\n        for _ in range(len(queue)):\n            node = queue.popleft()\n            level.append(node.val)\n            if node.left:\n                queue.append(node.left)\n            if node.right:\n                queue.append(node.right)\n        result.append(level)\n    return result\n</code></pre> <ul> <li>\u9677\u9631\uff1a\u4e0a\u9762\u7684\u9012\u5f52\u904d\u5386\u5728\u6bcf\u4e00\u6b65\u90fd\u521b\u5efa\u65b0\u5217\u8868\uff08\u7531\u4e8e <code>+</code> \u62fc\u63a5\uff09\uff0c\u8fd9\u662f \\(O(n^2)\\)\u3002\u4e3a\u4e86\u6548\u7387\uff0c\u4f20\u9012\u4e00\u4e2a\u7ed3\u679c\u5217\u8868\u5e76\u539f\u5730\u8ffd\u52a0\uff1a</li> </ul> <pre><code>def inorder_efficient(root, result=None):\n    if result is None:\n        result = []\n    if root:\n        inorder_efficient(root.left, result)\n        result.append(root.val)\n        inorder_efficient(root.right, result)\n    return result\n</code></pre>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/03.%20trees/#_3","title":"\u7b80\u5355\uff1a\u4e8c\u53c9\u6811\u7684\u6700\u5927\u6df1\u5ea6","text":"<pre><code>def max_depth(root):\n    if not root:\n        return 0\n    return 1 + max(max_depth(root.left), max_depth(root.right))\n</code></pre> <ul> <li>\u9012\u5f52\u6a21\u5f0f\uff1a\u57fa\u672c\u60c5\u51b5\uff08null \u2192 0\uff09\uff0c\u9012\u5f52\u5b50\u8282\u70b9\uff0c\u5408\u5e76\uff081 + max\uff09\u3002\u540c\u6837\u7684\u6a21\u5f0f\u9002\u7528\u4e8e\u6570\u5341\u79cd\u6811\u95ee\u9898\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/03.%20trees/#_4","title":"\u7b80\u5355\uff1a\u7ffb\u8f6c\u4e8c\u53c9\u6811","text":"<pre><code>def invert_tree(root):\n    if not root:\n        return None\n    root.left, root.right = invert_tree(root.right), invert_tree(root.left)\n    return root\n</code></pre>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/03.%20trees/#_5","title":"\u4e2d\u7b49\uff1a\u4e8c\u53c9\u6811\u7684\u6700\u8fd1\u516c\u5171\u7956\u5148","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u627e\u5230\u65e2\u662f \\(p\\) \u53c8\u662f \\(q\\) \u7684\u7956\u5148\u7684\u6700\u4f4e\u8282\u70b9\u3002</p> </li> <li> <p>\u6a21\u5f0f\uff1a\u5982\u679c \\(p\\) \u548c \\(q\\) \u90fd\u5728\u5de6\u5b50\u6811\u4e2d\uff0c\u5219 LCA \u5728\u5de6\u5b50\u6811\u4e2d\u3002\u5982\u679c\u90fd\u5728\u53f3\u5b50\u6811\u4e2d\uff0c\u5219\u5728\u53f3\u5b50\u6811\u4e2d\u3002\u5982\u679c\u5b83\u4eec\u5206\u5f00\u4e86\uff08\u4e00\u4e2a\u5728\u5de6\uff0c\u4e00\u4e2a\u5728\u53f3\uff09\uff0c\u5219\u5f53\u524d\u8282\u70b9\u5c31\u662f LCA\u3002</p> </li> </ul> <pre><code>def lowest_common_ancestor(root, p, q):\n    if not root or root == p or root == q:\n        return root\n\n    left = lowest_common_ancestor(root.left, p, q)\n    right = lowest_common_ancestor(root.right, p, q)\n\n    if left and right:\n        return root  # p \u548c q \u5728\u4e0d\u540c\u5b50\u6811\u4e2d\n    return left if left else right\n</code></pre> <ul> <li>\u9677\u9631\uff1a\u8fd9\u5047\u8bbe \\(p\\) \u548c \\(q\\) \u90fd\u5728\u6811\u4e2d\u3002\u5982\u679c\u5b83\u4eec\u53ef\u80fd\u4e0d\u5728\uff0c\u4f60\u9700\u8981\u989d\u5916\u7684\u68c0\u67e5\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/03.%20trees/#_6","title":"\u56f0\u96be\uff1a\u4e8c\u53c9\u6811\u4e2d\u7684\u6700\u5927\u8def\u5f84\u548c","text":"<ul> <li>\u95ee\u9898\uff1a\u627e\u51fa\u4efb\u610f\u4e24\u4e2a\u8282\u70b9\u4e4b\u95f4\u7684\u6700\u5927\u8def\u5f84\u548c\uff08\u8def\u5f84\u4e0d\u9700\u8981\u7ecf\u8fc7\u6839\u8282\u70b9\uff09\u3002</li> </ul> <pre><code>def max_path_sum(root):\n    best = [float('-inf')]\n\n    def dfs(node):\n        if not node:\n            return 0\n        left = max(dfs(node.left), 0)   # \u5ffd\u7565\u8d1f\u8def\u5f84\n        right = max(dfs(node.right), 0)\n\n        # \u7ecf\u8fc7\u5f53\u524d\u8282\u70b9\u7684\u8def\u5f84\uff08\u53ef\u80fd\u4f5c\u4e3a\"\u8f6c\u5f2f\u70b9\"\uff09\n        best[0] = max(best[0], node.val + left + right)\n\n        # \u8fd4\u56de\u5230\u7236\u8282\u70b9\u7684\u6700\u5927\u589e\u76ca\n        return node.val + max(left, right)\n\n    dfs(root)\n    return best[0]\n</code></pre> <ul> <li>\u5173\u952e\u6d1e\u5bdf\uff1a\u5728\u6bcf\u4e2a\u8282\u70b9\uff0c\u6709\u4e24\u4e2a\u95ee\u9898\uff1a(1) \u7ecf\u8fc7\u8fd9\u4e2a\u8282\u70b9\u7684\u6700\u4f73\u8def\u5f84\u662f\u4ec0\u4e48\uff08\u5de6 + \u8282\u70b9 + \u53f3\uff09\uff1f(2) \u8fd9\u4e2a\u8282\u70b9\u53ef\u4ee5\u8d21\u732e\u7ed9\u5176\u7236\u8282\u70b9\u7684\u6700\u4f73\u8def\u5f84\u662f\u4ec0\u4e48\uff08\u8282\u70b9 + max(\u5de6, \u53f3)\uff0c\u56e0\u4e3a\u8def\u5f84\u4e0d\u80fd\u5728\u4e24\u4e2a\u5c42\u7ea7\u5206\u53c9\uff09\uff1f\u6df7\u6dc6\u8fd9\u4e24\u8005\u662f\u6700\u5e38\u89c1\u7684\u9519\u8bef\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/03.%20trees/#bst","title":"\u4e8c\u53c9\u641c\u7d22\u6811\uff08BST\uff09","text":"<ul> <li>BST \u6ee1\u8db3\uff1a\u5bf9\u4e8e\u6bcf\u4e2a\u8282\u70b9\uff0c\u5de6\u5b50\u6811\u4e2d\u7684\u6240\u6709\u503c\u90fd\u8f83\u5c0f\uff0c\u53f3\u5b50\u6811\u4e2d\u7684\u6240\u6709\u503c\u90fd\u8f83\u5927\u3002\u8fd9\u5b9e\u73b0\u4e86 \\(O(\\log n)\\) \u7684\u641c\u7d22\u3001\u63d2\u5165\u548c\u5220\u9664\uff08\u5f53\u5e73\u8861\u65f6\uff09\u3002</li> </ul> <pre><code>def search_bst(root, target):\n    if not root:\n        return None\n    if target &lt; root.val:\n        return search_bst(root.left, target)\n    elif target &gt; root.val:\n        return search_bst(root.right, target)\n    else:\n        return root\n\ndef insert_bst(root, val):\n    if not root:\n        return TreeNode(val)\n    if val &lt; root.val:\n        root.left = insert_bst(root.left, val)\n    else:\n        root.right = insert_bst(root.right, val)\n    return root\n</code></pre> <ul> <li>\u9677\u9631\uff1aBST \u64cd\u4f5c\u4ec5\u5728\u6811\u5e73\u8861\u65f6\u624d\u662f \\(O(\\log n)\\)\u3002\u7531\u5df2\u6392\u5e8f\u63d2\u5165\u6784\u5efa\u7684 BST \u9000\u5316\u4e3a\u94fe\u8868\uff1a\u6bcf\u6b21\u64cd\u4f5c \\(O(n)\\)\u3002\u8fd9\u5c31\u662f\u5e73\u8861 BST\uff08AVL\u3001\u7ea2\u9ed1\u6811\uff09\u5b58\u5728\u7684\u539f\u56e0\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/03.%20trees/#_7","title":"\u4e2d\u7b49\uff1a\u9a8c\u8bc1\u4e8c\u53c9\u641c\u7d22\u6811","text":"<pre><code>def is_valid_bst(root, lo=float('-inf'), hi=float('inf')):\n    if not root:\n        return True\n    if root.val &lt;= lo or root.val &gt;= hi:\n        return False\n    return (is_valid_bst(root.left, lo, root.val) and\n            is_valid_bst(root.right, root.val, hi))\n</code></pre> <ul> <li>\u9677\u9631\uff1a\u53ea\u68c0\u67e5 <code>left.val &lt; root.val &lt; right.val</code> \u662f\u9519\u8bef\u7684\u3002\u7ea6\u675f\u6761\u4ef6\u662f\u5de6\u5b50\u6811\u4e2d\u6240\u6709\u8282\u70b9\u90fd\u66f4\u5c0f\uff0c\u800c\u4e0d\u4ec5\u4ec5\u662f\u76f4\u63a5\u5b50\u8282\u70b9\u3002<code>lo</code>/<code>hi</code> \u8fb9\u754c\u5c06\u8fd9\u4e2a\u7ea6\u675f\u5411\u4e0b\u4f20\u9012\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/03.%20trees/#k","title":"\u4e2d\u7b49\uff1a\u4e8c\u53c9\u641c\u7d22\u6811\u4e2d\u7b2c K \u5c0f\u7684\u5143\u7d20","text":"<ul> <li>\u6a21\u5f0f\uff1aBST \u7684\u4e2d\u5e8f\u904d\u5386\u6309\u6392\u5e8f\u987a\u5e8f\u8bbf\u95ee\u8282\u70b9\u3002\u8bbf\u95ee\u7684\u7b2c \\(k\\) \u4e2a\u8282\u70b9\u5c31\u662f\u7b54\u6848\u3002</li> </ul> <pre><code>def kth_smallest(root, k):\n    count = [0]\n    result = [None]\n\n    def inorder(node):\n        if not node or result[0] is not None:\n            return\n        inorder(node.left)\n        count[0] += 1\n        if count[0] == k:\n            result[0] = node.val\n            return\n        inorder(node.right)\n\n    inorder(root)\n    return result[0]\n</code></pre>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/03.%20trees/#trie","title":"\u524d\u7f00\u6811\uff08Trie\uff09","text":"<ul> <li>\u524d\u7f00\u6811\u9010\u5b57\u7b26\u5730\u5c06\u5b57\u7b26\u4e32\u5b58\u50a8\u5728\u6811\u4e2d\u3002\u6bcf\u6761\u8fb9\u4ee3\u8868\u4e00\u4e2a\u5b57\u7b26\uff0c\u4ece\u6839\u5230\u6807\u8bb0\u8282\u70b9\u7684\u8def\u5f84\u4ee3\u8868\u5b58\u50a8\u7684\u5b57\u7b26\u4e32\u3002\u524d\u7f00\u6811\u5b9e\u73b0\u4e86 \\(O(L)\\) \u7684\u67e5\u627e\uff0c\u5176\u4e2d \\(L\\) \u662f\u5b57\u7b26\u4e32\u957f\u5ea6\uff0c\u65e0\u8bba\u5b58\u50a8\u4e86\u591a\u5c11\u4e2a\u5b57\u7b26\u4e32\u3002</li> </ul> <pre><code>class TrieNode:\n    def __init__(self):\n        self.children = {}\n        self.is_end = False\n\nclass Trie:\n    def __init__(self):\n        self.root = TrieNode()\n\n    def insert(self, word):\n        node = self.root\n        for char in word:\n            if char not in node.children:\n                node.children[char] = TrieNode()\n            node = node.children[char]\n        node.is_end = True\n\n    def search(self, word):\n        node = self.root\n        for char in word:\n            if char not in node.children:\n                return False\n            node = node.children[char]\n        return node.is_end\n\n    def starts_with(self, prefix):\n        node = self.root\n        for char in prefix:\n            if char not in node.children:\n                return False\n            node = node.children[char]\n        return True\n</code></pre> <ul> <li>\u4f55\u65f6\u4f7f\u7528\uff1a\u81ea\u52a8\u8865\u5168\u3001\u62fc\u5199\u68c0\u67e5\u3001\u5355\u8bcd\u6e38\u620f\u3001IP \u8def\u7531\u8868\u3002\u6bcf\u5f53\u4f60\u9700\u8981\u57fa\u4e8e\u524d\u7f00\u7684\u64cd\u4f5c\u65f6\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/03.%20trees/#ii","title":"\u56f0\u96be\uff1a\u5355\u8bcd\u641c\u7d22 II","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u7ed9\u5b9a\u4e00\u4e2a\u5b57\u7b26\u677f\u548c\u4e00\u4e2a\u5355\u8bcd\u5217\u8868\uff0c\u627e\u51fa\u6240\u6709\u53ef\u4ee5\u901a\u8fc7\u904d\u5386\u76f8\u90bb\u5355\u5143\u683c\u5f62\u6210\u7684\u5355\u8bcd\u3002</p> </li> <li> <p>\u6a21\u5f0f\uff1a\u4ece\u5355\u8bcd\u5217\u8868\u6784\u5efa\u4e00\u4e2a\u524d\u7f00\u6811\uff0c\u7136\u540e\u4ece\u6bcf\u4e2a\u5355\u5143\u683c\u4f7f\u7528\u524d\u7f00\u6811\u8fdb\u884c DFS\uff0c\u5c3d\u65e9\u526a\u679d\u5206\u652f\uff08\u5982\u679c\u6ca1\u6709\u5355\u8bcd\u4ee5\u5f53\u524d\u524d\u7f00\u5f00\u5934\uff0c\u5219\u505c\u6b62\uff09\u3002</p> </li> <li> <p>\u9677\u9631\uff1a\u6ca1\u6709\u524d\u7f00\u6811\u7684\u8bdd\uff0c\u4f60\u9700\u8981\u4e3a\u6bcf\u4e2a\u5355\u8bcd\u5355\u72ec\u8fdb\u884c DFS\uff1a\\(O(w \\cdot m \\cdot n \\cdot 4^L)\\)\u3002\u524d\u7f00\u6811\u8de8\u5355\u8bcd\u5171\u4eab\u524d\u7f00\u8ba1\u7b97\uff0c\u5927\u5e45\u51cf\u5c11\u4e86\u5de5\u4f5c\u91cf\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/03.%20trees/#_8","title":"\u5e76\u67e5\u96c6\uff08\u4e0d\u76f8\u4ea4\u96c6\u5408\uff09","text":"<ul> <li>\u5e76\u67e5\u96c6\u8ddf\u8e2a\u4e00\u7ec4\u4e0d\u76f8\u4ea4\u96c6\u5408\u3002\u4e24\u4e2a\u64cd\u4f5c\uff1a<code>find(x)</code> \u8fd4\u56de \\(x\\) \u6240\u5728\u96c6\u5408\u7684\u4ee3\u8868\u5143\uff0c<code>union(x, y)</code> \u5408\u5e76\u5305\u542b \\(x\\) \u548c \\(y\\) \u7684\u96c6\u5408\u3002</li> </ul> <pre><code>class UnionFind:\n    def __init__(self, n):\n        self.parent = list(range(n))\n        self.rank = [0] * n\n        self.count = n  # \u8fde\u901a\u5206\u91cf\u6570\n\n    def find(self, x):\n        if self.parent[x] != x:\n            self.parent[x] = self.find(self.parent[x])  # \u8def\u5f84\u538b\u7f29\n        return self.parent[x]\n\n    def union(self, x, y):\n        rx, ry = self.find(x), self.find(y)\n        if rx == ry:\n            return False  # \u5df2\u7ecf\u8fde\u901a\n        # \u6309\u79e9\u5408\u5e76\n        if self.rank[rx] &lt; self.rank[ry]:\n            rx, ry = ry, rx\n        self.parent[ry] = rx\n        if self.rank[rx] == self.rank[ry]:\n            self.rank[rx] += 1\n        self.count -= 1\n        return True\n</code></pre> <ul> <li> <p>\u901a\u8fc7\u8def\u5f84\u538b\u7f29\u548c\u6309\u79e9\u5408\u5e76\uff0c\u4e24\u4e2a\u64cd\u4f5c\u90fd\u662f\u5e73\u644a \\(O(\\alpha(n)) \\approx O(1)\\)\uff08\u53cd\u963f\u514b\u66fc\u51fd\u6570\uff0c\u5b9e\u9645\u4e0a\u662f\u5e38\u6570\uff09\u3002</p> </li> <li> <p>\u4f55\u65f6\u4f7f\u7528\uff1a\u8fde\u901a\u5206\u91cf\u3001\u65e0\u5411\u56fe\u4e2d\u7684\u73af\u68c0\u6d4b\u3001Kruskal \u6700\u5c0f\u751f\u6210\u6811\u3001\u5206\u7ec4\u7b49\u4ef7\u9879\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/03.%20trees/#_9","title":"\u4e2d\u7b49\uff1a\u8fde\u901a\u5206\u91cf\u6570\u91cf","text":"<pre><code>def count_components(n, edges):\n    uf = UnionFind(n)\n    for u, v in edges:\n        uf.union(u, v)\n    return uf.count\n</code></pre>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/03.%20trees/#_10","title":"\u4e2d\u7b49\uff1a\u5197\u4f59\u8fde\u63a5","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u627e\u51fa\u4ece\u56fe\u4e2d\u79fb\u9664\u540e\u4f7f\u56fe\u6210\u4e3a\u6811\u7684\u90a3\u6761\u8fb9\uff08\u5373\uff0c\u521b\u5efa\u73af\u7684\u90a3\u6761\u8fb9\uff09\u3002</p> </li> <li> <p>\u6a21\u5f0f\uff1a\u9010\u4e00\u5904\u7406\u8fb9\u3002\u7b2c\u4e00\u6761\u4e24\u4e2a\u7aef\u70b9\u5df2\u7ecf\u5728\u540c\u4e00\u5206\u91cf\u4e2d\u7684\u8fb9\u5c31\u662f\u521b\u5efa\u73af\u7684\u8fb9\u3002</p> </li> </ul> <pre><code>def find_redundant(edges):\n    uf = UnionFind(len(edges) + 1)\n    for u, v in edges:\n        if not uf.union(u, v):\n            return [u, v]  # \u5df2\u7ecf\u8fde\u901a \u2192 \u8fd9\u6761\u8fb9\u521b\u5efa\u4e86\u73af\n</code></pre>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/03.%20trees/#_11","title":"\u7ebf\u6bb5\u6811\u548c\u6811\u72b6\u6570\u7ec4","text":"<ul> <li> <p>\u7ebf\u6bb5\u6811\u652f\u6301\u533a\u95f4\u67e5\u8be2\uff08\u5b50\u6570\u7ec4\u4e0a\u7684\u548c\u3001\u6700\u5c0f\u503c\u3001\u6700\u5927\u503c\uff09\u548c\u5355\u70b9\u66f4\u65b0\uff0c\u4e24\u8005\u90fd\u662f \\(O(\\log n)\\)\u3002</p> </li> <li> <p>\u6811\u72b6\u6570\u7ec4\uff08\u4e8c\u53c9\u7d22\u5f15\u6811\uff09\u662f\u524d\u7f00\u548c\u67e5\u8be2\u548c\u5355\u70b9\u66f4\u65b0\u7684\u66f4\u7b80\u5355\u3001\u66f4\u5feb\u7684\u66ff\u4ee3\u65b9\u6848\u3002\u5b83\u4f7f\u7528\u4e00\u79cd\u5de7\u5999\u7684\u4f4d\u64cd\u4f5c\u6280\u5de7\uff1a\u6bcf\u4e2a\u4f4d\u7f6e\u5b58\u50a8\u4e00\u4e2a\u90e8\u5206\u548c\uff0c\u8986\u76d6\u8303\u56f4\u7531\u6700\u4f4e\u8bbe\u7f6e\u4f4d\u51b3\u5b9a\u3002</p> </li> </ul> <pre><code>class FenwickTree:\n    def __init__(self, n):\n        self.n = n\n        self.tree = [0] * (n + 1)\n\n    def update(self, i, delta):\n        i += 1  # 1-indexed\n        while i &lt;= self.n:\n            self.tree[i] += delta\n            i += i &amp; (-i)  # \u52a0\u4e0a\u6700\u4f4e\u8bbe\u7f6e\u4f4d\n\n    def prefix_sum(self, i):\n        i += 1\n        total = 0\n        while i &gt; 0:\n            total += self.tree[i]\n            i -= i &amp; (-i)  # \u79fb\u9664\u6700\u4f4e\u8bbe\u7f6e\u4f4d\n        return total\n\n    def range_sum(self, l, r):\n        return self.prefix_sum(r) - (self.prefix_sum(l - 1) if l &gt; 0 else 0)\n</code></pre> <ul> <li>\u4f55\u65f6\u4f7f\u7528\uff1a\u9700\u8981\u5e26\u66f4\u65b0\u7684\u91cd\u590d\u533a\u95f4\u67e5\u8be2\u7684\u95ee\u9898\u3002\u5f53\u4f60\u53ea\u9700\u8981\u524d\u7f00\u548c\u65f6\u9996\u9009\u6811\u72b6\u6570\u7ec4\uff1b\u5f53\u4f60\u9700\u8981\u4efb\u610f\u533a\u95f4\u64cd\u4f5c\uff08\u6700\u5c0f\u503c\u3001\u6700\u5927\u503c\u3001GCD\uff09\u65f6\u4f7f\u7528\u7ebf\u6bb5\u6811\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/03.%20trees/#_12","title":"\u5e38\u89c1\u9677\u9631\u603b\u7ed3","text":"\u9677\u9631 \u793a\u4f8b \u4fee\u590d BST \u53ea\u68c0\u67e5\u76f4\u63a5\u5b50\u8282\u70b9 <code>left.val &lt; root.val</code> \u9057\u6f0f\u4e86\u6df1\u5c42\u8fdd\u89c4 \u4f20\u9012 <code>lo</code>/<code>hi</code> \u8fb9\u754c \u9012\u5f52\u4e2d \\(O(n^2)\\) \u5217\u8868\u62fc\u63a5 <code>inorder(left) + [val] + inorder(right)</code> \u8ffd\u52a0\u5230\u5171\u4eab\u5217\u8868 \u5fd8\u8bb0\u57fa\u672c\u60c5\u51b5 \u7a7a\u6811\u4e0a\u7684\u65e0\u9650\u9012\u5f52 <code>if not root: return</code> \u6df7\u6dc6\u7ecf\u8fc7\u8def\u5f84\u548c\u5230\u7236\u8282\u70b9\u7684\u8def\u5f84 \u6700\u5927\u8def\u5f84\u548c\uff1a\u5728\u4e24\u4e2a\u5c42\u7ea7\u5206\u53c9 \u5411\u7236\u8282\u70b9\u8fd4\u56de\u5355\u5206\u652f\uff0c\u5355\u72ec\u8ddf\u8e2a\u53cc\u5206\u652f \u6811\u72b6\u6570\u7ec4 1-indexed vs 0-indexed \u6811\u6570\u7ec4\u4e2d\u7684\u5dee\u4e00\u9519\u8bef \u5165\u53e3\u5904\u59cb\u7ec8 <code>i += 1</code> \u5e76\u67e5\u96c6\u6ca1\u6709\u8def\u5f84\u538b\u7f29 \u6700\u574f\u60c5\u51b5\u4e0b\u6bcf\u6b21 <code>find</code> \u662f \\(O(n)\\) <code>self.parent[x] = self.find(self.parent[x])</code>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/03.%20trees/#neetcode","title":"\u8bfe\u540e\u7ec3\u4e60\u9898\uff08NeetCode\uff09","text":""},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/03.%20trees/#_13","title":"\u4e8c\u53c9\u6811\u6a21\u5f0f","text":"<ul> <li>\u7ffb\u8f6c\u4e8c\u53c9\u6811 \u2014 \u57fa\u7840\u9012\u5f52</li> <li>\u4e8c\u53c9\u6811\u7684\u6700\u5927\u6df1\u5ea6 \u2014 \u9012\u5f52\u6df1\u5ea6</li> <li>\u76f8\u540c\u7684\u6811 \u2014 \u540c\u6b65\u904d\u5386</li> <li>\u53e6\u4e00\u68f5\u6811\u7684\u5b50\u6811 \u2014 \u5d4c\u5957\u9012\u5f52</li> <li>\u4e8c\u53c9\u6811\u7684\u5c42\u5e8f\u904d\u5386 \u2014 \u5e26\u5c42\u7ea7\u8ddf\u8e2a\u7684 BFS</li> <li>\u4e8c\u53c9\u6811\u4e2d\u7684\u6700\u5927\u8def\u5f84\u548c \u2014 \u5e26\u5168\u5c40\u6700\u4f18\u7684 DFS</li> <li>\u5e8f\u5217\u5316\u4e0e\u53cd\u5e8f\u5217\u5316\u4e8c\u53c9\u6811 \u2014 \u524d\u5e8f\u904d\u5386 + null \u6807\u8bb0</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/03.%20trees/#bst_1","title":"BST \u6a21\u5f0f","text":"<ul> <li>\u9a8c\u8bc1\u4e8c\u53c9\u641c\u7d22\u6811 \u2014 \u8fb9\u754c\u4f20\u64ad</li> <li>\u4e8c\u53c9\u641c\u7d22\u6811\u4e2d\u7b2c K \u5c0f\u7684\u5143\u7d20 \u2014 \u4e2d\u5e8f\u904d\u5386</li> <li>\u4e8c\u53c9\u641c\u7d22\u6811\u7684\u6700\u8fd1\u516c\u5171\u7956\u5148 \u2014 \u5229\u7528 BST \u6392\u5e8f\u6027\u8d28</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/03.%20trees/#_14","title":"\u524d\u7f00\u6811","text":"<ul> <li>\u5b9e\u73b0 Trie \u2014 \u57fa\u7840\u524d\u7f00\u6811\u64cd\u4f5c</li> <li>\u8bbe\u8ba1\u6dfb\u52a0\u548c\u641c\u7d22\u5355\u8bcd \u2014 \u524d\u7f00\u6811 + \u5e26\u901a\u914d\u7b26\u7684 DFS</li> <li>\u5355\u8bcd\u641c\u7d22 II \u2014 \u524d\u7f00\u6811\u5f15\u5bfc\u7684\u56de\u6eaf</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/03.%20trees/#_15","title":"\u5e76\u67e5\u96c6","text":"<ul> <li>\u8fde\u901a\u5206\u91cf\u6570\u91cf \u2014 \u57fa\u7840\u5e76\u67e5\u96c6</li> <li>\u5197\u4f59\u8fde\u63a5 \u2014 \u901a\u8fc7\u5e76\u67e5\u96c6\u68c0\u6d4b\u73af</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/04.%20graphs/","title":"\u56fe","text":"<p>\u56fe\u5efa\u6a21\u4e86\u5173\u7cfb\u548c\u8fde\u63a5\u2014\u2014\u4ece\u793e\u4ea4\u7f51\u7edc\u5230\u9053\u8def\u5730\u56fe\u518d\u5230\u4f9d\u8d56\u94fe\u3002\u672c\u6587\u4ef6\u6db5\u76d6\u56fe\u7684\u8868\u793a\u3001BFS\u3001DFS\u3001\u6700\u77ed\u8def\u5f84\u3001\u62d3\u6251\u6392\u5e8f\u548c\u8fde\u901a\u5206\u91cf\uff0c\u5305\u62ec\u904d\u5386\u548c\u5bfb\u8def\u6a21\u5f0f\uff0c\u8fd9\u4e9b\u662f\u56fe\u9762\u8bd5\u9898\u4e2d\u7684\u6838\u5fc3\u3002</p> <ul> <li> <p>\u6211\u4eec\u5728\u7b2c12\u7ae0\uff08\u90bb\u63a5\u77e9\u9635\u3001\u62c9\u666e\u62c9\u65af\u77e9\u9635\u3001\u8c31\u6027\u8d28\uff09\u548c\u7b2c13\u7ae0\uff08\u6811\u3001\u5e73\u9762\u6027\u3001\u7740\u8272\uff09\u4e2d\u5df2\u7ecf\u4ecb\u7ecd\u4e86\u56fe\u8bba\u3002\u8fd9\u91cc\u6211\u4eec\u4e13\u6ce8\u4e8e\u7b97\u6cd5\u6a21\u5f0f\uff1a\u5982\u4f55\u5728\u4ee3\u7801\u4e2d\u904d\u5386\u3001\u641c\u7d22\u548c\u4f18\u5316\u56fe\u3002</p> </li> <li> <p>\u4e24\u79cd\u57fa\u672c\u7684\u56fe\u7b97\u6cd5\u662f BFS \u548c DFS\u3002\u51e0\u4e4e\u6240\u6709\u56fe\u95ee\u9898\u90fd\u53ef\u4ee5\u5f52\u7ed3\u4e3a\u5176\u4e2d\u4e00\u79cd\uff0c\u53ef\u80fd\u5e26\u6709\u4fee\u6539\u3002\u638c\u63e1\u8fd9\u4e24\u79cd\u7b97\u6cd5\uff0c\u4f60\u5c31\u80fd\u89e3\u51b3\u7edd\u5927\u591a\u6570\u56fe\u95ee\u9898\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/04.%20graphs/#_2","title":"\u56fe\u7684\u8868\u793a","text":"<ul> <li>\u90bb\u63a5\u8868\uff1a\u5bf9\u4e8e\u6bcf\u4e2a\u8282\u70b9\uff0c\u5b58\u50a8\u4e00\u4e2a\u90bb\u5c45\u5217\u8868\u3002\u7a7a\u95f4\uff1a\\(O(|V| + |E|)\\)\u3002\u6700\u9002\u5408\u7a00\u758f\u56fe\uff08\u5927\u591a\u6570\u73b0\u5b9e\u4e16\u754c\u7684\u56fe\uff09\u3002</li> </ul> <pre><code># \u65e0\u5411\u56fe\ngraph = {\n    0: [1, 2],\n    1: [0, 3],\n    2: [0, 3],\n    3: [1, 2]\n}\n\n# \u4ece\u8fb9\u5217\u8868\u6784\u5efa\ndef build_graph(n, edges):\n    graph = {i: [] for i in range(n)}\n    for u, v in edges:\n        graph[u].append(v)\n        graph[v].append(u)  # \u6709\u5411\u56fe\u7701\u7565\u8fd9\u4e00\u884c\n    return graph\n</code></pre> <ul> <li> <p>\u90bb\u63a5\u77e9\u9635\uff1a\\(n \\times n\\) \u77e9\u9635\uff0c\u5176\u4e2d \\(A[i][j] = 1\\) \u5982\u679c\u8fb9 \\((i, j)\\) \u5b58\u5728\u3002\u7a7a\u95f4\uff1a\\(O(|V|^2)\\)\u3002\u6700\u9002\u5408\u7a20\u5bc6\u56fe\u6216\u9700\u8981 \\(O(1)\\) \u8fb9\u67e5\u627e\u65f6\u3002</p> </li> <li> <p>\u4f55\u65f6\u4f7f\u7528\u54ea\u79cd\uff1a\u7edd\u5927\u591a\u6570\u60c5\u51b5\u4f7f\u7528\u90bb\u63a5\u8868\u3002\u53ea\u6709\u5f53\u56fe\u5f88\u7a20\u5bc6\uff08\\(|E| \\approx |V|^2\\)\uff09\u6216\u9700\u8981\u5e38\u6570\u65f6\u95f4\u8fb9\u5b58\u5728\u6027\u68c0\u67e5\u65f6\u624d\u4f7f\u7528\u77e9\u9635\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/04.%20graphs/#bfs","title":"\u6a21\u5f0f\uff1aBFS\uff08\u5e7f\u5ea6\u4f18\u5148\u641c\u7d22\uff09","text":"<ul> <li>BFS \u4f7f\u7528\u961f\u5217\u9010\u5c42\u63a2\u7d22\u8282\u70b9\u3002\u5b83\u662f\u4ee5\u4e0b\u95ee\u9898\u7684\u9996\u9009\u7b97\u6cd5\uff1a<ul> <li>\u65e0\u6743\u56fe\u4e2d\u7684\u6700\u77ed\u8def\u5f84</li> <li>\u5c42\u5e8f\u904d\u5386</li> <li>\u5bfb\u627e\u8fde\u901a\u5206\u91cf</li> <li>\u4efb\u4f55\u8be2\u95ee\"\u6700\u5c0f\u6b65\u6570\"\u7684\u95ee\u9898</li> </ul> </li> </ul> <pre><code>from collections import deque\n\ndef bfs(graph, start):\n    visited = {start}\n    queue = deque([start])\n\n    while queue:\n        node = queue.popleft()\n        for neighbour in graph[node]:\n            if neighbour not in visited:\n                visited.add(neighbour)\n                queue.append(neighbour)\n</code></pre> <ul> <li>\u5173\u952e\uff1a\u5728\u5165\u961f\u65f6\u6dfb\u52a0\u5230 <code>visited</code>\uff0c\u800c\u4e0d\u662f\u5728\u51fa\u961f\u65f6\u3002\u5982\u679c\u4f60\u5728\u51fa\u961f\u65f6\u6807\u8bb0\u5df2\u8bbf\u95ee\uff0c\u540c\u4e00\u4e2a\u8282\u70b9\u53ef\u80fd\u88ab\u4e0d\u540c\u524d\u9a71\u591a\u6b21\u5165\u961f\uff0c\u6d6a\u8d39\u65f6\u95f4\u5e76\u53ef\u80fd\u5bfc\u81f4\u9519\u8bef\u7ed3\u679c\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/04.%20graphs/#_3","title":"\u7b80\u5355\uff1a\u5c9b\u5c7f\u6570\u91cf","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u7ed9\u5b9a\u4e00\u4e2a\u7531 '1'\uff08\u9646\u5730\uff09\u548c '0'\uff08\u6c34\uff09\u7ec4\u6210\u7684 2D \u7f51\u683c\uff0c\u8ba1\u7b97\u5c9b\u5c7f\u7684\u6570\u91cf\u3002</p> </li> <li> <p>\u6a21\u5f0f\uff1a\u904d\u5386\u7f51\u683c\u3002\u5f53\u627e\u5230\u4e00\u4e2a '1' \u65f6\uff0c\u4f7f\u7528 BFS/DFS \u5c06\u6240\u6709\u8fde\u901a\u7684\u9646\u5730\u5355\u5143\u683c\u6807\u8bb0\u4e3a\u5df2\u8bbf\u95ee\u3002\u6bcf\u6b21\u5f00\u59cb BFS \u5c31\u662f\u4e00\u4e2a\u5c9b\u5c7f\u3002</p> </li> </ul> <pre><code>from collections import deque\n\ndef num_islands(grid):\n    if not grid:\n        return 0\n\n    rows, cols = len(grid), len(grid[0])\n    count = 0\n\n    for r in range(rows):\n        for c in range(cols):\n            if grid[r][c] == '1':\n                count += 1\n                # BFS \u6807\u8bb0\u6574\u4e2a\u5c9b\u5c7f\n                queue = deque([(r, c)])\n                grid[r][c] = '0'  # \u6807\u8bb0\u5df2\u8bbf\u95ee\n                while queue:\n                    cr, cc = queue.popleft()\n                    for dr, dc in [(0,1),(0,-1),(1,0),(-1,0)]:\n                        nr, nc = cr + dr, cc + dc\n                        if 0 &lt;= nr &lt; rows and 0 &lt;= nc &lt; cols and grid[nr][nc] == '1':\n                            grid[nr][nc] = '0'\n                            queue.append((nr, nc))\n\n    return count\n</code></pre> <ul> <li> <p>\u9677\u9631\uff1a<code>directions = [(0,1),(0,-1),(1,0),(-1,0)]</code> \u6a21\u5f0f\u7528\u4e8e\u56db\u8fde\u901a\u7f51\u683c\u90bb\u5c45\uff0c\u51e0\u4e4e\u6bcf\u4e2a\u7f51\u683c\u95ee\u9898\u90fd\u4f1a\u7528\u5230\u3002\u8bb0\u4f4f\u5b83\u3002\u5bf9\u4e8e\u516b\u8fde\u901a\uff0c\u52a0\u4e0a\u5bf9\u89d2\u7ebf\u3002</p> </li> <li> <p>\u9677\u9631\uff1a\u4fee\u6539\u8f93\u5165\u7f51\u683c\uff08<code>grid[r][c] = '0'</code>\uff09\u907f\u514d\u4e86\u9700\u8981\u5355\u72ec\u7684 <code>visited</code> \u96c6\u5408\u3002\u5728\u9762\u8bd5\u4e2d\u8fd9\u662f\u53ef\u4ee5\u63a5\u53d7\u7684\uff0c\u4f46\u8981\u660e\u786e\u8bf4\u660e\u6743\u8861\uff08\u6539\u53d8\u4e86\u8f93\u5165\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/04.%20graphs/#_4","title":"\u4e2d\u7b49\uff1a\u8150\u70c2\u7684\u6a58\u5b50","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u65b0\u9c9c\u6a58\u5b50\u5982\u679c\u4e0e\u8150\u70c2\u6a58\u5b50\u76f8\u90bb\u5219\u4f1a\u8150\u70c2\u3002\u8fd4\u56de\u6240\u6709\u6a58\u5b50\u90fd\u8150\u70c2\u7684\u6700\u77ed\u65f6\u95f4\uff08\u5982\u679c\u4e0d\u53ef\u80fd\u5219\u8fd4\u56de -1\uff09\u3002</p> </li> <li> <p>\u6a21\u5f0f\uff1a\u591a\u6e90 BFS\u3002\u5c06\u6240\u6709\u521d\u59cb\u8150\u70c2\u7684\u6a58\u5b50\u540c\u65f6\u653e\u5165\u961f\u5217\u3002\u6bcf\u5c42 BFS \u5c31\u662f\u4e00\u4e2a\u65f6\u95f4\u6b65\u3002</p> </li> </ul> <pre><code>from collections import deque\n\ndef oranges_rotting(grid):\n    rows, cols = len(grid), len(grid[0])\n    queue = deque()\n    fresh = 0\n\n    for r in range(rows):\n        for c in range(cols):\n            if grid[r][c] == 2:\n                queue.append((r, c))\n            elif grid[r][c] == 1:\n                fresh += 1\n\n    if fresh == 0:\n        return 0\n\n    time = 0\n    while queue and fresh &gt; 0:\n        time += 1\n        for _ in range(len(queue)):\n            cr, cc = queue.popleft()\n            for dr, dc in [(0,1),(0,-1),(1,0),(-1,0)]:\n                nr, nc = cr + dr, cc + dc\n                if 0 &lt;= nr &lt; rows and 0 &lt;= nc &lt; cols and grid[nr][nc] == 1:\n                    grid[nr][nc] = 2\n                    fresh -= 1\n                    queue.append((nr, nc))\n\n    return time if fresh == 0 else -1\n</code></pre> <ul> <li>\u5173\u952e\u6d1e\u5bdf\uff1a\u591a\u6e90 BFS \u540c\u65f6\u5904\u7406\u6240\u6709\u6e90\u3002\u8fd9\u7ed9\u51fa\u4e86\u4ece\u4efb\u4f55\u6e90\u7684\u6700\u77ed\u8ddd\u79bb\uff0c\u8fd9\u6b63\u662f\"\u6700\u540e\u4e00\u4e2a\u65b0\u9c9c\u6a58\u5b50\u8150\u70c2\u9700\u8981\u591a\u957f\u65f6\u95f4\"\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/04.%20graphs/#dfs","title":"\u6a21\u5f0f\uff1aDFS\uff08\u6df1\u5ea6\u4f18\u5148\u641c\u7d22\uff09","text":"<ul> <li>DFS \u5c3d\u53ef\u80fd\u6df1\u5730\u63a2\u7d22\uff0c\u7136\u540e\u56de\u6eaf\u3002\u5b83\u4f7f\u7528\u6808\uff08\u663e\u5f0f\u6808\u6216\u901a\u8fc7\u9012\u5f52\u4f7f\u7528\u8c03\u7528\u6808\uff09\u3002DFS \u662f\u4ee5\u4e0b\u95ee\u9898\u7684\u9996\u9009\uff1a<ul> <li>\u73af\u68c0\u6d4b</li> <li>\u62d3\u6251\u6392\u5e8f</li> <li>\u8fde\u901a\u5206\u91cf</li> <li>\u56de\u6eaf / \u7a77\u4e3e\u641c\u7d22</li> <li>\u5e26\u7ea6\u675f\u7684\u5bfb\u8def</li> </ul> </li> </ul> <pre><code>def dfs(graph, node, visited=None):\n    if visited is None:\n        visited = set()\n    visited.add(node)\n    for neighbour in graph[node]:\n        if neighbour not in visited:\n            dfs(graph, neighbour, visited)\n</code></pre>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/04.%20graphs/#_5","title":"\u4e2d\u7b49\uff1a\u8bfe\u7a0b\u8868\uff08\u73af\u68c0\u6d4b\uff09","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u7ed9\u5b9a \\(n\\) \u95e8\u8bfe\u7a0b\u548c\u5148\u4fee\u6761\u4ef6\uff0c\u5224\u65ad\u662f\u5426\u80fd\u5b8c\u6210\u6240\u6709\u8bfe\u7a0b\uff08\u5373\uff0c\u6ca1\u6709\u5faa\u73af\u4f9d\u8d56\uff09\u3002</p> </li> <li> <p>\u6a21\u5f0f\uff1a\u5728\u6709\u5411\u56fe\u4e2d\u68c0\u6d4b\u73af\u3002\u4f7f\u7528\u5e26\u6709\u4e09\u79cd\u72b6\u6001\u7684 DFS\uff1a\u672a\u8bbf\u95ee\u3001\u6b63\u5728\u8fdb\u884c\uff08\u5728\u5f53\u524d DFS \u8def\u5f84\u4e0a\uff09\u3001\u5df2\u5b8c\u6210\u3002</p> </li> </ul> <pre><code>def can_finish(num_courses, prerequisites):\n    graph = {i: [] for i in range(num_courses)}\n    for course, prereq in prerequisites:\n        graph[course].append(prereq)\n\n    # 0 = \u672a\u8bbf\u95ee, 1 = \u8fdb\u884c\u4e2d, 2 = \u5df2\u5b8c\u6210\n    state = [0] * num_courses\n\n    def has_cycle(node):\n        if state[node] == 1:\n            return True   # \u56de\u8fb9 \u2192 \u73af\n        if state[node] == 2:\n            return False  # \u5df2\u7ecf\u5b8c\u5168\u63a2\u7d22\u8fc7\n\n        state[node] = 1  # \u6807\u8bb0\u4e3a\u8fdb\u884c\u4e2d\n        for neighbour in graph[node]:\n            if has_cycle(neighbour):\n                return True\n        state[node] = 2  # \u6807\u8bb0\u4e3a\u5df2\u5b8c\u6210\n        return False\n\n    for course in range(num_courses):\n        if has_cycle(course):\n            return False\n    return True\n</code></pre> <ul> <li>\u4e3a\u4ec0\u4e48\u9700\u8981\u4e09\u79cd\u72b6\u6001\uff1a\u4e24\u79cd\u72b6\u6001\uff08\u5df2\u8bbf\u95ee/\u672a\u8bbf\u95ee\uff09\u65e0\u6cd5\u533a\u5206\"\u6211\u6b63\u5728\u63a2\u7d22\u8fd9\u4e2a\u8282\u70b9\"\u548c\"\u6211\u5df2\u5b8c\u6210\u5bf9\u8fd9\u4e2a\u8282\u70b9\u7684\u63a2\u7d22\"\u3002\u627e\u5230\u4e00\u4e2a\u5f53\u524d\u6b63\u5728\u88ab\u63a2\u7d22\u7684\u8282\u70b9\uff08\u72b6\u6001 = 1\uff09\u610f\u5473\u7740\u6211\u4eec\u53d1\u73b0\u4e86\u73af\u3002\u627e\u5230\u4e00\u4e2a\u5df2\u7ecf\u5b8c\u5168\u63a2\u7d22\u7684\u8282\u70b9\uff08\u72b6\u6001 = 2\uff09\u53ea\u662f\u4ea4\u53c9\u8fb9\uff0c\u4e0d\u662f\u73af\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/04.%20graphs/#ii","title":"\u4e2d\u7b49\uff1a\u8bfe\u7a0b\u8868 II\uff08\u62d3\u6251\u6392\u5e8f\uff09","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u8fd4\u56de\u4e00\u4e2a\u6709\u6548\u7684\u8bfe\u7a0b\u987a\u5e8f\uff08\u62d3\u6251\u6392\u5e8f\uff09\u3002</p> </li> <li> <p>\u6a21\u5f0f\uff08Kahn \u7b97\u6cd5\u2014\u2014\u57fa\u4e8e BFS\uff09\uff1a\u4ece\u6ca1\u6709\u5165\u8fb9\u7684\u8282\u70b9\uff08\u5165\u5ea6\u4e3a 0\uff09\u5f00\u59cb\u3002\u5904\u7406\u5b83\u4eec\uff0c\u51cf\u5c11\u5b83\u4eec\u90bb\u5c45\u7684\u5165\u5ea6\u3002\u91cd\u590d\u3002</p> </li> </ul> <pre><code>from collections import deque\n\ndef find_order(num_courses, prerequisites):\n    graph = {i: [] for i in range(num_courses)}\n    indegree = [0] * num_courses\n\n    for course, prereq in prerequisites:\n        graph[prereq].append(course)\n        indegree[course] += 1\n\n    queue = deque([i for i in range(num_courses) if indegree[i] == 0])\n    order = []\n\n    while queue:\n        node = queue.popleft()\n        order.append(node)\n        for neighbour in graph[node]:\n            indegree[neighbour] -= 1\n            if indegree[neighbour] == 0:\n                queue.append(neighbour)\n\n    return order if len(order) == num_courses else []  # \u7a7a = \u5b58\u5728\u73af\n</code></pre> <ul> <li>\u9677\u9631\uff1a\u5982\u679c\u7ed3\u679c\u4e2d\u7684\u8282\u70b9\u6570\u5c11\u4e8e\u56fe\u4e2d\u7684\u8282\u70b9\u6570\uff0c\u5219\u5b58\u5728\u73af\uff08\u67d0\u4e9b\u8282\u70b9\u7684\u5165\u5ea6\u4ece\u672a\u964d\u5230 0\uff09\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/04.%20graphs/#_6","title":"\u6700\u77ed\u8def\u5f84","text":""},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/04.%20graphs/#dijkstra","title":"Dijkstra \u7b97\u6cd5","text":"<ul> <li>\u5728\u975e\u8d1f\u52a0\u6743\u56fe\u4e2d\u4ece\u6e90\u70b9\u627e\u5230\u5230\u6240\u6709\u5176\u4ed6\u8282\u70b9\u7684\u6700\u77ed\u8def\u5f84\u3002\u4f7f\u7528\u4f18\u5148\u961f\u5217\uff08\u6700\u5c0f\u5806\uff09\u3002</li> </ul> <pre><code>import heapq\n\ndef dijkstra(graph, start):\n    # graph: {node: [(neighbour, weight), ...]}\n    dist = {node: float('inf') for node in graph}\n    dist[start] = 0\n    heap = [(0, start)]\n\n    while heap:\n        d, node = heapq.heappop(heap)\n        if d &gt; dist[node]:\n            continue  # \u8fc7\u671f\u6761\u76ee\n\n        for neighbour, weight in graph[node]:\n            new_dist = d + weight\n            if new_dist &lt; dist[neighbour]:\n                dist[neighbour] = new_dist\n                heapq.heappush(heap, (new_dist, neighbour))\n\n    return dist\n</code></pre> <ul> <li> <p>\u65f6\u95f4\uff1a\u4f7f\u7528\u4e8c\u53c9\u5806\u4e3a \\(O((|V| + |E|) \\log |V|)\\)\u3002</p> </li> <li> <p>\u9677\u9631\uff1a<code>if d &gt; dist[node]: continue</code> \u8fd9\u884c\u662f\u5fc5\u987b\u7684\u3002\u6ca1\u6709\u5b83\uff0c\u4f60\u4f1a\u5904\u7406\u8fc7\u671f\u7684\u5806\u6761\u76ee\uff0c\u53ef\u80fd\u9000\u5316\u5230 \\(O(|V|^2)\\)\u3002</p> </li> <li> <p>\u9677\u9631\uff1aDijkstra \u4e0d\u9002\u7528\u4e8e\u8d1f\u6743\u91cd\u3002\u5982\u679c\u4e00\u6761\u8fb9\u6709\u8d1f\u6743\u91cd\uff0c\u8d2a\u5fc3\u5047\u8bbe\uff08\u4e00\u65e6\u8282\u70b9\u88ab\u786e\u5b9a\uff0c\u5176\u8ddd\u79bb\u5c31\u662f\u6700\u4f18\u7684\uff09\u5c31\u4e0d\u6210\u7acb\u4e86\u3002\u5e94\u6539\u7528 Bellman-Ford\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/04.%20graphs/#_7","title":"\u56f0\u96be\uff1a\u7f51\u7edc\u5ef6\u8fdf\u65f6\u95f4","text":"<ul> <li>\u95ee\u9898\uff1a\u7ed9\u5b9a \\(n\\) \u4e2a\u8282\u70b9\u548c\u52a0\u6743\u6709\u5411\u8fb9\uff0c\u627e\u51fa\u4fe1\u53f7\u4ece\u6e90\u70b9\u5230\u8fbe\u6240\u6709\u8282\u70b9\u6240\u9700\u7684\u65f6\u95f4\u3002\u5982\u679c\u5e76\u975e\u6240\u6709\u8282\u70b9\u90fd\u53ef\u5230\u8fbe\uff0c\u8fd4\u56de -1\u3002</li> </ul> <pre><code>def network_delay(times, n, k):\n    graph = {i: [] for i in range(1, n + 1)}\n    for u, v, w in times:\n        graph[u].append((v, w))\n\n    dist = dijkstra(graph, k)\n    max_time = max(dist.values())\n    return max_time if max_time &lt; float('inf') else -1\n</code></pre>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/04.%20graphs/#_8","title":"\u5f3a\u8fde\u901a\u5206\u91cf","text":"<ul> <li> <p>\u5728\u6709\u5411\u56fe\u4e2d\uff0c\u5f3a\u8fde\u901a\u5206\u91cf\uff08SCC\uff09\u662f\u4e00\u4e2a\u6700\u5927\u8282\u70b9\u96c6\u5408\uff0c\u5176\u4e2d\u6bcf\u4e2a\u8282\u70b9\u90fd\u80fd\u5230\u8fbe\u5176\u4ed6\u6240\u6709\u8282\u70b9\u3002</p> </li> <li> <p>Kosaraju \u7b97\u6cd5\uff1a(1) \u5728\u539f\u59cb\u56fe\u4e0a\u8fdb\u884c DFS\uff0c\u8bb0\u5f55\u5b8c\u6210\u987a\u5e8f\u3002(2) \u8f6c\u7f6e\u56fe\uff08\u53cd\u8f6c\u6240\u6709\u8fb9\uff09\u3002(3) \u6309\u5b8c\u6210\u987a\u5e8f\u7684\u9006\u5e8f\u5728\u8f6c\u7f6e\u56fe\u4e0a\u8fdb\u884c DFS\u3002\u7b2c3\u6b65\u4e2d\u7684\u6bcf\u4e2a DFS \u6811\u5c31\u662f\u4e00\u4e2a SCC\u3002</p> </li> <li> <p>\u4f55\u65f6\u4f7f\u7528\uff1a\u5bfb\u627e\u5faa\u73af\u4f9d\u8d56\u30012-SAT\u3001\u5c06\u6709\u5411\u56fe\u538b\u7f29\u4e3a SCC \u7684 DAG\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/04.%20graphs/#_9","title":"\u5e38\u89c1\u9677\u9631\u603b\u7ed3","text":"\u9677\u9631 \u793a\u4f8b \u4fee\u590d \u5728\u51fa\u961f\u65f6\u6807\u8bb0\u5df2\u8bbf\u95ee \u540c\u4e00\u8282\u70b9\u88ab\u591a\u6b21\u5165\u961f \u5728\u5165\u961f\u65f6\u6807\u8bb0\u5df2\u8bbf\u95ee \u6709\u5411\u56fe\u4e2d\u53ea\u6709\u4e24\u79cd\u72b6\u6001 \u65e0\u6cd5\u533a\u5206\u56de\u8fb9\u548c\u4ea4\u53c9\u8fb9 \u4f7f\u7528\u4e09\u79cd\u72b6\u6001\uff1a\u672a\u8bbf\u95ee/\u8fdb\u884c\u4e2d/\u5df2\u5b8c\u6210 Dijkstra \u7528\u4e8e\u8d1f\u6743\u91cd \u9519\u8bef\u7684\u6700\u77ed\u8def\u5f84 \u4f7f\u7528 Bellman-Ford \u5fd8\u8bb0 <code>if d &gt; dist[node]: continue</code> \u5904\u7406\u8fc7\u671f\u5806\u6761\u76ee \u603b\u662f\u8df3\u8fc7\u5f53\u524d\u8ddd\u79bb\u66f4\u5dee\u7684\u60c5\u51b5 \u7f51\u683c\u8fb9\u754c\u68c0\u67e5 \u7d22\u5f15\u8d8a\u754c <code>0 &lt;= nr &lt; rows and 0 &lt;= nc &lt; cols</code> \u6ca1\u6709\u8003\u8651 time=0 \u7684\u8fb9\u754c\u60c5\u51b5 \u8150\u70c2\u6a58\u5b50\uff1a\u6ca1\u6709\u65b0\u9c9c\u6a58\u5b50 \u5728 BFS \u4e4b\u524d\u68c0\u67e5 <code>fresh == 0</code> \u5c06\u6709\u5411\u56fe\u6784\u5efa\u4e3a\u65e0\u5411\u56fe \u5148\u4fee\u6761\u4ef6\u662f\u5355\u5411\u7684 \u53ea\u5728\u4e00\u4e2a\u65b9\u5411\u6dfb\u52a0\u8fb9"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/04.%20graphs/#neetcode","title":"\u8bfe\u540e\u7ec3\u4e60\u9898\uff08NeetCode\uff09","text":""},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/04.%20graphs/#bfs_1","title":"BFS \u6a21\u5f0f","text":"<ul> <li>\u5c9b\u5c7f\u6570\u91cf \u2014 \u7f51\u683c BFS/DFS</li> <li>\u8150\u70c2\u7684\u6a58\u5b50 \u2014 \u591a\u6e90 BFS</li> <li>\u514b\u9686\u56fe \u2014 BFS + \u54c8\u5e0c\u8868\u514b\u9686</li> <li>\u592a\u5e73\u6d0b\u5927\u897f\u6d0b\u6c34\u6d41 \u2014 \u4ece\u4e24\u4e2a\u6d77\u6d0b\u5f00\u59cb\u7684 BFS</li> <li>\u5355\u8bcd\u63a5\u9f99 \u2014 \u9690\u5f0f\u56fe\u4e0a\u7684 BFS</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/04.%20graphs/#dfs_1","title":"DFS \u6a21\u5f0f","text":"<ul> <li>\u5c9b\u5c7f\u7684\u6700\u5927\u9762\u79ef \u2014 \u5e26\u9762\u79ef\u8ba1\u6570\u7684 DFS</li> <li>\u8bfe\u7a0b\u8868 \u2014 \u6709\u5411\u56fe\u4e2d\u7684\u73af\u68c0\u6d4b</li> <li>\u8bfe\u7a0b\u8868 II \u2014 \u62d3\u6251\u6392\u5e8f</li> <li>\u8fde\u901a\u5206\u91cf\u6570\u91cf \u2014 DFS \u6216\u5e76\u67e5\u96c6</li> <li>\u56fe\u662f\u5426\u662f\u6811 \u2014 \u8fde\u901a + \u65e0\u73af</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/04.%20graphs/#_10","title":"\u6700\u77ed\u8def\u5f84","text":"<ul> <li>\u7f51\u7edc\u5ef6\u8fdf\u65f6\u95f4 \u2014 Dijkstra</li> <li>K \u7ad9\u4e2d\u8f6c\u5185\u6700\u4fbf\u5b9c\u7684\u822a\u73ed \u2014 \u5e26\u7ea6\u675f\u7684\u4fee\u6539\u7248 BFS/Bellman-Ford</li> <li>\u4e0a\u5347\u6c34\u6e29\u6e38\u6cf3 \u2014 \u4e8c\u5206\u67e5\u627e + BFS \u6216\u7f51\u683c\u4e0a\u7684 Dijkstra</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/04.%20graphs/#_11","title":"\u8fdb\u9636","text":"<ul> <li>\u5916\u661f\u6587\u5b57\u5178 \u2014 \u4ece\u5b57\u7b26\u987a\u5e8f\u8fdb\u884c\u62d3\u6251\u6392\u5e8f</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/","title":"\u6392\u5e8f\u3001\u641c\u7d22\u4e0e\u7b97\u6cd5\u8bbe\u8ba1","text":"<p>\u6392\u5e8f\u548c\u641c\u7d22\u662f\u6700\u57fa\u7840\u7684\u7b97\u6cd5\u64cd\u4f5c\u3002\u672c\u6587\u4ef6\u6db5\u76d6\u6392\u5e8f\u7b97\u6cd5\u3001\u4e8c\u5206\u67e5\u627e\u6a21\u5f0f\u3001\u5206\u6cbb\u6cd5\u3001\u8d2a\u5fc3\u7b97\u6cd5\u3001\u52a8\u6001\u89c4\u5212\u548c\u56de\u6eaf\u3002</p> <ul> <li>\u6bcf\u4e2a\u6570\u636e\u7ed3\u6784\u90fd\u652f\u6301\u7b97\u6cd5\uff0c\u6bcf\u4e2a\u7b97\u6cd5\u90fd\u4f9d\u8d56\u6570\u636e\u7ed3\u6784\u3002\u672c\u6587\u4ef6\u6db5\u76d6\u4e86\u8bbe\u8ba1\u8303\u5f0f\uff1a\u89e3\u51b3\u95ee\u9898\u7684\u9ad8\u7ea7\u7b56\u7565\u3002\u4e00\u65e6\u4f60\u8bc6\u522b\u51fa\u9002\u7528\u54ea\u79cd\u8303\u5f0f\uff0c\u5b9e\u73b0\u5c31\u81ea\u7136\u800c\u7136\u5730\u8ddf\u8fdb\u4e86\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#_2","title":"\u6392\u5e8f\u7b97\u6cd5","text":"<ul> <li>\u6392\u5e8f\u662f\u8ba1\u7b97\u673a\u79d1\u5b66\u4e2d\u7814\u7a76\u6700\u591a\u7684\u95ee\u9898\u3002\u7406\u89e3\u8fd9\u4e9b\u7b97\u6cd5\u53ef\u4ee5\u5efa\u7acb\u5bf9\u9012\u5f52\u3001\u5206\u6cbb\u6cd5\u548c\u590d\u6742\u5ea6\u5206\u6790\u7684\u76f4\u89c9\u3002</li> </ul> \u7b97\u6cd5 \u6700\u597d \u5e73\u5747 \u6700\u574f \u7a7a\u95f4 \u7a33\u5b9a\uff1f \u5192\u6ce1\u6392\u5e8f \\(O(n)\\) \\(O(n^2)\\) \\(O(n^2)\\) \\(O(1)\\) \u662f \u63d2\u5165\u6392\u5e8f \\(O(n)\\) \\(O(n^2)\\) \\(O(n^2)\\) \\(O(1)\\) \u662f \u5f52\u5e76\u6392\u5e8f \\(O(n \\log n)\\) \\(O(n \\log n)\\) \\(O(n \\log n)\\) \\(O(n)\\) \u662f \u5feb\u901f\u6392\u5e8f \\(O(n \\log n)\\) \\(O(n \\log n)\\) \\(O(n^2)\\) \\(O(\\log n)\\) \u5426 \u5806\u6392\u5e8f \\(O(n \\log n)\\) \\(O(n \\log n)\\) \\(O(n \\log n)\\) \\(O(1)\\) \u5426 \u8ba1\u6570\u6392\u5e8f \\(O(n + k)\\) \\(O(n + k)\\) \\(O(n + k)\\) \\(O(k)\\) \u662f \u57fa\u6570\u6392\u5e8f \\(O(d(n + k))\\) \\(O(d(n + k))\\) \\(O(d(n + k))\\) \\(O(n + k)\\) \u662f <ul> <li> <p>\u7a33\u5b9a\u610f\u5473\u7740\u76f8\u7b49\u5143\u7d20\u4fdd\u6301\u5176\u76f8\u5bf9\u987a\u5e8f\u3002\u8fd9\u5728\u6309\u591a\u4e2a\u952e\u6392\u5e8f\u65f6\u5f88\u91cd\u8981\u3002</p> </li> <li> <p>\u57fa\u4e8e\u6bd4\u8f83\u7684\u6392\u5e8f\u7684\u4e0b\u9650\u662f \\(\\Omega(n \\log n)\\)\u3002\u8bc1\u660e\u4f7f\u7528\u51b3\u7b56\u6811\uff08\u7b2c13\u7ae0\uff09\uff1a\u4efb\u4f55\u6bd4\u8f83\u6392\u5e8f\u5fc5\u987b\u533a\u5206\u6240\u6709 \\(n!\\) \u79cd\u6392\u5217\uff0c\u81f3\u5c11\u9700\u8981 \\(\\log_2(n!) = \\Omega(n \\log n)\\) \u6b21\u6bd4\u8f83\u3002\u8ba1\u6570\u6392\u5e8f\u548c\u57fa\u6570\u6392\u5e8f\u901a\u8fc7\u4e0d\u6bd4\u8f83\u5143\u7d20\u800c\u8d85\u8d8a\u4e86\u8fd9\u4e2a\u4e0b\u9650\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#_3","title":"\u5f52\u5e76\u6392\u5e8f","text":"<ul> <li>\u5c06\u6570\u7ec4\u5206\u6210\u4e24\u534a\uff0c\u9012\u5f52\u6392\u5e8f\u6bcf\u4e00\u534a\uff0c\u7136\u540e\u5408\u5e76\u5df2\u6392\u5e8f\u7684\u4e24\u534a\u3002\u59cb\u7ec8\u4e3a \\(O(n \\log n)\\)\uff0c\\(O(n)\\) \u989d\u5916\u7a7a\u95f4\u3002</li> </ul> <pre><code>def merge_sort(arr):\n    if len(arr) &lt;= 1:\n        return arr\n\n    mid = len(arr) // 2\n    left = merge_sort(arr[:mid])\n    right = merge_sort(arr[mid:])\n\n    return merge(left, right)\n\ndef merge(left, right):\n    result = []\n    i = j = 0\n    while i &lt; len(left) and j &lt; len(right):\n        if left[i] &lt;= right[j]:  # &lt;= \u4fdd\u8bc1\u7a33\u5b9a\u6027\n            result.append(left[i])\n            i += 1\n        else:\n            result.append(right[j])\n            j += 1\n    result.extend(left[i:])\n    result.extend(right[j:])\n    return result\n</code></pre> <ul> <li>\u9677\u9631\uff1a\u5728\u5408\u5e76\u4e2d\u4f7f\u7528 <code>&lt;</code> \u800c\u4e0d\u662f <code>&lt;=</code> \u4f1a\u7834\u574f\u7a33\u5b9a\u6027\uff08\u53f3\u534a\u90e8\u5206\u7684\u76f8\u7b49\u5143\u7d20\u4f1a\u6392\u5728\u5de6\u534a\u90e8\u5206\u4e4b\u524d\uff09\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#_4","title":"\u5feb\u901f\u6392\u5e8f","text":"<ul> <li>\u9009\u62e9\u4e00\u4e2a\u57fa\u51c6\uff0c\u5c06\u5143\u7d20\u5206\u4e3a\"\u5c0f\u4e8e\u57fa\u51c6\"\u548c\"\u5927\u4e8e\u57fa\u51c6\"\u4e24\u7ec4\uff0c\u9012\u5f52\u6392\u5e8f\u6bcf\u7ec4\u3002\u5e73\u5747 \\(O(n \\log n)\\)\uff0c\u6700\u574f \\(O(n^2)\\)\uff08\u5f53\u57fa\u51c6\u603b\u662f\u6700\u5c0f\u6216\u6700\u5927\u5143\u7d20\u65f6\uff09\u3002</li> </ul> <pre><code>def quicksort(arr, lo=0, hi=None):\n    if hi is None:\n        hi = len(arr) - 1\n    if lo &gt;= hi:\n        return\n\n    pivot_idx = partition(arr, lo, hi)\n    quicksort(arr, lo, pivot_idx - 1)\n    quicksort(arr, pivot_idx + 1, hi)\n\ndef partition(arr, lo, hi):\n    pivot = arr[hi]  # Lomuto \u5206\u533a\uff1a\u57fa\u51c6\u662f\u6700\u540e\u4e00\u4e2a\u5143\u7d20\n    i = lo\n    for j in range(lo, hi):\n        if arr[j] &lt; pivot:\n            arr[i], arr[j] = arr[j], arr[i]\n            i += 1\n    arr[i], arr[hi] = arr[hi], arr[i]\n    return i\n</code></pre> <ul> <li> <p>\u57fa\u51c6\u7b56\u7565\uff1a\u6700\u540e\u4e00\u4e2a\u5143\u7d20\uff08\u7b80\u5355\uff0c\u5bf9\u5df2\u6392\u5e8f\u8f93\u5165\u4e0d\u597d\uff09\u3001\u968f\u673a\uff08\u671f\u671b \\(O(n \\log n)\\)\uff09\u3001\u4e09\u6570\u53d6\u4e2d\uff08\u5b9e\u9645\u9009\u62e9\uff09\u3002\u5728\u9762\u8bd5\u4e2d\u59cb\u7ec8\u4f18\u5148\u9009\u62e9\u968f\u673a\u57fa\u51c6\u4ee5\u907f\u514d\u6700\u574f\u60c5\u51b5\u7684\u8ba8\u8bba\u3002</p> </li> <li> <p>\u9677\u9631\uff1a\u5feb\u901f\u6392\u5e8f\u7684 \\(O(n^2)\\) \u6700\u574f\u60c5\u51b5\u53d1\u751f\u5728\u5df2\u6392\u5e8f\u6570\u7ec4\u914d\u5408\u9996/\u5c3e\u57fa\u51c6\u65f6\u3002\u5b9e\u8df5\u4e2d\uff0c\u968f\u673a\u57fa\u51c6\u6216\u4e09\u6570\u53d6\u4e2d\u6d88\u9664\u4e86\u8fd9\u4e2a\u95ee\u9898\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#_5","title":"\u8ba1\u6570\u6392\u5e8f","text":"<ul> <li>\u5f53\u503c\u5728\u5df2\u77e5\u8303\u56f4 \\([0, k)\\) \u5185\u7684\u6574\u6570\u65f6\uff0c\u7edf\u8ba1\u51fa\u73b0\u6b21\u6570\u5e76\u91cd\u6784\uff1a\\(O(n + k)\\) \u65f6\u95f4\u3002\u4e0d\u662f\u57fa\u4e8e\u6bd4\u8f83\u7684\uff0c\u56e0\u6b64\u53ef\u4ee5\u8d85\u8d8a \\(O(n \\log n)\\)\u3002</li> </ul> <pre><code>def counting_sort(arr, k):\n    count = [0] * k\n    for x in arr:\n        count[x] += 1\n    result = []\n    for val in range(k):\n        result.extend([val] * count[val])\n    return result\n</code></pre> <ul> <li>\u4f55\u65f6\u4f7f\u7528\uff1a\u8303\u56f4 \\(k\\) \u4e0d\u6bd4 \\(n\\) \u5927\u5f88\u591a\u3002\u5982\u679c \\(k = O(n)\\)\uff0c\u8fd9\u662f \\(O(n)\\)\u3002\u5982\u679c \\(k \\gg n\\)\uff08\u4f8b\u5982\uff0c\u5bf9\u8303\u56f4 \\([0, 10^9]\\) \u4e2d\u7684 10 \u4e2a\u6570\u5b57\u6392\u5e8f\uff09\uff0c\u8ba1\u6570\u6392\u5e8f\u4f1a\u6d6a\u8d39\u5185\u5b58\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#_6","title":"\u6a21\u5f0f\uff1a\u4e8c\u5206\u67e5\u627e","text":"<ul> <li> <p>\u4e8c\u5206\u67e5\u627e\u901a\u8fc7\u5728\u5df2\u6392\u5e8f\u6570\u7ec4\u4e2d\u53cd\u590d\u51cf\u534a\u641c\u7d22\u7a7a\u95f4\u6765\u4ee5 \\(O(\\log n)\\) \u7684\u65f6\u95f4\u627e\u5230\u76ee\u6807\u3002\u4f46\u4e8c\u5206\u67e5\u627e\u8fdc\u4e0d\u6b62\"\u5728\u5df2\u6392\u5e8f\u6570\u7ec4\u4e2d\u627e\u4e00\u4e2a\u6570\"\u3002\u901a\u7528\u6a21\u5f0f\u662f\uff1a\u5728\u5355\u8c03\u6761\u4ef6\u4e0a\u8fdb\u884c\u641c\u7d22\u3002</p> </li> <li> <p>\u6a21\u677f\uff08\u907f\u514d\u5dee\u4e00\u9519\u8bef\u7684\u90a3\u4e00\u4e2a\uff09\uff1a</p> </li> </ul> <pre><code>def binary_search(arr, target):\n    lo, hi = 0, len(arr) - 1\n\n    while lo &lt;= hi:\n        mid = lo + (hi - lo) // 2  # \u5728\u5176\u4ed6\u8bed\u8a00\u4e2d\u907f\u514d\u6ea2\u51fa\n        if arr[mid] == target:\n            return mid\n        elif arr[mid] &lt; target:\n            lo = mid + 1\n        else:\n            hi = mid - 1\n\n    return -1  # \u672a\u627e\u5230\n</code></pre> <ul> <li>\u4e0b\u754c\uff08\u7b2c\u4e00\u4e2a \\(\\geq\\) target \u7684\u5143\u7d20\uff09\uff1a</li> </ul> <pre><code>def lower_bound(arr, target):\n    lo, hi = 0, len(arr)\n    while lo &lt; hi:\n        mid = (lo + hi) // 2\n        if arr[mid] &lt; target:\n            lo = mid + 1\n        else:\n            hi = mid\n    return lo\n</code></pre> <ul> <li>\u9677\u9631\uff1a<code>lo &lt;= hi</code> \u548c <code>lo &lt; hi</code> \u7684\u533a\u522b\uff0c\u4ee5\u53ca <code>hi = mid</code> \u548c <code>hi = mid - 1</code> \u7684\u533a\u522b\uff0c\u51b3\u5b9a\u4e86\u4f60\u662f\u627e\u5230\u7cbe\u786e\u5339\u914d\u8fd8\u662f\u8fb9\u754c\u3002\u7528\u4e00\u4e2a2\u5143\u7d20\u6570\u7ec4\u753b\u51fa\u6765\u9a8c\u8bc1\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#_7","title":"\u7b80\u5355\uff1a\u4e8c\u5206\u67e5\u627e","text":"<ul> <li>\u6807\u51c6\u95ee\u9898\u3002\u4f7f\u7528\u4e0a\u9762\u7684\u6a21\u677f\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#_8","title":"\u4e2d\u7b49\uff1a\u641c\u7d22\u65cb\u8f6c\u6392\u5e8f\u6570\u7ec4","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u4e00\u4e2a\u6392\u5e8f\u6570\u7ec4\u5728\u67d0\u4e2a\u67a2\u8f74\u5904\u88ab\u65cb\u8f6c\u3002\u627e\u5230\u76ee\u6807\u503c\u3002</p> </li> <li> <p>\u6a21\u5f0f\uff1a\u5728\u6bcf\u4e00\u6b65\uff0c\u6709\u4e00\u534a\u603b\u662f\u6709\u5e8f\u7684\u3002\u786e\u5b9a\u54ea\u4e00\u534a\u662f\u6709\u5e8f\u7684\uff0c\u5e76\u68c0\u67e5\u76ee\u6807\u662f\u5426\u5728\u8fd9\u4e00\u534a\u4e2d\u3002</p> </li> </ul> <pre><code>def search_rotated(nums, target):\n    lo, hi = 0, len(nums) - 1\n\n    while lo &lt;= hi:\n        mid = (lo + hi) // 2\n        if nums[mid] == target:\n            return mid\n\n        # \u5de6\u534a\u90e8\u5206\u6709\u5e8f\n        if nums[lo] &lt;= nums[mid]:\n            if nums[lo] &lt;= target &lt; nums[mid]:\n                hi = mid - 1\n            else:\n                lo = mid + 1\n        # \u53f3\u534a\u90e8\u5206\u6709\u5e8f\n        else:\n            if nums[mid] &lt; target &lt;= nums[hi]:\n                lo = mid + 1\n            else:\n                hi = mid - 1\n\n    return -1\n</code></pre> <ul> <li>\u9677\u9631\uff1a<code>nums[lo] &lt;= nums[mid]</code> \u4e2d\u7684 <code>&lt;=</code>\uff08\u800c\u4e0d\u662f <code>&lt;</code>\uff09\u81f3\u5173\u91cd\u8981\u3002\u5f53 <code>lo == mid</code>\uff08\u53ea\u52692\u4e2a\u5143\u7d20\uff09\u65f6\uff0c\u6211\u4eec\u5fc5\u987b\u6b63\u786e\u8bc6\u522b\u6709\u5e8f\u7684\u4e00\u534a\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#_9","title":"\u56f0\u96be\uff1a\u5bfb\u627e\u4e24\u4e2a\u6709\u5e8f\u6570\u7ec4\u7684\u4e2d\u4f4d\u6570","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u5728 \\(O(\\log(m + n))\\) \u65f6\u95f4\u5185\u627e\u5230\u4e24\u4e2a\u6709\u5e8f\u6570\u7ec4\u7684\u4e2d\u4f4d\u6570\u3002</p> </li> <li> <p>\u6a21\u5f0f\uff1a\u5bf9\u8f83\u5c0f\u6570\u7ec4\u7684\u5206\u5272\u70b9\u8fdb\u884c\u4e8c\u5206\u67e5\u627e\u3002\u5206\u5272\u5c06\u4e24\u4e2a\u6570\u7ec4\u5206\u4e3a\u4e24\u90e8\u5206\uff0c\u4f7f\u5f97\u5de6\u4fa7\u6240\u6709\u5143\u7d20\u90fd\u5c0f\u4e8e\u53f3\u4fa7\u6240\u6709\u5143\u7d20\u3002</p> </li> </ul> <pre><code>def find_median(nums1, nums2):\n    if len(nums1) &gt; len(nums2):\n        nums1, nums2 = nums2, nums1  # \u786e\u4fdd nums1 \u8f83\u77ed\n\n    m, n = len(nums1), len(nums2)\n    lo, hi = 0, m\n    half = (m + n + 1) // 2\n\n    while lo &lt;= hi:\n        i = (lo + hi) // 2          # nums1 \u4e2d\u7684\u5206\u5272\u70b9\n        j = half - i                 # nums2 \u4e2d\u7684\u5206\u5272\u70b9\n\n        left1 = nums1[i - 1] if i &gt; 0 else float('-inf')\n        right1 = nums1[i] if i &lt; m else float('inf')\n        left2 = nums2[j - 1] if j &gt; 0 else float('-inf')\n        right2 = nums2[j] if j &lt; n else float('inf')\n\n        if left1 &lt;= right2 and left2 &lt;= right1:\n            # \u6b63\u786e\u5206\u5272\n            if (m + n) % 2 == 1:\n                return max(left1, left2)\n            return (max(left1, left2) + min(right1, right2)) / 2\n        elif left1 &gt; right2:\n            hi = i - 1\n        else:\n            lo = i + 1\n</code></pre> <ul> <li>\u8fd9\u662f\u6700\u96be\u7684\u4e8c\u5206\u67e5\u627e\u95ee\u9898\u4e4b\u4e00\u3002\u5173\u952e\u5728\u4e8e\u4f60\u641c\u7d22\u7684\u4e0d\u662f\u4e00\u4e2a\u503c\uff0c\u800c\u662f\u4e00\u4e2a\u6ee1\u8db3\u6761\u4ef6\u7684\u5206\u5272\u70b9\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#_10","title":"\u5143\u6a21\u5f0f\uff1a\u5bf9\u7b54\u6848\u8fdb\u884c\u4e8c\u5206\u67e5\u627e","text":"<ul> <li> <p>\u8bb8\u591a\u770b\u8d77\u6765\u4e0d\u50cf\u4e8c\u5206\u67e5\u627e\u7684\u95ee\u9898\u53ef\u4ee5\u901a\u8fc7\u5bf9\u7b54\u6848\u8fdb\u884c\u4e8c\u5206\u67e5\u627e\u6765\u89e3\u51b3\u3002\u5982\u679c\u7b54\u6848\u662f\u4e00\u4e2a\u6570\u5b57\uff0c\u5e76\u4e14\u4f60\u53ef\u4ee5\u5199\u4e00\u4e2a\u5355\u8c03\u7684\u51fd\u6570 <code>is_feasible(x)</code>\uff08\u5bf9\u6240\u6709 \\(x \\geq\\) \u6700\u4f18\u503c\u4e3a True\uff0c\u6216\u5bf9\u6240\u6709 \\(x \\geq\\) \u6700\u4f18\u503c\u4e3a False\uff09\uff0c\u90a3\u4e48\u5c31\u5728 \\(x\\) \u4e0a\u8fdb\u884c\u4e8c\u5206\u67e5\u627e\u3002</p> </li> <li> <p>\u793a\u4f8b\uff1a\"\u5728 \\(d\\) \u5929\u5185\u8fd0\u9001\u6240\u6709\u5305\u88f9\u6240\u9700\u7684\u6700\u5c0f\u8fd0\u529b\u662f\u591a\u5c11\uff1f\"\u5bf9\u8fd0\u529b\u8fdb\u884c\u4e8c\u5206\u67e5\u627e\u3002\u5bf9\u4e8e\u6bcf\u4e2a\u5019\u9009\u8fd0\u529b\uff0c\u8d2a\u5fc3\u5730\u68c0\u67e5\u662f\u5426\u53ef\u4ee5\u5728 \\(d\\) \u5929\u5185\u8fd0\u9001\u6240\u6709\u5305\u88f9\u3002</p> </li> </ul> <pre><code>def ship_within_days(weights, days):\n    lo, hi = max(weights), sum(weights)\n\n    while lo &lt; hi:\n        mid = (lo + hi) // 2\n        # \u80fd\u5426\u4ee5\u8fd0\u529b mid \u5728 &lt;= days \u5929\u5185\u8fd0\u9001\u5b8c\uff1f\n        current_load, num_days = 0, 1\n        for w in weights:\n            if current_load + w &gt; mid:\n                num_days += 1\n                current_load = 0\n            current_load += w\n\n        if num_days &lt;= days:\n            hi = mid\n        else:\n            lo = mid + 1\n\n    return lo\n</code></pre>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#_11","title":"\u6a21\u5f0f\uff1a\u8d2a\u5fc3\u7b97\u6cd5","text":"<ul> <li>\u8d2a\u5fc3\u7b97\u6cd5\u5728\u6bcf\u4e00\u6b65\u505a\u51fa\u5c40\u90e8\u6700\u4f18\u9009\u62e9\uff0c\u5e0c\u671b\u8fd9\u80fd\u5bfc\u81f4\u5168\u5c40\u6700\u4f18\u89e3\u3002\u8d2a\u5fc3\u5728\u95ee\u9898\u5177\u6709\u8d2a\u5fc3\u9009\u62e9\u6027\u8d28\uff08\u5c40\u90e8\u6700\u4f18\u5bfc\u81f4\u5168\u5c40\u6700\u4f18\uff09\u548c\u6700\u4f18\u5b50\u7ed3\u6784\uff08\u6700\u4f18\u89e3\u5305\u542b\u5b50\u95ee\u9898\u7684\u6700\u4f18\u89e3\uff09\u65f6\u6709\u6548\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#_12","title":"\u4e2d\u7b49\uff1a\u8df3\u8dc3\u6e38\u620f","text":"<ul> <li>\u95ee\u9898\uff1a\u7ed9\u5b9a\u4e00\u4e2a\u6570\u7ec4\uff0c\u5176\u4e2d <code>nums[i]</code> \u662f\u5728\u4f4d\u7f6e \\(i\\) \u7684\u6700\u5927\u8df3\u8dc3\u957f\u5ea6\uff0c\u5224\u65ad\u662f\u5426\u80fd\u591f\u5230\u8fbe\u6700\u540e\u4e00\u4e2a\u7d22\u5f15\u3002</li> </ul> <pre><code>def can_jump(nums):\n    max_reach = 0\n    for i, jump in enumerate(nums):\n        if i &gt; max_reach:\n            return False  # \u65e0\u6cd5\u5230\u8fbe\u8fd9\u4e2a\u4f4d\u7f6e\n        max_reach = max(max_reach, i + jump)\n    return True\n</code></pre> <ul> <li>\u4e3a\u4ec0\u4e48\u8d2a\u5fc3\u6709\u6548\uff1a\u6211\u4eec\u53ea\u9700\u8981\u77e5\u9053\u6700\u8fdc\u53ef\u8fbe\u4f4d\u7f6e\u3002\u5982\u679c\u5f53\u524d\u4f4d\u7f6e\u8d85\u8fc7\u4e86\u6700\u8fdc\u53ef\u8fbe\u4f4d\u7f6e\uff0c\u6211\u4eec\u5c31\u5361\u4f4f\u4e86\u3002\u5426\u5219\uff0c\u66f4\u65b0\u6700\u8fdc\u53ef\u8fbe\u4f4d\u7f6e\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#_13","title":"\u4e2d\u7b49\uff1a\u5408\u5e76\u533a\u95f4","text":"<ul> <li>\u95ee\u9898\uff1a\u5408\u5e76\u91cd\u53e0\u7684\u533a\u95f4\u3002</li> </ul> <pre><code>def merge_intervals(intervals):\n    intervals.sort(key=lambda x: x[0])\n    merged = [intervals[0]]\n\n    for start, end in intervals[1:]:\n        if start &lt;= merged[-1][1]:\n            merged[-1][1] = max(merged[-1][1], end)\n        else:\n            merged.append([start, end])\n\n    return merged\n</code></pre> <ul> <li> <p>\u6a21\u5f0f\uff1a\u6309\u5f00\u59cb\u65f6\u95f4\u6392\u5e8f\uff0c\u7136\u540e\u8d2a\u5fc3\u5730\u5408\u5e76\u3002\u5982\u679c\u5f53\u524d\u533a\u95f4\u4e0e\u4e0a\u4e00\u4e2a\u5408\u5e76\u7684\u533a\u95f4\u91cd\u53e0\uff0c\u5219\u6269\u5c55\u5b83\u3002\u5426\u5219\uff0c\u5f00\u59cb\u4e00\u4e2a\u65b0\u7684\u5408\u5e76\u533a\u95f4\u3002</p> </li> <li> <p>\u9677\u9631\uff1a\u4f7f\u7528 <code>merged[-1][1] = end</code> \u800c\u4e0d\u662f <code>merged[-1][1] = max(merged[-1][1], end)</code>\u3002\u4e00\u4e2a\u533a\u95f4\u53ef\u80fd\u5b8c\u5168\u5305\u542b\u5728\u53e6\u4e00\u4e2a\u533a\u95f4\u5185\uff08\u4f8b\u5982 [1, 10] \u548c [2, 5]\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#_14","title":"\u6a21\u5f0f\uff1a\u52a8\u6001\u89c4\u5212","text":"<ul> <li> <p>\u52a8\u6001\u89c4\u5212\uff08DP\uff09\u901a\u8fc7\u5c06\u95ee\u9898\u5206\u89e3\u4e3a\u91cd\u53e0\u7684\u5b50\u95ee\u9898\uff0c\u6bcf\u4e2a\u5b50\u95ee\u9898\u53ea\u89e3\u4e00\u6b21\u5e76\u5b58\u50a8\u7ed3\u679c\u3002\u5b83\u9002\u7528\u4e8e\u5177\u6709\u6700\u4f18\u5b50\u7ed3\u6784\u548c\u91cd\u53e0\u5b50\u95ee\u9898\u7684\u95ee\u9898\u3002</p> </li> <li> <p>\u4e24\u79cd\u65b9\u6cd5\uff1a</p> <ul> <li>\u81ea\u9876\u5411\u4e0b\uff08\u8bb0\u5fc6\u5316\uff09\uff1a\u5199\u51fa\u81ea\u7136\u7684\u9012\u5f52\u89e3\u6cd5\uff0c\u7136\u540e\u5728\u5b57\u5178\u4e2d\u7f13\u5b58\u7ed3\u679c\u3002</li> <li>\u81ea\u5e95\u5411\u4e0a\uff08\u5236\u8868\u6cd5\uff09\uff1a\u4ece\u6700\u5c0f\u7684\u5b50\u95ee\u9898\u5f00\u59cb\u5411\u4e0a\u6784\u5efa\u8868\u683c\u3002</li> </ul> </li> <li> <p>\u5982\u4f55\u8bc6\u522b DP\uff1a\u95ee\u9898\u8981\u6c42\u6700\u4f18\u503c\uff08\u6700\u5c0f/\u6700\u5927\uff09\u3001\u8ba1\u6570\u6216\u5b58\u5728\u6027\uff0c\u5e76\u4e14\u5f53\u524d\u51b3\u7b56\u4f9d\u8d56\u4e8e\u5148\u524d\u7684\u51b3\u7b56\u3002\u5982\u679c\u4f60\u753b\u51fa\u9012\u5f52\u6811\u5e76\u770b\u5230\u91cd\u590d\u7684\u5b50\u95ee\u9898\uff0c\u90a3\u5c31\u662f DP\u3002</p> </li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#_15","title":"\u7b80\u5355\uff1a\u722c\u697c\u68af","text":"<ul> <li> <p>\u95ee\u9898\uff1a\\(n\\) \u4e2a\u53f0\u9636\uff0c\u6bcf\u6b21\u53ef\u4ee5\u722c 1 \u6216 2 \u4e2a\u53f0\u9636\u3002\u6709\u591a\u5c11\u79cd\u4e0d\u540c\u7684\u65b9\u6cd5\uff1f</p> </li> <li> <p>\u8fd9\u5c31\u662f\u6590\u6ce2\u90a3\u5951\u6570\u5217\uff1a\\(f(n) = f(n-1) + f(n-2)\\)\u3002</p> </li> </ul> <pre><code>def climb_stairs(n):\n    if n &lt;= 2:\n        return n\n    a, b = 1, 2\n    for _ in range(3, n + 1):\n        a, b = b, a + b\n    return b\n</code></pre> <ul> <li>\\(O(n)\\) \u65f6\u95f4\uff0c\\(O(1)\\) \u7a7a\u95f4\u3002\u4e0d\u9700\u8981\u5b8c\u6574\u7684\u8bb0\u5fc6\u5316\u8868\uff0c\u56e0\u4e3a\u6bcf\u4e2a\u72b6\u6001\u53ea\u4f9d\u8d56\u4e8e\u524d\u4e24\u4e2a\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#_16","title":"\u4e2d\u7b49\uff1a\u96f6\u94b1\u5151\u6362","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u7ed9\u5b9a\u786c\u5e01\u9762\u989d\u548c\u4e00\u4e2a\u76ee\u6807\u91d1\u989d\uff0c\u627e\u5230\u6240\u9700\u7684\u6700\u5c11\u786c\u5e01\u6570\u91cf\u3002</p> </li> <li> <p>\u72b6\u6001\uff1a<code>dp[amount]</code> = \u51d1\u6210 <code>amount</code> \u6240\u9700\u7684\u6700\u5c0f\u786c\u5e01\u6570\u3002</p> </li> <li>\u8f6c\u79fb\uff1a<code>dp[amount] = min(dp[amount - coin] + 1)</code> \u5bf9\u6bcf\u4e2a\u786c\u5e01\u3002</li> <li>\u57fa\u672c\u60c5\u51b5\uff1a<code>dp[0] = 0</code>\u3002</li> </ul> <pre><code>def coin_change(coins, amount):\n    dp = [float('inf')] * (amount + 1)\n    dp[0] = 0\n\n    for a in range(1, amount + 1):\n        for coin in coins:\n            if coin &lt;= a and dp[a - coin] + 1 &lt; dp[a]:\n                dp[a] = dp[a - coin] + 1\n\n    return dp[amount] if dp[amount] != float('inf') else -1\n</code></pre> <ul> <li>\u9677\u9631\uff1a\u7528 <code>float('inf')</code> \u521d\u59cb\u5316\uff08\u800c\u4e0d\u662f 0 \u6216 -1\uff09\u3002\u6700\u5c0f\u6bd4\u8f83\u53ea\u6709\u5728\u4e0d\u53ef\u8fbe\u72b6\u6001\u4e3a\u65e0\u7a77\u5927\u65f6\u624d\u6709\u6548\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#_17","title":"\u4e2d\u7b49\uff1a\u6700\u957f\u516c\u5171\u5b50\u5e8f\u5217","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u7ed9\u5b9a\u4e24\u4e2a\u5b57\u7b26\u4e32\uff0c\u627e\u51fa\u5b83\u4eec\u7684\u6700\u957f\u516c\u5171\u5b50\u5e8f\u5217\u7684\u957f\u5ea6\u3002</p> </li> <li> <p>\u72b6\u6001\uff1a<code>dp[i][j]</code> = <code>text1[:i]</code> \u548c <code>text2[:j]</code> \u7684 LCS\u3002</p> </li> <li>\u8f6c\u79fb\uff1a\u5982\u679c <code>text1[i-1] == text2[j-1]</code>\uff0c\u5219 <code>dp[i][j] = dp[i-1][j-1] + 1</code>\u3002\u5426\u5219\uff0c<code>dp[i][j] = max(dp[i-1][j], dp[i][j-1])</code>\u3002</li> </ul> <pre><code>def longest_common_subsequence(text1, text2):\n    m, n = len(text1), len(text2)\n    dp = [[0] * (n + 1) for _ in range(m + 1)]\n\n    for i in range(1, m + 1):\n        for j in range(1, n + 1):\n            if text1[i - 1] == text2[j - 1]:\n                dp[i][j] = dp[i - 1][j - 1] + 1\n            else:\n                dp[i][j] = max(dp[i - 1][j], dp[i][j - 1])\n\n    return dp[m][n]\n</code></pre>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#01","title":"\u56f0\u96be\uff1a0/1 \u80cc\u5305","text":"<ul> <li> <p>\u95ee\u9898\uff1a\u7ed9\u5b9a\u5177\u6709\u91cd\u91cf\u548c\u4ef7\u503c\u7684\u7269\u54c1\uff0c\u4ee5\u53ca\u5bb9\u91cf \\(W\\)\uff0c\u5728\u4e0d\u8d85\u51fa \\(W\\) \u7684\u60c5\u51b5\u4e0b\u6700\u5927\u5316\u603b\u4ef7\u503c\u3002</p> </li> <li> <p>\u72b6\u6001\uff1a<code>dp[i][w]</code> = \u4f7f\u7528\u524d \\(i\\) \u4e2a\u7269\u54c1\u5728\u5bb9\u91cf \\(w\\) \u4e0b\u7684\u6700\u5927\u4ef7\u503c\u3002</p> </li> <li>\u8f6c\u79fb\uff1a<code>dp[i][w] = max(dp[i-1][w], dp[i-1][w - weight[i]] + value[i])</code>\uff08\u8df3\u8fc7\u6216\u53d6\u7528\u7269\u54c1 \\(i\\)\uff09\u3002</li> </ul> <pre><code>def knapsack(weights, values, capacity):\n    n = len(weights)\n    dp = [[0] * (capacity + 1) for _ in range(n + 1)]\n\n    for i in range(1, n + 1):\n        for w in range(capacity + 1):\n            dp[i][w] = dp[i - 1][w]  # \u8df3\u8fc7\u7269\u54c1 i\n            if weights[i - 1] &lt;= w:\n                dp[i][w] = max(dp[i][w],\n                               dp[i - 1][w - weights[i - 1]] + values[i - 1])\n\n    return dp[n][capacity]\n</code></pre> <ul> <li>\u7a7a\u95f4\u4f18\u5316\uff1a\u7531\u4e8e\u6bcf\u4e00\u884c\u53ea\u4f9d\u8d56\u4e8e\u524d\u4e00\u884c\uff0c\u4f7f\u7528\u4e00\u7ef4\u6570\u7ec4\u5e76\u4ece\u53f3\u5411\u5de6\u8fed\u4ee3 \\(w\\)\uff1a</li> </ul> <pre><code>def knapsack_optimised(weights, values, capacity):\n    dp = [0] * (capacity + 1)\n    for i in range(len(weights)):\n        for w in range(capacity, weights[i] - 1, -1):  # \u4ece\u53f3\u5411\u5de6\uff01\n            dp[w] = max(dp[w], dp[w - weights[i]] + values[i])\n    return dp[capacity]\n</code></pre> <ul> <li>\u9677\u9631\uff1a\u5728\u4e00\u7ef4\u7248\u672c\u4e2d\u4ece\u5de6\u5411\u53f3\u8fed\u4ee3\u4f1a\u5141\u8bb8\u591a\u6b21\u4f7f\u7528\u7269\u54c1 \\(i\\)\uff08\u65e0\u9650\u80cc\u5305\uff09\u3002\u4ece\u53f3\u5411\u5de6\u786e\u4fdd\u6bcf\u4e2a\u7269\u54c1\u6700\u591a\u4f7f\u7528\u4e00\u6b21\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#_18","title":"\u6a21\u5f0f\uff1a\u56de\u6eaf","text":"<ul> <li> <p>\u56de\u6eaf\u662f\u5e26\u526a\u679d\u7684\u7a77\u4e3e\u641c\u7d22\u3002\u9010\u6b65\u6784\u5efa\u89e3\uff0c\u4e00\u65e6\u90e8\u5206\u89e3\u4e0d\u53ef\u80fd\u5bfc\u81f4\u5b8c\u6574\u7684\u6709\u6548\u89e3\uff0c\u5c31\u7acb\u5373\u653e\u5f03\uff08\u56de\u6eaf\uff09\u3002</p> </li> <li> <p>\u6a21\u677f\uff1a</p> </li> </ul> <pre><code>def backtrack(candidates, path, result):\n    if is_solution(path):\n        result.append(path[:])  # \u590d\u5236\uff01\n        return\n\n    for candidate in get_candidates(path):\n        if is_valid(candidate, path):\n            path.append(candidate)     # \u9009\u62e9\n            backtrack(candidates, path, result)  # \u63a2\u7d22\n            path.pop()                 # \u64a4\u9500\uff08\u56de\u6eaf\uff09\n</code></pre>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#_19","title":"\u4e2d\u7b49\uff1a\u5b50\u96c6","text":"<pre><code>def subsets(nums):\n    result = []\n    def backtrack(start, path):\n        result.append(path[:])\n        for i in range(start, len(nums)):\n            path.append(nums[i])\n            backtrack(i + 1, path)\n            path.pop()\n    backtrack(0, [])\n    return result\n</code></pre>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#_20","title":"\u4e2d\u7b49\uff1a\u7ec4\u5408\u603b\u548c","text":"<ul> <li>\u95ee\u9898\uff1a\u627e\u51fa\u6240\u6709\u548c\u4e3a\u76ee\u6807\u503c\u7684\u552f\u4e00\u7ec4\u5408\uff08\u5143\u7d20\u53ef\u91cd\u590d\u4f7f\u7528\uff09\u3002</li> </ul> <pre><code>def combination_sum(candidates, target):\n    result = []\n    def backtrack(start, path, remaining):\n        if remaining == 0:\n            result.append(path[:])\n            return\n        for i in range(start, len(candidates)):\n            if candidates[i] &gt; remaining:\n                break  # \u526a\u679d\uff1a\u5df2\u6392\u5e8f\uff0c\u540e\u7eed\u5019\u9009\u90fd\u592a\u5927\n            path.append(candidates[i])\n            backtrack(i, path, remaining - candidates[i])  # i \u800c\u4e0d\u662f i+1\uff1a\u5141\u8bb8\u91cd\u590d\u4f7f\u7528\n            path.pop()\n\n    candidates.sort()  # \u6392\u5e8f\u4ee5\u4fbf\u526a\u679d\n    backtrack(0, [], target)\n    return result\n</code></pre> <ul> <li>\u9677\u9631\uff1a<code>backtrack(i, ...)</code> \u5141\u8bb8\u91cd\u590d\u4f7f\u7528\u540c\u4e00\u5143\u7d20\u3002<code>backtrack(i + 1, ...)</code> \u4f1a\u79fb\u52a8\u5230\u4e0b\u4e00\u4e2a\u5143\u7d20\uff08\u4e0d\u53ef\u91cd\u590d\u4f7f\u7528\uff09\u3002\u641e\u9519\u8fd9\u4e2a\u662f\u6700\u5e38\u89c1\u7684\u56de\u6eaf bug\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#n","title":"\u56f0\u96be\uff1aN \u7687\u540e","text":"<ul> <li>\u95ee\u9898\uff1a\u5728 \\(n \\times n\\) \u7684\u68cb\u76d8\u4e0a\u653e\u7f6e \\(n\\) \u4e2a\u7687\u540e\uff0c\u4f7f\u5f97\u5b83\u4eec\u4e92\u4e0d\u653b\u51fb\u3002</li> </ul> <pre><code>def solve_n_queens(n):\n    result = []\n    cols = set()\n    pos_diag = set()  # (row + col) \u5728 / \u5bf9\u89d2\u7ebf\u4e0a\u4e3a\u5e38\u6570\n    neg_diag = set()  # (row - col) \u5728 \\ \u5bf9\u89d2\u7ebf\u4e0a\u4e3a\u5e38\u6570\n\n    board = [['.' ] * n for _ in range(n)]\n\n    def backtrack(row):\n        if row == n:\n            result.append([''.join(r) for r in board])\n            return\n\n        for col in range(n):\n            if col in cols or (row + col) in pos_diag or (row - col) in neg_diag:\n                continue\n\n            cols.add(col)\n            pos_diag.add(row + col)\n            neg_diag.add(row - col)\n            board[row][col] = 'Q'\n\n            backtrack(row + 1)\n\n            cols.remove(col)\n            pos_diag.remove(row + col)\n            neg_diag.remove(row - col)\n            board[row][col] = '.'\n\n    backtrack(0)\n    return result\n</code></pre> <ul> <li>\u5173\u952e\u6d1e\u5bdf\uff1a\u5bf9\u89d2\u7ebf\u7f16\u7801\u3002\u5bf9\u4e8e <code>/</code> \u5bf9\u89d2\u7ebf\uff0c<code>row + col</code> \u662f\u5e38\u6570\u3002\u5bf9\u4e8e <code>\\</code> \u5bf9\u89d2\u7ebf\uff0c<code>row - col</code> \u662f\u5e38\u6570\u3002\u4f7f\u7528\u96c6\u5408\u8ddf\u8e2a\u5217\u548c\u5bf9\u89d2\u7ebf\u4f7f\u5f97\u6709\u6548\u6027\u68c0\u67e5\u53d8\u4e3a \\(O(1)\\)\u3002</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#_21","title":"\u5e38\u89c1\u9677\u9631\u603b\u7ed3","text":"\u9677\u9631 \u793a\u4f8b \u4fee\u590d \u4e8c\u5206\u67e5\u627e\u4e2d <code>lo &lt;= hi</code> vs <code>lo &lt; hi</code> \u8fb9\u754c\u5dee\u4e00\u9519\u8bef \u6839\u636e <code>hi</code> \u662f\u5305\u542b\u8fd8\u662f\u6392\u9664\u6765\u9009\u62e9 \u4ece\u5de6\u5230\u53f3\u7684\u4e00\u7ef4\u80cc\u5305 \u7269\u54c1\u88ab\u591a\u6b21\u4f7f\u7528 0/1 \u80cc\u5305\u4ece\u53f3\u5411\u5de6\u8fed\u4ee3 \u56de\u6eaf\u4e2d\u672a\u590d\u5236\u8def\u5f84 <code>result.append(path)</code> \u2014 \u6240\u6709\u6761\u76ee\u6307\u5411\u540c\u4e00\u5217\u8868 <code>result.append(path[:])</code> \u6216 <code>path.copy()</code> <code>backtrack(i)</code> vs <code>backtrack(i+1)</code> \u91cd\u590d\u4f7f\u7528 vs \u4e0d\u91cd\u590d\u4f7f\u7528\u5143\u7d20 \u5339\u914d\u95ee\u9898\u8981\u6c42 \u6392\u5e8f\u540e\u7684\u56de\u6eaf\u4e2d\u7f3a\u5c11 <code>break</code> \u63a2\u7d22\u8fc7\u5927\u7684\u5019\u9009 \u6392\u5e8f + \u5019\u9009\u8d85\u8fc7\u5269\u4f59\u65f6 break DP \u521d\u59cb\u5316 <code>dp[0]</code> \u9519\u8bef \u2192 \u6240\u6709\u540e\u7eed\u503c\u90fd\u9519 \u4ed4\u7ec6\u5b9a\u4e49\u57fa\u672c\u60c5\u51b5 \u672a\u7ecf\u8bc1\u660e\u7684\u8d2a\u5fc3 \u8d2a\u5fc3\u5e76\u4e0d\u603b\u662f\u6709\u6548 \u9a8c\u8bc1\u8d2a\u5fc3\u9009\u62e9\u6027\u8d28 \u591a\u952e\u6392\u5e8f\u65f6\u4e0d\u7a33\u5b9a \u76f8\u7b49\u5143\u7d20\u7684\u76f8\u5bf9\u987a\u5e8f\u4e22\u5931 \u4f7f\u7528\u7a33\u5b9a\u6392\u5e8f\uff08\u5f52\u5e76\u6392\u5e8f\u3001Python \u7684 <code>sorted</code>\uff09"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#neetcode","title":"\u8bfe\u540e\u7ec3\u4e60\u9898\uff08NeetCode\uff09","text":""},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#_22","title":"\u4e8c\u5206\u67e5\u627e","text":"<ul> <li>\u4e8c\u5206\u67e5\u627e \u2014 \u6807\u51c6\u6a21\u677f</li> <li>\u641c\u7d22\u4e8c\u7ef4\u77e9\u9635 \u2014 \u5728\u5c55\u5e73\u77e9\u9635\u4e0a\u4e8c\u5206\u67e5\u627e</li> <li>Koko \u5403\u9999\u8549 \u2014 \u5bf9\u7b54\u6848\u4e8c\u5206\u67e5\u627e</li> <li>\u641c\u7d22\u65cb\u8f6c\u6392\u5e8f\u6570\u7ec4 \u2014 \u8bc6\u522b\u6709\u5e8f\u7684\u4e00\u534a</li> <li>\u5bfb\u627e\u65cb\u8f6c\u6392\u5e8f\u6570\u7ec4\u4e2d\u7684\u6700\u5c0f\u503c \u2014 \u641c\u7d22\u62d0\u70b9</li> <li>\u5bfb\u627e\u4e24\u4e2a\u6709\u5e8f\u6570\u7ec4\u7684\u4e2d\u4f4d\u6570 \u2014 \u57fa\u4e8e\u5206\u5272\u7684\u4e8c\u5206\u67e5\u627e</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#_23","title":"\u8d2a\u5fc3","text":"<ul> <li>\u8df3\u8dc3\u6e38\u620f \u2014 \u8ddf\u8e2a\u6700\u8fdc\u8ddd\u79bb</li> <li>\u8df3\u8dc3\u6e38\u620f II \u2014 BFS \u98ce\u683c\u7684\u5c42\u7ea7\u8ddf\u8e2a</li> <li>\u5408\u5e76\u533a\u95f4 \u2014 \u6392\u5e8f + \u5408\u5e76</li> <li>\u63d2\u5165\u533a\u95f4 \u2014 \u5bfb\u627e\u91cd\u53e0\u533a\u57df</li> <li>\u65e0\u91cd\u53e0\u533a\u95f4 \u2014 \u6309\u7ed3\u675f\u65f6\u95f4\u6392\u5e8f</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#_24","title":"\u52a8\u6001\u89c4\u5212","text":"<ul> <li>\u722c\u697c\u68af \u2014 \u6590\u6ce2\u90a3\u5951 DP</li> <li>\u6253\u5bb6\u52ab\u820d \u2014 \u53d6\u6216\u4e0d\u53d6 DP</li> <li>\u6253\u5bb6\u52ab\u820d II \u2014 \u73af\u5f62\uff1a\u8fd0\u884c\u4e24\u6b21</li> <li>\u96f6\u94b1\u5151\u6362 \u2014 \u65e0\u9650\u80cc\u5305</li> <li>\u6700\u957f\u516c\u5171\u5b50\u5e8f\u5217 \u2014 \u4e24\u4e2a\u5b57\u7b26\u4e32\u4e0a\u7684 2D DP</li> <li>\u5355\u8bcd\u62c6\u5206 \u2014 \u5e26\u96c6\u5408\u67e5\u627e\u7684 DP</li> <li>\u6700\u957f\u9012\u589e\u5b50\u5e8f\u5217 \u2014 \\(O(n^2)\\) DP \u6216\u5e26\u4e8c\u5206\u67e5\u627e\u7684 \\(O(n \\log n)\\)</li> <li>\u7f16\u8f91\u8ddd\u79bb \u2014 \u7ecf\u5178 2D DP</li> <li>\u5206\u5272\u7b49\u548c\u5b50\u96c6 \u2014 0/1 \u80cc\u5305\u53d8\u4f53</li> </ul>"},{"location":"chapter%2014%3A%20data%20structures%20and%20algorithms/05.%20sorting%20and%20search/#_25","title":"\u56de\u6eaf","text":"<ul> <li>\u5b50\u96c6 \u2014 \u679a\u4e3e\u6240\u6709\u5b50\u96c6</li> <li>\u7ec4\u5408\u603b\u548c \u2014 \u5141\u8bb8\u91cd\u590d\u4f7f\u7528\u7684\u56de\u6eaf</li> <li>\u5168\u6392\u5217 \u2014 \u5e26\u4f7f\u7528\u96c6\u5408\u7684\u56de\u6eaf</li> <li>\u5b50\u96c6 II \u2014 \u8df3\u8fc7\u91cd\u590d\u9879</li> <li>\u5355\u8bcd\u641c\u7d22 \u2014 \u7f51\u683c\u56de\u6eaf</li> <li>\u5206\u5272\u56de\u6587\u4e32 \u2014 \u56de\u6eaf + \u56de\u6587\u68c0\u67e5</li> <li>N \u7687\u540e \u2014 \u7ea6\u675f\u4f20\u64ad</li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/01.%20linux%20and%20CMD/","title":"Linux \u4e0e\u547d\u4ee4\u884c","text":"<p>\u547d\u4ee4\u884c\u662f\u673a\u5668\u5b66\u4e60\u5de5\u7a0b\u7684\u4e3b\u8981\u754c\u9762\uff1a\u8bad\u7ec3\u4efb\u52a1\u3001\u670d\u52a1\u5668\u7ba1\u7406\u3001\u6570\u636e\u7ba1\u9053\u548c\u96c6\u7fa4\u7ba1\u7406\u90fd\u901a\u8fc7\u7ec8\u7aef\u8fdb\u884c\u3002\u672c\u6587\u6db5\u76d6 Shell\u3001\u6587\u4ef6\u7cfb\u7edf\u3001\u6743\u9650\u3001\u8fdb\u7a0b\u7ba1\u7406\u3001\u5305\u7ba1\u7406\u5668\u3001\u73af\u5883\u53d8\u91cf\u3001SSH \u4ee5\u53ca\u6bcf\u4f4d\u673a\u5668\u5b66\u4e60\u5de5\u7a0b\u5e08\u65e5\u5e38\u4f7f\u7528\u7684\u57fa\u672c\u547d\u4ee4\u3002</p> <ul> <li> <p>GUI \u9002\u5408\u6d4f\u89c8\u7f51\u9875\uff0c\u4f46\u5728\u51cc\u6668 2 \u70b9\u5728\u8fdc\u7a0b GPU \u96c6\u7fa4\u4e0a\u8fd0\u884c\u8bad\u7ec3\u4efb\u52a1\u65f6\u5374\u5f88\u7cdf\u7cd5\u3002\u547d\u4ee4\u884c\uff08\u6216\u7ec8\u7aef\u3001Shell\uff09\u662f\u80fd\u591f\u6269\u5c55\u7684\u5de5\u5177\uff1a\u5b83\u5728\u4efb\u4f55\u673a\u5668\u4e0a\u90fd\u80fd\u5de5\u4f5c\uff0c\u53ef\u7f16\u5199\u811a\u672c\uff0c\u53ef\u7ec4\u5408\uff0c\u5e76\u4e14\u5728\u4f60\u7684\u7b14\u8bb0\u672c\u7535\u8111\u3001\u4e91 VM \u548c HPC \u96c6\u7fa4\u4e0a\u5b8c\u5168\u76f8\u540c\u3002</p> </li> <li> <p>\u5982\u679c\u4f60\u662f\u4e00\u540d\u53ea\u4f7f\u7528 Jupyter notebook \u548c VS Code \u6309\u94ae\u7684\u673a\u5668\u5b66\u4e60\u5de5\u7a0b\u5e08\uff0c\u4f60\u6b63\u5728\u6d6a\u8d39\u5de8\u5927\u7684\u751f\u4ea7\u529b\u3002\u6bcf\u4e2a\u751f\u4ea7\u7ea7\u673a\u5668\u5b66\u4e60\u7cfb\u7edf\u90fd\u662f\u901a\u8fc7\u547d\u4ee4\u884c\u8fdb\u884c\u90e8\u7f72\u3001\u76d1\u63a7\u548c\u8c03\u8bd5\u7684\u3002</p> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/01.%20linux%20and%20CMD/#shell","title":"Shell","text":"<ul> <li> <p>Shell \u662f\u4e00\u4e2a\u8bfb\u53d6\u4f60\u7684\u547d\u4ee4\u5e76\u6267\u884c\u5b83\u4eec\u7684\u7a0b\u5e8f\u3002\u5b83\u662f\u4f60\u548c\u64cd\u4f5c\u7cfb\u7edf\u4e4b\u95f4\u7684\u4e2d\u4ecb\uff08\u7b2c 13 \u7ae0\uff09\u3002\u6700\u5e38\u89c1\u7684 Shell \u662f bash\uff08\u5927\u591a\u6570 Linux \u7cfb\u7edf\u7684\u9ed8\u8ba4 Shell\uff09\u548c zsh\uff08macOS \u7684\u9ed8\u8ba4 Shell\uff09\u3002</p> </li> <li> <p>\u547d\u4ee4\u7684\u683c\u5f0f\u4e3a\uff1a<code>command [options] [arguments]</code></p> </li> </ul> <pre><code>ls -la /home/user    # \u547d\u4ee4=ls, \u9009\u9879=-la, \u53c2\u6570=/home/user\n</code></pre> <ul> <li>\u9009\u9879\u4fee\u6539\u884c\u4e3a\uff08\u901a\u5e38\u4ee5 <code>-</code> \u8868\u793a\u77ed\u9009\u9879\uff0c<code>--</code> \u8868\u793a\u957f\u9009\u9879\uff09\u3002<code>ls -l</code> \u4ee5\u957f\u683c\u5f0f\u5217\u51fa\uff0c<code>ls --all</code> \u663e\u793a\u9690\u85cf\u6587\u4ef6\u3002\u8bb8\u591a\u9009\u9879\u53ef\u4ee5\u7ec4\u5408\uff1a<code>ls -la</code> \u8868\u793a\u5c06 <code>-l</code> \u548c <code>-a</code> \u4e00\u8d77\u4f7f\u7528\u3002</li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/01.%20linux%20and%20CMD/#_1","title":"\u57fa\u672c\u5bfc\u822a","text":"<pre><code>pwd                 # \u6253\u5370\u5f53\u524d\u5de5\u4f5c\u76ee\u5f55\uff08\u6211\u5728\u54ea\uff1f\uff09\nls                  # \u5217\u51fa\u5f53\u524d\u76ee\u5f55\u4e2d\u7684\u6587\u4ef6\nls -la              # \u5217\u51fa\u6240\u6709\u6587\u4ef6\uff08\u5305\u62ec\u9690\u85cf\u6587\u4ef6\uff09\u53ca\u8be6\u7ec6\u4fe1\u606f\ncd /path/to/dir     # \u5207\u6362\u76ee\u5f55\ncd ..               # \u8fd4\u56de\u4e0a\u4e00\u7ea7\ncd ~                # \u8fd4\u56de\u7528\u6237\u4e3b\u76ee\u5f55\ncd -                # \u8fd4\u56de\u4e0a\u4e00\u4e2a\u76ee\u5f55\n</code></pre>"},{"location":"chapter%2015%3A%20production%20software%20engineering/01.%20linux%20and%20CMD/#_2","title":"\u6587\u4ef6\u64cd\u4f5c","text":"<pre><code>cp source dest      # \u590d\u5236\u6587\u4ef6\ncp -r dir1 dir2     # \u9012\u5f52\u590d\u5236\u76ee\u5f55\nmv old new          # \u79fb\u52a8/\u91cd\u547d\u540d\u6587\u4ef6\nrm file             # \u5220\u9664\u6587\u4ef6\uff08\u6ca1\u6709\u56de\u6536\u7ad9\u2014\u2014\u6c38\u4e45\u5220\u9664\uff09\nrm -rf dir          # \u9012\u5f52\u5220\u9664\u76ee\u5f55\uff08\u5371\u9669\u2014\u2014\u65e0\u786e\u8ba4\uff09\nmkdir -p a/b/c      # \u521b\u5efa\u5d4c\u5957\u76ee\u5f55\ntouch file.txt      # \u521b\u5efa\u7a7a\u6587\u4ef6\uff08\u6216\u66f4\u65b0\u65f6\u95f4\u6233\uff09\ncat file.txt        # \u6253\u5370\u6587\u4ef6\u5185\u5bb9\nhead -n 20 file     # \u663e\u793a\u524d 20 \u884c\ntail -f logfile     # \u5b9e\u65f6\u8ddf\u8e2a\u65e5\u5fd7\u6587\u4ef6\uff08\u76d1\u63a7\u8bad\u7ec3\u65f6\u975e\u5e38\u6709\u7528\uff09\n</code></pre> <ul> <li>\u9677\u9631\uff1a<code>rm -rf</code> \u662f\u8ba1\u7b97\u4e2d\u6700\u5371\u9669\u7684\u547d\u4ee4\u3002\u6ca1\u6709\u64a4\u9500\u64cd\u4f5c\u3002\u6309\u56de\u8f66\u524d\u8bf7\u4e09\u6b21\u68c0\u67e5\u8def\u5f84\u3002\u5207\u52ff\u8fd0\u884c <code>rm -rf /</code> \u6216 <code>rm -rf ~</code>\u3002</li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/01.%20linux%20and%20CMD/#_3","title":"\u7ba1\u9053\u4e0e\u91cd\u5b9a\u5411","text":"<ul> <li> <p>Shell \u7684\u6740\u624b\u7ea7\u7279\u6027\u662f\u53ef\u7ec4\u5408\u6027\uff1a\u5c06\u5c0f\u547d\u4ee4\u8fde\u63a5\u8d77\u6765\u5b8c\u6210\u590d\u6742\u4efb\u52a1\u3002</p> </li> <li> <p>\u7ba1\u9053\uff08<code>|</code>\uff09\uff1a\u5c06\u4e00\u4e2a\u547d\u4ee4\u7684\u8f93\u51fa\u4f5c\u4e3a\u4e0b\u4e00\u4e2a\u547d\u4ee4\u7684\u8f93\u5165\u3002</p> </li> </ul> <pre><code>cat training.log | grep \"loss\" | tail -5    # \u6700\u540e5\u884c\u5305\u542b\"loss\"\u7684\u5185\u5bb9\nps aux | grep python                        # \u67e5\u627e\u6b63\u5728\u8fd0\u884c\u7684 Python \u8fdb\u7a0b\nhistory | grep \"docker\"                     # \u67e5\u627e\u4e4b\u524d\u7684 docker \u547d\u4ee4\n</code></pre> <ul> <li>\u91cd\u5b9a\u5411\uff1a\u5c06\u8f93\u51fa\u53d1\u9001\u5230\u6587\u4ef6\u800c\u4e0d\u662f\u5c4f\u5e55\u3002</li> </ul> <pre><code>python train.py &gt; output.log 2&gt;&amp;1    # stdout \u548c stderr \u90fd\u8f93\u51fa\u5230\u6587\u4ef6\npython train.py &gt;&gt; output.log        # \u8ffd\u52a0\uff08\u4e0d\u8986\u76d6\uff09\necho \"data\" &gt; file.txt               # \u8986\u76d6\u6587\u4ef6\necho \"more\" &gt;&gt; file.txt              # \u8ffd\u52a0\u5230\u6587\u4ef6\n</code></pre> <ul> <li><code>2&gt;&amp;1</code> \u5c06 stderr\uff08\u6587\u4ef6\u63cf\u8ff0\u7b26 2\uff09\u91cd\u5b9a\u5411\u5230 stdout\uff08\u6587\u4ef6\u63cf\u8ff0\u7b26 1\uff09\u3002\u6ca1\u6709\u5b83\uff0c\u9519\u8bef\u6d88\u606f\u4ecd\u4f1a\u51fa\u73b0\u5728\u5c4f\u5e55\u4e0a\uff0c\u53ea\u6709\u6b63\u5e38\u8f93\u51fa\u4f1a\u8fdb\u5165\u6587\u4ef6\u3002</li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/01.%20linux%20and%20CMD/#_4","title":"\u6587\u672c\u5904\u7406","text":"<pre><code>grep \"error\" logfile.txt             # \u67e5\u627e\u5305\u542b\"error\"\u7684\u884c\ngrep -r \"import torch\" src/          # \u9012\u5f52\u641c\u7d22\u76ee\u5f55\ngrep -i \"warning\" log.txt            # \u4e0d\u533a\u5206\u5927\u5c0f\u5199\u641c\u7d22\ngrep -c \"epoch\" train.log            # \u7edf\u8ba1\u5339\u914d\u884c\u6570\n\nwc -l file.txt                       # \u7edf\u8ba1\u884c\u6570\nwc -w file.txt                       # \u7edf\u8ba1\u5355\u8bcd\u6570\n\nsort data.txt                        # \u6309\u5b57\u6bcd\u987a\u5e8f\u6392\u5e8f\nsort -n numbers.txt                  # \u6309\u6570\u503c\u6392\u5e8f\nsort -u data.txt                     # \u6392\u5e8f\u5e76\u53bb\u91cd\nuniq -c sorted.txt                   # \u7edf\u8ba1\u8fde\u7eed\u91cd\u590d\u9879\n\ncut -d',' -f2,3 data.csv            # \u63d0\u53d6 CSV \u7684\u7b2c 2 \u548c\u7b2c 3 \u5217\nawk '{print $1, $3}' data.txt       # \u6253\u5370\u7b2c 1 \u548c\u7b2c 3 \u4e2a\u7a7a\u767d\u5206\u9694\u5b57\u6bb5\nsed 's/old/new/g' file.txt          # \u5c06\u6240\u6709\"old\"\u66ff\u6362\u4e3a\"new\"\n</code></pre> <ul> <li>\u8fd9\u4e9b\u547d\u4ee4\u53ef\u4ee5\u4f18\u7f8e\u5730\u7ec4\u5408\uff1a</li> </ul> <pre><code># \u67e5\u627e\u65e5\u5fd7\u6587\u4ef6\u4e2d\u6700\u5e38\u89c1\u7684 10 \u79cd\u9519\u8bef\u7c7b\u578b\ngrep \"ERROR\" app.log | awk -F': ' '{print $2}' | sort | uniq -c | sort -rn | head -10\n</code></pre>"},{"location":"chapter%2015%3A%20production%20software%20engineering/01.%20linux%20and%20CMD/#_5","title":"\u67e5\u627e\u6587\u4ef6","text":"<pre><code>find . -name \"*.py\"                  # \u67e5\u627e\u6240\u6709 Python \u6587\u4ef6\nfind . -name \"*.pyc\" -delete         # \u67e5\u627e\u5e76\u5220\u9664\u7f16\u8bd1\u540e\u7684 Python \u6587\u4ef6\nfind /data -size +100M               # \u67e5\u627e\u5927\u4e8e 100MB \u7684\u6587\u4ef6\nfind . -mtime -1                     # \u67e5\u627e\u8fc7\u53bb 24 \u5c0f\u65f6\u5185\u4fee\u6539\u8fc7\u7684\u6587\u4ef6\n\nwhich python                        # python \u53ef\u6267\u884c\u6587\u4ef6\u5728\u54ea\uff1f\nlocate filename                      # \u5feb\u901f\u67e5\u627e\u6587\u4ef6\uff08\u4f7f\u7528\u9884\u6784\u5efa\u7d22\u5f15\uff09\n</code></pre>"},{"location":"chapter%2015%3A%20production%20software%20engineering/01.%20linux%20and%20CMD/#_6","title":"\u6587\u4ef6\u7cfb\u7edf\u5c42\u6b21\u7ed3\u6784","text":"<ul> <li>Linux \u5c06\u6240\u6709\u5185\u5bb9\u7ec4\u7ec7\u5728\u4ee5 <code>/</code> \u4e3a\u6839\u7684\u5355\u68f5\u6811\u4e2d\uff1a</li> </ul> \u76ee\u5f55 \u7528\u9014 <code>/</code> \u6574\u4e2a\u6587\u4ef6\u7cfb\u7edf\u7684\u6839 <code>/home/user</code> \u4f60\u7684\u4e2a\u4eba\u6587\u4ef6\u3001\u914d\u7f6e\u3001\u9879\u76ee <code>/etc</code> \u7cfb\u7edf\u7ea7\u914d\u7f6e\u6587\u4ef6 <code>/usr</code> \u7528\u6237\u7a0b\u5e8f\u3001\u5e93\u3001\u6587\u6863 <code>/usr/local</code> \u672c\u5730\u5b89\u88c5\u7684\u8f6f\u4ef6\uff08\u975e\u5305\u7ba1\u7406\u5668\u5b89\u88c5\uff09 <code>/var</code> \u53ef\u53d8\u6570\u636e\uff1a\u65e5\u5fd7\uff08<code>/var/log</code>\uff09\u3001\u6570\u636e\u5e93\u3001\u7f13\u5b58 <code>/tmp</code> \u4e34\u65f6\u6587\u4ef6\uff08\u91cd\u542f\u540e\u6e05\u9664\uff09 <code>/opt</code> \u53ef\u9009\u7684\u7b2c\u4e09\u65b9\u8f6f\u4ef6 <code>/proc</code> \u66b4\u9732\u5185\u6838\u548c\u8fdb\u7a0b\u4fe1\u606f\u7684\u865a\u62df\u6587\u4ef6\u7cfb\u7edf <code>/dev</code> \u8bbe\u5907\u6587\u4ef6\uff08\u78c1\u76d8\u3001GPU \u5728\u8fd9\u91cc\u663e\u793a\uff09 <ul> <li>\u5bf9\u4e8e\u673a\u5668\u5b66\u4e60\uff1a\u4f60\u7684\u8bad\u7ec3\u6570\u636e\u901a\u5e38\u5728 <code>/data</code> \u6216 <code>/home/user/data</code>\uff0c\u6a21\u578b\u5728 <code>/home/user/models</code>\uff0cCUDA \u5728 <code>/usr/local/cuda</code>\u3002GPU \u8bbe\u5907\u663e\u793a\u4e3a <code>/dev/nvidia0</code>\u3001<code>/dev/nvidia1</code> \u7b49\u3002</li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/01.%20linux%20and%20CMD/#_7","title":"\u6587\u4ef6\u6743\u9650","text":"<ul> <li>\u6bcf\u4e2a\u6587\u4ef6\u548c\u76ee\u5f55\u6709\u4e09\u79cd\u7528\u6237\u7c7b\u522b\u7684\u4e09\u79cd\u6743\u9650\u7c7b\u578b\uff1a</li> </ul> \u6743\u9650 \u6587\u4ef6 \u76ee\u5f55 r\uff08\u8bfb\uff09 \u67e5\u770b\u5185\u5bb9 \u5217\u51fa\u5185\u5bb9 w\uff08\u5199\uff09 \u4fee\u6539\u5185\u5bb9 \u5728\u5185\u90e8\u521b\u5efa/\u5220\u9664\u6587\u4ef6 x\uff08\u6267\u884c\uff09 \u4f5c\u4e3a\u7a0b\u5e8f\u8fd0\u884c \u8fdb\u5165\uff08cd \u8fdb\u5165\uff09\u76ee\u5f55 <ul> <li>\u4e09\u79cd\u7528\u6237\u7c7b\u522b\uff1a\u6240\u6709\u8005\uff08u\uff09\u3001\u7ec4\uff08g\uff09\u3001\u5176\u4ed6\u4eba\uff08o\uff09\u3002</li> </ul> <pre><code>ls -l script.py\n# -rwxr-xr-- 1 henry ml_team 2048 Mar 28 script.py\n#  ^^^         \u6240\u6709\u8005\u6743\u9650\uff1arwx\uff08\u8bfb\u3001\u5199\u3001\u6267\u884c\uff09\n#     ^^^      \u7ec4\u6743\u9650\uff1ar-x\uff08\u8bfb\u3001\u6267\u884c\uff0c\u4e0d\u53ef\u5199\uff09\n#        ^^^   \u5176\u4ed6\u4eba\u6743\u9650\uff1ar--\uff08\u53ea\u8bfb\uff09\n</code></pre> <pre><code>chmod 755 script.py       # owner=rwx, group=rx, others=rx\nchmod +x script.py        # \u4e3a\u6240\u6709\u4eba\u6dfb\u52a0\u6267\u884c\u6743\u9650\nchmod u+w,g-w file.txt    # \u4e3a\u6240\u6709\u8005\u6dfb\u52a0\u5199\u6743\u9650\uff0c\u79fb\u9664\u7ec4\u7684\u5199\u6743\u9650\nchown henry:ml_team file  # \u66f4\u6539\u6240\u6709\u8005\u548c\u7ec4\n</code></pre> <ul> <li>\u9677\u9631\uff1a\u9876\u90e8\u5e26\u6709 <code>#!/usr/bin/env python3</code> \u7684 Python \u811a\u672c\u9700\u8981\u6267\u884c\u6743\u9650\uff08<code>chmod +x</code>\uff09\u624d\u80fd\u4ee5 <code>./script.py</code> \u65b9\u5f0f\u8fd0\u884c\u3002\u6ca1\u6709\u5b83\uff0c\u4f60\u5fc5\u987b\u4f7f\u7528 <code>python3 script.py</code>\u3002</li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/01.%20linux%20and%20CMD/#_8","title":"\u8fdb\u7a0b\u7ba1\u7406","text":"<ul> <li>\u8fdb\u7a0b\u662f\u4e00\u4e2a\u6b63\u5728\u8fd0\u884c\u7684\u7a0b\u5e8f\uff08\u7b2c 13 \u7ae0\uff09\u3002Shell \u4e3a\u4f60\u63d0\u4f9b\u4e86\u7ba1\u7406\u5b83\u4eec\u7684\u5de5\u5177\uff1a</li> </ul> <pre><code>ps aux                    # \u5217\u51fa\u6240\u6709\u6b63\u5728\u8fd0\u884c\u7684\u8fdb\u7a0b\nps aux | grep python      # \u67e5\u627e Python \u8fdb\u7a0b\ntop                       # \u5b9e\u65f6\u8fdb\u7a0b\u76d1\u63a7\uff08CPU\u3001\u5185\u5b58\uff09\nhtop                      # top \u7684\u589e\u5f3a\u7248\uff08\u9700\u5355\u72ec\u5b89\u88c5\uff09\nnvidia-smi                # GPU \u4f7f\u7528\u60c5\u51b5\uff08\u673a\u5668\u5b66\u4e60\u5fc5\u5907\uff09\nwatch -n 1 nvidia-smi     # \u6bcf\u79d2\u5237\u65b0 nvidia-smi\n\nkill PID                  # \u4f18\u96c5\u7ec8\u6b62\u8fdb\u7a0b\nkill -9 PID               # \u5f3a\u5236\u7ec8\u6b62\uff08\u4f18\u96c5\u65b9\u5f0f\u5931\u8d25\u65f6\u4f7f\u7528\uff09\nkillall python            # \u7ec8\u6b62\u6240\u6709 Python \u8fdb\u7a0b\n\n# \u540e\u53f0\u8fd0\u884c\npython train.py &amp;                    # \u540e\u53f0\u8fd0\u884c\nnohup python train.py &gt; log.txt &amp;    # \u540e\u53f0\u8fd0\u884c\uff0c\u9000\u51fa\u767b\u5f55\u540e\u4ecd\u5b58\u6d3b\n</code></pre> <ul> <li> <p><code>nohup</code> \u5bf9\u673a\u5668\u5b66\u4e60\u8bad\u7ec3\u81f3\u5173\u91cd\u8981\uff1a\u6ca1\u6709\u5b83\uff0c\u5173\u95ed SSH \u8fde\u63a5\u4f1a\u7ec8\u6b62\u8bad\u7ec3\u4efb\u52a1\u3002<code>nohup</code> \u5c06\u8fdb\u7a0b\u4ece\u7ec8\u7aef\u5206\u79bb\u51fa\u6765\u3002</p> </li> <li> <p><code>screen</code> \u548c <code>tmux</code> \u662f\u7ec8\u7aef\u590d\u7528\u5668\uff0c\u53ef\u4ee5\u521b\u5efa\u6301\u4e45\u4f1a\u8bdd\u3002\u4f60\u53ef\u4ee5\u5728 tmux \u4f1a\u8bdd\u4e2d\u542f\u52a8\u8bad\u7ec3\u4efb\u52a1\uff0c\u65ad\u5f00 SSH \u8fde\u63a5\uff0c\u7a0d\u540e\u91cd\u65b0\u8fde\u63a5\uff0c\u4f1a\u8bdd\uff08\u548c\u8bad\u7ec3\uff09\u4ecd\u5728\u8fd0\u884c\u3002</p> </li> </ul> <pre><code>tmux new -s training          # \u521b\u5efa\u547d\u540d\u4f1a\u8bdd\n# ... \u5f00\u59cb\u8bad\u7ec3 ...\n# Ctrl+B, \u7136\u540e D              # \u4ece\u4f1a\u8bdd\u5206\u79bb\ntmux attach -t training       # \u7a0d\u540e\u91cd\u65b0\u8fde\u63a5\uff08\u5373\u4f7f SSH \u91cd\u65b0\u8fde\u63a5\u540e\u4e5f\u53ef\u7528\uff09\ntmux ls                       # \u5217\u51fa\u4f1a\u8bdd\n</code></pre>"},{"location":"chapter%2015%3A%20production%20software%20engineering/01.%20linux%20and%20CMD/#_9","title":"\u5305\u7ba1\u7406\u5668","text":"<ul> <li>\u7cfb\u7edf\u5305\uff08\u64cd\u4f5c\u7cfb\u7edf\u7ea7\u8f6f\u4ef6\uff09\uff1a</li> </ul> <pre><code># Debian/Ubuntu\nsudo apt update               # \u5237\u65b0\u5305\u5217\u8868\nsudo apt install htop         # \u5b89\u88c5\u5305\nsudo apt upgrade              # \u5347\u7ea7\u6240\u6709\u5305\n\n# macOS\nbrew install wget             # \u901a\u8fc7 Homebrew \u5b89\u88c5\n</code></pre> <ul> <li>Python \u5305\uff1a</li> </ul> <pre><code>pip install torch             # \u4ece PyPI \u5b89\u88c5\npip install -e .              # \u4ee5\u53ef\u7f16\u8f91\u6a21\u5f0f\u5b89\u88c5\u5f53\u524d\u9879\u76ee\npip install -r requirements.txt  # \u4ece requirements \u6587\u4ef6\u5b89\u88c5\npip freeze &gt; requirements.txt    # \u5bfc\u51fa\u5df2\u5b89\u88c5\u7684\u5305\n\n# Conda\uff08\u7528\u4e8e\u590d\u6742\u4f9d\u8d56\uff0c\u5982 CUDA\uff09\nconda create -n myenv python=3.11\nconda activate myenv\nconda install pytorch torchvision cudatoolkit=12.1 -c pytorch\n</code></pre> <ul> <li>\u9677\u9631\uff1a\u6c38\u8fdc\u4e0d\u8981\u5c06 <code>pip install</code> \u5b89\u88c5\u5230\u7cfb\u7edf Python \u4e2d\u3002\u59cb\u7ec8\u4f7f\u7528\u865a\u62df\u73af\u5883\uff08<code>python -m venv env</code>\u3001<code>conda create</code> \u6216 <code>uv venv</code>\uff09\u3002\u7cfb\u7edf Python \u88ab\u64cd\u4f5c\u7cfb\u7edf\u5de5\u5177\u5171\u4eab\uff1b\u7834\u574f\u5b83\u53ef\u80fd\u5bfc\u81f4\u7cfb\u7edf\u5d29\u6e83\u3002</li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/01.%20linux%20and%20CMD/#_10","title":"\u73af\u5883\u53d8\u91cf","text":"<ul> <li>\u73af\u5883\u53d8\u91cf\u662f\u6240\u6709\u7a0b\u5e8f\u90fd\u53ef\u4ee5\u8bbf\u95ee\u7684\u952e\u503c\u5bf9\u3002\u5b83\u4eec\u5728\u4e0d\u6539\u53d8\u4ee3\u7801\u7684\u60c5\u51b5\u4e0b\u914d\u7f6e\u884c\u4e3a\u3002</li> </ul> <pre><code>export CUDA_VISIBLE_DEVICES=0,1    # \u4ec5\u4f7f\u7528 GPU 0 \u548c 1\nexport PYTHONPATH=/home/user/src   # \u6dfb\u52a0\u5230 Python \u7684\u5bfc\u5165\u8def\u5f84\nexport WANDB_API_KEY=abc123        # Weights &amp; Biases \u7684 API \u5bc6\u94a5\n\necho $PATH                         # \u67e5\u770b\u5f53\u524d PATH\nexport PATH=$PATH:/usr/local/cuda/bin  # \u5c06 CUDA \u6dfb\u52a0\u5230 PATH\n</code></pre> <ul> <li> <p><code>.bashrc</code>\uff08\u6216 <code>.zshrc</code>\uff09\uff1a\u6bcf\u6b21\u6253\u5f00 Shell \u65f6\u8fd0\u884c\u7684\u547d\u4ee4\u3002\u628a\u4f60\u7684 <code>export</code> \u8bed\u53e5\u653e\u5728\u8fd9\u91cc\uff0c\u8fd9\u6837\u5b83\u4eec\u5c31\u4f1a\u6301\u4e45\u5b58\u5728\u3002</p> </li> <li> <p><code>.env</code> \u6587\u4ef6\uff1a\u7531 <code>python-dotenv</code> \u7b49\u5de5\u5177\u52a0\u8f7d\u7684\u9879\u76ee\u7279\u5b9a\u53d8\u91cf\u3002\u5c06\u5bc6\u94a5\uff08API \u5bc6\u94a5\u3001\u6570\u636e\u5e93\u5bc6\u7801\uff09\u4fdd\u5b58\u5728 <code>.env</code> \u4e2d\uff0c\u5e76\u5c06 <code>.env</code> \u6dfb\u52a0\u5230 <code>.gitignore</code>\u3002\u5207\u52ff\u5c06\u5bc6\u94a5\u63d0\u4ea4\u5230 Git\u3002</p> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/01.%20linux%20and%20CMD/#ssh","title":"SSH\uff08\u5b89\u5168\u5916\u58f3\u534f\u8bae\uff09","text":"<ul> <li>SSH \u901a\u8fc7\u52a0\u5bc6\u901a\u9053\u5c06\u4f60\u8fde\u63a5\u5230\u8fdc\u7a0b\u673a\u5668\u3002\u8fd9\u662f\u4f60\u8bbf\u95ee\u4e91 VM\u3001GPU \u670d\u52a1\u5668\u548c HPC \u96c6\u7fa4\u7684\u65b9\u5f0f\u3002</li> </ul> <pre><code>ssh user@hostname              # \u8fde\u63a5\u5230\u8fdc\u7a0b\u673a\u5668\nssh -i ~/.ssh/key.pem user@ip  # \u4f7f\u7528\u7279\u5b9a\u5bc6\u94a5\u8fde\u63a5\nssh -L 8888:localhost:8888 user@server  # \u7aef\u53e3\u8f6c\u53d1\uff08\u8fdc\u7a0b Jupyter\uff09\n</code></pre> <ul> <li>SSH \u5bc6\u94a5\uff08\u516c\u94a5/\u79c1\u94a5\u5bf9\uff09\u66ff\u4ee3\u5bc6\u7801\uff1a</li> </ul> <pre><code>ssh-keygen -t ed25519          # \u751f\u6210\u5bc6\u94a5\u5bf9\nssh-copy-id user@server        # \u5c06\u516c\u94a5\u590d\u5236\u5230\u670d\u52a1\u5668\n# \u73b0\u5728\u65e0\u9700\u8f93\u5165\u5bc6\u7801\u5373\u53ef SSH\n</code></pre> <ul> <li>SSH \u914d\u7f6e\uff08<code>~/.ssh/config</code>\uff09\u4fdd\u5b58\u8fde\u63a5\u8be6\u60c5\uff1a</li> </ul> <pre><code>Host gpu-server\n    HostName 10.0.1.42\n    User henry\n    IdentityFile ~/.ssh/gpu_key\n    LocalForward 8888 localhost:8888\n</code></pre> <ul> <li> <p>\u73b0\u5728\u8f93\u5165 <code>ssh gpu-server</code> \u5373\u53ef\u81ea\u52a8\u4f7f\u7528\u6240\u6709\u8fd9\u4e9b\u8bbe\u7f6e\u8fdb\u884c\u8fde\u63a5\u3002</p> </li> <li> <p><code>scp</code> \u548c <code>rsync</code> \u5728\u673a\u5668\u4e4b\u95f4\u4f20\u8f93\u6587\u4ef6\uff1a</p> </li> </ul> <pre><code>scp model.pt user@server:/data/models/     # \u5c06\u6587\u4ef6\u590d\u5236\u5230\u8fdc\u7a0b\nscp -r user@server:/data/results/ ./       # \u4ece\u8fdc\u7a0b\u590d\u5236\u76ee\u5f55\nrsync -avz --progress data/ user@server:/data/  # \u5e26\u8fdb\u5ea6\u540c\u6b65\uff08\u6bd4 scp \u66f4\u667a\u80fd\uff09\n</code></pre>"},{"location":"chapter%2015%3A%20production%20software%20engineering/01.%20linux%20and%20CMD/#_11","title":"\u673a\u5668\u5b66\u4e60\u5fc5\u5907\u547d\u4ee4\u901f\u67e5\u8868","text":"<pre><code># GPU \u76d1\u63a7\nnvidia-smi                                   # GPU \u4f7f\u7528\u5feb\u7167\nwatch -n 1 nvidia-smi                        # \u5b9e\u65f6\u76d1\u63a7\ngpustat                                      # \u66f4\u6e05\u6670\u7684 GPU \u6982\u89c8\uff08pip install gpustat\uff09\n\n# \u8bad\u7ec3\u7ba1\u7406\nnohup python train.py &gt; train.log 2&gt;&amp;1 &amp;     # \u9000\u51fa\u767b\u5f55\u540e\u4ecd\u5b58\u6d3b\u7684\u540e\u53f0\u8bad\u7ec3\ntail -f train.log                            # \u76d1\u63a7\u8bad\u7ec3\u8f93\u51fa\nkill %1                                      # \u7ec8\u6b62\u6700\u540e\u4e00\u4e2a\u540e\u53f0\u4efb\u52a1\n\n# \u78c1\u76d8\u4f7f\u7528\uff08\u6570\u636e\u96c6\u5f88\u5927\uff09\ndf -h                                        # \u6240\u6709\u6302\u8f7d\u70b9\u7684\u78c1\u76d8\u7a7a\u95f4\ndu -sh /data/*                               # /data \u4e2d\u6bcf\u4e2a\u9879\u76ee\u7684\u5927\u5c0f\ndu -sh --max-depth=1 .                       # \u5b50\u76ee\u5f55\u7684\u5927\u5c0f\n\n# \u5185\u5b58\nfree -h                                      # RAM \u4f7f\u7528\u60c5\u51b5\ncat /proc/meminfo                            # \u8be6\u7ec6\u5185\u5b58\u4fe1\u606f\n\n# \u7f51\u7edc\ncurl -O https://example.com/dataset.tar.gz   # \u4e0b\u8f7d\u6587\u4ef6\nwget https://example.com/model.bin           # \u66ff\u4ee3\u4e0b\u8f7d\u5de5\u5177\ncurl -X POST http://localhost:8080/predict \\\n    -H \"Content-Type: application/json\" \\\n    -d '{\"text\": \"hello\"}'                   # \u6d4b\u8bd5\u6a21\u578b\u63a8\u7406\u7aef\u70b9\n\n# \u5f52\u6863\ntar -czf archive.tar.gz directory/           # \u538b\u7f29\ntar -xzf archive.tar.gz                      # \u89e3\u538b\nzip -r archive.zip directory/                # zip \u538b\u7f29\nunzip archive.zip                            # zip \u89e3\u538b\n\n# \u5feb\u901f\u6570\u636e\u68c0\u67e5\nhead -5 data.csv                             # CSV \u7684\u524d 5 \u884c\nwc -l data.csv                               # \u7edf\u8ba1\u884c\u6570\ncut -d',' -f1 data.csv | sort -u | wc -l    # \u7edf\u8ba1\u7b2c 1 \u5217\u7684\u552f\u4e00\u503c\u6570\u91cf\n</code></pre>"},{"location":"chapter%2015%3A%20production%20software%20engineering/02.%20git%20and%20repository%20management/","title":"Git \u4e0e\u7248\u672c\u63a7\u5236","text":"<p>Git \u662f\u8f6f\u4ef6\u56e2\u961f\u5728\u4e0d\u76f8\u4e92\u8986\u76d6\u5de5\u4f5c\u7684\u60c5\u51b5\u4e0b\u8fdb\u884c\u534f\u4f5c\u7684\u65b9\u5f0f\u3002\u672c\u6587\u6db5\u76d6 Git \u7684\u5fc3\u667a\u6a21\u578b\u3001\u5206\u652f\u7b56\u7565\u3001\u5408\u5e76\u4e0e\u53d8\u57fa\u3001\u51b2\u7a81\u89e3\u51b3\u3001\u62c9\u53d6\u8bf7\u6c42\uff0c\u4ee5\u53ca\u7ba1\u7406\u673a\u5668\u5b66\u4e60\u7279\u5b9a\u6311\u6218\uff08\u5982\u5927\u6587\u4ef6\u548c\u5b9e\u9a8c\u8ffd\u8e2a\uff09\u7684\u65b9\u6cd5\u3002</p> <ul> <li> <p>\u6bcf\u4e2a\u4e25\u8083\u7684\u8f6f\u4ef6\u9879\u76ee\u90fd\u4f7f\u7528\u7248\u672c\u63a7\u5236\u3002Git \u662f\u4e3b\u5bfc\u7cfb\u7edf\uff0c\u51e0\u4e4e\u6240\u6709\u5f00\u6e90\u9879\u76ee\u548c\u516c\u53f8\u90fd\u5728\u4f7f\u7528\u3002\u6ca1\u6709 Git\uff0c\u534f\u4f5c\u5c31\u662f\u901a\u8fc7\u7535\u5b50\u90ae\u4ef6\u53d1\u9001 zip \u6587\u4ef6\u5e76\u7948\u7977\u6ca1\u4eba\u8986\u76d6\u4f60\u7684\u66f4\u6539\u3002\u6709\u4e86 Git\uff0c\u6bcf\u6b21\u66f4\u6539\u90fd\u53ef\u8ffd\u8e2a\u3001\u53ef\u64a4\u9500\u3001\u53ef\u8ffd\u6eaf\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u673a\u5668\u5b66\u4e60\u5de5\u7a0b\u5e08\uff1aGit \u8ffd\u8e2a\u4f60\u7684\u4ee3\u7801\u3001\u914d\u7f6e\u548c\u5b9e\u9a8c\u811a\u672c\u3002\u7ed3\u5408\u5b9e\u9a8c\u8ffd\u8e2a\u5de5\u5177\uff0c\u5b83\u80fd\u63d0\u4f9b\u53ef\u91cd\u73b0\u6027\uff1a\"\u662f\u54ea\u4e2a\u786e\u5207\u7684\u4ee3\u7801\u548c\u914d\u7f6e\u4ea7\u751f\u4e86\u8fd9\u4e2a\u6a21\u578b\uff1f\"</p> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/02.%20git%20and%20repository%20management/#_1","title":"\u5fc3\u667a\u6a21\u578b","text":"<ul> <li> <p>Git \u8ffd\u8e2a\u9879\u76ee\u7684\u5feb\u7167\u3002\u6bcf\u6b21\u63d0\u4ea4\u90fd\u662f\u90a3\u4e00\u523b\u6240\u6709\u8ffd\u8e2a\u6587\u4ef6\u7684\u5b8c\u6574\u5feb\u7167\uff0c\u800c\u4e0d\u662f\u5dee\u5f02\uff08\u5728\u5185\u90e8\uff0cGit \u4e3a\u6548\u7387\u5b58\u50a8\u5dee\u5f02\uff0c\u4f46\u4ece\u6982\u5ff5\u4e0a\u8bb2\uff0c\u6bcf\u6b21\u63d0\u4ea4\u90fd\u662f\u4e00\u4e2a\u5b8c\u6574\u72b6\u6001\uff09\u3002</p> </li> <li> <p>\u6587\u4ef6\u7684\u56db\u4e2a\"\u4f4d\u7f6e\"\uff1a</p> <ol> <li>\u5de5\u4f5c\u76ee\u5f55\uff1a\u78c1\u76d8\u4e0a\u7684\u5b9e\u9645\u6587\u4ef6\u3002\u4f60\u5728\u8fd9\u91cc\u7f16\u8f91\u3002</li> <li>\u6682\u5b58\u533a\uff08\u7d22\u5f15\uff09\uff1a\u4f60\u6807\u8bb0\u4e3a\u4e0b\u4e00\u6b21\u63d0\u4ea4\u7684\u6587\u4ef6\u3002<code>git add</code> \u5c06\u66f4\u6539\u79fb\u5230\u8fd9\u91cc\u3002</li> <li>\u672c\u5730\u4ed3\u5e93\uff1a\u4f60\u7684\u63d0\u4ea4\u5386\u53f2\uff0c\u5b58\u50a8\u5728 <code>.git/</code> \u4e2d\u3002<code>git commit</code> \u5c06\u6682\u5b58\u533a\u4fdd\u5b58\u4e3a\u65b0\u7684\u5feb\u7167\u3002</li> <li>\u8fdc\u7a0b\u4ed3\u5e93\uff08\u4f8b\u5982 GitHub\uff09\uff1a\u4e00\u4e2a\u5171\u4eab\u526f\u672c\u3002<code>git push</code> \u4e0a\u4f20\u4f60\u7684\u63d0\u4ea4\uff0c<code>git pull</code> \u4e0b\u8f7d\u4ed6\u4eba\u7684\u63d0\u4ea4\u3002</li> </ol> </li> </ul> <pre><code>Working Dir  \u2192  git add  \u2192  Staging  \u2192  git commit  \u2192  Local Repo  \u2192  git push  \u2192  Remote\n                                                        \u2190  git pull  \u2190\n</code></pre> <ul> <li>\u6682\u5b58\u533a\u6b63\u662f Git \u5f3a\u5927\u4e4b\u5904\u3002\u4f60\u53ef\u4ee5\u7f16\u8f91 10 \u4e2a\u6587\u4ef6\uff0c\u4f46\u53ea\u63d0\u4ea4\u5176\u4e2d\u7684 3 \u4e2a\uff0c\u5c06\u5176\u4ed6\u66f4\u6539\u4fdd\u7559\u7ed9\u53e6\u4e00\u6b21\u63d0\u4ea4\u3002\u8fd9\u4f7f\u5f97\u6e05\u6670\u7684\u3001\u6709\u91cd\u70b9\u7684\u63d0\u4ea4\u6210\u4e3a\u53ef\u80fd\u3002</li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/02.%20git%20and%20repository%20management/#_2","title":"\u57fa\u672c\u547d\u4ee4","text":"<pre><code>git init                          # \u521b\u5efa\u65b0\u4ed3\u5e93\ngit clone url                     # \u4e0b\u8f7d\u8fdc\u7a0b\u4ed3\u5e93\ngit status                        # \u6709\u4ec0\u4e48\u53d8\u5316\uff1f\uff08\u6700\u5e38\u7528\u7684\u547d\u4ee4\uff09\ngit add file.py                   # \u6682\u5b58\u7279\u5b9a\u6587\u4ef6\ngit add .                         # \u6682\u5b58\u6240\u6709\u66f4\u6539\uff08\u8c28\u614e\u4f7f\u7528\uff09\ngit commit -m \"descriptive msg\"   # \u63d0\u4ea4\u6682\u5b58\u7684\u66f4\u6539\ngit push                          # \u5c06\u63d0\u4ea4\u4e0a\u4f20\u5230\u8fdc\u7a0b\ngit pull                          # \u4e0b\u8f7d\u5e76\u5408\u5e76\u8fdc\u7a0b\u66f4\u6539\ngit log --oneline                 # \u7d27\u51d1\u7684\u63d0\u4ea4\u5386\u53f2\ngit diff                          # \u663e\u793a\u672a\u6682\u5b58\u7684\u66f4\u6539\ngit diff --staged                 # \u663e\u793a\u5df2\u6682\u5b58\u7684\u66f4\u6539\n</code></pre>"},{"location":"chapter%2015%3A%20production%20software%20engineering/02.%20git%20and%20repository%20management/#_3","title":"\u5206\u652f","text":"<ul> <li>\u5206\u652f\u662f\u6307\u5411\u4e00\u6b21\u63d0\u4ea4\u7684\u6307\u9488\u3002\u9ed8\u8ba4\u5206\u652f\u662f <code>main</code>\uff08\u6216 <code>master</code>\uff09\u3002\u521b\u5efa\u5206\u652f\u8ba9\u4f60\u62e5\u6709\u72ec\u7acb\u7684\u5f00\u53d1\u7ebf\uff1a\u4f60\u53ef\u4ee5\u5728\u4e0d\u5f71\u54cd <code>main</code> \u7684\u60c5\u51b5\u4e0b\u8fdb\u884c\u66f4\u6539\u3002</li> </ul> <pre><code>git branch feature-x              # \u521b\u5efa\u5206\u652f\ngit checkout feature-x            # \u5207\u6362\u5230\u6b64\u5206\u652f\ngit checkout -b feature-x         # \u521b\u5efa\u5e76\u5207\u6362\uff08\u4e00\u6b65\u5b8c\u6210\uff09\ngit branch -d feature-x           # \u5220\u9664\u5206\u652f\uff08\u5408\u5e76\u540e\uff09\ngit branch -a                     # \u5217\u51fa\u6240\u6709\u5206\u652f\uff08\u672c\u5730 + \u8fdc\u7a0b\uff09\n</code></pre> <ul> <li>\u4f55\u65f6\u5206\u652f\uff1a\u59cb\u7ec8\u9700\u8981\u3002\u6c38\u8fdc\u4e0d\u8981\u76f4\u63a5\u63d0\u4ea4\u5230 <code>main</code>\u3002\u6bcf\u4e2a\u529f\u80fd\u3001\u9519\u8bef\u4fee\u590d\u6216\u5b9e\u9a8c\u90fd\u6709\u5176\u81ea\u5df1\u7684\u5206\u652f\u3002\u8fd9\u4fdd\u6301\u4e86 <code>main</code> \u7684\u7a33\u5b9a\u6027\u548c\u53ef\u90e8\u7f72\u6027\u3002</li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/02.%20git%20and%20repository%20management/#_4","title":"\u5206\u652f\u7b56\u7565","text":"<ul> <li> <p>\u529f\u80fd\u5206\u652f\uff08\u6700\u5e38\u89c1\uff09\uff1a\u6bcf\u4e2a\u529f\u80fd/\u4fee\u590d\u4ece <code>main</code> \u521b\u5efa\u4e00\u4e2a\u5206\u652f\u3002\u5b8c\u6210\u540e\uff0c\u6253\u5f00\u62c9\u53d6\u8bf7\u6c42\uff08PR\uff09\u4ee5\u5408\u5e76\u56de\u53bb\u3002\u7b80\u5355\uff0c\u9002\u7528\u4e8e\u5927\u591a\u6570\u56e2\u961f\u3002</p> </li> <li> <p>\u4e3b\u5e72\u5f00\u53d1\uff1a\u5f00\u53d1\u4eba\u5458\u9891\u7e41\uff08\u6bcf\u5929\u591a\u6b21\uff09\u63d0\u4ea4\u5230 <code>main</code>\uff0c\u4f7f\u7528\u7279\u6027\u6807\u8bb0\u9690\u85cf\u672a\u5b8c\u6210\u7684\u5de5\u4f5c\u3002\u6301\u7eed\u90e8\u7f72\u7684\u56e2\u961f\uff08Google\u3001Facebook\uff09\u66f4\u504f\u597d\u8fd9\u79cd\u65b9\u5f0f\u3002\u9700\u8981\u4f18\u79c0\u7684 CI/CD\u3002</p> </li> <li> <p>Gitflow\uff1a\u4e3a\u529f\u80fd\u3001\u53d1\u5e03\u548c\u70ed\u4fee\u590d\u8bbe\u7f6e\u5355\u72ec\u7684\u5206\u652f\u3002\u66f4\u590d\u6742\uff0c\u9002\u7528\u4e8e\u6709\u7248\u672c\u5316\u53d1\u5e03\u7684\u8f6f\u4ef6\uff08\u79fb\u52a8\u5e94\u7528\u3001\u6253\u5305\u8f6f\u4ef6\uff09\u3002\u5bf9\u5927\u591a\u6570\u673a\u5668\u5b66\u4e60\u9879\u76ee\u6765\u8bf4\u8fc7\u4e8e\u590d\u6742\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u673a\u5668\u5b66\u4e60\u56e2\u961f\uff1a\u529f\u80fd\u5206\u652f\u914d\u5408\u77ed\u751f\u547d\u5468\u671f\u7684\u5206\u652f\uff081-3 \u5929\u5185\u5408\u5e76\uff09\u662f\u6700\u4f73\u9009\u62e9\u3002\u751f\u547d\u5468\u671f\u957f\u7684\u5206\u652f\u4f1a\u4e0e <code>main</code> \u4ea7\u751f\u5206\u6b67\uff0c\u5bfc\u81f4\u75db\u82e6\u7684\u5408\u5e76\u51b2\u7a81\u3002</p> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/02.%20git%20and%20repository%20management/#_5","title":"\u5408\u5e76\u4e0e\u53d8\u57fa","text":"<ul> <li>\u5408\u5e76\u521b\u5efa\u4e00\u4e2a\u65b0\u7684\"\u5408\u5e76\u63d0\u4ea4\"\uff0c\u5c06\u4e24\u4e2a\u5206\u652f\u5408\u5e76\uff1a</li> </ul> <pre><code>git checkout main\ngit merge feature-x\n</code></pre> <ul> <li> <p>\u8fd9\u4fdd\u7559\u4e86\u5b8c\u6574\u7684\u5386\u53f2\u8bb0\u5f55\uff1a\u4f60\u53ef\u4ee5\u770b\u5230\u5de5\u4f5c\u662f\u5728\u5206\u652f\u4e0a\u5b8c\u6210\u7684\uff0c\u4ee5\u53ca\u4f55\u65f6\u5408\u5e76\u7684\u3002\u5408\u5e76\u63d0\u4ea4\u6709\u4e24\u4e2a\u7236\u8282\u70b9\u3002</p> </li> <li> <p>\u53d8\u57fa\u5728\u4f60\u7684\u5206\u652f\u4e0a\u91cd\u653e\u63d0\u4ea4\u5230\u76ee\u6807\u5206\u652f\u4e4b\u4e0a\uff1a</p> </li> </ul> <pre><code>git checkout feature-x\ngit rebase main\n</code></pre> <ul> <li> <p>\u8fd9\u4f1a\u91cd\u5199\u5386\u53f2\uff1a\u4f60\u7684\u5206\u652f\u4e0a\u7684\u63d0\u4ea4\u4f1a\u83b7\u5f97\u65b0\u7684\u54c8\u5e0c\u503c\uff0c\u5c31\u597d\u50cf\u4f60\u662f\u4ece <code>main</code> \u7684\u5f53\u524d\u9876\u7aef\u5f00\u59cb\u5de5\u4f5c\u4e00\u6837\u3002\u7ed3\u679c\u662f\u7ebf\u6027\u7684\u5386\u53f2\u8bb0\u5f55\uff08\u6ca1\u6709\u5408\u5e76\u63d0\u4ea4\uff09\uff0c\u9605\u8bfb\u8d77\u6765\u66f4\u6e05\u6670\u3002</p> </li> <li> <p>\u4f55\u65f6\u4f7f\u7528\u54ea\u79cd\uff1a</p> <ul> <li>\u53d8\u57fa\u7528\u4e8e\u4f7f\u7528\u6700\u65b0\u7684 <code>main</code> \u66f4\u6539\u66f4\u65b0\u4f60\u7684\u529f\u80fd\u5206\u652f\uff08\u4fdd\u6301\u5206\u652f\u6574\u6d01\u548c\u6700\u65b0\uff09\u3002</li> <li>\u5408\u5e76\u7528\u4e8e\u5c06\u4f60\u7684\u529f\u80fd\u5206\u652f\u96c6\u6210\u5230 <code>main</code>\uff08\u4fdd\u7559\u5206\u652f\u5386\u53f2\uff09\u3002</li> <li>\u6c38\u8fdc\u4e0d\u8981\u53d8\u57fa\u5df2\u7ecf\u63a8\u9001\u5e76\u4e0e\u4ed6\u4eba\u5171\u4eab\u7684\u63d0\u4ea4\u3002\u53d8\u57fa\u4f1a\u91cd\u5199\u5386\u53f2\uff1b\u5982\u679c\u5176\u4ed6\u4eba\u5df2\u7ecf\u57fa\u4e8e\u539f\u59cb\u63d0\u4ea4\u5f00\u5c55\u5de5\u4f5c\uff0c\u53d8\u57fa\u4f1a\u5bfc\u81f4\u6df7\u4e71\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/02.%20git%20and%20repository%20management/#_6","title":"\u89e3\u51b3\u51b2\u7a81","text":"<ul> <li>\u51b2\u7a81\u53d1\u751f\u5728\u4e24\u4e2a\u5206\u652f\u4fee\u6539\u540c\u4e00\u6587\u4ef6\u7684\u540c\u4e00\u884c\u65f6\u3002Git \u65e0\u6cd5\u81ea\u52a8\u51b3\u5b9a\u4fdd\u7559\u54ea\u4e2a\u66f4\u6539\uff0c\u9700\u8981\u4f60\u624b\u52a8\u89e3\u51b3\u3002</li> </ul> <pre><code>&lt;&lt;&lt;&lt;&lt;&lt;&lt; HEAD\nlearning_rate = 0.001\n=======\nlearning_rate = 0.0005\n&gt;&gt;&gt;&gt;&gt;&gt;&gt; feature-x\n</code></pre> <ul> <li> <p><code>&lt;&lt;&lt;&lt;&lt;&lt;&lt; HEAD</code> \u548c <code>=======</code> \u4e4b\u95f4\u662f\u5f53\u524d\u5206\u652f\u7684\u7248\u672c\u3002<code>=======</code> \u548c <code>&gt;&gt;&gt;&gt;&gt;&gt;&gt; feature-x</code> \u4e4b\u95f4\u662f\u4f20\u5165\u5206\u652f\u7684\u7248\u672c\u3002\u4f60\u51b3\u5b9a\u4fdd\u7559\u54ea\u4e2a\uff08\u6216\u7ec4\u5408\u5b83\u4eec\uff09\uff0c\u5220\u9664\u6807\u8bb0\uff0c\u4fdd\u5b58\uff0c\u7136\u540e\u8fd0\u884c <code>git add</code> \u6dfb\u52a0\u5df2\u89e3\u51b3\u7684\u6587\u4ef6\u3002</p> </li> <li> <p>\u9677\u9631\uff1a\u4e0d\u8981\u5728\u5df2\u63d0\u4ea4\u7684\u6587\u4ef6\u4e2d\u7559\u4e0b\u51b2\u7a81\u6807\u8bb0\u3002\u5b83\u4eec\u662f\u4f1a\u7834\u574f\u4f60\u4ee3\u7801\u7684\u5b57\u9762\u6587\u672c\u3002\u89e3\u51b3\u540e\u59cb\u7ec8\u641c\u7d22 <code>&lt;&lt;&lt;&lt;&lt;&lt;&lt;</code>\u3002</p> </li> <li> <p>\u51cf\u5c11\u51b2\u7a81\uff1a\u4fdd\u6301\u5206\u652f\u77ed\u751f\u547d\u5468\u671f\uff0c\u9891\u7e41\u5c06 <code>main</code> \u5408\u5e76\u5230\u4f60\u7684\u5206\u652f\u4e2d\uff0c\u907f\u514d\u591a\u4eba\u540c\u65f6\u7f16\u8f91\u540c\u4e00\u4e2a\u6587\u4ef6\u3002</p> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/02.%20git%20and%20repository%20management/#_7","title":"\u7f16\u5199\u826f\u597d\u7684\u63d0\u4ea4\u4fe1\u606f","text":"<ul> <li> <p>\u63d0\u4ea4\u4fe1\u606f\u662f\u4e3a\u4e86\u672a\u6765\u7684\u4f60\u548c\u4f60\u7684\u961f\u53cb\u3002\"\u4fee\u590d\u9519\u8bef\"\u544a\u8bc9\u4e0d\u4e86\u4f60\u4ec0\u4e48\u3002\"\u4fee\u590d\u6279\u6b21\u5927\u5c0f\u8ba1\u7b97\u4e2d\u7684\u5dee\u4e00\u9519\u8bef\uff0c\u8be5\u9519\u8bef\u5bfc\u81f4 8-GPU \u8bad\u7ec3\u65f6 OOM\"\u544a\u8bc9\u4f60\u4e00\u5207\u3002</p> </li> <li> <p>\u683c\u5f0f\uff1a</p> </li> </ul> <pre><code>\u7b80\u77ed\u6458\u8981\uff0850 \u5b57\u4ee5\u5185\uff0c\u7948\u4f7f\u8bed\u6c14\uff09\n\n\u5982\u679c\u9700\u8981\uff0c\u53ef\u9644\u5e26\u66f4\u957f\u7684\u63cf\u8ff0\u3002\u89e3\u91ca WHY\uff0c\u800c\u4e0d\u662f WHAT\n\uff08\u5dee\u5f02\u663e\u793a\u4e86\u4ec0\u4e48\u6539\u53d8\u4e86\uff09\u3002\u6bcf\u884c\u4e0d\u8d85\u8fc7 72 \u4e2a\u5b57\u7b26\u3002\n\nFixes #123\n</code></pre> <ul> <li> <p>\u7948\u4f7f\u8bed\u6c14\uff1a\"\u6dfb\u52a0\u529f\u80fd\"\u800c\u4e0d\u662f\"\u5df2\u6dfb\u52a0\u529f\u80fd\"\u6216\"\u6dfb\u52a0\u4e86\u529f\u80fd\"\u3002\u5c06\u5176\u89c6\u4e3a\u5b8c\u6210\u53e5\u5b50\uff1a\"\u5982\u679c\u5e94\u7528\u6b64\u63d0\u4ea4\uff0c\u5b83\u5c06\u6dfb\u52a0\u529f\u80fd\u3002\"</p> </li> <li> <p>\u539f\u5b50\u63d0\u4ea4\uff1a\u6bcf\u4e2a\u63d0\u4ea4\u5e94\u505a\u4e00\u4ef6\u4e8b\u3002\"\u6dfb\u52a0\u6570\u636e\u52a0\u8f7d\u5668\"\u662f\u4e00\u4e2a\u63d0\u4ea4\u3002\"\u6dfb\u52a0\u6570\u636e\u52a0\u8f7d\u5668\u5e76\u4fee\u590d\u65e0\u5173\u7684\u9519\u8bef\u5e76\u66f4\u65b0 README\"\u5e94\u8be5\u662f\u4e09\u4e2a\u63d0\u4ea4\u3002\u8fd9\u4f7f\u5f97 <code>git bisect</code>\uff08\u627e\u5230\u54ea\u4e2a\u63d0\u4ea4\u5f15\u5165\u4e86\u9519\u8bef\uff09\u6210\u4e3a\u53ef\u80fd\u3002</p> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/02.%20git%20and%20repository%20management/#_8","title":"\u62c9\u53d6\u8bf7\u6c42\u4e0e\u4ee3\u7801\u5ba1\u67e5","text":"<ul> <li> <p>\u62c9\u53d6\u8bf7\u6c42\uff08PR\uff09\u63d0\u8bae\u5c06\u4e00\u4e2a\u5206\u652f\u5408\u5e76\u5230 <code>main</code>\u3002\u5b83\u662f\u4ee3\u7801\u5ba1\u67e5\u7684\u95e8\u6237\uff1a\u961f\u53cb\u9605\u8bfb\u4f60\u7684\u66f4\u6539\uff0c\u63d0\u51fa\u6539\u8fdb\u5efa\u8bae\uff0c\u5e76\u5728\u5408\u5e76\u524d\u6279\u51c6\u3002</p> </li> <li> <p>\u826f\u597d\u7684 PR \u5b9e\u8df5\uff1a</p> <ul> <li>\u4fdd\u6301 PR \u5c0f\uff08\u5c11\u4e8e 400 \u884c\u66f4\u6539\uff09\u3002\u5927\u7684 PR \u4f1a\u88ab\u6577\u884d\u6279\u51c6\uff0c\u56e0\u4e3a\u6ca1\u4eba\u60f3\u5ba1\u67e5 2000 \u884c\u3002</li> <li>\u7f16\u5199\u6e05\u6670\u7684\u63cf\u8ff0\uff1a\u66f4\u6539\u4e86\u4ec0\u4e48\u3001\u4e3a\u4ec0\u4e48\u4ee5\u53ca\u5982\u4f55\u6d4b\u8bd5\u3002</li> <li>\u94fe\u63a5\u5230\u4fc3\u4f7f\u66f4\u6539\u7684\u95ee\u9898\u6216\u5de5\u5355\u3002</li> <li>\u53ca\u65f6\u56de\u590d\u5ba1\u67e5\u8bc4\u8bba\u3002</li> <li>\u5728\u5408\u5e76\u524d\u538b\u7f29\u7410\u788e\u7684\u63d0\u4ea4\uff08\u8fd9\u6837 <code>main</code> \u5c31\u6709\u5e72\u51c0\u7684\u5386\u53f2\u8bb0\u5f55\uff09\u3002</li> </ul> </li> <li> <p>\u4ee3\u7801\u5ba1\u67e5\u4e0d\u662f\u4e3a\u4e86\u627e\u9519\u8bef\uff08\u6d4b\u8bd5\u6765\u505a\u8fd9\u4e2a\uff09\u3002\u5b83\u7684\u76ee\u7684\u662f\uff1a\u77e5\u8bc6\u5206\u4eab\uff08\u5ba1\u67e5\u8005\u5b66\u4e60\u4ee3\u7801\u5e93\uff09\u3001\u8bbe\u8ba1\u53cd\u9988\uff08\u8fd9\u662f\u6b63\u786e\u7684\u65b9\u6cd5\u5417\uff1f\uff09\u548c\u7ef4\u62a4\u6807\u51c6\uff08\u547d\u540d\u3001\u98ce\u683c\u3001\u67b6\u6784\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/02.%20git%20and%20repository%20management/#gitignore","title":".gitignore","text":"<ul> <li><code>.gitignore</code> \u6587\u4ef6\u544a\u8bc9 Git \u6392\u9664\u54ea\u4e9b\u6587\u4ef6\u4e0d\u88ab\u8ffd\u8e2a\u3002\u5bf9\u4e8e\u673a\u5668\u5b66\u4e60\u9879\u76ee\uff1a</li> </ul> <pre><code># Python\n__pycache__/\n*.pyc\n*.egg-info/\n.venv/\nenv/\n\n# \u6570\u636e\u548c\u6a21\u578b\uff08\u5bf9 git \u6765\u8bf4\u592a\u5927\uff09\ndata/\n*.csv\n*.parquet\nmodels/\n*.pt\n*.onnx\n*.bin\ncheckpoints/\n\n# \u5bc6\u94a5\n.env\n*.pem\ncredentials.json\n\n# IDE\n.vscode/\n.idea/\n*.swp\n\n# \u64cd\u4f5c\u7cfb\u7edf\n.DS_Store\nThumbs.db\n\n# Jupyter\n.ipynb_checkpoints/\n\n# \u5b9e\u9a8c\u8f93\u51fa\nwandb/\nmlruns/\noutputs/\nlogs/\n</code></pre> <ul> <li>\u9677\u9631\uff1a\u5728\u6587\u4ef6\u5df2\u88ab\u63d0\u4ea4\u540e\u5c06\u6587\u4ef6\u6dfb\u52a0\u5230 <code>.gitignore</code> \u4e0d\u4f1a\u5c06\u5176\u4ece\u4ed3\u5e93\u4e2d\u79fb\u9664\u3002\u4f60\u8fd8\u5fc5\u987b\u4f7f\u7528 <code>git rm --cached file</code> \u6765\u53d6\u6d88\u8ffd\u8e2a\u3002\u8be5\u6587\u4ef6\u4f1a\u6c38\u8fdc\u7559\u5728\u5386\u53f2\u4e2d\uff0c\u9664\u975e\u4f60\u91cd\u5199\u5386\u53f2\uff08\u8fd9\u5f88\u9ebb\u70e6\uff09\u3002</li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/02.%20git%20and%20repository%20management/#git_1","title":"Git \u5728\u673a\u5668\u5b66\u4e60\u4e2d\u7684\u5e94\u7528","text":"<ul> <li> <p>\u673a\u5668\u5b66\u4e60\u5f15\u5165\u4e86\u4f20\u7edf\u8f6f\u4ef6\u4e0d\u9762\u4e34\u7684\u6311\u6218\uff1a</p> </li> <li> <p>\u5927\u6587\u4ef6\uff1a\u6570\u636e\u96c6\u548c\u6a21\u578b\u6743\u91cd\u53ef\u80fd\u6709\u6570 GB \u6216\u66f4\u5927\u3002Git \u662f\u4e3a\u6587\u672c\u6587\u4ef6\uff08\u6e90\u4ee3\u7801\uff09\u8bbe\u8ba1\u7684\uff0c\u800c\u4e0d\u662f\u4e8c\u8fdb\u5236 blob\u3002\u89e3\u51b3\u65b9\u6848\uff1a</p> <ul> <li>Git LFS\uff08\u5927\u6587\u4ef6\u5b58\u50a8\uff09\uff1a\u5728 Git \u4e2d\u8ffd\u8e2a\u6307\u9488\uff0c\u5c06\u5b9e\u9645\u6587\u4ef6\u5b58\u50a8\u5728\u5355\u72ec\u7684\u670d\u52a1\u5668\u4e0a\u3002\u7b80\u5355\uff0c\u4f46\u5728 GitHub \u4e0a\u6709\u9650\u5236\u5b58\u50a8/\u5e26\u5bbd\u3002</li> <li>DVC\uff08\u6570\u636e\u7248\u672c\u63a7\u5236\uff09\uff1a\u5c06\u6570\u636e\u548c\u6a21\u578b\u6587\u4ef6\u4e0e Git \u5206\u5f00\u7ba1\u7406\uff0c\u4f7f\u7528\u8fdc\u7a0b\u5b58\u50a8\uff08S3\u3001GCS\uff09\u3002\u50cf Git \u4e00\u6837\u7528\u4e8e\u6570\u636e\uff1a<code>dvc add data.csv</code>\u3001<code>dvc push</code>\u3001<code>dvc pull</code>\u3002</li> </ul> </li> <li> <p>\u5b9e\u9a8c\u8ffd\u8e2a\uff1a\u54ea\u4e2a\u63d0\u4ea4 + \u54ea\u4e9b\u8d85\u53c2\u6570 + \u54ea\u4e2a\u6570\u636e\u4ea7\u751f\u4e86\u54ea\u4e9b\u6307\u6807\uff1fGit \u8ffd\u8e2a\u4ee3\u7801\uff0c\u4f46\u4e0d\u8ffd\u8e2a\u5b8c\u6574\u7684\u5b9e\u9a8c\u4e0a\u4e0b\u6587\u3002</p> <ul> <li>Weights &amp; Biases\uff08W&amp;B\uff09\uff1a\u8bb0\u5f55\u6307\u6807\u3001\u8d85\u53c2\u6570\u3001\u7cfb\u7edf\u4fe1\u606f\uff0c\u5e76\u94fe\u63a5\u5230 Git \u63d0\u4ea4\u3002\u63d0\u4f9b\u7528\u4e8e\u6bd4\u8f83\u8fd0\u884c\u7ed3\u679c\u7684\u4eea\u8868\u677f\u3002</li> <li>MLflow\uff1a\u5f00\u6e90\u7684\u5b9e\u9a8c\u8ffd\u8e2a\uff0c\u5e26\u6709\u6a21\u578b\u6ce8\u518c\u8868\u3002\u8bb0\u5f55\u53c2\u6570\u3001\u6307\u6807\u548c\u4ea7\u7269\u3002</li> <li>\u7b80\u5355\u65b9\u6cd5\uff1a\u5728\u4f60\u7684\u8bad\u7ec3\u811a\u672c\u4e2d\u8bb0\u5f55 Git \u54c8\u5e0c\u503c\uff1a<code>git_hash = subprocess.check_output(['git', 'rev-parse', 'HEAD']).strip()</code>\u3002\u5c06\u5176\u4e0e\u4f60\u7684\u7ed3\u679c\u4e00\u8d77\u5b58\u50a8\u3002</li> </ul> </li> <li> <p>\u53ef\u91cd\u73b0\u6027\u68c0\u67e5\u6e05\u5355\uff08\u6bcf\u4e2a\u5b9e\u9a8c\u9700\u8981\u8ffd\u8e2a\u7684\u5185\u5bb9\uff09\uff1a</p> <ul> <li>Git \u63d0\u4ea4\u54c8\u5e0c\u503c\uff08\u786e\u5207\u7684\u4ee3\u7801\u7248\u672c\uff09</li> <li>\u914d\u7f6e\u6587\u4ef6 / \u8d85\u53c2\u6570</li> <li>\u968f\u673a\u79cd\u5b50</li> <li>Python \u548c\u5e93\u7248\u672c\uff08<code>pip freeze</code>\uff09</li> <li>\u6570\u636e\u7248\u672c\uff08DVC \u54c8\u5e0c\u503c\u6216\u6570\u636e\u96c6\u7248\u672c\u6807\u7b7e\uff09</li> <li>\u786c\u4ef6\uff08GPU \u7c7b\u578b\u3001GPU \u6570\u91cf\uff09</li> </ul> </li> </ul> <pre><code># \u5feb\u901f\u53ef\u91cd\u73b0\u6027\u5feb\u7167\necho \"Commit: $(git rev-parse HEAD)\" &gt; experiment_info.txt\necho \"Branch: $(git branch --show-current)\" &gt;&gt; experiment_info.txt\necho \"Dirty: $(git status --porcelain | wc -l) files\" &gt;&gt; experiment_info.txt\npip freeze &gt;&gt; experiment_info.txt\nnvidia-smi &gt;&gt; experiment_info.txt\n</code></pre>"},{"location":"chapter%2015%3A%20production%20software%20engineering/03.%20codebase%20design/","title":"\u4ee3\u7801\u5e93\u8bbe\u8ba1\u4e0e\u6a21\u5f0f","text":"<p>\u826f\u597d\u7684\u4ee3\u7801\u5e93\u8bbe\u8ba1\u662f\u533a\u5206\u7814\u7a76\u539f\u578b\u4e0e\u751f\u4ea7\u7ea7\u8f6f\u4ef6\u7684\u5173\u952e\u3002\u672c\u6587\u6db5\u76d6\u9879\u76ee\u7ed3\u6784\u3001\u6574\u6d01\u4ee3\u7801\u539f\u5219\u3001\u4e0e\u673a\u5668\u5b66\u4e60\u76f8\u5173\u7684\u8bbe\u8ba1\u6a21\u5f0f\u3001\u914d\u7f6e\u7ba1\u7406\u3001\u65e5\u5fd7\u3001API \u8bbe\u8ba1\u4ee5\u53ca\u6253\u5305\u5206\u53d1\u3002</p> <ul> <li> <p>\u5927\u591a\u6570\u673a\u5668\u5b66\u4e60\u4ee3\u7801\u59cb\u4e8e Jupyter notebook\u3002Notebook \u4e0d\u65ad\u589e\u957f\u3001\u88ab\u590d\u5236\u3001\u4fee\u6539\u3001\u5171\u4eab\uff0c\u6700\u7ec8\u53d8\u6210\u7531\u5168\u5c40\u53d8\u91cf\u3001\u6b7b\u5355\u5143\u683c\u548c\u9b54\u6570\u7ec4\u6210\u7684\u96be\u4ee5\u7ef4\u62a4\u7684\u6df7\u4e71\u3002\u4ee3\u7801\u5e93\u8bbe\u8ba1\u662f\u4e00\u95e8\u7ec4\u7ec7\u4ee3\u7801\u7684\u5b66\u79d1\uff0c\u4f7f\u4ee3\u7801\u5728\u9879\u76ee\u589e\u957f\u8fc7\u7a0b\u4e2d\u4fdd\u6301\u53ef\u7406\u89e3\u548c\u53ef\u4fee\u6539\u3002</p> </li> <li> <p>\u8fd9\u4e0d\u662f\u4e3a\u4e86\u9075\u5faa\u89c4\u5219\u800c\u9075\u5faa\u89c4\u5219\u3002\u800c\u662f\u4e3a\u4e86\u51cf\u5c11\u4ece\"\u6211\u60f3\u6539\u53d8 X\"\u5230\"X \u5df2\u88ab\u4fee\u6539\u5e76\u80fd\u6b63\u5e38\u5de5\u4f5c\"\u4e4b\u95f4\u7684\u65f6\u95f4\u3002\u5728\u7cbe\u5fc3\u8bbe\u8ba1\u7684\u4ee3\u7801\u5e93\u4e2d\uff0c\u8fd9\u4e2a\u65f6\u95f4\u662f\u51e0\u5206\u949f\u3002\u5728\u8bbe\u8ba1\u7cdf\u7cd5\u7684\u4ee3\u7801\u5e93\u4e2d\uff0c\u5219\u9700\u8981\u51e0\u5929\u7684\u65f6\u95f4\u53bb\u8003\u53e4\u3001\u7ffb\u9605\u672a\u8bb0\u5f55\u7684\u610f\u5927\u5229\u9762\u6761\u5f0f\u4ee3\u7801\u3002</p> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/03.%20codebase%20design/#_2","title":"\u9879\u76ee\u7ed3\u6784","text":"<ul> <li>\u4e00\u81f4\u7684\u9879\u76ee\u5e03\u5c40\u8ba9\u4efb\u4f55\u4eba\uff08\u5305\u62ec\u672a\u6765\u7684\u4f60\uff09\u90fd\u80fd\u7acb\u5373\u6d4f\u89c8\u4ee3\u7801\u5e93\u3002</li> </ul> <pre><code>my_project/\n\u251c\u2500\u2500 src/my_project/       # \u6e90\u4ee3\u7801\uff08\u53ef\u5bfc\u5165\u7684\u5305\uff09\n\u2502   \u251c\u2500\u2500 __init__.py\n\u2502   \u251c\u2500\u2500 data/             # \u6570\u636e\u52a0\u8f7d\u548c\u9884\u5904\u7406\n\u2502   \u2502   \u251c\u2500\u2500 __init__.py\n\u2502   \u2502   \u251c\u2500\u2500 dataset.py\n\u2502   \u2502   \u2514\u2500\u2500 transforms.py\n\u2502   \u251c\u2500\u2500 models/           # \u6a21\u578b\u67b6\u6784\n\u2502   \u2502   \u251c\u2500\u2500 __init__.py\n\u2502   \u2502   \u251c\u2500\u2500 transformer.py\n\u2502   \u2502   \u2514\u2500\u2500 layers.py\n\u2502   \u251c\u2500\u2500 training/         # \u8bad\u7ec3\u5faa\u73af\u3001\u4f18\u5316\u5668\n\u2502   \u2502   \u251c\u2500\u2500 __init__.py\n\u2502   \u2502   \u251c\u2500\u2500 trainer.py\n\u2502   \u2502   \u2514\u2500\u2500 losses.py\n\u2502   \u2514\u2500\u2500 utils/            # \u5171\u4eab\u5de5\u5177\n\u2502       \u251c\u2500\u2500 __init__.py\n\u2502       \u2514\u2500\u2500 logging.py\n\u251c\u2500\u2500 configs/              # \u914d\u7f6e\u6587\u4ef6\n\u2502   \u251c\u2500\u2500 base.yaml\n\u2502   \u2514\u2500\u2500 experiment_1.yaml\n\u251c\u2500\u2500 scripts/              # \u5165\u53e3\u70b9\uff08\u8bad\u7ec3\u3001\u8bc4\u4f30\u3001\u63a8\u7406\uff09\n\u2502   \u251c\u2500\u2500 train.py\n\u2502   \u251c\u2500\u2500 evaluate.py\n\u2502   \u2514\u2500\u2500 serve.py\n\u251c\u2500\u2500 tests/                # \u6d4b\u8bd5\u6587\u4ef6\uff08\u955c\u50cf src/ \u7ed3\u6784\uff09\n\u2502   \u251c\u2500\u2500 test_dataset.py\n\u2502   \u251c\u2500\u2500 test_model.py\n\u2502   \u2514\u2500\u2500 test_trainer.py\n\u251c\u2500\u2500 notebooks/            # \u4ec5\u7528\u4e8e\u63a2\u7d22\uff08\u975e\u751f\u4ea7\u4ee3\u7801\uff09\n\u251c\u2500\u2500 pyproject.toml        # \u9879\u76ee\u5143\u6570\u636e\u548c\u4f9d\u8d56\n\u251c\u2500\u2500 README.md\n\u251c\u2500\u2500 .gitignore\n\u2514\u2500\u2500 Dockerfile\n</code></pre> <ul> <li> <p><code>src/</code> \u5e03\u5c40\uff1a\u5c06\u6e90\u4ee3\u7801\u653e\u5728 <code>src/my_project/</code> \u4e0b\u53ef\u4ee5\u9632\u6b62\u4ece\u5f53\u524d\u76ee\u5f55\u610f\u5916\u5bfc\u5165\uff08\u8fd9\u4f1a\u63a9\u76d6\u5728\u751f\u4ea7\u73af\u5883\u4e2d\u624d\u4f1a\u66b4\u9732\u7684\u5bfc\u5165\u9519\u8bef\uff09\u3002\u4f7f\u7528 <code>pip install -e .</code> \u8fdb\u884c\u5f00\u53d1\u5b89\u88c5\u3002</p> </li> <li> <p>\u5355\u4ed3\u5e93 vs \u591a\u4ed3\u5e93\uff1a\u5355\u4ed3\u5e93\u5c06\u6240\u6709\u76f8\u5173\u9879\u76ee\u653e\u5728\u4e00\u4e2a\u4ed3\u5e93\u4e2d\uff08\u8de8\u9879\u76ee\u66f4\u6539\u66f4\u5bb9\u6613\u3001CI \u5171\u4eab\uff09\u3002\u591a\u4ed3\u5e93\u7ed9\u6bcf\u4e2a\u9879\u76ee\u81ea\u5df1\u7684\u4ed3\u5e93\uff08\u8fb9\u754c\u66f4\u6e05\u6670\u3001\u7248\u672c\u63a7\u5236\u72ec\u7acb\uff09\u3002\u5927\u591a\u6570\u673a\u5668\u5b66\u4e60\u56e2\u961f\u4ece\u5355\u4ed3\u5e93\u5f00\u59cb\uff0c\u5fc5\u8981\u65f6\u518d\u62c6\u5206\u3002</p> </li> <li> <p>\u811a\u672c vs \u5e93\uff1a\u5c06\u5165\u53e3\u70b9\uff08<code>train.py</code>\u3001<code>evaluate.py</code>\uff09\u4fdd\u7559\u5728 <code>scripts/</code> \u4e2d\u3002\u5c06\u53ef\u590d\u7528\u7684\u903b\u8f91\u653e\u5728 <code>src/</code> \u4e2d\u3002\u8bad\u7ec3\u811a\u672c\u5e94\u7ea6\u4e3a 50 \u884c\uff1a\u89e3\u6790\u914d\u7f6e\u3001\u6784\u5efa\u6570\u636e\u96c6\u3001\u6784\u5efa\u6a21\u578b\u3001\u6784\u5efa\u8bad\u7ec3\u5668\u3001\u8bad\u7ec3\u3002\u6240\u6709\u590d\u6742\u6027\u90fd\u5728\u5e93\u4e2d\u3002</p> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/03.%20codebase%20design/#_3","title":"\u6574\u6d01\u4ee3\u7801\u539f\u5219","text":"<ul> <li>\u547d\u540d\uff1a\u4f60\u80fd\u505a\u7684\u552f\u4e00\u6700\u6709\u5f71\u54cd\u529b\u7684\u4e8b\u60c5\u3002\u540d\u4e3a <code>x</code> \u7684\u53d8\u91cf\u9700\u8981\u4f60\u9605\u8bfb\u5468\u56f4\u7684\u4ee3\u7801\u624d\u80fd\u7406\u89e3\u3002\u540d\u4e3a <code>learning_rate</code> \u7684\u53d8\u91cf\u662f\u81ea\u89e3\u91ca\u7684\u3002</li> </ul> <pre><code># \u7cdf\u7cd5\ndef proc(d, n, lr):\n    for i in range(n):\n        for k, v in d.items():\n            v -= lr * g[k]\n\n# \u826f\u597d\ndef update_parameters(parameters, num_steps, learning_rate):\n    for step in range(num_steps):\n        for name, param in parameters.items():\n            param -= learning_rate * gradients[name]\n</code></pre> <ul> <li> <p>\u5355\u4e00\u804c\u8d23\u539f\u5219\uff1a\u6bcf\u4e2a\u51fd\u6570/\u7c7b\u53ea\u505a\u4e00\u4ef6\u4e8b\u3002\u540d\u4e3a <code>load_data_and_train_model</code> \u7684\u51fd\u6570\u5728\u505a\u4e24\u4ef6\u4e8b\uff0c\u5e94\u8be5\u62c6\u5206\u3002\u8fd9\u4f7f\u6bcf\u4e2a\u90e8\u5206\u90fd\u53ef\u4ee5\u72ec\u7acb\u6d4b\u8bd5\u3001\u590d\u7528\u548c\u7406\u89e3\u3002</p> </li> <li> <p>DRY\uff08\u4e0d\u8981\u91cd\u590d\u81ea\u5df1\uff09\u2014\u2014\u4f46\u4e0d\u8981\u8fc7\u65e9\u62bd\u8c61\u3002\u5982\u679c\u4f60\u590d\u5236\u7c98\u8d34\u4ee3\u7801\u4e09\u6b21\uff0c\u5c06\u5176\u63d0\u53d6\u4e3a\u4e00\u4e2a\u51fd\u6570\u3002\u4f46\u4e0d\u8981\u4e3a\u53ea\u4f7f\u7528\u8fc7\u4e00\u6b21\u7684\u4ee3\u7801\u521b\u5efa\u62bd\u8c61\u3002\u8fc7\u65e9\u7684\u62bd\u8c61\u6bd4\u91cd\u590d\u66f4\u7cdf\u7cd5\uff1a\u5b83\u589e\u52a0\u4e86\u590d\u6742\u6027\u4f46\u6ca1\u6709\u7ecf\u8fc7\u9a8c\u8bc1\u7684\u597d\u5904\u3002</p> </li> </ul> <pre><code># \u8fc7\u65e9\u62bd\u8c61\uff08\u4e00\u4e2a\u7528\u4f8b\uff0c\u8fc7\u5ea6\u8bbe\u8ba1\uff09\nclass AbstractDataTransformPipelineFactory:\n    ...\n\n# \u6070\u5230\u597d\u5904\uff08\u76f4\u63a5\u3001\u6e05\u6670\u3001\u5728\u4e09\u5904\u4f7f\u7528\uff09\ndef normalise_image(image, mean, std):\n    return (image - mean) / std\n</code></pre> <ul> <li>\u9b54\u6570\uff1a\u6c38\u8fdc\u4e0d\u8981\u4f7f\u7528\u672a\u89e3\u91ca\u7684\u5b57\u9762\u503c\u3002</li> </ul> <pre><code># \u7cdf\u7cd5\nif len(batch) &gt; 32:\n    split_batch(batch, 32)\n\n# \u826f\u597d\nMAX_BATCH_SIZE = 32\nif len(batch) &gt; MAX_BATCH_SIZE:\n    split_batch(batch, MAX_BATCH_SIZE)\n</code></pre> <ul> <li>\u51fd\u6570\u5e94\u8be5\u7b80\u77ed\uff1a\u5982\u679c\u4e00\u4e2a\u51fd\u6570\u4e0d\u80fd\u5728\u4e00\u5c4f\u5185\u663e\u793a\u5b8c\u6574\uff08\u7ea6 30 \u884c\uff09\uff0c\u90a3\u5b83\u53ef\u80fd\u505a\u5f97\u592a\u591a\u4e86\u3002\u5c06\u903b\u8f91\u5757\u63d0\u53d6\u4e3a\u5e26\u6709\u63cf\u8ff0\u6027\u540d\u79f0\u7684\u8f85\u52a9\u51fd\u6570\u3002\u7136\u540e\u51fd\u6570\u4f53\u8bfb\u8d77\u6765\u5c31\u50cf\u9ad8\u7ea7\u6458\u8981\u3002</li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/03.%20codebase%20design/#_4","title":"\u9002\u7528\u4e8e\u673a\u5668\u5b66\u4e60\u7684\u8bbe\u8303\u8ba1\u5f0f","text":"<ul> <li> <p>\u8bbe\u8ba1\u6a21\u5f0f\u662f\u9488\u5bf9\u5e38\u89c1\u95ee\u9898\u7684\u53ef\u590d\u7528\u89e3\u51b3\u65b9\u6848\u3002\u4ee5\u4e0b\u662f\u4e0e\u673a\u5668\u5b66\u4e60\u4ee3\u7801\u5e93\u6700\u76f8\u5173\u7684\u6a21\u5f0f\uff1a</p> </li> <li> <p>\u5de5\u5382\u6a21\u5f0f\uff1a\u5728\u4e0d\u6307\u5b9a\u786e\u5207\u7c7b\u7684\u60c5\u51b5\u4e0b\u521b\u5efa\u5bf9\u8c61\u3002\u5f53\u4f60\u7684\u914d\u7f6e\u8bf4 <code>model: \"transformer\"</code> \u5e76\u4e14\u4f60\u9700\u8981\u5b9e\u4f8b\u5316\u6b63\u786e\u7684\u7c7b\u65f6\u5f88\u6709\u7528\uff1a</p> </li> </ul> <pre><code>MODEL_REGISTRY = {\n    \"transformer\": TransformerModel,\n    \"cnn\": CNNModel,\n    \"mlp\": MLPModel,\n}\n\ndef build_model(config):\n    model_cls = MODEL_REGISTRY[config[\"model\"]]\n    return model_cls(**config[\"model_params\"])\n</code></pre> <ul> <li> <p>\u8fd9\u4f7f\u8bad\u7ec3\u811a\u672c\u4e0e\u7279\u5b9a\u7684\u6a21\u578b\u5b9e\u73b0\u89e3\u8026\u3002\u6dfb\u52a0\u65b0\u6a21\u578b\u610f\u5473\u7740\u5728\u6ce8\u518c\u8868\u4e2d\u6dfb\u52a0\u4e00\u884c\uff0c\u800c\u4e0d\u662f\u4fee\u6539\u8bad\u7ec3\u5faa\u73af\u3002</p> </li> <li> <p>\u7b56\u7565\u6a21\u5f0f\uff1a\u5728\u8fd0\u884c\u65f6\u4ea4\u6362\u7b97\u6cd5\u3002\u9002\u7528\u4e8e\u635f\u5931\u51fd\u6570\u3001\u4f18\u5316\u5668\u3001\u8c03\u5ea6\u5668\uff1a</p> </li> </ul> <pre><code>LOSS_FUNCTIONS = {\n    \"mse\": nn.MSELoss,\n    \"cross_entropy\": nn.CrossEntropyLoss,\n    \"focal\": FocalLoss,\n}\n\nloss_fn = LOSS_FUNCTIONS[config[\"loss\"]]()\n</code></pre> <ul> <li>\u89c2\u5bdf\u8005\u6a21\u5f0f\uff08\u56de\u8c03/\u94a9\u5b50\uff09\uff1a\u8ba9\u6a21\u5757\u54cd\u5e94\u4e8b\u4ef6\u800c\u4e0d\u7d27\u5bc6\u8026\u5408\u3002\u8bad\u7ec3\u6846\u67b6\uff08PyTorch Lightning\u3001Keras\uff09\u5e7f\u6cdb\u4f7f\u7528\u56de\u8c03\uff1a</li> </ul> <pre><code>class EarlyStopping:\n    def __init__(self, patience=5):\n        self.patience = patience\n        self.best_loss = float('inf')\n        self.counter = 0\n\n    def on_epoch_end(self, epoch, val_loss):\n        if val_loss &lt; self.best_loss:\n            self.best_loss = val_loss\n            self.counter = 0\n        else:\n            self.counter += 1\n            if self.counter &gt;= self.patience:\n                return \"stop\"\n</code></pre> <ul> <li>\u4f9d\u8d56\u6ce8\u5165\uff1a\u5c06\u4f9d\u8d56\u9879\u4f20\u5165\u51fd\u6570/\u7c7b\uff0c\u800c\u4e0d\u662f\u5728\u5185\u90e8\u521b\u5efa\u3002\u8fd9\u4f7f\u5f97\u6d4b\u8bd5\u53d8\u5f97\u5bb9\u6613\uff08\u6ce8\u5165 mock\uff09\u5e76\u4e14\u914d\u7f6e\u7075\u6d3b\uff1a</li> </ul> <pre><code># \u7cdf\u7cd5\uff1a\u786c\u7f16\u7801\u4f9d\u8d56\nclass Trainer:\n    def __init__(self):\n        self.logger = WandbLogger()  # \u6ca1\u6709 W&amp;B \u5c31\u65e0\u6cd5\u6d4b\u8bd5\n\n# \u826f\u597d\uff1a\u6ce8\u5165\u4f9d\u8d56\nclass Trainer:\n    def __init__(self, logger):\n        self.logger = logger  # \u53ef\u4ee5\u6ce8\u5165\u4efb\u4f55\u8bb0\u5f55\u5668\uff0c\u5305\u62ec mock\n</code></pre>"},{"location":"chapter%2015%3A%20production%20software%20engineering/03.%20codebase%20design/#_5","title":"\u914d\u7f6e\u7ba1\u7406","text":"<ul> <li> <p>\u786c\u7f16\u7801\u8d85\u53c2\u6570\u3001\u6587\u4ef6\u8def\u5f84\u548c\u6a21\u578b\u8bbe\u7f6e\u4f7f\u5b9e\u9a8c\u65e0\u6cd5\u91cd\u73b0\uff0c\u4fee\u6539\u4e5f\u5f88\u75db\u82e6\u3002\u5c06\u914d\u7f6e\u5916\u90e8\u5316\u5230\u6587\u4ef6\u4e2d\u3002</p> </li> <li> <p>YAML \u662f\u673a\u5668\u5b66\u4e60\u914d\u7f6e\u6700\u5e38\u89c1\u7684\u683c\u5f0f\uff1a</p> </li> </ul> <pre><code># configs/experiment_1.yaml\nmodel:\n  name: transformer\n  d_model: 512\n  n_heads: 8\n  n_layers: 6\n\ntraining:\n  batch_size: 64\n  learning_rate: 3e-4\n  max_epochs: 100\n  early_stopping_patience: 10\n\ndata:\n  train_path: /data/train.parquet\n  val_path: /data/val.parquet\n  max_seq_length: 512\n</code></pre> <ul> <li> <p>Hydra\uff08Facebook\uff09\u662f\u4e00\u4e2a\u652f\u6301\u7ec4\u5408\uff08\u5c06\u57fa\u7840\u914d\u7f6e\u4e0e\u5b9e\u9a8c\u7279\u5b9a\u8986\u76d6\u5408\u5e76\uff09\u3001\u547d\u4ee4\u884c\u8986\u76d6\uff08<code>python train.py training.lr=1e-3</code>\uff09\u548c\u591a\u8fd0\u884c\uff08\u8d85\u53c2\u6570\u626b\u63cf\uff09\u7684\u914d\u7f6e\u6846\u67b6\u3002</p> </li> <li> <p>argparse \u9002\u7528\u4e8e\u53c2\u6570\u8f83\u5c11\u7684\u811a\u672c\uff1a</p> </li> </ul> <pre><code>import argparse\n\nparser = argparse.ArgumentParser()\nparser.add_argument(\"--lr\", type=float, default=3e-4)\nparser.add_argument(\"--batch-size\", type=int, default=64)\nparser.add_argument(\"--config\", type=str, default=\"configs/base.yaml\")\nargs = parser.parse_args()\n</code></pre> <ul> <li>\u6700\u4f73\u5b9e\u8df5\uff1a\u6709\u4e00\u4e2a\u5305\u542b\u6240\u6709\u9ed8\u8ba4\u503c\u7684\u57fa\u7840\u914d\u7f6e\uff0c\u4ee5\u53ca\u6bcf\u4e2a\u5b9e\u9a8c\u7684\u914d\u7f6e\uff0c\u53ea\u8986\u76d6\u66f4\u6539\u7684\u90e8\u5206\u3002\u8ffd\u8e2a\u6bcf\u4e2a\u5b9e\u9a8c\u7684\u914d\u7f6e\u53ca\u5176\u7ed3\u679c\u3002</li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/03.%20codebase%20design/#_6","title":"\u65e5\u5fd7\u4e0e\u53ef\u89c2\u6d4b\u6027","text":"<ul> <li><code>print</code> \u8bed\u53e5\u7528\u4e8e\u8c03\u8bd5\u3002\u65e5\u5fd7\u7528\u4e8e\u751f\u4ea7\u73af\u5883\uff1a</li> </ul> <pre><code>import logging\n\nlogger = logging.getLogger(__name__)\nlogger.setLevel(logging.INFO)\n\nlogger.debug(\"Batch loaded: %d samples\", len(batch))     # \u8be6\u7ec6\uff0c\u7528\u4e8e\u8c03\u8bd5\nlogger.info(\"Epoch %d: loss=%.4f, lr=%.6f\", epoch, loss, lr)  # \u6b63\u5e38\u8fd0\u884c\nlogger.warning(\"GPU memory &gt;90%%, consider reducing batch size\")\nlogger.error(\"Failed to load checkpoint: %s\", path)       # \u53ef\u6062\u590d\u7684\u9519\u8bef\nlogger.critical(\"CUDA out of memory, aborting\")            # \u81f4\u547d\u9519\u8bef\n</code></pre> <ul> <li> <p>\u4e3a\u4ec0\u4e48\u4e0d\u7528 print\uff1a\u65e5\u5fd7\u652f\u6301\u7ea7\u522b\uff08\u5728\u751f\u4ea7\u73af\u5883\u4e2d\u8fc7\u6ee4\u8c03\u8bd5\u6d88\u606f\uff09\u3001\u683c\u5f0f\u5316\uff08\u65f6\u95f4\u6233\u3001\u6a21\u5757\u540d\uff09\u548c\u5904\u7406\u7a0b\u5e8f\uff08\u5199\u5165\u6587\u4ef6\u3001\u53d1\u9001\u5230\u76d1\u63a7\u7cfb\u7edf\uff09\uff0c\u800c\u65e0\u9700\u66f4\u6539\u65e5\u5fd7\u8c03\u7528\u3002</p> </li> <li> <p>\u7ed3\u6784\u5316\u65e5\u5fd7\u540c\u65f6\u8f93\u51fa\u673a\u5668\u53ef\u89e3\u6790\u7684\u683c\u5f0f\uff08JSON\uff09\u548c\u4eba\u7c7b\u53ef\u8bfb\u7684\u6d88\u606f\u3002\u8fd9\u4f7f\u5f97\u53ef\u4ee5\u641c\u7d22\u7279\u5b9a\u5b57\u6bb5\u5e76\u8bbe\u7f6e\u544a\u8b66\uff1a</p> </li> </ul> <pre><code>logger.info(\"training_step\", extra={\n    \"epoch\": 5, \"step\": 1200, \"loss\": 0.0342, \"lr\": 2.1e-4\n})\n</code></pre>"},{"location":"chapter%2015%3A%20production%20software%20engineering/03.%20codebase%20design/#api","title":"API \u8bbe\u8ba1","text":"<ul> <li> <p>\u5982\u679c\u4f60\u7684\u6a21\u578b\u5c06\u88ab\u5176\u4ed6\u670d\u52a1\u4f7f\u7528\uff08Web \u5e94\u7528\u3001\u79fb\u52a8\u5e94\u7528\u3001\u53e6\u4e00\u4e2a\u673a\u5668\u5b66\u4e60\u7ba1\u9053\uff09\uff0c\u5b83\u9700\u8981\u4e00\u4e2a API\uff08\u5e94\u7528\u7a0b\u5e8f\u7f16\u7a0b\u63a5\u53e3\uff09\u3002</p> </li> <li> <p>REST API \u4f7f\u7528 HTTP \u65b9\u6cd5\uff1a<code>GET</code> \u7528\u4e8e\u8bfb\u53d6\uff0c<code>POST</code> \u7528\u4e8e\u521b\u5efa/\u9884\u6d4b\uff0c<code>PUT</code> \u7528\u4e8e\u66f4\u65b0\uff0c<code>DELETE</code> \u7528\u4e8e\u5220\u9664\u3002\u7aef\u70b9\u9075\u5faa\u57fa\u4e8e\u8d44\u6e90\u7684\u547d\u540d\uff1a</p> </li> </ul> <pre><code>POST /api/v1/predict          # \u53d1\u9001\u8f93\u5165\uff0c\u83b7\u53d6\u9884\u6d4b\u7ed3\u679c\nGET  /api/v1/models           # \u5217\u51fa\u53ef\u7528\u6a21\u578b\nGET  /api/v1/models/{id}      # \u83b7\u53d6\u6a21\u578b\u8be6\u60c5\nPOST /api/v1/models/{id}/predict  # \u4f7f\u7528\u7279\u5b9a\u6a21\u578b\u8fdb\u884c\u9884\u6d4b\n</code></pre> <ul> <li>FastAPI \u662f\u673a\u5668\u5b66\u4e60\u63a8\u7406\u7684\u9996\u9009 Python \u6846\u67b6\uff1a</li> </ul> <pre><code>from fastapi import FastAPI\nfrom pydantic import BaseModel\n\napp = FastAPI()\n\nclass PredictRequest(BaseModel):\n    text: str\n\nclass PredictResponse(BaseModel):\n    label: str\n    confidence: float\n\n@app.post(\"/predict\", response_model=PredictResponse)\nasync def predict(request: PredictRequest):\n    result = model.predict(request.text)\n    return PredictResponse(label=result.label, confidence=result.score)\n</code></pre> <ul> <li> <p>FastAPI \u81ea\u52a8\u751f\u6210 API \u6587\u6863\uff08\u5728 <code>/docs</code> \u7684 Swagger UI\uff09\uff0c\u4f7f\u7528 Pydantic \u6a21\u578b\u9a8c\u8bc1\u8f93\u5165/\u8f93\u51fa\uff0c\u5e76\u652f\u6301\u5f02\u6b65\u4ee5\u5b9e\u73b0\u9ad8\u541e\u5410\u91cf\u3002</p> </li> <li> <p>gRPC \u5728\u5185\u90e8\u670d\u52a1\u95f4\u901a\u4fe1\u65b9\u9762\u6bd4 REST \u66f4\u5feb\u3002\u5b83\u4f7f\u7528 Protocol Buffers\uff08\u4e8c\u8fdb\u5236\u5e8f\u5217\u5316\uff0c\u6bd4 JSON \u66f4\u5c0f\u66f4\u5feb\uff09\u5e76\u652f\u6301\u6d41\u5f0f\u4f20\u8f93\u3002TensorFlow Serving\u3001Triton Inference Server \u548c\u8bb8\u591a\u5fae\u670d\u52a1\u67b6\u6784\u90fd\u4f7f\u7528\u5b83\u3002</p> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/03.%20codebase%20design/#_7","title":"\u6253\u5305\u4e0e\u5206\u53d1","text":"<ul> <li>\u8ba9\u4f60\u7684\u4ee3\u7801\u53ef\u4ee5\u4f5c\u4e3a\u5305\u5b89\u88c5\uff0c\u4f7f\u5176\u4ed6\u4eba\uff08\u548c\u4f60\u81ea\u5df1\u7684\u811a\u672c\uff09\u53ef\u4ee5\u5e72\u51c0\u5730\u5bfc\u5165\uff1a</li> </ul> <pre><code># pyproject.toml\n[project]\nname = \"my-ml-project\"\nversion = \"0.1.0\"\nrequires-python = \"&gt;=3.10\"\ndependencies = [\n    \"torch&gt;=2.0\",\n    \"jax&gt;=0.4\",\n    \"pydantic&gt;=2.0\",\n]\n\n[project.optional-dependencies]\ndev = [\"pytest\", \"ruff\", \"mypy\"]\n\n[build-system]\nrequires = [\"setuptools&gt;=64\"]\nbuild-backend = \"setuptools.backends._legacy:_Backend\"\n</code></pre> <pre><code>pip install -e \".[dev]\"    # \u4ee5\u53ef\u7f16\u8f91\u6a21\u5f0f\u5b89\u88c5\uff0c\u5305\u542b\u5f00\u53d1\u4f9d\u8d56\n</code></pre> <ul> <li> <p>\u53ef\u7f16\u8f91\u5b89\u88c5\uff08<code>-e</code>\uff09\uff1a\u5bf9\u6e90\u4ee3\u7801\u7684\u66f4\u6539\u4f1a\u7acb\u5373\u751f\u6548\uff0c\u65e0\u9700\u91cd\u65b0\u5b89\u88c5\u3002\u5f00\u53d1\u671f\u95f4\u5fc5\u4e0d\u53ef\u5c11\u3002</p> </li> <li> <p>\u9501\u5b9a\u4f9d\u8d56\uff1a\u4f7f\u7528\u786e\u5207\u7248\u672c\u7684 <code>requirements.txt</code>\uff08<code>torch==2.2.1</code>\uff0c\u800c\u4e0d\u662f <code>torch&gt;=2.0</code>\uff09\u786e\u4fdd\u53ef\u91cd\u73b0\u6027\u3002\u4f7f\u7528 <code>pip freeze &gt; requirements.txt</code> \u6355\u83b7\u4f60\u5f53\u524d\u7684\u73af\u5883\u3002\u5bf9\u4e8e\u66f4\u590d\u6742\u7684\u4f9d\u8d56\u7ba1\u7406\uff0c\u4f7f\u7528 <code>uv</code>\u3001<code>poetry</code> \u6216 <code>pip-tools</code>\u3002</p> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/03.%20codebase%20design/#ai","title":"\u4f7f\u7528 AI \u7f16\u7801\u52a9\u624b","text":"<ul> <li> <p>AI \u7f16\u7801\u52a9\u624b\uff08Claude Code\u3001GitHub Copilot\u3001Cursor \u7b49\uff09\u73b0\u5728\u5df2\u6210\u4e3a\u4e13\u4e1a\u5de5\u7a0b\u5e08\u5de5\u4f5c\u6d41\u7a0b\u7684\u4e00\u90e8\u5206\u3002\u4f7f\u7528\u5f97\u5f53\uff0c\u5b83\u4eec\u80fd\u6781\u5927\u52a0\u901f\u5f00\u53d1\u3002\u4f7f\u7528\u4e0d\u5f53\uff0c\u5b83\u4eec\u4f1a\u5f15\u5165\u5fae\u5999\u7684\u9519\u8bef\u3001\u4fb5\u8680\u4f60\u5bf9\u4ee3\u7801\u5e93\u7684\u7406\u89e3\uff0c\u5e76\u5236\u9020\u865a\u5047\u7684\u751f\u4ea7\u529b\u611f\u3002</p> </li> <li> <p>\u6b63\u786e\u7684\u5fc3\u667a\u6a21\u578b\uff1aAI \u52a9\u624b\u662f\u4e00\u4e2a\u5feb\u901f\u4f46\u7f3a\u4e4f\u7ecf\u9a8c\u7684\u7ed3\u5bf9\u7a0b\u5e8f\u5458\u3002\u5b83\u53ef\u4ee5\u5feb\u901f\u7f16\u5199\u4ee3\u7801\uff0c\u719f\u6089\u8bed\u6cd5\u548c\u6807\u51c6\u6a21\u5f0f\uff0c\u5e76\u4e14\u9605\u8bfb\u8fc7\u7684\u6587\u6863\u6bd4\u4f60\u8fd8\u591a\u3002\u4f46\u5b83\u4e0d\u4e86\u89e3\u4f60\u7684\u7279\u5b9a\u7cfb\u7edf\u3001\u4e1a\u52a1\u7ea6\u675f\u3001\u8fb9\u754c\u60c5\u51b5\u4ee5\u53ca\u8bbe\u8ba1\u51b3\u7b56\u80cc\u540e\u7684\u539f\u56e0\u3002\u4f60\u662f\u9ad8\u7ea7\u5de5\u7a0b\u5e08\uff1bAI \u52a9\u624b\u662f\u521d\u7ea7\u5de5\u7a0b\u5e08\u3002\u4f60\u6765\u6307\u5bfc\u3001\u5ba1\u67e5\u5e76\u627f\u62c5\u8d23\u4efb\u3002</p> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/03.%20codebase%20design/#ai_1","title":"AI \u52a9\u624b\u64c5\u957f\u4e4b\u5904","text":"<ul> <li> <p>\u6837\u677f\u4ee3\u7801\u548c\u811a\u624b\u67b6\uff1a\u751f\u6210 Dockerfile\u3001CI \u914d\u7f6e\u3001\u6d4b\u8bd5\u5939\u5177\u3001\u6570\u636e\u7c7b\u5b9a\u4e49\u3001argparse \u8bbe\u7f6e\u3002\u8fd9\u4e9b\u9075\u5faa\u4f17\u6240\u5468\u77e5\u7684\u6a21\u5f0f\uff0c\u624b\u52a8\u7f16\u5199\u5f88\u7e41\u7410\u3002\u8ba9 AI \u751f\u6210\u5b83\u4eec\uff0c\u7136\u540e\u5ba1\u67e5\u6b63\u786e\u6027\u3002</p> </li> <li> <p>\u7f16\u5199\u6d4b\u8bd5\uff1a\u63cf\u8ff0\u51fd\u6570\u7684\u884c\u4e3a\uff0cAI \u52a9\u624b\u751f\u6210\u6d4b\u8bd5\u7528\u4f8b\u3002\u5b83\u901a\u5e38\u4f1a\u6355\u6349\u5230\u4f60\u53ef\u80fd\u4f1a\u9057\u6f0f\u7684\u8fb9\u754c\u60c5\u51b5\uff08\u7a7a\u8f93\u5165\u3001\u8d1f\u503c\u3001Unicode\uff09\u3002\u59cb\u7ec8\u9605\u8bfb\u751f\u6210\u7684\u6d4b\u8bd5\u2014\u2014\u5b83\u4eec\u9a8c\u8bc1\u7684\u662f\u4f60\u7684\u5047\u8bbe\uff0c\u800c\u4e0d\u4ec5\u4ec5\u662f\u4f60\u7684\u4ee3\u7801\u3002</p> </li> <li> <p>\u91cd\u6784\uff1a\"\u5c06\u8fd9\u4e2a\u5757\u63d0\u53d6\u6210\u51fd\u6570\"\u3001\"\u5c06\u8fd9\u4e2a\u7c7b\u6539\u4e3a\u4f7f\u7528 dataclasses\"\u3001\"\u7ed9\u8fd9\u4e2a\u6a21\u5757\u6dfb\u52a0\u7c7b\u578b\u63d0\u793a\"\u3002\u673a\u68b0\u6027\u7684\u8f6c\u6362\uff0c\u610f\u56fe\u660e\u786e\uff0c\u5f15\u5165\u7ec6\u5fae\u9519\u8bef\u7684\u98ce\u9669\u8f83\u4f4e\u3002</p> </li> <li> <p>\u63a2\u7d22\u548c\u539f\u578b\u5f00\u53d1\uff1a\"\u5199\u4e00\u4e2a\u5feb\u901f\u811a\u672c\u6765 benchmark \u63a8\u7406\u5ef6\u8fdf\"\u6216\"\u5c55\u793a\u5982\u4f55\u4f7f\u7528 HuggingFace tokeniser API\"\u3002AI \u52a9\u624b\u80fd\u6bd4\u9605\u8bfb\u6587\u6863\u66f4\u5feb\u5730\u7ed9\u4f60\u4e00\u4e2a\u53ef\u7528\u7684\u8d77\u70b9\u3002</p> </li> <li> <p>\u6587\u6863\u548c docstrings\uff1aAI \u52a9\u624b\u53ef\u4ee5\u6839\u636e\u4f60\u7684\u4ee3\u7801\u7ed3\u6784\u751f\u6210\u6587\u6863\u3002\u4f60\u9700\u8981\u5ba1\u67e5\u51c6\u786e\u6027\uff0c\u4f46\u82e6\u529b\u6d3b\u5df2\u7ecf\u81ea\u52a8\u5316\u4e86\u3002</p> </li> <li> <p>\u8c03\u8bd5\u8f85\u52a9\uff1a\u7c98\u8d34\u9519\u8bef\u56de\u6eaf\u4fe1\u606f\u5e76\u8bf7\u6c42\u8bca\u65ad\u3002AI \u52a9\u624b\u901a\u5e38\u80fd\u8bc6\u522b\u6839\u672c\u539f\u56e0\u5e76\u63d0\u51fa\u4fee\u590d\u5efa\u8bae\uff0c\u5c24\u5176\u662f\u5bf9\u4e8e\u5e38\u89c1\u95ee\u9898\uff08\u5f62\u72b6\u4e0d\u5339\u914d\u3001\u5bfc\u5165\u9519\u8bef\u3001CUDA \u5185\u5b58\u4e0d\u8db3\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/03.%20codebase%20design/#ai_2","title":"\u4f55\u65f6\u4e0d\u5e94\u4f9d\u8d56 AI \u52a9\u624b","text":"<ul> <li> <p>\u65b0\u9896\u7684\u67b6\u6784\u51b3\u7b56\uff1a\u5982\u679c\u4f60\u6b63\u5728\u8bbe\u8ba1\u4e00\u4e2a\u65b0\u7684\u8bad\u7ec3\u7ba1\u9053\uff0cAI \u52a9\u624b\u4f1a\u7ed9\u51fa\u4e00\u4e2a\u901a\u7528\u7684\u7b54\u6848\u3002\u5b83\u4e0d\u4e86\u89e3\u4f60\u7684\u6570\u636e\u7ea6\u675f\u3001\u5ef6\u8fdf\u8981\u6c42\u6216\u56e2\u961f\u4e13\u4e1a\u77e5\u8bc6\u3002\u4f7f\u7528 AI \u52a9\u624b\u6765\u5b9e\u73b0\u4f60\u5df2\u7ecf\u6df1\u601d\u719f\u8651\u7684\u8bbe\u8ba1\u3002</p> </li> <li> <p>\u5b89\u5168\u5173\u952e\u4ee3\u7801\uff1a\u8ba4\u8bc1\u3001\u52a0\u5bc6\u3001\u8f93\u5165\u6e05\u7406\u3002AI \u52a9\u624b\u53ef\u80fd\u751f\u6210\u770b\u8d77\u6765\u6b63\u786e\u4f46\u5b58\u5728\u7ec6\u5fae\u6f0f\u6d1e\u7684\u4ee3\u7801\uff08SQL \u6ce8\u5165\u3001\u4e0d\u5b89\u5168\u7684\u9ed8\u8ba4\u503c\u3001\u65f6\u5e8f\u653b\u51fb\uff09\u3002\u5b89\u5168\u4ee3\u7801\u5e94\u7531\u7406\u89e3\u5a01\u80c1\u6a21\u578b\u7684\u4eba\u7f16\u5199\uff0c\u5e76\u7531\u53e6\u4e00\u4e2a\u4eba\u5ba1\u67e5\u3002</p> </li> <li> <p>\u6027\u80fd\u5173\u952e\u7684\u5185\u5faa\u73af\uff1aAI \u52a9\u624b\u4f1a\u7f16\u5199\u6b63\u786e\u4f46\u5929\u771f\u7684\u4ee3\u7801\u3002\u5bf9\u4e8e GPU \u5185\u6838\u3001\u5185\u5b58\u5173\u952e\u7684\u6570\u636e\u7ed3\u6784\u6216\u5ef6\u8fdf\u654f\u611f\u7684\u63a8\u7406\u8def\u5f84\uff0c\u4f60\u9700\u8981\u7406\u89e3\u786c\u4ef6\u7ea6\u675f\uff08\u7b2c 13 \u7ae0\u3001\u7b2c 16 \u7ae0\uff09\u5e76\u6709\u76ee\u7684\u5730\u8fdb\u884c\u4f18\u5316\u3002</p> </li> <li> <p>\u4f60\u4e0d\u7406\u89e3\u7684\u4ee3\u7801\uff1a\u5982\u679c AI \u52a9\u624b\u751f\u6210\u4e86 200 \u884c\u4ee3\u7801\uff0c\u800c\u4f60\u65e0\u6cd5\u89e3\u91ca\u6bcf\u4e00\u884c\u7684\u4f5c\u7528\uff0c\u90a3\u5c31\u4e0d\u8981\u63d0\u4ea4\u3002\u4f60\u73b0\u5728\u6b63\u5728\u7ef4\u62a4\u4f60\u4e0d\u7406\u89e3\u7684\u4ee3\u7801\uff0c\u5f53\u5b83\u51fa\u95ee\u9898\u65f6\uff08\u5b83\u4f1a\u7684\uff09\uff0c\u4f60\u65e0\u6cd5\u8c03\u8bd5\u3002\u8fd9\u662f\u6700\u5e38\u89c1\u4e5f\u6700\u5371\u9669\u7684\u5931\u8d25\u6a21\u5f0f\u3002</p> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/03.%20codebase%20design/#_8","title":"\u5ba1\u67e5\u7eaa\u5f8b","text":"<ul> <li> <p>\u5728\u63d0\u4ea4\u524d\u59cb\u7ec8\u9010\u884c\u9605\u8bfb\u751f\u6210\u7684\u4ee3\u7801\u3002\u8fd9\u4e0d\u662f\u53ef\u9009\u7684\u3002AI \u52a9\u624b\u7684\u4ee3\u7801\u662f\u8349\u7a3f\uff0c\u4e0d\u662f\u6210\u54c1\u3002\u5c31\u50cf\u5bf9\u5f85\u540c\u4e8b\u7684\u62c9\u53d6\u8bf7\u6c42\u4e00\u6837\uff1a\u6279\u5224\u6027\u5730\u5ba1\u67e5\u5b83\u3002</p> </li> <li> <p>\u68c0\u67e5\u4ec0\u4e48\uff1a</p> <ul> <li>\u6b63\u786e\u6027\uff1a\u5b83\u662f\u5426\u771f\u7684\u505a\u4e86\u4f60\u8981\u6c42\u7684\u4e8b\u60c5\uff1fAI \u52a9\u624b\u7ecf\u5e38\u89e3\u51b3\u4e0e\u4f60\u610f\u56fe\u7565\u6709\u4e0d\u540c\u7684\u95ee\u9898\u3002</li> <li>\u8fb9\u754c\u60c5\u51b5\uff1a\u5b83\u662f\u5426\u5904\u7406\u4e86\u7a7a\u8f93\u5165\u3001None \u503c\u3001\u8d1f\u6570\u3001\u975e\u5e38\u5927\u7684\u8f93\u5165\uff1fAI \u52a9\u624b\u7ecf\u5e38\u7701\u7565\u8fb9\u754c\u60c5\u51b5\u5904\u7406\u3002</li> <li>\u5e7b\u60f3\u7684 API\uff1aAI \u52a9\u624b\u53ef\u80fd\u8c03\u7528\u4e0d\u5b58\u5728\u51fd\u6570\u6216\u4f7f\u7528\u4e0d\u5b58\u5728\u7684\u53c2\u6570\uff0c\u5c24\u5176\u662f\u5bf9\u4e8e\u8f83\u65b0\u6216\u8f83\u5c11\u4f7f\u7528\u7684\u5e93\u3002\u9a8c\u8bc1\u6bcf\u4e2a API \u8c03\u7528\u662f\u5426\u771f\u5b9e\u5b58\u5728\u3002</li> <li>\u8fc7\u5ea6\u5de5\u7a0b\uff1aAI \u52a9\u624b\u503e\u5411\u4e8e\u4ea7\u751f\u6bd4\u5fc5\u8981\u66f4\u591a\u7684\u4ee3\u7801\u3002\u4e00\u4e2a 50 \u884c\u7684\u89e3\u51b3\u65b9\u6848\u89e3\u51b3\u4e00\u4e2a 10 \u884c\u7684\u95ee\u9898\uff0c\u589e\u52a0\u4e86\u4e0d\u5fc5\u8981\u7684\u590d\u6742\u6027\u3002\u65e0\u60c5\u5730\u7b80\u5316\u3002</li> <li>\u5b89\u5168\u6027\uff1a\u786c\u7f16\u7801\u7684\u5bc6\u94a5\u3001\u672a\u7ecf\u6e05\u7406\u7684\u7528\u6237\u8f93\u5165\u3001\u4e0d\u5b89\u5168\u7684\u9ed8\u8ba4\u503c\u3002AI \u52a9\u624b\u4e0d\u4f1a\u4ee5\u5bf9\u6297\u6027\u601d\u7ef4\u601d\u8003\u3002</li> <li>\u98ce\u683c\u4e00\u81f4\u6027\uff1a\u751f\u6210\u7684\u4ee3\u7801\u662f\u5426\u4e0e\u9879\u76ee\u7684\u7ea6\u5b9a\u4e00\u81f4\uff08\u547d\u540d\u3001\u6a21\u5f0f\u3001\u9519\u8bef\u5904\u7406\uff09\uff1f</li> </ul> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/03.%20codebase%20design/#_9","title":"\u5982\u4f55\u7f16\u5199\u597d\u7684\u63d0\u793a\u8bcd","text":"<ul> <li> <p>AI \u52a9\u624b\u8f93\u51fa\u7684\u8d28\u91cf\u76f4\u63a5\u4e0e\u4f60\u7684\u6307\u4ee4\u8d28\u91cf\u6210\u6b63\u6bd4\u3002\u6a21\u7cca\u7684\u63d0\u793a\u8bcd\u5f97\u5230\u6a21\u7cca\u7684\u4ee3\u7801\u3002</p> </li> <li> <p>\u7cdf\u7cd5\uff1a\"\u5199\u4e00\u4e2a\u6570\u636e\u52a0\u8f7d\u5668\"</p> </li> <li> <p>\u597d\uff1a\"\u4e3a\u4e00\u4e2a\u5305\u542b'text'\u548c'label'\u5217\u7684 CSV \u6587\u4ef6\u7f16\u5199\u4e00\u4e2a PyTorch DataLoader\u3002\u4f7f\u7528 HuggingFace tokeniser 'bert-base-uncased' \u5bf9\u6587\u672c\u8fdb\u884c\u5206\u8bcd\uff0cmax_length=512\u3002\u8fd4\u56de input_ids\u3001attention_mask \u548c label \u4f5c\u4e3a\u5f20\u91cf\u3002\u5904\u7406 CSV \u4e2d\u6807\u7b7e\u5217\u6709\u7f3a\u5931\u503c\u7684\u60c5\u51b5\uff0c\u8df3\u8fc7\u90a3\u4e9b\u884c\u3002\"</p> </li> <li> <p>\u63d0\u4f9b\u4e0a\u4e0b\u6587\uff1a\u544a\u8bc9 AI \u52a9\u624b\u4f60\u7684\u9879\u76ee\u7ed3\u6784\u3001\u73b0\u6709\u4ee3\u7801\u3001\u7ea6\u675f\u548c\u7ea6\u5b9a\u3002\u4e0a\u4e0b\u6587\u8d8a\u591a\uff0c\u8f93\u51fa\u8d8a\u597d\u3002</p> </li> <li> <p>\u6307\u5b9a\u7ea6\u675f\uff1a\"\u53ea\u4f7f\u7528\u6807\u51c6\u5e93\"\u3001\"\u5fc5\u987b\u517c\u5bb9 Python 3.10\"\u3001\"\u4e0d\u8981\u4f7f\u7528\u5168\u5c40\u53d8\u91cf\"\u3001\"\u9075\u5faa <code>src/models/transformer.py</code> \u4e2d\u7684\u73b0\u6709\u6a21\u5f0f\"\u3002</p> </li> <li> <p>\u8981\u6c42\u89e3\u91ca\uff1a\"\u5b9e\u73b0 X \u5e76\u89e3\u91ca\u5173\u952e\u7684\u8bbe\u8ba1\u51b3\u7b56\u3002\"\u8fd9\u4f1a\u8feb\u4f7f AI \u52a9\u624b\u9610\u8ff0\u5176\u63a8\u7406\uff0c\u4f7f\u4f60\u66f4\u5bb9\u6613\u53d1\u73b0\u9519\u8bef\u5047\u8bbe\u3002</p> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/03.%20codebase%20design/#ai_3","title":"\u4f7f\u7528\u8d28\u91cf\u95e8\u63a7\u6765\u6355\u6349 AI \u52a9\u624b\u7684\u9519\u8bef","text":"<ul> <li> <p>\u4f60\u73b0\u6709\u7684\u8d28\u91cf\u57fa\u7840\u8bbe\u65bd\uff08\u6587\u4ef6 04\uff09\u6355\u6349 AI \u52a9\u624b\u7684\u9519\u8bef\u4e0e\u6355\u6349\u4eba\u7c7b\u7684\u9519\u8bef\u540c\u6837\u6709\u6548\uff1a</p> <ul> <li>\u7c7b\u578b\u68c0\u67e5\uff08mypy\uff09\uff1a\u6355\u6349\u5e7b\u60f3\u7684 API \u7b7e\u540d\u548c\u7c7b\u578b\u4e0d\u5339\u914d\u3002</li> <li>\u4ee3\u7801\u68c0\u67e5\uff08ruff\uff09\uff1a\u6355\u6349\u672a\u4f7f\u7528\u7684\u5bfc\u5165\u3001\u672a\u5b9a\u4e49\u7684\u53d8\u91cf\u548c\u98ce\u683c\u8fdd\u89c4\u3002</li> <li>\u6d4b\u8bd5\uff08pytest\uff09\uff1a\u5982\u679c AI \u52a9\u624b\u7684\u4ee3\u7801\u901a\u8fc7\u4e86\u4f60\u7684\u6d4b\u8bd5\u5957\u4ef6\uff0c\u5b83\u66f4\u53ef\u80fd\u662f\u6b63\u786e\u7684\u3002\u5982\u679c\u4f60\u8fd8\u6ca1\u6709\u6d4b\u8bd5\uff0c\u5728\u8981\u6c42 AI \u52a9\u624b\u5b9e\u73b0\u529f\u80fd\u4e4b\u524d\u5148\u7f16\u5199\u6d4b\u8bd5\uff08\u6d4b\u8bd5\u9a71\u52a8\u5f00\u53d1\u4e0e AI \u52a9\u624b\u914d\u5408\u5f97\u7279\u522b\u597d\uff09\u3002</li> <li>CI \u7ba1\u9053\uff1a\u5728\u6bcf\u6b21\u63d0\u4ea4\u65f6\u81ea\u52a8\u8fd0\u884c\u4e0a\u8ff0\u6240\u6709\u68c0\u67e5\u3002</li> </ul> </li> <li> <p>\"AI \u52a9\u624b\u5199\u4ee3\u7801\" + \"\u8d28\u91cf\u95e8\u63a7\u9a8c\u8bc1\" \u7684\u7ec4\u5408\u6bd4\u5355\u72ec\u4f7f\u7528\u4efb\u4f55\u4e00\u79cd\u90fd\u66f4\u9ad8\u6548\u3002AI \u52a9\u624b\u5feb\u901f\u4f46\u8349\u7387\uff1b\u95e8\u63a7\u5de5\u5177\u5f7b\u5e95\u4f46\u4e0d\u5199\u4ee3\u7801\u3002\u4e24\u8005\u7ed3\u5408\uff0c\u4f60\u540c\u65f6\u83b7\u5f97\u901f\u5ea6\u548c\u6b63\u786e\u6027\u3002</p> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/03.%20codebase%20design/#_10","title":"\u751f\u4ea7\u529b\u9677\u9631","text":"<ul> <li> <p>\u4f7f\u7528\u7f16\u7801\u52a9\u624b\u7684\u6700\u5927\u98ce\u9669\u662f\u751f\u4ea7\u529b\u7684\u5e7b\u89c9\u3002\u4f60\u53ef\u4ee5\u5728 10 \u5206\u949f\u5185\u751f\u6210 500 \u884c\u4ee3\u7801\u3002\u4f46\u5982\u679c\u4f60\u82b1 2 \u5c0f\u65f6\u8c03\u8bd5\u8fd9\u4e9b\u4f60\u5e76\u4e0d\u7406\u89e3\u7684 500 \u884c\u4ee3\u7801\uff0c\u90a3\u8fd8\u4e0d\u5982\u81ea\u5df1\u82b1 30 \u5206\u949f\u5199 200 \u884c\u4ee3\u7801\u6765\u5f97\u5feb\u3002</p> </li> <li> <p>\u4f7f\u7528 AI \u52a9\u624b\u7684\u771f\u6b63\u751f\u4ea7\u529b\u6765\u81ea\uff1a</p> <ol> <li>\u4fdd\u6301\u63a7\u5236\uff1a\u4f60\u51b3\u5b9a\u67b6\u6784\uff0cAI \u52a9\u624b\u586b\u5165\u5b9e\u73b0\u3002</li> <li>\u7406\u89e3\u751f\u6210\u7684\u5185\u5bb9\uff1a\u5982\u679c\u4f60\u65e0\u6cd5\u89e3\u91ca\u5b83\uff0c\u5c31\u91cd\u5199\u5b83\u6216\u8ba9 AI \u52a9\u624b\u7b80\u5316\u5b83\u3002</li> <li>\u6295\u8d44\u8d28\u91cf\u95e8\u63a7\uff1a\u6d4b\u8bd5\u3001\u7c7b\u578b\u548c\u4ee3\u7801\u68c0\u67e5\u7684\u6210\u672c\u901a\u8fc7\u6bcf\u6b21 AI \u4ea4\u4e92\u5206\u644a\u3002</li> <li>\u5229\u7528 AI \u52a9\u624b\u5f25\u8865\u4f60\u7684\u5f31\u70b9\uff1a\u5982\u679c\u4f60\u64c5\u957f\u7b97\u6cd5\u4f46\u7f16\u5199\u6d4b\u8bd5\u5f88\u6162\uff0c\u8ba9 AI \u52a9\u624b\u5199\u6d4b\u8bd5\u3002\u5982\u679c\u4f60\u5bf9 UI \u4ee3\u7801\u5f88\u5feb\u4f46\u4e0d\u719f\u6089\u6570\u636e\u5e93\u67e5\u8be2\uff0c\u8ba9 AI \u52a9\u624b\u8349\u62df SQL\u3002\u53d1\u6325\u4f60\u7684\u4f18\u52bf\uff0c\u59d4\u6258\u4f60\u7684\u77ed\u677f\u3002</li> </ol> </li> <li> <p>\u4ece\u7f16\u7801\u52a9\u624b\u4e2d\u83b7\u76ca\u6700\u591a\u7684\u5de5\u7a0b\u5e08\u662f\u90a3\u4e9b\u5df2\u7ecf\u64c5\u957f\u7f16\u7801\u7684\u4eba\u3002AI \u52a9\u624b\u653e\u5927\u4f60\u73b0\u6709\u7684\u6280\u80fd\uff1b\u5b83\u4e0d\u4f1a\u53d6\u4ee3\u4f60\u7684\u6280\u80fd\u3002\u7406\u89e3\u6570\u636e\u7ed3\u6784\u3001\u7b97\u6cd5\u3001\u7cfb\u7edf\u8bbe\u8ba1\u548c\u8f6f\u4ef6\u5de5\u7a0b\uff08\u6574\u7ae0\u7684\u5185\u5bb9\uff09\u8ba9\u4f60\u80fd\u591f\u6709\u6548\u5730\u6307\u5bfc AI \u52a9\u624b\u5e76\u6279\u5224\u6027\u5730\u8bc4\u4f30\u5176\u8f93\u51fa\u3002</p> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/04.%20testing%20and%20quality%20assurance/","title":"\u6d4b\u8bd5\u4e0e\u8d28\u91cf\u4fdd\u969c","text":"<p>\u6d4b\u8bd5\u662f\u4f60\u5982\u4f55\u786e\u4fdd\u4ee3\u7801\u6b63\u5e38\u5de5\u4f5c\u7684\u65b9\u6cd5\u2014\u2014\u4e0d\u4ec5\u662f\u73b0\u5728\uff0c\u800c\u4e14\u5728\u6bcf\u6b21\u66f4\u6539\u540e\u90fd\u80fd\u6b63\u5e38\u5de5\u4f5c\u3002\u672c\u6587\u6db5\u76d6\u6d4b\u8bd5\u91d1\u5b57\u5854\u3001\u4f7f\u7528 pytest \u8fdb\u884c\u7684\u5355\u5143\u6d4b\u8bd5\u3001Mock\u3001\u6d4b\u8bd5\u673a\u5668\u5b66\u4e60\u7279\u5b9a\u4ee3\u7801\u3001CI/CD \u7ba1\u9053\u3001\u4ee3\u7801\u68c0\u67e5\u3001\u683c\u5f0f\u5316\u548c\u4ee3\u7801\u5ba1\u67e5\u2014\u2014\u8fd9\u4e9b\u5b9e\u8df5\u80fd\u5728\u9519\u8bef\u5230\u8fbe\u751f\u4ea7\u73af\u5883\u4e4b\u524d\u6355\u83b7\u5b83\u4eec\u3002</p> <ul> <li> <p>\u673a\u5668\u5b66\u4e60\u4ee3\u7801\u4ee5\u7f3a\u4e4f\u6d4b\u8bd5\u800c\u95fb\u540d\u3002\"\u80fd\u8bad\u7ec3\uff0c\u6240\u4ee5\u80fd\u5de5\u4f5c\"\u662f\u666e\u904d\u6001\u5ea6\u3002\u8fd9\u4f1a\u5bfc\u81f4\u9759\u9ed8\u9519\u8bef\uff1a\u4e00\u4e2a\u9519\u8bef\u5730\u6253\u4e71\u6570\u636e\u7684\u6570\u636e\u52a0\u8f7d\u5668\u3001\u4e00\u4e2a\u6709\u7b26\u53f7\u9519\u8bef\u7684\u635f\u5931\u51fd\u6570\u3001\u4e00\u4e2a\u4e22\u5f03 5% \u6570\u636e\u7684\u9884\u5904\u7406\u6b65\u9aa4\u3002\u8fd9\u4e9b\u9519\u8bef\u4e0d\u4f1a\u4f7f\u4f60\u7684\u7a0b\u5e8f\u5d29\u6e83\u3002\u5b83\u4eec\u53ea\u662f\u8ba9\u4f60\u7684\u6a21\u578b\u6084\u6084\u53d8\u5dee\uff0c\u7136\u540e\u4f60\u6d6a\u8d39\u6570\u5468\u65f6\u95f4\u8c03\u8bd5\"\u672c\u5e94\u66f4\u9ad8\"\u7684\u6307\u6807\u3002</p> </li> <li> <p>\u6d4b\u8bd5\u4e0d\u662f\u989d\u5916\u8d1f\u62c5\u3002\u5b83\u662f\u5feb\u901f\u524d\u8fdb\u800c\u4e0d\u7834\u574f\u4e1c\u897f\u7684\u6700\u5feb\u65b9\u5f0f\u3002</p> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/04.%20testing%20and%20quality%20assurance/#_2","title":"\u6d4b\u8bd5\u91d1\u5b57\u5854","text":"<ul> <li> <p>\u6d4b\u8bd5\u6309\u5c42\u7ea7\u7ec4\u7ec7\uff0c\u4ece\u5feb\u901f\u4e14\u72ed\u7a84\u5230\u6162\u901f\u4e14\u5e7f\u6cdb\uff1a</p> <ul> <li> <p>\u5355\u5143\u6d4b\u8bd5\uff08\u5e95\u5c42\uff09\uff1a\u9694\u79bb\u6d4b\u8bd5\u5355\u4e2a\u51fd\u6570\u548c\u7c7b\u3002\u5feb\u901f\uff08\u6beb\u79d2\u7ea7\uff09\uff0c\u6570\u91cf\u591a\uff08\u6570\u767e\u5230\u6570\u5343\uff09\u3002\"<code>normalise_image</code> \u662f\u5426\u4ea7\u751f [0, 1] \u8303\u56f4\u5185\u7684\u503c\uff1f\"</p> </li> <li> <p>\u96c6\u6210\u6d4b\u8bd5\uff08\u4e2d\u5c42\uff09\uff1a\u6d4b\u8bd5\u7ec4\u4ef6\u534f\u540c\u5de5\u4f5c\u3002\u8f83\u6162\uff08\u79d2\u7ea7\uff09\u3002\"\u6570\u636e\u52a0\u8f7d\u5668\u662f\u5426\u4ee5\u6a21\u578b\u671f\u671b\u7684\u683c\u5f0f\u4ea7\u751f\u6279\u6b21\uff1f\"</p> </li> <li> <p>\u7aef\u5230\u7aef\u6d4b\u8bd5\uff08\u9876\u5c42\uff09\uff1a\u6d4b\u8bd5\u4ece\u8f93\u5165\u5230\u8f93\u51fa\u7684\u5b8c\u6574\u7ba1\u9053\u3002\u8f83\u6162\uff08\u5206\u949f\u7ea7\uff09\u3002\"<code>python train.py --config test.yaml</code> \u662f\u5426\u65e0\u9519\u8bef\u5b8c\u6210\u5e76\u4ea7\u751f\u6709\u6548\u7684\u68c0\u67e5\u70b9\uff1f\"</p> </li> </ul> </li> <li> <p>\u91d1\u5b57\u5854\u5f62\u72b6\u610f\u5473\u7740\uff1a\u7f16\u5199\u5927\u91cf\u5355\u5143\u6d4b\u8bd5\uff0c\u8f83\u5c11\u6570\u91cf\u7684\u96c6\u6210\u6d4b\u8bd5\uff0c\u4ee5\u53ca\u5c11\u91cf\u7aef\u5230\u7aef\u6d4b\u8bd5\u3002\u5355\u5143\u6d4b\u8bd5\u6355\u83b7\u5927\u591a\u6570\u9519\u8bef\uff0c\u5e76\u5728\u51e0\u79d2\u949f\u5185\u8fd0\u884c\u3002\u7aef\u5230\u7aef\u6d4b\u8bd5\u6355\u83b7\u96c6\u6210\u95ee\u9898\uff0c\u4f46\u6162\u4e14\u8106\u5f31\u3002</p> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/04.%20testing%20and%20quality%20assurance/#pytest","title":"\u4f7f\u7528 pytest \u8fdb\u884c\u5355\u5143\u6d4b\u8bd5","text":"<ul> <li>pytest \u662f\u6807\u51c6\u7684 Python \u6d4b\u8bd5\u6846\u67b6\u3002\u6d4b\u8bd5\u662f\u4ee5 <code>test_</code> \u5f00\u5934\u7684\u51fd\u6570\uff0c\u653e\u5728\u4ee5 <code>test_</code> \u5f00\u5934\u7684\u6587\u4ef6\u4e2d\uff1a</li> </ul> <pre><code># tests/test_utils.py\n\ndef test_normalise_image():\n    import numpy as np\n    image = np.array([0, 128, 255], dtype=np.uint8)\n    result = normalise_image(image, mean=128, std=128)\n    assert result.min() &gt;= -1.0\n    assert result.max() &lt;= 1.0\n    assert abs(result[1]) &lt; 1e-6  # 128 \u88ab mean=128 \u5f52\u4e00\u5316\u540e\u5e94\u7ea6\u4e3a 0\n\ndef test_normalise_empty():\n    import numpy as np\n    image = np.array([], dtype=np.uint8)\n    result = normalise_image(image, mean=128, std=128)\n    assert len(result) == 0\n</code></pre> <pre><code>pytest tests/                     # \u8fd0\u884c\u6240\u6709\u6d4b\u8bd5\npytest tests/test_utils.py        # \u8fd0\u884c\u4e00\u4e2a\u6587\u4ef6\npytest -v                         # \u8be6\u7ec6\u8f93\u51fa\npytest -x                         # \u5728\u7b2c\u4e00\u4e2a\u5931\u8d25\u65f6\u505c\u6b62\npytest -k \"normalise\"             # \u8fd0\u884c\u5339\u914d\u540d\u79f0\u6a21\u5f0f\u7684\u6d4b\u8bd5\npytest --tb=short                 # \u66f4\u77ed\u7684\u8ffd\u6eaf\u4fe1\u606f\n</code></pre>"},{"location":"chapter%2015%3A%20production%20software%20engineering/04.%20testing%20and%20quality%20assurance/#_3","title":"\u5939\u5177","text":"<ul> <li>\u5939\u5177\u4e3a\u6d4b\u8bd5\u63d0\u4f9b\u53ef\u590d\u7528\u7684\u8bbe\u7f6e\u3002\u65e0\u9700\u5728\u6bcf\u4e2a\u6d4b\u8bd5\u4e2d\u91cd\u590d\u8bbe\u7f6e\u4ee3\u7801\uff0c\u53ea\u9700\u5b9a\u4e49\u4e00\u6b21\uff1a</li> </ul> <pre><code>import pytest\n\n@pytest.fixture\ndef sample_dataset():\n    \"\"\"\u521b\u5efa\u4e00\u4e2a\u7528\u4e8e\u6d4b\u8bd5\u7684\u5c0f\u578b\u6570\u636e\u96c6\u3002\"\"\"\n    return {\n        \"inputs\": torch.randn(10, 3, 32, 32),\n        \"labels\": torch.randint(0, 10, (10,))\n    }\n\n@pytest.fixture\ndef trained_model():\n    \"\"\"\u52a0\u8f7d\u4e00\u4e2a\u5c0f\u578b\u9884\u8bad\u7ec3\u6a21\u578b\u3002\"\"\"\n    model = SmallModel()\n    model.load_state_dict(torch.load(\"tests/fixtures/small_model.pt\"))\n    return model\n\ndef test_model_output_shape(trained_model, sample_dataset):\n    output = trained_model(sample_dataset[\"inputs\"])\n    assert output.shape == (10, 10)  # batch_size x num_classes\n</code></pre> <ul> <li>\u5939\u5177\u53ef\u4ee5\u6709\u4f5c\u7528\u57df\uff1a<code>scope=\"function\"</code>\uff08\u9ed8\u8ba4\uff0c\u6bcf\u6b21\u6d4b\u8bd5\u91cd\u65b0\u521b\u5efa\uff09\u3001<code>scope=\"module\"</code>\uff08\u6bcf\u4e2a\u6587\u4ef6\u4e00\u6b21\uff09\u3001<code>scope=\"session\"</code>\uff08\u6bcf\u6b21\u6d4b\u8bd5\u8fd0\u884c\u4e00\u6b21\uff09\u3002\u5bf9\u4e8e\u52a0\u8f7d\u6a21\u578b\u7b49\u6602\u8d35\u8bbe\u7f6e\uff0c\u4f7f\u7528 <code>scope=\"session\"</code>\u3002</li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/04.%20testing%20and%20quality%20assurance/#_4","title":"\u53c2\u6570\u5316\u6d4b\u8bd5","text":"<ul> <li>\u4f7f\u7528\u591a\u4e2a\u8f93\u5165\u6d4b\u8bd5\u540c\u4e00\u4e2a\u51fd\u6570\uff0c\u65e0\u9700\u91cd\u590d\u4ee3\u7801\uff1a</li> </ul> <pre><code>@pytest.mark.parametrize(\"input,expected\", [\n    ([1, 2, 3], 6),\n    ([], 0),\n    ([-1, 1], 0),\n    ([1000000, 1000000], 2000000),\n])\ndef test_sum(input, expected):\n    assert sum(input) == expected\n</code></pre>"},{"location":"chapter%2015%3A%20production%20software%20engineering/04.%20testing%20and%20quality%20assurance/#mock","title":"Mock \u4e0e\u8865\u4e01","text":"<ul> <li>Mock \u5728\u6d4b\u8bd5\u671f\u95f4\u7528\u5047\u4f9d\u8d56\u66ff\u6362\u771f\u5b9e\u4f9d\u8d56\u3002\u8fd9\u8ba9\u4f60\u53ef\u4ee5\u9694\u79bb\u6d4b\u8bd5\u51fd\u6570\uff0c\u800c\u65e0\u9700\u6570\u636e\u5e93\u3001API \u6216 GPU\u3002</li> </ul> <pre><code>from unittest.mock import patch, MagicMock\n\ndef test_training_logs_metrics():\n    mock_logger = MagicMock()\n\n    with patch(\"my_project.training.trainer.wandb\") as mock_wandb:\n        trainer = Trainer(logger=mock_logger)\n        trainer.train_one_epoch()\n\n        # \u9a8c\u8bc1\u8bad\u7ec3\u5668\u8bb0\u5f55\u4e86\u6307\u6807\n        mock_logger.log.assert_called()\n        # \u9a8c\u8bc1\u5b83\u8bb0\u5f55\u4e86\u635f\u5931\u503c\n        call_args = mock_logger.log.call_args\n        assert \"loss\" in call_args[1]\n</code></pre> <ul> <li> <p>\u4f55\u65f6\u4f7f\u7528 Mock\uff1a\u5916\u90e8\u670d\u52a1\uff08API\u3001\u6570\u636e\u5e93\u3001\u4e91\u5b58\u50a8\uff09\u3001\u6602\u8d35\u64cd\u4f5c\uff08GPU \u8ba1\u7b97\u3001\u5927\u578b\u6587\u4ef6 I/O\uff09\u548c\u975e\u786e\u5b9a\u6027\u884c\u4e3a\uff08\u968f\u673a\u6570\u751f\u6210\u5668\u3001\u65f6\u95f4\u6233\uff09\u3002</p> </li> <li> <p>\u4f55\u65f6\u4e0d\u8981 Mock\uff1a\u4f60\u81ea\u5df1\u7684\u4ee3\u7801\u3002\u5982\u679c\u4f60 Mock \u4e86\u6240\u6709\u5185\u5bb9\uff0c\u4f60\u7684\u6d4b\u8bd5\u9a8c\u8bc1\u7684\u662f Mock \u7684\u884c\u4e3a\u7b26\u5408\u9884\u671f\uff0c\u800c\u4e0d\u662f\u4f60\u7684\u4ee3\u7801\u80fd\u5de5\u4f5c\u3002\u5728\u8fb9\u754c\u5904\u8fdb\u884c Mock\uff0c\u76f4\u63a5\u6d4b\u8bd5\u4f60\u7684\u903b\u8f91\u3002</p> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/04.%20testing%20and%20quality%20assurance/#_5","title":"\u6d4b\u8bd5\u673a\u5668\u5b66\u4e60\u4ee3\u7801","text":"<ul> <li>\u673a\u5668\u5b66\u4e60\u4ee3\u7801\u6709\u72ec\u7279\u7684\u6d4b\u8bd5\u6311\u6218\uff1a\u8f93\u51fa\u662f\u6982\u7387\u6027\u7684\uff0c\u8bad\u7ec3\u5f88\u6162\uff0c\u800c\u4e14\"\u6b63\u786e\"\u662f\u6a21\u7cca\u7684\u3002</li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/04.%20testing%20and%20quality%20assurance/#_6","title":"\u786e\u5b9a\u6027\u79cd\u5b50","text":"<ul> <li>\u5728\u6240\u6709\u5730\u65b9\u8bbe\u7f6e\u968f\u673a\u79cd\u5b50\uff0c\u4f7f\u6d4b\u8bd5\u53ef\u91cd\u73b0\uff1a</li> </ul> <pre><code>import random\nimport numpy as np\nimport torch\n\ndef set_seed(seed=42):\n    random.seed(seed)\n    np.random.seed(seed)\n    torch.manual_seed(seed)\n    if torch.cuda.is_available():\n        torch.cuda.manual_seed_all(seed)\n    torch.backends.cudnn.deterministic = True\n    torch.backends.cudnn.benchmark = False\n</code></pre>"},{"location":"chapter%2015%3A%20production%20software%20engineering/04.%20testing%20and%20quality%20assurance/#_7","title":"\u6570\u503c\u5bb9\u5dee","text":"<ul> <li>\u6d6e\u70b9\u6570\u6bd4\u8f83\u9700\u8981\u5bb9\u5dee\uff08\u7b2c 13 \u7ae0\uff0cIEEE 754\uff09\uff1a</li> </ul> <pre><code># \u7cdf\u7cd5\uff1a\u7531\u4e8e\u6d6e\u70b9\u6570\u95ee\u9898\uff0c\u7cbe\u786e\u6bd4\u8f83\u4f1a\u5931\u8d25\nassert model_output == 0.5\n\n# \u826f\u597d\uff1a\u8fd1\u4f3c\u6bd4\u8f83\nimport numpy as np\nassert np.isclose(model_output, 0.5, atol=1e-5)\n\n# \u5bf9\u4e8e\u5f20\u91cf\nassert torch.allclose(output, expected, atol=1e-4)\n</code></pre>"},{"location":"chapter%2015%3A%20production%20software%20engineering/04.%20testing%20and%20quality%20assurance/#_8","title":"\u673a\u5668\u5b66\u4e60\u4e2d\u9700\u8981\u6d4b\u8bd5\u4ec0\u4e48","text":"<ul> <li>\u5f62\u72b6\u6d4b\u8bd5\uff1a\u9a8c\u8bc1\u8f93\u51fa\u5177\u6709\u9884\u671f\u7684\u7ef4\u5ea6\u3002</li> </ul> <pre><code>def test_model_output_shape():\n    model = MyModel(d_model=256, n_classes=10)\n    x = torch.randn(8, 32, 256)  # batch=8, seq=32, dim=256\n    output = model(x)\n    assert output.shape == (8, 10)\n</code></pre> <ul> <li>\u68af\u5ea6\u6d41\uff1a\u9a8c\u8bc1\u53ef\u8bad\u7ec3\u53c2\u6570\u5177\u6709\u975e\u96f6\u68af\u5ea6\u3002</li> </ul> <pre><code>def test_gradients_flow():\n    model = MyModel()\n    x = torch.randn(4, 3, 32, 32)\n    y = torch.randint(0, 10, (4,))\n\n    output = model(x)\n    loss = F.cross_entropy(output, y)\n    loss.backward()\n\n    for name, param in model.named_parameters():\n        assert param.grad is not None, f\"\u6ca1\u6709 {name} \u7684\u68af\u5ea6\"\n        assert param.grad.abs().sum() &gt; 0, f\"{name} \u7684\u68af\u5ea6\u4e3a\u96f6\"\n</code></pre> <ul> <li>\u5728\u4e00\u4e2a\u6279\u6b21\u4e0a\u8fc7\u62df\u5408\uff1a\u6a21\u578b\u5e94\u8be5\u80fd\u591f\u8bb0\u5fc6\u5355\u4e2a\u6279\u6b21\u3002\u5982\u679c\u4e0d\u80fd\uff0c\u8bf4\u660e\u67d0\u5904\u5b58\u5728\u6839\u672c\u6027\u95ee\u9898\u3002</li> </ul> <pre><code>def test_overfit_one_batch():\n    model = MyModel()\n    optimiser = torch.optim.Adam(model.parameters(), lr=1e-3)\n    x, y = get_single_batch()\n\n    for _ in range(100):\n        loss = F.cross_entropy(model(x), y)\n        loss.backward()\n        optimiser.step()\n        optimiser.zero_grad()\n\n    assert loss.item() &lt; 0.01, f\"\u65e0\u6cd5\u8fc7\u62df\u5408\u5355\u4e2a\u6279\u6b21\uff1aloss={loss.item()}\"\n</code></pre> <ul> <li>\u6570\u636e\u9a8c\u8bc1\uff1a\u9a8c\u8bc1\u6570\u636e\u52a0\u8f7d\u4ea7\u751f\u6709\u6548\u8f93\u51fa\u3002</li> </ul> <pre><code>def test_dataset_basics():\n    dataset = MyDataset(\"tests/fixtures/small_data.csv\")\n    assert len(dataset) &gt; 0\n    x, y = dataset[0]\n    assert x.shape == (3, 224, 224)\n    assert 0 &lt;= y &lt; 10\n    assert not torch.isnan(x).any()\n    assert not torch.isinf(x).any()\n</code></pre> <ul> <li>\u786e\u5b9a\u6027\uff1a\u76f8\u540c\u8f93\u5165 + \u76f8\u540c\u79cd\u5b50 \u2192 \u76f8\u540c\u8f93\u51fa\u3002</li> </ul> <pre><code>def test_determinism():\n    set_seed(42)\n    output1 = model(input_data)\n    set_seed(42)\n    output2 = model(input_data)\n    assert torch.allclose(output1, output2)\n</code></pre>"},{"location":"chapter%2015%3A%20production%20software%20engineering/04.%20testing%20and%20quality%20assurance/#cicd","title":"CI/CD \u7ba1\u9053","text":"<ul> <li> <p>\u6301\u7eed\u96c6\u6210\uff08CI\uff09\uff1a\u5728\u6bcf\u6b21\u63d0\u4ea4\u6216 PR \u4e0a\u81ea\u52a8\u8fd0\u884c\u6d4b\u8bd5\u3002\u5982\u679c\u6d4b\u8bd5\u5931\u8d25\uff0cPR \u4e0d\u80fd\u5408\u5e76\u3002\u8fd9\u9632\u6b62\u4e86\u635f\u574f\u7684\u4ee3\u7801\u5230\u8fbe <code>main</code>\u3002</p> </li> <li> <p>GitHub Actions \u793a\u4f8b\uff08<code>.github/workflows/ci.yml</code>\uff09\uff1a</p> </li> </ul> <pre><code>name: CI\non: [push, pull_request]\n\njobs:\n  test:\n    runs-on: ubuntu-latest\n    steps:\n      - uses: actions/checkout@v4\n      - uses: actions/setup-python@v5\n        with:\n          python-version: \"3.11\"\n      - run: pip install -e \".[dev]\"\n      - run: ruff check src/\n      - run: mypy src/\n      - run: pytest tests/ -v --tb=short\n</code></pre> <ul> <li>\u9884\u63d0\u4ea4\u94a9\u5b50\uff1a\u5728\u6bcf\u6b21\u63d0\u4ea4\u524d\uff08\u672c\u5730\uff09\u8fd0\u884c\u68c0\u67e5\uff0c\u5728\u5b83\u4eec\u5230\u8fbe CI \u4e4b\u524d\u6355\u83b7\u95ee\u9898\uff1a</li> </ul> <pre><code># .pre-commit-config.yaml\nrepos:\n  - repo: https://github.com/astral-sh/ruff-pre-commit\n    rev: v0.3.0\n    hooks:\n      - id: ruff\n        args: [--fix]\n      - id: ruff-format\n  - repo: https://github.com/pre-commit/pre-commit-hooks\n    rev: v4.5.0\n    hooks:\n      - id: trailing-whitespace\n      - id: end-of-file-fixer\n      - id: check-yaml\n</code></pre> <pre><code>pip install pre-commit\npre-commit install    # \u73b0\u5728\u6bcf\u6b21 git \u63d0\u4ea4\u65f6\u90fd\u4f1a\u8fd0\u884c\u94a9\u5b50\n</code></pre>"},{"location":"chapter%2015%3A%20production%20software%20engineering/04.%20testing%20and%20quality%20assurance/#_9","title":"\u4ee3\u7801\u68c0\u67e5\u4e0e\u683c\u5f0f\u5316","text":"<ul> <li> <p>\u4ee3\u7801\u68c0\u67e5\u65e0\u9700\u8fd0\u884c\u4ee3\u7801\u5373\u53ef\u6355\u83b7\u9519\u8bef\u548c\u98ce\u683c\u95ee\u9898\u3002\u683c\u5f0f\u5316\u81ea\u52a8\u5f3a\u5236\u6267\u884c\u4e00\u81f4\u7684\u98ce\u683c\u3002</p> </li> <li> <p>Ruff\uff1a\u4e00\u4e2a\u5feb\u901f\u7684 Python \u4ee3\u7801\u68c0\u67e5\u5668\u548c\u683c\u5f0f\u5316\u5668\uff08\u5728\u4e00\u4e2a\u5de5\u5177\u4e2d\u66ff\u4ee3 flake8\u3001isort \u548c black\uff09\uff1a</p> </li> </ul> <pre><code>ruff check src/          # \u4ee3\u7801\u68c0\u67e5\nruff check --fix src/    # \u4ee3\u7801\u68c0\u67e5\u5e76\u81ea\u52a8\u4fee\u590d\nruff format src/         # \u683c\u5f0f\u5316\n</code></pre> <ul> <li>mypy\uff1aPython \u9759\u6001\u7c7b\u578b\u68c0\u67e5\u5668\u3002\u5728\u8fd0\u884c\u65f6\u4e4b\u524d\u6355\u83b7\u7c7b\u578b\u9519\u8bef\uff1a</li> </ul> <pre><code>mypy src/\n# src/model.py:42: error: Argument 1 to \"forward\" has incompatible type \"int\"; expected \"Tensor\"\n</code></pre> <ul> <li>\u7c7b\u578b\u63d0\u793a\u4f7f\u4ee3\u7801\u81ea\u6587\u6863\u5316\u5e76\u6355\u83b7\u9519\u8bef\uff1a</li> </ul> <pre><code>def train(\n    model: nn.Module,\n    dataloader: DataLoader,\n    optimiser: torch.optim.Optimizer,\n    num_epochs: int = 10,\n) -&gt; float:\n    \"\"\"\u8bad\u7ec3\u6a21\u578b\u5e76\u8fd4\u56de\u6700\u7ec8\u635f\u5931\u3002\"\"\"\n    ...\n</code></pre>"},{"location":"chapter%2015%3A%20production%20software%20engineering/04.%20testing%20and%20quality%20assurance/#_10","title":"\u4ee3\u7801\u5ba1\u67e5\u6700\u4f73\u5b9e\u8df5","text":"<ul> <li> <p>\u5bf9\u4e8e\u4f5c\u8005\uff1a</p> <ul> <li>\u5728\u8bf7\u6c42\u5ba1\u67e5\u4e4b\u524d\u5148\u81ea\u6211\u5ba1\u67e5\u4f60\u7684\u5dee\u5f02\u3002\u4f60\u4f1a\u53d1\u73b0\u660e\u663e\u7684\u95ee\u9898\u3002</li> <li>\u4fdd\u6301 PR \u5c0f\u800c\u4e13\u6ce8\u3002\u4e00\u4e2a PR \u805a\u7126\u4e00\u4e2a\u95ee\u9898\u3002</li> <li>\u5199\u6e05\u6670\u7684\u63cf\u8ff0\uff1a\u4ec0\u4e48\u3001\u4e3a\u4ec0\u4e48\u3001\u5982\u4f55\u6d4b\u8bd5\u3002</li> <li>\u56de\u590d\u6bcf\u6761\u8bc4\u8bba\uff08\u5373\u4f7f\u53ea\u662f\"\u5df2\u4fee\u6539\"\uff09\u3002</li> </ul> </li> <li> <p>\u5bf9\u4e8e\u5ba1\u67e5\u8005\uff1a</p> <ul> <li>\u4fdd\u6301\u53cb\u5584\u3002\u6279\u8bc4\u4ee3\u7801\uff0c\u800c\u4e0d\u662f\u4eba\u3002\"\u8fd9\u91cc\u53ef\u4ee5\u66f4\u6e05\u6670\"\u800c\u4e0d\u662f\"\u8fd9\u5f88\u4ee4\u4eba\u56f0\u60d1\u3002\"</li> <li>\u533a\u5206\u963b\u585e\u6027\u95ee\u9898\uff08\u9519\u8bef\u3001\u5b89\u5168\uff09\u548c\u5efa\u8bae\uff08\u98ce\u683c\u3001\u547d\u540d\uff09\u3002\u4f7f\u7528\u6807\u7b7e\uff1a\"nit:\"\u3001\"suggestion:\"\u3001\"blocking:\"\u3002</li> <li>\u63d0\u95ee\u800c\u4e0d\u662f\u53d1\u53f7\u65bd\u4ee4\u3002\"\u5982\u679c\u8fd9\u4e2a\u5217\u8868\u4e3a\u7a7a\u4f1a\u600e\u6837\uff1f\"\u6bd4\"\u5904\u7406\u7a7a\u7684\u60c5\u51b5\"\u66f4\u6709\u5e2e\u52a9\u3002</li> <li>\u53ca\u65f6\u6279\u51c6\u3002\u7b49\u5f85\u6570\u5929\u7684 PR \u4f1a\u963b\u585e\u4f5c\u8005\uff0c\u5e76\u9f13\u52b1\u5927\u578b\u3001\u6279\u91cf\u7684 PR\uff08\u8fd9\u4e9b\u66f4\u96be\u5ba1\u67e5\uff09\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/05.%20deployment%20and%20devops/","title":"\u90e8\u7f72\u4e0e DevOps","text":"<p>\u90e8\u7f72\u662f\u4f60\u7684\u6a21\u578b\u4ece\u7814\u7a76\u4ea7\u7269\u53d8\u6210\u4ea7\u54c1\u7684\u5730\u65b9\u3002\u672c\u6587\u6db5\u76d6\u7528\u4e8e\u673a\u5668\u5b66\u4e60\u7684 Docker\u3001\u6a21\u578b\u63a8\u7406\u3001\u5b9e\u9a8c\u8ffd\u8e2a\u3001\u53ef\u91cd\u73b0\u6027\u3001\u751f\u4ea7\u73af\u5883\u76d1\u63a7\u3001\u7279\u5f81\u5b58\u50a8\u548c\u7ba1\u9053\u7f16\u6392\u2014\u2014\u8fd9\u4e9b\u57fa\u7840\u8bbe\u65bd\u5c06\u4e00\u4e2a\u8bad\u7ec3\u597d\u7684\u6a21\u578b\u4ece notebook \u5e26\u5230\u6570\u767e\u4e07\u7528\u6237\u9762\u524d\u3002</p> <ul> <li> <p>\u4e00\u4e2a\u53ea\u5728\u4f60\u7b14\u8bb0\u672c\u7535\u8111\u4e0a\u8fd0\u884c\u7684\u6a21\u578b\u662f\u539f\u578b\u3002\u4e00\u4e2a\u80fd\u591f\u53ef\u9760\u5730\u5927\u89c4\u6a21\u8fd0\u884c\u3001\u5728\u6beb\u79d2\u5185\u63d0\u4f9b\u9884\u6d4b\u7ed3\u679c\u3001\u80fd\u591f\u4ece\u6545\u969c\u4e2d\u6062\u590d\u5e76\u5728\u4e0d\u4e2d\u65ad\u670d\u52a1\u7684\u60c5\u51b5\u4e0b\u66f4\u65b0\u7684\u6a21\u578b\u624d\u662f\u4ea7\u54c1\u3002\u4e24\u8005\u4e4b\u95f4\u7684\u5dee\u8ddd\u5c31\u662f\u90e8\u7f72\u4e0e DevOps\u3002</p> </li> <li> <p>\u5927\u591a\u6570\u673a\u5668\u5b66\u4e60\u5de5\u7a0b\u5e08\u5728\u90e8\u7f72\u3001\u76d1\u63a7\u548c\u8c03\u8bd5\u751f\u4ea7\u95ee\u9898\u4e0a\u82b1\u8d39\u7684\u65f6\u95f4\u6bd4\u8bad\u7ec3\u6a21\u578b\u8fd8\u591a\u3002\u7406\u89e3\u8fd9\u4e9b\u57fa\u7840\u8bbe\u65bd\u5bf9\u4e8e\u4efb\u4f55\u6784\u5efa\u771f\u5b9e ML \u7cfb\u7edf\u7684\u4eba\u6765\u8bf4\u90fd\u4e0d\u662f\u53ef\u9009\u9879\u3002</p> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/05.%20deployment%20and%20devops/#docker","title":"\u7528\u4e8e\u673a\u5668\u5b66\u4e60\u7684 Docker","text":"<ul> <li> <p>\u6211\u4eec\u5728\u7b2c 13 \u7ae0\uff08\u64cd\u4f5c\u7cfb\u7edf\uff09\u4e2d\u6982\u5ff5\u6027\u5730\u4ecb\u7ecd\u4e86\u5bb9\u5668\u3002\u8fd9\u91cc\u6211\u4eec\u5173\u6ce8\u5b9e\u8df5\u65b9\u9762\uff1a\u4e3a\u673a\u5668\u5b66\u4e60\u5de5\u4f5c\u8d1f\u8f7d\u7f16\u5199 Dockerfile\u3002</p> </li> <li> <p>Dockerfile \u662f\u6784\u5efa\u5bb9\u5668\u955c\u50cf\u7684\u914d\u65b9\uff1a</p> </li> </ul> <pre><code># \u4ece\u5b98\u65b9\u7684 CUDA \u57fa\u7840\u955c\u50cf\u5f00\u59cb\nFROM nvidia/cuda:12.1.0-cudnn8-runtime-ubuntu22.04\n\n# \u7cfb\u7edf\u4f9d\u8d56\nRUN apt-get update &amp;&amp; apt-get install -y \\\n    python3.11 python3-pip git \\\n    &amp;&amp; rm -rf /var/lib/apt/lists/*\n\n# Python \u4f9d\u8d56\uff08\u5355\u72ec\u5b89\u88c5\u4ee5\u5229\u7528\u7f13\u5b58\uff09\nCOPY requirements.txt .\nRUN pip install --no-cache-dir -r requirements.txt\n\n# \u590d\u5236\u6e90\u4ee3\u7801\uff08\u9891\u7e41\u66f4\u6539\uff0c\u56e0\u6b64\u6b64\u5c42\u653e\u5728\u6700\u540e\uff09\nCOPY src/ /app/src/\nCOPY configs/ /app/configs/\nWORKDIR /app\n\n# \u5165\u53e3\u70b9\nCMD [\"python3\", \"src/scripts/serve.py\", \"--config\", \"configs/serve.yaml\"]\n</code></pre> <ul> <li> <p>\u5c42\u7f13\u5b58\uff1aDocker \u4f1a\u7f13\u5b58\u6bcf\u4e00\u5c42\u3002\u5982\u679c <code>requirements.txt</code> \u6ca1\u6709\u53d8\u5316\uff0c<code>pip install</code> \u5728\u91cd\u65b0\u6784\u5efa\u65f6\u4f1a\u88ab\u8df3\u8fc7\u3002\u5c06\u4e0d\u5e38\u66f4\u6539\u7684\u5c42\uff08\u7cfb\u7edf\u5305\u3001pip \u5b89\u88c5\uff09\u653e\u5728\u9891\u7e41\u66f4\u6539\u7684\u5c42\uff08\u6e90\u4ee3\u7801\uff09\u4e4b\u524d\u3002\u8fd9\u5c06 10 \u5206\u949f\u7684\u6784\u5efa\u53d8\u6210 10 \u79d2\u7684\u91cd\u65b0\u6784\u5efa\u3002</p> </li> <li> <p>GPU \u8bbf\u95ee\uff1a\u4f7f\u7528 <code>nvidia/cuda</code> \u57fa\u7840\u955c\u50cf\uff0c\u5e76\u4f7f\u7528 <code>docker run --gpus all</code> \u8fd0\u884c\u3002<code>nvidia-container-toolkit</code> \u63d0\u4f9b\u4ece\u5bbf\u4e3b\u673a\u5230\u5bb9\u5668\u7684 GPU \u900f\u4f20\u3002</p> </li> <li> <p>\u591a\u9636\u6bb5\u6784\u5efa\u901a\u8fc7\u5c06\u6784\u5efa\u73af\u5883\u4e0e\u8fd0\u884c\u73af\u5883\u5206\u79bb\u6765\u51cf\u5c0f\u955c\u50cf\u5927\u5c0f\uff1a</p> </li> </ul> <pre><code># \u6784\u5efa\u9636\u6bb5\uff1a\u5b89\u88c5\u6784\u5efa\u5de5\u5177\u3001\u7f16\u8bd1\u4f9d\u8d56\nFROM python:3.11 AS builder\nCOPY requirements.txt .\nRUN pip install --user -r requirements.txt\n\n# \u8fd0\u884c\u9636\u6bb5\uff1a\u4ec5\u8fd0\u884c\u73af\u5883\u4f9d\u8d56\nFROM nvidia/cuda:12.1.0-cudnn8-runtime-ubuntu22.04\nCOPY --from=builder /root/.local /root/.local\nCOPY src/ /app/src/\nENV PATH=/root/.local/bin:$PATH\n</code></pre> <ul> <li> <p>\u6700\u7ec8\u955c\u50cf\u53ea\u5305\u542b\u8fd0\u884c\u65f6\u5e93\uff0c\u4e0d\u5305\u542b\u7f16\u8bd1\u5668\u3001\u5934\u6587\u4ef6\u6216\u6784\u5efa\u5de5\u5177\u3002\u4e00\u4e2a 5GB \u7684\u6784\u5efa\u955c\u50cf\u53d8\u6210\u4e86 2GB \u7684\u8fd0\u884c\u955c\u50cf\u3002</p> </li> <li> <p>Docker Compose \u8fd0\u884c\u591a\u5bb9\u5668\u8bbe\u7f6e\uff08\u6a21\u578b\u670d\u52a1\u5668 + \u8d1f\u8f7d\u5747\u8861\u5668 + \u76d1\u63a7\uff09\uff1a</p> </li> </ul> <pre><code># docker-compose.yml\nservices:\n  model:\n    build: .\n    ports:\n      - \"8080:8080\"\n    deploy:\n      resources:\n        reservations:\n          devices:\n            - capabilities: [gpu]\n  prometheus:\n    image: prom/prometheus\n    ports:\n      - \"9090:9090\"\n</code></pre>"},{"location":"chapter%2015%3A%20production%20software%20engineering/05.%20deployment%20and%20devops/#_1","title":"\u6a21\u578b\u63a8\u7406","text":"<ul> <li> <p>\u6a21\u578b\u63a8\u7406\u662f\u5c06\u63a8\u7406\u4f5c\u4e3a\u670d\u52a1\u8fd0\u884c\uff1a\u63a5\u6536\u8bf7\u6c42\u3001\u8fd0\u884c\u6a21\u578b\u3001\u8fd4\u56de\u9884\u6d4b\u7ed3\u679c\u3002</p> </li> <li> <p>FastAPI\uff08\u5728\u6587\u4ef6 03 \u4e2d\u4ecb\u7ecd\uff09\u9002\u7528\u4e8e\u4f4e\u5230\u4e2d\u7b49\u541e\u5410\u91cf\u7684\u6700\u7b80\u5355\u65b9\u6cd5\u3002\u5bf9\u4e8e\u9ad8\u541e\u5410\u91cf\u548c GPU \u4f18\u5316\u63a8\u7406\uff0c\u4f7f\u7528\u4e13\u7528\u5de5\u5177\uff1a</p> </li> <li> <p>Triton Inference Server\uff08NVIDIA\uff09\uff1a\u4ee5 TensorRT\u3001ONNX\u3001PyTorch \u548c TensorFlow \u683c\u5f0f\u63d0\u4f9b\u6a21\u578b\u3002\u7279\u6027\uff1a</p> <ul> <li>\u52a8\u6001\u6279\u5904\u7406\uff1a\u6536\u96c6\u5355\u4e2a\u8bf7\u6c42\u5e76\u5c06\u5b83\u4eec\u5206\u6279\u5904\u7406\u4ee5\u63d0\u9ad8 GPU \u6548\u7387\u3002\u5355\u4e2a\u8bf7\u6c42\u6d41\u88ab\u5206\u7ec4\u4e3a 32 \u7684\u6279\u6b21\uff0c\u5927\u5e45\u63d0\u9ad8\u541e\u5410\u91cf\u3002</li> <li>\u6a21\u578b\u96c6\u6210\uff1a\u5728\u5355\u4e2a\u8bf7\u6c42\u4e2d\u94fe\u5f0f\u8c03\u7528\u591a\u4e2a\u6a21\u578b\uff08\u9884\u5904\u7406\u5668 \u2192 \u6a21\u578b \u2192 \u540e\u5904\u7406\u5668\uff09\u3002</li> <li>\u591a\u6a21\u578b\u63a8\u7406\uff1a\u5728\u540c\u4e00 GPU \u4e0a\u63d0\u4f9b\u591a\u4e2a\u6a21\u578b\uff0c\u5171\u4eab\u8d44\u6e90\u3002</li> <li>\u5e76\u53d1\u6a21\u578b\u6267\u884c\uff1a\u5728\u540c\u4e00 GPU \u4e0a\u5e76\u884c\u8fd0\u884c\u591a\u4e2a\u63a8\u7406\u8bf7\u6c42\u3002</li> </ul> </li> <li> <p>TorchServe\uff08PyTorch\uff09\uff1a\u4ee5 REST/gRPC API \u63d0\u4f9b PyTorch \u6a21\u578b\u3002\u652f\u6301\u6a21\u578b\u7248\u672c\u63a7\u5236\u3001A/B \u6d4b\u8bd5\u548c\u81ea\u5b9a\u4e49\u5904\u7406\u5668\u3002</p> </li> <li> <p>vLLM\uff1a\u4e13\u95e8\u7528\u4e8e LLM \u63a8\u7406\u3002\u5b9e\u73b0\u4e86 PagedAttention\uff08\u9ad8\u6548\u7684 KV \u7f13\u5b58\u7ba1\u7406\uff09\u3001\u8fde\u7eed\u6279\u5904\u7406\u548c\u8de8 GPU \u7684\u5f20\u91cf\u5e76\u884c\u3002\u5bf9\u4e8e\u5927\u8bed\u8a00\u6a21\u578b\uff0c\u541e\u5410\u91cf\u6bd4\u6734\u7d20\u63a8\u7406\u9ad8\u51fa 10-20 \u500d\u3002</p> </li> <li> <p>Cactus\uff08github.com/cactus-compute/cactus\uff09\uff1a\u4e00\u4e2a\u7528\u4e8e\u79fb\u52a8\u7aef\u548c\u8fb9\u7f18\u7aef\u8bbe\u5907\u63a8\u7406\u7684\u4f4e\u5ef6\u8fdf AI \u5f15\u64ce\u3002Cactus \u63d0\u4f9b\u517c\u5bb9 OpenAI \u7684 API\uff08\u804a\u5929\u8865\u5168\u3001\u6d41\u5f0f\u4f20\u8f93\u3001\u5de5\u5177\u8c03\u7528\u3001\u8f6c\u5f55\u3001\u5d4c\u5165\u3001RAG\u3001\u89c6\u89c9\uff09\uff0c\u5b8c\u5168\u5728\u8bbe\u5907\u4e0a\u8fd0\u884c\uff0c\u5f53\u672c\u5730\u6a21\u578b\u65e0\u6cd5\u5904\u7406\u8bf7\u6c42\u65f6\u81ea\u52a8\u8fdb\u884c\u4e91\u56de\u9000\u3002\u8fd9\u79cd\u6df7\u5408\u67b6\u6784\u610f\u5473\u7740\u4f60\u7684\u5e94\u7528\u7a0b\u5e8f\u4ee3\u7801\u4f7f\u7528\u76f8\u540c\u7684 API\uff0c\u65e0\u8bba\u63a8\u7406\u662f\u5728\u672c\u5730\u8fd8\u662f\u5728\u4e91\u7aef\u8fd0\u884c\u2014\u2014\u5f15\u64ce\u6839\u636e\u6a21\u578b\u7f6e\u4fe1\u5ea6\u548c\u8bbe\u5907\u80fd\u529b\u6765\u51b3\u5b9a\u3002\u63d0\u4f9b Python\u3001Swift\u3001Kotlin\u3001Flutter\u3001React Native \u548c Rust \u7684 SDK\uff0c\u4ee5\u53ca HuggingFace \u4e0a\u9884\u8f6c\u6362\u7684\u6a21\u578b\u6743\u91cd\u3002\u652f\u6301\u591a\u6a21\u6001\u63a8\u7406\uff08LLM\u3001\u89c6\u89c9\u3001\u8bed\u97f3\uff09\uff0c\u914d\u5907\u81ea\u5b9a\u4e49 ARM SIMD \u5185\u6838\u4ee5\u5b9e\u73b0 ARM CPU \u4e0a\u7684\u6700\u5feb\u63a8\u7406\uff0c\u4ee5\u53ca\u96f6\u62f7\u8d1d\u5185\u5b58\u6620\u5c04\u4ee5\u5b9e\u73b0 10 \u500d RAM \u4f7f\u7528\u964d\u4f4e\uff08\u7b2c 16 \u7ae0\u3001\u7b2c 17 \u7ae0\uff09\u3002</p> </li> <li> <p>\u6a21\u578b\u683c\u5f0f\u4f18\u5316\uff1a</p> <ul> <li>ONNX\uff1a\u7528\u4e8e\u4e92\u64cd\u4f5c\u6027\u7684\u5f00\u653e\u683c\u5f0f\u3002\u4ece PyTorch/TensorFlow \u5bfc\u51fa\uff0c\u5728\u4efb\u4f55\u5730\u65b9\u8fd0\u884c\u3002</li> <li>TensorRT\uff1aNVIDIA \u7684\u4f18\u5316\u5668\u3002\u878d\u5408\u5c42\u3001\u9009\u62e9\u6700\u4f73\u5185\u6838\u3001\u91cf\u5316\u6743\u91cd\u3002\u5728 NVIDIA GPU \u4e0a\u901a\u5e38\u6bd4 PyTorch \u5feb 2-5 \u500d\u3002</li> <li>GGUF/GGML\uff1a\u9002\u7528\u4e8e CPU \u9ad8\u6548\u63a8\u7406\u7684\u683c\u5f0f\uff0c\u5728\u6d88\u8d39\u7ea7\u786c\u4ef6\u4e0a\u8fd0\u884c LLM \u65f6\u5f88\u6d41\u884c\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/05.%20deployment%20and%20devops/#_2","title":"\u5b9e\u9a8c\u8ffd\u8e2a","text":"<ul> <li> <p>\u6ca1\u6709\u5b9e\u9a8c\u8ffd\u8e2a\uff0c\u673a\u5668\u5b66\u4e60\u7814\u7a76\u4f1a\u9000\u5316\u4e3a\uff1a\"\u6211\u89c9\u5f97\u4e0a\u5468\u4e8c\u90a3\u4e2a\u6211\u6539\u4e86\u4e9b\u914d\u7f6e\u7684\u6a21\u578b\u662f\u6700\u597d\u7684\uff0c\u4f46\u6211\u4e0d\u8bb0\u5f97\u6539\u4e86\u5565\u3002\"</p> </li> <li> <p>Weights &amp; Biases\uff08W&amp;B\uff09\uff1a\u6700\u6d41\u884c\u7684\u5b9e\u9a8c\u8ffd\u8e2a\u5de5\u5177\u3002\u4ece\u4f60\u7684\u8bad\u7ec3\u811a\u672c\u4e2d\u8bb0\u5f55\u4efb\u4f55\u5185\u5bb9\uff1a</p> </li> </ul> <pre><code>import wandb\n\nwandb.init(project=\"my-project\", config={\n    \"model\": \"transformer\",\n    \"lr\": 3e-4,\n    \"batch_size\": 64,\n})\n\nfor epoch in range(num_epochs):\n    train_loss = train_one_epoch()\n    val_loss = validate()\n\n    wandb.log({\n        \"train/loss\": train_loss,\n        \"val/loss\": val_loss,\n        \"epoch\": epoch,\n    })\n\n    # \u5c06\u6a21\u578b\u8bb0\u5f55\u4e3a\u4ea7\u7269\n    if val_loss &lt; best_loss:\n        wandb.save(\"best_model.pt\")\n\nwandb.finish()\n</code></pre> <ul> <li> <p>W&amp;B \u63d0\u4f9b\uff1a\u7528\u4e8e\u6bd4\u8f83\u8fd0\u884c\u7684\u4eea\u8868\u677f\u3001\u8d85\u53c2\u6570\u626b\u63cf\u5de5\u5177\u3001\u6a21\u578b\u6ce8\u518c\u8868\u3001\u6570\u636e\u96c6\u7248\u672c\u63a7\u5236\u548c\u56e2\u961f\u534f\u4f5c\u3002</p> </li> <li> <p>MLflow\uff1a\u5f00\u6e90\u66ff\u4ee3\u65b9\u6848\u3002\u5728\u672c\u5730\u6216\u670d\u52a1\u5668\u4e0a\u8fd0\u884c\uff1a</p> </li> </ul> <pre><code>import mlflow\n\nmlflow.set_experiment(\"my-experiment\")\n\nwith mlflow.start_run():\n    mlflow.log_params({\"lr\": 3e-4, \"batch_size\": 64})\n    mlflow.log_metric(\"val_loss\", 0.042, step=epoch)\n    mlflow.pytorch.log_model(model, \"model\")\n</code></pre> <ul> <li>\u6a21\u578b\u6ce8\u518c\u8868\uff1a\u8bad\u7ec3\u6a21\u578b\u7684\u4e2d\u592e\u5b58\u50a8\uff0c\u5e26\u7248\u672c\u63a7\u5236\u3001\u9636\u6bb5\uff08\u5f00\u53d1 \u2192 \u9884\u53d1\u5e03 \u2192 \u751f\u4ea7\uff09\u548c\u5143\u6570\u636e\u3002W&amp;B \u548c MLflow \u90fd\u63d0\u4f9b\u6ce8\u518c\u8868\u3002\u6ce8\u518c\u8868\u56de\u7b54\uff1a\"\u5f53\u524d\u751f\u4ea7\u73af\u5883\u4e2d\u7684\u662f\u54ea\u4e2a\u6a21\u578b\uff0c\u8c01\u8bad\u7ec3\u7684\uff0c\u5176\u9a8c\u8bc1\u51c6\u786e\u7387\u662f\u591a\u5c11\uff0c\u4ee5\u53ca\u7531\u54ea\u4e2a\u4ee3\u7801/\u6570\u636e\u4ea7\u751f\uff1f\"</li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/05.%20deployment%20and%20devops/#_3","title":"\u53ef\u91cd\u73b0\u6027","text":"<ul> <li> <p>\u53ef\u91cd\u73b0\u6027\u610f\u5473\u7740\uff1a\u7ed9\u5b9a\u76f8\u540c\u7684\u4ee3\u7801\u3001\u6570\u636e\u548c\u914d\u7f6e\uff0c\u4ea7\u751f\u76f8\u540c\u7684\u6a21\u578b\u3002\u8fd9\u5728\u673a\u5668\u5b66\u4e60\u4e2d\u51fa\u5947\u5730\u56f0\u96be\uff0c\u56e0\u4e3a GPU \u64cd\u4f5c\u7684\u975e\u786e\u5b9a\u6027\u3001\u6570\u636e\u6253\u4e71\u548c\u6d6e\u70b9\u6570\u7d2f\u79ef\u3002</p> </li> <li> <p>\u53ef\u91cd\u73b0\u6027\u68c0\u67e5\u6e05\u5355\uff1a</p> </li> </ul> \u4ec0\u4e48 \u5982\u4f55\u505a \u4ee3\u7801\u7248\u672c Git \u63d0\u4ea4\u54c8\u5e0c\u503c \u914d\u7f6e / \u8d85\u53c2\u6570 \u914d\u7f6e\u6587\u4ef6\uff08\u5728 Git \u4e2d\u7248\u672c\u63a7\u5236\u6216\u8bb0\u5f55\u5230 W&amp;B\uff09 \u968f\u673a\u79cd\u5b50 \u8bbe\u7f6e\u5e76\u8bb0\u5f55\u6240\u6709\u79cd\u5b50\uff08Python\u3001NumPy\u3001PyTorch\u3001CUDA\uff09 \u6570\u636e\u7248\u672c DVC \u54c8\u5e0c\u503c\u3001\u6570\u636e\u96c6\u7248\u672c\u6807\u7b7e\u6216 S3 \u5bf9\u8c61\u7248\u672c \u4f9d\u8d56\u9879 <code>pip freeze</code>\u3001Docker \u955c\u50cf\u54c8\u5e0c\u503c\u6216\u9501\u5b9a\u6587\u4ef6 \u786c\u4ef6 GPU \u7c7b\u578b\u3001GPU \u6570\u91cf\u3001CUDA \u7248\u672c \u975e\u786e\u5b9a\u6027 <code>torch.backends.cudnn.deterministic = True</code>\uff08\u8f83\u6162\u4f46\u53ef\u91cd\u73b0\uff09 <ul> <li> <p>\u9501\u5b9a\u6240\u6709\u5185\u5bb9\uff1a<code>pip install torch==2.2.1</code> \u800c\u4e0d\u662f <code>torch&gt;=2.0</code>\u3002\u6b21\u7248\u672c\u53f7\u5347\u7ea7\u53ef\u80fd\u6539\u53d8\u6570\u503c\u884c\u4e3a\u3001\u4f18\u5316\u5668\u5b9e\u73b0\u6216\u9ed8\u8ba4\u8d85\u53c2\u6570\u3002</p> </li> <li> <p>\u4f7f\u7528 Docker \u5b9e\u73b0\u53ef\u91cd\u73b0\u6027\uff1aDocker \u955c\u50cf\u9501\u5b9a\u4e86\u64cd\u4f5c\u7cfb\u7edf\u3001\u7cfb\u7edf\u5e93\u3001Python \u7248\u672c\u548c pip \u5305\u3002\u955c\u50cf\u54c8\u5e0c\u503c\u662f\u5b8c\u6574\u7684\u73af\u5883\u6307\u7eb9\u3002\u5982\u679c\u4f60\u80fd\u91cd\u73b0 Docker \u955c\u50cf\uff0c\u5c31\u80fd\u91cd\u73b0\u8bad\u7ec3\u3002</p> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/05.%20deployment%20and%20devops/#_4","title":"\u751f\u4ea7\u73af\u5883\u76d1\u63a7","text":"<ul> <li> <p>\u90e8\u7f72\u6a21\u578b\u4e0d\u662f\u7ec8\u70b9\u2014\u2014\u800c\u662f\u4e00\u7cfb\u5217\u65b0\u95ee\u9898\u7684\u5f00\u59cb\u3002\u968f\u7740\u73b0\u5b9e\u4e16\u754c\u7684\u53d8\u5316\uff08\u6982\u5ff5\u6f02\u79fb\uff09\u4ee5\u53ca\u8f93\u5165\u6570\u636e\u5206\u5e03\u7684\u53d8\u5316\uff08\u6570\u636e\u6f02\u79fb\uff09\uff0c\u6a21\u578b\u4f1a\u968f\u65f6\u95f4\u63a8\u79fb\u800c\u9000\u5316\u3002</p> </li> <li> <p>\u9700\u8981\u76d1\u63a7\u7684\u5185\u5bb9\uff1a</p> <ul> <li> <p>\u5ef6\u8fdf\uff1a\u63a8\u7406\u9700\u8981\u591a\u957f\u65f6\u95f4\uff1f\u8ffd\u8e2a p50\uff08\u4e2d\u4f4d\u6570\uff09\u3001p95 \u548c p99\u3002p99 \u4e3a 500ms \u610f\u5473\u7740\u6bcf 100 \u4e2a\u7528\u6237\u4e2d\u6709 1 \u4e2a\u8981\u7b49\u5f85\u534a\u79d2\u949f\uff0c\u8fd9\u53ef\u80fd\u4e0d\u53ef\u63a5\u53d7\u3002</p> </li> <li> <p>\u541e\u5410\u91cf\uff1a\u6bcf\u79d2\u5904\u7406\u591a\u5c11\u4e2a\u8bf7\u6c42\uff1f\u7cfb\u7edf\u662f\u5426\u8ddf\u5f97\u4e0a\u9700\u6c42\uff1f</p> </li> <li> <p>\u9519\u8bef\u7387\uff1a\u6709\u591a\u5c11\u6bd4\u4f8b\u7684\u8bf7\u6c42\u5931\u8d25\uff08\u5f02\u5e38\u3001\u8d85\u65f6\u3001\u65e0\u6548\u8f93\u5165\uff09\uff1f</p> </li> <li> <p>\u6a21\u578b\u6307\u6807\uff1a\u5728\u9a8c\u8bc1\u96c6\u4e0a\u7684\u51c6\u786e\u7387\u3001\u7cbe\u786e\u7387\u3001\u53ec\u56de\u7387\u3002\u5982\u679c\u751f\u4ea7\u73af\u5883\u4e2d\u5b58\u5728\u6807\u6ce8\u6570\u636e\uff08\u4f8b\u5982\u7528\u6237\u7ea0\u6b63\uff09\uff0c\u8ffd\u8e2a\u5728\u7ebf\u6307\u6807\u3002</p> </li> <li> <p>\u6570\u636e\u6f02\u79fb\uff1a\u8f93\u5165\u6570\u636e\u7684\u5206\u5e03\u662f\u5426\u53d1\u751f\u4e86\u53d8\u5316\uff1f\u5728\u767d\u5929\u7167\u7247\u4e0a\u8bad\u7ec3\u7684\u6a21\u578b\u53ef\u80fd\u5728\u591c\u95f4\u7167\u7247\u4e0a\u5931\u8d25\u3002\u7edf\u8ba1\u68c0\u9a8c\uff08KS \u68c0\u9a8c\u3001PSI\uff09\u5c06\u8bad\u7ec3\u5206\u5e03\u4e0e\u5728\u7ebf\u5206\u5e03\u8fdb\u884c\u6bd4\u8f83\u3002</p> </li> <li> <p>\u7279\u5f81\u6f02\u79fb\uff1a\u5355\u4e2a\u7279\u5f81\u7684\u5206\u5e03\u662f\u5426\u53d1\u751f\u4e86\u53d8\u5316\uff1f\u8bad\u7ec3\u65f6\u5448\u6b63\u6001\u5206\u5e03\u4f46\u5728\u751f\u4ea7\u65f6\u5448\u53cc\u5cf0\u5206\u5e03\u7684\u7279\u5f81\uff0c\u8868\u660e\u6570\u636e\u7ba1\u9053\u5b58\u5728\u95ee\u9898\u3002</p> </li> </ul> </li> <li> <p>\u5de5\u5177\uff1a</p> <ul> <li>Prometheus + Grafana\uff1a\u57fa\u7840\u8bbe\u65bd\u76d1\u63a7\u7684\u6807\u51c6\u65b9\u6848\u3002Prometheus \u6536\u96c6\u6307\u6807\uff0cGrafana \u5c06\u5176\u53ef\u89c6\u5316\u4e3a\u5e26\u544a\u8b66\u7684\u4eea\u8868\u677f\u3002</li> <li>Evidently AI\uff1a\u5f00\u6e90\u673a\u5668\u5b66\u4e60\u76d1\u63a7\u3002\u751f\u6210\u5173\u4e8e\u6570\u636e\u6f02\u79fb\u3001\u6a21\u578b\u6027\u80fd\u548c\u6570\u636e\u8d28\u91cf\u7684\u62a5\u544a\u3002</li> </ul> </li> <li> <p>\u544a\u8b66\uff1a\u4e0d\u8981\u53ea\u653e\u5728\u4eea\u8868\u677f\u4e0a\u2014\u2014\u8bbe\u7f6e\u81ea\u52a8\u544a\u8b66\u3002\"\u5982\u679c p99 \u5ef6\u8fdf\u8d85\u8fc7 200ms \u6301\u7eed 5 \u5206\u949f\uff0c\u53d1\u9001 Slack \u901a\u77e5\u3002\"\"\u5982\u679c\u6570\u636e\u6f02\u79fb\u8bc4\u5206\u8d85\u8fc7\u9608\u503c\uff0c\u901a\u77e5\u503c\u73ed\u5de5\u7a0b\u5e08\u3002\"</p> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/05.%20deployment%20and%20devops/#_5","title":"\u7279\u5f81\u5b58\u50a8","text":"<ul> <li> <p>\u7279\u5f81\u5b58\u50a8\u662f\u9884\u8ba1\u7b97\u7279\u5f81\u7684\u96c6\u4e2d\u5f0f\u4ed3\u5e93\uff0c\u5728\u8bad\u7ec3\u548c\u63a8\u7406\u4e4b\u95f4\u5171\u4eab\u3002\u5b83\u89e3\u51b3\u4e24\u4e2a\u95ee\u9898\uff1a</p> <ul> <li> <p>\u8bad\u7ec3-\u63a8\u7406\u504f\u5dee\uff1a\u8bad\u7ec3\u671f\u95f4\u4f7f\u7528\u7684\u7279\u5f81\u5fc5\u987b\u4e0e\u63a8\u7406\u671f\u95f4\u4f7f\u7528\u7684\u7279\u5f81\u5b8c\u5168\u76f8\u540c\u3002\u5982\u679c\u8bad\u7ec3\u4f7f\u7528\u4e00\u79cd\u65b9\u5f0f\u8ba1\u7b97\u7684 <code>user_age_at_signup</code>\uff0c\u800c\u63a8\u7406\u4f7f\u7528\u4e0d\u540c\u7684\u65b9\u5f0f\u8ba1\u7b97\uff0c\u6a21\u578b\u7684\u9884\u6d4b\u7ed3\u679c\u4f1a\u9759\u9ed8\u51fa\u9519\u3002</p> </li> <li> <p>\u7279\u5f81\u590d\u7528\uff1a\u591a\u4e2a\u6a21\u578b\u901a\u5e38\u4f7f\u7528\u76f8\u540c\u7684\u7279\u5f81\uff08\u7528\u6237\u4eba\u53e3\u7edf\u8ba1\u3001\u7269\u54c1\u5d4c\u5165\u3001\u805a\u5408\u7edf\u8ba1\uff09\u3002\u8ba1\u7b97\u4e00\u6b21\u5e76\u5171\u4eab\uff0c\u907f\u514d\u4e86\u91cd\u590d\u548c\u4e0d\u4e00\u81f4\u6027\u3002</p> </li> </ul> </li> <li> <p>Feast \u662f\u6700\u6d41\u884c\u7684\u5f00\u6e90\u7279\u5f81\u5b58\u50a8\u3002\u5b83\u7ba1\u7406\u5728\u7ebf\u7279\u5f81\uff08\u4f4e\u5ef6\u8fdf\uff0c\u4ece Redis \u6216 DynamoDB \u63d0\u4f9b\uff09\u548c\u79bb\u7ebf\u7279\u5f81\uff08\u6279\u5904\u7406\uff0c\u5b58\u50a8\u5728\u6570\u636e\u4ed3\u5e93\u4e2d\u7528\u4e8e\u8bad\u7ec3\uff09\u3002</p> </li> <li> <p>\u7279\u5f81\u5b58\u50a8\u5bf9\u4e8e\u63a8\u8350\u7cfb\u7edf\u3001\u6b3a\u8bc8\u68c0\u6d4b\u4ee5\u53ca\u4efb\u4f55\u7279\u5f81\u4ece\u539f\u59cb\u6570\u636e\u7ba1\u9053\u8ba1\u7b97\u800c\u6765\u7684\u5e94\u7528\u90fd\u81f3\u5173\u91cd\u8981\u3002</p> </li> </ul>"},{"location":"chapter%2015%3A%20production%20software%20engineering/05.%20deployment%20and%20devops/#_6","title":"\u7ba1\u9053\u7f16\u6392","text":"<ul> <li> <p>\u751f\u4ea7\u7ea7\u673a\u5668\u5b66\u4e60\u7cfb\u7edf\u4e0d\u4ec5\u4ec5\u662f\u6a21\u578b\u3002\u5b83\u662f\u4e00\u4e2a\u7ba1\u9053\uff1a\u6570\u636e\u91c7\u96c6 \u2192 \u9884\u5904\u7406 \u2192 \u7279\u5f81\u8ba1\u7b97 \u2192 \u8bad\u7ec3 \u2192 \u8bc4\u4f30 \u2192 \u90e8\u7f72 \u2192 \u76d1\u63a7\u3002\u6bcf\u4e2a\u6b65\u9aa4\u4f9d\u8d56\u4e8e\u524d\u4e00\u6b65\u9aa4\uff0c\u53ef\u4ee5\u72ec\u7acb\u5931\u8d25\uff0c\u53ef\u80fd\u9700\u8981\u5728\u4e0d\u540c\u7684\u65f6\u95f4\u8868\u4e0a\u8fd0\u884c\u3002</p> </li> <li> <p>\u7f16\u6392\u5668\u7ba1\u7406\u8fd9\u4e9b\u7ba1\u9053\uff1a</p> </li> <li> <p>Apache Airflow\uff1a\u6570\u636e\u7ba1\u9053\u7f16\u6392\u7684\u6807\u51c6\u65b9\u6848\u3002DAG\uff08\u6709\u5411\u65e0\u73af\u56fe\uff09\u5b9a\u4e49\u4efb\u52a1\u4f9d\u8d56\u5173\u7cfb\u3002\u6bcf\u4e2a\u4efb\u52a1\u72ec\u7acb\u8fd0\u884c\uff0c\u5931\u8d25\u65f6\u53ef\u4ee5\u91cd\u8bd5\uff0c\u5e76\u901a\u8fc7 Web UI \u8fdb\u884c\u76d1\u63a7\u3002</p> </li> </ul> <pre><code># airflow DAG \u793a\u4f8b\uff08\u7b80\u5316\uff09\nfrom airflow import DAG\nfrom airflow.operators.python import PythonOperator\n\ndag = DAG(\"training_pipeline\", schedule=\"@daily\")\n\npreprocess = PythonOperator(task_id=\"preprocess\", python_callable=preprocess_data, dag=dag)\ntrain = PythonOperator(task_id=\"train\", python_callable=train_model, dag=dag)\nevaluate = PythonOperator(task_id=\"evaluate\", python_callable=evaluate_model, dag=dag)\ndeploy = PythonOperator(task_id=\"deploy\", python_callable=deploy_model, dag=dag)\n\npreprocess &gt;&gt; train &gt;&gt; evaluate &gt;&gt; deploy\n</code></pre> <ul> <li> <p>Kubeflow Pipelines\uff1a\u5728 Kubernetes \u4e0a\u8fd0\u884c\u673a\u5668\u5b66\u4e60\u7279\u5b9a\u7f16\u6392\u3002\u6bcf\u4e2a\u6b65\u9aa4\u5728\u5bb9\u5668\u4e2d\u8fd0\u884c\uff0cGPU \u8d44\u6e90\u6309\u9700\u5206\u914d\uff0c\u5b9e\u9a8c\u81ea\u52a8\u8ffd\u8e2a\u3002</p> </li> <li> <p>Prefect \u548c Dagster\uff1aAirflow \u7684\u73b0\u4ee3\u66ff\u4ee3\u65b9\u6848\uff0c\u62e5\u6709\u66f4\u597d\u7684\u5f00\u53d1\u8005\u4f53\u9a8c\u3001\u539f\u751f Python API \u548c\u5185\u7f6e\u6570\u636e\u8840\u7f18\u8ffd\u8e2a\u3002</p> </li> <li> <p>\u4f55\u65f6\u9700\u8981\u7f16\u6392\uff1a\u5f53\u4f60\u7684\u7ba1\u9053\u6709\u8d85\u8fc7 2-3 \u4e2a\u6b65\u9aa4\u3001\u6309\u8ba1\u5212\u8fd0\u884c\u3001\u6d89\u53ca\u591a\u4e2a\u56e2\u961f\u6216\u670d\u52a1\u3001\u6216\u9700\u8981\u81ea\u52a8\u6545\u969c\u6062\u590d\u65f6\u3002\u5355\u4e00\u811a\u672c\u7684\u8bad\u7ec3\u4efb\u52a1\u4e0d\u9700\u8981\u7f16\u6392\u5668\u3002\u6bcf\u5929\u91cd\u65b0\u8bad\u7ec3\u7684\u7ba1\u9053\u2014\u2014\u4ece 5 \u4e2a\u6570\u636e\u6e90\u91c7\u96c6\u6570\u636e\u3001\u8bad\u7ec3 3 \u4e2a\u6a21\u578b\u3001\u8bc4\u4f30\u5b83\u4eec\u5e76\u90e8\u7f72\u6700\u4f73\u6a21\u578b\u2014\u2014\u7edd\u5bf9\u9700\u8981\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/00.%20why%20C%2B%2B%20and%20how%20ML%20frameworks%20work/","title":"\u4e3a\u4ec0\u4e48\u662fC++\u4ee5\u53caML\u6846\u67b6\u5982\u4f55\u5de5\u4f5c","text":"<p>\u672c\u4e66\u4e2d\u6bcf\u4e00\u6b21 <code>jnp.matmul</code>\u3001\u6bcf\u4e00\u6b21 <code>torch.nn.Linear</code>\u3001\u6bcf\u4e00\u6b21 <code>np.dot</code> \u8c03\u7528\uff0c\u5e95\u5c42\u90fd\u5728\u6267\u884cC++\u548cCUDA\u4ee3\u7801\u3002\u672c\u6587\u6863\u63ed\u5f00\u5e37\u5e55\uff1a\u4e3a\u4f55ML\u6846\u67b6\u91c7\u7528\u8fd9\u79cd\u67b6\u6784\uff0c\u9762\u5411Python\u5de5\u7a0b\u5e08\u7684C++\u5feb\u901f\u5165\u95e8\uff0c\u4f55\u65f6\u7f16\u5199\u81ea\u5b9a\u4e49C++\u6838\u51fd\u6570\uff0c\u4ee5\u53ca\u5982\u4f55\u5c06\u5176\u7ed1\u5b9a\u5230Python\u2014\u2014\u8fd9\u662f\u8fde\u63a5\u4f60\u6240\u5199\u4ee3\u7801\u4e0e\u6240\u8fd0\u884c\u786c\u4ef6\u4e4b\u95f4\u7684\u6865\u6881\u3002</p> <ul> <li> <p>\u4f60\u82b1\u4e8615\u7ae0\u5199Python\u3002\u4f60\u5bfc\u5165\u4e86JAX\uff0c\u8c03\u7528\u4e86<code>jax.grad</code>\uff0c\u8fd0\u884c\u4e86\u8bad\u7ec3\u5faa\u73af\uff0c\u6784\u5efa\u4e86\u6a21\u578b\u3002\u4e00\u5207\u611f\u89c9\u90fd\u50cf\u662fPython\u3002\u4f46\u4e8b\u5b9e\u662f\uff1a\u51e0\u4e4e\u6ca1\u6709\u5b9e\u9645\u8ba1\u7b97\u53d1\u751f\u5728Python\u4e2d\u3002</p> </li> <li> <p>\u5f53\u4f60\u5728PyTorch\u4e2d\u5199 <code>output = model(input)</code> \u6216\u5728JAX\u4e2d\u5199 <code>output = jnp.matmul(W, x)</code> \u65f6\uff0cPython\u51e0\u4e4e\u4ec0\u4e48\u90fd\u4e0d\u505a\u3002\u5b83\u6784\u5efa\u4e00\u4e2a\u8ba1\u7b97\u7684\u63cf\u8ff0\uff08\u4e00\u4e2a\u64cd\u4f5c\u56fe\uff09\uff0c\u7136\u540e\u5c06\u5176\u4ea4\u7ed9\u6267\u884c\u771f\u6b63\u5de5\u4f5c\u7684C++/CUDA\u540e\u7aef\u3002Python\u662f\u65b9\u5411\u76d8\uff1bC++\u662f\u5f15\u64ce\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/00.%20why%20C%2B%2B%20and%20how%20ML%20frameworks%20work/#pythonc","title":"\u4e3a\u4ec0\u4e48Python\u524d\u7aef\u642d\u914dC++\u540e\u7aef","text":"<ul> <li>\u8fd9\u79cd\u53cc\u8bed\u8a00\u67b6\u6784\u7684\u5b58\u5728\u662f\u56e0\u4e3aPython\u548cC++\u64c5\u957f\u622a\u7136\u4e0d\u540c\u7684\u4e8b\u60c5\uff1a</li> </ul> Python C++ \u5f00\u53d1\u901f\u5ea6 \u5feb\uff08\u52a8\u6001\u7c7b\u578b\u3001REPL\u3001\u65e0\u9700\u7f16\u8bd1\uff09 \u6162\uff08\u9759\u6001\u7c7b\u578b\u3001\u5934\u6587\u4ef6\u3001\u7f16\u8bd1\u65f6\u95f4\u957f\uff09 \u6267\u884c\u901f\u5ea6 \u6bd4C\u6162\u7ea6100\u500d\uff08\u89e3\u91ca\u578b\u3001GIL\uff09 \u63a5\u8fd1\u786c\u4ef6\u901f\u5ea6\uff08\u7f16\u8bd1\u578b\u3001\u65e0\u5f00\u9500\uff09 \u5185\u5b58\u63a7\u5236 \u81ea\u52a8\uff08GC\uff09\uff0c\u65e0\u6cd5\u63a7\u5236\u5e03\u5c40 \u624b\u52a8\uff0c\u7cbe\u786e\u63a7\u5236\u6bcf\u4e00\u4e2a\u5b57\u8282 \u786c\u4ef6\u8bbf\u95ee \u65e0\uff08\u65e0SIMD\u3001\u65e0GPU\u3001\u65e0\u81ea\u5b9a\u4e49\u5185\u5b58\uff09 \u5168\u9762\uff08\u5185\u8054\u51fd\u6570\u3001CUDA\u3001\u5185\u8054\u6c47\u7f16\uff09 \u751f\u6001\u7cfb\u7edf ML\u4e30\u5bcc\uff08\u7b14\u8bb0\u672c\u3001\u53ef\u89c6\u5316\u3001\u6570\u636e\uff09 \u7cfb\u7edf\u4e30\u5bcc\uff08\u64cd\u4f5c\u7cfb\u7edf\u3001\u9a71\u52a8\u3001\u5f15\u64ce\uff09 <ul> <li> <p>\u6838\u5fc3\u89c1\u89e3\uff1a\u6bcf\u79cd\u8bed\u8a00\u53d1\u6325\u5176\u4f18\u52bf\u3002Python\u5904\u7406\u4eba\u529b\u751f\u4ea7\u529b\u91cd\u8981\u7684\u4e8b\u52a1\uff08\u5b9e\u9a8c\u8bbe\u8ba1\u3001\u8d85\u53c2\u6570\u8c03\u4f18\u3001\u6570\u636e\u63a2\u7d22\uff09\u3002C++\u5904\u7406\u673a\u5668\u6027\u80fd\u91cd\u8981\u7684\u4e8b\u52a1\uff08\u77e9\u9635\u4e58\u6cd5\u3001\u5377\u79ef\u3001\u6ce8\u610f\u529b\u6838\u51fd\u6570\uff09\u3002</p> </li> <li> <p>\u4e00\u6b21\u77e9\u9635\u4e58\u6cd5 <code>jnp.matmul(A, B)</code>\uff0c\u5176\u4e2d \\(A\\) \u4e3a \\(4096 \\times 4096\\)\uff0c\u6267\u884c\u7ea61370\u4ebf\u6b21\u6d6e\u70b9\u8fd0\u7b97\u3002\u5728\u7eafPython\uff08\u5d4c\u5957\u5faa\u73af\uff09\u4e2d\u9700\u8981\u7ea630\u5206\u949f\u3002\u5728\u4f7f\u7528AVX-512 SIMD\u548c\u591a\u7ebf\u7a0b\u4f18\u5316\u540e\u7684C++\u4e2d\uff0c\u53ea\u9700\u7ea610\u6beb\u79d2\u3002\u5dee\u8ddd\u8fbe180,000\u500d\u3002\u518d\u591a\u7684Python\u6280\u5de7\u4e5f\u65e0\u6cd5\u5f25\u5408\u8fd9\u4e00\u9e3f\u6c9f\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/00.%20why%20C%2B%2B%20and%20how%20ML%20frameworks%20work/#ml","title":"ML\u6846\u67b6\u7684\u7ed3\u6784","text":"<ul> <li>\u6bcf\u4e2a\u4e3b\u6d41ML\u6846\u67b6\u90fd\u9075\u5faa\u76f8\u540c\u7684\u67b6\u6784\uff1a</li> </ul> <pre><code>\u7528\u6237\u4ee3\u7801\uff08Python\uff09\n    \u2193\nPython API\u5c42\uff08torch.nn\u3001jax.numpy\u3001numpy\uff09\n    \u2193\n\u8c03\u5ea6/JIT\u7f16\u8bd1\u5668\uff08torch.compile\u3001XLA\u3001NumPy\u8c03\u5ea6\uff09\n    \u2193\nC++\u6838\u51fd\u6570\u5e93\uff08ATen/PyTorch\u3001XLA\u3001BLAS/LAPACK\uff09\n    \u2193\n\u786c\u4ef6\u7279\u5b9a\u540e\u7aef\uff08CUDA\u3001cuDNN\u3001MKL\u3001oneDNN\u3001Metal\uff09\n    \u2193\n\u786c\u4ef6\uff08CPU SIMD\u5355\u5143\u3001GPU\u6838\u5fc3\u3001TPU MXU\uff09\n</code></pre>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/00.%20why%20C%2B%2B%20and%20how%20ML%20frameworks%20work/#numpy","title":"NumPy","text":"<ul> <li> <p>NumPy\u7684\u6838\u5fc3\u7528C\u7f16\u5199\u3002\u5f53\u4f60\u8c03\u7528 <code>np.dot(A, B)</code> \u65f6\uff0cPython\u8c03\u7528\u4e00\u4e2aC\u51fd\u6570\uff0c\u8be5\u51fd\u6570\u8c03\u7528BLAS\uff08\u57fa\u672c\u7ebf\u6027\u4ee3\u6570\u5b50\u7a0b\u5e8f\uff09\uff0c\u901a\u5e38\u662fIntel MKL\u6216OpenBLAS\u3002BLAS\u662f\u624b\u5de5\u4f18\u5316\u7684C\u548cFortran\u4ee3\u7801\uff0c\u4f7f\u7528SIMD\u6307\u4ee4\u3001\u7f13\u5b58\u611f\u77e5\u7684\u5185\u5b58\u8bbf\u95ee\u6a21\u5f0f\u548c\u591a\u7ebf\u7a0b\u3002\u6570\u5341\u5e74\u4f18\u5316\u81f4\u529b\u4e8e\u8ba9\u77e9\u9635\u4e58\u6cd5\u66f4\u5feb\u3002</p> </li> <li> <p>NumPy\u4ec5\u652f\u6301CPU\uff0c\u4e0d\u4f7f\u7528GPU\u3002\u4f46\u5728CPU\u4e0a\uff0c\u5b83\u6781\u5176\u5feb\u901f\uff0c\u56e0\u4e3a\u5b83\u59d4\u6258\u7ed9\u53ef\u7528\u7684\u6700\u4f73BLAS\u5b9e\u73b0\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/00.%20why%20C%2B%2B%20and%20how%20ML%20frameworks%20work/#pytorch","title":"PyTorch","text":"<ul> <li> <p>PyTorch\u7684\u8ba1\u7b97\u5f15\u64ce\u662fATen\uff08\u5f20\u91cf\u5e93\uff09\uff0c\u7528C++\u7f16\u5199\u3002ATen\u5b9e\u73b0\u4e86\u7ea62000\u4e2a\u5f20\u91cf\u64cd\u4f5c\uff08add\u3001matmul\u3001conv2d\u3001softmax...\uff09\uff0c\u6bcf\u4e2a\u90fd\u6709CPU\u548cCUDA\u540e\u7aef\u3002</p> </li> <li> <p>\u5f53\u4f60\u8c03\u7528 <code>torch.matmul(A, B)</code> \u65f6\uff1a</p> <ol> <li>Python\u8c03\u5ea6\u5230ATen\u7684C++\u51fd\u6570\u3002</li> <li>ATen\u68c0\u67e5\u8bbe\u5907\uff08CPU\u6216CUDA\uff09\u548c\u6570\u636e\u7c7b\u578b\u3002</li> <li>\u5728CPU\u4e0a\uff1a\u8c03\u7528MKL/OpenBLAS\u3002\u5728GPU\u4e0a\uff1a\u8c03\u7528cuBLAS\uff08NVIDIA\u7684GPU\u4f18\u5316BLAS\uff09\u3002</li> <li>\u7ed3\u679c\u5305\u88c5\u5728Python\u5f20\u91cf\u5bf9\u8c61\u4e2d\u5e76\u8fd4\u56de\u3002</li> </ol> </li> <li> <p>torch.compile\uff08PyTorch 2.0+\uff09\u66f4\u8fdb\u4e00\u6b65\uff1a\u5b83\u8ffd\u8e2a\u4f60\u7684Python\u4ee3\u7801\uff0c\u6784\u5efa\u8ba1\u7b97\u56fe\uff0c\u5e76\u4f7f\u7528Triton\uff08GPU\uff09\u6216C++/OpenMP\uff08CPU\uff09\u7f16\u8bd1\u3002\u7f16\u8bd1\u540e\u7684\u4ee3\u7801\u878d\u5408\u64cd\u4f5c\uff0c\u6d88\u9664Python\u5f00\u9500\uff0c\u53ef\u4ee5\u6bd4\u5373\u65f6\u6a21\u5f0f\u5feb2-5\u500d\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/00.%20why%20C%2B%2B%20and%20how%20ML%20frameworks%20work/#jax","title":"JAX","text":"<ul> <li> <p>JAX\u5c06Python\u51fd\u6570\u7f16\u8bd1\u4e3aXLA\uff08\u52a0\u901f\u7ebf\u6027\u4ee3\u6570\uff09\uff0cGoogle\u7684ML\u7f16\u8bd1\u5668\u3002\u5f53\u4f60 <code>jax.jit</code> \u4e00\u4e2a\u51fd\u6570\u65f6\uff1a</p> <ol> <li>JAX\u8ffd\u8e2a\u51fd\u6570\uff0c\u5c06\u64cd\u4f5c\u6355\u83b7\u4e3aXLA\u8ba1\u7b97\u56fe\uff08HLO\u2014\u2014\u9ad8\u7ea7\u64cd\u4f5c\uff09\u3002</li> <li>XLA\u4f18\u5316\u56fe\uff1a\u878d\u5408\u64cd\u4f5c\uff0c\u6d88\u9664\u5197\u4f59\u8ba1\u7b97\uff0c\u4f18\u5316\u5185\u5b58\u5e03\u5c40\u3002</li> <li>XLA\u7f16\u8bd1\u4e3a\u76ee\u6807\u540e\u7aef\uff1aCPU\uff08\u901a\u8fc7LLVM\uff09\u3001GPU\uff08\u901a\u8fc7CUDA/PTX\uff09\u6216TPU\uff08\u901a\u8fc7TPU\u7279\u5b9a\u6307\u4ee4\uff09\u3002</li> <li>\u7f16\u8bd1\u540e\u7684\u4ee3\u7801\u76f4\u63a5\u5728\u786c\u4ef6\u4e0a\u8fd0\u884c\uff0c\u96f6Python\u53c2\u4e0e\u3002</li> </ol> </li> <li> <p>\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48 <code>jax.jit</code> \u5982\u6b64\u91cd\u8981\uff1a\u6ca1\u6709\u5b83\uff0c\u6bcf\u4e2a\u64cd\u4f5c\u90fd\u662f\u72ec\u7acb\u7684Python\u2192C++\u5f80\u8fd4\u3002\u6709\u4e86\u5b83\uff0c\u6574\u4e2a\u51fd\u6570\u662f\u4e00\u4e2a\u5355\u4e00\u7684\u7f16\u8bd1\u6838\u51fd\u6570\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/00.%20why%20C%2B%2B%20and%20how%20ML%20frameworks%20work/#pythonc_1","title":"\u9762\u5411Python\u5de5\u7a0b\u5e08\u7684C++\u5feb\u901f\u5165\u95e8","text":"<ul> <li>\u4f60\u4e0d\u9700\u8981\u6210\u4e3aC++\u4e13\u5bb6\u3002\u4f60\u9700\u8981\u7406\u89e3\u8db3\u591f\u7684\u77e5\u8bc6\u6765\u9605\u8bfb\u6838\u51fd\u6570\u4ee3\u7801\u3001\u7f16\u5199\u7b80\u5355\u7684\u6269\u5c55\u4ee5\u53ca\u7406\u89e3\u6027\u80fd\u8ba8\u8bba\u3002\u4ee5\u4e0b\u662f\u7cbe\u534e\u5185\u5bb9\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/00.%20why%20C%2B%2B%20and%20how%20ML%20frameworks%20work/#_1","title":"\u7c7b\u578b\u548c\u53d8\u91cf","text":"<pre><code>// C++\u9700\u8981\u663e\u5f0f\u7c7b\u578b\uff08\u4e0d\u50cfPython\uff09\nint count = 0;           // 32\u4f4d\u6574\u6570\nfloat loss = 0.5f;       // 32\u4f4d\u6d6e\u70b9\u6570\ndouble lr = 3e-4;        // 64\u4f4d\u6d6e\u70b9\u6570\nbool training = true;    // \u5e03\u5c14\u503c\n\n// \u6570\u7ec4\uff08\u56fa\u5b9a\u5927\u5c0f\uff0c\u6808\u5206\u914d\uff09\nfloat weights[1024];     // 1024\u4e2a\u6d6e\u70b9\u6570\uff0c\u5185\u5b58\u4e2d\u8fde\u7eed\n\n// \u6307\u9488\uff1a\u4fdd\u5b58\u5185\u5b58\u5730\u5740\u7684\u53d8\u91cf\nfloat* ptr = weights;    // ptr\u6307\u5411weights\u7684\u7b2c\u4e00\u4e2a\u5143\u7d20\nfloat val = ptr[42];     // \u901a\u8fc7\u6307\u9488\u8fd0\u7b97\u8bbf\u95ee\u5143\u7d2042\n// ptr[42] \u7b49\u4ef7\u4e8e *(ptr + 42)\n</code></pre> <ul> <li>\u6307\u9488\u662f\u4e0ePython\u6700\u5927\u7684\u6982\u5ff5\u5dee\u5f02\u3002\u5728Python\u4e2d\uff0c\u4e00\u5207\u90fd\u662f\u5f15\u7528\uff0c\u4f60\u4ece\u4e0d\u9700\u8981\u601d\u8003\u5185\u5b58\u5730\u5740\u3002\u5728C++\u4e2d\uff0c\u6307\u9488\u8ba9\u4f60\u76f4\u63a5\u8bbf\u95ee\u5185\u5b58\u2014\u2014\u5f3a\u5927\u4f46\u5371\u9669\uff08\u60ac\u7a7a\u6307\u9488\u3001\u7f13\u51b2\u533a\u6ea2\u51fa\uff09\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/00.%20why%20C%2B%2B%20and%20how%20ML%20frameworks%20work/#_2","title":"\u51fd\u6570","text":"<pre><code>// \u51fd\u6570\u58f0\u660e\uff1a\u8fd4\u56de\u7c7b\u578b \u540d\u5b57(\u53c2\u6570\u7c7b\u578b \u53c2\u6570\u540d)\nfloat relu(float x) {\n    return x &gt; 0.0f ? x : 0.0f;\n}\n\n// \u4f20\u5f15\u7528\uff08\u907f\u514d\u62f7\u8d1d\u5927\u5bf9\u8c61\uff09\nvoid scale_vector(std::vector&lt;float&gt;&amp; vec, float factor) {\n    for (size_t i = 0; i &lt; vec.size(); i++) {\n        vec[i] *= factor;\n    }\n}\n\n// const\u5f15\u7528\uff1a\u53ea\u8bfb\uff0c\u65e0\u62f7\u8d1d\nfloat sum(const std::vector&lt;float&gt;&amp; vec) {\n    float total = 0.0f;\n    for (float x : vec) {  // \u57fa\u4e8e\u8303\u56f4\u7684for\u5faa\u73af\uff08\u7c7b\u4f3cPython\u7684for x in vec\uff09\n        total += x;\n    }\n    return total;\n}\n</code></pre>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/00.%20why%20C%2B%2B%20and%20how%20ML%20frameworks%20work/#_3","title":"\u5185\u5b58\uff1a\u6808\u4e0e\u5806","text":"<pre><code>// \u6808\u5206\u914d\uff1a\u5feb\u901f\uff0c\u81ea\u52a8\u751f\u547d\u5468\u671f\uff08\u51fd\u6570\u8fd4\u56de\u65f6\u91ca\u653e\uff09\nfloat buffer[256];   // \u6808\u4e0a\u7684256\u4e2a\u6d6e\u70b9\u6570\n\n// \u5806\u5206\u914d\uff1a\u624b\u52a8\uff0c\u5728\u51fd\u6570\u5916\u4ecd\u7136\u5b58\u6d3b\nfloat* data = new float[n];   // \u5728\u5806\u4e0a\u5206\u914dn\u4e2a\u6d6e\u70b9\u6570\n// ... \u4f7f\u7528data ...\ndelete[] data;                 // \u5fc5\u987b\u624b\u52a8\u91ca\u653e\uff08\u6ca1\u6709\u5783\u573e\u56de\u6536\u5668\uff09\n\n// \u73b0\u4ee3C++\uff1a\u667a\u80fd\u6307\u9488\uff08\u81ea\u52a8\u6e05\u7406\uff0c\u7c7b\u4f3cPython\u5f15\u7528\uff09\n#include &lt;memory&gt;\nauto data = std::make_unique&lt;float[]&gt;(n);  // \u79bb\u5f00\u4f5c\u7528\u57df\u65f6\u81ea\u52a8\u91ca\u653e\n</code></pre> <ul> <li>\u5173\u952e\u89c4\u5219\uff1a\u6808\u5feb\u901f\u4f46\u6709\u9650\uff08\u901a\u5e381-8 MB\uff09\u3002\u5927\u6570\u7ec4\uff08\u5f20\u91cf\u3001\u7279\u5f81\u56fe\uff09\u5fc5\u987b\u653e\u5728\u5806\u4e0a\u3002\u5728Python\u4e2d\uff0c\u4e00\u5207\u90fd\u5728\u5806\u4e0a\uff0cGC\u5904\u7406\u6e05\u7406\u3002\u5728C++\u4e2d\uff0c\u4f60\u81ea\u884c\u7ba1\u7406\uff08\u6216\u4f7f\u7528\u667a\u80fd\u6307\u9488\uff09\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/00.%20why%20C%2B%2B%20and%20how%20ML%20frameworks%20work/#_4","title":"\u6a21\u677f\uff08\u6cdb\u578b\uff09","text":"<pre><code>// \u9002\u7528\u4e8e\u4efb\u4f55\u6570\u503c\u7c7b\u578b\u7684\u51fd\u6570\ntemplate &lt;typename T&gt;\nT add(T a, T b) {\n    return a + b;\n}\n\nadd&lt;float&gt;(1.5f, 2.5f);   // \u8fd4\u56de 4.0f\nadd&lt;int&gt;(3, 4);             // \u8fd4\u56de 7\n</code></pre> <ul> <li>\u6a21\u677f\u662fC++\u5e93\uff08\u5982ATen\uff09\u7f16\u5199\u9002\u7528\u4e8efloat16\u3001float32\u3001float64\u7b49\u7684\u4ee3\u7801\u800c\u4e0d\u91cd\u590d\u5b9e\u73b0\u7684\u65b9\u5f0f\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/00.%20why%20C%2B%2B%20and%20how%20ML%20frameworks%20work/#_5","title":"\u6807\u51c6\u5e93\u7cbe\u534e","text":"<pre><code>#include &lt;vector&gt;      // \u52a8\u6001\u6570\u7ec4\uff08\u7c7b\u4f3cPython list\uff09\n#include &lt;string&gt;      // \u5b57\u7b26\u4e32\u7c7b\u578b\n#include &lt;unordered_map&gt;  // \u54c8\u5e0c\u6620\u5c04\uff08\u7c7b\u4f3cPython dict\uff09\n#include &lt;algorithm&gt;   // sort\u3001find\u3001transform\u7b49\n#include &lt;cmath&gt;       // \u6570\u5b66\u51fd\u6570\n\nstd::vector&lt;float&gt; vec = {1.0f, 2.0f, 3.0f};\nvec.push_back(4.0f);            // \u8ffd\u52a0\nfloat first = vec[0];           // \u7d22\u5f15\nsize_t len = vec.size();        // \u957f\u5ea6\n\nstd::unordered_map&lt;std::string, int&gt; counts;\ncounts[\"hello\"] = 5;            // \u63d2\u5165\nif (counts.count(\"hello\")) { }  // \u68c0\u67e5\u5b58\u5728\u6027\n</code></pre>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/00.%20why%20C%2B%2B%20and%20how%20ML%20frameworks%20work/#c","title":"\u4f55\u65f6\u7f16\u5199\u81ea\u5b9a\u4e49C++\u6838\u51fd\u6570","text":"<ul> <li> <p>\u5927\u591a\u6570ML\u5de5\u7a0b\u5e08\u4ece\u4e0d\u9700\u8981\u5199C++\u3002\u6846\u67b6\u7684\u5185\u7f6e\u64cd\u4f5c\u8986\u76d6\u4e8699%\u7684\u7528\u4f8b\u3002\u4ec5\u5728\u4ee5\u4e0b\u60c5\u51b5\u8003\u8651\u81ea\u5b9a\u4e49C++\uff1a</p> </li> <li> <p>\u6846\u67b6\u4e2d\u4e0d\u5b58\u5728\u4f60\u7684\u64cd\u4f5c\uff1a\u65b0\u9896\u7684\u6fc0\u6d3b\u51fd\u6570\u3001\u81ea\u5b9a\u4e49\u6ce8\u610f\u529b\u6a21\u5f0f\u3001\u65e0\u6cd5\u8868\u793a\u4e3a\u73b0\u6709\u64cd\u4f5c\u7ec4\u5408\u7684\u7279\u6b8a\u635f\u5931\u51fd\u6570\u3002</p> </li> <li> <p>\u878d\u5408\u64cd\u4f5c\u4ee5\u63d0\u9ad8\u6027\u80fd\uff1a\u4f60\u7684\u6a21\u578b\u6267\u884c <code>relu(layernorm(matmul(x, W) + b))</code>\u3002\u6bcf\u4e2a\u64cd\u4f5c\u542f\u52a8\u4e00\u4e2a\u72ec\u7acb\u7684\u6838\u51fd\u6570\uff0c\u8bfb\u5199\u5185\u5b58\uff0c\u5e76\u540c\u6b65\u3002\u4e00\u4e2a\u878d\u5408\u6838\u51fd\u6570\u5728\u4e00\u6b21\u904d\u5386\u4e2d\u5b8c\u6210\u6240\u6709\u5de5\u4f5c\uff0c\u907f\u514d\u5185\u5b58\u5f80\u8fd4\u3002\u8fd9\u53ef\u5feb2-5\u500d\u3002</p> </li> <li> <p>\u51cf\u5c11\u5185\u5b58\u4f7f\u7528\uff1a\u81ea\u5b9a\u4e49\u6838\u51fd\u6570\u53ef\u4ee5\u5728\u4e0d\u5b58\u50a8\u6240\u6709\u4e2d\u95f4\u6fc0\u6d3b\u7684\u60c5\u51b5\u4e0b\u8ba1\u7b97\u68af\u5ea6\uff08\u6838\u51fd\u6570\u7ea7\u522b\u7684\u68af\u5ea6\u68c0\u67e5\u70b9\uff09\u3002</p> </li> <li> <p>\u9488\u5bf9\u65b0\u578b\u786c\u4ef6\uff1a\u65b0\u7684\u52a0\u901f\u5668\uff08\u5982Cerebras\u3001Groq\uff09\u53ef\u80fd\u6ca1\u6709\u6846\u67b6\u652f\u6301\u3002\u4f60\u9700\u8981\u76f4\u63a5\u7f16\u5199\u6838\u51fd\u6570\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u60c5\u51b51-2\uff0cTriton\uff08\u7b2c16\u7ae0\u6587\u4ef605\uff09\u901a\u5e38\u8db3\u591f\u4e14\u6bd4\u76f4\u63a5\u7f16\u5199CUDA C\u66f4\u7b80\u5355\u3002\u53ea\u6709\u5728Triton\u65e0\u6cd5\u8868\u8fbe\u4f60\u7684\u9700\u6c42\u65f6\u624d\u4e0b\u964d\u5230CUDA C\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/00.%20why%20C%2B%2B%20and%20how%20ML%20frameworks%20work/#cpython","title":"\u5982\u4f55\u5c06C++\u7ed1\u5b9a\u5230Python","text":"<ul> <li>\u7f16\u5199C++\u53ea\u662f\u5de5\u4f5c\u7684\u4e00\u534a\u3002\u4f60\u8fd8\u9700\u8981\u4ecePython\u8c03\u7528\u5b83\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/00.%20why%20C%2B%2B%20and%20how%20ML%20frameworks%20work/#pybind11","title":"pybind11\uff08\u901a\u7528\u76ee\u7684\uff09","text":"<ul> <li>pybind11\u7528\u6700\u5c11\u7684\u6837\u677f\u4ee3\u7801\u4e3aC++\u51fd\u6570\u521b\u5efaPython\u7ed1\u5b9a\uff1a</li> </ul> <pre><code>// my_ops.cpp\n#include &lt;pybind11/pybind11.h&gt;\n#include &lt;pybind11/numpy.h&gt;\nnamespace py = pybind11;\n\n// \u4e00\u4e2a\u7b80\u5355\u7684\u81ea\u5b9a\u4e49\u64cd\u4f5c\npy::array_t&lt;float&gt; custom_relu(py::array_t&lt;float&gt; input) {\n    auto buf = input.request();\n    float* ptr = static_cast&lt;float*&gt;(buf.ptr);\n    size_t n = buf.size;\n\n    auto result = py::array_t&lt;float&gt;(n);\n    float* out = static_cast&lt;float*&gt;(result.request().ptr);\n\n    for (size_t i = 0; i &lt; n; i++) {\n        out[i] = ptr[i] &gt; 0 ? ptr[i] : 0;\n    }\n    return result;\n}\n\nPYBIND11_MODULE(my_ops, m) {\n    m.def(\"custom_relu\", &amp;custom_relu, \"\u81ea\u5b9a\u4e49ReLU\u64cd\u4f5c\");\n}\n</code></pre> <pre><code># \u7f16\u8bd1\npip install pybind11\nc++ -O3 -shared -std=c++17 -fPIC $(python3 -m pybind11 --includes) my_ops.cpp -o my_ops$(python3-config --extension-suffix)\n</code></pre> <pre><code># \u4ecePython\u4f7f\u7528\nimport my_ops\nimport numpy as np\n\nx = np.array([-1.0, 2.0, -3.0, 4.0], dtype=np.float32)\ny = my_ops.custom_relu(x)\nprint(y)  # [0. 2. 0. 4.]\n</code></pre>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/00.%20why%20C%2B%2B%20and%20how%20ML%20frameworks%20work/#pytorch-c","title":"PyTorch C++\u6269\u5c55","text":"<ul> <li>PyTorch\u63d0\u4f9b\u4e86\u4e00\u79cd\u7b80\u5316\u7684\u65b9\u5f0f\u6765\u6dfb\u52a0\u81ea\u5b9a\u4e49\u64cd\u4f5c\uff1a</li> </ul> <pre><code>// custom_op.cpp\n#include &lt;torch/extension.h&gt;\n\ntorch::Tensor custom_gelu(torch::Tensor x) {\n    return x * 0.5 * (1.0 + torch::erf(x / std::sqrt(2.0)));\n}\n\nPYBIND11_MODULE(TORCH_EXTENSION_NAME, m) {\n    m.def(\"custom_gelu\", &amp;custom_gelu, \"\u81ea\u5b9a\u4e49GELU\u6fc0\u6d3b\u51fd\u6570\");\n}\n</code></pre> <pre><code># \u52a8\u6001\u52a0\u8f7d\u548c\u7f16\u8bd1\nfrom torch.utils.cpp_extension import load\n\ncustom_ops = load(\n    name=\"custom_ops\",\n    sources=[\"custom_op.cpp\"],\n    extra_cflags=[\"-O3\"],\n)\n\nx = torch.randn(1000)\ny = custom_ops.custom_gelu(x)\n</code></pre> <ul> <li><code>torch.utils.cpp_extension.load</code> \u7f16\u8bd1C++\u4ee3\u7801\uff0c\u521b\u5efa\u5171\u4eab\u5e93\uff0c\u5e76\u5c06\u5176\u4f5c\u4e3aPython\u6a21\u5757\u52a0\u8f7d\uff0c\u5168\u5728\u4e00\u4e2a\u8c03\u7528\u4e2d\u5b8c\u6210\u3002\u8fd9\u662f\u5728PyTorch\u4e2d\u5b9e\u9a8c\u81ea\u5b9a\u4e49C++\u64cd\u4f5c\u7684\u6700\u7b80\u5355\u65b9\u5f0f\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/00.%20why%20C%2B%2B%20and%20how%20ML%20frameworks%20work/#jax_1","title":"JAX\u81ea\u5b9a\u4e49\u8c03\u7528","text":"<ul> <li> <p>JAX\u4f7f\u7528XLA\u81ea\u5b9a\u4e49\u8c03\u7528\u3002\u8fc7\u7a0b\u66f4\u4e3a\u590d\u6742\uff08\u4f60\u9700\u8981\u5411XLA\u6ce8\u518c\u4e00\u4e2aC\u51fd\u6570\uff09\uff0c\u4f46\u6982\u5ff5\u76f8\u540c\uff1a\u7f16\u5199C/C++\uff0c\u7ed1\u5b9a\uff0c\u4ecePython\u8c03\u7528\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u5927\u591a\u6570JAX\u7528\u6237\uff0cPallas\uff08\u5728\u6587\u4ef605\u4e2d\u4ecb\u7ecd\uff09\u662f\u66f4\u597d\u7684\u9009\u62e9\uff1a\u5b83\u8ba9\u4f60\u7528\u7c7b\u4f3cPython\u7684\u8bed\u6cd5\u7f16\u5199GPU\u6838\u51fd\u6570\uff0c\u7531XLA\u7f16\u8bd1\uff0c\u65e0\u9700\u79bb\u5f00JAX\u751f\u6001\u7cfb\u7edf\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/00.%20why%20C%2B%2B%20and%20how%20ML%20frameworks%20work/#_6","title":"\u5927\u5c40\u89c2","text":"<ul> <li> <p>\u672c\u6587\u89e3\u91ca\u4e86Python\u548c\u786c\u4ef6\u4e4b\u95f4\u7684\u5c42\u6b21\u3002\u672c\u7ae0\u5269\u4f59\u6587\u4ef6\u5c06\u6df1\u5165\u63a2\u8ba8\uff1a</p> <ul> <li>\u6587\u4ef601\uff1a\u786c\u4ef6\u672c\u8eab\uff08CPU\u67b6\u6784\u3001GPU\u67b6\u6784\u3001\u5185\u5b58\u7cfb\u7edf\uff09</li> <li>\u6587\u4ef602-03\uff1aCPU\u4e0a\u7684SIMD\u7f16\u7a0b\uff08ARM NEON\u3001x86 AVX\uff09\u2014\u2014\u7f16\u5199\u4f7f\u7528CPU\u5411\u91cf\u5355\u5143\u7684C++\u4ee3\u7801</li> <li>\u6587\u4ef604\uff1a\u4f7f\u7528CUDA\u7684GPU\u7f16\u7a0b\u2014\u2014\u7f16\u5199\u5728\u6570\u5343\u4e2aGPU\u6838\u5fc3\u4e0a\u8fd0\u884c\u7684C++\u4ee3\u7801</li> <li>\u6587\u4ef605\uff1aTriton\u3001Pallas\u548c\u66f4\u9ad8\u7ea7\u7684GPU\u7f16\u7a0b\u2014\u2014\u7f16\u5199\u7f16\u8bd1\u4e3aGPU\u6838\u51fd\u6570\u7684Python\u4ee3\u7801</li> </ul> </li> <li> <p>\u8fd9\u79cd\u9012\u8fdb\u53cd\u6620\u4e86\u62bd\u8c61\u9636\u68af\uff1aC++\u5185\u8054\u51fd\u6570\uff08\u6700\u4f4e\u5c42\u3001\u6700\u591a\u63a7\u5236\uff09\u2192 CUDA\uff08GPU\u4e13\u7528\uff09\u2192 Triton/Pallas\uff08Python\u98ce\u683c\u3001\u7f16\u8bd1\u578b\uff09\u2192 JAX/PyTorch\uff08\u6700\u9ad8\u5c42\u3001\u81ea\u52a8\uff09\u3002\u6bcf\u4e00\u5c42\u4ee5\u63a7\u5236\u6743\u6362\u53d6\u4fbf\u5229\u6027\u3002\u7406\u89e3\u8f83\u4f4e\u5c42\u4f7f\u4f60\u6210\u4e3a\u8f83\u9ad8\u5c42\u7684\u66f4\u597d\u4f7f\u7528\u8005\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/00.%20why%20C%2B%2B%20and%20how%20ML%20frameworks%20work/#gclang","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u7528g++\u6216clang++\u7f16\u8bd1\uff09","text":"<ol> <li> <p>\u7f16\u5199\u4f60\u7684\u7b2c\u4e00\u4e2aC++\u7a0b\u5e8f\u3002\u5206\u914d\u4e00\u4e2a\u6570\u7ec4\uff0c\u586b\u5145\u6570\u636e\uff0c\u8ba1\u7b97\u603b\u548c\uff0c\u5e76\u6d4b\u91cf\u65f6\u95f4\u3002\u8fd9\u4ecb\u7ecd\u4e86\u7f16\u8bd1\u3001\u6570\u7ec4\u3001\u6307\u9488\u548c\u8ba1\u65f6\u3002 <pre><code>// task1_basics.cpp\n// \u7f16\u8bd1\uff1ag++ -O3 -o task1 task1_basics.cpp\n// \u8fd0\u884c\uff1a./task1\n\n#include &lt;iostream&gt;\n#include &lt;chrono&gt;\n#include &lt;vector&gt;\n\nint main() {\n    const int N = 10'000'000;  // C++\u5141\u8bb8'\u4f5c\u4e3a\u6570\u5b57\u5206\u9694\u7b26\n    std::vector&lt;float&gt; data(N);\n\n    // \u586b\u5145\u6570\u7ec4\n    for (int i = 0; i &lt; N; i++) {\n        data[i] = static_cast&lt;float&gt;(i) * 0.001f;\n    }\n\n    // \u8ba1\u7b97\u603b\u548c\n    auto start = std::chrono::high_resolution_clock::now();\n    float sum = 0.0f;\n    for (int i = 0; i &lt; N; i++) {\n        sum += data[i];\n    }\n    auto end = std::chrono::high_resolution_clock::now();\n    double elapsed = std::chrono::duration&lt;double, std::milli&gt;(end - start).count();\n\n    std::cout &lt;&lt; \"\u603b\u548c: \" &lt;&lt; sum &lt;&lt; std::endl;\n    std::cout &lt;&lt; \"\u65f6\u95f4: \" &lt;&lt; elapsed &lt;&lt; \" ms\" &lt;&lt; std::endl;\n    std::cout &lt;&lt; \"\u5143\u7d20\u6570: \" &lt;&lt; N &lt;&lt; std::endl;\n    std::cout &lt;&lt; \"\u541e\u5410\u91cf: \" &lt;&lt; (N * sizeof(float)) / elapsed / 1e6 &lt;&lt; \" GB/s\" &lt;&lt; std::endl;\n\n    return 0;\n}\n</code></pre></p> </li> <li> <p>\u7f16\u5199\u4e00\u4e2aC++\u51fd\u6570\u5728\u6570\u7ec4\u4e0a\u8ba1\u7b97ReLU\uff0c\u7136\u540e\u4f7f\u7528pybind11\u6784\u5efaPython\u7ed1\u5b9a\u3002\u4ecePython\u8c03\u7528\u5b83\u5e76\u4e0eNumPy\u6bd4\u8f83\u901f\u5ea6\u3002 <pre><code>// task2_relu.cpp\n// \u7f16\u8bd1\uff1ac++ -O3 -shared -std=c++17 -fPIC $(python3 -m pybind11 --includes) \\\n//          task2_relu.cpp -o my_relu$(python3-config --extension-suffix)\n\n#include &lt;pybind11/pybind11.h&gt;\n#include &lt;pybind11/numpy.h&gt;\nnamespace py = pybind11;\n\npy::array_t&lt;float&gt; cpp_relu(py::array_t&lt;float&gt; input) {\n    auto buf = input.request();\n    float* ptr = static_cast&lt;float*&gt;(buf.ptr);\n    int n = buf.size;\n\n    auto result = py::array_t&lt;float&gt;(n);\n    float* out = static_cast&lt;float*&gt;(result.request().ptr);\n\n    for (int i = 0; i &lt; n; i++) {\n        out[i] = ptr[i] &gt; 0.0f ? ptr[i] : 0.0f;\n    }\n    return result;\n}\n\nPYBIND11_MODULE(my_relu, m) {\n    m.def(\"relu\", &amp;cpp_relu, \"C++ ReLU\");\n}\n</code></pre> <pre><code># test_relu.py \u2014 \u5728\u7f16\u8bd1\u4e0a\u8ff0C++\u6a21\u5757\u540e\u8fd0\u884c\nimport numpy as np\nimport time\nimport my_relu  # \u7f16\u8bd1\u540e\u7684C++\u6a21\u5757\n\nx = np.random.randn(10_000_000).astype(np.float32)\n\n# C++ ReLU\nstart = time.time()\nfor _ in range(100):\n    y_cpp = my_relu.relu(x)\ncpp_time = (time.time() - start) / 100\n\n# NumPy ReLU\nstart = time.time()\nfor _ in range(100):\n    y_np = np.maximum(x, 0)\nnp_time = (time.time() - start) / 100\n\nprint(f\"C++ ReLU:   {cpp_time*1000:.2f} ms\")\nprint(f\"NumPy ReLU: {np_time*1000:.2f} ms\")\nprint(f\"\u5339\u914d: {np.allclose(y_cpp, y_np)}\")\n</code></pre></p> </li> <li> <p>\u7f16\u5199\u4e00\u4e2aC++\u7a0b\u5e8f\uff0c\u6f14\u793a\u4e3a\u4f55\u5185\u5b58\u5e03\u5c40\u5f88\u91cd\u8981\u3002\u6bd4\u8f83\u884c\u4f18\u5148\u4e0e\u5217\u4f18\u5148\u8bbf\u95ee\u6a21\u5f0f\u5e76\u6d4b\u91cf\u6027\u80fd\u5dee\u5f02\u3002 <pre><code>// task3_layout.cpp\n// \u7f16\u8bd1\uff1ag++ -O3 -o task3 task3_layout.cpp\n\n#include &lt;iostream&gt;\n#include &lt;chrono&gt;\n#include &lt;vector&gt;\n\nint main() {\n    const int N = 4096;\n    std::vector&lt;float&gt; matrix(N * N, 1.0f);\n\n    // \u884c\u4f18\u5148\u8bbf\u95ee\uff1a\u8fde\u7eed\u5185\u5b58\u5730\u5740\uff08\u7f13\u5b58\u53cb\u597d\uff09\n    auto start = std::chrono::high_resolution_clock::now();\n    float sum_row = 0.0f;\n    for (int i = 0; i &lt; N; i++) {\n        for (int j = 0; j &lt; N; j++) {\n            sum_row += matrix[i * N + j];  // \u6b65\u957f1\u8bbf\u95ee\n        }\n    }\n    auto end = std::chrono::high_resolution_clock::now();\n    double row_ms = std::chrono::duration&lt;double, std::milli&gt;(end - start).count();\n\n    // \u5217\u4f18\u5148\u8bbf\u95ee\uff1a\u6b65\u957fN\u8bbf\u95ee\uff08\u7f13\u5b58\u4e0d\u53cb\u597d\uff09\n    start = std::chrono::high_resolution_clock::now();\n    float sum_col = 0.0f;\n    for (int j = 0; j &lt; N; j++) {\n        for (int i = 0; i &lt; N; i++) {\n            sum_col += matrix[i * N + j];  // \u6b65\u957fN\u8bbf\u95ee\uff08\u7f13\u5b58\u7f3a\u5931\uff01\uff09\n        }\n    }\n    end = std::chrono::high_resolution_clock::now();\n    double col_ms = std::chrono::duration&lt;double, std::milli&gt;(end - start).count();\n\n    std::cout &lt;&lt; \"\u884c\u4f18\u5148\uff08\u7f13\u5b58\u53cb\u597d\uff09: \" &lt;&lt; row_ms &lt;&lt; \" ms\" &lt;&lt; std::endl;\n    std::cout &lt;&lt; \"\u5217\u4f18\u5148\uff08\u7f13\u5b58\u4e0d\u53cb\u597d\uff09: \" &lt;&lt; col_ms &lt;&lt; \" ms\" &lt;&lt; std::endl;\n    std::cout &lt;&lt; \"\u51cf\u901f\u6bd4: \" &lt;&lt; col_ms / row_ms &lt;&lt; \"x\" &lt;&lt; std::endl;\n    std::cout &lt;&lt; \"\uff08\u4e24\u4e2a\u548c: \" &lt;&lt; sum_row &lt;&lt; \", \" &lt;&lt; sum_col &lt;&lt; \"\uff09\" &lt;&lt; std::endl;\n\n    return 0;\n}\n</code></pre></p> </li> </ol>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/01.%20hardware%20fundamentals/","title":"\u786c\u4ef6\u57fa\u7840","text":"<p>\u5728\u7f16\u5199SIMD\u6216GPU\u4ee3\u7801\u4e4b\u524d\uff0c\u4f60\u9700\u8981\u4e86\u89e3\u6240\u7f16\u7a0b\u7684\u786c\u4ef6\u3002\u672c\u6587\u6db5\u76d6\u4e3a\u4ec0\u4e48\u5e76\u884c\u6027\u53d6\u4ee3\u4e86\u65f6\u949f\u901f\u5ea6\u3001\u73b0\u4ee3CPU\u5982\u4f55\u6267\u884c\u6307\u4ee4\u3001\u4ec0\u4e48\u662fSIMD\u3001\u7528\u4e8e\u63a8\u7406\u6027\u80fd\u7684\u5c4b\u9876\u7ebf\u6a21\u578b\uff0c\u4ee5\u53ca\u82af\u7247\u67b6\u6784\u7684\u5168\u666f</p> <ul> <li>\u51e0\u5341\u5e74\u6765\uff0c\u8f6f\u4ef6\u514d\u8d39\u53d8\u5feb\uff1a\u8d2d\u4e70\u4e00\u4e2a\u65f6\u949f\u9891\u7387\u66f4\u9ad8\u7684\u65b0CPU\uff0c\u4f60\u7684\u7a0b\u5e8f\u65e0\u9700\u4fee\u6539\u4e00\u884c\u4ee3\u7801\u5c31\u80fd\u8fd0\u884c\u5f97\u66f4\u5feb\u3002\u8fd9\u4e2a\u65f6\u4ee3\u5927\u7ea6\u57282005\u5e74\u7ed3\u675f\u3002\u7406\u89e3\u5b83\u4e3a\u4f55\u7ed3\u675f\u4ee5\u53ca\u4ec0\u4e48\u66ff\u4ee3\u4e86\u5b83\uff0c\u5bf9\u4efb\u4f55\u60f3\u7f16\u5199\u5feb\u901f\u4ee3\u7801\u7684\u4eba\u90fd\u81f3\u5173\u91cd\u8981\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/01.%20hardware%20fundamentals/#_2","title":"\u514d\u8d39\u6027\u80fd\u7684\u7ec8\u7ed3","text":"<ul> <li> <p>\u6469\u5c14\u5b9a\u5f8b\uff081965\u5e74\uff09\u89c2\u5bdf\u5230\u82af\u7247\u4e0a\u7684\u6676\u4f53\u7ba1\u6570\u91cf\u5927\u7ea6\u6bcf\u4e24\u5e74\u7ffb\u4e00\u756a\u3002\u8fd9\u4e00\u89c4\u5f8b\u7ef4\u6301\u4e8660\u5e74\u3002\u66f4\u591a\u6676\u4f53\u7ba1\u610f\u5473\u7740\u66f4\u5c0f\u7684\u6676\u4f53\u7ba1\uff0c\u8fdb\u800c\u610f\u5473\u7740\u66f4\u9ad8\u7684\u65f6\u949f\u9891\u7387\uff0c\u4ece\u800c\u610f\u5473\u7740\u66f4\u5feb\u7684\u7a0b\u5e8f\u3002</p> </li> <li> <p>\u4f46\u57282005\u5e74\u5de6\u53f3\uff0c\u65f6\u949f\u9891\u7387\u5728\u5927\u7ea64 GHz\u5904\u649e\u4e0a\u4e86\u5899\u58c1\u3002\u95ee\u9898\u662f\u529f\u8017\u3002\u82af\u7247\u6d88\u8017\u7684\u529f\u7387\u5927\u7ea6\u4e3a\uff1a</p> </li> </ul> \\[P \\propto C \\cdot V^2 \\cdot f\\] <ul> <li> <p>\u5176\u4e2d \\(C\\) \u662f\u7535\u5bb9\uff08\u4e0e\u6676\u4f53\u7ba1\u6570\u91cf\u6210\u6b63\u6bd4\uff09\uff0c\\(V\\) \u662f\u7535\u538b\uff0c\\(f\\) \u662f\u65f6\u949f\u9891\u7387\u3002\u8981\u63d0\u9ad8\u9891\u7387\uff0c\u5fc5\u987b\u63d0\u9ad8\u7535\u538b\uff08\u4ee5\u4f7f\u6676\u4f53\u7ba1\u66f4\u5feb\u5730\u5207\u6362\uff09\u3002\u4f46\u529f\u8017\u4e0e \\(V^2 \\cdot f\\) \u6210\u6bd4\u4f8b\uff0c\u6240\u4ee5\u9891\u7387\u7684\u5c0f\u5e45\u589e\u52a0\u4f1a\u5bfc\u81f4\u529f\u8017\uff08\u548c\u70ed\u91cf\uff09\u7684\u5927\u5e45\u589e\u52a0\u3002\u57284 GHz\u65f6\uff0c\u82af\u7247\u5df2\u7ecf\u8fbe\u5230100+\u74e6\u3002\u8fbe\u52308 GHz\u9700\u8981\u4e0d\u5207\u5b9e\u9645\u7684\u51b7\u5374\u65b9\u6848\u3002</p> </li> <li> <p>\u89e3\u51b3\u65b9\u6848\uff1a\u4e0d\u8ba9\u5355\u4e2a\u6838\u5fc3\u66f4\u5feb\uff0c\u800c\u662f\u5728\u540c\u4e00\u82af\u7247\u4e0a\u653e\u7f6e\u591a\u4e2a\u6838\u5fc3\u3002\u4e00\u4e2a4\u6838\u82af\u7247\u57283 GHz\u4e0b\u4f7f\u7528\u4e0e\u5355\u4e2a\u6838\u5fc3\u57284.5 GHz\u4e0b\u76f8\u4f3c\u7684\u529f\u8017\uff0c\u4f46\u53ef\u4ee5\u505a4\u500d\u7684\u5e76\u884c\u5de5\u4f5c\u3002\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48\u6bcf\u4e2a\u73b0\u4ee3CPU\u90fd\u6709\u591a\u4e2a\u6838\u5fc3\uff0c\u4ee5\u53ca\u4e3a\u4ec0\u4e48\u5e76\u884c\u6027\uff08SIMD\u3001\u591a\u7ebf\u7a0b\u3001GPU\u8ba1\u7b97\uff09\u662f\u83b7\u5f97\u66f4\u9ad8\u6027\u80fd\u7684\u552f\u4e00\u9014\u5f84\u3002</p> </li> <li> <p>\u5bf9ML\u7684\u5f71\u54cd\uff1a\u4e00\u4e2a\u5728\u5355\u6838\u4e0a\u9700\u898110\u5206\u949f\u7684\u8bad\u7ec3\u6b65\u9aa4\uff0c\u65e0\u6cd5\u901a\u8fc7\u8d2d\u4e70\u66f4\u5feb\u7684CPU\u6765\u52a0\u901f\u3002\u53ea\u80fd\u901a\u8fc7\u4f7f\u7528\u66f4\u591a\u6838\u5fc3\uff08\u6570\u636e\u5e76\u884c\u6027\uff0c\u7b2c6\u7ae0\uff09\u3001\u66f4\u5bbd\u7684SIMD\u5355\u5143\uff08\u672c\u7ae0\uff09\u6216GPU\uff08\u6570\u5343\u4e2a\u6838\u5fc3\uff09\u6765\u52a0\u901f\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/01.%20hardware%20fundamentals/#cpu","title":"\u73b0\u4ee3CPU\u5982\u4f55\u6267\u884c\u6307\u4ee4","text":"<ul> <li> <p>\u73b0\u4ee3CPU\u6838\u5fc3\u8fdc\u6bd4\u7b2c13\u7ae0\u4e2d\u7b80\u5355\u7684\u53d6\u6307-\u8bd1\u7801-\u6267\u884c\u6a21\u578b\u590d\u6742\u3002\u5b83\u4f7f\u7528\u51e0\u79cd\u6280\u5de7\u6765\u6bcf\u5468\u671f\u6267\u884c\u66f4\u591a\u6307\u4ee4\uff1a</p> </li> <li> <p>\u8d85\u6807\u91cf\u6267\u884c\uff1aCPU\u6709\u591a\u4e2a\u6267\u884c\u5355\u5143\uff08ALU\u3001FPU\u3001\u52a0\u8f7d/\u5b58\u50a8\u5355\u5143\uff09\uff0c\u53ef\u4ee5\u540c\u65f6\u6267\u884c\u591a\u4e2a\u72ec\u7acb\u7684\u6307\u4ee4\u3002\u5982\u679c\u6307\u4ee4\u4e0d\u76f8\u4e92\u4f9d\u8d56\uff0c\u73b0\u4ee3\u6838\u5fc3\u6bcf\u5468\u671f\u53ef\u80fd\u6267\u884c4-6\u6761\u6307\u4ee4\u3002</p> </li> <li> <p>\u4e71\u5e8f\u6267\u884c\uff08OoO\uff09\uff1aCPU\u4e0d\u6309\u7a0b\u5e8f\u987a\u5e8f\u6267\u884c\u6307\u4ee4\u3002\u5b83\u5411\u524d\u770b\u6307\u4ee4\u6d41\uff0c\u627e\u5230\u8f93\u5165\u5df2\u51c6\u5907\u597d\u7684\u6307\u4ee4\uff0c\u5e76\u7acb\u5373\u6267\u884c\uff0c\u4e0d\u8bba\u5176\u4f4d\u7f6e\u3002\u8fd9\u9690\u85cf\u4e86\u5ef6\u8fdf\uff1a\u5f53\u4e00\u6761\u6307\u4ee4\u7b49\u5f85\u6765\u81ea\u5185\u5b58\u7684\u6570\u636e\u65f6\uff08100+\u5468\u671f\uff09\uff0cCPU\u6267\u884c\u5176\u4ed6\u5df2\u51c6\u5907\u597d\u7684\u6307\u4ee4\u3002</p> </li> <li> <p>\u5206\u652f\u9884\u6d4b\uff1a\u6761\u4ef6\u5206\u652f\uff08<code>if</code>\u8bed\u53e5\u3001\u5faa\u73af\u6761\u4ef6\uff09\u9020\u6210\u4e0d\u786e\u5b9a\u6027\uff1aCPU\u5728\u6761\u4ef6\u88ab\u8bc4\u4f30\u4e4b\u524d\u4e0d\u77e5\u9053\u8d70\u54ea\u6761\u8def\u5f84\u3002\u4e3a\u4e86\u907f\u514d\u505c\u987f\uff0cCPU\u9884\u6d4b\u7ed3\u679c\u5e76\u6cbf\u9884\u6d4b\u8def\u5f84\u6295\u673a\u6267\u884c\u3002\u5982\u679c\u9884\u6d4b\u6b63\u786e\uff08\u4f7f\u7528\u73b0\u4ee3\u9884\u6d4b\u5668\u8d85\u8fc795%\uff09\uff0c\u5219\u6ca1\u6709\u65f6\u95f4\u635f\u5931\u3002\u5982\u679c\u9519\u8bef\uff0c\u6295\u673a\u5de5\u4f5c\u88ab\u4e22\u5f03\uff0c\u6267\u884c\u6b63\u786e\u8def\u5f84\uff08\u7ea615\u5468\u671f\u60e9\u7f5a\uff09\u3002</p> </li> <li> <p>\u6295\u673a\u6267\u884c\uff1a\u5206\u652f\u9884\u6d4b\u7684\u5ef6\u4f38\u3002CPU\u6267\u884c\u53ef\u80fd\u4e0d\u9700\u8981\u7684\u6307\u4ee4\uff0c\u8d4c\u5b83\u4eec\u4f1a\u88ab\u9700\u8981\u3002\u8fd9\u586b\u5145\u4e86\u6d41\u6c34\u7ebf\u5e76\u4fdd\u6301\u6267\u884c\u5355\u5143\u5fd9\u788c\u3002</p> </li> <li> <p>\u6240\u6709\u8fd9\u4e9b\u90fd\u662f\u81ea\u52a8\u7684\u2014\u2014CPU\u65e0\u9700\u4efb\u4f55\u7a0b\u5e8f\u5458\u5e72\u9884\u5373\u53ef\u5b8c\u6210\u3002\u4f46\u5b83\u4eec\u53ea\u5e2e\u52a9\u6307\u4ee4\u7ea7\u5e76\u884c\u6027\uff08ILP\uff09\uff1a\u5355\u6761\u6d41\u5185\u76f8\u4e92\u72ec\u7acb\u7684\u6307\u4ee4\u3002\u5bf9\u4e8e\u6570\u636e\u7ea7\u5e76\u884c\u6027\uff08\u5bf9\u8bb8\u591a\u6570\u636e\u5143\u7d20\u6267\u884c\u76f8\u540c\u64cd\u4f5c\uff09\uff0c\u6211\u4eec\u9700\u8981SIMD\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/01.%20hardware%20fundamentals/#simd","title":"SIMD\uff1a\u5355\u6307\u4ee4\u591a\u6570\u636e","text":"<ul> <li> <p>SIMD\u662f\u5c06\u4e00\u6761\u6307\u4ee4\u540c\u65f6\u5e94\u7528\u4e8e\u591a\u4e2a\u6570\u636e\u5143\u7d20\u7684\u601d\u60f3\u3002\u4e0d\u662f\u5c06\u4e24\u4e2a\u6570\u76f8\u52a0\uff0c\u800c\u662f\u5728\u4e00\u6761\u6307\u4ee4\u4e2d\u5c06\u4e24\u4e2a4\uff08\u62168\u3001\u621616\uff09\u5143\u7d20\u5411\u91cf\u76f8\u52a0\u3002</p> </li> <li> <p>\u65e0SIMD\uff08\u6807\u91cf\uff09\uff1a</p> </li> </ul> <pre><code>// \u9010\u5143\u7d20\u76f8\u52a0\u4e24\u6570\u7ec4\uff1a4\u6761\u52a0\u6cd5\u6307\u4ee4\nfor (int i = 0; i &lt; 4; i++) {\n    c[i] = a[i] + b[i];  // \u6bcf\u6b21\u8fed\u4ee3\u4e00\u6b21\u52a0\u6cd5\n}\n</code></pre> <ul> <li>\u6709SIMD\uff08\u5411\u91cf\u5316\uff09\uff1a</li> </ul> <pre><code>// \u4e24\u6570\u7ec4\u76f8\u52a0\uff1a1\u6761SIMD\u6307\u4ee4\u5b8c\u6210\u6240\u67094\u6b21\u52a0\u6cd5\n#include &lt;immintrin.h&gt;  // x86 SIMD\u5185\u8054\u51fd\u6570\n\n__m128 va = _mm_load_ps(a);    // \u52a0\u8f7d4\u4e2a\u6d6e\u70b9\u6570\u5230128\u4f4d\u5bc4\u5b58\u5668\n__m128 vb = _mm_load_ps(b);    // \u52a0\u8f7d4\u4e2a\u6d6e\u70b9\u6570\u5230\u53e6\u4e00\u4e2a\u5bc4\u5b58\u5668\n__m128 vc = _mm_add_ps(va, vb); // \u540c\u65f6\u76f8\u52a0\u6240\u67094\u5bf9\n_mm_store_ps(c, vc);            // \u5b58\u50a84\u4e2a\u7ed3\u679c\n</code></pre> <ul> <li>SIMD\u7248\u672c\u75281/4\u7684\u6307\u4ee4\u5b8c\u6210\u76f8\u540c\u5de5\u4f5c\u3002\u8fd9\u662f\u7406\u8bba\u4e0a\u76844\u500d\u52a0\u901f\uff0c\u901a\u8fc7\u6bcf\u6761\u6307\u4ee4\u5904\u74064\u4e2a\u6d6e\u70b9\u6570\u800c\u975e1\u4e2a\u5b9e\u73b0\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/01.%20hardware%20fundamentals/#_3","title":"\u5411\u91cf\u5bc4\u5b58\u5668","text":"<ul> <li>SIMD\u6307\u4ee4\u64cd\u4f5c\u5411\u91cf\u5bc4\u5b58\u5668\uff1a\u4fdd\u5b58\u591a\u4e2a\u6570\u636e\u5143\u7d20\u7684\u5bbd\u5bc4\u5b58\u5668\u3002</li> </ul> \u5bc4\u5b58\u5668\u5bbd\u5ea6 \u6d6e\u70b9\u6570\uff0832\u4f4d\uff09 \u53cc\u7cbe\u5ea6\u6d6e\u70b9\u6570\uff0864\u4f4d\uff09 \u540d\u79f0 128\u4f4d 4 2 SSE\uff08x86\uff09\u3001NEON\uff08ARM\uff09 256\u4f4d 8 4 AVX/AVX2\uff08x86\uff09 512\u4f4d 16 8 AVX-512\uff08x86\uff09 \u53ef\u53d8\uff08128-2048\uff09 \u53ef\u53d8 \u53ef\u53d8 SVE/SVE2\uff08ARM\uff09 <ul> <li> <p>\u66f4\u5bbd\u7684\u5bc4\u5b58\u5668 = \u66f4\u591a\u5e76\u884c\u6027\u3002\u4e00\u6761512\u4f4dAVX-512\u6307\u4ee4\u4e00\u6b21\u5904\u740616\u4e2a\u6d6e\u70b9\u6570\uff0c\u662f\u6807\u91cf\u4ee3\u7801\u7406\u8bba\u4e0a\u768416\u500d\u52a0\u901f\u3002\u5b9e\u9645\u4e0a\uff0c\u7531\u4e8e\u5185\u5b58\u5e26\u5bbd\u9650\u5236\uff08\u8ba1\u7b97\u901f\u5ea6\u53ef\u80fd\u8d85\u8fc7\u5411CPU\u8f93\u9001\u6570\u636e\u7684\u901f\u5ea6\uff09\uff0c\u52a0\u901f\u6bd4\u66f4\u4f4e\u3002</p> </li> <li> <p>\u5bf9\u4e8eML\uff1afloat32\u503c\u7684\u77e9\u9635\u4e58\u6cd5\u4eceSIMD\u4e2d\u83b7\u76ca\u5de8\u5927\u3002\u5185\u5faa\u73af\uff08\u4e24\u4e2a\u5411\u91cf\u7684\u70b9\u79ef\uff09\u76f4\u63a5\u6620\u5c04\u5230SIMD\u4e58\u52a0\u6307\u4ee4\u3002\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48BLAS\u5e93\uff08NumPy\u548cPyTorch\u8c03\u7528\u7684\uff09\u7528SIMD\u8fdb\u884c\u4e86\u5982\u6b64\u6df1\u5ea6\u4f18\u5316\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/01.%20hardware%20fundamentals/#_4","title":"\u5c4b\u9876\u7ebf\u6a21\u578b","text":"<ul> <li> <p>\u4f60\u5982\u4f55\u77e5\u9053\u4f60\u7684\u4ee3\u7801\u662f\u5426\u5feb\u901f\uff1f\u5c4b\u9876\u7ebf\u6a21\u578b\u63d0\u4f9b\u4e86\u4e00\u4e2a\u6846\u67b6\uff0c\u6839\u636e\u4e24\u4e2a\u786c\u4ef6\u9650\u5236\u6765\u63cf\u8ff0\u6027\u80fd\uff1a</p> </li> <li> <p>\u5cf0\u503c\u8ba1\u7b97\u80fd\u529b\uff08FLOPS\uff09\uff1a\u6bcf\u79d2\u6700\u5927\u6d6e\u70b9\u8fd0\u7b97\u6b21\u6570\u3002\u5bf9\u4e8e\u4e00\u4e2a4 GHz CPU\uff0c\u914d\u5907256\u4f4dAVX\uff08\u6bcf\u6761\u6307\u4ee48\u4e2a\u6d6e\u70b9\u6570\uff09\u548c2\u4e2aFMA\u5355\u5143\uff1a\\(4 \\times 10^9 \\times 8 \\times 2 = 64\\) GFLOPS\u3002</p> </li> <li> <p>\u5cf0\u503c\u5185\u5b58\u5e26\u5bbd\uff08\u5b57\u8282/\u79d2\uff09\uff1a\u6570\u636e\u4ece\u5185\u5b58\u5230CPU\u7684\u6700\u5927\u4f20\u8f93\u901f\u5ea6\u3002\u73b0\u4ee3CPU\u53ef\u80fd\u670950 GB/s\u7684\u5185\u5b58\u5e26\u5bbd\u3002</p> </li> <li> <p>\u4ee3\u7801\u7684\u7b97\u672f\u5f3a\u5ea6\u662f\u8ba1\u7b97\u4e0e\u5185\u5b58\u8bbf\u95ee\u7684\u6bd4\u7387\uff1a</p> </li> </ul> \\[\\text{\u7b97\u672f\u5f3a\u5ea6} = \\frac{\\text{FLOPS}}{\\text{\u4f20\u8f93\u7684\u5b57\u8282\u6570}}\\] <ul> <li> <p>\u5982\u679c\u7b97\u672f\u5f3a\u5ea6\u4f4e\uff08\u6bcf\u52a0\u8f7d\u5b57\u8282\u7684\u64cd\u4f5c\u6570\u5c11\uff09\uff0c\u4f60\u7684\u4ee3\u7801\u662f\u5185\u5b58\u53d7\u9650\u7684\uff1a\u5927\u90e8\u5206\u65f6\u95f4\u82b1\u5728\u7b49\u5f85\u6570\u636e\u4e0a\u3002\u8ba9\u8ba1\u7b97\u66f4\u5feb\uff08\u66f4\u5bbd\u7684SIMD\u3001\u66f4\u9ad8\u7684\u65f6\u949f\uff09\u4e0d\u4f1a\u6709\u5e2e\u52a9\u3002</p> </li> <li> <p>\u5982\u679c\u7b97\u672f\u5f3a\u5ea6\u9ad8\uff08\u6bcf\u5b57\u8282\u591a\u6b21\u64cd\u4f5c\uff09\uff0c\u4f60\u7684\u4ee3\u7801\u662f\u8ba1\u7b97\u53d7\u9650\u7684\uff1a\u5927\u90e8\u5206\u65f6\u95f4\u82b1\u5728\u8ba1\u7b97\u4e0a\u3002\u66f4\u5feb\u7684\u5185\u5b58\u4e0d\u4f1a\u6709\u5e2e\u52a9\u3002</p> </li> <li> <p>\u5c4b\u9876\u7ebf\uff1a</p> </li> </ul> \\[\\text{\u53ef\u8fbeFLOPS} = \\min\\left(\\text{\u5cf0\u503cFLOPS}, \\; \\text{\u5e26\u5bbd} \\times \\text{\u7b97\u672f\u5f3a\u5ea6}\\right)\\] <ul> <li> <p>\u77e9\u9635\u4e58\u6cd5\u5177\u6709\u9ad8\u7b97\u672f\u5f3a\u5ea6\uff1a\\(O(n^3)\\) \u6b21\u64cd\u4f5c\u4f5c\u7528\u4e8e \\(O(n^2)\\) \u6570\u636e\uff0c\u56e0\u6b64\u5f3a\u5ea6 \\(\\approx O(n)\\)\u3002\u5bf9\u4e8e\u5927\u77e9\u9635\uff0c\u5b83\u662f\u8ba1\u7b97\u53d7\u9650\u7684\u3002\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48GPU\uff08\u9ad8\u8ba1\u7b97\u80fd\u529b\uff09\u4e3b\u5bfc\u77e9\u9635\u5bc6\u96c6\u578b\u7684ML\u5de5\u4f5c\u8d1f\u8f7d\u3002</p> </li> <li> <p>\u9010\u5143\u7d20\u64cd\u4f5c\uff08ReLU\u3001\u52a0\u6cd5\u3001\u4e58\u6cd5\uff09\u5177\u6709\u4f4e\u7b97\u672f\u5f3a\u5ea6\uff1a\u6bcf\u52a0\u8f7d\u4e00\u4e2a\u5143\u7d201\u6b21\u64cd\u4f5c\u3002\u8fd9\u4e9b\u662f\u5185\u5b58\u53d7\u9650\u7684\u3002\u8ba9GPU\u66f4\u5feb\u6ca1\u6709\u5e2e\u52a9\uff1b\u4f60\u9700\u8981\u66f4\u5feb\u7684\u5185\u5b58\uff08\u6216\u8005\u5c06\u8fd9\u4e9b\u64cd\u4f5c\u4e0e\u8ba1\u7b97\u5bc6\u96c6\u578b\u64cd\u4f5c\u878d\u5408\uff0c\u4ee5\u907f\u514d\u72ec\u7acb\u7684\u5185\u5b58\u5f80\u8fd4\uff09\u3002</p> </li> <li> <p>\u5c4b\u9876\u7ebf\u6a21\u578b\u89e3\u91ca\u4e86\u4e3a\u4ec0\u4e48\u6838\u51fd\u6570\u878d\u5408\u5982\u6b64\u91cd\u8981\uff1a\u5c06matmul\u4e0e\u504f\u7f6e\u52a0\u6cd5\u548cReLU\u7ec4\u5408\u6210\u4e00\u4e2a\u6838\u51fd\u6570\uff0c\u907f\u514d\u4e86\u5c06\u4e2d\u95f4\u7ed3\u679c\u5199\u5165\u5185\u5b58\u5e76\u91cd\u65b0\u8bfb\u53d6\uff0c\u5c06\u4e09\u4e2a\u5185\u5b58\u53d7\u9650\u64cd\u4f5c\u8f6c\u5316\u4e3a\u4e00\u4e2a\u8ba1\u7b97\u53d7\u9650\u64cd\u4f5c\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/01.%20hardware%20fundamentals/#_5","title":"\u5ef6\u8fdf\u4e0e\u541e\u5410\u91cf","text":"<ul> <li> <p>\u5ef6\u8fdf\u662f\u5b8c\u6210\u4e00\u4e2a\u64cd\u4f5c\u6240\u9700\u7684\u65f6\u95f4\u3002\u541e\u5410\u91cf\u662f\u5355\u4f4d\u65f6\u95f4\u5185\u5b8c\u6210\u7684\u64cd\u4f5c\u6570\u91cf\u3002</p> </li> <li> <p>\u6253\u4e2a\u6bd4\u65b9\uff1a\u516c\u4ea4\u8f66\u5ef6\u8fdf\u9ad8\uff08\u6bcf\u7ad9\u90fd\u505c\uff09\uff0c\u4f46\u541e\u5410\u91cf\u9ad8\uff08\u4e00\u6b21\u642d\u8f7d50\u4eba\uff09\u3002\u51fa\u79df\u8f66\u5ef6\u8fdf\u4f4e\uff08\u76f4\u8fbe\u4f60\u7684\u76ee\u7684\u5730\uff09\uff0c\u4f46\u541e\u5410\u91cf\u4f4e\uff08\u642d\u8f7d1-4\u4eba\uff09\u3002</p> </li> <li> <p>GPU\u662f\u516c\u4ea4\u8f66\uff1a\u6bcf\u6b21\u64cd\u4f5c\u5ef6\u8fdf\u9ad8\uff08\u6bcf\u6761\u6307\u4ee4\u9700\u8981\u8bb8\u591a\u5468\u671f\u5b8c\u6210\uff09\uff0c\u4f46\u541e\u5410\u91cf\u5de8\u5927\uff08\u6570\u5343\u4e2a\u6838\u5fc3\u540c\u65f6\u5904\u7406\uff09\u3002CPU\u662f\u51fa\u79df\u8f66\uff1a\u5ef6\u8fdf\u4f4e\uff08\u4e71\u5e8f\u6267\u884c\u3001\u5206\u652f\u9884\u6d4b\u3001\u6df1\u5c42\u7f13\u5b58\u6700\u5c0f\u5316\u5ef6\u8fdf\uff09\uff0c\u4f46\u541e\u5410\u91cf\u6709\u9650\uff084-64\u4e2a\u6838\u5fc3\uff09\u3002</p> </li> <li> <p>\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48GPU\u66f4\u9002\u5408ML\u8bad\u7ec3\uff08\u541e\u5410\u91cf\u91cd\u8981\uff1a\u5904\u7406\u6570\u767e\u4e07\u4e2a\u6837\u672c\uff09\u800cCPU\u66f4\u9002\u5408\u64cd\u4f5c\u7cfb\u7edf\u4efb\u52a1\uff08\u5ef6\u8fdf\u91cd\u8981\uff1a\u7acb\u5373\u54cd\u5e94\u6309\u952e\uff09\u3002</p> </li> <li> <p>\u6d41\u6c34\u7ebf\u5c06\u5ef6\u8fdf\u8f6c\u5316\u4e3a\u541e\u5410\u91cf\u3002\u5982\u679c\u4e00\u6761\u6307\u4ee4\u9700\u89815\u4e2a\u5468\u671f\uff0c\u4f46\u6d41\u6c34\u7ebf\u6bcf\u5468\u671f\u5f00\u59cb\u4e00\u6761\u65b0\u6307\u4ee4\uff0c\u5219\u541e\u5410\u91cf\u662f\u6bcf\u6761\u6307\u4ee41\u5468\u671f\uff08\u5373\u4f7f\u6bcf\u6761\u6307\u4ee4\u9700\u89815\u4e2a\u5468\u671f\u5b8c\u6210\uff09\u3002\u8fd9\u548c\u7b2c13\u7ae0\u7684CPU\u6d41\u6c34\u7ebf\u662f\u540c\u4e00\u539f\u7406\uff0c\u4f46\u5b83\u9002\u7528\u4e8e\u6bcf\u4e2a\u5c42\u9762\uff1aSIMD\u5355\u5143\u3001\u5185\u5b58\u63a7\u5236\u5668\u548cGPU\u6838\u5fc3\u90fd\u662f\u6d41\u6c34\u7ebf\u5316\u7684\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/01.%20hardware%20fundamentals/#_6","title":"\u82af\u7247\u67b6\u6784\u5168\u666f","text":"<ul> <li>\u4f60\u7f16\u5199\u4ee3\u7801\u7684\u786c\u4ef6\u51b3\u5b9a\u4e86\u54ea\u4e9bSIMD\u6307\u4ee4\u53ef\u7528\uff1a</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/01.%20hardware%20fundamentals/#x86intel-amd","title":"x86\uff08Intel, AMD\uff09","text":"<ul> <li> <p>\u4e3b\u5bfc\u53f0\u5f0f\u673a\u3001\u7b14\u8bb0\u672c\u7535\u8111\u548c\u6570\u636e\u4e2d\u5fc3CPU\u3002SIMD\uff1aSSE\uff08128\u4f4d\uff09\u3001AVX/AVX2\uff08256\u4f4d\uff09\u3001AVX-512\uff08512\u4f4d\uff09\u3002Intel AMX\u63d0\u4f9b\u4e13\u7528\u7684\u77e9\u9635\u4e58\u6cd5\u5355\u5143\u7528\u4e8eAI\u5de5\u4f5c\u8d1f\u8f7d\u3002</p> </li> <li> <p>\u4f18\u52bf\uff1a\u6700\u9ad8\u5355\u6838\u6027\u80fd\u3001\u6700\u5bbdSIMD\u3001\u6210\u719f\u7684\u8f6f\u4ef6\u751f\u6001\u7cfb\u7edf\uff08MKL\u3001oneDNN\uff09\u3002</p> </li> <li>\u5f31\u70b9\uff1a\u9ad8\u529f\u8017\u3001\u590d\u6742\u6307\u4ee4\u96c6\u3001\u6602\u8d35\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/01.%20hardware%20fundamentals/#arm","title":"ARM","text":"<ul> <li> <p>\u4e3b\u5bfc\u79fb\u52a8\u8bbe\u5907\uff08\u6bcf\u4e00\u90e8\u667a\u80fd\u624b\u673a\uff09\uff0c\u5728\u670d\u52a1\u5668\uff08AWS Graviton\u3001Ampere Altra\uff09\u548c\u7b14\u8bb0\u672c\u7535\u8111\uff08Apple M\u7cfb\u5217\uff09\u4e2d\u589e\u957f\u3002SIMD\uff1aNEON\uff08128\u4f4d\uff09\u3001SVE/SVE2\uff08\u53ef\u4f38\u7f29\uff0c128-2048\u4f4d\uff09\u3002</p> </li> <li> <p>\u4f18\u52bf\uff1a\u51fa\u8272\u7684\u529f\u8017\u6548\u7387\uff08\u6bcf\u74e6\u6027\u80fd\uff09\u3001\u81ea\u5b9a\u4e49\u6838\u5fc3\uff08Apple M4\u5728\u5355\u6838\u6027\u80fd\u4e0a\u5ab2\u7f8eIntel\uff0c\u529f\u8017\u4ec5\u4e3a\u5176\u4e00\u5c0f\u90e8\u5206\uff09\u3002</p> </li> <li>\u5f31\u70b9\uff1a\u8f83\u7a84\u7684SIMD\uff08NEON\u4ec5\u4e3a128\u4f4d\uff0c\u867dSVE\u53ef\u66f4\u5bbd\uff09\u3001\u7528\u4e8eHPC\u7684\u8f6f\u4ef6\u751f\u6001\u7cfb\u7edf\u8f83\u5c0f\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/01.%20hardware%20fundamentals/#apple-siliconm1m2m3m4","title":"Apple Silicon\uff08M1/M2/M3/M4\uff09","text":"<ul> <li> <p>\u57fa\u4e8eARM\u5e76\u5e26\u6709\u81ea\u5b9a\u4e49\u6269\u5c55\u3002\u5305\u542bAMX\uff08Apple\u77e9\u9635\u6269\u5c55\uff09\u2014\u2014\u672a\u516c\u5f00\u7684\u77e9\u9635\u4e58\u6cd5\u5355\u5143\uff0cAccelerate\u6846\u67b6\u5c06\u5176\u7528\u4e8eBLAS\u64cd\u4f5c\u3002\u7edf\u4e00\u5185\u5b58\u67b6\u6784\uff1aCPU\u548cGPU\u5171\u4eab\u540c\u4e00\u7269\u7406\u5185\u5b58\uff0c\u6d88\u9664\u4e86CPU\u2194GPU\u62f7\u8d1d\u7684\u74f6\u9888\u3002</p> </li> <li> <p>\u5bf9\u4e8eML\uff1aApple\u7684\u795e\u7ecf\u7f51\u7edc\u5f15\u64ce\uff0816\u6838\uff0c\u4e13\u7528ML\u52a0\u901f\u5668\uff09\u548c\u7edf\u4e00\u5185\u5b58\u4f7fM\u7cfb\u5217\u82af\u7247\u5728\u672c\u5730ML\u63a8\u7406\u548c\u5c0f\u89c4\u6a21\u8bad\u7ec3\u65b9\u9762\u51fa\u5947\u5730\u5f3a\u5927\u3002\u4e0d\u8fc7\u6ca1\u6709CUDA\uff1a\u4f60\u5fc5\u987b\u4f7f\u7528Metal\uff08Apple\u7684GPU API\uff09\u6216MLX\uff08Apple\u7684ML\u6846\u67b6\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/01.%20hardware%20fundamentals/#risc-v","title":"RISC-V","text":"<ul> <li> <p>\u5f00\u6e90ISA\u3002\u65e0\u8bb8\u53ef\u8d39\u7528\uff08\u4e0d\u50cfARM\uff09\u3002\u5728\u5d4c\u5165\u5f0f\u7cfb\u7edf\u3001\u7269\u8054\u7f51\u548c\u7814\u7a76\u9886\u57df\u589e\u957f\u3002SIMD\uff1a\"V\"\uff08\u5411\u91cf\uff09\u6269\u5c55\u63d0\u4f9b\u7c7b\u4f3c\u4e8eARM SVE\u7684\u53ef\u4f38\u7f29\u5411\u91cf\u5904\u7406\u3002</p> </li> <li> <p>\u5bf9\u4e8eML\uff1a\u5728ML\u5de5\u4f5c\u8d1f\u8f7d\u4e0a\u5c1a\u4e0d\u80fd\u4e0ex86/ARM\u7ade\u4e89\uff0c\u4f46\u503c\u5f97\u5173\u6ce8\u3002\u51e0\u4e2aAI\u52a0\u901f\u5668\u521d\u521b\u516c\u53f8\u4f7f\u7528RISC-V\u6838\u5fc3\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/01.%20hardware%20fundamentals/#gpunvidiaamdintel","title":"GPU\uff08NVIDIA\u3001AMD\u3001Intel\uff09","text":"<ul> <li>\u5728\u6587\u4ef604-05\u4e2d\u6df1\u5165\u4ecb\u7ecd\u3002\u6570\u5343\u4e2a\u4e3a\u541e\u5410\u91cf\u4f18\u5316\u7684\u7b80\u5355\u6838\u5fc3\u3002NVIDIA\u4ee5CUDA\u4e3b\u5bfcML\uff1bAMD\u4ee5ROCm\u7ade\u4e89\uff1bIntel\u4ee5Arc GPU\u548cGaudi\u52a0\u901f\u5668\u8fdb\u5165\u5e02\u573a\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/01.%20hardware%20fundamentals/#tpugoogle","title":"TPU\uff08Google\uff09","text":"<ul> <li>\u4e13\u95e8\u4e3aML\u8bbe\u8ba1\u7684\u81ea\u5b9a\u4e49ASIC\u3002\u4e3a\u77e9\u9635\u4e58\u6cd5\u4f18\u5316\u7684\u8109\u52a8\u9635\u5217\u3002\u5728\u6587\u4ef605\u4e2d\u4ecb\u7ecd\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/01.%20hardware%20fundamentals/#_7","title":"\u70ed\u4e0e\u529f\u8017\u7ea6\u675f","text":"<ul> <li> <p>\u6027\u80fd\u6700\u7ec8\u53d7\u9650\u4e8e\u529f\u8017\u548c\u6563\u70ed\uff1a</p> </li> <li> <p>TDP\uff08\u70ed\u8bbe\u8ba1\u529f\u8017\uff09\uff1a\u82af\u7247\u53ef\u4ee5\u6301\u7eed\u6d88\u8017\u7684\u6700\u5927\u529f\u7387\u3002\u7b14\u8bb0\u672c\u7535\u8111CPU\u53ef\u80fd\u670915W TDP\uff1b\u670d\u52a1\u5668CPU 250W\uff1b\u6570\u636e\u4e2d\u5fc3GPU 700W\uff08NVIDIA B200\uff09\u3002</p> </li> <li> <p>\u6697\u7845\uff1a\u5728\u4efb\u4f55\u7ed9\u5b9a\u65f6\u523b\uff0c\u4e3a\u4e86\u4fdd\u6301\u5728\u70ed\u9884\u7b97\u5185\uff0c\u5fc5\u987b\u5173\u95ed\u82af\u7247\u7684\u76f8\u5f53\u5927\u4e00\u90e8\u5206\u6676\u4f53\u7ba1\u3002\u7406\u8bba\u4e0a\u82af\u7247\u53ef\u4ee5\u540c\u65f6\u4f7f\u7528\u6240\u6709\u6676\u4f53\u7ba1\uff0c\u4f46\u4f1a\u7194\u5316\u3002</p> </li> <li> <p>\u529f\u8017\u6548\u7387\uff08FLOPS/\u74e6\uff09\u65e5\u76ca\u6210\u4e3a\u91cd\u8981\u6307\u6807\uff0c\u800c\u975e\u539f\u59cbFLOPS\u3002\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48\uff1a</p> <ul> <li>ARM\u6b63\u5728\u63a5\u7ba1\u6570\u636e\u4e2d\u5fc3\uff08\u76f8\u6bd4x86\u66f4\u597d\u7684FLOPS/\u74e6\uff09\u3002</li> <li>TPU\u5c3d\u7ba1\u5cf0\u503cFLOPS\u8f83\u4f4e\uff0c\u4f46\u4ecd\u4e0eGPU\u7ade\u4e89\uff08\u5bf9\u4e8eML\u5de5\u4f5c\u8d1f\u8f7d\uff0cFLOPS/\u74e6\u597d\u5f97\u591a\uff09\u3002</li> <li>\u91cf\u5316\uff08INT8\u3001FP8\uff09\u4e0d\u4ec5\u5173\u4e4e\u5185\u5b58\uff1a\u5b83\u4e5f\u964d\u4f4e\u4e86\u6bcf\u6b21\u64cd\u4f5c\u7684\u529f\u8017\u3002</li> </ul> </li> <li> <p>\u5bf9\u4e8e\u5927\u89c4\u6a21ML\uff1a\u8bad\u7ec3\u524d\u6cbfLLM\u6570\u6708\u6d88\u8017\u5146\u74e6\u7ea7\u529f\u7387\u3002\u7535\u8d39\u53ef\u80fd\u8d85\u8fc7\u786c\u4ef6\u6210\u672c\u3002\u529f\u8017\u6548\u7387\u76f4\u63a5\u5f71\u54cdAI\u7814\u7a76\u7684\u7ecf\u6d4e\u6027\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/01.%20hardware%20fundamentals/#c","title":"\u5b9e\u8df5\uff1a\u5728C++\u4e2d\u6d4b\u91cf\u6027\u80fd","text":"<ul> <li>\u8981\u63a8\u7406\u6027\u80fd\uff0c\u4f60\u9700\u8981\u6d4b\u91cf\u5b83\u3002\u4ee5\u4e0b\u662f\u4e00\u4e2a\u6700\u5c0f\u7684C++\u57fa\u51c6\u6d4b\u8bd5\u8bbe\u7f6e\uff1a</li> </ul> <pre><code>#include &lt;iostream&gt;\n#include &lt;chrono&gt;\n#include &lt;vector&gt;\n\n// \u6807\u91cf\u52a0\u6cd5\nvoid add_scalar(const float* a, const float* b, float* c, int n) {\n    for (int i = 0; i &lt; n; i++) {\n        c[i] = a[i] + b[i];\n    }\n}\n\nint main() {\n    const int N = 1 &lt;&lt; 24;  // \u7ea61600\u4e07\u4e2a\u5143\u7d20\n    std::vector&lt;float&gt; a(N, 1.0f), b(N, 2.0f), c(N);\n\n    // \u9884\u70ed\uff08\u586b\u5145\u7f13\u5b58\uff0c\u89e6\u53d1\u9891\u7387\u7f29\u653e\uff09\n    add_scalar(a.data(), b.data(), c.data(), N);\n\n    // \u57fa\u51c6\u6d4b\u8bd5\n    auto start = std::chrono::high_resolution_clock::now();\n\n    for (int trial = 0; trial &lt; 100; trial++) {\n        add_scalar(a.data(), b.data(), c.data(), N);\n    }\n\n    auto end = std::chrono::high_resolution_clock::now();\n    double elapsed = std::chrono::duration&lt;double&gt;(end - start).count();\n\n    double total_bytes = 3.0 * N * sizeof(float) * 100;  // \u8bfba\u3001\u8bfbb\u3001\u5199c\n    double bandwidth = total_bytes / elapsed / 1e9;        // GB/s\n\n    std::cout &lt;&lt; \"\u65f6\u95f4: \" &lt;&lt; elapsed &lt;&lt; \" s\\n\";\n    std::cout &lt;&lt; \"\u5e26\u5bbd: \" &lt;&lt; bandwidth &lt;&lt; \" GB/s\\n\";\n\n    return 0;\n}\n</code></pre> <pre><code># \u542f\u7528\u4f18\u5316\u7f16\u8bd1\ng++ -O3 -march=native -o bench bench.cpp\n./bench\n</code></pre> <ul> <li> <p>\u8fd9\u6bb5\u4ee3\u7801\u4e2d\u7684\u5173\u952eC++\u6982\u5ff5\uff1a</p> <ul> <li><code>#include &lt;vector&gt;</code>\uff1a\u52a8\u6001\u6570\u7ec4\uff08<code>std::vector&lt;float&gt;</code>\uff09\u2014\u2014\u7c7b\u4f3cPython\u7684<code>list</code>\u4f46\u5e26\u7c7b\u578b\u4e14\u5728\u5185\u5b58\u4e2d\u8fde\u7eed\u3002</li> <li><code>a.data()</code>\uff1a\u8fd4\u56de\u5e95\u5c42\u6570\u7ec4\u7684\u539f\u59cb\u6307\u9488\uff08<code>float*</code>\uff09\u2014\u2014SIMD\u5185\u8054\u51fd\u6570\u9700\u8981\u3002</li> <li><code>std::chrono</code>\uff1a\u7528\u4e8e\u57fa\u51c6\u6d4b\u8bd5\u7684\u9ad8\u5206\u8fa8\u7387\u8ba1\u65f6\u5668\u3002</li> <li><code>-O3</code>\uff1a\u6700\u9ad8\u7f16\u8bd1\u5668\u4f18\u5316\u7ea7\u522b\u3002\u7f16\u8bd1\u5668\u53ef\u80fd\u81ea\u52a8\u5411\u91cf\u5316\u4f60\u7684\u5faa\u73af\uff08\u81ea\u52a8\u4f7f\u7528SIMD\uff09\u3002<code>-march=native</code> \u542f\u7528\u4f60\u7684CPU\u652f\u6301\u7684\u6240\u6709SIMD\u6307\u4ee4\u3002</li> </ul> </li> <li> <p>\u4e3a\u4ec0\u4e48\u9700\u8981\u9884\u70ed\uff1a\u9996\u6b21\u8fd0\u884c\u586b\u5145\u7f13\u5b58\u5e76\u53ef\u80fd\u89e6\u53d1CPU\u9891\u7387\u7f29\u653e\uff08\u777f\u9891\u52a0\u901f\uff09\u3002\u540e\u7eed\u8fd0\u884c\u66f4\u5177\u4ee3\u8868\u6027\u3002</p> </li> <li> <p>\u4e3a\u4ec0\u4e48\u6d4b\u91cf\u5e26\u5bbd\uff1a\u5bf9\u4e8e\u5185\u5b58\u53d7\u9650\u7684\u64cd\u4f5c\uff08\u5982\u9010\u5143\u7d20\u52a0\u6cd5\uff09\uff0c\u6709\u610f\u4e49\u7684\u5ea6\u91cf\u662f\u5e26\u5bbd\uff08GB/s\uff09\uff0c\u800c\u4e0d\u662fFLOPS\u3002\u5982\u679c\u4f60\u7684\u6d4b\u91cf\u5e26\u5bbd\u63a5\u8fd1\u786c\u4ef6\u6781\u9650\uff08DDR5\u7ea650 GB/s\uff09\uff0c\u4f60\u662f\u5185\u5b58\u53d7\u9650\u7684\uff0cSIMD\u4e0d\u4f1a\u6709\u591a\u5927\u5e2e\u52a9\uff08\u74f6\u9888\u662f\u5185\u5b58\uff0c\u800c\u975e\u8ba1\u7b97\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/01.%20hardware%20fundamentals/#colab","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216\u7b14\u8bb0\u672c\uff09","text":"<ol> <li> <p>\u8ba1\u7b97\u5e38\u89c1ML\u64cd\u4f5c\u7684\u7b97\u672f\u5f3a\u5ea6\uff0c\u5e76\u5c06\u5b83\u4eec\u5206\u7c7b\u4e3a\u5185\u5b58\u53d7\u9650\u6216\u8ba1\u7b97\u53d7\u9650\u3002 <pre><code>import jax.numpy as jnp\n\ndef arithmetic_intensity(flops, bytes_transferred):\n    return flops / bytes_transferred\n\n# \u9010\u5143\u7d20ReLU\uff1a\u6bcf\u5143\u7d201\u6b21\u6bd4\u8f83\uff0c\u8bfb\u53d6+\u5199\u5165\nn = 1024\nrelu_flops = n  # \u6bcf\u5143\u7d201\u6b21\u64cd\u4f5c\nrelu_bytes = 2 * n * 4  # \u8bfb\u53d6\u8f93\u5165+\u5199\u5165\u8f93\u51fa\uff08float32\uff09\nprint(f\"ReLU: {arithmetic_intensity(relu_flops, relu_bytes):.2f} FLOPS/byte \u2192 \u5185\u5b58\u53d7\u9650\")\n\n# \u77e9\u9635\u4e58\u6cd5\uff1a2*n^3\u6b21\u64cd\u4f5c\uff0c\u8bfb\u53d62*n^2 + \u5199\u5165n^2\u4e2a\u6d6e\u70b9\u6570\nmatmul_flops = 2 * n**3\nmatmul_bytes = 3 * n**2 * 4  # \u8bfb\u53d6A + \u8bfb\u53d6B + \u5199\u5165C\nprint(f\"\u77e9\u9635\u4e58\u6cd5 ({n}\u00d7{n}): {arithmetic_intensity(matmul_flops, matmul_bytes):.0f} FLOPS/byte \u2192 \u8ba1\u7b97\u53d7\u9650\")\n\n# \u5c42\u5f52\u4e00\u5316\uff1a\u7ea65n\u6b21\u64cd\u4f5c\uff08\u5747\u503c\u3001\u65b9\u5dee\u3001\u5f52\u4e00\u5316\uff09\uff0c\u8bfb\u53d6+\u5199\u5165\nln_flops = 5 * n\nln_bytes = 2 * n * 4\nprint(f\"LayerNorm: {arithmetic_intensity(ln_flops, ln_bytes):.2f} FLOPS/byte \u2192 \u5185\u5b58\u53d7\u9650\")\n\n# 3x3\u5377\u79ef\uff1a2*9*C_in*C_out*H*W\uff0c\u8bfb\u53d6\u5377\u79ef\u6838+\u7279\u5f81\u56fe+\u5199\u5165\u8f93\u51fa\nC_in, C_out, H, W = 64, 128, 32, 32\nconv_flops = 2 * 9 * C_in * C_out * H * W\nconv_bytes = (9 * C_in * C_out + C_in * H * W + C_out * H * W) * 4\nprint(f\"Conv3x3: {arithmetic_intensity(conv_flops, conv_bytes):.0f} FLOPS/byte \u2192 \u8ba1\u7b97\u53d7\u9650\")\n</code></pre></p> </li> <li> <p>\u6f14\u793a\u4e3a\u4ec0\u4e48\u5e76\u884c\u6027\u91cd\u8981\u3002\u6bd4\u8f83\u987a\u5e8f\u6267\u884c\u4e0e\u5e76\u884c\uff08NumPy\uff09\u6267\u884c\u968f\u6570\u636e\u89c4\u6a21\u589e\u957f\u7684\u8868\u73b0\u3002 <pre><code>import numpy as np\nimport time\n\nfor n in [1000, 10000, 100000, 1000000, 10000000]:\n    a = np.random.randn(n).astype(np.float32)\n    b = np.random.randn(n).astype(np.float32)\n\n    # \"\u987a\u5e8f\u6267\u884c\"\uff08Python\u5faa\u73af\uff09\n    start = time.time()\n    c = [a[i] * b[i] for i in range(min(n, 100000))]  # \u4e0a\u965010\u4e07\u4ee5\u786e\u4fdd\u5408\u7406\n    seq_time = time.time() - start\n    if n &gt; 100000:\n        seq_time *= n / 100000  # \u5916\u63a8\n\n    # \"\u5e76\u884c\"\uff08NumPy\uff0c\u5185\u90e8\u4f7f\u7528SIMD+\u591a\u7ebf\u7a0b\uff09\n    start = time.time()\n    c = a * b\n    par_time = time.time() - start\n\n    print(f\"n={n:&gt;10,}  \u987a\u5e8f={seq_time:.4f}s  \u5e76\u884c={par_time:.6f}s  \"\n          f\"\u52a0\u901f\u6bd4={seq_time/par_time:.0f}x\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/02.%20ARM%20and%20NEON/","title":"ARM\u4e0eNEON","text":"<p>ARM\u5904\u7406\u5668\u9a71\u52a8\u7740\u6bcf\u4e00\u90e8\u667a\u80fd\u624b\u673a\u3001\u5927\u591a\u6570\u5e73\u677f\u7535\u8111\u3001Apple\u7684\u7b14\u8bb0\u672c\u7535\u8111\u4ee5\u53ca\u65e5\u76ca\u589e\u957f\u7684\u6570\u636e\u4e2d\u5fc3\u670d\u52a1\u5668\u4efd\u989d\u3002\u672c\u6587\u6db5\u76d6ARM\u67b6\u6784\u3001\u4f7f\u7528C++\u5185\u8054\u51fd\u6570\u7684NEON SIMD\u7f16\u7a0b\u3001\u7528\u4e8e\u53ef\u4f38\u7f29\u5411\u91cf\u5904\u7406\u7684SVE/SVE2\u3001Apple Silicon\u7279\u6027\u4ee5\u53ca\u5b9e\u9645\u5411\u91cf\u5316\u6838\u51fd\u6570\u793a\u4f8b</p> <ul> <li> <p>\u5982\u679c\u4f60\u62e5\u6709iPhone\u3001MacBook\u6216\u4f7f\u7528AWS Graviton\u5b9e\u4f8b\uff0c\u4f60\u6b63\u5728\u8fd0\u884cARM\u3002ARM\u7684\u529f\u8017\u6548\u7387\u4f7f\u5176\u5728\u79fb\u52a8\u548c\u5d4c\u5165\u5f0f\u9886\u57df\u5360\u636e\u4e3b\u5bfc\u5730\u4f4d\uff0c\u5e76\u5728\u670d\u52a1\u5668\u548cML\u63a8\u7406\u65b9\u9762\u65e5\u76ca\u5177\u6709\u7ade\u4e89\u529b\u3002\u7406\u89e3ARM SIMD\u8ba9\u4f60\u80fd\u591f\u7f16\u5199\u5728\u5927\u591a\u6570\u4eba\u5b9e\u9645\u4f7f\u7528\u7684\u786c\u4ef6\u4e0a\u5feb\u901f\u8fd0\u884c\u7684\u4ee3\u7801\u3002</p> </li> <li> <p>\u6709\u5173\u751f\u4ea7\u4e2dARM SIMD\u6838\u51fd\u6570\u7684\u5b9e\u9645\u4f8b\u5b50\uff0c\u8bf7\u53c2\u89c1Cactus\u2014\u2014\u9762\u5411\u79fb\u52a8\u8bbe\u5907\u548c\u53ef\u7a7f\u6234\u8bbe\u5907\u7684\u4f4e\u5ef6\u8fdfAI\u5f15\u64ce\uff1agithub.com/cactus-compute/cactus\u3002Cactus\u5b9e\u73b0\u4e86\u81ea\u5b9a\u4e49ARM NEON\u548cNPU\u52a0\u901f\u7684\u6ce8\u610f\u673a\u5236\u3001KV\u7f13\u5b58\u91cf\u5316\u548c\u5206\u5757\u9884\u586b\u5145\u6838\u51fd\u6570\uff0c\u5728ARM CPU\u4e0a\u5b9e\u73b0\u4e86\u6700\u5feb\u7684\u63a8\u7406\uff0c\u4e14RAM\u6bd4\u5176\u5b83\u5f15\u64ce\u4f4e10\u500d\u3002\u5176\u4e09\u5c42\u67b6\u6784\uff08\u5f15\u64ce\u2192\u56fe\u2192\u6838\u51fd\u6570\uff09\u662f\u672c\u6587\u4e2dSIMD\u6982\u5ff5\u5982\u4f55\u7528\u4e8e\u6784\u5efa\u751f\u4ea7\u7ea7ML\u57fa\u7840\u8bbe\u65bd\u7684\u5177\u4f53\u5b9e\u4f8b\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/02.%20ARM%20and%20NEON/#arm","title":"ARM\u67b6\u6784\u57fa\u7840","text":"<ul> <li> <p>ARM\u662f\u4e00\u79cdRISC\uff08\u7cbe\u7b80\u6307\u4ee4\u96c6\u8ba1\u7b97\u673a\uff09\u67b6\u6784\uff08\u7b2c13\u7ae0\uff09\u3002\u5173\u952e\u7279\u5f81\uff1a</p> <ul> <li> <p>\u52a0\u8f7d-\u5b58\u50a8\u67b6\u6784\uff1a\u7b97\u672f\u6307\u4ee4\u53ea\u64cd\u4f5c\u5bc4\u5b58\u5668\uff0c\u4ece\u4e0d\u76f4\u63a5\u64cd\u4f5c\u5185\u5b58\u3002\u8981\u5bf9\u5185\u5b58\u4e2d\u7684\u4e24\u4e2a\u6570\u76f8\u52a0\uff0c\u4f60\u5fc5\u987b\uff1a(1) \u5c06\u5b83\u4eec\u52a0\u8f7d\u5230\u5bc4\u5b58\u5668\uff0c(2) \u5c06\u5bc4\u5b58\u5668\u76f8\u52a0\uff0c(3) \u5c06\u7ed3\u679c\u5b58\u56de\u5185\u5b58\u3002\u8fd9\u6bd4x86\u66f4\u7b80\u5355\uff08x86\u53ef\u4ee5\u5728\u4e00\u6761\u6307\u4ee4\u4e2d\u52a0\u4e00\u4e2a\u5bc4\u5b58\u5668\u548c\u4e00\u4e2a\u5185\u5b58\u4f4d\u7f6e\uff09\uff0c\u4f46\u4f7f\u5f97\u6d41\u6c34\u7ebf\u66f4\u6e05\u6670\u3002</p> </li> <li> <p>\u5b9a\u957f\u6307\u4ee4\uff1a\u6bcf\u4e2aARMv8\uff08AArch64\uff09\u6307\u4ee4\u6070\u597d32\u4f4d\u3002\u8fd9\u4f7f\u5f97\u89e3\u7801\u5feb\u901f\u4e14\u53ef\u9884\u6d4b\uff08\u4e0d\u50cfx86\u7684\u53ef\u53d8\u957f\u6307\u4ee4\uff0c\u957f\u5ea6\u53ef\u4ee5\u662f1-15\u5b57\u8282\uff09\u3002</p> </li> <li> <p>32\u4e2a\u901a\u7528\u5bc4\u5b58\u5668\uff08x0-x30\uff0c\u6bcf\u4e2a64\u4f4d\uff09\u52a0\u4e0a\u6808\u6307\u9488\uff08sp\uff09\u548c\u96f6\u5bc4\u5b58\u5668\uff08xzr\uff09\u3002\u76f8\u6bd4\u4e4b\u4e0bx86\u670916\u4e2a\u901a\u7528\u5bc4\u5b58\u5668\u3002\u66f4\u591a\u5bc4\u5b58\u5668 = \u66f4\u5c11\u5185\u5b58\u8bbf\u95ee = \u66f4\u5feb\u4ee3\u7801\u3002</p> </li> <li> <p>32\u4e2aSIMD/\u6d6e\u70b9\u5bc4\u5b58\u5668\uff08v0-v31\uff0c\u6bcf\u4e2a128\u4f4d\uff09\u7528\u4e8eNEON\u548c\u6d6e\u70b9\u64cd\u4f5c\u3002</p> </li> </ul> </li> </ul> <pre><code>// ARM\u6c47\u7f16\uff08\u4ec5\u611f\u53d7\u98ce\u683c\u2014\u2014\u4f60\u5c06\u4f7f\u7528\u5185\u8054\u51fd\u6570\uff0c\u800c\u975e\u6c47\u7f16\uff09\n// \u4e24\u5bc4\u5b58\u5668\u76f8\u52a0\nadd x0, x1, x2    // x0 = x1 + x2\n\n// \u4ece\u5185\u5b58\u52a0\u8f7d\nldr x0, [x1]      // x0 = *x1\uff08\u4ecex1\u4e2d\u7684\u5730\u5740\u52a0\u8f7d64\u4f4d\uff09\n\n// NEON\uff1a\u52a0\u56db\u4e2a\u6d6e\u70b9\u6570\nfadd v0.4s, v1.4s, v2.4s  // v0 = v1 + v2\uff08\u56db\u4e2a32\u4f4d\u6d6e\u70b9\u6570\uff09\n</code></pre> <ul> <li>\u4f60\u4e0d\u4f1a\u5199\u6c47\u7f16\u3002\u4f60\u5c06\u4f7f\u7528\u5185\u8054\u51fd\u6570\uff1a\u4e0e\u7279\u5b9a\u6307\u4ee4\u4e00\u5bf9\u4e00\u6620\u5c04\u7684C/C++\u51fd\u6570\u3002\u7f16\u8bd1\u5668\u5904\u7406\u5bc4\u5b58\u5668\u5206\u914d\u3001\u8c03\u5ea6\u548c\u5176\u4ed6\u5e95\u5c42\u7ec6\u8282\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/02.%20ARM%20and%20NEON/#neon128simd","title":"NEON\uff1a128\u4f4dSIMD","text":"<ul> <li>NEON\u662fARM\u7684SIMD\u6269\u5c55\u3002\u6bcf\u4e2aNEON\u5bc4\u5b58\u5668\u5bbd128\u4f4d\uff0c\u53ef\u5bb9\u7eb3\uff1a</li> </ul> \u6570\u636e\u7c7b\u578b \u6bcf\u5bc4\u5b58\u5668\u5143\u7d20\u6570 \u8868\u793a\u6cd5 float32 4 <code>float32x4_t</code> float16 8 <code>float16x8_t</code> int32 4 <code>int32x4_t</code> int16 8 <code>int16x8_t</code> int8 16 <code>int8x16_t</code> <ul> <li>128\u4f4d\u6bd4x86\u7684AVX\uff08256\u4f4d\uff09\u6216AVX-512\uff08512\u4f4d\uff09\u7a84\u3002\u4f46ARM\u4ee5\u51fa\u8272\u7684\u529f\u8017\u6548\u7387\u548c\u5e7f\u6cdb\u7684\u53ef\u7528\u6027\u5f25\u8865\u4e86\u8fd9\u4e00\u70b9\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/02.%20ARM%20and%20NEON/#neon","title":"NEON\u5185\u8054\u51fd\u6570\uff1a\u57fa\u7840","text":"<ul> <li>NEON\u5185\u8054\u51fd\u6570\u9075\u5faa\u547d\u540d\u7ea6\u5b9a\uff1a<code>v[\u64cd\u4f5c][\u9650\u5b9a\u7b26]_[\u7c7b\u578b]</code></li> </ul> <pre><code>#include &lt;arm_neon.h&gt;\n\n// \u4ece\u5185\u5b58\u52a0\u8f7d4\u4e2a\u6d6e\u70b9\u6570\u5230NEON\u5bc4\u5b58\u5668\nfloat32x4_t a = vld1q_f32(ptr);        // vld1q = vector load 1, q = 128\u4f4d\uff08\u56db\u5b57\uff09\n\n// \u4eceNEON\u5bc4\u5b58\u5668\u5b58\u50a84\u4e2a\u6d6e\u70b9\u6570\u5230\u5185\u5b58\nvst1q_f32(out_ptr, a);                   // vst1q = vector store 1, q = 128\u4f4d\n\n// \u7b97\u672f\u8fd0\u7b97\nfloat32x4_t c = vaddq_f32(a, b);        // c = a + b\uff084\u4e2a\u6d6e\u70b9\u6570\uff09\nfloat32x4_t d = vmulq_f32(a, b);        // d = a * b\uff084\u4e2a\u6d6e\u70b9\u6570\uff09\nfloat32x4_t e = vfmaq_f32(c, a, b);     // e = c + a * b\uff08\u878d\u5408\u4e58\u52a0\uff0c4\u4e2a\u6d6e\u70b9\u6570\uff09\n\n// \u6bd4\u8f83\uff08\u8fd4\u56de\u63a9\u7801\uff1a\u82e5\u771f\u5219\u51681\uff0c\u82e5\u5047\u5219\u51680\uff09\nuint32x4_t mask = vcgtq_f32(a, b);      // mask[i] = (a[i] &gt; b[i]) ? 0xFFFFFFFF : 0\n\n// \u57fa\u4e8e\u63a9\u7801\u9009\u62e9\u5143\u7d20\uff08\u7c7b\u4f3cnumpy.where\uff09\nfloat32x4_t result = vbslq_f32(mask, a, b);  // result[i] = mask[i] ? a[i] : b[i]\n\n// \u5f52\u7ea6\uff1a\u5c06\u6240\u67094\u4e2a\u5143\u7d20\u6c42\u548c\u4e3a\u6807\u91cf\nfloat total = vaddvq_f32(a);             // total = a[0] + a[1] + a[2] + a[3]\n</code></pre> <ul> <li><code>vfmaq_f32</code>\uff08\u878d\u5408\u4e58\u52a0\uff09\u662fML\u6700\u91cd\u8981\u7684SIMD\u6307\u4ee4\u3002\u5b83\u7528\u4e00\u6b21\u820d\u5165\u6b65\u9aa4\u8ba1\u7b97 \\(c = c + a \\times b\\)\uff08\u6bd4\u5206\u5f00\u4e58\u7136\u540e\u52a0\u66f4\u7cbe\u786e\uff09\u3002\u70b9\u79ef\u3001\u77e9\u9635\u4e58\u6cd5\u548c\u5377\u79ef\u90fd\u7531FMA\u6784\u5efa\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/02.%20ARM%20and%20NEON/#_1","title":"\u5b9e\u8df5\u793a\u4f8b\uff1a\u5411\u91cf\u5316\u70b9\u79ef","text":"<ul> <li>\u70b9\u79ef\u662f\u77e9\u9635\u4e58\u6cd5\u7684\u5185\u5faa\u73af\u3002\u8ba9\u6211\u4eec\u5148\u7528\u6807\u91cfC++\u7f16\u5199\uff0c\u7136\u540e\u7528NEON\u5411\u91cf\u5316\u3002</li> </ul> <pre><code>#include &lt;arm_neon.h&gt;\n\n// \u6807\u91cf\u70b9\u79ef\nfloat dot_scalar(const float* a, const float* b, int n) {\n    float sum = 0.0f;\n    for (int i = 0; i &lt; n; i++) {\n        sum += a[i] * b[i];\n    }\n    return sum;\n}\n\n// NEON\u5411\u91cf\u5316\u70b9\u79ef\nfloat dot_neon(const float* a, const float* b, int n) {\n    float32x4_t sum_vec = vdupq_n_f32(0.0f);  // \u521d\u59cb\u53164\u4e2a\u7d2f\u52a0\u5668\u4e3a0\n\n    int i = 0;\n    for (; i + 4 &lt;= n; i += 4) {\n        float32x4_t va = vld1q_f32(a + i);     // \u4ecea\u52a0\u8f7d4\u4e2a\u5143\u7d20\n        float32x4_t vb = vld1q_f32(b + i);     // \u4eceb\u52a0\u8f7d4\u4e2a\u5143\u7d20\n        sum_vec = vfmaq_f32(sum_vec, va, vb);   // sum_vec += va * vb\n    }\n\n    // \u5c064\u4e2a\u7d2f\u52a0\u5668\u5f52\u7ea6\u4e3a\u5355\u4e00\u6807\u91cf\n    float sum = vaddvq_f32(sum_vec);\n\n    // \u5904\u7406\u5269\u4f59\u5143\u7d20\uff08\u5982\u679cn\u4e0d\u662f4\u7684\u500d\u6570\uff09\n    for (; i &lt; n; i++) {\n        sum += a[i] * b[i];\n    }\n\n    return sum;\n}\n</code></pre> <ul> <li> <p>\u5173\u952eC++\u6982\u5ff5\uff1a</p> <ul> <li><code>const float*</code>\uff1a\u6307\u5411\u53ea\u8bfb\u6d6e\u70b9\u6570\u636e\u7684\u6307\u9488\u3002<code>const</code> \u627f\u8bfa\u6211\u4eec\u4e0d\u4f1a\u901a\u8fc7\u6b64\u6307\u9488\u4fee\u6539\u6570\u636e\u3002</li> <li><code>a + i</code>\uff1a\u6307\u9488\u8fd0\u7b97\u3002<code>a + i</code> \u6307\u5411\u6570\u7ec4\u7684\u7b2c \\(i\\) \u4e2a\u5143\u7d20\uff08\u7b49\u540c\u4e8e <code>&amp;a[i]</code>\uff09\u3002</li> <li>\u672b\u5c3e\u7684\"\u6e05\u7406\u5faa\u73af\"\u5904\u7406 \\(n\\) \u4e0d\u662f4\u7684\u500d\u6570\u7684\u60c5\u51b5\u3002\u8fd9\u662fSIMD\u4ee3\u7801\u4e2d\u7684\u901a\u7528\u6a21\u5f0f\uff1a\u7528\u5411\u91cf\u5316\u5757\u5904\u7406\u4e3b\u4f53\u90e8\u5206\uff0c\u7136\u540e\u7528\u6807\u91cf\u4ee3\u7801\u5904\u7406\u4f59\u6570\u3002</li> </ul> </li> <li> <p>\u4e3a\u4ec0\u4e48 <code>sum_vec</code> \u4e2d\u4f7f\u75284\u4e2a\u7d2f\u52a0\u5668\uff1a\u6211\u4eec\u4f7f\u75284\u4e2a\u72ec\u7acb\u7684\u7d2f\u52a0\u5668\uff08\u6bcf\u4e2aSIMD\u901a\u9053\u4e00\u4e2a\uff09\uff0c\u800c\u4e0d\u662f\u5355\u4e2a\u6807\u91cf\u7d2f\u52a0\u5668\u3002\u8fd9\u907f\u514d\u4e86\u6570\u636e\u4f9d\u8d56\uff1a\u6bcf\u6b21\u8fed\u4ee3\u7684FMA\u4f9d\u8d56\u4e8e <code>sum_vec</code>\uff0c\u4f46\u6709\u4e864\u4e2a\u72ec\u7acb\u901a\u9053\uff0cCPU\u53ef\u4ee5\u5bf9FMAs\u8fdb\u884c\u6d41\u6c34\u7ebf\u5904\u7406\u3002\u6700\u540e\uff0c\u6211\u4eec\u5c064\u4e2a\u90e8\u5206\u548c\u5f52\u7ea6\u4e3a\u4e00\u4e2a\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/02.%20ARM%20and%20NEON/#relu","title":"\u5b9e\u8df5\u793a\u4f8b\uff1a\u5411\u91cf\u5316ReLU","text":"<pre><code>#include &lt;arm_neon.h&gt;\n\nvoid relu_neon(const float* input, float* output, int n) {\n    float32x4_t zero = vdupq_n_f32(0.0f);\n\n    int i = 0;\n    for (; i + 4 &lt;= n; i += 4) {\n        float32x4_t x = vld1q_f32(input + i);\n        float32x4_t result = vmaxq_f32(x, zero);  // max(x, 0) = ReLU\n        vst1q_f32(output + i, result);\n    }\n\n    // \u6807\u91cf\u6e05\u7406\n    for (; i &lt; n; i++) {\n        output[i] = input[i] &gt; 0 ? input[i] : 0;\n    }\n}\n</code></pre> <ul> <li><code>vmaxq_f32</code> \u8ba1\u7b97\u4e24\u4e2a\u5411\u91cf\u7684\u9010\u5143\u7d20\u6700\u5927\u503c\u3002\u7531\u4e8e\u4e00\u4e2a\u5411\u91cf\u5168\u4e3a\u96f6\uff0c\u8fd9\u6070\u597d\u5c31\u662fReLU\u3002\u65e0\u9700\u5206\u652f\uff0c\u65e0\u9700\u6bd4\u8f83\u2014\u2014\u4ec5\u4e00\u6761\u6307\u4ee4\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/02.%20ARM%20and%20NEON/#i8mm","title":"I8MM\uff1a\u6574\u6570\u77e9\u9635\u4e58\u6cd5","text":"<ul> <li> <p>I8MM\uff08Int8\u77e9\u9635\u4e58\u6cd5\uff09\u662fARMv8.6\u6269\u5c55\uff0c\u589e\u52a0\u4e86\u7528\u4e8eINT8\u77e9\u9635\u4e58\u6cd5\uff08INT32\u7d2f\u52a0\uff09\u7684\u4e13\u7528\u6307\u4ee4\u2014\u2014\u8fd9\u6b63\u662f\u91cf\u5316ML\u63a8\u7406\u6240\u9700\u8981\u7684\u3002</p> </li> <li> <p>\u5173\u952e\u6307\u4ee4\u662f <code>SMMLA</code>\uff08\u6709\u7b26\u53f7\u77e9\u9635\u4e58\u52a0\uff09\uff1a\u5b83\u63a5\u53d7\u4e24\u4e2a8\u00d72\u5757\u7684INT8\u503c\uff0c\u5e76\u5c06\u7ed3\u679c\u7d2f\u52a0\u52302\u00d72\u5757\u7684INT32\u4e2d\uff1a</p> </li> </ul> <pre><code>#include &lt;arm_neon.h&gt;\n\n// I8MM\uff1a\u5c06\u4e24\u4e2a8\u5143\u7d20INT8\u5411\u91cf\u76f8\u4e58\uff0c\u7d2f\u52a0\u52304\u4e2aINT32\u7ed3\u679c\u4e2d\n// \u8fd9\u4ece2x8 \u00d7 8x2\u8f93\u5165\u5757\u8ba1\u7b97\u8f93\u51fa\u77e9\u9635\u7684\u4e00\u4e2a2x2\u74e6\u7247\nvoid matmul_i8mm_tile(const int8_t* A, const int8_t* B, int32_t* C) {\n    // \u4eceA\u52a0\u8f7d8\u5b57\u8282\uff082\u884c\u54044\u5143\u7d20\uff0c\u6253\u5305\uff09\n    int8x16_t va = vld1q_s8(A);   // 16\u5b57\u8282 = 2\u884c \u00d7 8\u5143\u7d20\n    int8x16_t vb = vld1q_s8(B);   // 16\u5b57\u8282 = 2\u884c \u00d7 8\u5143\u7d20\n\n    // \u52a0\u8f7d\u73b0\u6709\u7d2f\u52a0\u5668\uff082x2 = 4\u4e2aint32\u503c\uff09\n    int32x4_t acc = vld1q_s32(C);\n\n    // I8MM\u6307\u4ee4\uff1aacc += A_tile \u00d7 B_tile^T\n    // \u4ece2\u00d78 \u00d7 8\u00d72\u8f93\u5165\u8ba1\u7b972\u00d72\u8f93\u51fa\n    acc = vmmlaq_s32(acc, va, vb);  // I8MM\u6307\u4ee4\n\n    vst1q_s32(C, acc);\n}\n</code></pre> <ul> <li> <p>\u4e3a\u4ec0\u4e48I8MM\u91cd\u8981\uff1a\u6ca1\u6709I8MM\u65f6\uff0cNEON\u4e0a\u7684INT8\u77e9\u9635\u4e58\u6cd5\u9700\u8981\u52a0\u5bbd\u4e58\u6cd5\uff08<code>vmull</code>\uff09\u540e\u8ddf\u6210\u5bf9\u52a0\u6cd5\u2014\u2014\u6bcf\u4e2a\u8f93\u51fa\u5143\u7d20\u9700\u8981\u591a\u6761\u6307\u4ee4\u3002\u6709\u4e86I8MM\uff0c\u786c\u4ef6\u5728\u4e00\u6761\u6307\u4ee4\u4e2d\u5b8c\u62108\u5143\u7d20\u70b9\u79ef\uff082\u00d78 \u00d7 8\u00d72 = 2\u00d72\uff09\u3002\u5bf9\u4e8eINT8\u63a8\u7406\u5de5\u4f5c\u8d1f\u8f7d\uff0c\u8fd9\u6bd4\u7eafNEON\u5feb4-8\u500d\u3002</p> </li> <li> <p>\u53ef\u7528\u6027\uff1aApple M1+\uff08\u6240\u6709Apple Silicon\uff09\u3001ARM Cortex-A510/A710/X2+\uff08ARMv9\uff09\u3001AWS Graviton3+\u3002\u7528 <code>#ifdef __ARM_FEATURE_MATMUL_INT8</code> \u68c0\u67e5\u3002</p> </li> <li> <p>\u5bf9\u4e8eML\u63a8\u7406\uff1a\u5728ARM\u670d\u52a1\u5668\uff08Graviton\uff09\u6216Apple Silicon\u4e0a\u8fd0\u884c\u7684INT8\u91cf\u5316\u6a21\u578b\uff08\u7b2c18\u7ae0\uff09\u4eceI8MM\u4e2d\u83b7\u76ca\u5de8\u5927\u3002ONNX Runtime\u548cllama.cpp\u7b49\u6846\u67b6\u5728\u8fd0\u884c\u65f6\u68c0\u6d4bI8MM\u5e76\u81ea\u52a8\u4f7f\u7528\u4f18\u5316\u6838\u51fd\u6570\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/02.%20ARM%20and%20NEON/#smesme2","title":"SME\u548cSME2\uff1a\u53ef\u4f38\u7f29\u77e9\u9635\u6269\u5c55","text":"<ul> <li> <p>SME\uff08\u53ef\u4f38\u7f29\u77e9\u9635\u6269\u5c55\uff09\u662fARM\u5bf9Intel AMX\u548cNVIDIA\u5f20\u91cf\u6838\u5fc3\u7684\u56de\u5e94\uff1a\u7528\u4e8e\u77e9\u9635\u64cd\u4f5c\u7684\u4e13\u7528\u786c\u4ef6\u3002SME2\uff08ARMv9.2\uff09\u8fdb\u4e00\u6b65\u6269\u5c55\u4e86\u5b83\u3002</p> </li> <li> <p>SME\u5f15\u5165\u4e86ZA\u74e6\u7247\u5bc4\u5b58\u5668\uff1a\u5b58\u50a8\u5728\u786c\u4ef6\u4e2d\u76842D\u77e9\u9635\uff0c\u6700\u5927\u53ef\u8fbeSVL\u00d7SVL\u5b57\u8282\uff08\u5176\u4e2dSVL\u662f\u6d41\u5411\u91cf\u957f\u5ea6\uff0c\u901a\u5e38\u6bcf\u7ef4128-512\u4f4d\uff09\u3002\u4e0eNEON\uff081D\u5411\u91cf\uff09\u751a\u81f3SVE\uff081D\u53ef\u4f38\u7f29\u5411\u91cf\uff09\u4e0d\u540c\uff0cSME\u539f\u751f\u64cd\u4f5c2D\u74e6\u7247\u3002</p> </li> <li> <p>\u7f16\u7a0b\u6a21\u578b\u6709\u4e24\u79cd\u6a21\u5f0f\uff1a</p> <ul> <li>\u666e\u901a\u6a21\u5f0f\uff1a\u6807\u51c6ARM\u6267\u884c\uff08NEON\u3001SVE\u6b63\u5e38\u5de5\u4f5c\uff09\u3002</li> <li>\u6d41SVE\u6a21\u5f0f\uff1a\u901a\u8fc7 <code>smstart</code> \u8fdb\u5165\uff0c\u542f\u7528SME\u6307\u4ee4\u3002SVE\u6307\u4ee4\u5728\u6b64\u6a21\u5f0f\u4e0b\u4e5f\u53ef\u5de5\u4f5c\uff0c\u4f46\u53ef\u80fd\u4f7f\u7528\u4e0d\u540c\u7684\u5bc4\u5b58\u5668\u5bbd\u5ea6\u3002</li> </ul> </li> </ul> <pre><code>#include &lt;arm_sme.h&gt;\n\n// SME2\uff1a\u77e9\u9635\u4e58\u6cd5\u7684\u5916\u79ef\u7d2f\u52a0\n// \u5c06A_col \u00d7 B_row \u7d2f\u52a0\u5230ZA\u74e6\u7247\u5bc4\u5b58\u5668\u4e2d\nvoid sme2_matmul_outer(const float* A_col, const float* B_row, int K) {\n    // \u8fdb\u5165\u6d41\u6a21\u5f0f\n    // smstart;  // \uff08\u901a\u8fc7\u7f16\u8bd1\u5668\u5185\u8054\u6216\u5185\u8054\u6c47\u7f16\u5b8c\u6210\uff09\n\n    // \u6e05\u96f6ZA\u74e6\u7247\u7d2f\u52a0\u5668\n    svzero_za();\n\n    for (int k = 0; k &lt; K; k++) {\n        // \u5c06A\u7684\u4e00\u5217\u548cB\u7684\u4e00\u884c\u52a0\u8f7d\u5230SVE\u5bc4\u5b58\u5668\u4e2d\n        svfloat32_t a = svld1_f32(svptrue_b32(), &amp;A_col[k * SVL]);\n        svfloat32_t b = svld1_f32(svptrue_b32(), &amp;B_row[k * SVL]);\n\n        // \u5916\u79ef\uff1aZA += a \u00d7 b^T\n        // \u8fd9\u5728\u4e00\u4e2a\u6307\u4ee4\u4e2d\u7d2f\u52a0\u4e00\u4e2aSVL\u00d7SVL\u74e6\u7247\n        svmopa_za32_f32_m(0, svptrue_b32(), svptrue_b32(), a, b);\n    }\n\n    // \u5c06ZA\u74e6\u7247\u5b58\u50a8\u5230\u5185\u5b58\n    // svst1_za(...);\n\n    // \u9000\u51fa\u6d41\u6a21\u5f0f\n    // smstop;\n}\n</code></pre> <ul> <li> <p>\u5173\u952e\u6982\u5ff5\uff1a</p> <ul> <li><code>svmopa</code>\uff08\u5916\u79ef\u7d2f\u52a0\uff09\uff1a\u6838\u5fc3SME\u6307\u4ee4\u3002\u5b83\u8ba1\u7b97\u4e24\u4e2a\u5411\u91cf\u7684\u5b8c\u6574\u5916\u79ef\u5e76\u7d2f\u52a0\u5230ZA\u74e6\u7247\u4e2d\u3002\u5bf9\u4e8eSVL=512\u4f4d\uff0816\u4e2a\u6d6e\u70b9\u6570\uff09\uff0c\u8fd9\u662f\u4e00\u4e2a16\u00d716\u5916\u79ef\u2014\u2014\u4e00\u6761\u6307\u4ee4\u4e2d256\u6b21FMA\u64cd\u4f5c\u3002</li> <li>ZA\u74e6\u7247\uff1a\u5728\u6d41\u6a21\u5f0f\u4e2d\u8de8\u6307\u4ee4\u6301\u4e45\u5b58\u5728\u3002\u4f60\u5c06\u591a\u4e2a\u5916\u79ef\uff08\u6bcf\u4e2aK\u8fed\u4ee3\u4e00\u4e2a\uff09\u7d2f\u52a0\u5230\u540c\u4e00\u74e6\u7247\u4e2d\uff0c\u6784\u5efa\u5b8c\u6574\u7684\u77e9\u9635\u4e58\u6cd5\u74e6\u7247\u3002</li> <li>\u6d41\u6a21\u5f0f\uff1aSME\u6307\u4ee4\u4ec5\u5728\u6d41\u6a21\u5f0f\u4e0b\u5de5\u4f5c\u3002\u8fdb\u5165/\u9000\u51fa\u6d41\u6a21\u5f0f\u7684\u5f00\u9500\u610f\u5473\u7740SME\u6700\u9002\u5408\u6301\u7eed\u7684\u77e9\u9635\u8ba1\u7b97\uff0c\u800c\u975e\u77ed\u65f6\u7206\u53d1\u3002</li> </ul> </li> <li> <p>SME2\u65b0\u589e\uff1a\u591a\u5411\u91cf\u64cd\u4f5c\uff08\u540c\u65f6\u5904\u74062\u62164\u4e2aSVE\u5411\u91cf\uff09\u3001\u989d\u5916\u7684\u74e6\u7247\u64cd\u4f5c\u4ee5\u53ca\u4e0e\u666e\u901a\u6a21\u5f0f\u7684\u6539\u8fdb\u96c6\u6210\u3002</p> </li> <li> <p>\u53ef\u7528\u6027\uff1aARM Neoverse V2\uff08AWS Graviton4\uff09\u3001\u4e00\u4e9b\u5373\u5c06\u63a8\u51fa\u7684\u79fb\u52a8\u82af\u7247\u3002\u622a\u81f32026\u5e74\u5c1a\u672a\u51fa\u73b0\u5728Apple Silicon\u4e0a\u3002SME\u4ecd\u5904\u4e8e\u65e9\u671f\u9636\u6bb5\u2014\u2014\u5927\u591a\u6570ML\u6846\u67b6\u8fd8\u6ca1\u6709SME\u4f18\u5316\u7684\u6838\u51fd\u6570\u3002</p> </li> <li> <p>\u6f14\u8fdb\u8109\u7edc\uff1aNEON\uff08128\u4f4d\u5411\u91cf\uff0c\u9010\u5143\u7d20\uff09\u2192 I8MM\uff08INT8\u77e9\u9635\u74e6\u7247\uff09\u2192 SVE\uff08\u53ef\u4f38\u7f29\u5411\u91cf\uff09\u2192 SME\uff08\u53ef\u4f38\u7f292D\u77e9\u9635\u74e6\u7247\uff09\u3002\u6bcf\u4e00\u4ee3\u90fd\u66f4\u63a5\u8fd1\u786c\u4ef6\u539f\u751f\u77e9\u9635\u64cd\u4f5c\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/02.%20ARM%20and%20NEON/#svesve2","title":"SVE\u548cSVE2\uff1a\u53ef\u4f38\u7f29\u5411\u91cf\u6269\u5c55","text":"<ul> <li>NEON\u5177\u6709\u56fa\u5b9a\u7684128\u4f4d\u5bbd\u5ea6\u3002SVE\uff08\u53ef\u4f38\u7f29\u5411\u91cf\u6269\u5c55\uff09\u5f15\u5165\u4e86\u5411\u91cf\u957f\u5ea6\u65e0\u5173\uff08VLA\uff09\u7f16\u7a0b\uff1a\u4f60\u7f16\u5199\u4e00\u6b21\u4ee3\u7801\uff0c\u5b83\u5728\u4efb\u4f55\u5411\u91cf\u5bbd\u5ea6\uff08128\u52302048\u4f4d\uff09\u7684\u786c\u4ef6\u4e0a\u8fd0\u884c\u3002\u786c\u4ef6\u5728\u8fd0\u884c\u65f6\u786e\u5b9a\u5bbd\u5ea6\u3002</li> </ul> <pre><code>#include &lt;arm_sve.h&gt;\n\nvoid add_sve(const float* a, const float* b, float* c, int n) {\n    int i = 0;\n    svbool_t pred = svwhilelt_b32(i, n);  // \u8c13\u8bcd\uff1a\u54ea\u4e9b\u901a\u9053\u662f\u6fc0\u6d3b\u7684\n\n    while (svptest_any(svptrue_b32(), pred)) {\n        svfloat32_t va = svld1(pred, a + i);\n        svfloat32_t vb = svld1(pred, b + i);\n        svst1(pred, c + i, svadd_x(pred, va, vb));\n\n        i += svcntw();  // \u6309\u786c\u4ef6\u5411\u91cf\u5bbd\u5ea6\u524d\u8fdb\uff08\u4ee532\u4f4d\u5143\u7d20\u8ba1\uff09\n        pred = svwhilelt_b32(i, n);\n    }\n}\n</code></pre> <ul> <li> <p>\u8c13\u8bcd\u5bc4\u5b58\u5668\uff08<code>svbool_t</code>\uff09\u53d6\u4ee3\u4e86\u6807\u91cf\u6e05\u7406\u5faa\u73af\u3002\u6bcf\u4e2a\u901a\u9053\u6709\u4e00\u4e2a\u8c13\u8bcd\u4f4d\uff1a\u6fc0\u6d3b\u7684\u901a\u9053\u53c2\u4e0e\uff0c\u975e\u6fc0\u6d3b\u7684\u88ab\u5c4f\u853d\u3002<code>svwhilelt_b32(i, n)</code> \u6307\u4ee4\u521b\u5efa\u4e00\u4e2a\u8c13\u8bcd\uff0c\u5176\u4e2d\u5bf9\u5e94 <code>i, i+1, ..., n-1</code> \u7684\u901a\u9053\u88ab\u6fc0\u6d3b\u3002\u8fd9\u81ea\u52a8\u5904\u7406\u4e86\u5c3e\u90e8\u3002</p> </li> <li> <p><code>svcntw()</code> \u5728\u8fd0\u884c\u65f6\u8fd4\u56de\u6bcf\u4e2a\u5411\u91cf\u5bc4\u5b58\u5668\u4e2d32\u4f4d\u5143\u7d20\u7684\u6570\u91cf\u3002\u5728\u5177\u6709256\u4f4dSVE\u7684CPU\u4e0a\uff0c\u8fd4\u56de8\u3002\u5728512\u4f4dSVE\u4e0a\uff0c\u8fd4\u56de16\u3002\u4f60\u7684\u4ee3\u7801\u81ea\u52a8\u9002\u5e94\u3002</p> </li> <li> <p>SVE\u5728ARM Neoverse V1/V2\u4e0a\u53ef\u7528\uff08AWS Graviton3/4\uff0c\u4e00\u4e9b\u670d\u52a1\u5668\u82af\u7247\uff09\u3002\u5728Apple Silicon\u4e0a\u5c1a\u4e0d\u53ef\u7528\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/02.%20ARM%20and%20NEON/#apple-silicon","title":"Apple Silicon\u7279\u6027","text":"<ul> <li> <p>Apple\u7684M\u7cfb\u5217\u82af\u7247\uff08M1\u3001M2\u3001M3\u3001M4\uff09\u662f\u57fa\u4e8eARM\u7684\u81ea\u5b9a\u4e49\u5fae\u67b6\u6784\uff1a</p> </li> <li> <p>\u6027\u80fd\u6838\u5fc3\u548c\u6548\u7387\u6838\u5fc3\uff1aP\u6838\u5fc3\uff08Firestorm/Avalanche\u7b49\uff09\u7528\u4e8e\u91cd\u578b\u8ba1\u7b97\uff0cE\u6838\u5fc3\uff08Icestorm/Blizzard\u7b49\uff09\u7528\u4e8e\u540e\u53f0\u4efb\u52a1\u3002\u8c03\u5ea6\u5668\u5c06\u7ebf\u7a0b\u5206\u914d\u7ed9\u9002\u5f53\u7684\u6838\u5fc3\u7c7b\u578b\u3002</p> </li> <li> <p>AMX\uff08Apple\u77e9\u9635\u6269\u5c55\uff09\uff1a\u4e13\u7528\u77e9\u9635\u4e58\u6cd5\u5355\u5143\uff0c\u72ec\u7acb\u4e8eNEON\u3002AMX\u672a\u516c\u5f00\uff08Apple\u4e0d\u53d1\u5e03ISA\uff09\uff0c\u4f46Accelerate\u6846\u67b6\u5185\u90e8\u5c06\u5176\u7528\u4e8eBLAS\u64cd\u4f5c\u3002\u5f53\u4f60\u5728Mac\u4e0a\u8c03\u7528 <code>np.dot</code> \u65f6\uff0c\u5b83\u901a\u8fc7Accelerate\uff0c\u540e\u8005\u4f7f\u7528AMX\u3002\u4f60\u4e0d\u80fd\u76f4\u63a5\u5bf9AMX\u7f16\u7a0b\uff08\u9664\u975e\u9006\u5411\u5de5\u7a0b\uff09\u3002</p> </li> <li> <p>\u7edf\u4e00\u5185\u5b58\uff1aCPU\u548cGPU\u5171\u4eab\u540c\u4e00\u7269\u7406RAM\u3002\u5728\u5176\u4ed6\u7cfb\u7edf\u4e0a\uff0c\u6570\u636e\u5fc5\u987b\u4eceCPU\u5185\u5b58\u62f7\u8d1d\u5230GPU\u5185\u5b58\uff08\u901a\u8fc7PCIe\uff0c\u7ea632 GB/s\uff09\u3002\u5728Apple Silicon\u4e0a\uff0c\u65e0\u9700\u62f7\u8d1d\u2014\u2014GPU\u8bfb\u53d6CPU\u5199\u5165\u7684\u540c\u4e00\u5185\u5b58\u3002\u8fd9\u6d88\u9664\u4e86ML\u5de5\u4f5c\u8d1f\u8f7d\u7684\u4e3b\u8981\u74f6\u9888\u3002</p> </li> <li> <p>\u795e\u7ecf\u7f51\u7edc\u5f15\u64ce\uff1a\u4e00\u4e2a16\u6838\u4e13\u7528ML\u52a0\u901f\u5668\u3002INT8\u63a8\u7406\u65f6\u8fbe\u5230\u7ea630 TOPS\uff08\u6bcf\u79d2\u4e07\u4ebf\u6b21\u64cd\u4f5c\uff09\u3002Core ML\u5c06\u5176\u7528\u4e8e\u8bbe\u5907\u7aef\u63a8\u7406\u3002</p> </li> <li> <p>Apple Silicon\u4e0a\u7684ML\uff1a\u4f7f\u7528MLX\uff08Apple\u7684ML\u6846\u67b6\uff09\uff0c\u5b83\u4e13\u4e3a\u7edf\u4e00\u5185\u5b58\u67b6\u6784\u8bbe\u8ba1\u3002PyTorch\u4e5f\u6709MPS\uff08Metal\u6027\u80fd\u7740\u8272\u5668\uff09\u540e\u7aef\u652f\u6301\uff0c\u5c3d\u7ba1\u4e0d\u5982CUDA\u6210\u719f\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/02.%20ARM%20and%20NEON/#_2","title":"\u81ea\u52a8\u5411\u91cf\u5316","text":"<ul> <li> <p>\u7f16\u5199SIMD\u5185\u8054\u51fd\u6570\u5f88\u7e41\u7410\u3002\u7f16\u8bd1\u5668\u80fd\u81ea\u52a8\u5411\u91cf\u5316\u4f60\u7684\u4ee3\u7801\u5417\uff1f</p> </li> <li> <p>\u53ef\u4ee5\u7684\uff0c\u4f46\u6709\u9650\u5236\u3002\u73b0\u4ee3\u7f16\u8bd1\u5668\uff08GCC\u3001Clang\uff09\u53ef\u4ee5\u81ea\u52a8\u5411\u91cf\u5316\u7b80\u5355\u5faa\u73af\uff1a</p> </li> </ul> <pre><code>// \u7f16\u8bd1\u5668\u53ef\u4ee5\u81ea\u52a8\u5411\u91cf\u5316\u6b64\u4ee3\u7801\uff08\u4f7f\u7528 -O3 -march=native\uff09\nvoid add_auto(const float* a, const float* b, float* c, int n) {\n    for (int i = 0; i &lt; n; i++) {\n        c[i] = a[i] + b[i];\n    }\n}\n</code></pre> <ul> <li>\u6709\u52a9\u4e8e\u81ea\u52a8\u5411\u91cf\u5316\u7684\u6a21\u5f0f\uff1a<ul> <li>\u7b80\u5355\u7684\u5faa\u73af\uff0c\u8fed\u4ee3\u6b21\u6570\u5df2\u77e5\u3002</li> <li>\u8fed\u4ee3\u4e4b\u95f4\u65e0\u6570\u636e\u4f9d\u8d56\uff08<code>c[i]</code> \u4e0d\u4f9d\u8d56\u4e8e <code>c[i-1]</code>\uff09\u3002</li> <li>\u8fde\u7eed\u5185\u5b58\u8bbf\u95ee\uff08\u65e0\u5206\u6563/\u805a\u96c6\uff09\u3002</li> <li><code>const</code> \u548c <code>restrict</code> \u6307\u9488\uff08\u544a\u77e5\u7f16\u8bd1\u5668\u6570\u7ec4\u4e0d\u91cd\u53e0\uff09\u3002</li> </ul> </li> </ul> <pre><code>// restrict \u544a\u8bc9\u7f16\u8bd1\u5668\uff1aa\u3001b\u3001c \u6307\u5411\u4e0d\u91cd\u53e0\u7684\u5185\u5b58\nvoid add_restrict(const float* __restrict__ a,\n                  const float* __restrict__ b,\n                  float* __restrict__ c, int n) {\n    for (int i = 0; i &lt; n; i++) {\n        c[i] = a[i] + b[i];\n    }\n}\n</code></pre> <ul> <li> <p>\u6ca1\u6709 <code>restrict</code>\uff0c\u7f16\u8bd1\u5668\u5fc5\u987b\u5047\u8bbe <code>c</code> \u53ef\u80fd\u4e0e <code>a</code> \u6216 <code>b</code> \u91cd\u53e0\uff08\u5199\u5165 <code>c[i]</code> \u53ef\u80fd\u6539\u53d8 <code>a[i+1]</code>\uff09\uff0c\u4ece\u800c\u963b\u6b62\u5411\u91cf\u5316\u3002</p> </li> <li> <p>\u963b\u6b62\u81ea\u52a8\u5411\u91cf\u5316\u7684\u6a21\u5f0f\uff1a</p> <ul> <li>\u6570\u636e\u4f9d\u8d56\uff1a<code>a[i] = a[i-1] + b[i]</code>\uff08\u6bcf\u6b21\u8fed\u4ee3\u4f9d\u8d56\u524d\u4e00\u6b21\uff09\u3002</li> <li>\u590d\u6742\u63a7\u5236\u6d41\uff1a\u5faa\u73af\u5185\u7684 <code>if</code> \u8bed\u53e5\uff08\u9664\u975e\u7f16\u8bd1\u5668\u80fd\u8f6c\u6362\u4e3a\u8c13\u8bcd\u5316\uff09\u3002</li> <li>\u5faa\u73af\u5185\u7684\u51fd\u6570\u8c03\u7528\uff08\u9664\u975e\u51fd\u6570\u88ab\u5185\u8054\uff09\u3002</li> <li>\u6307\u9488\u522b\u540d\uff08\u6570\u7ec4\u53ef\u80fd\u91cd\u53e0\uff0c\u6ca1\u6709 <code>restrict</code>\uff09\u3002</li> </ul> </li> <li> <p>\u68c0\u67e5\u81ea\u52a8\u5411\u91cf\u5316\uff1a\u4f7f\u7528\u7f16\u8bd1\u5668\u6807\u5fd7\u67e5\u770b\u54ea\u4e9b\u88ab\u5411\u91cf\u5316\u4e86\uff1a</p> </li> </ul> <pre><code># GCC\uff1a\u663e\u793a\u5411\u91cf\u5316\u51b3\u7b56\ng++ -O3 -march=native -fopt-info-vec-optimized code.cpp\n\n# Clang\uff1a\u663e\u793a\u5411\u91cf\u5316\u62a5\u544a\nclang++ -O3 -march=native -Rpass=loop-vectorize code.cpp\n</code></pre> <ul> <li>\u4f55\u65f6\u4f7f\u7528\u5185\u8054\u51fd\u6570 vs \u81ea\u52a8\u5411\u91cf\u5316\uff1a\u4ece\u5e72\u51c0\u7684C++\u548c\u7f16\u8bd1\u5668\u4f18\u5316\u5f00\u59cb\u3002\u5982\u679c\u7f16\u8bd1\u5668\u5411\u91cf\u5316\u4e86\u4f60\u7684\u5faa\u73af\uff0c\u5f88\u597d\u3002\u5982\u679c\u6027\u80fd\u4ecd\u4e0d\u8db3\uff0c\u68c0\u67e5\u7f16\u8bd1\u5668\u7684\u5411\u91cf\u5316\u62a5\u544a\u4ee5\u7406\u89e3\u539f\u56e0\uff0c\u7136\u540e\u4ec5\u4e3a\u5173\u952e\u5185\u5faa\u73af\u7f16\u5199\u5185\u8054\u51fd\u6570\u3002\u8fc7\u65e9\u4f7f\u7528\u5185\u8054\u51fd\u6570\u4f1a\u8ba9\u4ee3\u7801\u96be\u4ee5\u9605\u8bfb\u800c\u6ca1\u6709\u786e\u5b9a\u7684\u6536\u76ca\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/02.%20ARM%20and%20NEON/#armgclangmac-mlinux-aarch64","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u5728ARM\u4e0a\u7528g++\u6216clang++\u7f16\u8bd1\u2014\u2014Mac M\u7cfb\u5217\u6216Linux aarch64\uff09","text":"<ol> <li> <p>\u7f16\u5199\u6807\u91cf\u70b9\u79ef\u548cNEON\u5411\u91cf\u5316\u70b9\u79ef\u3002\u5bf9\u4e24\u8005\u8fdb\u884c\u57fa\u51c6\u6d4b\u8bd5\u5e76\u6d4b\u91cf\u52a0\u901f\u6bd4\u3002 <pre><code>// task1_neon_dot.cpp\n// \u7f16\u8bd1\uff08Mac/ARM Linux\uff09\uff1aclang++ -O3 -o task1 task1_neon_dot.cpp\n// \u6ce8\u610f\uff1aNEON\u5728AArch64\u4e0a\u9ed8\u8ba4\u542f\u7528\uff0c\u65e0\u9700\u7279\u6b8a\u6807\u5fd7\n\n#include &lt;iostream&gt;\n#include &lt;chrono&gt;\n#include &lt;vector&gt;\n#include &lt;arm_neon.h&gt;\n\nfloat dot_scalar(const float* a, const float* b, int n) {\n    float sum = 0.0f;\n    for (int i = 0; i &lt; n; i++) {\n        sum += a[i] * b[i];\n    }\n    return sum;\n}\n\nfloat dot_neon(const float* a, const float* b, int n) {\n    float32x4_t sum_vec = vdupq_n_f32(0.0f);\n    int i = 0;\n    for (; i + 4 &lt;= n; i += 4) {\n        float32x4_t va = vld1q_f32(a + i);\n        float32x4_t vb = vld1q_f32(b + i);\n        sum_vec = vfmaq_f32(sum_vec, va, vb);\n    }\n    float sum = vaddvq_f32(sum_vec);\n    for (; i &lt; n; i++) sum += a[i] * b[i];\n    return sum;\n}\n\nint main() {\n    const int N = 10'000'000;\n    std::vector&lt;float&gt; a(N, 1.0f), b(N, 2.0f);\n\n    // \u9884\u70ed\n    volatile float s1 = dot_scalar(a.data(), b.data(), N);\n    volatile float s2 = dot_neon(a.data(), b.data(), N);\n\n    // \u6807\u91cf\u57fa\u51c6\u6d4b\u8bd5\n    auto start = std::chrono::high_resolution_clock::now();\n    for (int t = 0; t &lt; 100; t++) {\n        s1 = dot_scalar(a.data(), b.data(), N);\n    }\n    auto end = std::chrono::high_resolution_clock::now();\n    double scalar_ms = std::chrono::duration&lt;double, std::milli&gt;(end - start).count() / 100;\n\n    // NEON\u57fa\u51c6\u6d4b\u8bd5\n    start = std::chrono::high_resolution_clock::now();\n    for (int t = 0; t &lt; 100; t++) {\n        s2 = dot_neon(a.data(), b.data(), N);\n    }\n    end = std::chrono::high_resolution_clock::now();\n    double neon_ms = std::chrono::duration&lt;double, std::milli&gt;(end - start).count() / 100;\n\n    std::cout &lt;&lt; \"\u6807\u91cf: \" &lt;&lt; scalar_ms &lt;&lt; \" ms\uff08\u7ed3\u679c: \" &lt;&lt; s1 &lt;&lt; \"\uff09\\n\";\n    std::cout &lt;&lt; \"NEON: \" &lt;&lt; neon_ms &lt;&lt; \" ms\uff08\u7ed3\u679c: \" &lt;&lt; s2 &lt;&lt; \"\uff09\\n\";\n    std::cout &lt;&lt; \"\u52a0\u901f\u6bd4: \" &lt;&lt; scalar_ms / neon_ms &lt;&lt; \"x\\n\";\n    return 0;\n}\n</code></pre></p> </li> <li> <p>\u5b9e\u73b0NEON ReLU\u548csoftmax\u6700\u5927\u503c\u67e5\u627e\u3002\u7ec3\u4e60\u4f7f\u7528\u4e0d\u540c\u64cd\u4f5c\u7684\u52a0\u8f7d\u2192\u8ba1\u7b97\u2192\u5b58\u50a8\u6a21\u5f0f\u3002 <pre><code>// task2_neon_ops.cpp\n// \u7f16\u8bd1\uff1aclang++ -O3 -o task2 task2_neon_ops.cpp\n\n#include &lt;iostream&gt;\n#include &lt;vector&gt;\n#include &lt;cmath&gt;\n#include &lt;arm_neon.h&gt;\n\nvoid relu_neon(const float* in, float* out, int n) {\n    float32x4_t zero = vdupq_n_f32(0.0f);\n    int i = 0;\n    for (; i + 4 &lt;= n; i += 4) {\n        float32x4_t x = vld1q_f32(in + i);\n        vst1q_f32(out + i, vmaxq_f32(x, zero));\n    }\n    for (; i &lt; n; i++) out[i] = in[i] &gt; 0 ? in[i] : 0;\n}\n\nfloat max_neon(const float* data, int n) {\n    float32x4_t max_vec = vdupq_n_f32(-INFINITY);\n    int i = 0;\n    for (; i + 4 &lt;= n; i += 4) {\n        max_vec = vmaxq_f32(max_vec, vld1q_f32(data + i));\n    }\n    float result = vmaxvq_f32(max_vec);\n    for (; i &lt; n; i++) result = result &gt; data[i] ? result : data[i];\n    return result;\n}\n\nint main() {\n    std::vector&lt;float&gt; data = {-3, 1, -1, 4, 2, -5, 0, 7, -2, 3};\n    std::vector&lt;float&gt; out(data.size());\n\n    relu_neon(data.data(), out.data(), data.size());\n    std::cout &lt;&lt; \"ReLU: \";\n    for (float x : out) std::cout &lt;&lt; x &lt;&lt; \" \";\n    std::cout &lt;&lt; \"\\n\";\n\n    float mx = max_neon(data.data(), data.size());\n    std::cout &lt;&lt; \"\u6700\u5927\u503c: \" &lt;&lt; mx &lt;&lt; \"\uff08\u671f\u671b\u503c: 7\uff09\\n\";\n    return 0;\n}\n</code></pre></p> </li> <li> <p>\u6bd4\u8f83\u81ea\u52a8\u5411\u91cf\u5316\u4ee3\u7801\u4e0e\u624b\u5199NEON\u5185\u8054\u51fd\u6570\u3002\u7528 <code>-fopt-info-vec</code>\uff08GCC\uff09\u6216 <code>-Rpass=loop-vectorize</code>\uff08Clang\uff09\u7f16\u8bd1\u4ee5\u67e5\u770b\u7f16\u8bd1\u5668\u7684\u64cd\u4f5c\u3002 <pre><code>// task3_auto_vs_manual.cpp\n// \u7f16\u8bd1\uff1aclang++ -O3 -Rpass=loop-vectorize -o task3 task3_auto_vs_manual.cpp\n//    \uff08\u6216\uff09\uff1ag++ -O3 -fopt-info-vec-optimized -o task3 task3_auto_vs_manual.cpp\n\n#include &lt;iostream&gt;\n#include &lt;chrono&gt;\n#include &lt;vector&gt;\n#include &lt;arm_neon.h&gt;\n\n// \u8ba9\u7f16\u8bd1\u5668\u81ea\u52a8\u5411\u91cf\u5316\nvoid add_auto(const float* __restrict__ a, const float* __restrict__ b,\n              float* __restrict__ c, int n) {\n    for (int i = 0; i &lt; n; i++) {\n        c[i] = a[i] + b[i];\n    }\n}\n\n// \u624b\u5199NEON\nvoid add_neon(const float* a, const float* b, float* c, int n) {\n    int i = 0;\n    for (; i + 4 &lt;= n; i += 4) {\n        vst1q_f32(c + i, vaddq_f32(vld1q_f32(a + i), vld1q_f32(b + i)));\n    }\n    for (; i &lt; n; i++) c[i] = a[i] + b[i];\n}\n\nint main() {\n    const int N = 10'000'000;\n    std::vector&lt;float&gt; a(N, 1.0f), b(N, 2.0f), c(N);\n\n    auto bench = [&amp;](auto fn, const char* name) {\n        fn(a.data(), b.data(), c.data(), N);  // \u9884\u70ed\n        auto start = std::chrono::high_resolution_clock::now();\n        for (int t = 0; t &lt; 100; t++) fn(a.data(), b.data(), c.data(), N);\n        auto end = std::chrono::high_resolution_clock::now();\n        double ms = std::chrono::duration&lt;double, std::milli&gt;(end - start).count() / 100;\n        std::cout &lt;&lt; name &lt;&lt; \": \" &lt;&lt; ms &lt;&lt; \" ms\\n\";\n    };\n\n    bench(add_auto, \"\u81ea\u52a8\u5411\u91cf\u5316\");\n    bench(add_neon, \"\u624b\u5199NEON\");\n    // \u5b83\u4eec\u5e94\u8be5\u975e\u5e38\u63a5\u8fd1\u2014\u2014\u7f16\u8bd1\u5668\u80fd\u5f88\u597d\u5730\u81ea\u52a8\u5411\u91cf\u5316\u8fd9\u4e2a\u7b80\u5355\u5faa\u73af\n    return 0;\n}\n</code></pre></p> </li> </ol>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/03.%20x86%20and%20AVX/","title":"x86\u4e0eAVX","text":"<p>x86\u5904\u7406\u5668\u6765\u81eaIntel\u548cAMD\uff0c\u4e3b\u5bfc\u7740\u5927\u591a\u6570ML\u8bad\u7ec3\u6240\u5728\u7684\u6570\u636e\u4e2d\u5fc3\u670d\u52a1\u5668\u3002\u672c\u6587\u6db5\u76d6x86 SIMD\u7684\u6f14\u8fdb\u3001AVX/AVX2\u5185\u8054\u51fd\u6570\u7f16\u7a0b\u3001AVX-512\u3001\u7528\u4e8e\u77e9\u9635\u64cd\u4f5c\u7684Intel AMX\u3001\u5185\u5b58\u5bf9\u9f50\u3001\u6027\u80fd\u9677\u9631\u4ee5\u53ca\u6027\u80fd\u5206\u6790\u2014\u2014\u5728\u5168\u7403\u6700\u5e38\u89c1\u7684\u670d\u52a1\u5668CPU\u4e0a\u69a8\u53d6\u6700\u5927\u6027\u80fd\u7684\u5de5\u5177\u3002</p> <ul> <li>\u5982\u679c\u4f60\u7684\u8bad\u7ec3\u5728\u4e91\u865a\u62df\u673a\uff08AWS\u3001GCP\u3001Azure\uff09\u4e0a\u8fd0\u884c\uff0c\u5b83\u51e0\u4e4e\u80af\u5b9a\u8fd0\u884c\u5728x86\u4e0a\u3002\u5373\u4f7f\u662fGPU\u5bc6\u96c6\u8bad\u7ec3\u4e5f\u6709CPU\u74f6\u9888\uff1a\u6570\u636e\u52a0\u8f7d\u3001\u9884\u5904\u7406\u3001\u68af\u5ea6\u805a\u5408\u548c\u68c0\u67e5\u70b9\u4fdd\u5b58\u90fd\u5728CPU\u4e0a\u8fd0\u884c\u3002\u4f7f\u7528x86 SIMD\u4f18\u5316\u8fd9\u4e9b\u73af\u8282\u53ef\u4ee5\u6709\u610f\u4e49\u5730\u51cf\u5c11\u7aef\u5230\u7aef\u8bad\u7ec3\u65f6\u95f4\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/03.%20x86%20and%20AVX/#x86-simd","title":"x86 SIMD\u6f14\u8fdb","text":"<ul> <li>x86 SIMD\u7ecf\u5386\u4e86\u8d8a\u6765\u8d8a\u5bbd\u7684\u5411\u91cf\u5bc4\u5b58\u5668\uff1a</li> </ul> \u4ee3\u6b21 \u5e74\u4efd \u5bc4\u5b58\u5668\u5bbd\u5ea6 \u5bc4\u5b58\u5668\u6570\u91cf \u5173\u952e\u7279\u6027 MMX 1997 64\u4f4d 8\uff08mm0-7\uff09 \u4ec5\u6574\u6570\uff0c\u4e0eFPU\u5171\u4eab SSE 1999 128\u4f4d 8\uff08xmm0-7\uff09 4\u4e2a\u6d6e\u70b9\u6570\uff0c\u4e13\u7528\u5bc4\u5b58\u5668 SSE2 2001 128\u4f4d 8/16 2\u4e2a\u53cc\u7cbe\u5ea6\u6d6e\u70b9\u6570\uff0c\u6574\u6570\u64cd\u4f5c AVX 2011 256\u4f4d 16\uff08ymm0-15\uff09 8\u4e2a\u6d6e\u70b9\u6570\uff0c\u4e09\u64cd\u4f5c\u6570\u6307\u4ee4 AVX2 2013 256\u4f4d 16 \u6574\u6570256\u4f4d\uff0cFMA\uff0c\u6536\u96c6 AVX-512 2017 512\u4f4d 32\uff08zmm0-31\uff09 16\u4e2a\u6d6e\u70b9\u6570\uff0c\u63a9\u7801\u5bc4\u5b58\u5668\uff0c\u5206\u6563 AMX 2023 \u74e6\u7247\u5bc4\u5b58\u5668 8\u4e2a\u74e6\u7247 \u77e9\u9635\u4e58\u6cd5\uff08BF16\uff0cINT8\uff09 <ul> <li> <p>\u6bcf\u4e00\u4ee3\u90fd\u5c06\u5411\u91cf\u5316\u4ee3\u7801\u7684\u541e\u5410\u91cf\u7ffb\u500d\u3002\u7528SSE\u5185\u8054\u51fd\u6570\u7f16\u5199\u7684\u4ee3\u7801\u53ef\u4ee5\u57282001\u5e74\u4ee5\u6765\u5236\u9020\u7684\u6bcf\u4e00\u4e2ax86 CPU\u4e0a\u8fd0\u884c\u3002AVX2\u9700\u89812013\u5e74\u4ee5\u540e\u7684CPU\u3002AVX-512\u9700\u8981Intel Xeon\u548c\u4e00\u4e9b\u6d88\u8d39\u7ea7\u82af\u7247\u3002AMX\u662f\u6700\u65b0\u7684\uff08Sapphire Rapids\u53ca\u4ee5\u540e\uff09\u3002</p> </li> <li> <p>\u5411\u540e\u517c\u5bb9\u6027\uff1ax86 SSE\u5bc4\u5b58\u5668\uff08xmm\uff09\u662fAVX\u5bc4\u5b58\u5668\uff08ymm\uff09\u7684\u4f4e128\u4f4d\uff0c\u540e\u8005\u662fAVX-512\u5bc4\u5b58\u5668\uff08zmm\uff09\u7684\u4f4e256\u4f4d\u3002\u65e7\u7684SSE\u4ee3\u7801\u65e0\u9700\u4fee\u6539\u5373\u53ef\u5728\u65b0\u7684CPU\u4e0a\u8fd0\u884c\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/03.%20x86%20and%20AVX/#avx2","title":"AVX2\u7f16\u7a0b","text":"<ul> <li>AVX2\u64cd\u4f5c256\u4f4d\u5bc4\u5b58\u5668\uff08YMM\uff09\uff0c\u540c\u65f6\u5904\u74068\u4e2a\u6d6e\u70b9\u6570\u62164\u4e2a\u53cc\u7cbe\u5ea6\u6d6e\u70b9\u6570\u3002\u5b83\u662f\u53ef\u79fb\u690d\u9ad8\u6027\u80fd\u4ee3\u7801\u7684\u751c\u70b9\u533a\u57df\uff1a\u5728\u51e0\u4e4e\u6240\u6709\u73b0\u4ee3x86 CPU\uff082013+\uff09\u4e0a\u53ef\u7528\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/03.%20x86%20and%20AVX/#_1","title":"\u5185\u8054\u51fd\u6570\u547d\u540d\u7ea6\u5b9a","text":"<ul> <li> <p>\u6240\u6709x86\u5185\u8054\u51fd\u6570\u9075\u5faa\u6a21\u5f0f\uff1a<code>_mm[\u5bbd\u5ea6]_[\u64cd\u4f5c]_[\u7c7b\u578b]</code></p> <ul> <li><code>_mm</code> = MMX/SSE\uff08128\u4f4d\uff09\uff0c<code>_mm256</code> = AVX\uff08256\u4f4d\uff09\uff0c<code>_mm512</code> = AVX-512\uff08512\u4f4d\uff09</li> <li>\u64cd\u4f5c\uff1a<code>add</code>\u3001<code>mul</code>\u3001<code>fmadd</code>\u3001<code>load</code>\u3001<code>store</code>\u3001<code>set</code> \u7b49</li> <li>\u7c7b\u578b\uff1a<code>ps</code> = \u6253\u5305\u5355\u7cbe\u5ea6\uff08float32\uff09\uff0c<code>pd</code> = \u6253\u5305\u53cc\u7cbe\u5ea6\uff08float64\uff09\uff0c<code>epi32</code> = \u6253\u5305int32\uff0c<code>si256</code> = 256\u4f4d\u6574\u6570</li> </ul> </li> </ul> <pre><code>#include &lt;immintrin.h&gt;  // \u6240\u6709x86 SIMD\u5185\u8054\u51fd\u6570\n\n// \u6570\u636e\u7c7b\u578b\n__m256  a;   // 256\u4f4d\u5bc4\u5b58\u5668\uff0c\u4fdd\u5b588\u4e2afloat32\n__m256d b;   // 256\u4f4d\u5bc4\u5b58\u5668\uff0c\u4fdd\u5b584\u4e2afloat64\n__m256i c;   // 256\u4f4d\u5bc4\u5b58\u5668\uff0c\u4fdd\u5b58\u6574\u6570\uff088x32\u300116x16\u621632x8\uff09\n</code></pre>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/03.%20x86%20and%20AVX/#_2","title":"\u52a0\u8f7d\u548c\u5b58\u50a8\u6570\u636e","text":"<pre><code>// \u4ece\u5185\u5b58\u52a0\u8f7d8\u4e2a\u6d6e\u70b9\u6570\n__m256 v = _mm256_loadu_ps(ptr);      // \u975e\u5bf9\u9f50\u52a0\u8f7d\uff08\u9002\u7528\u4e8e\u4efb\u4f55\u5730\u5740\uff09\n__m256 v = _mm256_load_ps(ptr);       // \u5bf9\u9f50\u52a0\u8f7d\uff08ptr\u5fc5\u987b32\u5b57\u8282\u5bf9\u9f50\uff0c\u66f4\u5feb\uff09\n\n// \u5b58\u50a88\u4e2a\u6d6e\u70b9\u6570\u5230\u5185\u5b58\n_mm256_storeu_ps(out_ptr, v);          // \u975e\u5bf9\u9f50\u5b58\u50a8\n_mm256_store_ps(out_ptr, v);           // \u5bf9\u9f50\u5b58\u50a8\n\n// \u5c06\u5355\u4e2a\u503c\u5e7f\u64ad\u5230\u6240\u67098\u4e2a\u901a\u9053\n__m256 ones = _mm256_set1_ps(1.0f);    // [1, 1, 1, 1, 1, 1, 1, 1]\n\n// \u8bbe\u7f6e\u5404\u4e2a\u503c\uff08\u5f88\u5c11\u9700\u8981\uff09\n__m256 v = _mm256_set_ps(7,6,5,4,3,2,1,0);  // \u6ce8\u610f\uff1a\u9006\u5e8f\uff01\n\n// \u96f6\u5bc4\u5b58\u5668\n__m256 z = _mm256_setzero_ps();\n</code></pre>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/03.%20x86%20and%20AVX/#_3","title":"\u7b97\u672f\u8fd0\u7b97","text":"<pre><code>__m256 c = _mm256_add_ps(a, b);        // c[i] = a[i] + b[i]\n__m256 d = _mm256_mul_ps(a, b);        // d[i] = a[i] * b[i]\n__m256 e = _mm256_sub_ps(a, b);        // e[i] = a[i] - b[i]\n__m256 f = _mm256_div_ps(a, b);        // f[i] = a[i] / b[i]\uff08\u6bd4\u4e58\u6cd5\u6162\uff09\n\n// \u878d\u5408\u4e58\u52a0\uff1ar = a * b + c\uff08\u4e00\u6761\u6307\u4ee4\uff0c\u4e00\u6b21\u820d\u5165\uff09\n__m256 r = _mm256_fmadd_ps(a, b, c);   // ML\u6700\u91cd\u8981\u7684\u6307\u4ee4\n\n// \u6700\u5c0f\u503c\u548c\u6700\u5927\u503c\n__m256 mn = _mm256_min_ps(a, b);       // min(a[i], b[i]) \u2014 \u7528\u4e8e\u88c1\u526a\n__m256 mx = _mm256_max_ps(a, b);       // max(a[i], b[i]) \u2014 \u7528\u4e8eReLU\n</code></pre>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/03.%20x86%20and%20AVX/#avx2_1","title":"\u5b9e\u8df5\u793a\u4f8b\uff1aAVX2\u70b9\u79ef","text":"<pre><code>#include &lt;immintrin.h&gt;\n\nfloat dot_avx2(const float* a, const float* b, int n) {\n    __m256 sum = _mm256_setzero_ps();  // 8\u4e2a\u7d2f\u52a0\u5668\u521d\u59cb\u5316\u4e3a0\n\n    int i = 0;\n    for (; i + 8 &lt;= n; i += 8) {\n        __m256 va = _mm256_loadu_ps(a + i);\n        __m256 vb = _mm256_loadu_ps(b + i);\n        sum = _mm256_fmadd_ps(va, vb, sum);  // sum += va * vb\n    }\n\n    // \u6c34\u5e73\u5f52\u7ea6\uff1a\u5c06sum\u76848\u4e2a\u5143\u7d20\u76f8\u52a0\n    // \u6b65\u9aa41\uff1a\u5c06\u4e0a128\u4f4d\u52a0\u5230\u4e0b128\u4f4d\n    __m128 hi = _mm256_extractf128_ps(sum, 1);\n    __m128 lo = _mm256_castps256_ps128(sum);\n    __m128 sum128 = _mm_add_ps(hi, lo);        // 4\u4e2a\u90e8\u5206\u548c\n\n    // \u6b65\u9aa42\uff1a\u5728128\u4f4d\u5bc4\u5b58\u5668\u5185\u6c34\u5e73\u76f8\u52a0\n    sum128 = _mm_hadd_ps(sum128, sum128);       // [a+b, c+d, a+b, c+d]\n    sum128 = _mm_hadd_ps(sum128, sum128);       // [a+b+c+d, ...]\n\n    float result = _mm_cvtss_f32(sum128);       // \u63d0\u53d6\u6807\u91cf\n\n    // \u6807\u91cf\u6e05\u7406\n    for (; i &lt; n; i++) {\n        result += a[i] * b[i];\n    }\n\n    return result;\n}\n</code></pre> <ul> <li> <p>\u4e3a\u4ec0\u4e48\u6c34\u5e73\u5f52\u7ea6\u5982\u6b64\u4e11\u964b\uff1aSIMD\u662f\u4e3a\u5782\u76f4\u64cd\u4f5c\u8bbe\u8ba1\u7684\uff08\u901a\u90530\u4e0e\u901a\u90530\uff0c\u901a\u90531\u4e0e\u901a\u90531\uff09\u3002\u6c34\u5e73\u64cd\u4f5c\uff08\u8de8\u901a\u9053\u6c42\u548c\uff09\u4e0e\u786c\u4ef6\u5bf9\u6297\u3002\u8fd9\u5c31\u662f\u70b9\u79ef\u5728\u672b\u5c3e\u6709\u5c34\u5c2c\u5f52\u7ea6\u4ee3\u7801\u7684\u539f\u56e0\u3002\u5411\u91cf\u5316\u5faa\u73af\u662f\u7b80\u6d01\u7684\uff1b\u5f52\u7ea6\u662f\u6837\u677f\u4ee3\u7801\u3002</p> </li> <li> <p>\u6027\u80fd\uff1a\u4e0eNEON\u7248\u672c\uff08\u6587\u4ef602\uff09\u76f8\u6bd4\uff0cAVX2\u6bcf\u6b21\u8fed\u4ee3\u5904\u74068\u4e2a\u6d6e\u70b9\u6570\uff0c\u800cNEON\u5904\u74064\u4e2a\u3002\u5bf9\u4e8e\u957f\u5411\u91cf\uff0c\u8fd9\u6bd4NEON\u5feb2\u500d\uff08\u5ffd\u7565\u5185\u5b58\u5e26\u5bbd\u9650\u5236\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/03.%20x86%20and%20AVX/#avx2-softmax","title":"\u5b9e\u8df5\u793a\u4f8b\uff1aAVX2 Softmax\uff08\u7b80\u5316\u7248\uff09","text":"<ul> <li>Softmax\u9700\u8981\uff1a\u627e\u5230\u6700\u5927\u503c\uff0c\u51cf\u53bb\u5b83\uff0c\u6c42\u6307\u6570\uff0c\u6c42\u548c\uff0c\u9664\u6cd5\u3002\u4ee5\u4e0b\u662f\u6700\u503c\u67e5\u627e\u6b65\u9aa4\uff1a</li> </ul> <pre><code>float vector_max_avx2(const float* data, int n) {\n    __m256 max_vec = _mm256_set1_ps(-INFINITY);\n\n    int i = 0;\n    for (; i + 8 &lt;= n; i += 8) {\n        __m256 v = _mm256_loadu_ps(data + i);\n        max_vec = _mm256_max_ps(max_vec, v);\n    }\n\n    // \u5c068\u4e2a\u6700\u5927\u503c\u5f52\u7ea6\u4e3a1\u4e2a\n    __m128 hi = _mm256_extractf128_ps(max_vec, 1);\n    __m128 lo = _mm256_castps256_ps128(max_vec);\n    __m128 max128 = _mm_max_ps(hi, lo);\n\n    // \u901a\u8fc7\u6df7\u6d17\u548c\u53d6\u6700\u5927\u503c\u627e\u5230\u5355\u4e00\u6700\u5927\u503c\n    max128 = _mm_max_ps(max128, _mm_shuffle_ps(max128, max128, 0b01001110));\n    max128 = _mm_max_ps(max128, _mm_shuffle_ps(max128, max128, 0b10110001));\n\n    float result = _mm_cvtss_f32(max128);\n\n    for (; i &lt; n; i++) {\n        result = result &gt; data[i] ? result : data[i];\n    }\n\n    return result;\n}\n</code></pre> <ul> <li><code>_mm_shuffle_ps</code> \u6307\u4ee4\u5728\u5bc4\u5b58\u5668\u5185\u91cd\u6392\u5143\u7d20\u3002\u4e8c\u8fdb\u5236\u5e38\u91cf <code>0b01001110</code> \u63a7\u5236\u54ea\u4e9b\u5143\u7d20\u53bb\u54ea\u91cc\u3002\u8fd9\u79f0\u4e3a\u7f6e\u6362\uff0c\u5b83\u76f4\u63a5\u8fde\u63a5\u5230\u7f6e\u6362\u77e9\u9635\uff08\u7b2c2\u7ae0\uff09\uff1a\u6253\u4e71SIMD\u901a\u9053\u662f\u505a\u786c\u4ef6\u7ea7\u522b\u7684\u4e58\u4ee5\u7f6e\u6362\u77e9\u9635\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/03.%20x86%20and%20AVX/#avx-512","title":"AVX-512","text":"<ul> <li>AVX-512\u518d\u6b21\u52a0\u500d\u5bbd\u5ea6\uff1a512\u4f4d\u5bc4\u5b58\u5668\uff08ZMM\uff09\uff0c\u540c\u65f6\u5904\u740616\u4e2a\u6d6e\u70b9\u6570\u3002</li> </ul> <pre><code>__m512 a = _mm512_loadu_ps(ptr);                // \u52a0\u8f7d16\u4e2a\u6d6e\u70b9\u6570\n__m512 c = _mm512_fmadd_ps(a, b, c);            // 16\u4e2aFMA\u540c\u65f6\u8fdb\u884c\nfloat sum = _mm512_reduce_add_ps(a);             // \u5185\u7f6e\u6c34\u5e73\u6c42\u548c\uff08\u65e0\u9700\u624b\u52a8\u5f52\u7ea6\uff01\uff09\n\n// \u63a9\u7801\u64cd\u4f5c\uff1a\u64cd\u4f5c\u901a\u9053\u5b50\u96c6\n__mmask16 mask = _mm512_cmpgt_ps_mask(a, zero);  // \u54ea\u4e9b\u901a\u9053 &gt; 0\uff1f\n__m512 relu = _mm512_maskz_mov_ps(mask, a);       // \u8d1f\u901a\u9053\u7f6e\u96f6 = ReLU\n</code></pre> <ul> <li> <p>\u63a9\u7801\u5bc4\u5b58\u5668\uff08<code>__mmask16</code>\uff09\u662fAVX-512\u6700\u5f3a\u5927\u7684\u529f\u80fd\u3002\u6bcf\u4e2a\u4f4d\u63a7\u5236\u4e00\u4e2a\u901a\u9053\u662f\u5426\u53c2\u4e0e\u64cd\u4f5c\u3002\u8fd9\u53d6\u4ee3\u4e86\u6807\u91cf\u6e05\u7406\u5faa\u73af\uff1a\u6700\u540e\u4e00\u6b21\u8fed\u4ee3\u4f7f\u7528\u63a9\u7801\uff0c\u53ea\u6709\u6709\u6548\u901a\u9053\u662f\u6fc0\u6d3b\u7684\uff0c\u5904\u7406\u4efb\u4f55\u5411\u91cf\u957f\u5ea6\u800c\u65e0\u9700\u5355\u72ec\u6807\u91cf\u5faa\u73af\u3002</p> </li> <li> <p>AVX-512\u9891\u7387\u964d\u9891\uff1a\u5728\u8bb8\u591aIntel CPU\u4e0a\uff0c\u4f7f\u7528AVX-512\u6307\u4ee4\u4f1a\u5bfc\u81f4CPU\u6682\u65f6\u964d\u4f4e\u65f6\u949f\u9891\u7387\uff08\u4ee5\u4fdd\u6301\u5728\u70ed\u9650\u5236\u5185\uff09\u3002\u8fd9\u610f\u5473\u7740\u5bf9\u4e8e\u77ed\u65f6\u7206\u53d1\uff0cAVX-512\u5e76\u4e0d\u603b\u662f\u6bd4AVX2\u5feb\u2014\u2014\u9891\u7387\u60e9\u7f5a\u53ef\u80fd\u62b5\u6d88\u66f4\u5bbd\u5411\u91cf\u7684\u4f18\u52bf\u3002\u5bf9\u4e8e\u6301\u7eed\u5de5\u4f5c\u8d1f\u8f7d\uff08\u5982\u77e9\u9635\u4e58\u6cd5\uff09\uff0cAVX-512\u80dc\u51fa\u3002\u5bf9\u4e8e\u6df7\u5408\u4ee3\u7801\uff08\u90e8\u5206SIMD\u3001\u90e8\u5206\u6807\u91cf\uff09\uff0c\u9891\u7387\u8f6c\u6362\u53ef\u80fd\u9020\u6210\u635f\u5931\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/03.%20x86%20and%20AVX/#intel-amx","title":"Intel AMX\uff1a\u77e9\u9635\u4e58\u6cd5\u786c\u4ef6","text":"<ul> <li>AMX\uff08\u9ad8\u7ea7\u77e9\u9635\u6269\u5c55\uff09\u589e\u52a0\u4e86\u4e13\u7528\u77e9\u9635\u4e58\u6cd5\u5355\u5143\u3002AMX\u64cd\u4f5c\u7684\u4e0d\u662fSIMD\u5411\u91cf\uff0c\u800c\u662f\u74e6\u7247\uff1a2D\u6570\u636e\u5757\uff08\u6700\u591a16\u884c \u00d7 \u6bcf\u884c64\u5b57\u8282\uff09\u3002</li> </ul> <pre><code>#include &lt;immintrin.h&gt;\n\n// AMX\u74e6\u7247\u4e58\u6cd5\uff1aC += A * B\uff08BF16\u683c\u5f0f\uff09\n// A\u4e3a16x32 BF16\uff0cB\u4e3a32x16 BF16\uff0cC\u4e3a16x16 FP32\n_tile_loadd(0, a_ptr, stride_a);   // \u4eceA\u52a0\u8f7d\u74e6\u72470\n_tile_loadd(1, b_ptr, stride_b);   // \u4eceB\u52a0\u8f7d\u74e6\u72471\n_tile_dpbf16ps(2, 0, 1);           // \u74e6\u72472 += \u74e6\u72470 * \u74e6\u72471\uff08BF16\u77e9\u9635\u4e58\u6cd5\uff0cFP32\u7d2f\u52a0\uff09\n_tile_stored(2, c_ptr, stride_c);  // \u5b58\u50a8\u74e6\u72472\u5230C\n</code></pre> <ul> <li> <p>AMX\u5728\u4e00\u6761\u6307\u4ee4\u4e2d\u6267\u884c\u5b8c\u6574\u768416\u00d732 \u00d7 32\u00d716\u77e9\u9635\u4e58\u6cd5\u3002\u8fd9\u662f\u6570\u767e\u6b21FMA\u64cd\u4f5c\u540c\u65f6\u8fdb\u884c\uff0c\u4e13\u95e8\u4e3aTransformer\u63a8\u7406\u4e2d\u4e3b\u5bfc\u7684\u5c0f\u77e9\u9635\u4e58\u6cd5\u8bbe\u8ba1\uff08\u6ce8\u610f\u529b\u5f97\u5206\u8ba1\u7b97\u3001MLP\u5c42\uff09\u3002</p> </li> <li> <p>AMX\u652f\u6301BF16\uff08bfloat16\uff09\u548cINT8\uff0c\u5339\u914dML\u63a8\u7406\u4e2d\u4f7f\u7528\u7684\u7cbe\u5ea6\u3002\u7ed3\u5408\u7528\u4e8e\u5176\u4ed6\u64cd\u4f5c\u7684AVX-512\uff0c\u914d\u5907AMX\u7684CPU\uff08Intel Sapphire Rapids\u3001Emerald Rapids\uff09\u53ef\u4ee5\u5728Transformer\u63a8\u7406\u4e2d\u4e0e\u5165\u95e8\u7ea7GPU\u7ade\u4e89\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/03.%20x86%20and%20AVX/#_4","title":"\u5185\u5b58\u5bf9\u9f50","text":"<ul> <li>\u5bf9\u9f50\u5185\u5b58\u8bbf\u95ee\u662f\u6307\u6570\u636e\u5730\u5740\u662f\u5411\u91cf\u5bc4\u5b58\u5668\u5bbd\u5ea6\u7684\u500d\u6570\uff08SSE\u4e3a16\u5b57\u8282\u3001AVX\u4e3a32\u5b57\u8282\u3001AVX-512\u4e3a64\u5b57\u8282\uff09\u3002\u5bf9\u9f50\u8bbf\u95ee\u5728\u67d0\u4e9bCPU\u4e0a\u66f4\u5feb\uff0c\u5e76\u4e14\u662f <code>_mm256_load_ps</code>\uff08\u76f8\u5bf9\u4e8e <code>_mm256_loadu_ps</code>\uff09\u7684\u8981\u6c42\u3002</li> </ul> <pre><code>// \u5206\u914d\u5bf9\u9f50\u5185\u5b58\nfloat* data = (float*)aligned_alloc(32, n * sizeof(float));  // AVX\u768432\u5b57\u8282\u5bf9\u9f50\n\n// C++\u5bf9\u9f50\u5206\u914d\n#include &lt;new&gt;\nfloat* data = new (std::align_val_t(32)) float[n];\n\n// \u6216\u8005\u4f7f\u7528\u7f16\u8bd1\u5668\u5c5e\u6027\nalignas(32) float data[1024];\n</code></pre> <ul> <li>\u5b9e\u9645\u4e0a\uff1a\u5728\u73b0\u4ee3CPU\uff08Haswell\u53ca\u4ee5\u540e\uff09\u4e0a\uff0c\u5f53\u6570\u636e\u4e0d\u8de8\u8d8a\u7f13\u5b58\u884c\u8fb9\u754c\u65f6\uff0c\u975e\u5bf9\u9f50\u52a0\u8f7d\uff08<code>loadu</code>\uff09\u51e0\u4e4e\u4e0e\u5bf9\u9f50\u52a0\u8f7d\u4e00\u6837\u5feb\u3002\u975e\u5bf9\u9f50\u8bbf\u95ee\u7684\u6027\u80fd\u60e9\u7f5a\u5df2\u57fa\u672c\u6d88\u5931\uff0c\u4f46\u7f13\u5b58\u884c\u5206\u5272\uff08\u6570\u636e\u8de8\u8d8a\u4e24\u4e2a64\u5b57\u8282\u7f13\u5b58\u884c\uff09\u4ecd\u53ef\u80fd\u4f7f\u7279\u5b9a\u52a0\u8f7d\u53d8\u6162\u7ea62\u500d\u3002\u5bf9\u9f50\u5206\u914d\u5b8c\u5168\u907f\u514d\u4e86\u8fd9\u79cd\u60c5\u51b5\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/03.%20x86%20and%20AVX/#_5","title":"\u6027\u80fd\u9677\u9631","text":"<ul> <li> <p>AVX-SSE\u8f6c\u6362\u60e9\u7f5a\uff1a\u5728\u8f83\u65e7\u7684Intel CPU\uff08Skylake\u4e4b\u524d\uff09\u4e0a\uff0c\u5728AVX\uff08256\u4f4d\uff09\u548cSSE\uff08128\u4f4d\uff09\u6307\u4ee4\u4e4b\u95f4\u5207\u6362\u4f1a\u9020\u6210\u60e9\u7f5a\uff08\u7ea670\u5468\u671f\uff09\u3002\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48\u4f60\u5e94\u8be5\u5728\u4ece\u4f7f\u7528AVX\u7684\u51fd\u6570\u8fd4\u56de\u4e4b\u524d\u4f7f\u7528 <code>_mm256_zeroupper()</code>\uff08\u6216 <code>vzeroupper</code> \u6307\u4ee4\uff09\u6e05\u9664YMM\u5bc4\u5b58\u5668\u7684\u4e0a128\u4f4d\u3002\u73b0\u4ee3CPU\uff08Skylake+\uff09\u6ca1\u6709\u6b64\u60e9\u7f5a\u3002</p> </li> <li> <p>\u5bc4\u5b58\u5668\u538b\u529b\uff1aAVX2\u670916\u4e2aYMM\u5bc4\u5b58\u5668\u3002\u5982\u679c\u4f60\u7684\u6838\u51fd\u6570\u4f7f\u7528\u592a\u591a\u53d8\u91cf\uff0c\u7f16\u8bd1\u5668\u4f1a\u5c06\u5bc4\u5b58\u5668\u6ea2\u51fa\u5230\u6808\uff08\u5185\u5b58\uff09\uff0c\u4ece\u800c\u7834\u574f\u6027\u80fd\u3002\u4fdd\u6301\u5185\u5faa\u73af\u7b80\u5355\uff0c\u6d3b\u53d8\u91cf\u5c11\u3002</p> </li> <li> <p>\u6570\u636e\u4f9d\u8d56\uff1a<code>sum = _mm256_fmadd_ps(a, b, sum)</code> \u5bf9 <code>sum</code> \u6709\u4f9d\u8d56\uff1a\u6bcf\u6b21\u8fed\u4ee3\u5fc5\u987b\u7b49\u5f85\u524d\u4e00\u4e2aFMA\u5b8c\u6210\uff08\u7ea64-5\u4e2a\u5468\u671f\u7684\u5ef6\u8fdf\uff09\u3002\u89e3\u51b3\u65b9\u6848\uff1a\u4f7f\u7528\u591a\u4e2a\u72ec\u7acb\u7d2f\u52a0\u5668\u5e76\u5728\u7ed3\u675f\u65f6\u5f52\u7ea6\uff1a</p> </li> </ul> <pre><code>// \u5355\u7d2f\u52a0\u5668\uff1a\u53d7FMA\u5ef6\u8fdf\u9650\u5236\uff084-5\u4e2a\u5468\u671f\uff09\n__m256 sum = _mm256_setzero_ps();\nfor (...) {\n    sum = _mm256_fmadd_ps(a, b, sum);  // \u6bcf\u4e2a\u4f9d\u8d56\u524d\u4e00\u4e2a\n}\n\n// \u56db\u4e2a\u7d2f\u52a0\u5668\uff1a4\u500d\u541e\u5410\u91cf\uff08\u9690\u85cf\u5ef6\u8fdf\uff09\n__m256 sum0 = _mm256_setzero_ps();\n__m256 sum1 = _mm256_setzero_ps();\n__m256 sum2 = _mm256_setzero_ps();\n__m256 sum3 = _mm256_setzero_ps();\nfor (...) {\n    sum0 = _mm256_fmadd_ps(a0, b0, sum0);  // \u72ec\u7acb\n    sum1 = _mm256_fmadd_ps(a1, b1, sum1);  // \u72ec\u7acb\n    sum2 = _mm256_fmadd_ps(a2, b2, sum2);  // \u72ec\u7acb\n    sum3 = _mm256_fmadd_ps(a3, b3, sum3);  // \u72ec\u7acb\n}\nsum0 = _mm256_add_ps(sum0, sum1);\nsum2 = _mm256_add_ps(sum2, sum3);\nsum0 = _mm256_add_ps(sum0, sum2);\n</code></pre> <ul> <li>\u8fd9\u662f\u5faa\u73af\u5c55\u5f00\u4ee5\u9690\u85cf\u5ef6\u8fdf\u3002CPU\u53ef\u4ee5\u80cc\u9760\u80cc\u53d1\u51faFMAs\uff0c\u56e0\u4e3a\u5b83\u4eec\u5199\u5165\u4e0d\u540c\u7684\u5bc4\u5b58\u5668\u3002\u8fd9\u662f\u6570\u503c\u4ee3\u7801\u4e2d\u6700\u6709\u5f71\u54cd\u529b\u7684\u5fae\u4f18\u5316\u4e4b\u4e00\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/03.%20x86%20and%20AVX/#_6","title":"\u6027\u80fd\u5206\u6790","text":"<ul> <li>\u6027\u80fd\u8ba1\u6570\u5668\u63d0\u4f9b\u786c\u4ef6\u7ea7\u6d4b\u91cf\uff1a</li> </ul> <pre><code># Linux perf\uff08\u9700\u8981\u5185\u6838\u652f\u6301\uff09\nperf stat ./my_program                    # \u57fa\u672c\u8ba1\u6570\u5668\uff1a\u5468\u671f\u3001\u6307\u4ee4\u3001IPC\nperf stat -e cache-misses,cache-references ./my_program  # \u7f13\u5b58\u884c\u4e3a\nperf record -g ./my_program &amp;&amp; perf report              # \u8c03\u7528\u56fe\u5206\u6790\n\n# Intel VTune\uff08\u8be6\u7ec6\u7684x86\u6027\u80fd\u5206\u6790\uff09\nvtune -collect hotspots -- ./my_program\nvtune -collect memory-access -- ./my_program   # \u5185\u5b58\u5e26\u5bbd\u5206\u6790\n</code></pre> <ul> <li>\u9700\u8981\u5173\u6ce8\u4ec0\u4e48\uff1a<ul> <li>IPC\uff08\u6bcf\u5468\u671f\u6307\u4ee4\u6570\uff09\uff1aCPU\u88ab\u4f7f\u7528\u7684\u6548\u7387\u3002IPC &gt; 2 \u826f\u597d\u3002IPC &lt; 1 \u8868\u660e\u5185\u5b58\u505c\u987f\u6216\u5206\u652f\u9884\u6d4b\u9519\u8bef\u3002</li> <li>\u7f13\u5b58\u7f3a\u5931\u7387\uff1a\u9ad8L1/L2\u7f3a\u5931\u7387\u8868\u660e\u6570\u636e\u5c40\u90e8\u6027\u5dee\u3002\u9700\u91cd\u6784\u6570\u636e\u8bbf\u95ee\u6a21\u5f0f\u3002</li> <li>\u5206\u652f\u9884\u6d4b\u9519\u8bef\u7387\uff1a&gt; 5% \u8868\u660e\u5206\u652f\u4e0d\u53ef\u9884\u6d4b\u3002\u5982\u53ef\u80fd\uff0c\u8f6c\u6362\u4e3a\u65e0\u5206\u652f\u4ee3\u7801\uff08SIMD\u6bd4\u8f83+\u6df7\u5408\uff09\u3002</li> <li>\u5b9e\u9645FLOPS vs \u5c4b\u9876\u7ebf\uff1a\u5c06\u4f60\u7684\u5b9e\u6d4bFLOPS\u4e0e\u5c4b\u9876\u7ebf\u6a21\u578b\uff08\u6587\u4ef601\uff09\u6bd4\u8f83\u3002\u5982\u679c\u4f60\u4f4e\u4e8e\u5c4b\u9876\u7ebf\uff0c\u8fd8\u6709\u6539\u8fdb\u7a7a\u95f4\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/03.%20x86%20and%20AVX/#x86intelamdgclang","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u5728x86\u2014\u2014Intel/AMD\u4e0a\u7528g++\u6216clang++\u7f16\u8bd1\uff09","text":"<ol> <li> <p>\u7f16\u5199\u6807\u91cf\u70b9\u79ef\u548cAVX2\u70b9\u79ef\u3002\u5bf9\u4e24\u8005\u8fdb\u884c\u57fa\u51c6\u6d4b\u8bd5\u5e76\u6d4b\u91cf8\u8defSIMD\u5e26\u6765\u7684\u52a0\u901f\u6bd4\u3002 <pre><code>// task1_avx_dot.cpp\n// \u7f16\u8bd1\uff1ag++ -O3 -mavx2 -mfma -o task1 task1_avx_dot.cpp\n\n#include &lt;iostream&gt;\n#include &lt;chrono&gt;\n#include &lt;vector&gt;\n#include &lt;immintrin.h&gt;\n\nfloat dot_scalar(const float* a, const float* b, int n) {\n    float sum = 0.0f;\n    for (int i = 0; i &lt; n; i++) sum += a[i] * b[i];\n    return sum;\n}\n\nfloat dot_avx2(const float* a, const float* b, int n) {\n    __m256 sum = _mm256_setzero_ps();\n    int i = 0;\n    for (; i + 8 &lt;= n; i += 8) {\n        __m256 va = _mm256_loadu_ps(a + i);\n        __m256 vb = _mm256_loadu_ps(b + i);\n        sum = _mm256_fmadd_ps(va, vb, sum);\n    }\n    // \u5f52\u7ea6\uff1a\u4e0a128\u52a0\u5230\u4e0b128\uff0c\u7136\u540e\u6c34\u5e73\u76f8\u52a0\n    __m128 hi = _mm256_extractf128_ps(sum, 1);\n    __m128 lo = _mm256_castps256_ps128(sum);\n    __m128 r = _mm_add_ps(hi, lo);\n    r = _mm_hadd_ps(r, r);\n    r = _mm_hadd_ps(r, r);\n    float result = _mm_cvtss_f32(r);\n    for (; i &lt; n; i++) result += a[i] * b[i];\n    return result;\n}\n\nint main() {\n    const int N = 10'000'000;\n    std::vector&lt;float&gt; a(N, 1.0f), b(N, 2.0f);\n\n    volatile float s1 = dot_scalar(a.data(), b.data(), N);\n    volatile float s2 = dot_avx2(a.data(), b.data(), N);\n\n    auto bench = [&amp;](auto fn, const char* name) {\n        auto start = std::chrono::high_resolution_clock::now();\n        volatile float s;\n        for (int t = 0; t &lt; 100; t++) s = fn(a.data(), b.data(), N);\n        auto end = std::chrono::high_resolution_clock::now();\n        double ms = std::chrono::duration&lt;double, std::milli&gt;(end - start).count() / 100;\n        std::cout &lt;&lt; name &lt;&lt; \": \" &lt;&lt; ms &lt;&lt; \" ms\uff08\u7ed3\u679c: \" &lt;&lt; s &lt;&lt; \"\uff09\\n\";\n        return ms;\n    };\n\n    double t1 = bench(dot_scalar, \"\u6807\u91cf\");\n    double t2 = bench(dot_avx2,   \"AVX2  \");\n    std::cout &lt;&lt; \"\u52a0\u901f\u6bd4: \" &lt;&lt; t1 / t2 &lt;&lt; \"x\\n\";\n    return 0;\n}\n</code></pre></p> </li> <li> <p>\u4f7f\u7528 <code>_mm256_max_ps</code> \u5b9e\u73b0AVX2 ReLU\u5e76\u4e0e\u6807\u91cf\u5faa\u73af\u6bd4\u8f83\u3002\u7136\u540e\u5c1d\u8bd5\u4f7f\u7528\u591a\u7d2f\u52a0\u5668\uff08\u5faa\u73af\u5c55\u5f00\uff09\u4ee5\u9690\u85cfFMA\u5ef6\u8fdf\u3002 <pre><code>// task2_avx_relu.cpp\n// \u7f16\u8bd1\uff1ag++ -O3 -mavx2 -o task2 task2_avx_relu.cpp\n\n#include &lt;iostream&gt;\n#include &lt;chrono&gt;\n#include &lt;vector&gt;\n#include &lt;immintrin.h&gt;\n\nvoid relu_scalar(const float* in, float* out, int n) {\n    for (int i = 0; i &lt; n; i++) {\n        out[i] = in[i] &gt; 0.0f ? in[i] : 0.0f;\n    }\n}\n\nvoid relu_avx2(const float* in, float* out, int n) {\n    __m256 zero = _mm256_setzero_ps();\n    int i = 0;\n    for (; i + 8 &lt;= n; i += 8) {\n        __m256 x = _mm256_loadu_ps(in + i);\n        _mm256_storeu_ps(out + i, _mm256_max_ps(x, zero));\n    }\n    for (; i &lt; n; i++) out[i] = in[i] &gt; 0.0f ? in[i] : 0.0f;\n}\n\n// \u5c55\u5f00\uff1a\u6bcf\u6b21\u8fed\u4ee3\u5904\u740632\u4e2a\u6d6e\u70b9\u6570\uff084 x 8\uff09\nvoid relu_avx2_unrolled(const float* in, float* out, int n) {\n    __m256 zero = _mm256_setzero_ps();\n    int i = 0;\n    for (; i + 32 &lt;= n; i += 32) {\n        __m256 x0 = _mm256_loadu_ps(in + i);\n        __m256 x1 = _mm256_loadu_ps(in + i + 8);\n        __m256 x2 = _mm256_loadu_ps(in + i + 16);\n        __m256 x3 = _mm256_loadu_ps(in + i + 24);\n        _mm256_storeu_ps(out + i,      _mm256_max_ps(x0, zero));\n        _mm256_storeu_ps(out + i + 8,  _mm256_max_ps(x1, zero));\n        _mm256_storeu_ps(out + i + 16, _mm256_max_ps(x2, zero));\n        _mm256_storeu_ps(out + i + 24, _mm256_max_ps(x3, zero));\n    }\n    for (; i + 8 &lt;= n; i += 8) {\n        _mm256_storeu_ps(out + i, _mm256_max_ps(_mm256_loadu_ps(in + i), zero));\n    }\n    for (; i &lt; n; i++) out[i] = in[i] &gt; 0.0f ? in[i] : 0.0f;\n}\n\nint main() {\n    const int N = 16'000'000;\n    std::vector&lt;float&gt; in(N), out(N);\n    for (int i = 0; i &lt; N; i++) in[i] = (float)(i % 200) - 100.0f;\n\n    auto bench = [&amp;](auto fn, const char* name) {\n        fn(in.data(), out.data(), N);  // \u9884\u70ed\n        auto start = std::chrono::high_resolution_clock::now();\n        for (int t = 0; t &lt; 100; t++) fn(in.data(), out.data(), N);\n        auto end = std::chrono::high_resolution_clock::now();\n        double ms = std::chrono::duration&lt;double, std::milli&gt;(end - start).count() / 100;\n        double bw = 2.0 * N * sizeof(float) / ms / 1e6;  // \u8bfb\u53d6+\u5199\u5165\n        std::cout &lt;&lt; name &lt;&lt; \": \" &lt;&lt; ms &lt;&lt; \" ms\uff08\" &lt;&lt; bw &lt;&lt; \" GB/s\uff09\\n\";\n    };\n\n    bench(relu_scalar,        \"\u6807\u91cf          \");\n    bench(relu_avx2,          \"AVX2          \");\n    bench(relu_avx2_unrolled, \"AVX2\u5c55\u5f00      \");\n    return 0;\n}\n</code></pre></p> </li> <li> <p>\u6d4b\u91cf\u5185\u5b58\u5bf9\u9f50\u7684\u6548\u679c\u3002\u6bd4\u8f83\u5728\u5927\u6570\u7ec4\u4e0a\u7684\u5bf9\u9f50\u52a0\u8f7d\u4e0e\u975e\u5bf9\u9f50\u52a0\u8f7d\u3002 <pre><code>// task3_alignment.cpp\n// \u7f16\u8bd1\uff1ag++ -O3 -mavx2 -o task3 task3_alignment.cpp\n\n#include &lt;iostream&gt;\n#include &lt;chrono&gt;\n#include &lt;cstdlib&gt;\n#include &lt;immintrin.h&gt;\n\nint main() {\n    const int N = 16'000'000;\n\n    // \u5bf9\u9f50\u5206\u914d\uff08AVX2\u4e3a32\u5b57\u8282\uff09\n    float* aligned = (float*)aligned_alloc(32, N * sizeof(float));\n\n    // \u975e\u5bf9\u9f50\uff1a\u4ece\u5bf9\u9f50\u8fb9\u754c\u504f\u79fb4\u5b57\u8282\uff081\u4e2a\u6d6e\u70b9\u6570\uff09\n    float* raw = (float*)malloc((N + 1) * sizeof(float));\n    float* unaligned = raw + 1;  // \u4fdd\u8bc1\u672a\u5bf9\u9f50\n\n    for (int i = 0; i &lt; N; i++) {\n        aligned[i] = 1.0f;\n        unaligned[i] = 1.0f;\n    }\n\n    auto bench = [&amp;](float* ptr, bool use_aligned, const char* name) {\n        __m256 sum = _mm256_setzero_ps();\n        // \u9884\u70ed\n        for (int i = 0; i + 8 &lt;= N; i += 8) {\n            __m256 v = use_aligned ? _mm256_load_ps(ptr + i) : _mm256_loadu_ps(ptr + i);\n            sum = _mm256_add_ps(sum, v);\n        }\n\n        auto start = std::chrono::high_resolution_clock::now();\n        for (int t = 0; t &lt; 100; t++) {\n            sum = _mm256_setzero_ps();\n            for (int i = 0; i + 8 &lt;= N; i += 8) {\n                __m256 v = use_aligned ? _mm256_load_ps(ptr + i) : _mm256_loadu_ps(ptr + i);\n                sum = _mm256_add_ps(sum, v);\n            }\n        }\n        auto end = std::chrono::high_resolution_clock::now();\n        double ms = std::chrono::duration&lt;double, std::milli&gt;(end - start).count() / 100;\n        double bw = (double)N * sizeof(float) / ms / 1e6;\n        std::cout &lt;&lt; name &lt;&lt; \": \" &lt;&lt; ms &lt;&lt; \" ms\uff08\" &lt;&lt; bw &lt;&lt; \" GB/s\uff09\\n\";\n    };\n\n    bench(aligned,   true,  \"\u5bf9\u9f50\u52a0\u8f7d  \");\n    bench(unaligned, false, \"\u975e\u5bf9\u9f50\u52a0\u8f7d\");\n\n    free(aligned);\n    free(raw);\n    return 0;\n}\n</code></pre></p> </li> </ol>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/04.%20GPU%20architecture%20and%20CUDA/","title":"GPU\u67b6\u6784\u4e0eCUDA","text":"<p>GPU\u901a\u8fc7\u63d0\u4f9b\u6570\u5343\u4e2a\u6838\u5fc3\u7528\u4e8e\u5927\u89c4\u6a21\u5e76\u884c\u8ba1\u7b97\uff0c\u6539\u53d8\u4e86AI\u3002\u672c\u6587\u6db5\u76d6GPU\u4e0eCPU\u7684\u8bbe\u8ba1\u54f2\u5b66\u5bf9\u6bd4\u3001GPU\u5b58\u50a8\u5c42\u6b21\u3001C++\u4e2d\u7684CUDA\u7f16\u7a0b\u3001SIMT\u6267\u884c\u6a21\u578b\u3001\u5185\u5b58\u8bbf\u95ee\u6a21\u5f0f\u3001\u540c\u6b65\u3001\u6d41\u3001\u6027\u80fd\u5206\u6790\u4ee5\u53caNVIDIA GPU\u4ee3\u6b21\u2014\u2014\u7f16\u5199\u548c\u7406\u89e3GPU\u6838\u51fd\u6570\u6240\u9700\u7684\u77e5\u8bc6\u3002</p> <ul> <li> <p>\u6709\u5173\u5e26\u6709\u5b8c\u6574\u5de5\u4f5c\u793a\u4f8b\u7684\u5b9e\u8df5CUDA\u6559\u7a0b\uff0c\u8bf7\u53c2\u89c1\u914d\u5957\u4ed3\u5e93\uff1agithub.com/HenryNdubuaku/cuda-tutorials\u3002</p> </li> <li> <p>\u73b0\u4ee3NVIDIA GPU\u6709\u8d85\u8fc710,000\u4e2aCUDA\u6838\u5fc3\u3002CPU\u67094-128\u4e2a\u6838\u5fc3\u3002\u8fd9100-1000\u500d\u7684\u6838\u5fc3\u4f18\u52bf\u662fGPU\u4e3b\u5bfcML\u7684\u539f\u56e0\uff1a\u8bad\u7ec3\u4e00\u4e2aTransformer\u9700\u8981\u6570\u4e07\u4ebf\u6b21\u4e58\u52a0\u64cd\u4f5c\uff0cGPU\u4ee5CPU\u65e0\u6cd5\u5339\u654c\u7684\u89c4\u6a21\u5e76\u884c\u5904\u7406\u5b83\u4eec\u3002</p> </li> <li> <p>\u5373\u4f7f\u4f60\u4ece\u4e0d\u81ea\u5df1\u7f16\u5199CUDA\u6838\u51fd\u6570\uff0c\u7406\u89e3GPU\u67b6\u6784\u4e5f\u80fd\u89e3\u91ca\uff1a\u4e3a\u4ec0\u4e48\u6279\u6b21\u5927\u5c0f\u5f88\u91cd\u8981\uff08\u9700\u8981\u8db3\u591f\u7684\u5de5\u4f5c\u6765\u9971\u548cGPU\uff09\uff0c\u4e3a\u4ec0\u4e48\u5185\u5b58\u901a\u5e38\u662f\u74f6\u9888\uff08\u800c\u975e\u8ba1\u7b97\uff09\uff0c\u4ee5\u53ca\u4e3a\u4ec0\u4e48\u67d0\u4e9b\u64cd\u4f5c\uff08\u5206\u6563\u3001\u6761\u4ef6\u5206\u652f\uff09\u5728GPU\u4e0a\u5f88\u6162\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/04.%20GPU%20architecture%20and%20CUDA/#gpu-vs-cpu","title":"GPU vs CPU\uff1a\u6839\u672c\u4e0d\u540c\u7684\u8bbe\u8ba1","text":"<ul> <li> <p>CPU\u662f\u4e3a\u5ef6\u8fdf\u8bbe\u8ba1\u7684\uff1a\u6700\u5c0f\u5316\u5b8c\u6210\u4e00\u4e2a\u4efb\u52a1\u7684\u65f6\u95f4\u3002\u5b83\u5c06\u5176\u6676\u4f53\u7ba1\u9884\u7b97\u7684\u5927\u90e8\u5206\u7528\u4e8e\u7f13\u5b58\u3001\u5206\u652f\u9884\u6d4b\u5668\u548c\u4e71\u5e8f\u6267\u884c\u2014\u2014\u6240\u6709\u8ba9\u5355\u4e00\u7ebf\u7a0b\u5feb\u901f\u8fd0\u884c\u7684\u6280\u5de7\u3002</p> </li> <li> <p>GPU\u662f\u4e3a\u541e\u5410\u91cf\u8bbe\u8ba1\u7684\uff1a\u6700\u5927\u5316\u6bcf\u79d2\u5b8c\u6210\u7684\u4efb\u52a1\u6570\u91cf\u3002\u5b83\u5c06\u5927\u90e8\u5206\u6676\u4f53\u7ba1\u7528\u4e8e\u6267\u884c\u5355\u5143\uff08ALU\uff09\u3002\u5355\u4e2a\u7ebf\u7a0b\u5f88\u6162\uff0c\u4f46\u6709\u6570\u5343\u4e2a\u3002</p> </li> </ul> CPU GPU \u6838\u5fc3 4-128\uff08\u590d\u6742\u3001\u5feb\u901f\uff09 1,000-20,000\uff08\u7b80\u5355\u3001\u6162\u901f\uff09 \u65f6\u949f\u9891\u7387 3-5 GHz 1-2.5 GHz \u7f13\u5b58 \u5927\uff0832 MB+ L3\uff09 \u5c0f\uff08\u6bcfSM\u5171\u4eab\u5185\u5b58\uff09 \u5206\u652f\u9884\u6d4b \u7cbe\u5bc6 \u65e0\uff08\u6240\u6709\u7ebf\u7a0b\u9075\u5faa\u76f8\u540c\u8def\u5f84\uff09 \u6700\u9002\u5408 \u4f4e\u5ef6\u8fdf\u3001\u590d\u6742\u63a7\u5236\u6d41 \u9ad8\u541e\u5410\u91cf\u3001\u6570\u636e\u5e76\u884c\u5de5\u4f5c \u5178\u578bFLOPS\uff08FP32\uff09 1-5 TFLOPS 30-80 TFLOPS \u5185\u5b58\u5e26\u5bbd 50-100 GB/s 1-3 TB/s <ul> <li>GPU\u7684\u5185\u5b58\u5e26\u5bbd\u4f18\u52bf\uff0810-30\u500d\uff09\u901a\u5e38\u6bd4\u5176\u8ba1\u7b97\u4f18\u52bf\u66f4\u91cd\u8981\u3002\u8bb8\u591aML\u64cd\u4f5c\u662f\u5185\u5b58\u53d7\u9650\u7684\uff08\u9010\u5143\u7d20\u64cd\u4f5c\u3001\u5f52\u4e00\u5316\u3001\u6ce8\u610f\u529b\uff09\uff0cGPU\u7684\u5e26\u5bbd\u4f7f\u5176\u80fd\u591f\u8db3\u591f\u5feb\u5730\u5411\u6838\u5fc3\u8f93\u9001\u6570\u636e\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/04.%20GPU%20architecture%20and%20CUDA/#gpu","title":"GPU\u5b58\u50a8\u5c42\u6b21","text":"<ul> <li>\u7406\u89e3GPU\u5185\u5b58\u81f3\u5173\u91cd\u8981\uff0c\u56e0\u4e3a\u5185\u5b58\u8bbf\u95ee\u662f\u4e3b\u8981\u74f6\u9888\uff0c\u800c\u975e\u8ba1\u7b97\u3002</li> </ul> \u5185\u5b58 \u5927\u5c0f \u5ef6\u8fdf \u5e26\u5bbd \u4f5c\u7528\u57df \u5bc4\u5b58\u5668 \u6bcfSM\u7ea6256 KB 0\u5468\u671f \u6700\u9ad8 \u6bcf\u7ebf\u7a0b \u5171\u4eab\u5185\u5b58 \u6bcfSM 48-228 KB \u7ea65\u5468\u671f \u7ea620 TB/s \u6bcf\u7ebf\u7a0b\u5757 L1\u7f13\u5b58 \u6bcfSM 128-256 KB \u7ea630\u5468\u671f \u6bcfSM L2\u7f13\u5b58 4-96 MB \u7ea6200\u5468\u671f \u7ea66 TB/s \u5168\u5c40 \u5168\u5c40\u5185\u5b58\uff08HBM\uff09 24-192 GB \u7ea6400\u5468\u671f 1-3.3 TB/s \u5168\u5c40 <ul> <li> <p>\u5bc4\u5b58\u5668\u662f\u6700\u5feb\u4f46\u6700\u6709\u9650\u7684\u3002\u6bcf\u4e2a\u7ebf\u7a0b\u6709\u4e00\u7ec4\u79c1\u6709\u5bc4\u5b58\u5668\uff08\u901a\u5e38\u6700\u591a255\u4e2a\uff09\u3002\u6bcf\u7ebf\u7a0b\u4f7f\u7528\u8fc7\u591a\u5bc4\u5b58\u5668\u4f1a\u964d\u4f4e\u5360\u7528\u7387\uff08\u53ef\u540c\u65f6\u8fd0\u884c\u7684\u7ebf\u7a0b\u66f4\u5c11\uff09\u3002</p> </li> <li> <p>\u5171\u4eab\u5185\u5b58\u662f\u7531\u7a0b\u5e8f\u5458\u7ba1\u7406\u7684\u7f13\u5b58\uff0c\u7531\u5757\u4e2d\u7684\u6240\u6709\u7ebf\u7a0b\u5171\u4eab\u3002\u5b83\u662f\u7f16\u5199\u5feb\u901fCUDA\u6838\u51fd\u6570\u7684\u5173\u952e\uff1a\u5c06\u6570\u636e\u74e6\u7247\u4ece\u6162\u901f\u5168\u5c40\u5185\u5b58\u52a0\u8f7d\u5230\u5feb\u901f\u5171\u4eab\u5185\u5b58\uff0c\u7136\u540e\u8fdb\u884c\u8ba1\u7b97\u3002\u8fd9\u662f\u4e3b\u5bfcGPU\u7f16\u7a0b\u7684\u5206\u5757\u6a21\u5f0f\u3002</p> </li> <li> <p>\u5168\u5c40\u5185\u5b58\uff08HBM\uff09\uff1a\u4e3bGPU\u5185\u5b58\uff08VRAM\uff09\u3002\u5927\u4f46\u6162\uff08400\u5468\u671f\u5ef6\u8fdf\uff09\u3002\u6240\u6709\u6570\u636e\u8d77\u59cb\u548c\u7ed3\u675f\u4e8e\u6b64\u3002\u6838\u51fd\u6570\u4f18\u5316\u7684\u76ee\u6807\u662f\u5c3d\u91cf\u51cf\u5c11\u5168\u5c40\u5185\u5b58\u8bbf\u95ee\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/04.%20GPU%20architecture%20and%20CUDA/#cuda","title":"CUDA\u7f16\u7a0b\u6a21\u578b","text":"<ul> <li>CUDA\uff08\u7edf\u4e00\u8ba1\u7b97\u8bbe\u5907\u67b6\u6784\uff09\u662fNVIDIA\u7684GPU\u7f16\u7a0b\u6a21\u578b\u3002\u4f60\u7f16\u5199\u6838\u51fd\u6570\uff1a\u5728GPU\u4e0a\u8fd0\u884c\u7684\u51fd\u6570\uff0c\u7531\u6570\u5343\u4e2a\u7ebf\u7a0b\u540c\u65f6\u6267\u884c\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/04.%20GPU%20architecture%20and%20CUDA/#_1","title":"\u5c42\u6b21\u7ed3\u6784\uff1a\u7f51\u683c\u3001\u5757\u3001\u7ebf\u7a0b","text":"<pre><code>\u7f51\u683c\uff08\u6574\u4e2a\u542f\u52a8\uff09\n\u251c\u2500\u2500 \u5757 (0,0)\n\u2502   \u251c\u2500\u2500 \u7ebf\u7a0b (0,0)\n\u2502   \u251c\u2500\u2500 \u7ebf\u7a0b (1,0)\n\u2502   \u251c\u2500\u2500 \u7ebf\u7a0b (2,0)\n\u2502   \u2514\u2500\u2500 ... \uff08\u6bcf\u5757\u6700\u591a1024\u7ebf\u7a0b\uff09\n\u251c\u2500\u2500 \u5757 (1,0)\n\u2502   \u251c\u2500\u2500 \u7ebf\u7a0b (0,0)\n\u2502   \u2514\u2500\u2500 ...\n\u2514\u2500\u2500 ... \uff08\u53ef\u80fd\u6709\u6570\u767e\u4e07\u4e2a\u5757\uff09\n</code></pre> <ul> <li>\u7ebf\u7a0b\uff1a\u6700\u5c0f\u5355\u4f4d\u3002\u6bcf\u4e2a\u7ebf\u7a0b\u5728\u5176\u5757\u5185\u6709\u552f\u4e00ID\uff08<code>threadIdx.x</code>\uff09\u3002</li> <li>\u5757\uff1a\u4e00\u7ec4\u53ef\u4ee5\u5171\u4eab\u5185\u5b58\u548c\u540c\u6b65\u7684\u7ebf\u7a0b\u3002\u5757ID\uff1a<code>blockIdx.x</code>\u3002\u5757\u5927\u5c0f\uff1a<code>blockDim.x</code>\uff08\u6700\u591a1024\u7ebf\u7a0b\uff09\u3002</li> <li> <p>\u7f51\u683c\uff1a\u5355\u4e2a\u6838\u51fd\u6570\u542f\u52a8\u7684\u6240\u6709\u5757\u3002\u53ef\u4ee5\u662f1D\u30012D\u62163D\u3002</p> </li> <li> <p>\u6bcf\u4e2a\u7ebf\u7a0b\u8ba1\u7b97\u5176\u5168\u5c40\u7d22\u5f15\uff1a<code>int idx = blockIdx.x * blockDim.x + threadIdx.x;</code></p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/04.%20GPU%20architecture%20and%20CUDA/#cuda_1","title":"\u4f60\u7684\u7b2c\u4e00\u4e2aCUDA\u6838\u51fd\u6570","text":"<pre><code>// vector_add.cu \u2014 CUDA\u6e90\u6587\u4ef6\uff08.cu\u6269\u5c55\u540d\uff09\n\n#include &lt;stdio.h&gt;\n\n// __global__ \u6807\u8bb0\u6b64\u4e3aGPU\u6838\u51fd\u6570\uff08\u4eceCPU\u8c03\u7528\uff0c\u5728GPU\u4e0a\u8fd0\u884c\uff09\n__global__ void vector_add(const float* a, const float* b, float* c, int n) {\n    int idx = blockIdx.x * blockDim.x + threadIdx.x;\n    if (idx &lt; n) {           // \u8fb9\u754c\u68c0\u67e5\uff08\u7f51\u683c\u53ef\u80fd\u5927\u4e8e\u6570\u636e\uff09\n        c[idx] = a[idx] + b[idx];\n    }\n}\n\nint main() {\n    int n = 1 &lt;&lt; 20;  // \u7ea6100\u4e07\u4e2a\u5143\u7d20\n    size_t bytes = n * sizeof(float);\n\n    // \u5206\u914d\u4e3b\u673a\uff08CPU\uff09\u5185\u5b58\n    float *h_a = new float[n];\n    float *h_b = new float[n];\n    float *h_c = new float[n];\n\n    // \u521d\u59cb\u5316\n    for (int i = 0; i &lt; n; i++) {\n        h_a[i] = 1.0f;\n        h_b[i] = 2.0f;\n    }\n\n    // \u5206\u914d\u8bbe\u5907\uff08GPU\uff09\u5185\u5b58\n    float *d_a, *d_b, *d_c;\n    cudaMalloc(&amp;d_a, bytes);\n    cudaMalloc(&amp;d_b, bytes);\n    cudaMalloc(&amp;d_c, bytes);\n\n    // \u5c06\u6570\u636e\u4eceCPU\u62f7\u8d1d\u5230GPU\n    cudaMemcpy(d_a, h_a, bytes, cudaMemcpyHostToDevice);\n    cudaMemcpy(d_b, h_b, bytes, cudaMemcpyHostToDevice);\n\n    // \u542f\u52a8\u6838\u51fd\u6570\uff1a\u6bcf\u5757256\u7ebf\u7a0b\uff0c\u8db3\u591f\u7684\u5757\u8986\u76d6n\u4e2a\u5143\u7d20\n    int block_size = 256;\n    int grid_size = (n + block_size - 1) / block_size;  // \u4e0a\u53d6\u6574\u9664\u6cd5\n    vector_add&lt;&lt;&lt;grid_size, block_size&gt;&gt;&gt;(d_a, d_b, d_c, n);\n\n    // \u5c06\u7ed3\u679c\u4eceGPU\u62f7\u8d1d\u5230CPU\n    cudaMemcpy(h_c, d_a, bytes, cudaMemcpyDeviceToHost);\n\n    // \u9a8c\u8bc1\n    printf(\"c[0] = %f\uff08\u671f\u671b\u503c 3.0\uff09\\n\", h_c[0]);\n\n    // \u91ca\u653e\u5185\u5b58\n    cudaFree(d_a); cudaFree(d_b); cudaFree(d_c);\n    delete[] h_a; delete[] h_b; delete[] h_c;\n\n    return 0;\n}\n</code></pre> <pre><code># \u7528NVIDIA\u7f16\u8bd1\u5668\u7f16\u8bd1\nnvcc -O3 -o vector_add vector_add.cu\n./vector_add\n</code></pre> <ul> <li>CUDA\u4e2d\u7684\u5173\u952eC++\u6982\u5ff5\uff1a<ul> <li><code>__global__</code>\uff1aCUDA\u5173\u952e\u5b57\uff0c\u6807\u8bb0\u6838\u51fd\u6570\u3002\u4eceCPU\uff08\u4e3b\u673a\uff09\u8c03\u7528\uff0c\u5728GPU\uff08\u8bbe\u5907\uff09\u4e0a\u8fd0\u884c\u3002</li> <li><code>&lt;&lt;&lt;grid_size, block_size&gt;&gt;&gt;</code>\uff1a\u6838\u51fd\u6570\u542f\u52a8\u8bed\u6cd5\u3002\u6307\u5b9a\u4f7f\u7528\u591a\u5c11\u5757\u548c\u7ebf\u7a0b\u3002</li> <li><code>cudaMalloc</code> / <code>cudaFree</code>\uff1a\u5206\u914d/\u91ca\u653eGPU\u5185\u5b58\uff08\u7c7b\u4f3c\u4e8e<code>new</code>/<code>delete</code>\uff0c\u4f46\u9488\u5bf9GPU\uff09\u3002</li> <li><code>cudaMemcpy</code>\uff1a\u5728CPU\u548cGPU\u4e4b\u95f4\u62f7\u8d1d\u6570\u636e\u3002\u8fd9\u901a\u5e38\u662f\u6700\u5927\u7684\u74f6\u9888\uff08PCIe\u5e26\u5bbd\u7ea632 GB/s\uff0c\u800cGPU\u5185\u5b58\u5e26\u5bbd\u7ea63 TB/s\uff09\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/04.%20GPU%20architecture%20and%20CUDA/#simt","title":"\u7ebf\u7a0b\u675f\u4e0eSIMT","text":"<ul> <li> <p>GPU\u4ee532\u4e2a\u4e3a\u4e00\u7ec4\u79f0\u4e3a\u7ebf\u7a0b\u675f\u7684\u7ec4\u6267\u884c\u7ebf\u7a0b\u3002\u4e00\u4e2a\u7ebf\u7a0b\u675f\u4e2d\u7684\u6240\u670932\u4e2a\u7ebf\u7a0b\u540c\u65f6\u6267\u884c\u76f8\u540c\u6307\u4ee4\uff08\u5355\u6307\u4ee4\u591a\u7ebf\u7a0b\u2014\u2014SIMT\uff09\u3002\u8fd9\u662fGPU\u7684SIMD\u7b49\u6548\uff0c\u4f46\u5728\u7ebf\u7a0b\u7ea7\u522b\u3002</p> </li> <li> <p>\u7ebf\u7a0b\u675f\u5206\u6b67\u53d1\u751f\u5728\u540c\u4e00\u7ebf\u7a0b\u675f\u4e2d\u7684\u7ebf\u7a0b\u5728<code>if</code>\u8bed\u53e5\u4e2d\u8d70\u4e0d\u540c\u5206\u652f\u65f6\u3002GPU\u4e0d\u80fd\u5728\u4e00\u4e2a\u7ebf\u7a0b\u675f\u4e2d\u540c\u65f6\u6267\u884c\u4e24\u6761\u4e0d\u540c\u6307\u4ee4\uff0c\u56e0\u6b64\u5b83\u987a\u5e8f\u6267\u884c\u4e24\u4e2a\u5206\u652f\uff0c\u5c4f\u853d\u6389\u4e0d\u5e94\u53c2\u4e0e\u7684\u7ebf\u7a0b\u3002\u8fd9\u4f7f\u6027\u80fd\u51cf\u534a\uff08\u6216\u66f4\u5dee\uff09\u3002</p> </li> </ul> <pre><code>// \u7cdf\u7cd5\uff1a\u7ebf\u7a0b\u675f\u5206\u6b67\uff08\u540c\u4e00\u7ebf\u7a0b\u675f\u4e2d\u7684\u7ebf\u7a0b\u8d70\u4e0d\u540c\u8def\u5f84\uff09\nif (threadIdx.x % 2 == 0) {\n    c[idx] = a[idx] + b[idx];    // \u5076\u6570\u7ebf\u7a0b\u505a\u8fd9\u4e2a\n} else {\n    c[idx] = a[idx] - b[idx];    // \u5947\u6570\u7ebf\u7a0b\u505a\u8fd9\u4e2a\uff08\u540c\u4e00\u7ebf\u7a0b\u675f\uff0c\u4e32\u884c\u5316\uff09\n}\n\n// \u66f4\u597d\uff1a\u65e0\u5206\u652f\uff08\u65e0\u5206\u6b67\uff09\nfloat sign = (threadIdx.x % 2 == 0) ? 1.0f : -1.0f;\nc[idx] = a[idx] + sign * b[idx];  // \u6240\u6709\u7ebf\u7a0b\u6267\u884c\u76f8\u540c\u6307\u4ee4\n</code></pre>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/04.%20GPU%20architecture%20and%20CUDA/#_2","title":"\u5185\u5b58\u5408\u5e76","text":"<ul> <li>\u5408\u5e76\u8bbf\u95ee\uff1a\u5f53\u8fde\u7eed\u7684\u7ebf\u7a0b\u8bbf\u95ee\u8fde\u7eed\u7684\u5185\u5b58\u5730\u5740\u65f6\uff0cGPU\u5c06\u5b83\u4eec\u7ec4\u5408\u6210\u5355\u4e2a\u5185\u5b58\u4e8b\u52a1\u3002\u8fd9\u5bf9\u6027\u80fd\u81f3\u5173\u91cd\u8981\u3002</li> </ul> <pre><code>// \u597d\uff1a\u5408\u5e76\u2014\u2014\u7ebf\u7a0b0\u8bfba[0]\uff0c\u7ebf\u7a0b1\u8bfba[1]\uff0c...\nc[idx] = a[idx] + b[idx];\n\n// \u574f\uff1a\u8de8\u6b65\u2014\u2014\u7ebf\u7a0b0\u8bfba[0]\uff0c\u7ebf\u7a0b1\u8bfba[\u6b65\u957f]\uff0c...\nc[idx] = a[idx * stride] + b[idx * stride];  // \u6b65\u957f &gt; 1 \u6d6a\u8d39\u5e26\u5bbd\n</code></pre> <ul> <li>\u5bf9\u4e8e\u4e00\u4e2a32\u7ebf\u7a0b\u7684\u7ebf\u7a0b\u675f\uff0c\u5408\u5e76\u8bbf\u95ee\u5728\u5355\u6b21\u4e8b\u52a1\u4e2d\u52a0\u8f7d128\u5b57\u8282\uff0832 \u00d7 4\u5b57\u8282\u7528\u4e8efloat32\uff09\u3002\u8de8\u6b65\u8bbf\u95ee\u9700\u8981\u591a\u6b21\u4e8b\u52a1\uff0c\u6bcf\u6b21\u52a0\u8f7d128\u5b57\u8282\u4f46\u53ea\u4f7f\u7528\u4e00\u5c0f\u90e8\u5206\u3002\u6b65\u957f\u4e3a32\u662f\u6700\u574f\u60c5\u51b5\uff1a\u6bcf\u6b21\u4e8b\u52a1\u52a0\u8f7d128\u5b57\u8282\uff0c\u4f46\u53ea\u6709\u4e00\u4e2a\u7ebf\u7a0b\u4f7f\u75284\u5b57\u8282\uff083%\u7684\u5229\u7528\u7387\uff09\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/04.%20GPU%20architecture%20and%20CUDA/#_3","title":"\u5171\u4eab\u5185\u5b58\u4e0e\u5206\u5757","text":"<ul> <li>\u5206\u5757\u6a21\u5f0f\u662f\u6700\u91cd\u8981\u7684GPU\u4f18\u5316\u6280\u672f\u3002\u5176\u60f3\u6cd5\uff1a\u5c06\u6570\u636e\u5757\u4ece\u6162\u901f\u5168\u5c40\u5185\u5b58\u52a0\u8f7d\u5230\u5feb\u901f\u5171\u4eab\u5185\u5b58\uff0c\u8fdb\u884c\u8ba1\u7b97\uff0c\u7136\u540e\u5c06\u7ed3\u679c\u5199\u56de\u3002</li> </ul> <pre><code>// \u4f7f\u7528\u5171\u4eab\u5185\u5b58\u5206\u5757\u7684\u77e9\u9635\u4e58\u6cd5\uff08\u7b80\u5316\u7248\uff09\n__global__ void matmul_tiled(const float* A, const float* B, float* C,\n                              int M, int N, int K) {\n    // A\u7684\u4e00\u4e2a\u74e6\u7247\u548cB\u7684\u4e00\u4e2a\u74e6\u7247\u7684\u5171\u4eab\u5185\u5b58\n    __shared__ float tile_A[TILE_SIZE][TILE_SIZE];\n    __shared__ float tile_B[TILE_SIZE][TILE_SIZE];\n\n    int row = blockIdx.y * TILE_SIZE + threadIdx.y;\n    int col = blockIdx.x * TILE_SIZE + threadIdx.x;\n    float sum = 0.0f;\n\n    // \u904d\u5386\u74e6\u7247\n    for (int t = 0; t &lt; (K + TILE_SIZE - 1) / TILE_SIZE; t++) {\n        // \u5c06A\u548cB\u7684\u4e00\u4e2a\u74e6\u7247\u52a0\u8f7d\u5230\u5171\u4eab\u5185\u5b58\n        if (row &lt; M &amp;&amp; t * TILE_SIZE + threadIdx.x &lt; K)\n            tile_A[threadIdx.y][threadIdx.x] = A[row * K + t * TILE_SIZE + threadIdx.x];\n        else\n            tile_A[threadIdx.y][threadIdx.x] = 0.0f;\n\n        if (col &lt; N &amp;&amp; t * TILE_SIZE + threadIdx.y &lt; K)\n            tile_B[threadIdx.y][threadIdx.x] = B[(t * TILE_SIZE + threadIdx.y) * N + col];\n        else\n            tile_B[threadIdx.y][threadIdx.x] = 0.0f;\n\n        __syncthreads();  // \u7b49\u5f85\u6240\u6709\u7ebf\u7a0b\u5b8c\u6210\u52a0\u8f7d\n\n        // \u8ba1\u7b97\u6b64\u74e6\u7247\u7684\u90e8\u5206\u70b9\u79ef\n        for (int k = 0; k &lt; TILE_SIZE; k++) {\n            sum += tile_A[threadIdx.y][k] * tile_B[k][threadIdx.x];\n        }\n\n        __syncthreads();  // \u5728\u52a0\u8f7d\u4e0b\u4e00\u4e2a\u74e6\u7247\u524d\u7b49\u5f85\n    }\n\n    if (row &lt; M &amp;&amp; col &lt; N)\n        C[row * N + col] = sum;\n}\n</code></pre> <ul> <li><code>__shared__</code>\uff1a\u58f0\u660e\u5757\u5185\u6240\u6709\u7ebf\u7a0b\u5171\u4eab\u7684\u5185\u5b58\uff08\u5feb\u901f\u3001\u7247\u4e0a\uff09\u3002</li> <li><code>__syncthreads()</code>\uff1a\u4e00\u4e2a\u5c4f\u969c\uff0c\u7b49\u5f85\u5757\u4e2d\u6240\u6709\u7ebf\u7a0b\u5230\u8fbe\u6b64\u70b9\u3002\u5728\u5199\u5165\u5171\u4eab\u5185\u5b58\u548c\u8bfb\u53d6\u5b83\u4e4b\u95f4\u5fc5\u987b\u4f7f\u7528\uff08\u5426\u5219\u67d0\u4e9b\u7ebf\u7a0b\u8bfb\u53d6\u5230\u8fc7\u671f\u6570\u636e\uff09\u3002</li> <li>\u4e3a\u4ec0\u4e48\u5206\u5757\u6709\u6548\uff1a\u6ca1\u6709\u5b83\uff0c\u6bcf\u4e2a\u7ebf\u7a0b\u6bcf\u6b21\u4e58\u6cd5\u90fd\u4ece\u5168\u5c40\u5185\u5b58\u52a0\u8f7d\u3002\u6709\u4e86\u5206\u5757\uff0c\u4e00\u4e2aTILE_SIZE \u00d7 TILE_SIZE\u7684\u6570\u636e\u5757\u88ab\u52a0\u8f7d\u5230\u5171\u4eab\u5185\u5b58\u4e00\u6b21\uff0c\u5e76\u88ab\u5757\u4e2d\u6240\u6709\u7ebf\u7a0b\u91cd\u7528\u3002\u91cd\u7528\u56e0\u5b50\u4e3aTILE_SIZE\uff0c\u5c06\u5168\u5c40\u5185\u5b58\u6d41\u91cf\u51cf\u5c11\u8be5\u56e0\u5b50\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/04.%20GPU%20architecture%20and%20CUDA/#_4","title":"\u6d41\u4e0e\u5e76\u53d1","text":"<ul> <li>\u9ed8\u8ba4\u60c5\u51b5\u4e0b\uff0cCUDA\u64cd\u4f5c\u662f\u987a\u5e8f\u7684\uff1aCPU\u542f\u52a8\u4e00\u4e2a\u6838\u51fd\u6570\uff0c\u7b49\u5f85\u5b83\u5b8c\u6210\uff0c\u7136\u540e\u542f\u52a8\u4e0b\u4e00\u4e2a\u3002\u6d41\u5141\u8bb8\u91cd\u53e0\uff1a</li> </ul> <pre><code>cudaStream_t stream1, stream2;\ncudaStreamCreate(&amp;stream1);\ncudaStreamCreate(&amp;stream2);\n\n// \u8fd9\u4e9b\u64cd\u4f5c\u53ef\u4ee5\u91cd\u53e0\uff1a\u4e0d\u540c\u6d41\u5e76\u53d1\u6267\u884c\ncudaMemcpyAsync(d_a, h_a, bytes, cudaMemcpyHostToDevice, stream1);\ncudaMemcpyAsync(d_b, h_b, bytes, cudaMemcpyHostToDevice, stream2);\n\nkernel1&lt;&lt;&lt;grid, block, 0, stream1&gt;&gt;&gt;(d_a, d_c);\nkernel2&lt;&lt;&lt;grid, block, 0, stream2&gt;&gt;&gt;(d_b, d_d);\n</code></pre> <ul> <li>\u6d41\u5c06\u6570\u636e\u4f20\u8f93\u4e0e\u8ba1\u7b97\u91cd\u53e0\uff1a\u5f53\u6d411\u7684\u6838\u51fd\u6570\u8fd0\u884c\u65f6\uff0c\u6d412\u5728\u62f7\u8d1d\u6570\u636e\u3002\u8fd9\u9690\u85cf\u4e86PCIe\u4f20\u8f93\u5ef6\u8fdf\uff0c\u5e76\u4fdd\u6301GPU\u5fd9\u788c\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/04.%20GPU%20architecture%20and%20CUDA/#cuda_2","title":"\u5206\u6790CUDA\u4ee3\u7801","text":"<pre><code># NVIDIA Nsight Compute\uff1a\u6838\u51fd\u6570\u7ea7\u5206\u6790\nncu --set full ./my_program\n\n# NVIDIA Nsight Systems\uff1a\u7cfb\u7edf\u7ea7\u65f6\u95f4\u7ebf\nnsys profile ./my_program\n\n# \u5feb\u901f\u6307\u6807\nncu --metrics sm__throughput,dram__throughput ./my_program\n</code></pre> <ul> <li>\u9700\u8981\u5173\u6ce8\u4ec0\u4e48\uff1a<ul> <li>\u5360\u7528\u7387\uff1aSM\u5bb9\u91cf\u4e2d\u88ab\u4f7f\u7528\u7684\u6bd4\u4f8b\u3002\u4f4e\u5360\u7528\u7387\uff08&lt; 50%\uff09\u610f\u5473\u7740\u7ebf\u7a0b\u592a\u5c11\uff0c\u65e0\u6cd5\u9690\u85cf\u5185\u5b58\u5ef6\u8fdf\u3002\u539f\u56e0\uff1a\u6bcf\u7ebf\u7a0b\u5bc4\u5b58\u5668\u8fc7\u591a\u3001\u6bcf\u5757\u5171\u4eab\u5185\u5b58\u8fc7\u591a\u3002</li> <li>\u5185\u5b58\u541e\u5410\u91cf\uff1a\u4e0e\u5cf0\u503c\u5e26\u5bbd\u6bd4\u8f83\u3002\u5982\u679c\u4f60\u8fbe\u5230\u5cf0\u503c\u5e26\u5bbd\u768450%\u4ee5\u4e0b\uff0c\u5185\u5b58\u8bbf\u95ee\u6a21\u5f0f\u4f4e\u6548\uff08\u975e\u5408\u5e76\u3001\u5b58\u50a8\u4f53\u51b2\u7a81\uff09\u3002</li> <li>\u8ba1\u7b97\u541e\u5410\u91cf\uff1a\u4e0e\u5cf0\u503cFLOPS\u6bd4\u8f83\u3002\u5982\u679c\u5185\u5b58\u548c\u8ba1\u7b97\u541e\u5410\u91cf\u90fd\u4f4e\uff0c\u6838\u51fd\u6570\u662f\u5ef6\u8fdf\u53d7\u9650\u7684\uff08\u5e76\u884c\u5ea6\u4e0d\u591f\uff09\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/04.%20GPU%20architecture%20and%20CUDA/#_5","title":"\u9ad8\u7ea7\u4f18\u5316\u6280\u672f","text":"<ul> <li>\u9664\u4e86\u5408\u5e76\u548c\u5171\u4eab\u5185\u5b58\u5206\u5757\u7684\u57fa\u7840\u77e5\u8bc6\u5916\uff0c\u9ad8\u6027\u80fdGPU\uff08\u548cCPU\uff09\u4ee3\u7801\u8fd8\u4f7f\u7528\u51e0\u79cd\u9ad8\u7ea7\u6280\u672f\uff1a</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/04.%20GPU%20architecture%20and%20CUDA/#aos-vs-soa","title":"\u6570\u636e\u5e03\u5c40\uff1aAoS vs SoA","text":"<ul> <li>\u7ed3\u6784\u4f53\u6570\u7ec4\uff08AoS\uff09\uff1a\u6bcf\u4e2a\u5143\u7d20\u5c06\u6240\u6709\u5b57\u6bb5\u5b58\u50a8\u5728\u4e00\u8d77\u3002<code>[{x,y,z}, {x,y,z}, {x,y,z}]</code>\u3002</li> <li>\u6570\u7ec4\u7ed3\u6784\u4f53\uff08SoA\uff09\uff1a\u6bcf\u4e2a\u5b57\u6bb5\u5b58\u50a8\u5728\u81ea\u5df1\u7684\u8fde\u7eed\u6570\u7ec4\u4e2d\u3002<code>{[x,x,x], [y,y,y], [z,z,z]}</code>\u3002</li> </ul> <pre><code>// AoS\uff1a\u5bf9\u4e8eSIMD/GPU\u4e0d\u597d\uff08\u8bbf\u95ee\u6240\u6709x\u503c\u89e6\u53ca\u975e\u8fde\u7eed\u5185\u5b58\uff09\nstruct Particle { float x, y, z, mass; };\nParticle particles[N];\n// particles[0].x, particles[1].x \u76f8\u969416\u5b57\u8282\n\n// SoA\uff1a\u5bf9\u4e8eSIMD/GPU\u597d\uff08\u6240\u6709x\u503c\u8fde\u7eed\uff09\nstruct Particles {\n    float x[N], y[N], z[N], mass[N];\n};\n// x[0], x[1] \u76f8\u96944\u5b57\u8282\u2014\u2014\u975e\u5e38\u9002\u5408\u5408\u5e76\u8bbf\u95ee\u548cSIMD\n</code></pre> <ul> <li>SoA\u5bf9\u4e8e\u6570\u636e\u5e76\u884c\u5de5\u4f5c\u8d1f\u8f7d\uff08SIMD\u3001GPU\uff09\u51e0\u4e4e\u603b\u662f\u66f4\u5feb\u3002AoS\u5728\u4f60\u603b\u662f\u540c\u65f6\u8bbf\u95ee\u4e00\u4e2a\u5143\u7d20\u7684\u6240\u6709\u5b57\u6bb5\u65f6\u66f4\u597d\uff08\u5728\u6570\u503c\u4ee3\u7801\u4e2d\u5f88\u5c11\u89c1\uff09\u3002PyTorch\u5f20\u91cf\u672c\u8d28\u4e0a\u662fSoA\uff1a\u6bcf\u4e2a\u7279\u5f81\u662f\u4e00\u4e2a\u8fde\u7eed\u7ef4\u5ea6\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/04.%20GPU%20architecture%20and%20CUDA/#_6","title":"\u8f6f\u4ef6\u9884\u53d6","text":"<ul> <li>\u53ef\u4ee5\u544a\u8bc9CPU\u5728\u9700\u8981\u4e4b\u524d\u5f00\u59cb\u52a0\u8f7d\u6570\u636e\uff0c\u9690\u85cf\u5185\u5b58\u5ef6\u8fdf\uff1a</li> </ul> <pre><code>#include &lt;xmmintrin.h&gt;  // for _mm_prefetch\n\nfor (int i = 0; i &lt; n; i += 4) {\n    _mm_prefetch((char*)(a + i + 64), _MM_HINT_T0);  // \u9884\u53d6\u4e4b\u524d64\u4e2a\u5143\u7d20\n    // \u7528SIMD\u5904\u7406 a[i:i+4]\n    __m128 va = _mm_load_ps(a + i);\n    // ...\n}\n</code></pre> <ul> <li>\u9884\u53d6\u6307\u4ee4\u662f\u4e00\u4e2a\u63d0\u793a\uff1a\u5982\u679c\u6570\u636e\u5df2\u5728\u7f13\u5b58\u4e2d\uff0c\u5b83\u662f\u7a7a\u64cd\u4f5c\u3002\u5982\u679c\u4e0d\u662f\uff0cCPU\u5728\u6267\u884c\u5176\u4ed6\u6307\u4ee4\u7684\u540c\u65f6\u5f00\u59cb\u5728\u540e\u53f0\u83b7\u53d6\u6570\u636e\u3002\u9884\u53d6\u8ddd\u79bb\uff08\u6b64\u793a\u4f8b\u4e2d\u5411\u524d64\u4e2a\u5143\u7d20\uff09\u5e94\u6839\u636e\u5185\u5b58\u5ef6\u8fdf\u548c\u5faa\u73af\u8fed\u4ee3\u65f6\u95f4\u8fdb\u884c\u8c03\u6574\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/04.%20GPU%20architecture%20and%20CUDA/#_7","title":"\u6838\u51fd\u6570\u878d\u5408","text":"<ul> <li>\u6838\u51fd\u6570\u878d\u5408\u5c06\u591a\u4e2a\u64cd\u4f5c\u7ec4\u5408\u6210\u4e00\u4e2a\u6838\u51fd\u6570\uff0c\u4ee5\u907f\u514d\u5c06\u4e2d\u95f4\u7ed3\u679c\u5199\u5165\u5185\u5b58\u3002\u8fd9\u662fML\u4e2d\u6700\u6709\u5f71\u54cd\u529b\u7684\u5355\u4e2aGPU\u4f18\u5316\uff1a</li> </ul> <pre><code>// \u672a\u878d\u5408\uff1a3\u6b21\u6838\u51fd\u6570\u542f\u52a8\uff0c3\u6b21\u5168\u5c40\u5185\u5b58\u5f80\u8fd4\ny = matmul(x, W)     // \u5199y\u5230\u5168\u5c40\u5185\u5b58\nz = y + bias          // \u8bfby\uff0c\u5199z\nout = relu(z)         // \u8bfbz\uff0c\u5199out\n\n// \u878d\u5408\uff1a1\u6b21\u6838\u51fd\u6570\u542f\u52a8\uff0c1\u6b21\u5168\u5c40\u5185\u5b58\u5199\u5165\nout = fused_matmul_bias_relu(x, W, bias)  // y\u548cz\u6c38\u4e0d\u79bb\u5f00SRAM\n</code></pre> <ul> <li>\u5bf9\u4e8e\u5185\u5b58\u53d7\u9650\u64cd\u4f5c\uff08\u504f\u7f6e\u52a0\u6cd5\u3001ReLU\u3001\u5c42\u5f52\u4e00\u5316\uff09\uff0c\u5185\u5b58\u6d41\u91cf\u4e3b\u5bfc\u6267\u884c\u65f6\u95f4\u3002\u878d\u5408\u5b8c\u5168\u6d88\u9664\u4e86\u6d41\u91cf\u3002PyTorch\u7684<code>torch.compile</code>\u548cTriton\u53ef\u4ee5\u81ea\u52a8\u6216\u901a\u8fc7\u6700\u5c11\u52aa\u529b\u5b9e\u73b0\u878d\u5408\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/04.%20GPU%20architecture%20and%20CUDA/#_8","title":"\u6df7\u5408\u7cbe\u5ea6\u6838\u51fd\u6570","text":"<ul> <li>\u4f7f\u7528\u8f83\u4f4e\u7cbe\u5ea6\uff08FP16\u3001BF16\u3001INT8\uff09\u8fdb\u884c\u8ba1\u7b97\u548c\u8f83\u9ad8\u7cbe\u5ea6\uff08FP32\uff09\u8fdb\u884c\u7d2f\u52a0\uff0c\u8fbe\u5230\u4e24\u5168\u5176\u7f8e\uff1a</li> </ul> <pre><code>// \u5f20\u91cf\u6838\u5fc3\uff1a\u4e58FP16\u77e9\u9635\uff0c\u5728FP32\u4e2d\u7d2f\u52a0\n// \u6bcf\u6761\u5f20\u91cf\u6838\u5fc3\u6307\u4ee4\uff1aD\uff08FP32\uff09= A\uff08FP16\uff09\u00d7 B\uff08FP16\uff09+ C\uff08FP32\uff09\nnvcuda::wmma::mma_sync(c_frag, a_frag, b_frag, c_frag);\n</code></pre> <ul> <li>FP16\u6bd4FP32\u5c0f2\u500d\uff0c\u56e0\u6b64\u5b83\u4f7f\u5185\u5b58\u5e26\u5bbd\u52a0\u500d\uff08\u901a\u5e38\u7684\u74f6\u9888\uff09\uff0c\u5e76\u5728\u7f13\u5b58\u4e2d\u5bb9\u7eb32\u500d\u7684\u6570\u636e\u3002\u5f20\u91cf\u6838\u5fc3\u4ee5FP32 CUDA\u6838\u5fc38-16\u500d\u7684\u901f\u5ea6\u5904\u7406FP16\u3002\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48\u6df7\u5408\u7cbe\u5ea6\u8bad\u7ec3\uff08\u7b2c6\u7ae0\uff09\u63d0\u4f9b2-3\u500d\u52a0\u901f\u4e14\u7cbe\u5ea6\u635f\u5931\u6700\u5c0f\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/04.%20GPU%20architecture%20and%20CUDA/#_9","title":"\u5185\u5b58\u6c60\u5206\u914d\u5668","text":"<ul> <li> <p><code>cudaMalloc</code> \u5f88\u6162\uff08\u6bcf\u6b21\u8c03\u7528\u7ea61\u6beb\u79d2\uff09\uff0c\u56e0\u4e3a\u5b83\u4e0eGPU\u540c\u6b65\u3002\u5728\u6bcf\u6b21\u8fed\u4ee3\u5206\u914d\u4e34\u65f6\u7f13\u51b2\u533a\u7684\u8bad\u7ec3\u5faa\u73af\u4e2d\uff0c\u8fd9\u4f1a\u7d2f\u79ef\u8d77\u6765\u3002</p> </li> <li> <p>\u5185\u5b58\u6c60\uff08PyTorch\u7684\u7f13\u5b58\u5206\u914d\u5668\u3001CUDA\u5185\u5b58\u6c60\uff09\u9884\u5148\u5206\u914d\u4e00\u5927\u5757GPU\u5185\u5b58\uff0c\u5e76\u4ece\u5176\u4e2d\u5b50\u5206\u914d\u800c\u65e0\u9700\u7cfb\u7edf\u8c03\u7528\uff1a</p> </li> </ul> <pre><code># PyTorch\u81ea\u52a8\u6267\u884c\u6b64\u64cd\u4f5c\u2014\u2014\u4f46\u7406\u89e3\u539f\u56e0\u5f88\u91cd\u8981\n# \u6bcf\u4e2a torch.empty() \u4ece\u6c60\u4e2d\u91cd\u7528\u5185\u5b58\uff0c\u65e0\u9700cudaMalloc\ntemp = torch.empty(1024, 1024, device='cuda')  # \u5fae\u79d2\uff0c\u800c\u975e\u6beb\u79d2\n</code></pre> <ul> <li>\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48PyTorch\u7684 <code>torch.cuda.memory_allocated()</code> \u548c <code>torch.cuda.max_memory_allocated()</code> \u4e0d\u540c\uff1aallocated\u662f\u5f53\u524d\u4f7f\u7528\u7684\uff0cmax\u662f\u5cf0\u503c\uff08\u6c60\u53ef\u80fd\u6301\u6709\u6bd4\u5f53\u524d\u4f7f\u7528\u66f4\u591a\u7684\u5185\u5b58\uff09\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/04.%20GPU%20architecture%20and%20CUDA/#_10","title":"\u5206\u6790\u6307\u5bfc\u7684\u4f18\u5316","text":"<ul> <li> <p>\u4e0d\u8981\u76f2\u76ee\u4f18\u5316\u3002\u5148\u5206\u6790\uff0c\u8bc6\u522b\u74f6\u9888\uff0c\u4f18\u5316\u90a3\u4e2a\uff0c\u7136\u540e\u91cd\u65b0\u5206\u6790\u3002\u5c4b\u9876\u7ebf\u6a21\u578b\uff08\u6587\u4ef601\uff09\u544a\u8bc9\u4f60\u74f6\u9888\u662f\u5185\u5b58\u8fd8\u662f\u8ba1\u7b97\uff1a</p> <ul> <li>\u5185\u5b58\u53d7\u9650\uff08\u4f4e\u7b97\u672f\u5f3a\u5ea6\uff09\uff1a\u4f18\u5316\u6570\u636e\u5e03\u5c40\uff08SoA\uff09\u3001\u878d\u5408\u6838\u51fd\u6570\u3001\u4f7f\u7528\u8f83\u4f4e\u7cbe\u5ea6\u3001\u9884\u53d6\u3002</li> <li>\u8ba1\u7b97\u53d7\u9650\uff08\u9ad8\u7b97\u672f\u5f3a\u5ea6\uff09\uff1a\u4f7f\u7528\u5f20\u91cf\u6838\u5fc3\u3001\u589e\u52a0\u5e76\u884c\u5ea6\u3001\u4f7f\u7528\u66f4\u5feb\u6307\u4ee4\uff08FMA\uff09\u3002</li> <li>\u5ef6\u8fdf\u53d7\u9650\uff08\u5e76\u884c\u5ea6\u4e0d\u8db3\uff09\uff1a\u589e\u52a0\u5360\u7528\u7387\u3001\u51cf\u5c11\u5bc4\u5b58\u5668\u4f7f\u7528\u3001\u542f\u52a8\u66f4\u591a\u7ebf\u7a0b\u3002</li> </ul> </li> <li> <p>\u5927\u591a\u6570ML\u5de5\u4f5c\u8d1f\u8f7d\u662f\u5185\u5b58\u53d7\u9650\u7684\u3002\u4ee4\u4eba\u60ca\u8bb6\u7684\u63a8\u8bba\uff1a\u66f4\u5feb\u7684GPU\uff08\u66f4\u591aFLOPS\uff09\u901a\u5e38\u6ca1\u6709\u5e2e\u52a9\u3002\u66f4\u5feb\u7684\u5185\u5b58\uff08HBM3 vs HBM2e\uff09\u66f4\u6709\u5e2e\u52a9\u3002\u8fd9\u5c31\u662f\u4e3a\u4ec0\u4e48A100\u2192H100\u5347\u7ea7\u4e0d\u53ea\u662f\u5173\u4e8eFLOPS\u2014\u2014H100\u4e5f\u67092\u500d\u7684\u5185\u5b58\u5e26\u5bbd\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/04.%20GPU%20architecture%20and%20CUDA/#nvidia-gpu","title":"NVIDIA GPU\u4ee3\u6b21","text":"\u4ee3\u6b21 \u5e74\u4efd \u5173\u952e\u521b\u65b0 AI\u76f8\u5173\u6027 Pascal\uff08P100\uff09 2016 HBM2\u3001NVLink \u7b2c\u4e00\u4ee3\u4e25\u8083\u7684\u6df1\u5ea6\u5b66\u4e60GPU Volta\uff08V100\uff09 2017 \u5f20\u91cf\u6838\u5fc3\uff08\u6df7\u5408\u7cbe\u5ea6\u77e9\u9635\u4e58\u6cd5\uff09 \u5b9e\u73b0FP16\u8bad\u7ec3\uff0c125 TFLOPS TF32 Ampere\uff08A100\uff09 2020 TF32\u3001\u7a00\u758f\u6027\u3001\u7b2c\u4e09\u4ee3\u5f20\u91cf\u6838\u5fc3 312 TFLOPS TF32\uff0c\u7ed3\u6784\u6027\u7a00\u758f2:4 Hopper\uff08H100\uff09 2022 Transformer\u5f15\u64ce\uff08FP8\uff09\u3001HBM3 989 TFLOPS FP8\uff0c\u52a8\u6001\u7cbe\u5ea6\u5207\u6362 Blackwell\uff08B200\uff09 2024 \u7b2c\u4e8c\u4ee3Transformer\u5f15\u64ce\u3001NVLink 5 2.5 PFLOPS FP4\uff0c\u591a\u82af\u7247\u8bbe\u8ba1 <ul> <li> <p>\u5f20\u91cf\u6838\u5fc3\u662f\u4e13\u7528\u7684\u77e9\u9635\u4e58\u6cd5\u5355\u5143\u3002\u5355\u4e2a\u5f20\u91cf\u6838\u5fc3\u6307\u4ee4\u5728\u4e00\u4e2a\u5468\u671f\u5185\u8ba1\u7b974\u00d74\u77e9\u9635\u4e58\u6cd5\uff08D = A\u00d7B + C\uff09\u3002\u5e38\u89c4CUDA\u6838\u5fc3\u9700\u898164\u6b21FMA\u64cd\u4f5c\u3002\u5f20\u91cf\u6838\u5fc3\u5c31\u662f\u4e3a\u4ec0\u4e48\u6df7\u5408\u7cbe\u5ea6\u8bad\u7ec3\uff08float16\u8ba1\u7b97\uff0cfloat32\u7d2f\u52a0\uff09\u5982\u6b64\u5feb\u901f\u3002</p> </li> <li> <p>Transformer\u5f15\u64ce\uff08Hopper+\uff09\u5728\u5355\u5c42\u5185\u52a8\u6001\u5207\u6362FP8\u548cFP16\u7cbe\u5ea6\uff0c\u53ea\u5728\u9700\u8981\u65f6\u9009\u62e9\u66f4\u9ad8\u7cbe\u5ea6\u3002\u8fd9\u6700\u5927\u5316\u541e\u5410\u91cf\u800c\u4e0d\u727a\u7272\u6a21\u578b\u8d28\u91cf\u3002\u5b83\u4e13\u4e3aTransformer\u67b6\u6784\uff08\u6ce8\u610f\u529b+MLP\uff09\u8bbe\u8ba1\uff0c\u540e\u8005\u4e3b\u5bfc\u73b0\u4ee3AI\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/04.%20GPU%20architecture%20and%20CUDA/#nvcc","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u7528nvcc\u7f16\u8bd1\uff09","text":"<ol> <li> <p>\u7f16\u5199\u4e00\u4e2a\u5bf9\u6570\u7ec4\u5e94\u7528ReLU\u7684CUDA\u6838\u51fd\u6570\u3002\u6d4b\u91cf\u5305\u62ec\u5185\u5b58\u4f20\u8f93\u5728\u5185\u7684\u65f6\u95f4\u3002\u8fd9\u6559\u6388\u6838\u51fd\u6570\u7f16\u5199\u3001cudaMalloc/cudaMemcpy\u4ee5\u53ca\u4e3b\u673a\u2194\u8bbe\u5907\u4f20\u8f93\u74f6\u9888\u3002 <pre><code>// task1_relu.cu\n// \u7f16\u8bd1\uff1anvcc -O3 -o task1_relu task1_relu.cu\n\n#include &lt;stdio.h&gt;\n#include &lt;stdlib.h&gt;\n#include &lt;cuda_runtime.h&gt;\n\n__global__ void relu_kernel(const float* input, float* output, int n) {\n    int idx = blockIdx.x * blockDim.x + threadIdx.x;\n    if (idx &lt; n) {\n        output[idx] = input[idx] &gt; 0.0f ? input[idx] : 0.0f;\n    }\n}\n\nint main() {\n    const int N = 1 &lt;&lt; 24;  // \u7ea61600\u4e07\u5143\u7d20\n    size_t bytes = N * sizeof(float);\n\n    // \u5206\u914d\u4e3b\u673a\u5185\u5b58\n    float* h_input  = (float*)malloc(bytes);\n    float* h_output = (float*)malloc(bytes);\n    for (int i = 0; i &lt; N; i++) {\n        h_input[i] = (float)(i % 100) - 50.0f;  // \u6b63\u8d1f\u6df7\u5408\n    }\n\n    // \u5206\u914d\u8bbe\u5907\u5185\u5b58\n    float *d_input, *d_output;\n    cudaMalloc(&amp;d_input, bytes);\n    cudaMalloc(&amp;d_output, bytes);\n\n    // \u8ba1\u65f6\u5b8c\u6574\u6d41\u6c34\u7ebf\uff1a\u62f7\u8d1d\u5230GPU\u3001\u8ba1\u7b97\u3001\u62f7\u8d1d\u56de\n    cudaEvent_t start, stop;\n    cudaEventCreate(&amp;start);\n    cudaEventCreate(&amp;stop);\n\n    cudaEventRecord(start);\n    cudaMemcpy(d_input, h_input, bytes, cudaMemcpyHostToDevice);\n\n    int block_size = 256;\n    int grid_size = (N + block_size - 1) / block_size;\n    relu_kernel&lt;&lt;&lt;grid_size, block_size&gt;&gt;&gt;(d_input, d_output, N);\n\n    cudaMemcpy(h_output, d_output, bytes, cudaMemcpyDeviceToHost);\n    cudaEventRecord(stop);\n    cudaEventSynchronize(stop);\n\n    float ms = 0;\n    cudaEventElapsedTime(&amp;ms, start, stop);\n\n    // \u9a8c\u8bc1\n    int errors = 0;\n    for (int i = 0; i &lt; N; i++) {\n        float expected = h_input[i] &gt; 0.0f ? h_input[i] : 0.0f;\n        if (h_output[i] != expected) errors++;\n    }\n\n    printf(\"\u65f6\u95f4\uff08\u542b\u4f20\u8f93\uff09: %.2f ms\\n\", ms);\n    printf(\"\u5e26\u5bbd: %.1f GB/s\\n\", 2.0 * bytes / ms / 1e6);  // \u8bfb\u53d6+\u5199\u5165\n    printf(\"\u9519\u8bef: %d / %d\\n\", errors, N);\n\n    cudaFree(d_input); cudaFree(d_output);\n    free(h_input); free(h_output);\n    return 0;\n}\n</code></pre></p> </li> <li> <p>\u5728CUDA\u4e2d\u4f7f\u7528\u5171\u4eab\u5185\u5b58\u7f16\u5199\u5206\u5757\u77e9\u9635\u4e58\u6cd5\u3002\u5c06\u6027\u80fd\u4e0e\u6734\u7d20\uff08\u975e\u5206\u5757\uff09\u7248\u672c\u8fdb\u884c\u6bd4\u8f83\u3002\u8fd9\u6559\u6388\u5171\u4eab\u5185\u5b58\u3001<code>__syncthreads</code>\u4ee5\u53ca\u4e3a\u4ec0\u4e48\u5206\u5757\u91cd\u8981\u3002 <pre><code>// task2_matmul.cu\n// \u7f16\u8bd1\uff1anvcc -O3 -o task2_matmul task2_matmul.cu\n\n#include &lt;stdio.h&gt;\n#include &lt;cuda_runtime.h&gt;\n\n#define TILE 16\n\n// \u6734\u7d20\u77e9\u9635\u4e58\u6cd5\uff1a\u6bcf\u4e2a\u7ebf\u7a0b\u8ba1\u7b97C\u7684\u4e00\u4e2a\u5143\u7d20\n__global__ void matmul_naive(const float* A, const float* B, float* C, int N) {\n    int row = blockIdx.y * blockDim.y + threadIdx.y;\n    int col = blockIdx.x * blockDim.x + threadIdx.x;\n    if (row &lt; N &amp;&amp; col &lt; N) {\n        float sum = 0.0f;\n        for (int k = 0; k &lt; N; k++) {\n            sum += A[row * N + k] * B[k * N + col];\n        }\n        C[row * N + col] = sum;\n    }\n}\n\n// \u5206\u5757\u77e9\u9635\u4e58\u6cd5\uff1a\u4f7f\u7528\u5171\u4eab\u5185\u5b58\u51cf\u5c11\u5168\u5c40\u5185\u5b58\u8bbf\u95ee\n__global__ void matmul_tiled(const float* A, const float* B, float* C, int N) {\n    __shared__ float sA[TILE][TILE];\n    __shared__ float sB[TILE][TILE];\n\n    int row = blockIdx.y * TILE + threadIdx.y;\n    int col = blockIdx.x * TILE + threadIdx.x;\n    float sum = 0.0f;\n\n    for (int t = 0; t &lt; (N + TILE - 1) / TILE; t++) {\n        sA[threadIdx.y][threadIdx.x] = (row &lt; N &amp;&amp; t*TILE+threadIdx.x &lt; N)\n            ? A[row * N + t*TILE + threadIdx.x] : 0.0f;\n        sB[threadIdx.y][threadIdx.x] = (t*TILE+threadIdx.y &lt; N &amp;&amp; col &lt; N)\n            ? B[(t*TILE + threadIdx.y) * N + col] : 0.0f;\n\n        __syncthreads();\n        for (int k = 0; k &lt; TILE; k++)\n            sum += sA[threadIdx.y][k] * sB[k][threadIdx.x];\n        __syncthreads();\n    }\n\n    if (row &lt; N &amp;&amp; col &lt; N)\n        C[row * N + col] = sum;\n}\n\nint main() {\n    const int N = 1024;\n    size_t bytes = N * N * sizeof(float);\n\n    float *d_A, *d_B, *d_C;\n    cudaMalloc(&amp;d_A, bytes); cudaMalloc(&amp;d_B, bytes); cudaMalloc(&amp;d_C, bytes);\n\n    // \u521d\u59cb\u5316\u4e3a1\uff08\u5bb9\u6613\u9a8c\u8bc1\uff1aC\u5e94\u5168\u4e3aN\uff09\n    float* h_A = new float[N*N];\n    for (int i = 0; i &lt; N*N; i++) h_A[i] = 1.0f;\n    cudaMemcpy(d_A, h_A, bytes, cudaMemcpyHostToDevice);\n    cudaMemcpy(d_B, h_A, bytes, cudaMemcpyHostToDevice);\n\n    dim3 block(TILE, TILE);\n    dim3 grid((N+TILE-1)/TILE, (N+TILE-1)/TILE);\n\n    // \u57fa\u51c6\u6d4b\u8bd5\u6734\u7d20\u7248\n    cudaEvent_t start, stop;\n    cudaEventCreate(&amp;start); cudaEventCreate(&amp;stop);\n\n    cudaEventRecord(start);\n    for (int i = 0; i &lt; 10; i++)\n        matmul_naive&lt;&lt;&lt;grid, block&gt;&gt;&gt;(d_A, d_B, d_C, N);\n    cudaEventRecord(stop);\n    cudaEventSynchronize(stop);\n    float naive_ms; cudaEventElapsedTime(&amp;naive_ms, start, stop);\n\n    // \u57fa\u51c6\u6d4b\u8bd5\u5206\u5757\u7248\n    cudaEventRecord(start);\n    for (int i = 0; i &lt; 10; i++)\n        matmul_tiled&lt;&lt;&lt;grid, block&gt;&gt;&gt;(d_A, d_B, d_C, N);\n    cudaEventRecord(stop);\n    cudaEventSynchronize(stop);\n    float tiled_ms; cudaEventElapsedTime(&amp;tiled_ms, start, stop);\n\n    double gflops_naive = 2.0 * N * N * N * 10 / naive_ms / 1e6;\n    double gflops_tiled = 2.0 * N * N * N * 10 / tiled_ms / 1e6;\n\n    printf(\"\u6734\u7d20\u7248:  %.2f ms, %.1f GFLOPS\\n\", naive_ms/10, gflops_naive);\n    printf(\"\u5206\u5757\u7248:  %.2f ms, %.1f GFLOPS\\n\", tiled_ms/10, gflops_tiled);\n    printf(\"\u52a0\u901f\u6bd4: %.1fx\\n\", naive_ms / tiled_ms);\n\n    cudaFree(d_A); cudaFree(d_B); cudaFree(d_C);\n    delete[] h_A;\n    return 0;\n}\n</code></pre></p> </li> <li> <p>\u6f14\u793a\u7ebf\u7a0b\u675f\u5206\u6b67\u3002\u7f16\u5199\u4e00\u4e2a\u6838\u51fd\u6570\uff0c\u5176\u4e2d\u540c\u4e00\u7ebf\u7a0b\u675f\u4e2d\u7684\u7ebf\u7a0b\u8d70\u4e0d\u540c\u5206\u652f\uff0c\u5e76\u4e0e\u65e0\u5206\u652f\u7248\u672c\u6bd4\u8f83\u3002 <pre><code>// task3_divergence.cu\n// \u7f16\u8bd1\uff1anvcc -O3 -o task3_diverge task3_divergence.cu\n\n#include &lt;stdio.h&gt;\n#include &lt;cuda_runtime.h&gt;\n\n// \u7cdf\u7cd5\uff1a\u7ebf\u7a0b\u675f\u5206\u6b67\u2014\u2014\u5076\u6570/\u5947\u6570\u7ebf\u7a0b\u8d70\u4e0d\u540c\u8def\u5f84\n__global__ void divergent_kernel(float* data, int n) {\n    int idx = blockIdx.x * blockDim.x + threadIdx.x;\n    if (idx &lt; n) {\n        if (idx % 2 == 0) {\n            data[idx] = data[idx] * 2.0f + 1.0f;\n        } else {\n            data[idx] = data[idx] * 0.5f - 1.0f;\n        }\n    }\n}\n\n// \u597d\uff1a\u65e0\u5206\u652f\u2014\u2014\u6240\u6709\u7ebf\u7a0b\u6267\u884c\u76f8\u540c\u6307\u4ee4\n__global__ void branchless_kernel(float* data, int n) {\n    int idx = blockIdx.x * blockDim.x + threadIdx.x;\n    if (idx &lt; n) {\n        float scale = (idx % 2 == 0) ? 2.0f : 0.5f;\n        float offset = (idx % 2 == 0) ? 1.0f : -1.0f;\n        data[idx] = data[idx] * scale + offset;\n    }\n}\n\nint main() {\n    const int N = 1 &lt;&lt; 24;\n    float* d_data;\n    cudaMalloc(&amp;d_data, N * sizeof(float));\n    cudaMemset(d_data, 0, N * sizeof(float));\n\n    int block = 256, grid = (N + block - 1) / block;\n\n    cudaEvent_t start, stop;\n    cudaEventCreate(&amp;start); cudaEventCreate(&amp;stop);\n\n    // \u5206\u6b67\u7248\n    cudaEventRecord(start);\n    for (int i = 0; i &lt; 100; i++)\n        divergent_kernel&lt;&lt;&lt;grid, block&gt;&gt;&gt;(d_data, N);\n    cudaEventRecord(stop);\n    cudaEventSynchronize(stop);\n    float div_ms; cudaEventElapsedTime(&amp;div_ms, start, stop);\n\n    // \u65e0\u5206\u652f\u7248\n    cudaEventRecord(start);\n    for (int i = 0; i &lt; 100; i++)\n        branchless_kernel&lt;&lt;&lt;grid, block&gt;&gt;&gt;(d_data, N);\n    cudaEventRecord(stop);\n    cudaEventSynchronize(stop);\n    float nodiv_ms; cudaEventElapsedTime(&amp;nodiv_ms, start, stop);\n\n    printf(\"\u5206\u6b67\u7248:  %.2f ms\\n\", div_ms / 100);\n    printf(\"\u65e0\u5206\u652f\u7248: %.2f ms\\n\", nodiv_ms / 100);\n    printf(\"\u52a0\u901f\u6bd4:    %.2fx\\n\", div_ms / nodiv_ms);\n\n    cudaFree(d_data);\n    return 0;\n}\n</code></pre></p> </li> </ol>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/05.%20triton%2C%20TPUs%20and%20pallax/","title":"Triton\u4e0eTPU","text":"<p>CUDA C\u529f\u80fd\u5f3a\u5927\u4f46\u5197\u957f\u3002Triton\u8ba9\u4f60\u7528Python\u7f16\u5199GPU\u6838\u51fd\u6570\u3002TPU\u63d0\u4f9b\u4e86GPU\u4e4b\u5916\u7684\u9009\u62e9\uff0c\u5177\u6709\u4e0d\u540c\u7684\u6743\u8861\u3002\u672c\u6587\u6db5\u76d6Triton\u6838\u51fd\u6570\u7f16\u7a0b\u3001\u4ee5Flash Attention\u4e3a\u6848\u4f8b\u7814\u7a76\u3001TPU\u67b6\u6784\u4e0eJAX/Pallas\uff0c\u4ee5\u53ca\u5982\u4f55\u9009\u62e9\u5408\u9002\u7684\u5de5\u5177\u3002\u5173\u4e8eVulkan\u548c\u8de8\u5e73\u53f0GPU\u8ba1\u7b97\uff0c\u8bf7\u53c2\u89c1\u6587\u4ef607\u3002</p> <ul> <li>\u4e0a\u7bc7\u6587\u4ef6\u6559\u6388\u4e86CUDA C\u4e2d\u7684GPU\u7f16\u7a0b\u3002\u672c\u6587\u66f4\u4e0a\u4e00\u5c42\u62bd\u8c61\u9636\u68af\uff1aTriton\u4ee520%\u7684\u5de5\u4f5c\u91cf\u63d0\u4f9bCUDA 80%\u7684\u6027\u80fd\uff0c\u4e14\u7528Python\u3002TPU\u548cVulkan\u4e3a\u7279\u5b9a\u7528\u4f8b\u63d0\u4f9b\u66ff\u4ee3\u786c\u4ef6\u76ee\u6807\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/05.%20triton%2C%20TPUs%20and%20pallax/#tritonpythongpu","title":"Triton\uff1a\u7528Python\u7f16\u5199GPU\u6838\u51fd\u6570","text":"<ul> <li> <p>Triton\uff08OpenAI\uff09\u662f\u4e00\u79cd\u57fa\u4e8ePython\u7684GPU\u6838\u51fd\u6570\u7f16\u5199\u8bed\u8a00\u3002\u4f60\u4e0d\u9700\u8981\u601d\u8003\u5355\u4e2a\u7ebf\u7a0b\uff08CUDA\uff09\uff0c\u800c\u662f\u601d\u8003\u5757\u7ea7\u6570\u636e\u3002Triton\u7684\u7f16\u8bd1\u5668\u81ea\u52a8\u5904\u7406\u7ebf\u7a0b\u6620\u5c04\u3001\u5185\u5b58\u5408\u5e76\u3001\u5171\u4eab\u5185\u5b58\u7ba1\u7406\u548c\u8bb8\u591a\u4f18\u5316\u3002</p> </li> <li> <p>\u4e3a\u4ec0\u4e48Triton\u91cd\u8981\uff1aCUDA C\u9700\u8981\u5bf9\u7ebf\u7a0b\u675f\u8c03\u5ea6\u3001\u5171\u4eab\u5185\u5b58\u5b58\u50a8\u4f53\u51b2\u7a81\u3001\u5bc4\u5b58\u5668\u538b\u529b\u548c\u5408\u5e76\u6a21\u5f0f\u6709\u6df1\u5165\u7406\u89e3\u3002Triton\u62bd\u8c61\u4e86\u5176\u4e2d\u5927\u90e8\u5206\u5185\u5bb9\uff0c\u4f7fGPU\u6838\u51fd\u6570\u5f00\u53d1\u5bf9\u4e86\u89e3Python\u4f46\u4e0d\u4e86\u89e3\u7cfb\u7edf\u7f16\u7a0b\u7684ML\u7814\u7a76\u4eba\u5458\u53ef\u53ca\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/05.%20triton%2C%20TPUs%20and%20pallax/#triton","title":"\u4f60\u7684\u7b2c\u4e00\u4e2aTriton\u6838\u51fd\u6570","text":"<pre><code>import triton\nimport triton.language as tl\nimport torch\n\n@triton.jit\ndef add_kernel(\n    x_ptr, y_ptr, output_ptr,\n    n_elements,\n    BLOCK_SIZE: tl.constexpr,  # \u7f16\u8bd1\u65f6\u5e38\u91cf\n):\n    # \u6bcf\u4e2a\u7a0b\u5e8f\u5b9e\u4f8b\u5904\u7406\u4e00\u4e2aBLOCK_SIZE\u5143\u7d20\u7684\u5757\n    pid = tl.program_id(axis=0)  # \u6211\u662f\u54ea\u4e2a\u5757\uff1f\n    block_start = pid * BLOCK_SIZE\n\n    # \u6b64\u5757\u7684\u504f\u79fb\u91cf\n    offsets = block_start + tl.arange(0, BLOCK_SIZE)\n\n    # \u63a9\u7801\u5904\u7406n_elements\u4e0d\u662fBLOCK_SIZE\u500d\u6570\u7684\u60c5\u51b5\n    mask = offsets &lt; n_elements\n\n    # \u52a0\u8f7d\u6570\u636e\uff08\u5e26\u63a9\u7801\uff1a\u8d8a\u754c\u8bfb\u53d6\u8fd4\u56de0\uff09\n    x = tl.load(x_ptr + offsets, mask=mask)\n    y = tl.load(y_ptr + offsets, mask=mask)\n\n    # \u8ba1\u7b97\n    output = x + y\n\n    # \u5b58\u50a8\u7ed3\u679c\n    tl.store(output_ptr + offsets, output, mask=mask)\n\n\ndef add(x: torch.Tensor, y: torch.Tensor) -&gt; torch.Tensor:\n    output = torch.empty_like(x)\n    n_elements = output.numel()\n\n    # \u542f\u52a8\uff1a\u6bcf\u4e2a\u5757\u4e00\u4e2a\u7a0b\u5e8f\n    grid = lambda meta: (triton.cdiv(n_elements, meta['BLOCK_SIZE']),)\n    add_kernel[grid](x, y, output, n_elements, BLOCK_SIZE=1024)\n\n    return output\n\n\n# \u4f7f\u7528\nx = torch.randn(1000000, device='cuda')\ny = torch.randn(1000000, device='cuda')\nz = add(x, y)\n</code></pre> <ul> <li>\u4e0eCUDA\u7684\u5173\u952e\u533a\u522b\uff1a<ul> <li>\u65e0\u9700\u663e\u5f0f\u7ebf\u7a0b\u7ba1\u7406\u3002\u4f60\u601d\u8003\u5757\uff08\u7a0b\u5e8f\uff09\uff0c\u800c\u975e\u7ebf\u7a0b\u3002</li> <li><code>tl.arange(0, BLOCK_SIZE)</code> \u4e3a\u6574\u4e2a\u5757\u521b\u5efa\u4e00\u4e2a\u504f\u79fb\u5411\u91cf\u3002\u6b64\u5411\u91cf\u4e0a\u7684\u6240\u6709\u64cd\u4f5c\u90fd\u9690\u5f0f\u5411\u91cf\u5316\u3002</li> <li><code>mask</code> \u5904\u7406\u8fb9\u754c\u6761\u4ef6\uff08\u7c7b\u4f3c\u4e8eAVX-512\u63a9\u7801\u5bc4\u5b58\u5668\uff0c\u6587\u4ef603\uff09\u3002\u65e0\u9700\u6807\u91cf\u6e05\u7406\u5faa\u73af\u3002</li> <li><code>tl.load</code> \u548c <code>tl.store</code> \u81ea\u52a8\u5904\u7406\u5408\u5e76\u8bbf\u95ee\u3002</li> <li><code>@triton.jit</code> \u5728\u9996\u6b21\u8c03\u7528\u65f6\u5c06\u51fd\u6570\u7f16\u8bd1\u4e3aPTX\uff08GPU\u6c47\u7f16\uff09\uff0c\u7136\u540e\u7f13\u5b58\u7f16\u8bd1\u540e\u7684\u6838\u51fd\u6570\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/05.%20triton%2C%20TPUs%20and%20pallax/#triton-softmax","title":"Triton Softmax\u6838\u51fd\u6570","text":"<ul> <li>Softmax\u662f\u4e00\u4e2a\u5f88\u597d\u7684Triton\u793a\u4f8b\uff0c\u56e0\u4e3a\u5b83\u9700\u8981\u5bf9\u6570\u636e\u8fdb\u884c\u591a\u6b21\u904d\u5386\uff08\u6700\u5927\u503c\u3001\u51cf\u53bb\u3001\u6307\u6570\u3001\u6c42\u548c\u3001\u9664\u6cd5\uff09\uff0c\u5e76\u4e14\u53d7\u76ca\u4e8e\u5728\u591a\u6b21\u904d\u5386\u4e4b\u95f4\u5c06\u6570\u636e\u4fdd\u7559\u5728SRAM\uff08\u5171\u4eab\u5185\u5b58\uff09\u4e2d\uff1a</li> </ul> <pre><code>@triton.jit\ndef softmax_kernel(\n    output_ptr, input_ptr, input_row_stride, output_row_stride, n_cols,\n    BLOCK_SIZE: tl.constexpr,\n):\n    # \u6bcf\u4e2a\u7a0b\u5e8f\u5904\u7406\u4e00\u884c\n    row_idx = tl.program_id(0)\n    row_start = input_ptr + row_idx * input_row_stride\n\n    # \u52a0\u8f7d\u8be5\u884c\n    col_offsets = tl.arange(0, BLOCK_SIZE)\n    mask = col_offsets &lt; n_cols\n    row = tl.load(row_start + col_offsets, mask=mask, other=-float('inf'))\n\n    # Softmax\uff1a\u4e3a\u6570\u503c\u7a33\u5b9a\u6027\u53d6\u6700\u5927\u503c\uff0c\u7136\u540eexp\uff0c\u7136\u540e\u5f52\u4e00\u5316\n    row_max = tl.max(row, axis=0)\n    numerator = tl.exp(row - row_max)\n    denominator = tl.sum(numerator, axis=0)\n    softmax_output = numerator / denominator\n\n    # \u5b58\u50a8\u7ed3\u679c\n    output_start = output_ptr + row_idx * output_row_stride\n    tl.store(output_start + col_offsets, softmax_output, mask=mask)\n</code></pre> <ul> <li>\u5728PyTorch\u4e2d\uff0c<code>F.softmax(x, dim=-1)</code> \u542f\u52a83\u4e2a\u72ec\u7acb\u6838\u51fd\u6570\uff08\u6700\u5927\u503c\u3001\u6307\u6570-\u6c42\u548c\u3001\u9664\u6cd5\uff09\uff0c\u6bcf\u4e2a\u90fd\u4ece\u5168\u5c40\u5185\u5b58\u8bfb\u53d6\u548c\u5199\u5165\u3002Triton\u7248\u672c\u5728\u4e00\u4e2a\u6838\u51fd\u6570\u5185\u5b8c\u6210\u6240\u6709\u64cd\u4f5c\uff0c\u5c06\u6570\u636e\u4fdd\u7559\u5728\u5bc4\u5b58\u5668/SRAM\u4e2d\u3002\u8fd9\u79cd\u6838\u51fd\u6570\u878d\u5408\u5c31\u662f\u81ea\u5b9a\u4e49Triton\u6838\u51fd\u6570\u53ef\u4ee5\u6bd4PyTorch\u5185\u7f6e\u64cd\u4f5c\u5feb2-4\u500d\u7684\u539f\u56e0\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/05.%20triton%2C%20TPUs%20and%20pallax/#triton_1","title":"Triton\u81ea\u52a8\u8c03\u4f18","text":"<ul> <li>Triton\u652f\u6301\u81ea\u52a8\u8c03\u4f18\uff1a\u5c1d\u8bd5\u591a\u79cd\u914d\u7f6e\u5e76\u9009\u62e9\u6700\u5feb\u7684\uff1a</li> </ul> <pre><code>@triton.autotune(\n    configs=[\n        triton.Config({'BLOCK_SIZE_M': 128, 'BLOCK_SIZE_N': 128, 'BLOCK_SIZE_K': 32}),\n        triton.Config({'BLOCK_SIZE_M': 64, 'BLOCK_SIZE_N': 256, 'BLOCK_SIZE_K': 32}),\n        triton.Config({'BLOCK_SIZE_M': 256, 'BLOCK_SIZE_N': 64, 'BLOCK_SIZE_K': 64}),\n    ],\n    key=['M', 'N', 'K'],  # \u5f53\u8fd9\u4e9b\u53d8\u5316\u65f6\u91cd\u65b0\u8c03\u4f18\n)\n@triton.jit\ndef matmul_kernel(a_ptr, b_ptr, c_ptr, M, N, K, ...):\n    ...\n</code></pre> <ul> <li>Triton\u5728\u5b9e\u9645\u786c\u4ef6\u4e0a\u5bf9\u6bcf\u79cd\u914d\u7f6e\u8fdb\u884c\u57fa\u51c6\u6d4b\u8bd5\u5e76\u9009\u62e9\u6700\u5feb\u8005\u3002\u6700\u4f18\u74e6\u7247\u5927\u5c0f\u53d6\u51b3\u4e8eGPU\u67b6\u6784\u3001\u77e9\u9635\u7ef4\u5ea6\u548c\u5185\u5b58\u5e03\u5c40\u2014\u2014\u81ea\u52a8\u8c03\u4f18\u65e0\u9700\u624b\u52a8\u5b9e\u9a8c\u5373\u53ef\u627e\u5230\u5b83\u4eec\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/05.%20triton%2C%20TPUs%20and%20pallax/#triton-vs-cuda","title":"Triton vs CUDA\uff1a\u4f55\u65f6\u4f7f\u7528","text":"Triton CUDA C \u8bed\u8a00 Python C/C++ \u62bd\u8c61\u5c42\u7ea7 \u5757\u7ea7 \u7ebf\u7a0b\u7ea7 \u5f00\u53d1\u901f\u5ea6 \u5feb\uff08\u6bcf\u6838\u51fd\u657010-50\u884c\uff09 \u6162\uff08100-500\u884c\uff09 \u6027\u80fd\u5929\u82b1\u677f \u624b\u5de5\u8c03\u4f18CUDA\u7684\u7ea680-95% 100%\uff08\u5b8c\u5168\u786c\u4ef6\u63a7\u5236\uff09 \u5171\u4eab\u5185\u5b58 \u81ea\u52a8 \u624b\u52a8 \u5408\u5e76 \u81ea\u52a8 \u624b\u52a8 \u7ebf\u7a0b\u675f\u7ea7\u539f\u8bed \u6709\u9650 \u5b8c\u6574\uff08shuffle\u3001vote\u7b49\uff09 \u786c\u4ef6\u652f\u6301 \u4ec5NVIDIA\uff08AMD\u5b9e\u9a8c\u6027\uff09 \u4ec5NVIDIA <ul> <li>\u4f7f\u7528Triton\u5bf9\u4e8e\uff1a\u878d\u5408\u6838\u51fd\u6570\u3001\u81ea\u5b9a\u4e49\u6ce8\u610f\u529b\u6a21\u5f0f\u3001\u6fc0\u6d3b\u51fd\u6570\u3001\u5927\u591a\u6570ML\u7814\u7a76\u6838\u51fd\u6570\u9700\u6c42\u3002</li> <li>\u4f7f\u7528CUDA C\u5bf9\u4e8e\uff1a\u6700\u9ad8\u6027\u80fd\uff08\u6700\u540e5-20%\uff09\u3001\u7ebf\u7a0b\u675f\u7ea7\u539f\u8bed\u3001\u590d\u6742\u6570\u636e\u76f8\u5173\u5e76\u884c\u6027\u3001\u5f53Triton\u65e0\u6cd5\u8868\u8fbe\u4f60\u7684\u6a21\u5f0f\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/05.%20triton%2C%20TPUs%20and%20pallax/#flash-attention","title":"\u6848\u4f8b\u7814\u7a76\uff1aFlash Attention","text":"<ul> <li> <p>Flash Attention\uff08Dao\u7b49\u4eba\uff0c2022\uff09\u662f\u8fd1\u5e74\u6765\u6700\u5177\u5f71\u54cd\u529b\u7684\u81ea\u5b9a\u4e49\u6838\u51fd\u6570\u3002\u5b83\u4ee5 \\(O(n)\\) \u5185\u5b58\u800c\u975e \\(O(n^2)\\) \u8ba1\u7b97\u6ce8\u610f\u529b\uff0c\u4f7f\u5f97\u66f4\u957f\u7684\u5e8f\u5217\u6210\u4e3a\u53ef\u80fd\u3002</p> </li> <li> <p>\u95ee\u9898\uff1a\u6807\u51c6\u6ce8\u610f\u529b\u8ba1\u7b97 \\(\\\\text{softmax}(QK^T / \\\\sqrt{d}) \\\\cdot V\\)\u3002\\(QK^T\\) \u77e9\u9635\u662f \\(n \\\\times n\\)\uff0c\u5176\u4e2d \\(n\\) \u662f\u5e8f\u5217\u957f\u5ea6\u3002\u5bf9\u4e8e \\(n = 128K\\)\uff0c\u6b64\u77e9\u9635\u4e3a \\(128K \\\\times 128K \\\\times 4\\) \u5b57\u8282 = 64 GB\u3002\u5b83\u65e0\u6cd5\u653e\u5165GPU\u5185\u5b58\u3002</p> </li> <li> <p>\u5173\u952e\u6d1e\u5bdf\uff1a\u4f60\u4e0d\u9700\u8981\u5177\u4f53\u5316\u5b8c\u6574\u7684 \\(n \\\\times n\\) \u77e9\u9635\u3002\u6309\u74e6\u7247\u8ba1\u7b97\u6ce8\u610f\u529b\uff1a\u52a0\u8f7d\u4e00\u7ec4 \\(Q\\)\u3001\u4e00\u7ec4 \\(K\\)\uff0c\u8ba1\u7b97\u5b83\u4eec\u7684\u90e8\u5206\u6ce8\u610f\u529b\u5f97\u5206\uff0c\u7d2f\u52a0\uff0c\u7136\u540e\u79fb\u52a8\u5230\u4e0b\u4e00\u4e2a\u5757\u3002\\(n \\\\times n\\) \u77e9\u9635\u4ece\u672a\u5b8c\u5168\u5177\u4f53\u5316\u2014\u2014\u6bcf\u6b21\u53ea\u6709\u4e00\u5757\u5b58\u5728\u4e8eSRAM\u4e2d\u3002</p> </li> <li> <p>\u5728\u7ebfsoftmax\uff1a\u68d8\u624b\u7684\u90e8\u5206\u662fsoftmax\uff0c\u5b83\u9700\u8981\u77e5\u9053\u6574\u4e2a\u884c\u4e0a\u7684\u6700\u5927\u503c\uff08\u4e3a\u6570\u503c\u7a33\u5b9a\u6027\uff09\u3002Flash Attention\u4f7f\u7528\u5728\u7ebfsoftmax\u6280\u5de7\uff1a\u7ef4\u62a4\u4e00\u4e2a\u8fd0\u884c\u4e2d\u7684\u6700\u5927\u503c\uff0c\u5f53\u53d1\u73b0\u65b0\u7684\u6700\u5927\u503c\u65f6\u91cd\u65b0\u7f29\u653e\u5148\u524d\u8ba1\u7b97\u7684\u503c\u3002\u8fd9\u5141\u8bb8softmax\u4ee5\u589e\u91cf\u65b9\u5f0f\u9010\u5757\u8ba1\u7b97\u3002</p> </li> <li> <p>\u7b97\u6cd5\uff1a</p> </li> </ul> <pre><code>\u5bf9\u4e8e\u6bcf\u4e2aQ\u884c\u5757\uff1a\n    \u5bf9\u4e8e\u6bcf\u4e2aK\u5217\u5757\uff1a\n        1. \u5c06Q_block\u4eceHBM\u52a0\u8f7d\u5230SRAM\n        2. \u5c06K_block\u4eceHBM\u52a0\u8f7d\u5230SRAM\n        3. \u8ba1\u7b97S_block = Q_block @ K_block.T\uff08\u5728SRAM\u4e2d\uff09\n        4. \u66f4\u65b0\u8fd0\u884c\u4e2d\u6700\u5927\u503c\uff0c\u91cd\u65b0\u7f29\u653e\u5148\u524d\u7ed3\u679c\n        5. \u8ba1\u7b97exp(S_block - \u8fd0\u884c\u4e2d\u6700\u5927\u503c)\n        6. \u66f4\u65b0\u8fd0\u884c\u4e2d\u6c42\u548c\u548c\u8f93\u51fa\u7d2f\u52a0\u5668\n    \u52a0\u8f7dV_block\u5e76\u8ba1\u7b97\u6700\u7ec8\u8f93\u51fa\n    \u5c06\u8f93\u51fa\u5757\u5199\u56deHBM\n</code></pre> <ul> <li> <p>\u4e3a\u4ec0\u4e48\u5b83\u5feb\uff1a\u5185\u5faa\u73af\u5b8c\u5168\u5728SRAM\uff08\u5171\u4eab\u5185\u5b58\uff09\u4e2d\u64cd\u4f5c\u3002\u5168\u5c40\u5185\u5b58\uff08HBM\uff09\u4ec5\u7528\u4e8e\u52a0\u8f7dQ\u3001K\u3001V\u5757\u548c\u5199\u5165\u6700\u7ec8\u8f93\u51fa\u3002\u6570\u636e\u91cd\u7528\u56e0\u5b50\u4e0eSRAM\u5927\u5c0f\u6210\u6b63\u6bd4\uff0c\u800cSRAM\u6bd4HBM\u5feb\u7ea6100\u500d\u3002</p> </li> <li> <p>Flash Attention\u5728Triton\u548cCUDA C\u4e2d\u90fd\u6709\u5b9e\u73b0\u3002CUDA\u7248\u672c\u66f4\u5feb\uff08\u6548\u7387\u9ad8\u7ea610%\uff09\uff0c\u4f46Triton\u7248\u672c\u66f4\u5177\u53ef\u8bfb\u6027\u548c\u53ef\u4fee\u6539\u6027\uff0c\u8fd9\u5bf9\u7814\u7a76\u65b0\u7684\u6ce8\u610f\u529b\u53d8\u4f53\u5f88\u91cd\u8981\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/05.%20triton%2C%20TPUs%20and%20pallax/#tpu","title":"TPU\u67b6\u6784","text":"<ul> <li> <p>TPU\uff08\u5f20\u91cf\u5904\u7406\u5355\u5143\uff09\u662fGoogle\u7684\u81ea\u5b9a\u4e49ML\u52a0\u901f\u5668\u3002\u5b83\u4eec\u91c7\u7528\u4e0eGPU\u622a\u7136\u4e0d\u540c\u7684\u65b9\u6cd5\uff1a</p> </li> <li> <p>\u8109\u52a8\u9635\u5217\uff1aTPU\u7684\u6838\u5fc3\u8ba1\u7b97\u5355\u5143\u662f\u77e9\u9635\u4e58\u6cd5\u5355\u5143\uff08MXU\uff09\uff0c\u4e00\u4e2a128\u00d7128\u6216256\u00d7256\u7684\u8109\u52a8\u9635\u5217\uff0c\u901a\u8fc7\u8ba9\u6570\u636e\u6d41\u7ecf\u4e58\u52a0\u5355\u5143\u7f51\u683c\u6765\u8ba1\u7b97\u77e9\u9635\u4e58\u6cd5\u3002\u6570\u636e\u4ece\u8fb9\u7f18\u8fdb\u5165\u5e76\u901a\u8fc7\u9635\u5217\u4f20\u64ad\uff0c\u6bcf\u4e2a\u5355\u5143\u6267\u884c\u4e00\u6b21\u4e58\u52a0\u5e76\u5c06\u7ed3\u679c\u4f20\u9012\u7ed9\u4e0b\u4e00\u4e2a\u3002</p> </li> <li> <p>\u4e0eGPU\uff08\u8c03\u5ea6\u6570\u5343\u4e2a\u72ec\u7acb\u7ebf\u7a0b\uff09\u4e0d\u540c\uff0c\u8109\u52a8\u9635\u5217\u662f\u5355\u4e00\u7684\u786e\u5b9a\u6027\u6570\u636e\u6d41\u3002\u6ca1\u6709\u7ebf\u7a0b\u8c03\u5ea6\u3001\u6ca1\u6709\u7ebf\u7a0b\u675f\u5206\u6b67\u3001\u6ca1\u6709\u5206\u652f\u9884\u6d4b\u3002\u8fd9\u79cd\u7b80\u6734\u6027\u4f7fMXU\u5728\u77e9\u9635\u4e58\u6cd5\u65b9\u9762\u6781\u5176\u80fd\u6548\u9ad8\u6548\u3002</p> </li> <li> <p>HBM\uff1aTPU\u4f7f\u7528\u4e0eGPU\u76f8\u540c\u7684\u9ad8\u5e26\u5bbd\u5185\u5b58\u3002TPU v5e\u6bcf\u82af\u724716 GB HBM2e\uff1bTPU v5p\u6bcf\u82af\u724795 GB HBM2e\u3002</p> </li> <li> <p>ICI\uff08\u82af\u7247\u95f4\u4e92\u8fde\uff09\uff1aTPU Pod\u7528\u81ea\u5b9a\u4e49\u9ad8\u901f\u7f51\u7edc\u8fde\u63a5\u6570\u767e\u4e2aTPU\u3002JAX\u539f\u751f\u652f\u6301\u8de8TPU Pod\u7684\u6570\u636e\u5e76\u884c\u6027\u548c\u6a21\u578b\u5e76\u884c\u6027\uff08\u7b2c6\u7ae0\uff09\u3002</p> </li> <li> <p>BFloat16\uff1aTPU\u662f\u9996\u4e2a\u4f7f\u7528bfloat16\u7684\uff08\u7b2c13\u7ae0\u6587\u4ef602\uff09\u3002BF16\u5177\u6709\u4e0efloat32\u76f8\u540c\u7684\u6307\u6570\u8303\u56f4\uff08\u9632\u6b62\u8bad\u7ec3\u671f\u95f4\u6ea2\u51fa\uff09\uff0c\u5c3e\u6570\u7cbe\u5ea6\u8f83\u4f4e\u3002\u8fd9\u79cd\u6743\u8861\u5bf9ML\u662f\u7406\u60f3\u7684\uff0c\u5176\u4e2d\u68af\u5ea6\u503c\u8303\u56f4\u5e7f\u4f46\u4e0d\u9700\u898123\u4f4d\u7cbe\u5ea6\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/05.%20triton%2C%20TPUs%20and%20pallax/#tpujaxpallas","title":"\u7f16\u7a0bTPU\uff1aJAX\u4e0ePallas","text":"<ul> <li>TPU\u901a\u8fc7JAX\u548cXLA\u7f16\u7a0b\u3002\u4f60\u7f16\u5199Python/JAX\u4ee3\u7801\uff0c<code>jax.jit</code> \u5c06\u5176\u7f16\u8bd1\u4e3aXLA HLO\uff0cXLA\u5c06HLO\u7f16\u8bd1\u4e3aTPU\u7279\u5b9a\u7684\u6307\u4ee4\u3002\u65e0\u9700CUDA\uff0c\u65e0\u9700C++\u3002</li> </ul> <pre><code>import jax\nimport jax.numpy as jnp\n\n@jax.jit\ndef matmul(a, b):\n    return jnp.dot(a, b)\n\n# \u8fd9\u5c06\u6839\u636e\u8bbe\u5907\u5728CPU\u3001GPU\u6216TPU\u4e0a\u8fd0\u884c\na = jnp.ones((1024, 1024))\nb = jnp.ones((1024, 1024))\nc = matmul(a, b)\n</code></pre> <ul> <li>Pallas\u662fJAX\u7684\u6838\u51fd\u6570\u7f16\u5199API\u2014\u2014JAX\u7248\u7684Triton\u3002\u5b83\u8ba9\u4f60\u7f16\u5199\u4f4e\u7ea7\u6838\u51fd\u6570\uff0cXLA\u5c06\u5176\u7f16\u8bd1\u4e3aGPU\u6216TPU\uff1a</li> </ul> <pre><code>from jax.experimental import pallas as pl\nimport jax.numpy as jnp\n\ndef add_kernel(x_ref, y_ref, o_ref):\n    o_ref[...] = x_ref[...] + y_ref[...]\n\ndef add_pallas(x, y):\n    return pl.pallas_call(\n        add_kernel,\n        out_shape=jax.ShapeDtypeStruct(x.shape, x.dtype),\n        grid=(x.shape[0] // 128,),\n        in_specs=[pl.BlockSpec((128,), lambda i: (i,)),\n                  pl.BlockSpec((128,), lambda i: (i,))],\n        out_specs=pl.BlockSpec((128,), lambda i: (i,)),\n    )(x, y)\n</code></pre> <ul> <li>Pallas\u6bd4Triton\u66f4\u65b0\u4e14\u4e0d\u592a\u6210\u719f\uff0c\u4f46\u5b83\u662f\u4e3aTPU\u7f16\u5199\u81ea\u5b9a\u4e49\u6838\u51fd\u6570\u7684\u552f\u4e00\u65b9\u5f0f\uff08\u56e0\u4e3aTPU\u4e0d\u652f\u6301CUDA\uff09\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/05.%20triton%2C%20TPUs%20and%20pallax/#gpu-vs-tpu","title":"GPU vs TPU","text":"GPU\uff08NVIDIA\uff09 TPU\uff08Google\uff09 \u53ef\u7528\u6027 \u4efb\u4f55\u4e91\u3001\u672c\u5730\u90e8\u7f72 \u4ec5Google Cloud \u7f16\u7a0b CUDA C\u3001Triton\u3001PyTorch JAX/XLA\u3001Pallas \u7075\u6d3b\u6027 \u901a\u7528\u8ba1\u7b97 \u9488\u5bf9\u77e9\u9635\u5bc6\u96c6\u578bML\u4f18\u5316 \u5cf0\u503c\u77e9\u9635\u4e58\u6cd5FLOPS \u975e\u5e38\u9ad8\uff08\u5f20\u91cf\u6838\u5fc3\uff09 \u975e\u5e38\u9ad8\uff08MXU\uff09 \u975e\u77e9\u9635\u4e58\u6cd5\u64cd\u4f5c \u597d \u8f83\u6162\uff08\u901a\u8fc7\u5411\u91cf\u5355\u5143\u8def\u7531\uff0c\u800c\u975eMXU\uff09 \u591a\u82af\u7247\u6269\u5c55 NVLink\uff088\u4e2aGPU\uff09\u3001InfiniBand ICI\uff08\u6570\u5343\u4e2aTPU\uff0c\u66f4\u7d27\u5bc6\u96c6\u6210\uff09 \u6210\u672c\u6548\u7387 \u6709\u7ade\u4e89\u529b \u5927\u89c4\u6a21\u8bad\u7ec3\u901a\u5e38\u66f4\u4fbf\u5b9c \u751f\u6001\u7cfb\u7edf \u6700\u5927\uff08PyTorch\u3001TensorFlow\u3001JAX\uff09 \u9762\u5411JAX <ul> <li>\u4f7f\u7528GPU\u5bf9\u4e8e\uff1a\u5927\u591a\u6570ML\u5de5\u4f5c\u8d1f\u8f7d\u3001\u57fa\u4e8ePyTorch\u7684\u7814\u7a76\u3001\u63a8\u7406\u670d\u52a1\u3001\u6709\u5927\u91cf\u975e\u77e9\u9635\u4e58\u6cd5\u8ba1\u7b97\u7684\u5de5\u4f5c\u8d1f\u8f7d\u3002</li> <li>\u4f7f\u7528TPU\u5bf9\u4e8e\uff1a\u5927\u89c4\u6a21JAX\u8bad\u7ec3\uff08\u6570\u5343\u82af\u7247\uff09\u3001Google Cloud\u4e0a\u7684\u6210\u672c\u654f\u611f\u8bad\u7ec3\u3001\u4ee5\u77e9\u9635\u4e58\u6cd5\u4e3a\u4e3b\u7684\u5de5\u4f5c\u8d1f\u8f7d\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/05.%20triton%2C%20TPUs%20and%20pallax/#_1","title":"\u9009\u62e9\u5408\u9002\u7684\u5de5\u5177","text":"\u5de5\u4f5c\u8d1f\u8f7d \u6700\u4f73\u5de5\u5177 \u4e3a\u4ec0\u4e48 ML\u8bad\u7ec3\uff08PyTorch\uff09 NVIDIA GPU + CUDA/Triton \u6700\u5927\u751f\u6001\u7cfb\u7edf\u3001\u6700\u4f73\u5de5\u5177\u94fe ML\u8bad\u7ec3\uff08JAX\uff0c\u5927\u89c4\u6a21\uff09 TPU\u6216NVIDIA GPU TPU\u5728Google\u89c4\u6a21\u4e0b\u6210\u672c\u4f4e\uff0cGPU\u7075\u6d3b \u81ea\u5b9a\u4e49\u878d\u5408\u6838\u51fd\u6570 Triton\uff08Python\uff09\u6216CUDA C Triton\u5f00\u53d1\u901f\u5ea6\u5feb\uff0cCUDA\u5cf0\u503c\u6027\u80fd\u9ad8 JAX\u81ea\u5b9a\u4e49\u6838\u51fd\u6570 Pallas TPU\u552f\u4e00\u9009\u9879\uff0c\u4e5f\u53ef\u5728GPU\u4e0a\u5de5\u4f5c \u8de8\u5e73\u53f0\u63a8\u7406 Vulkan\uff08\u6587\u4ef607\uff09\u6216ONNX Runtime \u8fd0\u884c\u5728\u4efb\u4f55GPU\u4f9b\u5e94\u5546\u4e0a \u79fb\u52a8/\u8fb9\u7f18\u63a8\u7406 Metal\uff08Apple\uff09\u3001Vulkan\uff08Android\uff09\u3001NNAPI \u5e73\u53f0\u7279\u5b9a\u7684\u52a0\u901f\u5668 \u6d4f\u89c8\u5668\u63a8\u7406 WebGPU\uff08\u6587\u4ef607\uff09 \u6d4f\u89c8\u5668\u4e2d\u552f\u4e00\u9009\u9879 \u4ec5CPU\u63a8\u7406 ONNX Runtime + AVX/NEON \u65e0\u9700GPU\uff0c\u4f7f\u7528SIMD\uff08\u6587\u4ef602-03\uff09 \u65b0\u578b\u786c\u4ef6 \u4f9b\u5e94\u5546\u4e13\u7528SDK \u6bcf\u4e2a\u52a0\u901f\u5668\u6709\u81ea\u5df1\u7684\u5de5\u5177\u94fe"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/05.%20triton%2C%20TPUs%20and%20pallax/#gpucolab","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528\u5e26GPU\u8fd0\u884c\u65f6\u7684CoLab\uff09","text":"<ol> <li> <p>\u7f16\u5199\u5e76\u8fd0\u884c\u5411\u91cf\u52a0\u6cd5\u7684Triton\u6838\u51fd\u6570\u3002\u5c06\u5176\u6027\u80fd\u4e0ePyTorch\u5185\u7f6e\u52a0\u6cd5\u6bd4\u8f83\u3002 <pre><code>import triton\nimport triton.language as tl\nimport torch\nimport time\n\n@triton.jit\ndef add_kernel(x_ptr, y_ptr, out_ptr, n, BLOCK: tl.constexpr):\n    pid = tl.program_id(0)\n    offs = pid * BLOCK + tl.arange(0, BLOCK)\n    mask = offs &lt; n\n    x = tl.load(x_ptr + offs, mask=mask)\n    y = tl.load(y_ptr + offs, mask=mask)\n    tl.store(out_ptr + offs, x + y, mask=mask)\n\nn = 10_000_000\nx = torch.randn(n, device='cuda')\ny = torch.randn(n, device='cuda')\n\n# Triton\nout_triton = torch.empty_like(x)\ngrid = lambda meta: (triton.cdiv(n, meta['BLOCK']),)\nadd_kernel[grid](x, y, out_triton, n, BLOCK=1024)\n\n# PyTorch\nout_torch = x + y\n\n# \u9a8c\u8bc1\u6b63\u786e\u6027\nassert torch.allclose(out_triton, out_torch, atol=1e-5)\n\n# \u57fa\u51c6\u6d4b\u8bd5\ntorch.cuda.synchronize()\nstart = time.time()\nfor _ in range(1000):\n    add_kernel[grid](x, y, out_triton, n, BLOCK=1024)\ntorch.cuda.synchronize()\ntriton_time = (time.time() - start) / 1000\n\nstart = time.time()\nfor _ in range(1000):\n    out_torch = x + y\ntorch.cuda.synchronize()\ntorch_time = (time.time() - start) / 1000\n\nprint(f\"Triton:  {triton_time*1000:.3f} ms\")\nprint(f\"PyTorch: {torch_time*1000:.3f} ms\")\nprint(f\"\u6bd4\u7387:   {torch_time/triton_time:.2f}x\")\n</code></pre></p> </li> <li> <p>\u7f16\u5199\u4e00\u4e2aTriton\u878d\u5408\u6838\u51fd\u6570\uff0c\u5728\u5355\u6b21\u904d\u5386\u4e2d\u6267\u884c\u4e58\u6cd5+\u52a0\u6cd5+ReLU\u3002\u4e0e\u4e09\u4e2a\u72ec\u7acb\u7684PyTorch\u64cd\u4f5c\u6bd4\u8f83\u3002 <pre><code>import triton\nimport triton.language as tl\nimport torch\nimport time\n\n@triton.jit\ndef fused_mul_add_relu_kernel(x_ptr, w_ptr, b_ptr, out_ptr, n, BLOCK: tl.constexpr):\n    pid = tl.program_id(0)\n    offs = pid * BLOCK + tl.arange(0, BLOCK)\n    mask = offs &lt; n\n    x = tl.load(x_ptr + offs, mask=mask)\n    w = tl.load(w_ptr + offs, mask=mask)\n    b = tl.load(b_ptr + offs, mask=mask)\n    result = tl.maximum(x * w + b, 0.0)  # \u878d\u5408\uff1a\u4e58\u6cd5 + \u52a0\u6cd5 + relu\n    tl.store(out_ptr + offs, result, mask=mask)\n\nn = 10_000_000\nx = torch.randn(n, device='cuda')\nw = torch.randn(n, device='cuda')\nb = torch.randn(n, device='cuda')\n\n# \u878d\u5408\uff08Triton\uff09\nout_fused = torch.empty_like(x)\ngrid = lambda meta: (triton.cdiv(n, meta['BLOCK']),)\nfused_mul_add_relu_kernel[grid](x, w, b, out_fused, n, BLOCK=1024)\n\n# \u672a\u878d\u5408\uff08PyTorch\uff09\nout_unfused = torch.relu(x * w + b)\n\nassert torch.allclose(out_fused, out_unfused, atol=1e-5)\n\n# \u57fa\u51c6\u6d4b\u8bd5\ntorch.cuda.synchronize()\nstart = time.time()\nfor _ in range(1000):\n    fused_mul_add_relu_kernel[grid](x, w, b, out_fused, n, BLOCK=1024)\ntorch.cuda.synchronize()\nfused_time = (time.time() - start) / 1000\n\nstart = time.time()\nfor _ in range(1000):\n    out_unfused = torch.relu(x * w + b)\ntorch.cuda.synchronize()\nunfused_time = (time.time() - start) / 1000\n\nprint(f\"\u878d\u5408\uff08Triton\uff09:    {fused_time*1000:.3f} ms\")\nprint(f\"\u672a\u878d\u5408\uff08PyTorch\uff09: {unfused_time*1000:.3f} ms\")\nprint(f\"\u52a0\u901f\u6bd4:           {unfused_time/fused_time:.2f}x\")\n</code></pre></p> </li> <li> <p>\u6d4b\u91cfJAX\u7684XLA\u7f16\u8bd1\u5668\u5982\u4f55\u81ea\u52a8\u878d\u5408\u64cd\u4f5c\u3002\u6bd4\u8f83\u5e26\u548c\u4e0d\u5e26jit\u7684\u64cd\u4f5c\u94fe\u3002 <pre><code>import jax\nimport jax.numpy as jnp\nimport time\n\ndef chain_ops(x):\n    x = x * 2.0\n    x = x + 1.0\n    x = jnp.maximum(x, 0.0)  # ReLU\n    x = x / jnp.sum(x)\n    return x\n\nchain_jit = jax.jit(chain_ops)\nx = jax.random.normal(jax.random.PRNGKey(0), (10000, 1000))\n\n# \u9884\u70ed\n_ = chain_jit(x)\njax.block_until_ready(_)\n\n# \u5373\u65f6\u6a21\u5f0f\uff08\u6bcf\u4e2a\u64cd\u4f5c\u662f\u72ec\u7acb\u6838\u51fd\u6570\u542f\u52a8\uff09\nstart = time.time()\nfor _ in range(100):\n    y = chain_ops(x)\njax.block_until_ready(y)\neager_time = (time.time() - start) / 100\n\n# JIT\uff08XLA\u878d\u5408\u64cd\u4f5c\uff09\nstart = time.time()\nfor _ in range(100):\n    y = chain_jit(x)\njax.block_until_ready(y)\njit_time = (time.time() - start) / 100\n\nprint(f\"\u5373\u65f6: {eager_time*1000:.2f} ms\")\nprint(f\"JIT:   {jit_time*1000:.2f} ms\")\nprint(f\"\u52a0\u901f\u6bd4: {eager_time/jit_time:.1f}x\uff08XLA\u5c064\u4e2a\u64cd\u4f5c\u878d\u5408\u4e3a1\u4e2a\u6838\u51fd\u6570\uff09\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/06.%20RISC-V%20and%20embedded%20systems/","title":"RISC-V\u4e0e\u5d4c\u5165\u5f0f\u7cfb\u7edf","text":"<p>RISC-V\u662f\u6b63\u5728\u91cd\u5851\u82af\u7247\u884c\u4e1a\u7684\u5f00\u6e90\u6307\u4ee4\u96c6\u67b6\u6784\u3002\u672c\u6587\u6db5\u76d6RISC-V\u54f2\u5b66\u3001V\u5411\u91cf\u6269\u5c55\u3001\u5d4c\u5165\u5f0fML\u63a8\u7406\u3001\u5fae\u63a7\u5236\u5668\u4e0a\u7684TinyML\u3001AI\u52a0\u901f\u5668\u4e2d\u7684RISC-V\u4ee5\u53ca\u8fb9\u7f18\u90e8\u7f72\u7ea6\u675f</p> <ul> <li>\u6211\u4eec\u4e4b\u524d\u8ba8\u8bba\u7684\u6bcf\u4e00\u79cd\u82af\u7247\u67b6\u6784\uff08x86\u3001ARM\uff09\u90fd\u9700\u8981\u8bb8\u53ef\u3002Intel\u548cAMD\u4e3ax86\u4ed8\u8d39\u3002Apple\u3001Qualcomm\u4ee5\u53ca\u6bcf\u4e00\u5bb6\u667a\u80fd\u624b\u673a\u5382\u5546\u6bcf\u5e74\u5411ARM\u652f\u4ed8\u6570\u5341\u4ebf\u7f8e\u5143\u3002RISC-V\u5219\u4e0d\u540c\uff1a\u5b83\u662f\u4e00\u4e2a\u5f00\u653e\u6807\u51c6\u3002\u4efb\u4f55\u4eba\u90fd\u53ef\u4ee5\u8bbe\u8ba1\u3001\u5236\u9020\u548c\u9500\u552eRISC-V\u82af\u7247\uff0c\u65e0\u9700\u5411\u4efb\u4f55\u4eba\u652f\u4ed8\u7248\u7a0e\u3002\u8fd9\u6b63\u5728\u6539\u53d8\u82af\u7247\u8bbe\u8ba1\u7684\u7ecf\u6d4e\u6027\uff0c\u7279\u522b\u662f\u5bf9\u4e8eAI\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/06.%20RISC-V%20and%20embedded%20systems/#risc-v_1","title":"RISC-V\u54f2\u5b66","text":"<ul> <li> <p>RISC-V\uff08\u53d1\u97f3\u4e3a\"risk five\"\uff09\u4e8e2010\u5e74\u5728\u52a0\u5dde\u5927\u5b66\u4f2f\u514b\u5229\u5206\u6821\u521b\u5efa\uff0c\u4f5c\u4e3a\u4e00\u4e2a\u7b80\u6d01\u3001\u73b0\u4ee3\u7684RISC\u6307\u4ee4\u96c6\u3002\u5173\u952e\u539f\u5219\uff1a</p> <ul> <li> <p>\u5f00\u653e\u6807\u51c6\uff1aISA\u89c4\u8303\u514d\u8d39\u63d0\u4f9b\u3002\u4f60\u53ef\u4ee5\u5728\u6ca1\u6709\u8bb8\u53ef\u8d39\u3001NDA\u6216\u6cd5\u5f8b\u534f\u8bae\u7684\u60c5\u51b5\u4e0b\u6784\u5efaRISC-V CPU\u3002\u8fd9\u5c31\u50cfLinux\u4e4b\u4e8e\u64cd\u4f5c\u7cfb\u7edf\u2014\u2014\u4efb\u4f55\u4eba\u90fd\u53ef\u4ee5\u4f7f\u7528\u3001\u4fee\u6539\u548c\u5728\u6b64\u57fa\u7840\u4e0a\u6784\u5efa\u3002</p> </li> <li> <p>\u6a21\u5757\u5316\u8bbe\u8ba1\uff1a\u57fa\u7840ISA\uff08RV32I\u6216RV64I\uff09\u662f\u6700\u5c0f\u7684\u2014\u2014\u4ec547\u6761\u6307\u4ee4\u3002\u5176\u4ed6\u4e00\u5207\u90fd\u662f\u53ef\u9009\u7684\u6269\u5c55\uff1aM\uff08\u4e58\u6cd5/\u9664\u6cd5\uff09\u3001A\uff08\u539f\u5b50\u64cd\u4f5c\uff09\u3001F/D\uff08\u6d6e\u70b9\uff09\u3001C\uff08\u538b\u7f29\u6307\u4ee4\uff09\u3001V\uff08\u5411\u91cf\u5904\u7406\uff09\u3002\u4f60\u53ea\u9009\u62e9\u9700\u8981\u7684\uff0c\u4fdd\u6301\u82af\u7247\u5c0f\u5de7\u9ad8\u6548\u3002</p> </li> <li> <p>\u65e0\u9057\u7559\u5305\u88b1\uff1ax86\u80cc\u8d1f\u774045\u5e74\u7684\u5411\u540e\u517c\u5bb9\u6027\u3002ARM\u80cc\u8d1f\u774035\u5e74\u3002RISC-V\u4ece\u96f6\u5f00\u59cb\uff0c\u878d\u5165\u4e86\u4ece\u4e24\u8005\u4e2d\u5438\u53d6\u7684\u7ecf\u9a8c\u6559\u8bad\u3002\u6ca1\u6709\u4ec5\u4e3a\u4e0e1980\u5e74\u4ee3\u8f6f\u4ef6\u517c\u5bb9\u800c\u5b58\u5728\u7684\u6666\u6da9\u6307\u4ee4\u3002</p> </li> </ul> </li> <li> <p>\u8c01\u5728\u4f7f\u7528RISC-V\uff1aSiFive\uff08\u901a\u7528\u6838\u5fc3\uff09\u3001\u963f\u91cc\u5df4\u5df4\uff08\u7384\u94c1\u670d\u52a1\u5668\u6838\u5fc3\uff09\u3001\u897f\u90e8\u6570\u636e\uff08\u5b58\u50a8\u63a7\u5236\u5668\uff0c\u5df2\u51fa\u8d27\u6570\u5341\u4ebf\uff09\u3001\u4e50\u946b\uff08ESP32-C3\uff0c\u6d41\u884cIoT\u82af\u7247\uff09\uff0c\u4ee5\u53ca\u6570\u5341\u5bb6\u4f7f\u7528RISC-V\u4f5c\u4e3a\u7ba1\u7406\u5176\u81ea\u5b9a\u4e49\u8ba1\u7b97\u5355\u5143\u7684\u63a7\u5236\u5904\u7406\u5668\u7684AI\u52a0\u901f\u5668\u521d\u521b\u516c\u53f8\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/06.%20RISC-V%20and%20embedded%20systems/#risc-v_2","title":"RISC-V\u57fa\u7840\u67b6\u6784","text":"<ul> <li>\u57fa\u7840\u6574\u6570ISA\uff08RV64I\u7528\u4e8e64\u4f4d\uff09\u5177\u6709\uff1a<ul> <li>32\u4e2a\u901a\u7528\u5bc4\u5b58\u5668\uff08x0-x31\uff0c\u6bcf\u4e2a64\u4f4d\uff09\u3002x0\u786c\u8fde\u63a5\u4e3a\u96f6\uff08\u7528\u4e8e\u5728\u6ca1\u6709\u7279\u6b8a\u6307\u4ee4\u7684\u60c5\u51b5\u4e0b\u5b9e\u73b0\u5e38\u89c1\u6a21\u5f0f\uff09\u3002</li> <li>\u56fa\u5b9a32\u4f4d\u6307\u4ee4\u5bbd\u5ea6\uff08C\u6269\u5c55\u4e3a\u4ee3\u7801\u5bc6\u5ea6\u6dfb\u52a0\u4e8616\u4f4d\u538b\u7f29\u6307\u4ee4\uff09\u3002</li> <li>\u52a0\u8f7d-\u5b58\u50a8\u67b6\u6784\uff1a\u4e0eARM\u4e00\u6837\uff0c\u7b97\u672f\u4ec5\u64cd\u4f5c\u5bc4\u5b58\u5668\u3002\u5185\u5b58\u8bbf\u95ee\u901a\u8fc7\u663e\u5f0f\u52a0\u8f7d/\u5b58\u50a8\u6307\u4ee4\u8fdb\u884c\u3002</li> </ul> </li> </ul> <pre><code># RISC-V\u6c47\u7f16\uff08\u611f\u53d7\u98ce\u683c\u2014\u2014\u4f60\u5c06\u4f7f\u7528C/C++\uff09\nadd  x3, x1, x2      # x3 = x1 + x2\nlw   x4, 0(x5)       # \u4ecex5\u4e2d\u7684\u5730\u5740\u52a0\u8f7d\u5b57\nsw   x4, 8(x5)       # \u5b58\u50a8\u5b57\u5230\u5730\u5740 x5 + 8\nbeq  x1, x2, label   # \u5982\u679cx1 == x2\u5219\u5206\u652f\n</code></pre> <ul> <li>ISA\u7684\u7b80\u6d01\u6027\u4f7fRISC-V\u6838\u5fc3\u5c0f\u5de7\u4e14\u80fd\u6548\u9ad8\u3002\u6700\u5c0f\u7684RV32I\u6838\u5fc3\u53ef\u4ee5\u7528\u7ea610,000\u4e2a\u95e8\u5b9e\u73b0\uff08ARM Cortex-M0\u7ea6\u4e3a12,000\uff09\u3002\u8fd9\u5bf9\u4e8e\u6bcf\u4e00\u6beb\u74e6\u548c\u6bcf\u4e00\u5e73\u65b9\u6beb\u7c73\u7845\u7247\u90fd\u81f3\u5173\u91cd\u8981\u7684\u5d4c\u5165\u5f0f\u7cfb\u7edf\u5f88\u91cd\u8981\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/06.%20RISC-V%20and%20embedded%20systems/#vrisc-v","title":"V\u6269\u5c55\uff1aRISC-V\u5411\u91cf\u5904\u7406","text":"<ul> <li>V\u6269\u5c55\uff08RVV\uff09\u4e3aRISC-V\u6dfb\u52a0\u4e86\u53ef\u4f38\u7f29\u5411\u91cf\u5904\u7406\uff0c\u7c7b\u4f3c\u4e8eARM SVE\u3002\u5411\u91cf\u5bc4\u5b58\u5668\u5177\u6709\u53ef\u914d\u7f6e\u957f\u5ea6\uff08VLEN\uff09\uff0c\u7531\u786c\u4ef6\u6307\u5b9a\uff08128\u523065,536\u4f4d\uff09\u3002\u4ee3\u7801\u7f16\u5199\u4e3a\u5411\u91cf\u957f\u5ea6\u65e0\u5173\uff1a\u65e0\u9700\u91cd\u65b0\u7f16\u8bd1\u53ef\u5728\u4efb\u4f55VLEN\u4e0a\u5de5\u4f5c\u3002</li> </ul> <pre><code>#include &lt;riscv_vector.h&gt;\n\n// \u4f7f\u7528RVV\u5185\u8054\u51fd\u6570\u8fdb\u884c\u5411\u91cf\u52a0\u6cd5\nvoid vadd_rvv(const float* a, const float* b, float* c, int n) {\n    while (n &gt; 0) {\n        // vsetvl\uff1a\u8bbe\u7f6e\u5411\u91cf\u957f\u5ea6\u2014\u2014\u5904\u7406 min(n, \u786c\u4ef6\u6700\u5927\u503c) \u4e2a\u5143\u7d20\n        size_t vl = __riscv_vsetvl_e32m1(n);\n\n        // \u52a0\u8f7dvl\u4e2a\u5143\u7d20\n        vfloat32m1_t va = __riscv_vle32_v_f32m1(a, vl);\n        vfloat32m1_t vb = __riscv_vle32_v_f32m1(b, vl);\n\n        // \u76f8\u52a0\n        vfloat32m1_t vc = __riscv_vfadd_vv_f32m1(va, vb, vl);\n\n        // \u5b58\u50a8\n        __riscv_vse32_v_f32m1(c, vc, vl);\n\n        // \u524d\u8fdb\u6307\u9488\n        a += vl; b += vl; c += vl; n -= vl;\n    }\n}\n</code></pre> <ul> <li> <p><code>vsetvl</code> \u662f\u5173\u952e\u6307\u4ee4\u3002\u5b83\u544a\u8bc9\u786c\u4ef6\"\u6211\u60f3\u5904\u7406\u8fd9\u4e48\u591a\u5143\u7d20\"\uff0c\u786c\u4ef6\u56de\u5e94\"\u6211\u53ef\u4ee5\u5904\u7406\u8fd9\u4e48\u591a\"\uff08\u53d7VLEN\u9650\u5236\uff09\u3002\u5faa\u73af\u81ea\u52a8\u9002\u5e94\u4efb\u4f55\u5411\u91cf\u5bbd\u5ea6\uff0c\u65e0\u9700\u6807\u91cf\u6e05\u7406\uff08\u6700\u540e\u4e00\u6b21\u8fed\u4ee3\u53ea\u5904\u7406\u8f83\u5c11\u7684\u5143\u7d20\uff09\u3002</p> </li> <li> <p>LMUL\uff08\u957f\u5ea6\u4e58\u6570\uff09\uff1aRVV\u53ef\u4ee5\u5c06\u591a\u4e2a\u5411\u91cf\u5bc4\u5b58\u5668\u5206\u7ec4\u5728\u4e00\u8d77\uff08m1\u3001m2\u3001m4\u3001m8\uff09\uff0c\u4ee5\u6bcf\u6761\u6307\u4ee4\u5904\u7406\u66f4\u591a\u5143\u7d20\uff0c\u4ee3\u4ef7\u662f\u53ef\u7528\u7684\u5bc4\u5b58\u5668\u66f4\u5c11\u3002<code>m1</code> \u6bcf\u4e2a\u5411\u91cf\u64cd\u4f5c\u6570\u4f7f\u7528\u4e00\u4e2a\u5bc4\u5b58\u5668\uff1b<code>m8</code> \u4f7f\u7528\u516b\u4e2a\uff0c\u5904\u74068\u500d\u5143\u7d20\uff0c\u4f46\u53ea\u7559\u4e0b4\u4e2a\u5bc4\u5b58\u5668\u7ec4\u53ef\u7528\u3002</p> </li> <li> <p>\u4e0ex86 AVX\uff08\u56fa\u5b9a256/512\u4f4d\uff09\u548cARM NEON\uff08\u56fa\u5b9a128\u4f4d\uff09\u76f8\u6bd4\uff0cRVV\u7684\u53ef\u4f38\u7f29\u6027\u5bf9\u4e8e\u591a\u6837\u5316\u786c\u4ef6\u662f\u4e00\u4e2a\u91cd\u8981\u4f18\u52bf\uff1a\u76f8\u540c\u4ee3\u7801\u5728\u5c0f\u578b\u5d4c\u5165\u5f0f\u6838\u5fc3\uff08VLEN=128\uff09\u548c\u9ad8\u6027\u80fd\u670d\u52a1\u5668\u6838\u5fc3\uff08VLEN=1024+\uff09\u4e0a\u8fd0\u884c\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/06.%20RISC-V%20and%20embedded%20systems/#mltinyml","title":"\u5d4c\u5165\u5f0fML\uff1aTinyML","text":"<ul> <li> <p>TinyML\u662f\u5fae\u63a7\u5236\u5668\u4e0a\u7684\u673a\u5668\u5b66\u4e60\u2014\u2014\u5177\u6709\u5343\u5b57\u8282RAM\u3001\u5146\u8d6b\u7ea7CPU\u548c\u6beb\u74e6\u529f\u7387\u9884\u7b97\u7684\u8bbe\u5907\u3002\u60f3\u60f3\uff1a\u68c0\u6d4b\u5173\u952e\u8bcd\u7684\u4f20\u611f\u5668\uff08\"Hey Siri\"\uff09\u3001\u5206\u7c7b\u624b\u52bf\u7684\u52a0\u901f\u5ea6\u8ba1\u3001\u6216\u8ba1\u6570\u4eba\u6570\u7684\u5c0f\u578b\u6444\u50cf\u5934\uff0c\u6240\u6709\u8fd9\u4e9b\u90fd\u5728\u4e00\u4e2a\u552e\u4ef70.50\u7f8e\u5143\u3001\u65e0\u9700\u4e92\u8054\u7f51\u8fde\u63a5\u7684\u82af\u7247\u4e0a\u8fd0\u884c\u3002</p> </li> <li> <p>\u7ea6\u675f\u6761\u4ef6\u6781\u5176\u4e25\u82db\uff1a</p> </li> </ul> \u8d44\u6e90 \u670d\u52a1\u5668GPU \u667a\u80fd\u624b\u673a \u5fae\u63a7\u5236\u5668 RAM 80 GB 6 GB 256 KB \u5b58\u50a8 TB 128 GB 1 MB \u8ba1\u7b97\u80fd\u529b 1000 TFLOPS 10 TFLOPS 0.001 TFLOPS \u529f\u8017 700 W 5 W 0.001 W \u6210\u672c $30,000 $500 $1 <ul> <li>\u9002\u5408\u670d\u52a1\u5668GPU\u7684\u6a21\u578b\uff08\\(O(10^{10})\\) \u53c2\u6570\uff09\u65e0\u6cd5\u653e\u5165\u5fae\u63a7\u5236\u5668\u3002TinyML\u6a21\u578b\u6709 \\(O(10^4)\\)\u2013\\(O(10^6)\\) \u53c2\u6570\uff0c\u5e76\u4f7f\u7528INT8\u751a\u81f3INT4\u91cf\u5316\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/06.%20RISC-V%20and%20embedded%20systems/#tensorflow-lite-microtflm","title":"TensorFlow Lite Micro\uff08TFLM\uff09","text":"<ul> <li>TFLM\u662fGoogle\u7684\u5fae\u63a7\u5236\u5668\u63a8\u7406\u6846\u67b6\u3002\u5b83\u8fd0\u884c\u91cf\u5316\u7684TensorFlow Lite\u6a21\u578b\uff0c\u65e0\u9700\u52a8\u6001\u5185\u5b58\u5206\u914d\u3001\u65e0\u9700\u64cd\u4f5c\u7cfb\u7edf\uff0c\u4e8c\u8fdb\u5236\u5360\u7528\u7ea620 KB\u3002</li> </ul> <pre><code>// \u5fae\u63a7\u5236\u5668\u4e0a\u7684TinyML\u63a8\u7406\uff08\u7b80\u5316\u7248\uff09\n#include \"tensorflow/lite/micro/micro_interpreter.h\"\n#include \"tensorflow/lite/micro/micro_mutable_op_resolver.h\"\n\n// \u6a21\u578b\u7f16\u8bd1\u4e3aC\u6570\u7ec4\uff08const unsigned char model_data[]\uff09\nconst tflite::Model* model = tflite::GetModel(model_data);\n\n// \u5206\u914d\u56fa\u5b9a\u5185\u5b58\u7f13\u51b2\u533a\uff08\u65e0malloc\uff01\uff09\nconstexpr int kArenaSize = 10 * 1024;  // 10 KB\nuint8_t tensor_arena[kArenaSize];\n\n// \u8bbe\u7f6e\u89e3\u91ca\u5668\ntflite::MicroInterpreter interpreter(model, resolver, tensor_arena, kArenaSize);\ninterpreter.AllocateTensors();\n\n// \u8bbe\u7f6e\u8f93\u5165\nfloat* input = interpreter.input(0)-&gt;data.f;\ninput[0] = sensor_reading;\n\n// \u8fd0\u884c\u63a8\u7406\ninterpreter.Invoke();\n\n// \u8bfb\u53d6\u8f93\u51fa\nfloat* output = interpreter.output(0)-&gt;data.f;\nif (output[0] &gt; 0.8f) {\n    trigger_alert();\n}\n</code></pre> <ul> <li>\u6b64\u4ee3\u7801\u4e2d\u7684\u5173\u952e\u7ea6\u675f\uff1a<ul> <li><code>tensor_arena</code> \u662f\u9759\u6001\u5206\u914d\u7684\u2014\u2014\u6ca1\u6709 <code>malloc</code>\uff0c\u6ca1\u6709\u5806\u3002\u5d4c\u5165\u5f0f\u7cfb\u7edf\u901a\u5e38\u6ca1\u6709\u52a8\u6001\u5185\u5b58\u5206\u914d\u5668\u3002</li> <li>\u6a21\u578b\u662f\u4e00\u4e2a <code>const</code> \u5b57\u8282\u6570\u7ec4\uff0c\u5b58\u50a8\u5728\u95ea\u5b58\uff08ROM\uff09\u4e2d\uff0c\u800c\u975e\u4ece\u6587\u4ef6\u7cfb\u7edf\u52a0\u8f7d\u3002</li> <li>\u6574\u4e2a\u6846\u67b6+\u6a21\u578b+\u8fd0\u884c\u65f6\u9002\u5408\u51e0\u5341KB\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/06.%20RISC-V%20and%20embedded%20systems/#_1","title":"\u8fb9\u7f18\u6a21\u578b\u4f18\u5316","text":"<ul> <li> <p>\u8ba9\u6a21\u578b\u5728\u5fae\u63a7\u5236\u5668\u4e0a\u8fd0\u884c\u9700\u8981\u6fc0\u8fdb\u4f18\u5316\uff1a</p> <ul> <li> <p>\u91cf\u5316\uff08\u7b2c18\u7ae0\uff09\uff1a\u5c06float32\u6743\u91cd\u8f6c\u6362\u4e3aINT8\uff08\u5c0f4\u500d\uff0c\u5728\u7eaf\u6574\u6570\u786c\u4ef6\u4e0a\u5feb2-4\u500d\uff09\u3002\u8bad\u7ec3\u540e\u91cf\u5316\u7b80\u5355\uff1b\u91cf\u5316\u611f\u77e5\u8bad\u7ec3\u4fdd\u7559\u66f4\u591a\u7cbe\u5ea6\u3002</p> </li> <li> <p>\u526a\u679d\uff1a\u79fb\u9664\u63a5\u8fd1\u96f6\u7684\u6743\u91cd\u3002\u7ed3\u6784\u5316\u526a\u679d\uff08\u79fb\u9664\u6574\u4e2a\u901a\u9053/\u5934\uff09\u6bd4\u975e\u7ed3\u6784\u5316\u526a\u679d\uff08\u968f\u673a\u96f6\uff09\u5bf9\u786c\u4ef6\u66f4\u53cb\u597d\uff0c\u56e0\u4e3a\u5b83\u51cf\u5c11\u5b9e\u9645\u8ba1\u7b97\uff0c\u800c\u4e0d\u4ec5\u662f\u5b58\u50a8\u3002</p> </li> <li> <p>\u77e5\u8bc6\u84b8\u998f\uff08\u7b2c6\u7ae0\uff09\uff1a\u8bad\u7ec3\u4e00\u4e2a\u5c0f\u578b\"\u5b66\u751f\"\u6a21\u578b\u6765\u6a21\u4eff\u5927\u578b\"\u6559\u5e08\"\u6a21\u578b\u3002\u5b66\u751f\u6a21\u578b\u6bd4\u4ece\u5934\u8bad\u7ec3\u83b7\u5f97\u66f4\u9ad8\u7cbe\u5ea6\uff0c\u56e0\u4e3a\u5b83\u4ece\u6559\u5e08\u6a21\u578b\u7684\u8f6f\u9884\u6d4b\u4e2d\u5b66\u4e60\u3002</p> </li> <li> <p>\u795e\u7ecf\u67b6\u6784\u641c\u7d22\uff08NAS\uff09\uff1a\u81ea\u52a8\u641c\u7d22\u9002\u5408\u786c\u4ef6\u9884\u7b97\uff08\u5ef6\u8fdf\u3001\u5185\u5b58\u3001\u529f\u8017\uff09\u7684\u9ad8\u6548\u67b6\u6784\u3002MicroNets\u548cMCUNet\u4e3a\u7279\u5b9a\u5fae\u63a7\u5236\u5668\u5bfb\u627e\u4f18\u5316\u67b6\u6784\u3002</p> </li> <li> <p>\u7b97\u5b50\u878d\u5408\uff1a\u5c06\u5377\u79ef+\u6279\u5f52\u4e00\u5316+ReLU\u7ec4\u5408\u6210\u5355\u4e2a\u878d\u5408\u64cd\u4f5c\uff0c\u6d88\u9664\u4e2d\u95f4\u5185\u5b58\u5199\u5165\uff08\u4e0eGPU\u6838\u51fd\u6570\u878d\u5408\u540c\u4e00\u539f\u5219\uff0c\u4f46\u5728\u53ea\u6709256 KB RAM\u65f6\u66f4\u52a0\u5173\u952e\uff09\u3002</p> </li> </ul> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/06.%20RISC-V%20and%20embedded%20systems/#risc-vai","title":"RISC-V\u5728AI\u52a0\u901f\u5668\u4e2d\u7684\u5e94\u7528","text":"<ul> <li>\u8bb8\u591aAI\u52a0\u901f\u5668\u521d\u521b\u516c\u53f8\u4f7f\u7528RISC-V\u5e76\u975e\u76f4\u63a5\u8fd0\u884cML\u6a21\u578b\uff0c\u800c\u662f\u4f5c\u4e3a\u7ba1\u7406\u81ea\u5b9a\u4e49\u8ba1\u7b97\u5355\u5143\u7684\u63a7\u5236\u5904\u7406\u5668\uff1a</li> </ul> <pre><code>\u250c\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2510\n\u2502              AI\u52a0\u901f\u5668                    \u2502\n\u2502                                         \u2502\n\u2502  \u250c\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2510    \u250c\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2510   \u2502\n\u2502  \u2502  RISC-V  \u2502\u2500\u2500\u2500\u2192\u2502  \u81ea\u5b9a\u4e49\u77e9\u9635       \u2502   \u2502\n\u2502  \u2502  \u63a7\u5236     \u2502    \u2502  \u4e58\u6cd5\u5355\u5143         \u2502   \u2502\n\u2502  \u2502  \u6838\u5fc3     \u2502    \u2502 \uff08\u8109\u52a8\u9635\u5217\u3001      \u2502   \u2502\n\u2502  \u2502          \u2502    \u2502  \u81ea\u5b9a\u4e49\u6570\u636e\u6d41\uff09    \u2502   \u2502\n\u2502  \u2514\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2518    \u2514\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2518   \u2502\n\u2502       \u2502                    \u2502            \u2502\n\u2502       \u25bc                    \u25bc            \u2502\n\u2502  \u250c\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2510    \u250c\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2510   \u2502\n\u2502  \u2502  \u5185\u5b58     \u2502    \u2502  \u7247\u4e0aSRAM        \u2502   \u2502\n\u2502  \u2502  \u63a7\u5236     \u2502    \u2502 \uff08\u6fc0\u6d3b\u7f13\u51b2\uff09      \u2502   \u2502\n\u2502  \u2502          \u2502    \u2502                  \u2502   \u2502\n\u2502  \u2514\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2518    \u2514\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2518   \u2502\n\u2514\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2518\n</code></pre> <ul> <li> <p>RISC-V\u6838\u5fc3\u5904\u7406\uff1a\u4ece\u5916\u90e8\u5185\u5b58\u52a0\u8f7d\u6a21\u578b\u6743\u91cd\u3001\u8c03\u5ea6\u5c42\u6267\u884c\u3001\u7ba1\u7406\u8ba1\u7b97\u5355\u5143\u4e4b\u95f4\u7684\u6570\u636e\u6d41\u4ee5\u53ca\u4e0e\u4e3b\u673a\u901a\u4fe1\uff08\u901a\u8fc7PCIe\u3001USB\u6216SPI\uff09\u3002\u7e41\u91cd\u8ba1\u7b97\uff08\u77e9\u9635\u4e58\u6cd5\u3001\u5377\u79ef\uff09\u7531\u81ea\u5b9a\u4e49\u786c\u4ef6\u5b8c\u6210\uff0c\u800c\u975eRISC-V\u6838\u5fc3\u3002</p> </li> <li> <p>\u4e3a\u4ec0\u4e48\u7528RISC-V\u505a\u63a7\u5236\uff1a\u65e0\u9700\u8bb8\u53ef\u8d39\u7528\uff08\u5bf9\u521d\u521b\u516c\u53f8\u81f3\u5173\u91cd\u8981\uff09\u3001\u53ef\u5b9a\u5236\uff08\u6dfb\u52a0\u9886\u57df\u7279\u5b9a\u6307\u4ee4\uff09\u3001\u5c0f\u5360\u7528\u7a7a\u95f4\uff08\u63a7\u5236\u6838\u5fc3\u4e0d\u9700\u8981x86\u7684\u590d\u6742\u6027\uff09\uff0c\u4ee5\u53ca\u5f00\u653e\u751f\u6001\u7cfb\u7edf\u652f\u6301\u5feb\u901f\u539f\u578b\u5f00\u53d1\u3002</p> </li> <li> <p>\u793a\u4f8b\uff1aEsperanto Technologies\uff081000+\u4e2aRISC-V\u6838\u5fc3\u7528\u4e8eML\uff09\u3001Tenstorrent\uff08RISC-V\u63a7\u5236+\u81ea\u5b9a\u4e49tensix\u6838\u5fc3\uff09\u3001SiFive\uff08\u5e26\u5411\u91cf\u6269\u5c55\u7684RISC-V\u6838\u5fc3\u7528\u4e8e\u8fb9\u7f18ML\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/06.%20RISC-V%20and%20embedded%20systems/#_2","title":"\u8fb9\u7f18\u90e8\u7f72\u7ea6\u675f","text":"<ul> <li> <p>\u5728\u8fb9\u7f18\u90e8\u7f72ML\uff08\u8bbe\u5907\u7aef\uff0c\u800c\u975e\u4e91\u7aef\uff09\u5f15\u5165\u4e86\u4e91\u7aef\u90e8\u7f72\u4e0d\u9700\u8981\u7684\u7ea6\u675f\uff1a</p> </li> <li> <p>\u529f\u8017\uff1a\u7535\u6c60\u4f9b\u7535\u7684\u8bbe\u5907\u603b\u529f\u8017\u9884\u7b97\u53ef\u80fd\u4e3a100 mW\u3002\u8fd0\u884c\u6d88\u801750 mW\u7684\u6a21\u578b\u53ea\u7ed9\u7cfb\u7edf\u5176\u4f59\u90e8\u5206\uff08\u4f20\u611f\u5668\u3001\u65e0\u7ebf\u7535\u3001\u663e\u793a\u5668\uff09\u7559\u4e0b50 mW\u3002\u529f\u8017\u611f\u77e5\u63a8\u7406\u8c03\u5ea6\u8ba1\u7b97\u4ee5\u907f\u514d\u70ed\u964d\u9891\u5e76\u5ef6\u957f\u7535\u6c60\u5bff\u547d\u3002</p> </li> <li> <p>\u5ef6\u8fdf\uff1a\u8fb9\u7f18\u63a8\u7406\u901a\u5e38\u5fc5\u987b\u662f\u5b9e\u65f6\u7684\u3002\u5524\u9192\u8bcd\u68c0\u6d4b\u5668\uff08\"Hey Siri\"\uff09\u5fc5\u987b\u5728\u7ea6200 ms\u5185\u54cd\u5e94\u3002\u81ea\u52a8\u9a7e\u9a76\u611f\u77e5\u7cfb\u7edf\uff08\u7b2c11\u7ae0\uff09\u5fc5\u987b\u5728\u7ea630 ms\u5185\u5904\u7406\u5e27\u3002\u5230\u4e91\u7aef\u7684\u7f51\u7edc\u5f80\u8fd4\uff0850-200 ms\uff09\u5bf9\u8fd9\u4e9b\u7528\u4f8b\u6765\u8bf4\u592a\u6162\u4e86\u3002</p> </li> <li> <p>\u9690\u79c1\uff1a\u5728\u8bbe\u5907\u4e0a\u5904\u7406\u6570\u636e\u610f\u5473\u7740\u654f\u611f\u6570\u636e\uff08\u533b\u5b66\u56fe\u50cf\u3001\u8bed\u97f3\u8bb0\u5f55\u3001\u4e2a\u4eba\u7167\u7247\uff09\u6c38\u8fdc\u4e0d\u4f1a\u79bb\u5f00\u8bbe\u5907\u3002\u8fd9\u5728\u67d0\u4e9b\u53f8\u6cd5\u7ba1\u8f96\u533a\u662f\u6cd5\u5f8b\u8981\u6c42\uff08GDPR\uff09\uff0c\u5728\u6240\u6709\u5730\u65b9\u90fd\u662f\u7528\u6237\u4fe1\u4efb\u7684\u8981\u6c42\u3002</p> </li> <li> <p>\u8fde\u63a5\u6027\uff1a\u8fb9\u7f18\u8bbe\u5907\u53ef\u80fd\u95f4\u6b47\u6027\u6216\u5b8c\u5168\u6ca1\u6709\u4e92\u8054\u7f51\u8fde\u63a5\u3002\u5728\u706b\u661f\u8f66\uff08\u7b2c11\u7ae0\uff09\u3001\u6f5c\u8247\u6216\u519c\u6751\u519c\u7530\u4f20\u611f\u5668\u4e0a\u8fd0\u884c\u7684\u6a21\u578b\u5fc5\u987b\u5b8c\u5168\u79bb\u7ebf\u5de5\u4f5c\u3002</p> </li> <li> <p>\u89c4\u6a21\u6210\u672c\uff1a\u5c06ML\u90e8\u7f72\u5230\u5341\u4ebf\u90e8\u667a\u80fd\u624b\u673a\u6bcf\u53f0\u6210\u672c\u4e3a$0\uff08\u786c\u4ef6\u5df2\u7ecf\u5b58\u5728\uff09\u3002\u5c06ML\u90e8\u7f72\u5230\u5341\u4ebf\u4e2aIoT\u4f20\u611f\u5668\u610f\u5473\u7740\u6bcf\u4e2a\u4f20\u611f\u5668\u7684ML\u786c\u4ef6\u9884\u7b97\u53ea\u6709\u51e0\u5206\u94b1\u3002RISC-V\u7684\u96f6\u8bb8\u53ef\u6210\u672c\u5728\u8fd9\u4e2a\u89c4\u6a21\u4e0b\u610f\u4e49\u91cd\u5927\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/06.%20RISC-V%20and%20embedded%20systems/#griscv64-gcc","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u7528g++\u6216riscv64-gcc\u4ea4\u53c9\u7f16\u8bd1\u5668\u7f16\u8bd1\uff09","text":"<ol> <li> <p>\u7f16\u5199\u4e00\u4e2aC\u7a0b\u5e8f\uff0c\u6a21\u62dfTinyML\u63a8\u7406\u6d41\u6c34\u7ebf\uff1a\u9759\u6001\u5206\u914d\u6a21\u578b\u7f13\u51b2\u533a\uff0c\u8fd0\u884c\u6a21\u62df\u524d\u5411\u4f20\u64ad\uff0c\u5e76\u6d4b\u91cf\u8d44\u6e90\u4f7f\u7528\u3002\u8fd9\u6559\u6388\u5d4c\u5165\u5f0f\u7ea6\u675f\uff08\u65e0malloc\u3001\u56fa\u5b9a\u5185\u5b58\u7f13\u51b2\u533a\uff09\u3002 <pre><code>// task1_tinyml_sim.cpp\n// \u7f16\u8bd1\uff1ag++ -O2 -o task1 task1_tinyml_sim.cpp\n\n#include &lt;iostream&gt;\n#include &lt;chrono&gt;\n#include &lt;cmath&gt;\n#include &lt;cstring&gt;\n\n// \u6a21\u62df\u5fae\u63a7\u5236\u5668\uff1a\u56fa\u5b9a\u5185\u5b58\u7f13\u51b2\u533a\uff0c\u65e0\u52a8\u6001\u5206\u914d\nstatic constexpr int ARENA_SIZE = 32 * 1024;  // 32 KB\u603bRAM\u9884\u7b97\nstatic uint8_t arena[ARENA_SIZE];\n\n// \u7b80\u5355\u76842\u5c42MLP\uff1a784 -&gt; 64 -&gt; 10\uff08\u7c7b\u4f3cMNIST\uff0cINT8\u6743\u91cd\uff09\nstruct TinyModel {\n    int8_t w1[784 * 64];      // \u5c421\u6743\u91cd\uff1a50,176\u5b57\u8282\n    int8_t b1[64];             // \u5c421\u504f\u7f6e\n    int8_t w2[64 * 10];       // \u5c422\u6743\u91cd\uff1a640\u5b57\u8282\n    int8_t b2[10];             // \u5c422\u504f\u7f6e\n    // \u603b\u8ba1\uff1a\u7ea651 KB \u2192 \u5fc5\u987b\u653e\u5728\u95ea\u5b58\uff08ROM\uff09\uff0c\u800c\u975eRAM\n};\n\n// \u68c0\u67e5\u6a21\u578b\u662f\u5426\u9002\u5408\u95ea\u5b58\nvoid check_model_fit(int flash_kb) {\n    int model_bytes = sizeof(TinyModel);\n    std::cout &lt;&lt; \"\u6a21\u578b\u5927\u5c0f: \" &lt;&lt; model_bytes &lt;&lt; \" \u5b57\u8282\uff08\"\n              &lt;&lt; model_bytes / 1024 &lt;&lt; \" KB\uff09\\n\";\n    std::cout &lt;&lt; \"\u95ea\u5b58: \" &lt;&lt; flash_kb &lt;&lt; \" KB \u2192 \"\n              &lt;&lt; (model_bytes &lt;= flash_kb * 1024 ? \"\u9002\u5408\" : \"\u592a\u5927\") &lt;&lt; \"\\n\";\n}\n\n// \u4f7f\u7528\u56fa\u5b9a\u7f13\u51b2\u533a\u8fdb\u884c\u6fc0\u6d3b\u7684\u6a21\u62df\u63a8\u7406\nvoid mock_inference(const int8_t* input, int8_t* output) {\n    // \u6fc0\u6d3b\u503c\u653e\u5728\u7f13\u51b2\u533a\uff08RAM\uff09\u4e2d\uff0c\u800c\u975e\u52a8\u6001\u5206\u914d\n    int8_t* act1 = (int8_t*)arena;            // \u5c421\u8f93\u51fa64\u5b57\u8282\n    int8_t* act2 = (int8_t*)(arena + 64);     // \u5c422\u8f93\u51fa10\u5b57\u8282\n\n    // \u5c421\uff1a\u7b80\u5316\u7248\u77e9\u9635\u4e58\u6cd5\uff08\u4e0d\u662f\u771f\u6b63\u7684\u91cf\u5316\u77e9\u9635\u4e58\u6cd5\uff0c\u4ec5\u7ed3\u6784\u6f14\u793a\uff09\n    for (int j = 0; j &lt; 64; j++) {\n        int32_t sum = 0;  // \u7528int32\u7d2f\u52a0\u907f\u514d\u6ea2\u51fa\n        for (int i = 0; i &lt; 784; i++) {\n            sum += (int32_t)input[i] * 1;  // \u6a21\u62df\uff1a\u6743\u91cd=1\n        }\n        act1[j] = (int8_t)std::max(-128, std::min(127, sum / 784));  // \u91cf\u5316\u56de\n        act1[j] = act1[j] &gt; 0 ? act1[j] : 0;  // ReLU\n    }\n\n    // \u5c422\n    for (int j = 0; j &lt; 10; j++) {\n        int32_t sum = 0;\n        for (int i = 0; i &lt; 64; i++) {\n            sum += (int32_t)act1[i] * 1;\n        }\n        act2[j] = (int8_t)std::max(-128, std::min(127, sum / 64));\n    }\n\n    std::memcpy(output, act2, 10);\n}\n\nint main() {\n    std::cout &lt;&lt; \"=== TinyML\u8d44\u6e90\u9884\u7b97 ===\\n\";\n    std::cout &lt;&lt; \"\u7f13\u51b2\u533a\uff08RAM\uff09: \" &lt;&lt; ARENA_SIZE &lt;&lt; \" \u5b57\u8282\uff08\"\n              &lt;&lt; ARENA_SIZE / 1024 &lt;&lt; \" KB\uff09\\n\";\n    check_model_fit(256);  // \u5178\u578bMCU\u95ea\u5b58\n\n    // \u6fc0\u6d3b\u5185\u5b58\u4f7f\u7528\n    int activation_bytes = 64 + 10;  // \u5c421 + \u5c422\u8f93\u51fa\n    std::cout &lt;&lt; \"\u6fc0\u6d3b\u5185\u5b58: \" &lt;&lt; activation_bytes\n              &lt;&lt; \" \u5b57\u8282 / \" &lt;&lt; ARENA_SIZE &lt;&lt; \" \u53ef\u7528\\n\\n\";\n\n    // \u57fa\u51c6\u6d4b\u8bd5\u63a8\u7406\n    int8_t input[784];\n    int8_t output[10];\n    std::memset(input, 1, 784);\n\n    auto start = std::chrono::high_resolution_clock::now();\n    for (int i = 0; i &lt; 10000; i++) {\n        mock_inference(input, output);\n    }\n    auto end = std::chrono::high_resolution_clock::now();\n    double us = std::chrono::duration&lt;double, std::micro&gt;(end - start).count() / 10000;\n\n    std::cout &lt;&lt; \"\u63a8\u7406\u5ef6\u8fdf: \" &lt;&lt; us &lt;&lt; \" us\\n\";\n    std::cout &lt;&lt; \"\u5728160 MHz MCU\uff08\u7ea66.25 ns/\u5468\u671f\uff09\u4e0b\uff1a\u7ea6\"\n              &lt;&lt; (int)(us * 160) &lt;&lt; \" \u5468\u671f\\n\";\n\n    std::cout &lt;&lt; \"\u8f93\u51falogits: \";\n    for (int i = 0; i &lt; 10; i++) std::cout &lt;&lt; (int)output[i] &lt;&lt; \" \";\n    std::cout &lt;&lt; \"\\n\";\n\n    return 0;\n}\n</code></pre></p> </li> <li> <p>\u7f16\u5199\u4e00\u4e2aC++\u7a0b\u5e8f\uff0c\u5c06float32\u6743\u91cd\u91cf\u5316\u4e3aINT8\uff0c\u5e76\u6d4b\u91cf\u538b\u7f29\u6bd4\u548c\u91cf\u5316\u8bef\u5dee\u3002 <pre><code>// task2_quantise.cpp\n// \u7f16\u8bd1\uff1ag++ -O3 -o task2 task2_quantise.cpp\n\n#include &lt;iostream&gt;\n#include &lt;vector&gt;\n#include &lt;cmath&gt;\n#include &lt;algorithm&gt;\n#include &lt;numeric&gt;\n\n// \u5bf9\u79f0\u91cf\u5316\uff1a\u5c06\u6d6e\u70b9\u8303\u56f4 [-max, +max] \u6620\u5c04\u5230 [-127, +127]\nvoid quantise_symmetric(const float* input, int8_t* output, int n, float&amp; scale) {\n    float max_val = 0.0f;\n    for (int i = 0; i &lt; n; i++) {\n        max_val = std::max(max_val, std::abs(input[i]));\n    }\n    scale = max_val / 127.0f;\n    for (int i = 0; i &lt; n; i++) {\n        float scaled = input[i] / scale;\n        output[i] = (int8_t)std::max(-127.0f, std::min(127.0f, std::round(scaled)));\n    }\n}\n\n// \u53cd\u91cf\u5316\uff1aINT8\u8f6c\u56defloat\nvoid dequantise(const int8_t* input, float* output, int n, float scale) {\n    for (int i = 0; i &lt; n; i++) {\n        output[i] = (float)input[i] * scale;\n    }\n}\n\nint main() {\n    const int N = 100000;\n\n    // \u6a21\u62df\u968f\u673a\u6743\u91cd\uff08\u5927\u81f4\u6b63\u6001\u5206\u5e03\uff09\n    std::vector&lt;float&gt; weights(N);\n    for (int i = 0; i &lt; N; i++) {\n        // \u7b80\u5355\u7684\u4f2a\u968f\u673a\u6b63\u6001\u503c\n        float u1 = (float)(i * 7 % 997 + 1) / 998.0f;\n        float u2 = (float)(i * 13 % 991 + 1) / 992.0f;\n        weights[i] = std::sqrt(-2.0f * std::log(u1)) * std::cos(6.2832f * u2) * 0.1f;\n    }\n\n    // \u91cf\u5316\n    std::vector&lt;int8_t&gt; quantised(N);\n    float scale;\n    quantise_symmetric(weights.data(), quantised.data(), N, scale);\n\n    // \u53cd\u91cf\u5316\u5e76\u6d4b\u91cf\u8bef\u5dee\n    std::vector&lt;float&gt; reconstructed(N);\n    dequantise(quantised.data(), reconstructed.data(), N, scale);\n\n    float max_error = 0.0f, total_error = 0.0f;\n    for (int i = 0; i &lt; N; i++) {\n        float err = std::abs(weights[i] - reconstructed[i]);\n        max_error = std::max(max_error, err);\n        total_error += err;\n    }\n\n    std::cout &lt;&lt; \"=== \u91cf\u5316\u7ed3\u679c ===\\n\";\n    std::cout &lt;&lt; \"\u539f\u59cb:    \" &lt;&lt; N * 4 &lt;&lt; \" \u5b57\u8282\uff08float32\uff09\\n\";\n    std::cout &lt;&lt; \"\u91cf\u5316:   \" &lt;&lt; N * 1 &lt;&lt; \" \u5b57\u8282\uff08int8\uff09+ 4 \u5b57\u8282\uff08\u7f29\u653e\u56e0\u5b50\uff09\\n\";\n    std::cout &lt;&lt; \"\u538b\u7f29\u6bd4: \" &lt;&lt; 4.0f &lt;&lt; \"x\\n\";\n    std::cout &lt;&lt; \"\u7f29\u653e\u56e0\u5b50: \" &lt;&lt; scale &lt;&lt; \"\\n\";\n    std::cout &lt;&lt; \"\u5e73\u5747\u7edd\u5bf9\u8bef\u5dee: \" &lt;&lt; total_error / N &lt;&lt; \"\\n\";\n    std::cout &lt;&lt; \"\u6700\u5927\u7edd\u5bf9\u8bef\u5dee:  \" &lt;&lt; max_error &lt;&lt; \"\\n\";\n    std::cout &lt;&lt; \"\u6700\u5927\u7edd\u5bf9\u8bef\u5dee/\u7f29\u653e\u56e0\u5b50: \" &lt;&lt; max_error / scale\n              &lt;&lt; \"\uff08\u5e94 &lt;= 0.5 \u91cf\u5316\u7ea7\u522b\uff09\\n\";\n\n    return 0;\n}\n</code></pre></p> </li> <li> <p>\u7f16\u5199\u4e00\u4e2aC++\u7a0b\u5e8f\uff0c\u6267\u884cINT8\u77e9\u9635\u4e58\u6cd5\uff08INT32\u7d2f\u52a0\uff09\u2014\u2014\u8fd9\u662f\u5728\u5d4c\u5165\u5f0fML\u52a0\u901f\u5668\u4e0a\u8fd0\u884c\u7684\u5b9e\u9645\u8ba1\u7b97\u3002 <pre><code>// task3_int8_matmul.cpp\n// \u7f16\u8bd1\uff1ag++ -O3 -o task3 task3_int8_matmul.cpp\n\n#include &lt;iostream&gt;\n#include &lt;chrono&gt;\n#include &lt;vector&gt;\n#include &lt;cstdint&gt;\n\n// INT8\u77e9\u9635\u4e58\u6cd5\uff08INT32\u7d2f\u52a0\uff09\u2014\u2014\u5f20\u91cf\u6838\u5fc3\u548cMCU\u52a0\u901f\u5668\u7684\u5b9e\u9645\u5de5\u4f5c\u65b9\u5f0f\nvoid matmul_int8(const int8_t* A, const int8_t* B, int32_t* C,\n                 int M, int N, int K) {\n    for (int i = 0; i &lt; M; i++) {\n        for (int j = 0; j &lt; N; j++) {\n            int32_t sum = 0;\n            for (int k = 0; k &lt; K; k++) {\n                sum += (int32_t)A[i * K + k] * (int32_t)B[k * N + j];\n            }\n            C[i * N + j] = sum;\n        }\n    }\n}\n\n// \u7528\u4e8e\u6bd4\u8f83\u7684Float32\u77e9\u9635\u4e58\u6cd5\nvoid matmul_f32(const float* A, const float* B, float* C,\n                int M, int N, int K) {\n    for (int i = 0; i &lt; M; i++) {\n        for (int j = 0; j &lt; N; j++) {\n            float sum = 0.0f;\n            for (int k = 0; k &lt; K; k++) {\n                sum += A[i * K + k] * B[k * N + j];\n            }\n            C[i * N + j] = sum;\n        }\n    }\n}\n\nint main() {\n    const int M = 128, N = 128, K = 128;\n\n    std::vector&lt;int8_t&gt; A_i8(M * K, 1), B_i8(K * N, 1);\n    std::vector&lt;int32_t&gt; C_i32(M * N);\n\n    std::vector&lt;float&gt; A_f32(M * K, 1.0f), B_f32(K * N, 1.0f);\n    std::vector&lt;float&gt; C_f32(M * N);\n\n    // \u57fa\u51c6\u6d4b\u8bd5INT8\n    auto start = std::chrono::high_resolution_clock::now();\n    for (int t = 0; t &lt; 100; t++) {\n        matmul_int8(A_i8.data(), B_i8.data(), C_i32.data(), M, N, K);\n    }\n    auto end = std::chrono::high_resolution_clock::now();\n    double i8_ms = std::chrono::duration&lt;double, std::milli&gt;(end - start).count() / 100;\n\n    // \u57fa\u51c6\u6d4b\u8bd5FP32\n    start = std::chrono::high_resolution_clock::now();\n    for (int t = 0; t &lt; 100; t++) {\n        matmul_f32(A_f32.data(), B_f32.data(), C_f32.data(), M, N, K);\n    }\n    end = std::chrono::high_resolution_clock::now();\n    double f32_ms = std::chrono::duration&lt;double, std::milli&gt;(end - start).count() / 100;\n\n    double gops_i8 = 2.0 * M * N * K / i8_ms / 1e6;\n    double gflops_f32 = 2.0 * M * N * K / f32_ms / 1e6;\n\n    std::cout &lt;&lt; \"INT8\u77e9\u9635\u4e58\u6cd5:  \" &lt;&lt; i8_ms &lt;&lt; \" ms\uff08\" &lt;&lt; gops_i8 &lt;&lt; \" GOPS\uff09\\n\";\n    std::cout &lt;&lt; \"FP32\u77e9\u9635\u4e58\u6cd5:  \" &lt;&lt; f32_ms &lt;&lt; \" ms\uff08\" &lt;&lt; gflops_f32 &lt;&lt; \" GFLOPS\uff09\\n\";\n    std::cout &lt;&lt; \"INT8\u52a0\u901f\u6bd4: \" &lt;&lt; f32_ms / i8_ms &lt;&lt; \"x\\n\";\n    std::cout &lt;&lt; \"\u5185\u5b58: INT8 = \" &lt;&lt; M*K + K*N &lt;&lt; \" \u5b57\u8282 vs FP32 = \"\n              &lt;&lt; (M*K + K*N) * 4 &lt;&lt; \" \u5b57\u8282\uff08\u5c0f4\u500d\uff09\\n\";\n\n    return 0;\n}\n</code></pre></p> </li> </ol>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/07.%20vulkan%20compute%20and%20cross-platform%20GPU/","title":"Vulkan Compute \u4e0e\u8de8\u5e73\u53f0 GPU","text":"<p>Vulkan \u662f\u552f\u4e00\u80fd\u5728\u6240\u6709\u4e3b\u8981\u5e73\u53f0\u4e0a\u8fd0\u884c\u7684 GPU \u8ba1\u7b97 API\uff1aNVIDIA\u3001AMD\u3001Intel\u3001Apple\uff08\u901a\u8fc7 MoltenVK\uff09\u3001Android\uff0c\u751a\u81f3\u6d4f\u89c8\u5668\uff08\u901a\u8fc7 WebGPU\uff09\u3002\u672c\u6587\u6db5\u76d6 Vulkan \u67b6\u6784\u3001\u8ba1\u7b97\u7ba1\u7ebf\u3001\u4f7f\u7528 GLSL \u7f16\u5199\u8ba1\u7b97\u7740\u8272\u5668\u3001GPU \u8ba1\u7b97\u7a0b\u5e8f\u7684\u5b8c\u6574 C++ \u8bbe\u7f6e\u3001\u5171\u4eab\u5185\u5b58\u4e0e\u540c\u6b65\u3001\u7528\u4e8e\u6d4f\u89c8\u5668\u7684 WebGPU\uff0c\u4ee5\u53ca\u5b9e\u9645\u7684\u673a\u5668\u5b66\u4e60\u63a8\u7406\u793a\u4f8b\u3002</p> <ul> <li> <p>CUDA \u5728 NVIDIA \u786c\u4ef6\u4e0a\u4e3b\u5bfc\u7740 ML \u8bad\u7ec3\u3002\u4f46\u5e76\u975e\u6bcf\u4e2a\u90e8\u7f72\u76ee\u6807\u90fd\u6709 NVIDIA GPU\u3002\u79fb\u52a8\u5e94\u7528\u8fd0\u884c\u5728 Qualcomm Adreno \u6216 ARM Mali GPU \u4e0a\u3002Web \u5e94\u7528\u8fd0\u884c\u5728\u6d4f\u89c8\u5668\u4e2d\u3002\u6e38\u620f\u5f15\u64ce\u9700\u8981\u540c\u65f6\u652f\u6301 AMD\u3001Intel \u548c NVIDIA\u3002\u5bf9\u4e8e\u6240\u6709\u8fd9\u4e9b\u573a\u666f\uff0cVulkan \u5c31\u662f\u7b54\u6848\u3002</p> </li> <li> <p>Vulkan \u5f88\u5197\u957f\u2014\u2014\u4e00\u4e2a\"hello world\"\u8ba1\u7b97\u7a0b\u5e8f\u5927\u7ea6\u6709 300 \u884c C++ \u4ee3\u7801\u3002\u4f46\u8fd9\u79cd\u5197\u957f\u662f \u663e\u5f0f\u63a7\u5236 \u7684\u4ee3\u4ef7\uff1a\u4f60\u9700\u8981\u81ea\u5df1\u7ba1\u7406\u6bcf\u4e00\u4e2a GPU \u8d44\u6e90\uff08\u5185\u5b58\u3001\u7ba1\u7ebf\u3001\u547d\u4ee4\u7f13\u51b2\u533a\uff09\u3002\u8fd9\u79cd\u63a7\u5236\u5e26\u6765\u4e86\u6700\u5927\u6027\u80fd\u548c\u53ef\u79fb\u690d\u6027\uff0c\u4ee3\u4ef7\u662f\u5f00\u53d1\u901f\u5ea6\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/07.%20vulkan%20compute%20and%20cross-platform%20GPU/#vulkan","title":"Vulkan \u67b6\u6784\u6982\u8ff0","text":"<ul> <li> <p>Vulkan \u662f\u7531 Khronos Group\uff08OpenGL \u80cc\u540e\u7684\u540c\u4e00\u7ec4\u7ec7\uff09\u521b\u5efa\u7684\u4f4e\u7ea7 GPU API\u3002\u4e0e CUDA\uff08\u5b83\u9690\u85cf\u4e86 GPU \u8d44\u6e90\u7ba1\u7406\uff09\u4e0d\u540c\uff0cVulkan \u8981\u6c42\u4f60\u663e\u5f0f\u5730\u7ba1\u7406\uff1a</p> <ul> <li>\u5b9e\u4f8b\u4e0e\u8bbe\u5907\uff1a\u521b\u5efa Vulkan \u5b9e\u4f8b\uff0c\u679a\u4e3e\u53ef\u7528 GPU\uff0c\u5e76\u9009\u62e9\u4e00\u4e2a\u3002</li> <li>\u5185\u5b58\uff1a\u663e\u5f0f\u5206\u914d GPU \u5185\u5b58\uff0c\u6307\u5b9a\u5185\u5b58\u7c7b\u578b\uff08\u8bbe\u5907\u672c\u5730\u5185\u5b58\u7528\u4e8e\u901f\u5ea6\uff0c\u4e3b\u673a\u53ef\u89c1\u5185\u5b58\u7528\u4e8e CPU \u8bbf\u95ee\uff09\u3002</li> <li>\u7f13\u51b2\u533a\uff1a\u521b\u5efa\u5f15\u7528\u5df2\u5206\u914d\u5185\u5b58\u7684\u7f13\u51b2\u533a\u5bf9\u8c61\u3002</li> <li>\u63cf\u8ff0\u7b26\u96c6\uff1a\u5c06\u7f13\u51b2\u533a\u7ed1\u5b9a\u5230\u7740\u8272\u5668\u8f93\u5165\uff08\u7c7b\u4f3c\u4e8e\u8ba1\u7b97\u7740\u8272\u5668\u7684\u51fd\u6570\u53c2\u6570\uff09\u3002</li> <li>\u8ba1\u7b97\u7ba1\u7ebf\uff1a\u7f16\u8bd1\u7740\u8272\u5668\u5e76\u521b\u5efa\u7ba1\u7ebf\u5bf9\u8c61\u3002</li> <li>\u547d\u4ee4\u7f13\u51b2\u533a\uff1a\u8bb0\u5f55\u4e00\u7cfb\u5217 GPU \u547d\u4ee4\uff08\u7ed1\u5b9a\u7ba1\u7ebf\u3001\u7ed1\u5b9a\u63cf\u8ff0\u7b26\u3001\u8c03\u5ea6\u8ba1\u7b97\uff09\u3002</li> <li>\u961f\u5217\u63d0\u4ea4\uff1a\u5c06\u547d\u4ee4\u7f13\u51b2\u533a\u63d0\u4ea4\u7ed9 GPU \u6267\u884c\u3002</li> <li>\u540c\u6b65\uff1a\u4f7f\u7528\u6805\u680f\u548c\u5c4f\u969c\u786e\u4fdd\u6b63\u786e\u7684\u6267\u884c\u987a\u5e8f\u3002</li> </ul> </li> <li> <p>\u8fd9\u4e0e CUDA \u7684 <code>cudaMalloc</code> + \u5185\u6838\u542f\u52a8\u6a21\u578b\u622a\u7136\u4e0d\u540c\u3002\u5728 CUDA \u4e2d\uff0c\u9a71\u52a8\u7a0b\u5e8f\u5728\u5e55\u540e\u5904\u7406\u5927\u90e8\u5206\u5de5\u4f5c\u3002\u5728 Vulkan \u4e2d\uff0c\u4f60\u9700\u8981\u81ea\u5df1\u505a\u8fd9\u4e00\u5207\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/07.%20vulkan%20compute%20and%20cross-platform%20GPU/#_1","title":"\u4e3a\u4ec0\u4e48\u5982\u6b64\u5197\u957f\uff1f","text":"<ul> <li> <p>Vulkan \u7684\u663e\u5f0f\u6027\u5b58\u5728\u6709\u4e24\u65b9\u9762\u539f\u56e0\uff1a</p> <ol> <li> <p>\u9a71\u52a8\u7b80\u5316\uff1aOpenGL \u9a71\u52a8\u6781\u5176\u590d\u6742\uff08\u5b83\u4eec\u5fc5\u987b\u731c\u6d4b\u5e94\u7528\u7a0b\u5e8f\u7684\u610f\u56fe\u5e76\u8fdb\u884c\u76f8\u5e94\u4f18\u5316\uff09\u3002Vulkan \u5c06\u8be5\u8d23\u4efb\u8f6c\u79fb\u7ed9\u5e94\u7528\u7a0b\u5e8f\uff0c\u4f7f\u9a71\u52a8\u66f4\u7cbe\u7b80\u3001\u66f4\u53ef\u9884\u6d4b\uff0c\u5e76\u4e14\u66f4\u5bb9\u6613\u5728\u5404\u5382\u5546\u95f4\u6b63\u786e\u5b9e\u73b0\u3002</p> </li> <li> <p>\u6027\u80fd\uff1a\u5bf9\u5185\u5b58\u5e03\u5c40\u3001\u540c\u6b65\u548c\u547d\u4ee4\u6279\u5904\u7406\u7684\u663e\u5f0f\u63a7\u5236\u4f7f\u5e94\u7528\u7a0b\u5e8f\u80fd\u591f\u505a\u51fa\u6700\u4f18\u51b3\u7b56\u3002\u5728 CUDA \u4e2d\uff0c\u9a71\u52a8\u53ef\u80fd\u4f1a\u63d2\u5165\u4e0d\u5fc5\u8981\u7684\u540c\u6b65\u3002\u5728 Vulkan \u4e2d\uff0c\u4f60\u53ea\u5728\u9700\u8981\u65f6\u624d\u8fdb\u884c\u540c\u6b65\u3002</p> </li> </ol> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/07.%20vulkan%20compute%20and%20cross-platform%20GPU/#glsl","title":"GLSL \u4e2d\u7684\u8ba1\u7b97\u7740\u8272\u5668","text":"<ul> <li>\u8ba1\u7b97\u7740\u8272\u5668 \u662f\u5728 GPU \u4e0a\u8fd0\u884c\u7684\u7a0b\u5e8f\uff0c\u7c7b\u4f3c\u4e8e CUDA \u5185\u6838\u3002\u5b83\u4f7f\u7528 GLSL\uff08OpenGL \u7740\u8272\u8bed\u8a00\uff09\u7f16\u5199\uff0c\u5e76\u7f16\u8bd1\u4e3a SPIR-V \u5b57\u8282\u7801\uff08\u4e00\u79cd\u53ef\u79fb\u690d\u7684\u4e8c\u8fdb\u5236\u683c\u5f0f\uff09\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/07.%20vulkan%20compute%20and%20cross-platform%20GPU/#_2","title":"\u5411\u91cf\u52a0\u6cd5","text":"<pre><code>// add.comp \u2014 \u7f16\u8bd1\u547d\u4ee4: glslangValidator -V add.comp -o add.spv\n#version 450\n\n// \u5de5\u4f5c\u7ec4\u5927\u5c0f\uff1a\u6bcf\u4e2a\u5de5\u4f5c\u7ec4\u6709 256 \u4e2a\u8c03\u7528\uff08= CUDA \u4e2d\u6bcf\u5757\u7684\u7ebf\u7a0b\u6570\uff09\nlayout(local_size_x = 256) in;\n\n// \u7f13\u51b2\u533a\u7ed1\u5b9a\uff08\u7c7b\u4f3c\u4e8e\u5185\u6838\u53c2\u6570\uff09\nlayout(set = 0, binding = 0) buffer InputA { float a[]; };\nlayout(set = 0, binding = 1) buffer InputB { float b[]; };\nlayout(set = 0, binding = 2) buffer Output { float c[]; };\n\n// \u63a8\u9001\u5e38\u91cf\uff1a\u5c0f\u7684\u7edf\u4e00\u6570\u636e\uff08\u7c7b\u4f3c\u4e8e\u5185\u6838\u53c2\u6570\uff09\nlayout(push_constant) uniform PushConstants {\n    uint n;  // \u5143\u7d20\u6570\u91cf\n};\n\nvoid main() {\n    uint idx = gl_GlobalInvocationID.x;  // \u5168\u5c40\u7ebf\u7a0b\u7d22\u5f15\n    if (idx &lt; n) {\n        c[idx] = a[idx] + b[idx];\n    }\n}\n</code></pre> <ul> <li>\u4e0e CUDA \u6982\u5ff5\u7684\u6620\u5c04\uff1a</li> </ul> Vulkan CUDA \u542b\u4e49 \u5de5\u4f5c\u7ec4 (Workgroup) \u5757 (Block) \u53ef\u4ee5\u5171\u4eab\u5185\u5b58\u7684\u7ebf\u7a0b\u7ec4 \u8c03\u7528 (Invocation) \u7ebf\u7a0b (Thread) \u5355\u4e2a\u6267\u884c\u5355\u5143 <code>gl_GlobalInvocationID</code> <code>blockIdx * blockDim + threadIdx</code> \u5168\u5c40\u7ebf\u7a0b\u7d22\u5f15 <code>gl_LocalInvocationID</code> <code>threadIdx</code> \u5de5\u4f5c\u7ec4\u5185\u7684\u7ebf\u7a0b\u7d22\u5f15 <code>gl_WorkGroupID</code> <code>blockIdx</code> \u5de5\u4f5c\u7ec4\u7d22\u5f15 <code>local_size_x</code> <code>blockDim.x</code> \u6bcf\u5de5\u4f5c\u7ec4\u7684\u7ebf\u7a0b\u6570 \u5b58\u50a8\u7f13\u51b2\u533a \u5168\u5c40\u5185\u5b58 \u53ef\u8bfb\u5199\u7684 GPU \u5185\u5b58 \u5171\u4eab\u5185\u5b58 (<code>shared</code>) <code>__shared__</code> \u6bcf\u5de5\u4f5c\u7ec4\u7684\u9ad8\u901f\u5185\u5b58 \u63a8\u9001\u5e38\u91cf \u5185\u6838\u53c2\u6570 \u5c0f\u7684\u7edf\u4e00\u6570\u636e"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/07.%20vulkan%20compute%20and%20cross-platform%20GPU/#relu","title":"\u4f7f\u7528\u5171\u4eab\u5185\u5b58\u7684 ReLU","text":"<pre><code>// relu_shared.comp\n#version 450\n\nlayout(local_size_x = 256) in;\n\nlayout(set = 0, binding = 0) buffer Input  { float input_data[]; };\nlayout(set = 0, binding = 1) buffer Output { float output_data[]; };\n\nlayout(push_constant) uniform PushConstants { uint n; };\n\n// \u5171\u4eab\u5185\u5b58\uff08\u7b49\u540c\u4e8e CUDA \u7684 __shared__\uff09\nshared float tile[256];\n\nvoid main() {\n    uint gid = gl_GlobalInvocationID.x;\n    uint lid = gl_LocalInvocationID.x;\n\n    // \u52a0\u8f7d\u5230\u5171\u4eab\u5185\u5b58\n    if (gid &lt; n) {\n        tile[lid] = input_data[gid];\n    }\n\n    // \u5c4f\u969c\uff1a\u7b49\u5f85\u5de5\u4f5c\u7ec4\u4e2d\u6240\u6709\u8c03\u7528\u5b8c\u6210\u52a0\u8f7d\n    barrier();  // \u7b49\u540c\u4e8e CUDA \u7684 __syncthreads()\n\n    // \u8ba1\u7b97 ReLU\n    if (gid &lt; n) {\n        output_data[gid] = max(tile[lid], 0.0);\n    }\n}\n</code></pre> <ul> <li>\u5bf9\u4e8e ReLU\uff0c\u5171\u4eab\u5185\u5b58\u5e76\u975e\u4e25\u683c\u5fc5\u8981\uff08\u8be5\u64cd\u4f5c\u662f\u6309\u5143\u7d20\u8fdb\u884c\u7684\uff09\u3002\u4f46\u8fd9\u6f14\u793a\u4e86\u57fa\u672c\u6a21\u5f0f\uff1a\u52a0\u8f7d\u5230\u5171\u4eab\u5185\u5b58 \u2192 \u5c4f\u969c \u2192 \u8ba1\u7b97 \u2192 \u5b58\u50a8\u3002\u5bf9\u4e8e\u9700\u8981\u76f8\u90bb\u7ebf\u7a0b\u6570\u636e\u7684\u64cd\u4f5c\uff08\u5377\u79ef\u3001\u5f52\u7ea6\u3001softmax\uff09\uff0c\u5171\u4eab\u5185\u5b58\u662f\u5fc5\u4e0d\u53ef\u5c11\u7684\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/07.%20vulkan%20compute%20and%20cross-platform%20GPU/#_3","title":"\u5e76\u884c\u5f52\u7ea6\uff08\u6c42\u548c\uff09","text":"<pre><code>// reduce_sum.comp\n#version 450\n\nlayout(local_size_x = 256) in;\n\nlayout(set = 0, binding = 0) buffer Input  { float input_data[]; };\nlayout(set = 0, binding = 1) buffer Output { float partial_sums[]; };\n\nlayout(push_constant) uniform PushConstants { uint n; };\n\nshared float sdata[256];\n\nvoid main() {\n    uint gid = gl_GlobalInvocationID.x;\n    uint lid = gl_LocalInvocationID.x;\n    uint wgid = gl_WorkGroupID.x;\n\n    // \u52a0\u8f7d\u5230\u5171\u4eab\u5185\u5b58\n    sdata[lid] = (gid &lt; n) ? input_data[gid] : 0.0;\n    barrier();\n\n    // \u5de5\u4f5c\u7ec4\u5185\u7684\u6811\u5f62\u5f52\u7ea6\n    for (uint stride = 128; stride &gt; 0; stride &gt;&gt;= 1) {\n        if (lid &lt; stride) {\n            sdata[lid] += sdata[lid + stride];\n        }\n        barrier();\n    }\n\n    // \u7ebf\u7a0b 0 \u5199\u5165\u5de5\u4f5c\u7ec4\u7684\u5c40\u90e8\u548c\n    if (lid == 0) {\n        partial_sums[wgid] = sdata[0];\n    }\n}\n</code></pre> <ul> <li>\u8fd9\u662f\u7ecf\u5178\u7684\u5e76\u884c\u5f52\u7ea6\u6a21\u5f0f\uff08\u4e0e CUDA \u76f8\u540c\uff09\u3002\u6bcf\u4e2a\u5de5\u4f5c\u7ec4\u4ea7\u751f\u4e00\u4e2a\u5c40\u90e8\u548c\u3002\u7b2c\u4e8c\u6b21\u8c03\u5ea6\u5c06\u8fd9\u4e9b\u5c40\u90e8\u548c\u5f52\u7ea6\u4e3a\u6700\u7ec8\u7ed3\u679c\u3002\u6811\u5f62\u5f52\u7ea6\u6bcf\u4e00\u6b65\u5c06\u6d3b\u8dc3\u7ebf\u7a0b\u51cf\u534a\uff1a256 \u2192 128 \u2192 64 \u2192 ... \u2192 1\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/07.%20vulkan%20compute%20and%20cross-platform%20GPU/#_4","title":"\u4f7f\u7528\u5206\u5757\u7684\u77e9\u9635\u4e58\u6cd5","text":"<pre><code>// matmul_tiled.comp\n#version 450\n\n#define TILE_SIZE 16\n\nlayout(local_size_x = TILE_SIZE, local_size_y = TILE_SIZE) in;\n\nlayout(set = 0, binding = 0) buffer MatA { float A[]; };\nlayout(set = 0, binding = 1) buffer MatB { float B[]; };\nlayout(set = 0, binding = 2) buffer MatC { float C[]; };\n\nlayout(push_constant) uniform PushConstants {\n    uint M, N, K;\n};\n\nshared float tileA[TILE_SIZE][TILE_SIZE];\nshared float tileB[TILE_SIZE][TILE_SIZE];\n\nvoid main() {\n    uint row = gl_GlobalInvocationID.y;\n    uint col = gl_GlobalInvocationID.x;\n    uint lr = gl_LocalInvocationID.y;\n    uint lc = gl_LocalInvocationID.x;\n\n    float sum = 0.0;\n\n    for (uint t = 0; t &lt; (K + TILE_SIZE - 1) / TILE_SIZE; t++) {\n        // \u5c06 A \u548c B \u7684\u5206\u5757\u52a0\u8f7d\u5230\u5171\u4eab\u5185\u5b58\u4e2d\n        uint aCol = t * TILE_SIZE + lc;\n        uint bRow = t * TILE_SIZE + lr;\n\n        tileA[lr][lc] = (row &lt; M &amp;&amp; aCol &lt; K) ? A[row * K + aCol] : 0.0;\n        tileB[lr][lc] = (bRow &lt; K &amp;&amp; col &lt; N) ? B[bRow * N + col] : 0.0;\n\n        barrier();\n\n        // \u8ba1\u7b97\u90e8\u5206\u70b9\u79ef\n        for (uint k = 0; k &lt; TILE_SIZE; k++) {\n            sum += tileA[lr][k] * tileB[k][lc];\n        }\n\n        barrier();\n    }\n\n    if (row &lt; M &amp;&amp; col &lt; N) {\n        C[row * N + col] = sum;\n    }\n}\n</code></pre> <ul> <li>\u8fd9\u4e0e CUDA \u7248\u672c\uff08\u6587\u4ef6 04\uff09\u4e2d\u7684\u5206\u5757\u7b97\u6cd5\u76f8\u540c\uff0c\u53ea\u662f\u7528\u4e86 GLSL \u8bed\u6cd5\u3002\u6982\u5ff5\u5b8c\u5168\u4e00\u6837\uff1a\u5c06\u5206\u5757\u52a0\u8f7d\u5230\u5171\u4eab\u5185\u5b58\uff0c\u5c4f\u969c\uff0c\u8ba1\u7b97\uff0c\u5c4f\u969c\uff0c\u91cd\u590d\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/07.%20vulkan%20compute%20and%20cross-platform%20GPU/#c-vulkan","title":"C++ Vulkan \u8bbe\u7f6e","text":"<ul> <li>\u8ba1\u7b97\u7740\u8272\u5668\u662f\u7b80\u5355\u7684\u90e8\u5206\u3002\u56f0\u96be\u7684\u90e8\u5206\u662f\u521b\u5efa Vulkan \u5b9e\u4f8b\u3001\u5206\u914d\u5185\u5b58\u3001\u7ed1\u5b9a\u7f13\u51b2\u533a\u548c\u63d0\u4ea4\u547d\u4ee4\u7684 C++ \u6837\u677f\u4ee3\u7801\u3002\u4ee5\u4e0b\u662f\u5b8c\u6574\u7ba1\u7ebf\u7684\u7cbe\u7b80\u7248\u672c\uff1a</li> </ul> <pre><code>// vulkan_compute.cpp \u2014 \u4e00\u4e2a\u6700\u5c0f\u4f46\u5b8c\u6574\u7684 Vulkan \u8ba1\u7b97\u793a\u4f8b\n// \u7f16\u8bd1\u547d\u4ee4: g++ -O3 -o vulkan_compute vulkan_compute.cpp -lvulkan\n// \u8981\u6c42: \u5df2\u5b89\u88c5 Vulkan SDK\uff0c\u5df2\u4ece add.comp \u7f16\u8bd1 add.spv\n\n#include &lt;vulkan/vulkan.h&gt;\n#include &lt;iostream&gt;\n#include &lt;vector&gt;\n#include &lt;fstream&gt;\n#include &lt;cassert&gt;\n\n// \u8f85\u52a9\u51fd\u6570\uff1a\u8bfb\u53d6 SPIR-V \u6587\u4ef6\nstd::vector&lt;uint32_t&gt; readSPIRV(const std::string&amp; filename) {\n    std::ifstream file(filename, std::ios::ate | std::ios::binary);\n    size_t fileSize = file.tellg();\n    std::vector&lt;uint32_t&gt; buffer(fileSize / sizeof(uint32_t));\n    file.seekg(0);\n    file.read(reinterpret_cast&lt;char*&gt;(buffer.data()), fileSize);\n    return buffer;\n}\n\nint main() {\n    const uint32_t N = 1024;\n    const size_t bufferSize = N * sizeof(float);\n\n    // ========== 1. \u521b\u5efa Vulkan \u5b9e\u4f8b ==========\n    VkApplicationInfo appInfo{};\n    appInfo.sType = VK_STRUCTURE_TYPE_APPLICATION_INFO;\n    appInfo.apiVersion = VK_API_VERSION_1_2;\n\n    VkInstanceCreateInfo instanceInfo{};\n    instanceInfo.sType = VK_STRUCTURE_TYPE_INSTANCE_CREATE_INFO;\n    instanceInfo.pApplicationInfo = &amp;appInfo;\n\n    VkInstance instance;\n    vkCreateInstance(&amp;instanceInfo, nullptr, &amp;instance);\n\n    // ========== 2. \u9009\u62e9\u7269\u7406\u8bbe\u5907 (GPU) ==========\n    uint32_t deviceCount = 0;\n    vkEnumeratePhysicalDevices(instance, &amp;deviceCount, nullptr);\n    std::vector&lt;VkPhysicalDevice&gt; devices(deviceCount);\n    vkEnumeratePhysicalDevices(instance, &amp;deviceCount, devices.data());\n    VkPhysicalDevice physicalDevice = devices[0];  // \u4f7f\u7528\u7b2c\u4e00\u4e2a GPU\n\n    // \u6253\u5370 GPU \u540d\u79f0\n    VkPhysicalDeviceProperties props;\n    vkGetPhysicalDeviceProperties(physicalDevice, &amp;props);\n    std::cout &lt;&lt; \"\u4f7f\u7528\u7684 GPU: \" &lt;&lt; props.deviceName &lt;&lt; \"\\n\";\n\n    // ========== 3. \u67e5\u627e\u8ba1\u7b97\u961f\u5217\u65cf ==========\n    uint32_t queueFamilyCount = 0;\n    vkGetPhysicalDeviceQueueFamilyProperties(physicalDevice, &amp;queueFamilyCount, nullptr);\n    std::vector&lt;VkQueueFamilyProperties&gt; queueFamilies(queueFamilyCount);\n    vkGetPhysicalDeviceQueueFamilyProperties(physicalDevice, &amp;queueFamilyCount, queueFamilies.data());\n\n    uint32_t computeFamily = 0;\n    for (uint32_t i = 0; i &lt; queueFamilyCount; i++) {\n        if (queueFamilies[i].queueFlags &amp; VK_QUEUE_COMPUTE_BIT) {\n            computeFamily = i;\n            break;\n        }\n    }\n\n    // ========== 4. \u521b\u5efa\u903b\u8f91\u8bbe\u5907\u548c\u961f\u5217 ==========\n    float queuePriority = 1.0f;\n    VkDeviceQueueCreateInfo queueInfo{};\n    queueInfo.sType = VK_STRUCTURE_TYPE_DEVICE_QUEUE_CREATE_INFO;\n    queueInfo.queueFamilyIndex = computeFamily;\n    queueInfo.queueCount = 1;\n    queueInfo.pQueuePriorities = &amp;queuePriority;\n\n    VkDeviceCreateInfo deviceInfo{};\n    deviceInfo.sType = VK_STRUCTURE_TYPE_DEVICE_CREATE_INFO;\n    deviceInfo.queueCreateInfoCount = 1;\n    deviceInfo.pQueueCreateInfos = &amp;queueInfo;\n\n    VkDevice device;\n    vkCreateDevice(physicalDevice, &amp;deviceInfo, nullptr, &amp;device);\n\n    VkQueue computeQueue;\n    vkGetDeviceQueue(device, computeFamily, 0, &amp;computeQueue);\n\n    // ========== 5. \u5206\u914d\u7f13\u51b2\u533a (A, B, C) ==========\n    // \u4e3a\u7b80\u6d01\u8d77\u89c1\uff0c\u8fd9\u91cc\u4f7f\u7528\u4e3b\u673a\u53ef\u89c1\u5185\u5b58\uff08\u8f83\u6162\u4f46\u66f4\u7b80\u5355\uff09\n    auto createBuffer = [&amp;](VkBuffer&amp; buffer, VkDeviceMemory&amp; memory) {\n        VkBufferCreateInfo bufInfo{};\n        bufInfo.sType = VK_STRUCTURE_TYPE_BUFFER_CREATE_INFO;\n        bufInfo.size = bufferSize;\n        bufInfo.usage = VK_BUFFER_USAGE_STORAGE_BUFFER_BIT;\n        vkCreateBuffer(device, &amp;bufInfo, nullptr, &amp;buffer);\n\n        VkMemoryRequirements memReqs;\n        vkGetBufferMemoryRequirements(device, buffer, &amp;memReqs);\n\n        // \u67e5\u627e\u4e3b\u673a\u53ef\u89c1\u7684\u5185\u5b58\u7c7b\u578b\n        VkPhysicalDeviceMemoryProperties memProps;\n        vkGetPhysicalDeviceMemoryProperties(physicalDevice, &amp;memProps);\n        uint32_t memType = 0;\n        for (uint32_t i = 0; i &lt; memProps.memoryTypeCount; i++) {\n            if ((memReqs.memoryTypeBits &amp; (1 &lt;&lt; i)) &amp;&amp;\n                (memProps.memoryTypes[i].propertyFlags &amp;\n                 (VK_MEMORY_PROPERTY_HOST_VISIBLE_BIT | VK_MEMORY_PROPERTY_HOST_COHERENT_BIT))) {\n                memType = i;\n                break;\n            }\n        }\n\n        VkMemoryAllocateInfo allocInfo{};\n        allocInfo.sType = VK_STRUCTURE_TYPE_MEMORY_ALLOCATE_INFO;\n        allocInfo.allocationSize = memReqs.size;\n        allocInfo.memoryTypeIndex = memType;\n        vkAllocateMemory(device, &amp;allocInfo, nullptr, &amp;memory);\n        vkBindBufferMemory(device, buffer, memory, 0);\n    };\n\n    VkBuffer bufA, bufB, bufC;\n    VkDeviceMemory memA, memB, memC;\n    createBuffer(bufA, memA);\n    createBuffer(bufB, memB);\n    createBuffer(bufC, memC);\n\n    // ========== 6. \u586b\u5145\u8f93\u5165\u7f13\u51b2\u533a ==========\n    float* ptrA;\n    vkMapMemory(device, memA, 0, bufferSize, 0, (void**)&amp;ptrA);\n    for (uint32_t i = 0; i &lt; N; i++) ptrA[i] = 1.0f;\n    vkUnmapMemory(device, memA);\n\n    float* ptrB;\n    vkMapMemory(device, memB, 0, bufferSize, 0, (void**)&amp;ptrB);\n    for (uint32_t i = 0; i &lt; N; i++) ptrB[i] = 2.0f;\n    vkUnmapMemory(device, memB);\n\n    // ========== 7. \u521b\u5efa\u8ba1\u7b97\u7ba1\u7ebf ==========\n    auto spirvCode = readSPIRV(\"add.spv\");\n    VkShaderModuleCreateInfo shaderInfo{};\n    shaderInfo.sType = VK_STRUCTURE_TYPE_SHADER_MODULE_CREATE_INFO;\n    shaderInfo.codeSize = spirvCode.size() * sizeof(uint32_t);\n    shaderInfo.pCode = spirvCode.data();\n    VkShaderModule shaderModule;\n    vkCreateShaderModule(device, &amp;shaderInfo, nullptr, &amp;shaderModule);\n\n    // \u63cf\u8ff0\u7b26\u96c6\u5e03\u5c40\uff08\u544a\u8bc9 Vulkan \u7f13\u51b2\u533a\u7ed1\u5b9a\u7684\u4fe1\u606f\uff09\n    VkDescriptorSetLayoutBinding bindings[3] = {};\n    for (int i = 0; i &lt; 3; i++) {\n        bindings[i].binding = i;\n        bindings[i].descriptorType = VK_DESCRIPTOR_TYPE_STORAGE_BUFFER;\n        bindings[i].descriptorCount = 1;\n        bindings[i].stageFlags = VK_SHADER_STAGE_COMPUTE_BIT;\n    }\n\n    VkDescriptorSetLayoutCreateInfo layoutInfo{};\n    layoutInfo.sType = VK_STRUCTURE_TYPE_DESCRIPTOR_SET_LAYOUT_CREATE_INFO;\n    layoutInfo.bindingCount = 3;\n    layoutInfo.pBindings = bindings;\n    VkDescriptorSetLayout descLayout;\n    vkCreateDescriptorSetLayout(device, &amp;layoutInfo, nullptr, &amp;descLayout);\n\n    // \u63a8\u9001\u5e38\u91cf\u8303\u56f4\n    VkPushConstantRange pushRange{};\n    pushRange.stageFlags = VK_SHADER_STAGE_COMPUTE_BIT;\n    pushRange.offset = 0;\n    pushRange.size = sizeof(uint32_t);\n\n    // \u7ba1\u7ebf\u5e03\u5c40\n    VkPipelineLayoutCreateInfo pipeLayoutInfo{};\n    pipeLayoutInfo.sType = VK_STRUCTURE_TYPE_PIPELINE_LAYOUT_CREATE_INFO;\n    pipeLayoutInfo.setLayoutCount = 1;\n    pipeLayoutInfo.pSetLayouts = &amp;descLayout;\n    pipeLayoutInfo.pushConstantRangeCount = 1;\n    pipeLayoutInfo.pPushConstantRanges = &amp;pushRange;\n    VkPipelineLayout pipelineLayout;\n    vkCreatePipelineLayout(device, &amp;pipeLayoutInfo, nullptr, &amp;pipelineLayout);\n\n    // \u8ba1\u7b97\u7ba1\u7ebf\n    VkComputePipelineCreateInfo pipeInfo{};\n    pipeInfo.sType = VK_STRUCTURE_TYPE_COMPUTE_PIPELINE_CREATE_INFO;\n    pipeInfo.stage.sType = VK_STRUCTURE_TYPE_PIPELINE_SHADER_STAGE_CREATE_INFO;\n    pipeInfo.stage.stage = VK_SHADER_STAGE_COMPUTE_BIT;\n    pipeInfo.stage.module = shaderModule;\n    pipeInfo.stage.pName = \"main\";\n    pipeInfo.layout = pipelineLayout;\n    VkPipeline pipeline;\n    vkCreateComputePipelines(device, VK_NULL_HANDLE, 1, &amp;pipeInfo, nullptr, &amp;pipeline);\n\n    // ========== 8. \u63cf\u8ff0\u7b26\u96c6\uff08\u5c06\u7f13\u51b2\u533a\u7ed1\u5b9a\u5230\u7740\u8272\u5668\uff09 ==========\n    VkDescriptorPoolSize poolSize{};\n    poolSize.type = VK_DESCRIPTOR_TYPE_STORAGE_BUFFER;\n    poolSize.descriptorCount = 3;\n\n    VkDescriptorPoolCreateInfo poolInfo{};\n    poolInfo.sType = VK_STRUCTURE_TYPE_DESCRIPTOR_POOL_CREATE_INFO;\n    poolInfo.maxSets = 1;\n    poolInfo.poolSizeCount = 1;\n    poolInfo.pPoolSizes = &amp;poolSize;\n    VkDescriptorPool descPool;\n    vkCreateDescriptorPool(device, &amp;poolInfo, nullptr, &amp;descPool);\n\n    VkDescriptorSetAllocateInfo descAllocInfo{};\n    descAllocInfo.sType = VK_STRUCTURE_TYPE_DESCRIPTOR_SET_ALLOCATE_INFO;\n    descAllocInfo.descriptorPool = descPool;\n    descAllocInfo.descriptorSetCount = 1;\n    descAllocInfo.pSetLayouts = &amp;descLayout;\n    VkDescriptorSet descSet;\n    vkAllocateDescriptorSets(device, &amp;descAllocInfo, &amp;descSet);\n\n    // \u5c06\u7f13\u51b2\u533a\u5f15\u7528\u5199\u5165\u63cf\u8ff0\u7b26\u96c6\n    VkDescriptorBufferInfo bufInfos[3] = {\n        {bufA, 0, bufferSize}, {bufB, 0, bufferSize}, {bufC, 0, bufferSize}\n    };\n    VkWriteDescriptorSet writes[3] = {};\n    for (int i = 0; i &lt; 3; i++) {\n        writes[i].sType = VK_STRUCTURE_TYPE_WRITE_DESCRIPTOR_SET;\n        writes[i].dstSet = descSet;\n        writes[i].dstBinding = i;\n        writes[i].descriptorCount = 1;\n        writes[i].descriptorType = VK_DESCRIPTOR_TYPE_STORAGE_BUFFER;\n        writes[i].pBufferInfo = &amp;bufInfos[i];\n    }\n    vkUpdateDescriptorSets(device, 3, writes, 0, nullptr);\n\n    // ========== 9. \u8bb0\u5f55\u548c\u63d0\u4ea4\u547d\u4ee4\u7f13\u51b2\u533a ==========\n    VkCommandPoolCreateInfo cmdPoolInfo{};\n    cmdPoolInfo.sType = VK_STRUCTURE_TYPE_COMMAND_POOL_CREATE_INFO;\n    cmdPoolInfo.queueFamilyIndex = computeFamily;\n    VkCommandPool cmdPool;\n    vkCreateCommandPool(device, &amp;cmdPoolInfo, nullptr, &amp;cmdPool);\n\n    VkCommandBufferAllocateInfo cmdAllocInfo{};\n    cmdAllocInfo.sType = VK_STRUCTURE_TYPE_COMMAND_BUFFER_ALLOCATE_INFO;\n    cmdAllocInfo.commandPool = cmdPool;\n    cmdAllocInfo.level = VK_COMMAND_BUFFER_LEVEL_PRIMARY;\n    cmdAllocInfo.commandBufferCount = 1;\n    VkCommandBuffer cmdBuf;\n    vkAllocateCommandBuffers(device, &amp;cmdAllocInfo, &amp;cmdBuf);\n\n    VkCommandBufferBeginInfo beginInfo{};\n    beginInfo.sType = VK_STRUCTURE_TYPE_COMMAND_BUFFER_BEGIN_INFO;\n    vkBeginCommandBuffer(cmdBuf, &amp;beginInfo);\n\n    vkCmdBindPipeline(cmdBuf, VK_PIPELINE_BIND_POINT_COMPUTE, pipeline);\n    vkCmdBindDescriptorSets(cmdBuf, VK_PIPELINE_BIND_POINT_COMPUTE,\n                            pipelineLayout, 0, 1, &amp;descSet, 0, nullptr);\n    vkCmdPushConstants(cmdBuf, pipelineLayout, VK_SHADER_STAGE_COMPUTE_BIT,\n                       0, sizeof(uint32_t), &amp;N);\n    vkCmdDispatch(cmdBuf, (N + 255) / 256, 1, 1);  // \u542f\u52a8\u5de5\u4f5c\u7ec4\n\n    vkEndCommandBuffer(cmdBuf);\n\n    // \u63d0\u4ea4\n    VkFenceCreateInfo fenceInfo{};\n    fenceInfo.sType = VK_STRUCTURE_TYPE_FENCE_CREATE_INFO;\n    VkFence fence;\n    vkCreateFence(device, &amp;fenceInfo, nullptr, &amp;fence);\n\n    VkSubmitInfo submitInfo{};\n    submitInfo.sType = VK_STRUCTURE_TYPE_SUBMIT_INFO;\n    submitInfo.commandBufferCount = 1;\n    submitInfo.pCommandBuffers = &amp;cmdBuf;\n    vkQueueSubmit(computeQueue, 1, &amp;submitInfo, fence);\n    vkWaitForFences(device, 1, &amp;fence, VK_TRUE, UINT64_MAX);\n\n    // ========== 10. \u8bfb\u53d6\u7ed3\u679c ==========\n    float* ptrC;\n    vkMapMemory(device, memC, 0, bufferSize, 0, (void**)&amp;ptrC);\n    std::cout &lt;&lt; \"\u7ed3\u679c: c[0]=\" &lt;&lt; ptrC[0] &lt;&lt; \" c[1]=\" &lt;&lt; ptrC[1]\n              &lt;&lt; \" (\u671f\u671b\u503c 3.0)\\n\";\n    bool correct = true;\n    for (uint32_t i = 0; i &lt; N; i++) {\n        if (ptrC[i] != 3.0f) { correct = false; break; }\n    }\n    std::cout &lt;&lt; (correct ? \"\u5168\u90e8\u6b63\u786e\" : \"\u53d1\u73b0\u9519\u8bef\") &lt;&lt; \"\\n\";\n    vkUnmapMemory(device, memC);\n\n    // ========== \u6e05\u7406\uff08\u7b80\u5199\uff09 ==========\n    vkDestroyFence(device, fence, nullptr);\n    vkDestroyCommandPool(device, cmdPool, nullptr);\n    vkDestroyPipeline(device, pipeline, nullptr);\n    vkDestroyPipelineLayout(device, pipelineLayout, nullptr);\n    vkDestroyDescriptorPool(device, descPool, nullptr);\n    vkDestroyDescriptorSetLayout(device, descLayout, nullptr);\n    vkDestroyShaderModule(device, shaderModule, nullptr);\n    vkDestroyBuffer(device, bufA, nullptr); vkFreeMemory(device, memA, nullptr);\n    vkDestroyBuffer(device, bufB, nullptr); vkFreeMemory(device, memB, nullptr);\n    vkDestroyBuffer(device, bufC, nullptr); vkFreeMemory(device, memC, nullptr);\n    vkDestroyDevice(device, nullptr);\n    vkDestroyInstance(instance, nullptr);\n\n    return 0;\n}\n</code></pre> <ul> <li> <p>\u662f\u7684\uff0c\u5411\u91cf\u52a0\u6cd5\u5c31\u9700\u8981\u5927\u7ea6 200 \u884c\u4ee3\u7801\u3002 \u76f8\u6bd4\u4e4b\u4e0b CUDA \u53ea\u9700\u8981\u5927\u7ea6 30 \u884c\u3002\u8fd9\u5c31\u662f\u663e\u5f0f\u6027\u7684\u4ee3\u4ef7\u3002\u4f46\u8bf7\u6ce8\u610f\uff1a\u6bcf\u4e00\u884c\u90fd\u6709\u5176\u76ee\u7684\u3002\u6ca1\u6709\u9690\u85cf\u7684\u9a71\u52a8\u51b3\u7b56\uff0c\u6ca1\u6709\u9690\u5f0f\u540c\u6b65\uff0c\u6ca1\u6709\u610f\u5916\u7684\u5185\u5b58\u5206\u914d\u3002\u4f60\u63a7\u5236\u4e00\u5207\u3002</p> </li> <li> <p>\u5728\u5b9e\u8df5\u4e2d\uff0c\u4f60\u53ef\u4ee5\u5c06\u8fd9\u4e9b\u6837\u677f\u4ee3\u7801\u5c01\u88c5\u5230\u8f85\u52a9\u5e93\u4e2d\uff08\u6216\u4f7f\u7528\u73b0\u6709\u7684\u5e93\uff0c\u5982 vk-bootstrap\u3001\u7528\u4e8e\u5185\u5b58\u5206\u914d\u7684 VMA\uff0c\u6216\u4e13\u6ce8\u4e8e ML \u7684 Vulkan \u8ba1\u7b97\u5e93 kompute\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/07.%20vulkan%20compute%20and%20cross-platform%20GPU/#kompute-ml-vulkan","title":"Kompute\uff1a\u4e3a ML \u7b80\u5316\u7684 Vulkan","text":"<ul> <li>Kompute \u662f\u4e00\u4e2a\u5f00\u6e90 C++ \u5e93\uff0c\u5c01\u88c5\u4e86 Vulkan \u7528\u4e8e GPU \u8ba1\u7b97\u7684\u6837\u677f\u4ee3\u7801\u3002\u540c\u6837\u7684\u5411\u91cf\u52a0\u6cd5\u53d8\u6210\uff1a</li> </ul> <pre><code>#include &lt;kompute/Kompute.hpp&gt;\n\nint main() {\n    kp::Manager mgr;\n\n    auto tensorA = mgr.tensor({1, 1, 1, 1, 1});\n    auto tensorB = mgr.tensor({2, 2, 2, 2, 2});\n    auto tensorC = mgr.tensor({0, 0, 0, 0, 0});\n\n    std::string shader = R\"(\n        #version 450\n        layout(local_size_x = 1) in;\n        layout(set=0, binding=0) buffer A { float a[]; };\n        layout(set=0, binding=1) buffer B { float b[]; };\n        layout(set=0, binding=2) buffer C { float c[]; };\n        void main() {\n            uint i = gl_GlobalInvocationID.x;\n            c[i] = a[i] + b[i];\n        }\n    )\";\n\n    auto algorithm = mgr.algorithm({tensorA, tensorB, tensorC},\n                                     kompute::Shader::compile_source(shader));\n\n    mgr.sequence()\n        -&gt;record&lt;kp::OpTensorSyncDevice&gt;({tensorA, tensorB, tensorC})\n        -&gt;record&lt;kp::OpAlgoDispatch&gt;(algorithm)\n        -&gt;record&lt;kp::OpTensorSyncLocal&gt;({tensorC})\n        -&gt;eval();\n\n    // tensorC \u73b0\u5728\u5305\u542b [3, 3, 3, 3, 3]\n}\n</code></pre> <ul> <li>\u53ef\u8bfb\u6027\u5f3a\u591a\u4e86\u3002Kompute \u5904\u7406\u5b9e\u4f8b\u521b\u5efa\u3001\u8bbe\u5907\u9009\u62e9\u3001\u5185\u5b58\u5206\u914d\u3001\u63cf\u8ff0\u7b26\u96c6\u548c\u547d\u4ee4\u7f13\u51b2\u533a\u7ba1\u7406\u3002\u4f60\u53ea\u9700\u5173\u6ce8\u7740\u8272\u5668\u548c\u6570\u636e\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/07.%20vulkan%20compute%20and%20cross-platform%20GPU/#webgpu-gpu","title":"WebGPU\uff1a\u6d4f\u89c8\u5668\u4e2d\u7684 GPU \u8ba1\u7b97","text":"<ul> <li> <p>WebGPU \u662f WebGL \u7684\u7ee7\u4efb\u8005\uff0c\u63d0\u4f9b\u4ece JavaScript \u8bbf\u95ee\u73b0\u4ee3 GPU \u7684\u80fd\u529b\u3002\u5b83\u57fa\u4e8e Vulkan\uff08Linux/Android\uff09\u3001Metal\uff08macOS/iOS\uff09\u548c DirectX 12\uff08Windows\uff09\u6784\u5efa\uff0c\u62bd\u8c61\u4e86\u5e73\u53f0\u5dee\u5f02\u3002</p> </li> <li> <p>WebGPU \u4f7f\u7528 WGSL\uff08WebGPU \u7740\u8272\u8bed\u8a00\uff09\u800c\u975e GLSL\uff1a</p> </li> </ul> <pre><code>// add.wgsl \u2014 WebGPU \u8ba1\u7b97\u7740\u8272\u5668\n@group(0) @binding(0) var&lt;storage, read&gt; a: array&lt;f32&gt;;\n@group(0) @binding(1) var&lt;storage, read&gt; b: array&lt;f32&gt;;\n@group(0) @binding(2) var&lt;storage, read_write&gt; c: array&lt;f32&gt;;\n\n@compute @workgroup_size(256)\nfn main(@builtin(global_invocation_id) id: vec3&lt;u32&gt;) {\n    let i = id.x;\n    c[i] = a[i] + b[i];\n}\n</code></pre> <ul> <li>JavaScript \u8bbe\u7f6e\uff08\u7cbe\u7b80\u7248\uff09\uff1a</li> </ul> <pre><code>const adapter = await navigator.gpu.requestAdapter();\nconst device = await adapter.requestDevice();\n\n// \u521b\u5efa\u7f13\u51b2\u533a\nconst bufferA = device.createBuffer({ size: N * 4, usage: GPUBufferUsage.STORAGE, mappedAtCreation: true });\nnew Float32Array(bufferA.getMappedRange()).fill(1.0);\nbufferA.unmap();\n\n// ...\uff08B \u548c C \u7c7b\u4f3c\uff09\n\n// \u4ece WGSL \u7740\u8272\u5668\u521b\u5efa\u7ba1\u7ebf\nconst pipeline = device.createComputePipeline({\n    layout: 'auto',\n    compute: { module: device.createShaderModule({ code: wgslSource }), entryPoint: 'main' }\n});\n\n// \u8c03\u5ea6\nconst encoder = device.createCommandEncoder();\nconst pass = encoder.beginComputePass();\npass.setPipeline(pipeline);\npass.setBindGroup(0, bindGroup);\npass.dispatchWorkgroups(Math.ceil(N / 256));\npass.end();\ndevice.queue.submit([encoder.finish()]);\n</code></pre> <ul> <li>\u4e3a\u4ec0\u4e48 WebGPU \u5bf9 ML \u5f88\u91cd\u8981\uff1a\u5728\u6d4f\u89c8\u5668\u4e2d\u8fd0\u884c\u63a8\u7406\u610f\u5473\u7740\u6ca1\u6709\u670d\u52a1\u5668\u6210\u672c\u3001\u6ca1\u6709\u5ef6\u8fdf\uff0c\u4e14\u7528\u6237\u6570\u636e\u6c38\u8fdc\u4e0d\u4f1a\u79bb\u5f00\u8bbe\u5907\u3002\u50cf ONNX Runtime Web \u548c Transformers.js \u8fd9\u6837\u7684\u5e93\u4f7f\u7528 WebGPU \u5b8c\u5168\u5728\u5ba2\u6237\u7aef\u8fd0\u884c\u6a21\u578b\uff08\u5305\u62ec\u5c0f\u578b LLM\uff09\u3002</li> </ul>"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/07.%20vulkan%20compute%20and%20cross-platform%20GPU/#vulkan_1","title":"\u4f55\u65f6\u4f7f\u7528 Vulkan","text":"\u573a\u666f \u4f7f\u7528 Vulkan\uff1f \u539f\u56e0 / \u66ff\u4ee3\u65b9\u6848 ML \u8bad\u7ec3 \u5426 CUDA/Triton \u5728 NVIDIA \u4e0a\u66f4\u7b80\u5355\u66f4\u5feb\u901f NVIDIA GPU \u4e0a\u7684\u63a8\u7406 \u5426 TensorRT \u6216 CUDA \u66f4\u597d AMD/Intel GPU \u4e0a\u7684\u63a8\u7406 \u662f \u552f\u4e00\u8de8\u5382\u5546\u7684 GPU \u8ba1\u7b97\u9009\u9879 \u79fb\u52a8\u7aef\u63a8\u7406\uff08Android\uff09 \u662f Vulkan \u662f Android \u4e0a\u7684\u6807\u51c6 GPU API \u79fb\u52a8\u7aef\u63a8\u7406\uff08iOS\uff09 \u5426 \u76f4\u63a5\u4f7f\u7528 Metal\uff08MoltenVK \u589e\u52a0\u5f00\u9500\uff09 \u6d4f\u89c8\u5668\u63a8\u7406 WebGPU \u57fa\u4e8e Vulkan/Metal/DX12 \u6e38\u620f\u5f15\u64ce + ML \u662f \u5f15\u64ce\u5df2\u4f7f\u7528 Vulkan \u8fdb\u884c\u6e32\u67d3 \u8de8\u5e73\u53f0\u5e93 \u662f \u4e00\u5957\u4ee3\u7801\u652f\u6301\u6240\u6709 GPU \u5382\u5546 \u5b66\u4e60 GPU \u7f16\u7a0b \u89c6\u60c5\u51b5\u800c\u5b9a CUDA \u66f4\u5bb9\u6613\u4e0a\u624b\uff1bVulkan \u80fd\u5b66\u5230\u66f4\u591a"},{"location":"chapter%2016%3A%20SIMD%20and%20GPU%20programming/07.%20vulkan%20compute%20and%20cross-platform%20GPU/#g-lvulkan-vulkan-sdk","title":"\u7f16\u7801\u4efb\u52a1\uff08\u4f7f\u7528 g++ -lvulkan \u7f16\u8bd1\uff0c\u9700\u8981 Vulkan SDK\uff09","text":"<ol> <li> <p>\u7f16\u8bd1\u5e76\u8fd0\u884c\u4e0a\u9762\u7684\u5411\u91cf\u52a0\u6cd5\u793a\u4f8b\u3002\u4fee\u6539\u7740\u8272\u5668\u4ee5\u8ba1\u7b97 <code>c[i] = a[i] * b[i] + a[i]</code>\uff08\u878d\u5408\u4e58\u52a0\uff09\u5e76\u9a8c\u8bc1\u7ed3\u679c\u3002</p> </li> <li> <p>\u7f16\u5199\u4e00\u4e2a\u8ba1\u7b97\u7740\u8272\u5668\uff0c\u4f7f\u7528\u5171\u4eab\u5185\u5b58\u5bf9\u4e00\u884c\u6570\u636e\u5e94\u7528 softmax\uff08\u5305\u62ec\u6700\u5927\u503c\u548c\u6c42\u548c\u5f52\u7ea6\u6b65\u9aa4\uff09\u3002\u7528\u5df2\u77e5\u503c\u8fdb\u884c\u6d4b\u8bd5\u3002</p> </li> </ol> <pre><code>// softmax.comp \u2014 \u7f16\u8bd1\u547d\u4ee4: glslangValidator -V softmax.comp -o softmax.spv\n#version 450\n\n#define WG_SIZE 256\n\nlayout(local_size_x = WG_SIZE) in;\n\nlayout(set = 0, binding = 0) buffer Input  { float input_data[]; };\nlayout(set = 0, binding = 1) buffer Output { float output_data[]; };\n\nlayout(push_constant) uniform PC { uint n; };\n\nshared float sdata[WG_SIZE];\n\nvoid main() {\n    uint gid = gl_GlobalInvocationID.x;\n    uint lid = gl_LocalInvocationID.x;\n\n    // \u6b65\u9aa4 1\uff1a\u627e\u6700\u5927\u503c\uff08\u6570\u503c\u7a33\u5b9a\u6027\uff09\n    sdata[lid] = (gid &lt; n) ? input_data[gid] : -1e30;\n    barrier();\n    for (uint s = WG_SIZE / 2; s &gt; 0; s &gt;&gt;= 1) {\n        if (lid &lt; s) sdata[lid] = max(sdata[lid], sdata[lid + s]);\n        barrier();\n    }\n    float maxVal = sdata[0];\n    barrier();\n\n    // \u6b65\u9aa4 2\uff1a\u8ba1\u7b97 exp(x - max)\n    float expVal = (gid &lt; n) ? exp(input_data[gid] - maxVal) : 0.0;\n    sdata[lid] = expVal;\n    barrier();\n\n    // \u6b65\u9aa4 3\uff1aexp \u503c\u6c42\u548c\n    for (uint s = WG_SIZE / 2; s &gt; 0; s &gt;&gt;= 1) {\n        if (lid &lt; s) sdata[lid] += sdata[lid + s];\n        barrier();\n    }\n    float sumExp = sdata[0];\n\n    // \u6b65\u9aa4 4\uff1a\u5f52\u4e00\u5316\n    if (gid &lt; n) {\n        output_data[gid] = expVal / sumExp;\n    }\n}\n</code></pre> <ol> <li>\u4fee\u6539 C++ \u5bbf\u4e3b\u4ee3\u7801\u4ee5\u5bf9\u8ba1\u7b97\u7740\u8272\u5668\u8fdb\u884c\u57fa\u51c6\u6d4b\u8bd5\uff1a\u4f7f\u7528 Vulkan \u65f6\u95f4\u6233\u67e5\u8be2\u6216 CPU \u7aef\u6805\u680f\u5bf9\u8c03\u5ea6\uff08\u6392\u9664\u8bbe\u7f6e\u9636\u6bb5\uff09\u8ba1\u65f6\uff0c\u5e76\u8ba1\u7b97\u4ee5 GB/s \u4e3a\u5355\u4f4d\u7684\u5b9e\u9645\u5e26\u5bbd\u3002</li> </ol>"},{"location":"chapter%2017%3A%20AI%20inference/01.%20quantisation/","title":"\u91cf\u5316","text":"<p>\u91cf\u5316\u964d\u4f4e\u6a21\u578b\u6743\u91cd\u548c\u6fc0\u6d3b\u503c\u7684\u7cbe\u5ea6\uff0c\u4f7f\u6a21\u578b\u66f4\u5c0f\u3001\u66f4\u5feb\u3001\u8fd0\u884c\u6210\u672c\u66f4\u4f4e\u3002\u672c\u6587\u6db5\u76d6\u6570\u5b57\u683c\u5f0f\u3001\u8bad\u7ec3\u540e\u91cf\u5316\u3001\u91cf\u5316\u611f\u77e5\u8bad\u7ec3\u3001\u4ec5\u6743\u91cd\u91cf\u5316\u65b9\u6cd5\uff08GPTQ\u3001AWQ\uff09\u3001\u6fc0\u6d3b\u503c\u91cf\u5316\u3001\u6df7\u5408\u7cbe\u5ea6\u548cKV\u7f13\u5b58\u91cf\u5316</p> <ul> <li> <p>\u4e00\u4e2a70B\u53c2\u6570\u7684float16\u6a21\u578b\u9700\u8981140 GB\u5185\u5b58\uff0c\u8d85\u8fc7\u4efb\u4f55\u5355\u5f20GPU\u3002\u91cf\u5316\u4e3aINT4\u540e\uff0c\u5b83\u53ef\u4ee5\u88c5\u516535 GB\uff08\u4e00\u5f20A100\uff09\u751a\u81f320 GB\uff08\u5e26\u5378\u8f7d\u7684\u6d88\u8d39\u7ea7RTX 4090\uff09\u3002\u91cf\u5316\u4e0d\u662f\u4e00\u79cd\u53ef\u6709\u53ef\u65e0\u7684\u4f18\u5316\uff1b\u5b83\u662f\u8ba9\u5927\u6a21\u578b\u90e8\u7f72\u5728\u7ecf\u6d4e\u4e0a\u53ef\u884c\u7684\u5173\u952e\u3002</p> </li> <li> <p>\u57fa\u672c\u6743\u8861\uff1a\u4f4e\u7cbe\u5ea6\u610f\u5473\u7740\u66f4\u5c11\u5185\u5b58\u3001\u66f4\u9ad8\u541e\u5410\u91cf\u548c\u66f4\u4f4e\u529f\u8017\uff0c\u4f46\u4f1a\u5f15\u5165\u91cf\u5316\u8bef\u5dee\uff0c\u53ef\u80fd\u964d\u4f4e\u6a21\u578b\u8d28\u91cf\u3002\u91cf\u5316\u7684\u827a\u672f\u5728\u4e8e\u6700\u5c0f\u5316\u8fd9\u79cd\u964d\u7ea7\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/01.%20quantisation/#_2","title":"\u4e3a\u4ec0\u4e48\u8981\u91cf\u5316","text":"<ul> <li> <p>\u5185\u5b58\u51cf\u5c11\uff1aINT8\u6bd4FP16\u5c0f2\u500d\uff0cINT4\u5c0f4\u500d\u3002\u5bf9\u4e8eLLM\uff0c\u6a21\u578b\u6743\u91cd\u5360\u4e3b\u5bfc\u5185\u5b58\u3002\u7cbe\u5ea6\u51cf\u534a\u610f\u5473\u7740\u5185\u5b58\u9700\u6c42\u51cf\u534a\u3002</p> </li> <li> <p>\u541e\u5410\u91cf\u63d0\u5347\uff1a\u4f4e\u7cbe\u5ea6\u610f\u5473\u7740\u6bcf\u79d2\u66f4\u591a\u64cd\u4f5c\u3002NVIDIA Tensor Core\uff08\u7b2c16\u7ae0\uff09\u5728FP16 vs FP32\u4e0a\u5b9e\u73b02\u500d\u541e\u5410\u91cf\uff0cINT8 vs FP16\u518d\u5b9e\u73b02\u500d\uff0cINT4 vs INT8\u518d\u5b9e\u73b02\u500d\u3002H100\u5728FP8\u4e0b\u8fbe\u5230989 TFLOPS\uff0c\u800cFP32\u4e0b\u53ea\u670967 TFLOPS\u2014\u2014\u76f8\u5dee15\u500d\u3002</p> </li> <li> <p>\u5e26\u5bbd\u8282\u7701\uff1aLLM\u63a8\u7406\u901a\u5e38\u662f\u5185\u5b58\u5e26\u5bbd\u53d7\u9650\u7684\uff08\u7b2c16\u7ae0\uff0c\u5c4b\u9876\u6a21\u578b\uff09\u3002\u74f6\u9888\u662f\u4eceGPU\u5185\u5b58\u52a0\u8f7d\u6743\u91cd\uff0c\u800c\u4e0d\u662f\u8ba1\u7b97\u3002\u66f4\u5c0f\u7684\u6743\u91cd\u610f\u5473\u7740\u66f4\u5c11\u7684\u4f20\u8f93\u5b57\u8282\uff0c\u76f4\u63a5\u63d0\u9ad8\u6bcf\u79d2token\u6570\u3002\u8fd9\u5c31\u662f\u91cf\u5316\u901a\u5e38\u80fd\u4e3aLLM\u63a8\u7406\u5e26\u6765\u8fd1\u4e4e\u7ebf\u6027\u52a0\u901f\u7684\u539f\u56e0\u3002</p> </li> <li> <p>\u8282\u80fd\uff1a\u4f4e\u7cbe\u5ea6\u6bcf\u6b21\u64cd\u4f5c\u6d88\u8017\u66f4\u5c11\u80fd\u91cf\u3002\u5728\u6570\u636e\u4e2d\u5fc3\u89c4\u6a21\uff08\u6570\u5343GPU\uff09\u4e0b\uff0c\u8fd9\u8f6c\u5316\u4e3a\u663e\u8457\u7684\u7535\u529b\u6210\u672c\u964d\u4f4e\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/01.%20quantisation/#_3","title":"\u6570\u5b57\u683c\u5f0f","text":"<ul> <li>\u6211\u4eec\u5728\u7b2c13\u7ae0\uff08\u8ba1\u7b97\u673a\u4f53\u7cfb\u7ed3\u6784\uff09\u4e2d\u4ecb\u7ecd\u4e86IEEE 754\u6d6e\u70b9\u6570\u3002\u4ee5\u4e0b\u662fML\u7684\u5b8c\u6574\u7cbe\u5ea6\u5168\u666f\uff1a</li> </ul> \u683c\u5f0f \u4f4d\u6570 \u6307\u6570 \u5c3e\u6570 \u8303\u56f4 \u7528\u9014 FP32 32 8 23 \u00b13.4\u00d710\u00b3\u2078 \u8bad\u7ec3\uff08\u9ec4\u91d1\u6807\u51c6\uff09 TF32 19 8 10 \u00b13.4\u00d710\u00b3\u2078 Tensor Core\u8bad\u7ec3\uff08A100+\uff09 FP16 16 5 10 \u00b165504 \u6df7\u5408\u7cbe\u5ea6\u8bad\u7ec3 BF16 16 8 7 \u00b13.4\u00d710\u00b3\u2078 \u8bad\u7ec3\uff08\u4e0eFP32\u76f8\u540c\u7684\u8303\u56f4\uff09 FP8 E4M3 8 4 3 \u00b1448 \u524d\u5411\u4f20\u64ad\uff08Hopper+\uff09 FP8 E5M2 8 5 2 \u00b157344 \u68af\u5ea6\uff08\u66f4\u5bbd\u8303\u56f4\uff09 INT8 8 \u2014 \u2014 -128 \u5230 127 PTQ\u63a8\u7406 INT4 4 \u2014 \u2014 -8 \u5230 7 \u4ec5\u6743\u91cd\u91cf\u5316 INT2/\u4e09\u503c 2 \u2014 \u2014 {-1, 0, 1} \u6781\u9650\u538b\u7f29 <ul> <li> <p>FP8\u6709\u4e24\u79cd\u53d8\u4f53\uff1aE4M3\uff084\u4f4d\u6307\u6570\uff0c3\u4f4d\u5c3e\u6570\uff0c\u8303\u56f4\u8f83\u7a84\u4f46\u7cbe\u5ea6\u66f4\u9ad8\uff09\u7528\u4e8e\u524d\u5411\u4f20\u64ad\uff0cE5M2\uff085\u4f4d\u6307\u6570\uff0c2\u4f4d\u5c3e\u6570\uff0c\u8303\u56f4\u66f4\u5bbd\u4f46\u7cbe\u5ea6\u8f83\u4f4e\uff09\u7528\u4e8e\u68af\u5ea6\u3002Transformer Engine\uff08\u7b2c16\u7ae0\uff09\u5728\u6bcf\u4e2a\u5f20\u91cf\u4e4b\u95f4\u81ea\u52a8\u5207\u6362\u3002</p> </li> <li> <p>BF16 vs FP16\uff1aBF16\u5177\u6709\u4e0eFP32\u76f8\u540c\u7684\u6307\u6570\u8303\u56f4\uff08\u65e0\u6ea2\u51fa\u98ce\u9669\uff09\uff0c\u4f46\u5c3e\u6570\u7cbe\u5ea6\u8f83\u4f4e\u3002FP16\u7cbe\u5ea6\u66f4\u9ad8\u4f46\u8303\u56f4\u8f83\u7a84\uff08\u6700\u592765504\uff09\uff0c\u8bad\u7ec3\u65f6\u9700\u8981\u635f\u5931\u7f29\u653e\u3002\u5bf9\u4e8e\u63a8\u7406\uff0c\u4e24\u8005\u90fd\u8868\u73b0\u826f\u597d\uff1b\u5bf9\u4e8e\u8bad\u7ec3\uff0cBF16\u66f4\u5b89\u5168\u3002</p> </li> <li> <p>\u6574\u6570\u683c\u5f0f\u6ca1\u6709\u6307\u6570\u2014\u2014\u5b83\u4eec\u8868\u793a\u5b9a\u70b9\u503c\u3002\u8981\u5728\u6d6e\u70b9\u548c\u6574\u6570\u4e4b\u95f4\u8f6c\u6362\uff0c\u9700\u8981\u4e00\u4e2a\u7f29\u653e\u56e0\u5b50\u548c\u4e00\u4e2a\u53ef\u9009\u7684\u96f6\u70b9\uff1a\\(x_{\\text{float}} = \\text{scale} \\times (x_{\\text{int}} - \\text{zero\\_point})\\)\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/01.%20quantisation/#_4","title":"\u91cf\u5316\u65b9\u7a0b","text":"<ul> <li>\u6240\u6709\u91cf\u5316\u65b9\u6cd5\u90fd\u5c06\u6d6e\u70b9\u503c\u6620\u5c04\u5230\u6574\u6570\u5e76\u8fd4\u56de\uff1a</li> </ul> \\[x_q = \\text{clamp}\\left(\\text{round}\\left(\\frac{x}{\\text{scale}}\\right) + \\text{zero\\_point}, \\; q_{\\min}, \\; q_{\\max}\\right)\\] \\[\\hat{x} = \\text{scale} \\times (x_q - \\text{zero\\_point})\\] <ul> <li> <p>\u7f29\u653e\u56e0\u5b50\u51b3\u5b9a\u5206\u8fa8\u7387\uff1a\\(\\text{scale} = \\frac{x_{\\max} - x_{\\min}}{q_{\\max} - q_{\\min}}\\)\u3002\u5bf9\u4e8eINT8\uff1a\\(q_{\\min} = -128\\)\uff0c\\(q_{\\max} = 127\\)\u3002</p> </li> <li> <p>\u5bf9\u79f0\u91cf\u5316\u8bbe\u7f6e\\(\\text{zero\\_point} = 0\\)\uff0c\u56e0\u6b64\\(\\text{scale} = \\frac{\\max(|x|)}{127}\\)\u3002\u66f4\u7b80\u5355\u3001\u66f4\u5feb\uff08\u63a8\u7406\u65f6\u65e0\u9700\u51cf\u53bb\u96f6\u70b9\uff09\u3002</p> </li> <li> <p>\u975e\u5bf9\u79f0\u91cf\u5316\u4f7f\u7528\u975e\u96f6\\(\\text{zero\\_point}\\)\u6765\u5904\u7406\u975e\u5bf9\u79f0\u5206\u5e03\uff08\u4f8b\u5982\uff0cReLU\u8f93\u51fa\u5168\u4e3a\u975e\u8d1f\uff09\u3002\u5c06\\([x_{\\min}, x_{\\max}]\\)\u6620\u5c04\u5230\u65e0\u7b26\u53f7INT8\u7684\\([0, 255]\\)\u3002</p> </li> </ul> <p></p> <ul> <li>\u91cf\u5316\u7c92\u5ea6\uff1a\u591a\u5c11\u4e2a\u503c\u5171\u4eab\u540c\u4e00\u4e2a\u7f29\u653e\u56e0\u5b50\uff1a<ul> <li>\u9010\u5f20\u91cf\uff1a\u6574\u4e2a\u5f20\u91cf\u4e00\u4e2a\u7f29\u653e\u56e0\u5b50\u3002\u6700\u7b80\u5355\u4f46\u7cbe\u5ea6\u6700\u4f4e\uff08\u4e00\u4e2a\u5f02\u5e38\u503c\u5c31\u4f1a\u626d\u66f2\u6574\u4e2a\u5f20\u91cf\u7684\u7f29\u653e\u56e0\u5b50\uff09\u3002</li> <li>\u9010\u901a\u9053\uff1a\u6bcf\u4e2a\u8f93\u51fa\u901a\u9053\uff08\u5377\u79ef\uff09\u6216\u6bcf\u884c\uff08\u7ebf\u6027\u5c42\uff09\u4e00\u4e2a\u7f29\u653e\u56e0\u5b50\u3002\u7cbe\u5ea6\u597d\u5f97\u591a\uff0c\u5f00\u9500\u6700\u5c0f\u3002</li> <li>\u9010\u7ec4\uff1a\u6bcf\\(g\\)\u4e2a\u5143\u7d20\u4e00\u7ec4\uff08\u4f8b\u5982\\(g = 128\\)\uff09\u4e00\u4e2a\u7f29\u653e\u56e0\u5b50\u3002\u7cbe\u5ea6\u6700\u4f73\uff0c\u7528\u4e8e\u73b0\u4ee3\u4ec5\u6743\u91cd\u91cf\u5316\uff08GPTQ\u3001AWQ\uff09\u3002</li> <li>\u9010token\uff1a\u6bcf\u4e2atoken\u4e00\u4e2a\u7f29\u653e\u56e0\u5b50\u7528\u4e8e\u6fc0\u6d3b\u503c\u3002\u5904\u7406\u4e0d\u540ctoken\u6fc0\u6d3b\u503c\u5e45\u5ea6\u5dee\u5f02\u5f88\u5927\u7684\u60c5\u51b5\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/01.%20quantisation/#ptq","title":"\u8bad\u7ec3\u540e\u91cf\u5316\uff08PTQ\uff09","text":"<ul> <li>PTQ\u91cf\u5316\u9884\u8bad\u7ec3\u6a21\u578b\u800c\u4e0d\u9700\u8981\u91cd\u65b0\u8bad\u7ec3\u3002\u901a\u8fc7\u6821\u51c6\u96c6\uff08\u4e00\u4e2a\u5c0f\u7684\u4ee3\u8868\u6027\u6570\u636e\u96c6\uff0c\u901a\u5e38128-512\u4e2a\u6837\u672c\uff09\u8f93\u5165\u6a21\u578b\u6536\u96c6\u6fc0\u6d3b\u503c\u7edf\u8ba1\u4fe1\u606f\uff0c\u7136\u540e\u8ba1\u7b97\u6700\u4f18\u7f29\u653e\u56e0\u5b50\u3002</li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/01.%20quantisation/#_5","title":"\u6821\u51c6\u65b9\u6cd5","text":"<ul> <li> <p>\u6700\u5c0f-\u6700\u5927\uff1a\u57fa\u4e8e\u89c2\u5bdf\u5230\u7684\u6700\u5c0f\u503c\u548c\u6700\u5927\u503c\u8bbe\u7f6e\u7f29\u653e\u56e0\u5b50\u3002\u7b80\u5355\u4f46\u5bb9\u6613\u53d7\u5f02\u5e38\u503c\u5f71\u54cd\uff08\u4e00\u4e2a\u6781\u7aef\u503c\u5c06\u5927\u90e8\u5206\u91cf\u5316\u8303\u56f4\u6d6a\u8d39\u5728\u5f88\u5c11\u4f7f\u7528\u7684\u503c\u4e0a\uff09\u3002</p> </li> <li> <p>\u767e\u5206\u4f4d\u6570\uff1a\u4f7f\u752899.99\u767e\u5206\u4f4d\u6570\u800c\u4e0d\u662f\u7edd\u5bf9\u6700\u5927\u503c\u3002\u88c1\u526a\u6781\u7aef\u5f02\u5e38\u503c\uff0c\u4e3a\u5927\u591a\u6570\u503c\u63d0\u4f9b\u66f4\u597d\u7684\u5206\u8fa8\u7387\u3002\u88c1\u526a\u540e\u7684\u503c\u9971\u548c\u5230\\(q_{\\min}\\)\u6216\\(q_{\\max}\\)\u3002</p> </li> <li> <p>MSE\u6700\u4f18\uff1a\u627e\u5230\u6700\u5c0f\u5316\u539f\u59cb\u5f20\u91cf\u548c\u91cf\u5316\u5f20\u91cf\u4e4b\u95f4\u5747\u65b9\u8bef\u5dee\u7684\u7f29\u653e\u56e0\u5b50\u3002\u8fd9\u662f\u4e00\u4e2a\u4e00\u7ef4\u4f18\u5316\uff08\u641c\u7d22\u53ef\u80fd\u7684\u88c1\u526a\u503c\uff09\uff0c\u901a\u5e38\u7ed9\u51fa\u6700\u597d\u7684PTQ\u7cbe\u5ea6\u3002</p> </li> <li> <p>\u57fa\u4e8e\u71b5\uff08KL\u6563\u5ea6\uff09\uff1a\u627e\u5230\u6700\u5c0f\u5316\u539f\u59cb\u548c\u91cf\u5316\u503c\u5206\u5e03\u4e4b\u95f4KL\u6563\u5ea6\u7684\u7f29\u653e\u56e0\u5b50\u3002\u7528\u4e8eTensorRT\u7684INT8\u6821\u51c6\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/01.%20quantisation/#ptq_1","title":"PTQ\u5b9e\u8df5","text":"<pre><code># \u4f7f\u7528PyTorch\u7684\u7b80\u5316PTQ\uff08\u6982\u5ff5\u6027\uff09\nimport torch\n\ndef quantise_tensor_symmetric(tensor, bits=8):\n    qmax = 2 ** (bits - 1) - 1  # INT8\u7684127\n    scale = tensor.abs().max() / qmax\n    quantised = torch.clamp(torch.round(tensor / scale), -qmax, qmax).to(torch.int8)\n    return quantised, scale\n\ndef dequantise(quantised, scale):\n    return quantised.float() * scale\n\n# \u91cf\u5316\u4e00\u4e2a\u6743\u91cd\u77e9\u9635\nweight = torch.randn(512, 512)  # \u9884\u8bad\u7ec3\u6743\u91cd\nweight_q, scale = quantise_tensor_symmetric(weight, bits=8)\nweight_reconstructed = dequantise(weight_q, scale)\n\n# \u91cf\u5316\u8bef\u5dee\nerror = (weight - weight_reconstructed).abs().mean()\nprint(f\"\u5e73\u5747\u7edd\u5bf9\u8bef\u5dee: {error:.6f}\")\nprint(f\"\u538b\u7f29\u6bd4: {weight.numel() * 4 / (weight_q.numel() * 1 + 4):.1f}x\")  # +4\u5b57\u8282\u7528\u4e8e\u7f29\u653e\u56e0\u5b50\n</code></pre> <ul> <li>PTQ\u5728INT8\u4e0a\u5bf9\u5927\u591a\u6570\u6a21\u578b\u6548\u679c\u826f\u597d\uff0c\u7cbe\u5ea6\u4e0b\u964d&lt;1%\u3002\u5bf9\u4e8eINT4\uff0cPTQ\u8d28\u91cf\u663e\u8457\u4e0b\u964d\u2014\u2014\u4ec5\u6743\u91cd\u91cf\u5316\u65b9\u6cd5\uff08\u89c1\u4e0b\u6587\uff09\u5904\u7406INT4\u8981\u597d\u5f97\u591a\u3002</li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/01.%20quantisation/#qat","title":"\u91cf\u5316\u611f\u77e5\u8bad\u7ec3\uff08QAT\uff09","text":"<ul> <li>QAT\u5728\u8bad\u7ec3\u56fe\u4e2d\u63d2\u5165\u4f2a\u91cf\u5316\u64cd\u4f5c\uff1a\u5728\u524d\u5411\u4f20\u64ad\u4e2d\uff0c\u6743\u91cd\u548c\u6fc0\u6d3b\u503c\u88ab\u91cf\u5316\u548c\u53cd\u91cf\u5316\uff0c\u4f46\u68af\u5ea6\u50cf\u6ca1\u6709\u91cf\u5316\u4e00\u6837\u6d41\u8fc7\uff08\u76f4\u901a\u4f30\u8ba1\u5668\uff09\u3002</li> </ul> \\[\\text{\u524d\u5411: } \\hat{W} = \\text{\u53cd\u91cf\u5316}(\\text{\u91cf\u5316}(W))$$ $$\\text{\u53cd\u5411: } \\frac{\\partial L}{\\partial W} \\approx \\frac{\\partial L}{\\partial \\hat{W}}\\] <ul> <li> <p>\u6a21\u578b\u5728\u8bad\u7ec3\u8fc7\u7a0b\u4e2d\u5b66\u4f1a\u4e86\u62b5\u6297\u91cf\u5316\u566a\u58f0\u3002QAT\u901a\u5e38\u80fd\u6062\u590dPTQ\u635f\u5931\u7684\u5168\u90e8\u6216\u5927\u90e8\u5206\u7cbe\u5ea6\uff0c\u7279\u522b\u662f\u5728\u4f4e\u4f4d\u5bbd\uff08INT4\u3001INT2\uff09\u4e0b\u3002</p> </li> <li> <p>\u6210\u672c\uff1aQAT\u9700\u8981\u91cd\u65b0\u8bad\u7ec3\uff08\u6216\u5fae\u8c03\uff09\u6a21\u578b\uff0c\u8fd9\u5bf9\u5927\u6a21\u578b\u6765\u8bf4\u6210\u672c\u9ad8\u6602\u3002\u5bf9\u4e8e\u4e00\u4e2a70B\u53c2\u6570\u6a21\u578b\uff0cQAT\u53ef\u80fd\u9700\u8981\\(10,000-\\)100,000\u7684\u8ba1\u7b97\u6210\u672c\u3002PTQ\u57fa\u672c\u4e0a\u96f6\u6210\u672c\uff08\u53ea\u9700\u6821\u51c6\uff09\u3002</p> </li> <li> <p>\u4f55\u65f6\u4f7f\u7528QAT\uff1a\u5f53PTQ\u8d28\u91cf\u4e0d\u53ef\u63a5\u53d7\u65f6\uff08\u901a\u5e38\u662fINT4\u6216\u66f4\u4f4e\uff09\uff0c\u5f53\u90e8\u7f72\u5230\u6709\u4e25\u683c\u5ef6\u8fdf\u9884\u7b97\u7684\u8fb9\u7f18\u8bbe\u5907\u65f6\uff0c\u6216\u8005\u5f53\u6a21\u578b\u5c06\u88ab\u91cf\u5316\u6570\u767e\u4e07\u6b21\u65f6\uff08\u4e00\u6b21\u6027QAT\u6210\u672c\u88ab\u644a\u9500\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/01.%20quantisation/#_6","title":"\u4ec5\u6743\u91cd\u91cf\u5316","text":"<ul> <li>\u5bf9\u4e8eLLM\u63a8\u7406\uff0c\u74f6\u9888\u662f\u4ece\u5185\u5b58\u52a0\u8f7d\u6743\u91cd\uff0c\u800c\u4e0d\u662f\u8ba1\u7b97\uff08\u5185\u5b58\u5e26\u5bbd\u53d7\u9650\u6a21\u5f0f\uff09\u3002\u4ec5\u6743\u91cd\u91cf\u5316\u5c06\u6743\u91cd\u91cf\u5316\u4e3aINT4\u6216INT3\uff0c\u800c\u4fdd\u6301\u6fc0\u6d3b\u503c\u4e3aFP16\u3002\u8ba1\u7b97\u5728FP16\u4e2d\u8fdb\u884c\uff08\u5728\u8fd0\u884c\u65f6\u53cd\u91cf\u5316\u6743\u91cd\uff09\uff0c\u4f46\u5185\u5b58\u6d88\u8017\u548c\u5e26\u5bbd\u51cf\u5c11\u4e864-8\u500d\u3002</li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/01.%20quantisation/#gptq","title":"GPTQ","text":"<ul> <li>GPTQ\uff08Frantar\u7b49\u4eba\uff0c2022\uff09\u4e00\u6b21\u91cf\u5316\u4e00\u5217\u6743\u91cd\uff0c\u901a\u8fc7\u8c03\u6574\u540e\u7eed\u5217\u6765\u8865\u507f\u6bcf\u5217\u7684\u8bef\u5dee\u3002\u5b83\u4f7f\u7528Hessian\u77e9\u9635\uff08\u6765\u81ea\u6821\u51c6\u96c6\u7684\u4e8c\u9636\u4fe1\u606f\uff09\u6765\u786e\u5b9a\u6700\u4f18\u91cf\u5316\u987a\u5e8f\u548c\u8bef\u5dee\u8865\u507f\uff1a</li> </ul> \\[\\hat{W}_{:,j} = \\text{quant}(W_{:,j}), \\quad W_{:,j+1:} \\mathrel{-}= \\frac{(\\hat{W}_{:,j} - W_{:,j}) \\cdot H_{j,j+1:}}{H_{j,j}}\\] <ul> <li> <p>\u5173\u952e\u6d1e\u5bdf\uff1a\u91cf\u5316\u7b2c\\(j\\)\u5217\u4f1a\u5f15\u5165\u8bef\u5dee\u3002GPTQ\u7acb\u5373\u901a\u8fc7\u8c03\u6574\u6240\u6709\u5269\u4f59\u5217\u6765\u8865\u507f\uff0c\u4f7f\u5f97\u8be5\u5c42\u7684\u6574\u4f53\u8f93\u51fa\uff08\\(XW\\)\uff09\u53d8\u5316\u5c3d\u53ef\u80fd\u5c0f\u3002\u8fd9\u662f\u5e94\u7528\u4e8eTransformer\u7684\u6700\u4f18\u8111\u91cf\u5316\uff08OBQ\uff09\u3002</p> </li> <li> <p>\u4f7f\u75284\u4f4d\u7ec4\u91cf\u5316\uff08\u7ec4\u5927\u5c0f128\uff09\u7684GPTQ\u5728\u5927\u591a\u6570LLM\u4e0a\u8fbe\u5230&lt;1%\u7684\u56f0\u60d1\u5ea6\u964d\u7ea7\u3002\u5728\u5355GPU\u4e0a\uff0c70B\u6a21\u578b\u7684\u91cf\u5316\u5927\u7ea6\u9700\u89811\u5c0f\u65f6\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/01.%20quantisation/#awq","title":"AWQ","text":"<ul> <li> <p>AWQ\uff08\u6fc0\u6d3b\u611f\u77e5\u6743\u91cd\u91cf\u5316\uff0cLin\u7b49\u4eba\uff0c2023\uff09\u89c2\u5bdf\u5230\u4e00\u5c0f\u90e8\u5206\u6743\u91cd\u901a\u9053\uff081-3%\uff09\u6bd4\u5176\u4ed6\u901a\u9053\u91cd\u8981\u5f97\u591a\u2014\u2014\u5b83\u4eec\u5bf9\u5e94\u4e8e\u5177\u6709\u5927\u5e45\u5ea6\u7684\u6fc0\u6d3b\u901a\u9053\u3002\u4fdd\u62a4\u8fd9\u4e9b\u663e\u8457\u901a\u9053\u53ef\u4ee5\u5927\u5e45\u964d\u4f4e\u91cf\u5316\u8bef\u5dee\u3002</p> </li> <li> <p>AWQ\u5728\u91cf\u5316\u524d\u5c06\u8fd9\u4e9b\u91cd\u8981\u901a\u9053\u4e58\u4ee5\u4e00\u4e2a\u56e0\u5b50\\(s\\)\uff08\u4f7f\u5b83\u4eec\u53d8\u5927\uff0c\u56e0\u6b64\u53d7\u820d\u5165\u5f71\u54cd\u66f4\u5c0f\uff09\uff0c\u5e76\u5c06\u76f8\u5e94\u7684\u6fc0\u6d3b\u503c\u4e58\u4ee5\\(1/s\\)\uff08\u4ee5\u4fdd\u6301\u8f93\u51fa\u4e0d\u53d8\uff09\u3002\u7f29\u653e\u56e0\u5b50\\(s\\)\u6309\u7ec4\u4f18\u5316\uff0c\u4ee5\u6700\u5c0f\u5316\u6574\u4f53\u91cf\u5316\u8bef\u5dee\u3002</p> </li> <li> <p>AWQ\u6bd4GPTQ\u66f4\u7b80\u5355\uff08\u65e0\u9700Hessian\u8ba1\u7b97\uff09\uff0c\u8fd0\u884c\u66f4\u5feb\uff0c\u5e76\u8fbe\u5230\u53ef\u6bd4\u8f83\u7684\u8d28\u91cf\u3002\u5b83\u5df2\u6210\u4e3a\u8bb8\u591a\u5f00\u6e90LLM\u91cf\u5316\u6d41\u7a0b\u7684\u9ed8\u8ba4\u9009\u62e9\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/01.%20quantisation/#gguf-llamacpp","title":"GGUF / llama.cpp\u91cf\u5316","text":"<ul> <li> <p>GGUF\uff08GGML\u901a\u7528\u683c\u5f0f\uff09\u662fllama.cpp\u7528\u4e8eCPU\u63a8\u7406\u7684\u683c\u5f0f\u3002\u5b83\u652f\u6301\u591a\u79cd\u91cf\u5316\u65b9\u6848\uff1a</p> <ul> <li>Q4_0\uff1a4\u4f4d\uff0c32\u5143\u7d20\u5757\uff0c\u5bf9\u79f0\u3002</li> <li>Q4_K_M\uff1a4\u4f4d\uff0c\u5e26\u6df7\u5408\u7cbe\u5ea6\u91cd\u8981\u901a\u9053\uff08k-quants\uff09\u3002</li> <li>Q5_K_M\uff1a5\u4f4d\uff0c\u5e26k-quants\uff08\u66f4\u9ad8\u8d28\u91cf\uff09\u3002</li> <li>Q8_0\uff1a8\u4f4d\uff0c\u7b80\u5355\u5feb\u901f\u3002</li> </ul> </li> <li> <p>\"K\"\u53d8\u4f53\uff08k-quants\uff09\u4e3a\u91cd\u8981\u7684\u6743\u91cd\u5757\u5206\u914d\u66f4\u591a\u4f4d\uff0c\u7c7b\u4f3c\u4e8eAWQ\u7684\u6d1e\u5bdf\u4f46\u5b9e\u73b0\u5728\u683c\u5f0f\u5c42\u9762\u3002Q4_K_M\u662f\u5927\u591a\u6570\u6a21\u578b\u7684\u6700\u4f73\u9009\u62e9\uff1a\u5e73\u57474\u4f4d\uff0c\u8d28\u91cf\u635f\u5931\u6700\u5c0f\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/01.%20quantisation/#quipquip","title":"QuIP\u548cQuIP","text":"<ul> <li> <p>QuIP\uff08Chee\u7b49\u4eba\uff0c2023\uff09\u5f15\u5165\u4e86\u975e\u76f8\u5e72\u5904\u7406\uff1a\u5728\u91cf\u5316\u4e4b\u524d\u4f7f\u7528\u968f\u673a\u6b63\u4ea4\u53d8\u6362\u65cb\u8f6c\u6743\u91cd\u77e9\u9635\u3002\u8fd9\u4f1a\u5c06\u4fe1\u606f\u5206\u6563\u5230\u6240\u6709\u6743\u91cd\u4e0a\uff0c\u9632\u6b62\u5c11\u6570\u5f02\u5e38\u6743\u91cd\u4e3b\u5bfc\u91cf\u5316\u8bef\u5dee\u3002</p> </li> <li> <p>\u76f4\u89c9\uff1a\u5982\u679c\u4e00\u4e2a\u6743\u91cd\u662f100\uff0c\u5176\u4f59\u7684\u5927\u7ea6\u662f1\uff0c\u7528\u76f8\u540c\u7684\u7f29\u653e\u56e0\u5b50\u91cf\u5316\u6240\u6709\u6743\u91cd\u4f1a\u6d6a\u8d39INT4\u7684\u5927\u90e8\u5206\u8303\u56f4\u5728\u5f02\u5e38\u503c\u4e0a\u3002\u7ecf\u8fc7\u6b63\u4ea4\u65cb\u8f6c\uff08\u4fdd\u6301\u77e9\u9635\u7684\u6570\u5b66\u6027\u8d28\uff09\u540e\uff0c\u6240\u6709\u6743\u91cd\u5177\u6709\u76f8\u4f3c\u5e45\u5ea6\uff0c\u5747\u5300\u91cf\u5316\u6548\u679c\u66f4\u597d\u3002</p> </li> <li> <p>QuIP# \u901a\u8fc7\u683c\u70b9\u7801\u672c\u6269\u5c55\u4e86\u8fd9\u4e00\u601d\u60f3\uff1a\u4e0d\u662f\u6620\u5c04\u5230\u5747\u5300\u6574\u6570\u7f51\u683c\uff0c\u800c\u662f\u6620\u5c04\u5230\u6700\u4f18\u683c\u70b9\u4e2d\u7684\u70b9\uff088D\u4e2d\u7684E8\u683c\u70b9\uff09\u3002\u683c\u70b9\u7f16\u7801\u5728\u76f8\u540c\u4f4d\u6570\u5185\u6253\u5305\u66f4\u591a\u91cf\u5316\u70b9\uff0c\u5b9e\u73b0\u4e86\u6bd4\u5747\u5300\u91cf\u5316\u66f4\u597d\u7684\u7387\u5931\u771f\u6027\u80fd\u3002QuIP#\u57282\u4f4d\u7cbe\u5ea6\u4e0b\u8fbe\u5230\u4e86\u53ef\u7528\u8d28\u91cf\u2014\u2014\u5178\u578bINT4\u65b9\u6cd5\u7684\u4e00\u534a\u4f4d\u6570\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/01.%20quantisation/#spqr","title":"SpQR","text":"<ul> <li> <p>SpQR\uff08Dettmers\u7b49\u4eba\uff0c2023\uff09\u89c2\u5bdf\u5230\u6781\u5c0f\u4e00\u90e8\u5206\u6743\u91cd\uff080.1-1%\uff09\u662f\u5f02\u5e38\u503c\uff0c\u5bf9\u8f93\u51fa\u8d28\u91cf\u7684\u8d21\u732e\u4e0d\u6210\u6bd4\u4f8b\u3002SpQR\u4e0d\u662f\u5c06\u6240\u6709\u5185\u5bb9\u91cf\u5316\u5230\u76f8\u540c\u7cbe\u5ea6\uff0c\u800c\u662f\uff1a</p> <ol> <li>\u4f7f\u7528\u654f\u611f\u6027\u5206\u6790\uff08\u91cf\u5316\u8fd9\u4e2a\u6743\u91cd\u4f1a\u6539\u53d8\u5c42\u8f93\u51fa\u591a\u5c11\uff1f\uff09\u8bc6\u522b\u5f02\u5e38\u6743\u91cd\u3002</li> <li>\u4ee5\u5168\u7cbe\u5ea6\uff08FP16\uff09\u7684\u7a00\u758f\u683c\u5f0f\u5b58\u50a8\u5f02\u5e38\u503c\u3002</li> <li>\u5c06\u6240\u6709\u5269\u4f59\u6743\u91cd\u91cf\u5316\u4e3aINT3\u6216INT4\u3002</li> </ol> </li> <li> <p>\u7ed3\u679c\uff1a~99%\u7684\u6743\u91cd\u88ab\u79ef\u6781\u91cf\u5316\uff08\u5c0f\uff09\uff0c\u800c\u5173\u952e\u76841%\u4fdd\u6301\u5168\u7cbe\u5ea6\uff08\u51c6\u786e\uff09\u3002\u7a00\u758f\u5f02\u5e38\u503c\u5b58\u50a8\u589e\u52a0\u7684\u5f00\u9500\u6700\u5c0f\uff08\u5360\u603b\u5927\u5c0f\u7684&lt;5%\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/01.%20quantisation/#hqq","title":"HQQ","text":"<ul> <li> <p>HQQ\uff08\u534a\u4e8c\u6b21\u91cf\u5316\uff0cBadri &amp; Shaji\uff0c2023\uff09\u662f\u4e00\u79cd\u96f6\u6837\u672c\u6743\u91cd\u91cf\u5316\u65b9\u6cd5\uff0c\u5b8c\u5168\u4e0d\u9700\u8981\u6821\u51c6\u6570\u636e\u3002\u5b83\u5c06\u91cf\u5316\u8868\u8ff0\u4e3a\u4e00\u4e2a\u534a\u4e8c\u6b21\u4f18\u5316\u95ee\u9898\uff0c\u8fed\u4ee3\u6c42\u89e3\u6700\u4f18\u91cf\u5316\u6743\u91cd\u548c\u7f29\u653e\u56e0\u5b50\u3002</p> </li> <li> <p>\u4f18\u52bf\uff1a\u65e0\u9700\u6821\u51c6\u96c6\u610f\u5473\u7740\u6ca1\u6709\u6570\u636e\u4f9d\u8d56\uff0c\u5373\u65f6\u91cf\u5316\uff0c\u4e5f\u6ca1\u6709\u6821\u51c6\u6570\u636e\u4e0d\u5339\u914d\u7684\u98ce\u9669\u3002HQQ\u5bf9\u4e8e\u65e0\u6cd5\u83b7\u5f97\u4ee3\u8868\u6027\u6821\u51c6\u6570\u636e\u6216\u6570\u636e\u654f\u611f\u578b\u7684\u6a21\u578b\u7279\u522b\u6709\u7528\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/01.%20quantisation/#aqlm","title":"AQLM","text":"<ul> <li>AQLM\uff08Egiazarian\u7b49\u4eba\uff0c2024\uff09\u5c06\u52a0\u6cd5\u91cf\u5316\uff08\u591a\u7801\u672c\u5411\u91cf\u91cf\u5316\uff09\u5e94\u7528\u4e8eLLM\u3002AQLM\u4e0d\u662f\u72ec\u7acb\u91cf\u5316\u6bcf\u4e2a\u6743\u91cd\uff0c\u800c\u662f\u5c06\u6743\u91cd\u5206\u7ec4\u4e3a\u5411\u91cf\uff0c\u5e76\u5c06\u6bcf\u4e2a\u5411\u91cf\u8868\u793a\u4e3a\u6765\u81ea\u591a\u4e2a\u5b66\u4e60\u5230\u7684\u7801\u672c\u7684\u6761\u76ee\u4e4b\u548c\uff1a</li> </ul> \\[\\mathbf{w} \\approx \\mathbf{c}_1^{(1)} + \\mathbf{c}_2^{(2)} + \\cdots + \\mathbf{c}_M^{(M)}\\] <ul> <li>\u5176\u4e2d\\(\\mathbf{c}_i^{(m)}\\)\u662f\u6765\u81ea\u7801\u672c\\(m\\)\u7684\u4e00\u4e2a\u6761\u76ee\u3002\u6709\\(M = 2\\)\u4e2a\u7801\u672c\uff0c\u6bcf\u4e2a\u6709256\u4e2a\u6761\u76ee\uff0c\u4e00\u4e2a8\u5143\u7d20\u5411\u91cf\u88ab\u7f16\u7801\u4e3a\u4e24\u4e2a8\u4f4d\u7d22\u5f15 = 8\u4e2a\u6743\u91cd2\u5b57\u8282 = \u6bcf\u4e2a\u6743\u91cd\u6709\u65482\u4f4d\u3002AQLM\u57282\u4f4d\u7cbe\u5ea6\u4e0b\u8fbe\u5230\u4e86\u6700\u5148\u8fdb\u7684\u8d28\u91cf\uff0c\u5728\u8fd9\u4e2a\u6781\u9650\u538b\u7f29\u6c34\u5e73\u4e0a\u4f18\u4e8eGPTQ\u548cAWQ\u3002</li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/01.%20quantisation/#bitnet1llm","title":"BitNet\u548c1\u4f4dLLM","text":"<ul> <li> <p>BitNet\uff08Wang\u7b49\u4eba\uff0c2023\uff09\u5c06\u91cf\u5316\u63a8\u5411\u6781\u81f4\uff1a\u6743\u91cd\u662f\u4e09\u503c\u7684\uff08\\(\\{-1, 0, +1\\}\\)\uff09\uff0c\u6bcf\u4e2a\u6743\u91cd\u4ec5\u9700\u7ea61.58\u4f4d\u3002\u77e9\u9635\u4e58\u6cd5\u53d8\u6210\u53ea\u6709\u52a0\u6cd5\u548c\u51cf\u6cd5\u2014\u2014\u4e0d\u9700\u8981\u6d6e\u70b9\u4e58\u6cd5\u3002</p> </li> <li> <p>BitNet b1.58\uff08Ma\u7b49\u4eba\uff0c2024\uff09\u5c06\u6bcf\u4e2a\u6743\u91cd\u7ea6\u675f\u4e3a\\(\\{-1, 0, +1\\}\\)\u3002\"1.58\u4f4d\"\u6765\u81ea\\(\\log_2(3) \\approx 1.58\\)\u3002\u5728\u8fd9\u4e2a\u7cbe\u5ea6\u4e0b\uff0c\u4e00\u4e2a70B\u6a21\u578b\u9002\u5408\u7ea615 GB\uff0c\u63a8\u7406\u4e0d\u9700\u8981\u4e58\u6cd5\u8fd0\u7b97\u2014\u2014\u53ea\u9700\u52a0\u3001\u51cf\u548c\u7b26\u53f7\u7ffb\u8f6c\u3002</p> </li> <li> <p>\u77e9\u9635\u4e58\u6cd5\u53d8\u6210\uff1a</p> </li> </ul> \\[y_j = \\sum_i W_{ij} \\cdot x_i = \\sum_{i: W_{ij}=+1} x_i - \\sum_{i: W_{ij}=-1} x_i\\] <ul> <li>\u8fd9\u6bd4\u5728\u4efb\u4f55\u786c\u4ef6\u4e0a\u7684FP16\u77e9\u9635\u4e58\u6cd5\u90fd\u8981\u4fbf\u5b9c\u5f97\u591a\uff0c\u5e76\u4e14\u53ef\u4ee5\u5728\u6ca1\u6709\u6d6e\u70b9\u5355\u5143\u7684\u8bbe\u5907\u4e0a\u5b9e\u73b0LLM\u63a8\u7406\u3002\u5bf9\u4e8e\u5f53\u524d\u6a21\u578b\uff0c\u8d28\u91cf\u6743\u8861\u662f\u663e\u8457\u7684\uff0c\u4f46\u968f\u7740\u89c4\u6a21\u548c\u8bad\u7ec3\u65f6\u91cf\u5316\u611f\u77e5\u80fd\u529b\u7684\u63d0\u9ad8\u800c\u6539\u5584\u3002</li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/01.%20quantisation/#mx","title":"\u5fae\u7f29\u653e\uff08MX\uff09\u683c\u5f0f","text":"<ul> <li>\u5fae\u7f29\u653e\uff08MX\uff09\u683c\u5f0f\u662f\u4e00\u79cd\u65b0\u7684\u884c\u4e1a\u6807\u51c6\uff08\u7531AMD\u3001Arm\u3001Intel\u3001Meta\u3001Microsoft\u3001NVIDIA\u3001Qualcomm\u652f\u6301\uff09\uff0c\u4f7f\u7528\u5757\u6d6e\u70b9\uff1a\u4e00\u7ec4\u5143\u7d20\u5171\u4eab\u4e00\u4e2a\u6307\u6570\uff0c\u6bcf\u4e2a\u5143\u7d20\u6709\u81ea\u5df1\u7684\u5c3e\u6570\u3002</li> </ul> \u683c\u5f0f \u5171\u4eab\u6307\u6570 \u5143\u7d20\u4f4d\u6570 \u603b\u8ba1\uff08\u6bcf\u5143\u7d20\uff09 \u7b49\u4ef7 MXFP8 \u6bcf\u57578\u4f4d 8\uff08E4M3/E5M2\uff09 ~8 \u7c7b\u4f3cFP8\uff0c\u8303\u56f4\u66f4\u597d MXFP6 \u6bcf\u57578\u4f4d 6 ~6.5 \u4ecb\u4e8eFP8\u548cINT4\u4e4b\u95f4 MXFP4 \u6bcf\u57578\u4f4d 4 ~4.5 \u7c7b\u4f3cINT4\uff0c\u4f46\u6709\u6d6e\u70b9\u884c\u4e3a MXINT8 \u6bcf\u57578\u4f4d 8\uff08\u6574\u6570\uff09 ~8.5 INT8\uff0c\u5e26\u5171\u4eab\u7f29\u653e <ul> <li>\u5171\u4eab\u6307\u6570\u5c06\u6307\u6570\u6210\u672c\u5206\u644a\u5230\u4e00\u4e2a\u5757\uff08\u901a\u5e3816-32\u4e2a\u5143\u7d20\uff09\u3002\u6bcf\u4e2a\u5143\u7d20\u6bd4\u5355\u72ec\u6307\u6570\u65f6\u4fdd\u7559\u66f4\u591a\u5c3e\u6570\u4f4d\uff0c\u6bcf\u4f4d\u7684\u7cbe\u5ea6\u66f4\u597d\u3002MX\u683c\u5f0f\u9884\u8ba1\u5c06\u5728\u672a\u6765\u786c\u4ef6\u4e2d\u66ff\u4ee3\u5355\u72ec\u7684FP8\u548cINT8\u683c\u5f0f\u3002</li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/01.%20quantisation/#fp8","title":"FP8\u8bad\u7ec3","text":"<ul> <li> <p>\u5728FP8\u4e2d\u8bad\u7ec3\uff08\u4e0d\u4ec5\u4ec5\u662f\u63a8\u7406\uff09\u73b0\u5728\u5728NVIDIA Hopper\u548cBlackwell GPU\u4e0a\u53ef\u884c\u3002\u65b9\u6848\u5982\u4e0b\uff1a</p> <ul> <li> <p>\u524d\u5411\u4f20\u64ad\uff1a\u6743\u91cd\u548c\u6fc0\u6d3b\u503c\u4f7f\u7528E4M3\uff08\u66f4\u9ad8\u7cbe\u5ea6\uff0c\u66f4\u7a84\u8303\u56f4\uff09\u3002Transformer Engine\u4f7f\u7528\u5ef6\u8fdf\u7f29\u653e\uff08\u8ddf\u8e2a\u4e0a\u4e00\u6b21\u8fed\u4ee3\u7684\u7edf\u8ba1\u4fe1\u606f\uff0c\u5e94\u7528\u4e8e\u5f53\u524d\u8fed\u4ee3\uff09\u52a8\u6001\u8ba1\u7b97\u6bcf\u5f20\u91cf\u7f29\u653e\u56e0\u5b50\u3002</p> </li> <li> <p>\u53cd\u5411\u4f20\u64ad\uff1a\u68af\u5ea6\u4f7f\u7528E5M2\uff08\u66f4\u5bbd\u8303\u56f4\uff0c\u66f4\u4f4e\u7cbe\u5ea6\uff09\u3002\u68af\u5ea6\u7684\u503c\u8303\u56f4\u6bd4\u6743\u91cd/\u6fc0\u6d3b\u503c\u66f4\u5e7f\uff0c\u56e0\u6b64\u989d\u5916\u7684\u6307\u6570\u4f4d\u9632\u6b62\u6ea2\u51fa\u3002</p> </li> <li> <p>\u4e3b\u6743\u91cd\uff1a\u4ee5FP32\u7ef4\u62a4\uff0c\u7528\u4e8e\u4f18\u5316\u5668\u72b6\u6001\uff08\u5c31\u50cf\u4f7f\u7528FP16\u7684\u6807\u51c6\u6df7\u5408\u7cbe\u5ea6\u8bad\u7ec3\uff0c\u7b2c6\u7ae0\uff09\u3002FP8\u8ba1\u7b97\u4ec5\u7528\u4e8e\u77e9\u9635\u4e58\u6cd5\uff0c\u4e0d\u7528\u4e8e\u6743\u91cd\u66f4\u65b0\u3002</p> </li> <li> <p>\u635f\u5931\u7f29\u653e\uff1aFP8\u4ecd\u7136\u9700\u8981\uff0c\u5c31\u50cfFP16\u4e00\u6837\u3002\u52a8\u6001\u635f\u5931\u7f29\u653e\u5668\u8c03\u6574\u7f29\u653e\u56e0\u5b50\uff0c\u4f7f\u68af\u5ea6\u503c\u4fdd\u6301\u5728FP8\u7684\u53ef\u8868\u793a\u8303\u56f4\u5185\u3002</p> </li> </ul> </li> <li> <p>FP8\u8bad\u7ec3\u5728\u5927\u591a\u6570\u6a21\u578b\u89c4\u6a21\u4e0a\u8fbe\u5230\u4e0eBF16\u8bad\u7ec3\u76f8\u5f53\u7684\u8d28\u91cf\uff0c\u541e\u5410\u91cf\u63d0\u9ad8\u7ea62\u500d\u3002\u5b83\u662f\u5728H100\u96c6\u7fa4\u4e0a\u8fdb\u884c\u65b0\u7684\u5927\u89c4\u6a21\u8bad\u7ec3\u8fd0\u884c\u7684\u9ed8\u8ba4\u9009\u62e9\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/01.%20quantisation/#_7","title":"\u6fc0\u6d3b\u503c\u91cf\u5316","text":"<ul> <li> <p>\u6fc0\u6d3b\u503c\uff08\u5c42\u4e4b\u95f4\u6d41\u52a8\u7684\u4e2d\u95f4\u5f20\u91cf\uff09\u4e5f\u53ef\u4ee5\u91cf\u5316\uff0c\u5b9e\u73b0\u5b8c\u5168INT8\u8ba1\u7b97\uff08\u6743\u91cd\u548c\u6fc0\u6d3b\u503c\u90fd\u662fINT8\uff0cINT32\u7d2f\u52a0\uff09\u3002</p> </li> <li> <p>\u52a8\u6001\u91cf\u5316\uff1a\u5728\u8fd0\u884c\u65f6\u6839\u636e\u5b9e\u9645\u6fc0\u6d3b\u503c\u8ba1\u7b97\u7f29\u653e\u56e0\u5b50\u3002\u66f4\u51c6\u786e\uff08\u9002\u5e94\u6bcf\u4e2a\u8f93\u5165\uff09\uff0c\u4f46\u589e\u52a0\u5f00\u9500\uff08\u6bcf\u5c42\u8ba1\u7b97\u6700\u5c0f\u503c/\u6700\u5927\u503c\u6216\u767e\u5206\u4f4d\u6570\uff09\u3002</p> </li> <li> <p>\u9759\u6001\u91cf\u5316\uff1a\u5728\u6821\u51c6\u671f\u95f4\u8ba1\u7b97\u4e00\u6b21\u7f29\u653e\u56e0\u5b50\u5e76\u56fa\u5b9a\u3002\u63a8\u7406\u65f6\u66f4\u5feb\uff08\u65e0\u9700\u8fd0\u884c\u65f6\u7edf\u8ba1\uff09\uff0c\u4f46\u5982\u679c\u6821\u51c6\u6570\u636e\u4e0d\u5177\u4ee3\u8868\u6027\u5219\u7cbe\u5ea6\u8f83\u4f4e\u3002</p> </li> <li> <p>\u9010token\u91cf\u5316\uff1a\u4e3a\u5e8f\u5217\u4e2d\u7684\u6bcf\u4e2atoken\u8ba1\u7b97\u5355\u72ec\u7684\u7f29\u653e\u56e0\u5b50\u3002\u5bf9LLM\u81f3\u5173\u91cd\u8981\uff0c\u56e0\u4e3a\u4e0d\u540ctoken\u7684\u6fc0\u6d3b\u503c\u5e45\u5ea6\u53ef\u80fd\u5dee\u5f02\u5f88\u5927\uff08\u67d0\u4e9btoken\u7684\u6fc0\u6d3b\u503c\u6bd4\u5176\u4ed6token\u5927100\u500d\uff09\u3002</p> </li> <li> <p>\u6fc0\u6d3b\u503c\u91cf\u5316\u6bd4\u6743\u91cd\u91cf\u5316\u66f4\u96be\uff0c\u56e0\u4e3a\u6fc0\u6d3b\u503c\u4f9d\u8d56\u4e8e\u6570\u636e\uff08\u5b83\u4eec\u968f\u6bcf\u4e2a\u8f93\u5165\u53d8\u5316\uff09\uff0c\u800c\u6743\u91cd\u662f\u56fa\u5b9a\u7684\u3002\"\u5f02\u5e38\u503c\"\u95ee\u9898\u5c24\u5176\u4e25\u91cd\uff1a\u5c11\u6570\u6fc0\u6d3b\u901a\u9053\u5177\u6709\u6781\u503c\uff08\u5e73\u5747\u503c\u7684100\u500d\uff09\uff0c\u7528\u4e0e\u6b63\u5e38\u901a\u9053\u76f8\u540c\u7684\u7f29\u653e\u56e0\u5b50\u91cf\u5316\u5b83\u4eec\u4f1a\u6d6a\u8d39\u7cbe\u5ea6\u3002</p> </li> <li> <p>SmoothQuant\uff08Xiao\u7b49\u4eba\uff0c2022\uff09\u901a\u8fc7\u6570\u5b66\u4e0a\u5c06\u91cf\u5316\u96be\u5ea6\u4ece\u6fc0\u6d3b\u503c\uff08\u7531\u4e8e\u5f02\u5e38\u503c\u96be\u4ee5\u91cf\u5316\uff09\u8fc1\u79fb\u5230\u6743\u91cd\uff08\u6613\u4e8e\u91cf\u5316\uff09\u6765\u89e3\u51b3\u5f02\u5e38\u503c\u95ee\u9898\uff1a\u5c06\u6fc0\u6d3b\u503c\u4e58\u4ee5\\(1/s\\)\uff0c\u6743\u91cd\u4e58\u4ee5\\(s\\)\uff0c\u5176\u4e2d\\(s\\)\u5e73\u8861\u96be\u5ea6\u3002\u8f93\u51fa\\(XW = (X \\cdot \\text{diag}(s^{-1})) \\cdot (\\text{diag}(s) \\cdot W)\\)\u4fdd\u6301\u4e0d\u53d8\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/01.%20quantisation/#_8","title":"\u6df7\u5408\u7cbe\u5ea6\u91cf\u5316","text":"<ul> <li> <p>\u5e76\u975e\u6240\u6709\u5c42\u5bf9\u91cf\u5316\u7684\u654f\u611f\u5ea6\u76f8\u540c\u3002\u6ce8\u610f\u529b\u5c42\u901a\u5e38\u53ef\u4ee5\u5bb9\u5fcdINT4\uff0c\u800c\u5d4c\u5165\u5c42\u548c\u6700\u7ec8\u5206\u7c7b\u5668\u9700\u8981\u66f4\u9ad8\u7cbe\u5ea6\u3002</p> </li> <li> <p>\u654f\u611f\u6027\u5206\u6790\uff1a\u9010\u5c42\u91cf\u5316\u5e76\u6d4b\u91cf\u7cbe\u5ea6\u5f71\u54cd\u3002\u654f\u611f\u6027\u9ad8\u7684\u5c42\u83b7\u5f97\u66f4\u591a\u4f4d\uff1b\u4e0d\u654f\u611f\u7684\u5c42\u83b7\u5f97\u66f4\u5c11\u4f4d\u3002</p> </li> <li> <p>Transformer Engine\uff08\u7b2c16\u7ae0\uff0cNVIDIA Hopper\uff09\u5728\u64cd\u4f5c\u7ea7\u522b\u5b9e\u73b0\u52a8\u6001\u6df7\u5408\u7cbe\u5ea6\uff1a\u6bcf\u4e2a\u77e9\u9635\u4e58\u6cd5\u6839\u636e\u5f20\u91cf\u7edf\u8ba1\u4fe1\u606f\u5728FP8\u548cFP16\u4e4b\u95f4\u9009\u62e9\uff0c\u6700\u5927\u5316\u541e\u5410\u91cf\u540c\u65f6\u4fdd\u6301\u8d28\u91cf\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/01.%20quantisation/#kv","title":"KV\u7f13\u5b58\u91cf\u5316","text":"<ul> <li>\u5728LLM\u751f\u6210\u8fc7\u7a0b\u4e2d\uff0cKV\u7f13\u5b58\u5b58\u50a8\u6240\u6709\u5148\u524dtoken\u7684\u952e\u548c\u503c\u5f20\u91cf\u3002\u5bf9\u4e8e\u957f\u5e8f\u5217\uff0c\u8fd9\u4e3b\u5bfc\u4e86\u5185\u5b58\uff1a</li> </ul> \\[\\text{KV\u7f13\u5b58\u5927\u5c0f} = 2 \\times n_{\\text{layers}} \\times n_{\\text{heads}} \\times d_{\\text{head}} \\times \\text{seq\\_len} \\times \\text{bytes\\_per\\_element}\\] <ul> <li> <p>\u4e00\u4e2a70B\u6a21\u578b\uff0c80\u5c42\uff0c64\u5934\uff0c128\u7ef4\u5934\uff0c\u5e8f\u5217\u957f\u5ea6128K\uff0cFP16\uff1a\\(2 \\times 80 \\times 64 \\times 128 \\times 131072 \\times 2 = 330\\) GB\u3002\u8fd9\u8d85\u8fc7\u4e86GPU\u5185\u5b58\u3002</p> </li> <li> <p>KV\u7f13\u5b58\u91cf\u5316\u901a\u8fc7\u5c06\u7f13\u5b58\u7684\u952e\u548c\u503c\u4ee5INT8\u6216INT4\u800c\u4e0d\u662fFP16\u5b58\u50a8\u6765\u51cf\u5c11\u5185\u5b58\u3002\u91cf\u5316\u8bef\u5dee\u5728\u5e8f\u5217\u4e2d\u7d2f\u79ef\uff08\u6bcf\u4e2a\u65b0token\u5173\u6ce8\u6240\u6709\u7f13\u5b58\u7684K/V\uff09\uff0c\u4f46\u4f7f\u7528\u9010\u901a\u9053\u6216\u9010\u5934\u91cf\u5316\u540e\uff0c\u964d\u7ea7\u662f\u53ef\u4ee5\u63a5\u53d7\u7684\u3002</p> </li> <li> <p>KV\u7f13\u5b58\u91cf\u5316\u5177\u6709\u4e58\u6cd5\u7ea7\u6536\u76ca\uff1a\u5b83\u652f\u6301\u66f4\u957f\u7684\u5e8f\u5217\uff08\u66f4\u591a\u4e0a\u4e0b\u6587\uff09\u3001\u66f4\u5927\u7684\u6279\u6b21\u5927\u5c0f\uff08\u66f4\u591a\u5e76\u53d1\u7528\u6237\uff09\u548c\u66f4\u5feb\u7684\u63a8\u7406\uff08\u52a0\u8f7d\u7f13\u5b58\u6240\u9700\u7684\u5185\u5b58\u5e26\u5bbd\u66f4\u5c11\uff09\u3002\u8fd9\u662fLLM\u670d\u52a1\u4e2d\u5f71\u54cd\u6700\u5927\u7684\u4f18\u5316\u4e4b\u4e00\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/01.%20quantisation/#colabnotebook","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216notebook\uff09","text":"<ol> <li> <p>\u4ece\u5934\u5b9e\u73b0\u5bf9\u79f0INT8\u91cf\u5316\u3002\u91cf\u5316\u4e00\u4e2a\u6743\u91cd\u77e9\u9635\uff0c\u53cd\u91cf\u5316\u5b83\uff0c\u5e76\u6d4b\u91cf\u4f5c\u4e3a\u503c\u5206\u5e03\u51fd\u6570\u7684\u91cd\u5efa\u8bef\u5dee\u3002 <pre><code>import jax.numpy as jnp\nimport jax\n\ndef quantise_int8(tensor):\n    scale = jnp.max(jnp.abs(tensor)) / 127.0\n    quantised = jnp.clip(jnp.round(tensor / scale), -127, 127).astype(jnp.int8)\n    return quantised, scale\n\ndef dequantise(quantised, scale):\n    return quantised.astype(jnp.float32) * scale\n\n# \u6b63\u5e38\u6743\u91cd\uff08\u5178\u578b\u8bad\u7ec3\u6a21\u578b\uff09\nkey = jax.random.PRNGKey(0)\nweights = jax.random.normal(key, (1024, 1024)) * 0.02\n\nq, s = quantise_int8(weights)\nrecon = dequantise(q, s)\n\nprint(f\"\u539f\u59cb:     {weights.nbytes / 1024:.0f} KB\")\nprint(f\"\u91cf\u5316\u540e:    {q.nbytes / 1024:.0f} KB ({weights.nbytes / q.nbytes:.0f}x \u66f4\u5c0f)\")\nprint(f\"\u5e73\u5747\u7edd\u5bf9\u8bef\u5dee: {jnp.abs(weights - recon).mean():.6f}\")\nprint(f\"\u6700\u5927\u7edd\u5bf9\u8bef\u5dee:  {jnp.abs(weights - recon).max():.6f}\")\nprint(f\"\u76f8\u5bf9\u8bef\u5dee: {jnp.abs(weights - recon).mean() / jnp.abs(weights).mean():.4%}\")\n</code></pre></p> </li> <li> <p>\u6f14\u793a\u5f02\u5e38\u503c\u95ee\u9898\u3002\u521b\u5efa\u5177\u6709\u51e0\u4e2a\u6781\u7aef\u901a\u9053\u7684\u6fc0\u6d3b\u503c\uff0c\u5c55\u793a\u9010\u5f20\u91cf\u91cf\u5316\u5931\u8d25\u800c\u9010\u901a\u9053\u91cf\u5316\u6210\u529f\u3002 <pre><code>import jax.numpy as jnp\nimport jax\n\nkey = jax.random.PRNGKey(42)\n\n# \u6fc0\u6d3b\u503c\uff1a\u5927\u591a\u6570\u901a\u9053\u6b63\u5e38\uff0c2\u4e2a\u901a\u9053\u6709100x\u5f02\u5e38\u503c\nactivations = jax.random.normal(key, (32, 512)) * 0.1\nactivations = activations.at[:, 0].set(activations[:, 0] * 100)   # \u5f02\u5e38\u901a\u9053\nactivations = activations.at[:, 1].set(activations[:, 1] * 50)    # \u5f02\u5e38\u901a\u9053\n\n# \u9010\u5f20\u91cf\u91cf\u5316\uff08\u6574\u4e2a\u5f20\u91cf\u4e00\u4e2a\u7f29\u653e\u56e0\u5b50\uff09\nscale_tensor = jnp.max(jnp.abs(activations)) / 127.0\nq_tensor = jnp.clip(jnp.round(activations / scale_tensor), -127, 127)\nrecon_tensor = q_tensor * scale_tensor\n\n# \u9010\u901a\u9053\u91cf\u5316\uff08\u6bcf\u901a\u9053\u4e00\u4e2a\u7f29\u653e\u56e0\u5b50\uff09\nscales_channel = jnp.max(jnp.abs(activations), axis=0) / 127.0\nq_channel = jnp.clip(jnp.round(activations / scales_channel), -127, 127)\nrecon_channel = q_channel * scales_channel\n\nerr_tensor = jnp.abs(activations - recon_tensor).mean()\nerr_channel = jnp.abs(activations - recon_channel).mean()\n\nprint(f\"\u9010\u5f20\u91cf\u8bef\u5dee: {err_tensor:.6f}\")\nprint(f\"\u9010\u901a\u9053\u8bef\u5dee: {err_channel:.6f}\")\nprint(f\"\u9010\u901a\u9053\u597d {err_tensor / err_channel:.1f}x\")\nprint(f\"\\n\u5f02\u5e38\u901a\u9053\u6d6a\u8d39\u4e86 {(activations.shape[1] - 2) / activations.shape[1]:.0%} \"\n      f\"\u7684\u91cf\u5316\u8303\u56f4\u7ed9 {2 / activations.shape[1]:.1%} \u7684\u901a\u9053\")\n</code></pre></p> </li> <li> <p>\u8ba1\u7b97\u4e0d\u540c\u6a21\u578b\u5927\u5c0f\u548c\u5e8f\u5217\u957f\u5ea6\u7684KV\u7f13\u5b58\u5185\u5b58\u3002\u5c55\u793a\u4e3a\u4ec0\u4e48KV\u7f13\u5b58\u91cf\u5316\u5bf9\u957f\u4e0a\u4e0b\u6587\u6a21\u578b\u81f3\u5173\u91cd\u8981\u3002 <pre><code>def kv_cache_gb(n_layers, n_heads, d_head, seq_len, bytes_per_elem):\n    return 2 * n_layers * n_heads * d_head * seq_len * bytes_per_elem / 1e9\n\nmodels = [\n    (\"Llama-7B\",  32, 32, 128),\n    (\"Llama-70B\", 80, 64, 128),\n    (\"GPT-4 (\u4f30\u8ba1)\", 120, 96, 128),\n]\n\nprint(f\"{'\u6a21\u578b':&lt;15} {'\u5e8f\u5217\u957f\u5ea6':&gt;8} {'FP16 (GB)':&gt;10} {'INT8 (GB)':&gt;10} {'INT4 (GB)':&gt;10}\")\nprint(\"-\" * 60)\n\nfor name, layers, heads, d_head in models:\n    for seq_len in [4096, 32768, 131072]:\n        fp16 = kv_cache_gb(layers, heads, d_head, seq_len, 2)\n        int8 = kv_cache_gb(layers, heads, d_head, seq_len, 1)\n        int4 = kv_cache_gb(layers, heads, d_head, seq_len, 0.5)\n        print(f\"{name:&lt;15} {seq_len:&gt;8} {fp16:&gt;9.1f}  {int8:&gt;9.1f}  {int4:&gt;9.1f}\")\n    print()\n</code></pre></p> </li> </ol>"},{"location":"chapter%2017%3A%20AI%20inference/02.%20efficient%20architectures/","title":"\u9ad8\u6548\u67b6\u6784","text":"<p>\u8ba9\u6a21\u578b\u66f4\u5feb\u4e0d\u4ec5\u4ec5\u662f\u964d\u4f4e\u7cbe\u5ea6\uff0c\u8fd8\u5728\u4e8e\u8bbe\u8ba1\u66f4\u667a\u80fd\u7684\u67b6\u6784\uff0c\u4f7f\u6bcf\u4e2atoken\u7684\u8ba1\u7b97\u91cf\u66f4\u5c11\u3002\u672c\u6587\u6db5\u76d6StreamingLLM\u3001\u7a00\u758f\u548c\u7ebf\u6027\u6ce8\u610f\u529b\u3001\u591a\u67e5\u8be2\u548c\u5206\u7ec4\u67e5\u8be2\u6ce8\u610f\u529b\u3001\u63a8\u7406\u65f6\u7684\u6df7\u5408\u4e13\u5bb6\u3001\u77e5\u8bc6\u84b8\u998f\u3001\u526a\u679d\u548c\u795e\u7ecf\u67b6\u6784\u641c\u7d22</p> <ul> <li>\u91cf\u5316\uff08\u6587\u4ef61\uff09\u4f7f\u6bcf\u4e2a\u64cd\u4f5c\u66f4\u5ec9\u4ef7\u3002\u672c\u6587\u4ece\u6e90\u5934\u4e0a\u51cf\u5c11\u64cd\u4f5c\u6570\u91cf\u3002\u4e24\u8005\u4e92\u8865\uff1a\u4e00\u4e2a\u67b6\u6784\u9ad8\u6548\u4e14\u91cf\u5316\u7684\u6a21\u578b\u53ef\u4ee5\u6bd4\u539f\u59cb\u6a21\u578b\u5feb10-100\u500d\u3002</li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/02.%20efficient%20architectures/#streamingllm","title":"StreamingLLM\uff1a\u65e0\u9650\u957f\u5ea6\u751f\u6210","text":"<ul> <li> <p>\u6807\u51c6Transformer\u5c06\u6240\u6709\u5148\u524d\u7684token\u5b58\u50a8\u5728KV\u7f13\u5b58\u4e2d\uff0cKV\u7f13\u5b58\u968f\u5e8f\u5217\u957f\u5ea6\u7ebf\u6027\u589e\u957f\u3002\u5728\u67d0\u4e00\u70b9\u4e0a\uff0c\u7f13\u5b58\u8d85\u8fc7GPU\u5185\u5b58\uff0c\u751f\u6210\u5931\u8d25\u3002StreamingLLM\uff08Xiao\u7b49\u4eba\uff0c2023\uff09\u4f7f\u7528\u56fa\u5b9a\u5927\u5c0f\u7684\u6eda\u52a8KV\u7f13\u5b58\u89e3\u51b3\u4e86\u8fd9\u4e2a\u95ee\u9898\u3002</p> </li> <li> <p>\u5173\u952e\u89c2\u5bdf\uff1a\u5e8f\u5217\u4e2d\u7684\u524d\u51e0\u4e2atoken\uff0c\u65e0\u8bba\u5176\u5185\u5bb9\u5982\u4f55\uff0c\u90fd\u83b7\u5f97\u4e0d\u6210\u6bd4\u4f8b\u7684\u9ad8\u6ce8\u610f\u529b\u5206\u6570\u3002\u8fd9\u4e9b\u88ab\u79f0\u4e3a\u6ce8\u610f\u529b\u6c47\u805a\u70b9\u3002\u5982\u679c\u5c06\u5b83\u4eec\u4ece\u7f13\u5b58\u4e2d\u9010\u51fa\uff0c\u6ce8\u610f\u529b\u5206\u5e03\u4f1a\u5d29\u6e83\uff0c\u751f\u6210\u8d28\u91cf\u707e\u96be\u6027\u4e0b\u964d\u3002</p> </li> <li> <p>StreamingLLM\u7684\u89e3\u51b3\u65b9\u6848\uff1a\u5728\u7f13\u5b58\u4e2d\u6c38\u4e45\u4fdd\u7559\u5c11\u91cf\u6c47\u805atoken\uff08\u524d1-4\u4e2atoken\uff09\uff0c\u52a0\u4e0a\u6700\u8fd1\\(w\\)\u4e2atoken\u7684\u6eda\u52a8\u7a97\u53e3\u3002\u603b\u7f13\u5b58\u5927\u5c0f\u4e3a\\(\\text{sink} + w\\)\uff0c\u65e0\u8bba\u751f\u6210\u4e86\u591a\u5c11token\u90fd\u662f\u56fa\u5b9a\u7684\u3002</p> </li> </ul> \\[\\text{\u7f13\u5b58} = [\\text{token}_0, \\text{token}_1, \\text{token}_{t-w+1}, \\ldots, \\text{token}_t]\\] <ul> <li> <p>\u6ce8\u610f\u529b\u6c47\u805a\u70b9\u951a\u5b9asoftmax\u5206\u5e03\uff0c\u6eda\u52a8\u7a97\u53e3\u63d0\u4f9b\u6700\u8fd1\u7684\u4e0a\u4e0b\u6587\u3002\u8fd9\u5b9e\u73b0\u4e86\u65e0\u9650\u957f\u5ea6\u751f\u6210\uff0c\u5185\u5b58\u6052\u5b9a\uff0c\u4ee3\u4ef7\u662f\u5931\u53bb\u4e86\u8bbf\u95ee\u5e8f\u5217\u4e2d\u95f4\u4e0a\u4e0b\u6587\u7684\u80fd\u529b\u3002</p> </li> <li> <p>StreamingLLM\u65e0\u9700\u91cd\u65b0\u8bad\u7ec3\u5373\u53ef\u7528\u4e8e\u81ea\u7136\u5f62\u6210\u6ce8\u610f\u529b\u6c47\u805a\u70b9\u7684\u6a21\u578b\uff08\u5927\u591a\u6570\u9884\u8bad\u7ec3LLM\u90fd\u4f1a\uff09\u3002\u5bf9\u4e8e\u4e0d\u5f62\u6210\u6c47\u805a\u70b9\u7684\u6a21\u578b\uff0c\u5728\u8bad\u7ec3\u671f\u95f4\u6dfb\u52a0\u4e00\u4e2a\u53ef\u5b66\u4e60\u7684\u6c47\u805atoken\u5373\u53ef\u89e3\u51b3\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/02.%20efficient%20architectures/#_2","title":"\u7a00\u758f\u6ce8\u610f\u529b","text":"<ul> <li>\u5168\u81ea\u6ce8\u610f\u529b\u5728\u5e8f\u5217\u957f\u5ea6\\(n\\)\u4e0a\u662f\\(O(n^2)\\)\uff0c\u56e0\u4e3a\u6bcf\u4e2atoken\u5173\u6ce8\u6240\u6709\u5176\u4ed6token\u3002\u5bf9\u4e8e\\(n = 128K\\)\uff0c\u6ce8\u610f\u529b\u77e9\u9635\u6709\\(128K^2 = 160\\)\u4ebf\u4e2a\u6761\u76ee\u3002\u7a00\u758f\u6ce8\u610f\u529b\u6a21\u5f0f\u901a\u8fc7\u9650\u5236\u54ea\u4e9btoken\u5173\u6ce8\u54ea\u4e9btoken\u6765\u51cf\u5c11\u8fd9\u4e2a\u6570\u91cf\u3002</li> </ul> <ul> <li> <p>\u6ed1\u52a8\u7a97\u53e3\u6ce8\u610f\u529b\uff08Mistral\u3001Gemma\uff09\uff1a\u6bcf\u4e2atoken\u53ea\u5173\u6ce8\u4e4b\u524d\\(w\\)\u4e2atoken\uff08\u4f8b\u5982\\(w = 4096\\)\uff09\u3002\u6ce8\u610f\u529b\u662f\\(O(n \\cdot w)\\)\u800c\u4e0d\u662f\\(O(n^2)\\)\u3002\u4fe1\u606f\u901a\u8fc7\u591a\u5c42\u5728\u7a97\u53e3\u4e4b\u5916\u4f20\u64ad\uff1a\u7ecf\u8fc7\\(L\\)\u5c42\u540e\uff0c\u6709\u6548\u4e0a\u4e0b\u6587\u4e3a\\(L \\times w\\)\u3002</p> </li> <li> <p>\u5c40\u90e8+\u5168\u5c40\u6ce8\u610f\u529b\uff08Longformer\u3001BigBird\uff09\uff1a\u5927\u591a\u6570token\u4f7f\u7528\u6ed1\u52a8\u7a97\u53e3\u6ce8\u610f\u529b\uff08\u5c40\u90e8\uff09\uff0c\u4f46\u5c11\u6570\u6307\u5b9atoken\uff08\u4f8b\u5982[CLS]\uff0c\u6bcf512\u4e2atoken\uff09\u5173\u6ce8\u6240\u6709token\uff08\u5168\u5c40\uff09\u3002\u8fd9\u540c\u65f6\u6355\u83b7\u4e86\u5c40\u90e8\u6a21\u5f0f\u548c\u957f\u8ddd\u79bb\u4f9d\u8d56\u3002</p> </li> <li> <p>\u81a8\u80c0\u6ce8\u610f\u529b\uff1a\u5173\u6ce8\u7a97\u53e3\u5185\u6bcf\u7b2c\\(k\\)\u4e2atoken\uff0c\u521b\u5efa\u4e00\u4e2a\u8986\u76d6\u66f4\u5927\u8303\u56f4\u4f46\u6ce8\u610f\u529b\u5206\u6570\u6570\u91cf\u76f8\u540c\u7684\u7a00\u758f\u6a21\u5f0f\u3002\u8de8\u5c42\u589e\u52a0\u81a8\u80c0\u5ea6\u521b\u5efa\u7c7b\u4f3c\u4e8e\u81a8\u80c0\u5377\u79ef\u7684\u5c42\u6b21\u7ed3\u6784\uff08\u7b2c8\u7ae0\uff09\u3002</p> </li> <li> <p>\u73b0\u4ee3LLM\u7684\u5b9e\u9645\u80dc\u8005\u662f\u6ed1\u52a8\u7a97\u53e3+\u5168\u6ce8\u610f\u529b\u4ea4\u9519\uff1a\u67d0\u4e9b\u5c42\u4f7f\u7528\u6ed1\u52a8\u7a97\u53e3\uff08\u5ec9\u4ef7\uff0c\u5904\u7406\u5c40\u90e8\u4e0a\u4e0b\u6587\uff09\uff0c\u67d0\u4e9b\u5c42\u4f7f\u7528\u5168\u6ce8\u610f\u529b\uff08\u6602\u8d35\uff0c\u6355\u83b7\u957f\u8ddd\u79bb\uff09\u3002Mistral/Mixtral\u4f7f\u7528\u8fd9\u79cd\u6a21\u5f0f\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/02.%20efficient%20architectures/#_3","title":"\u7ebf\u6027\u6ce8\u610f\u529b\u548c\u72b6\u6001\u7a7a\u95f4\u6a21\u578b","text":"<ul> <li> <p>\u6211\u4eec\u80fd\u5b8c\u5168\u66ff\u6362\\(O(n^2)\\)\u7684\u6ce8\u610f\u529b\u5417\uff1f\u7ebf\u6027\u6ce8\u610f\u529b\u548c\u72b6\u6001\u7a7a\u95f4\u6a21\u578b\uff08SSM\uff09\u901a\u8fc7\u907f\u514d\u663e\u5f0f\u6ce8\u610f\u529b\u77e9\u9635\uff0c\u4ee5\\(O(n)\\)\u65f6\u95f4\u5904\u7406\u5e8f\u5217\u3002</p> </li> <li> <p>\u7ebf\u6027\u6ce8\u610f\u529b\u7528\u6838\u8fd1\u4f3c\u66ff\u6362softmax\u6ce8\u610f\u529b\uff1a</p> </li> </ul> \\[\\text{\u6807\u51c6: } O = \\text{softmax}(QK^T / \\sqrt{d}) V$$ $$\\text{\u7ebf\u6027: } O = \\phi(Q) (\\phi(K)^T V)\\] <ul> <li> <p>\u901a\u8fc7\u5148\u5173\u8054\\(K^T V\\)\u4e58\u79ef\uff08\u8fd9\u662f\\(d \\times d\\)\uff0c\u4e0e\u5e8f\u5217\u957f\u5ea6\u65e0\u5173\uff09\uff0c\u8ba1\u7b97\u53d8\u6210\\(O(n \\cdot d^2)\\)\u800c\u4e0d\u662f\\(O(n^2 \\cdot d)\\)\u3002\u5bf9\u4e8e\\(n \\gg d\\)\u7684\u957f\u5e8f\u5217\uff0c\u8fd9\u662f\u5de8\u5927\u7684\u8282\u7701\u3002</p> </li> <li> <p>RWKV\u7ed3\u5408\u4e86RNN\u548cTransformer\u7684\u601d\u60f3\u3002\u5b83\u4f7f\u7528\u5faa\u73af\u516c\u5f0f\u987a\u5e8f\u5904\u7406token\uff08\u50cfRNN\uff09\uff0c\u4f46\u53ef\u4ee5\u5728\u8bad\u7ec3\u65f6\u5e76\u884c\u5316\uff08\u50cfTransformer\uff09\u3002\u63a8\u7406\u662f\u6bcf\u4e2atoken \\(O(1)\\)\uff08\u5e38\u91cf\u5185\u5b58\uff0cKV\u7f13\u5b58\u4e0d\u589e\u957f\uff09\u3002</p> </li> <li> <p>Mamba\uff08Gu &amp; Dao\uff0c2023\uff09\u662f\u4e00\u79cd\u9009\u62e9\u6027\u72b6\u6001\u7a7a\u95f4\u6a21\u578b\u3002\u5b83\u901a\u8fc7\u5b66\u4e60\u5230\u7684\u72b6\u6001\u8f6c\u6362\u5904\u7406\u5e8f\u5217\uff1a</p> </li> </ul> \\[h_t = \\bar{A} h_{t-1} + \\bar{B} x_t, \\quad y_t = C h_t\\] <ul> <li> <p>\u5176\u4e2d\\(\\bar{A}\\)\u548c\\(\\bar{B}\\)\u662f\u4f9d\u8d56\u4e8e\u8f93\u5165\u7684\uff08\u9009\u62e9\u6027\uff09\uff0c\u5141\u8bb8Mamba\u52a8\u6001\u5173\u6ce8\u6216\u5ffd\u7565\u8f93\u5165\u7684\u90e8\u5206\u3002\u4e0e\u56fa\u5b9aSSM\u4e0d\u540c\uff0c\u9009\u62e9\u6027\u4f7fMamba\u5728\u8bed\u8a00\u4efb\u52a1\u4e0a\u4e0eTransformer\u5177\u6709\u7ade\u4e89\u529b\uff0c\u540c\u65f6\u4fdd\u6301\\(O(n)\\)\u7684\u6269\u5c55\u6027\u3002</p> </li> <li> <p>\u6743\u8861\uff1a\u7ebf\u6027\u6ce8\u610f\u529b\u548cSSM\u5bf9\u957f\u5e8f\u5217\u66f4\u5feb\uff0c\u4f46\u5bf9\u4e8e\u9700\u8981\u7cbe\u786e\u957f\u8ddd\u79bb\u68c0\u7d22\u7684\u4efb\u52a1\uff0c\u901a\u5e38\u4e0d\u5982\u5168\u6ce8\u610f\u529b\u3002\u6df7\u5408\u67b6\u6784\uff08\u4e00\u4e9bTransformer\u5c42+\u4e00\u4e9bMamba\u5c42\uff09\u901a\u5e38\u80fd\u63d0\u4f9b\u4e24\u5168\u5176\u7f8e\u7684\u6548\u679c\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/02.%20efficient%20architectures/#_4","title":"\u591a\u67e5\u8be2\u548c\u5206\u7ec4\u67e5\u8be2\u6ce8\u610f\u529b","text":"<ul> <li> <p>\u6807\u51c6\u591a\u5934\u6ce8\u610f\u529b\uff08MHA\uff0c\u7b2c7\u7ae0\uff09\u4e3a\u6bcf\u4e2a\u5934\u4f7f\u7528\u72ec\u7acb\u7684\\(K\\)\u3001\\(V\\)\u6295\u5f71\u3002\u5bf9\u4e8e\\(h\\)\u4e2ahead\uff0cKV\u7f13\u5b58\u4e2d\u6709\\(h\\)\u4e2a\u72ec\u7acb\u7684\u952e\u548c\u503c\u5f20\u91cf\u3002\u591a\u67e5\u8be2\u6ce8\u610f\u529b\uff08MQA\uff09\u548c\u5206\u7ec4\u67e5\u8be2\u6ce8\u610f\u529b\uff08GQA\uff09\u51cf\u5c11\u4e86\u8fd9\u4e2a\u6570\u91cf\u3002</p> </li> <li> <p>MQA\uff08Shazeer\uff0c2019\uff09\uff1a\u6240\u6709\u5934\u5171\u4eab\u5355\u7ec4\\(K, V\\)\u6295\u5f71\u3002\u6bcf\u4e2a\u5934\u4ecd\u7136\u6709\u81ea\u5df1\u7684\\(Q\\)\u6295\u5f71\u3002KV\u7f13\u5b58\u7f29\u5c0f\u4e86\\(h\\)\u500d\uff08\u4f8b\u5982\uff0c32\u4e2a\u5934\u5219\u7f29\u5c0f32\u500d\uff09\u3002</p> </li> <li> <p>GQA\uff08Ainslie\u7b49\u4eba\uff0c2023\uff09\uff1a\u4e00\u4e2a\u4e2d\u95f4\u65b9\u6848\u3002\u5934\u88ab\u5206\u7ec4\uff0c\u6bcf\u7ec4\u5171\u4eab\u4e00\u7ec4\\(K, V\\)\u6295\u5f71\u3002\u6709\\(h = 32\\)\u4e2a\u5934\u548c\\(g = 8\\)\u4e2a\u7ec4\uff0c\u6bcf\u7ec44\u4e2a\u5934\u5171\u4eabK/V\u3002KV\u7f13\u5b58\u7f29\u5c0f\u4e86\\(h/g = 4\\)\u500d\u3002</p> </li> </ul> \\[\\text{MHA: } h \\text{ \u4e2a\u5934, } h \\text{ \u4e2a K/V \u96c6} \\quad \\to \\quad \\text{GQA: } h \\text{ \u4e2a\u5934, } g \\text{ \u4e2a K/V \u96c6} \\quad \\to \\quad \\text{MQA: } h \\text{ \u4e2a\u5934, } 1 \\text{ \u4e2a K/V \u96c6}\\] <p></p> <ul> <li>\u5927\u591a\u6570\u73b0\u4ee3LLM\u4f7f\u7528GQA\uff08Llama 2/3\u3001Gemma\u3001Mistral\uff09\u3002\u5b83\u51cf\u5c11\u4e86KV\u7f13\u5b58\u5185\u5b58\u548c\u63a8\u7406\u5ef6\u8fdf\uff0c\u4e0eMHA\u76f8\u6bd4\u8d28\u91cf\u635f\u5931\u53ef\u4ee5\u5ffd\u7565\u4e0d\u8ba1\u3002</li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/02.%20efficient%20architectures/#mla","title":"\u591a\u5934\u6f5c\u5728\u6ce8\u610f\u529b\uff08MLA\uff09","text":"<ul> <li>MLA\uff08DeepSeek-V2\uff0c2024\uff09\u901a\u8fc7\u5c06KV\u7f13\u5b58\u538b\u7f29\u4e3a\u4f4e\u79e9\u6f5c\u5728\u7a7a\u95f4\uff0c\u6bd4GQA\u66f4\u8fdb\u4e00\u6b65\u3002MLA\u4e0d\u662f\u7f13\u5b58\u5b8c\u6574\u7684\u952e\u548c\u503c\u5411\u91cf\uff0c\u800c\u662f\u6bcf\u4e2atoken\u7f13\u5b58\u4e00\u4e2a\u538b\u7f29\u540e\u7684\u6f5c\u5728\u5411\u91cf\\(\\mathbf{c}_t\\)\uff0c\u5e76\u5728\u6ce8\u610f\u529b\u671f\u95f4\u52a8\u6001\u91cd\u6784K/V\uff1a</li> </ul> \\[\\mathbf{c}_t = W_{\\text{compress}} \\cdot [\\mathbf{k}_t; \\mathbf{v}_t], \\quad \\mathbf{k}_t = W_K^{\\text{up}} \\cdot \\mathbf{c}_t, \\quad \\mathbf{v}_t = W_V^{\\text{up}} \\cdot \\mathbf{c}_t\\] <ul> <li> <p>\u538b\u7f29\u5411\u91cf\\(\\mathbf{c}_t\\)\u6bd4\u539f\u59cbK\u548cV\u7684\u7ec4\u5408\u5c0f\u5f97\u591a\u3002DeepSeek-V2\u5b9e\u73b0\u4e86\u4e0eMHA\u76f8\u6bd493.3%\u7684KV\u7f13\u5b58\u5927\u5c0f\u51cf\u5c11\uff0c\u751a\u81f3\u4f18\u4e8eMQA\uff0c\u540c\u65f6\u4fdd\u6301MHA\u7ea7\u522b\u7684\u8d28\u91cf\u3002</p> </li> <li> <p>\u6743\u8861\uff1a\u4ece\u6f5c\u5728\u5411\u91cf\u91cd\u6784K/V\u5728\u6bcf\u4e2a\u6ce8\u610f\u529b\u64cd\u4f5c\u4e2d\u589e\u52a0\u4e86\u5c11\u91cf\u8ba1\u7b97\u6210\u672c\u3002\u4f46\u7531\u4e8eLLM\u89e3\u7801\u662f\u5185\u5b58\u5e26\u5bbd\u53d7\u9650\u7684\uff08\u800c\u975e\u8ba1\u7b97\u53d7\u9650\uff09\uff0c\u8fd9\u603b\u4f53\u4e0a\u662f\u4e2a\u51c0\u6536\u76ca\uff1a\u66f4\u5c11\u7684\u5185\u5b58\u52a0\u8f7d &gt; \u6bcftoken\u7a0d\u591a\u8ba1\u7b97\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/02.%20efficient%20architectures/#flash-attention","title":"Flash Attention","text":"<ul> <li> <p>Flash Attention\uff08Dao\u7b49\u4eba\uff0c2022\uff0c\u7b2c16\u7ae0\u6587\u4ef605\u6709\u8be6\u7ec6\u8bba\u8ff0\uff09\u4e0d\u662f\u67b6\u6784\u53d8\u5316\uff0c\u800c\u662f\u4e00\u79cd\u5b9e\u73b0\u4f18\u5316\uff0c\u5728\u4efb\u4f55\u9ad8\u6548\u6ce8\u610f\u529b\u8ba8\u8bba\u4e2d\u90fd\u4e0d\u53ef\u6216\u7f3a\u3002\u5b83\u8ba1\u7b97\u7cbe\u786e\u7684\u6807\u51c6\u6ce8\u610f\u529b\uff0c\u5177\u6709\u4ee5\u4e0b\u7279\u70b9\uff1a</p> <ul> <li>O(n)\u5185\u5b58\u800c\u4e0d\u662fO(n\u00b2)\uff08\u6ce8\u610f\u529b\u77e9\u9635\u4ece\u672a\u5728HBM\u4e2d\u5177\u4f53\u5316\uff09\u3002</li> <li>\u6bd4\u6807\u51c6\u6ce8\u610f\u529b\u5feb2-4\u500d\uff08\u901a\u8fc7\u5206\u5757\u548c\u5728\u7ebfsoftmax\u5c06\u6570\u636e\u4fdd\u7559\u5728SRAM\u4e2d\uff09\u3002</li> <li>\u65e0\u8d28\u91cf\u635f\u5931\u2014\u2014\u8f93\u51fa\u5728\u6570\u5b66\u4e0a\u4e0e\u6807\u51c6\u6ce8\u610f\u529b\u5b8c\u5168\u76f8\u540c\u3002</li> </ul> </li> <li> <p>Flash Attention\u73b0\u5728\u662fPyTorch\uff08<code>torch.nn.functional.scaled_dot_product_attention</code>\uff09\u3001JAX\u548c\u6240\u6709\u4e3b\u8981\u63a8\u7406\u6846\u67b6\u4e2d\u9ed8\u8ba4\u7684\u6ce8\u610f\u529b\u5b9e\u73b0\u3002\u5982\u679c\u4f60\u57282024+\u5e74\u8fd0\u884c\u6ce8\u610f\u529b\uff0c\u4f60\u51e0\u4e4e\u80af\u5b9a\u5728\u4f7f\u7528Flash Attention\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/02.%20efficient%20architectures/#ring-attention","title":"Ring Attention","text":"<ul> <li> <p>Ring Attention\uff08Liu\u7b49\u4eba\uff0c2023\uff09\u5c06\u6ce8\u610f\u529b\u8ba1\u7b97\u5206\u5e03\u5230\u591a\u4e2a\u8bbe\u5907\u4e0a\uff0c\u7528\u4e8e\u5373\u4f7f\u4f7f\u7528Flash Attention\u4e5f\u65e0\u6cd5\u88c5\u5165\u5355GPU\u5185\u5b58\u7684\u957f\u5e8f\u5217\u3002</p> </li> <li> <p>\u601d\u8def\uff1a\u5c06\u5e8f\u5217\u5206\u533a\u5230\\(N\\)\u4e2a\u8bbe\u5907\u4e0a\u3002\u6bcf\u4e2a\u8bbe\u5907\u6301\u6709\\(n/N\\)\u4e2atoken\u7684Q\u3001K\u3001V\u3002\u8bbe\u5907\u6392\u5217\u6210\u73af\u5f62\u3002\u6bcf\u4e00\u6b65\uff1a</p> <ol> <li>\u6bcf\u4e2a\u8bbe\u5907\u8ba1\u7b97\u5c40\u90e8\u6ce8\u610f\u529b\uff08\u5176Q\u5bf9\u5176\u5c40\u90e8K/V\uff09\u3002</li> <li>\u6bcf\u4e2a\u8bbe\u5907\u5c06\u5176K/V\u5757\u53d1\u9001\u5230\u73af\u4e2d\u7684\u4e0b\u4e00\u4e2a\u8bbe\u5907\u3002</li> <li>\u6bcf\u4e2a\u8bbe\u5907\u4ece\u4e0a\u4e00\u4e2a\u8bbe\u5907\u63a5\u6536K/V\uff0c\u5e76\u9488\u5bf9\u8fd9\u4e9bK/V\u8ba1\u7b97\u6ce8\u610f\u529b\u3002</li> <li>\u7ecf\u8fc7\\(N\\)\u6b65\u540e\uff0c\u6bcf\u4e2a\u8bbe\u5907\u5df2\u7ecf\u5173\u6ce8\u8fc7\u6bcf\u4e2aK/V\u5757\u3002</li> </ol> </li> <li> <p>\u901a\u4fe1\u4e0e\u8ba1\u7b97\u91cd\u53e0\uff1a\u5728\u5f53\u524dK/V\u5757\u4e0a\u8ba1\u7b97\u6ce8\u610f\u529b\u7684\u540c\u65f6\uff0c\u4e0b\u4e00\u4e2a\u5757\u6b63\u5728\u4f20\u8f93\u4e2d\u3002\u8fd9\u51e0\u4e4e\u5b8c\u5168\u9690\u85cf\u4e86\u901a\u4fe1\u5ef6\u8fdf\u3002</p> </li> <li> <p>Ring Attention\u901a\u8fc7\u5c06KV\u7f13\u5b58\u5206\u5e03\u5728\u4e00\u5708GPU\u4e0a\uff0c\u5b9e\u73b0\u4e86\u767e\u4e07token\u4e0a\u4e0b\u6587\u7a97\u53e3\u3002\u6bcf\u53f0\u8bbe\u5907\u7684\u5185\u5b58\u4e3aO(n/N)\uff0c\u4f7f\u5f97\u4efb\u610f\u957f\u5e8f\u5217\u90fd\u53ef\u884c\uff08\u4ec5\u53d7\u8bbe\u5907\u6570\u91cf\u9650\u5236\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/02.%20efficient%20architectures/#_5","title":"\u63a8\u7406\u65f6\u7684\u6df7\u5408\u4e13\u5bb6","text":"<ul> <li> <p>MoE\u6a21\u578b\uff08\u7b2c7\u7ae0\uff09\u6bcf\u4e2atoken\u53ea\u6fc0\u6d3b\u5176\u53c2\u6570\u7684\u4e00\u5c0f\u90e8\u5206\uff08\u901a\u5e388\u4e2a\u4e13\u5bb6\u4e2d\u76842\u4e2a\uff09\u3002\u5728\u63a8\u7406\u65f6\uff0c\u72ec\u7279\u7684\u6311\u6218\u662f\u4e13\u5bb6\u7f13\u5b58\uff1a\u6240\u6709\u4e13\u5bb6\u90fd\u5fc5\u987b\u5728\u5185\u5b58\u4e2d\uff08\u56e0\u4e3a\u4efb\u4f55token\u53ef\u80fd\u8def\u7531\u5230\u4efb\u4f55\u4e13\u5bb6\uff09\uff0c\u4f46\u6bcf\u4e2atoken\u53ea\u67092\u4e2a\u6d3b\u8dc3\u3002</p> </li> <li> <p>\u5bf9\u4e8eMixtral 8x7B\u6a21\u578b\uff1a\u603b\u53c2\u6570 = 47B\uff088 \u00d7 7B\u4e13\u5bb6\uff0c\u4f46\u6709\u5171\u4eab\u7ec4\u4ef6\uff09\u3002\u6bcf\u4e2atoken\u7684\u6d3b\u8dc3\u53c2\u6570 \u2248 13B\uff082\u4e2a\u4e13\u5bb6 + \u5171\u4eab\u5c42\uff09\u3002\u8be5\u6a21\u578b\u5177\u6709LLM-70B\u7ea7\u522b\u7684\u8d28\u91cf\uff0c\u4f46\u63a8\u7406\u6210\u672c\u4e3aLLM-13B\u7ea7\u522b\uff0c\u4e0d\u8fc7\u9700\u8981\u5728\u5185\u5b58\u4e2d\u4fdd\u755947B\u53c2\u6570\u3002</p> </li> <li> <p>\u4e13\u5bb6\u5378\u8f7d\uff1a\u5bf9\u4e8eGPU\u5185\u5b58\u53d7\u9650\u7684\u90e8\u7f72\uff0c\u5c06\u975e\u6d3b\u8dc3\u4e13\u5bb6\u4fdd\u7559\u5728CPU\u6216SSD\u4e0a\uff0c\u6309\u9700\u52a0\u8f7d\u3002\u8fd9\u4e4b\u6240\u4ee5\u6709\u6548\uff0c\u662f\u56e0\u4e3atoken\u8def\u7531\u8db3\u591f\u53ef\u9884\u6d4b\uff0c\u53ef\u4ee5\u9884\u53d6\u53ef\u80fd\u7684\u4e13\u5bb6\u3002</p> </li> <li> <p>\u4e13\u5bb6\u7f13\u5b58\uff1a\u5728GPU\u5185\u5b58\u4e2d\u7ef4\u62a4\u6700\u8fd1\u4f7f\u7528\u7684\u4e13\u5bb6\u7684LRU\u7f13\u5b58\u3002\u5982\u679c\u76f8\u540c\u7684\u4e13\u5bb6\u88ab\u91cd\u590d\u6fc0\u6d3b\uff08\u5728\u9886\u57df\u5185\u6570\u636e\u4e2d\u5e38\u89c1\uff09\uff0c\u7f13\u5b58\u547d\u4e2d\u7387\u5f88\u9ad8\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/02.%20efficient%20architectures/#_6","title":"\u77e5\u8bc6\u84b8\u998f","text":"<ul> <li>\u84b8\u998f\uff08\u7b2c6\u7ae0\uff09\u8bad\u7ec3\u4e00\u4e2a\u5c0f\u7684\"\u5b66\u751f\"\u6a21\u578b\u6765\u6a21\u4eff\u4e00\u4e2a\u5927\u7684\"\u6559\u5e08\"\u3002\u5b66\u751f\u4ece\u6559\u5e08\u7684\u8f6f\u9884\u6d4b\uff08\u7c7b\u4e0a\u7684\u6982\u7387\u5206\u5e03\uff09\u4e2d\u5b66\u4e60\uff0c\u8fd9\u6bd4\u5355\u72ec\u7684\u786c\u6807\u7b7e\u5305\u542b\u66f4\u591a\u4fe1\u606f\u3002</li> </ul> \\[\\mathcal{L} = \\alpha \\cdot \\text{KL}(p_{\\text{teacher}}^{T} \\| p_{\\text{student}}^{T}) + (1 - \\alpha) \\cdot \\mathcal{L}_{\\text{CE}}(y, p_{\\text{student}})\\] <ul> <li> <p>\u5176\u4e2d\\(T\\)\u662f\u6e29\u5ea6\uff08\u66f4\u9ad8\u7684\\(T\\)\u4f7f\u5206\u5e03\u53d8\u8f6f\uff0c\u63ed\u793a\u6559\u5e08\u7684\u4e0d\u786e\u5b9a\u6027\uff09\uff0c\\(\\alpha\\)\u5e73\u8861\u84b8\u998f\u635f\u5931\u4e0e\u6807\u51c6\u4ea4\u53c9\u71b5\u635f\u5931\u3002</p> </li> <li> <p>\u5bf9\u4e8eLLM\uff1a\u84b8\u998f\u7528\u4e8e\u4ece\u5927\u578b\u3001\u80fd\u529b\u5f3a\u7684\u6a21\u578b\u521b\u5efa\u5c0f\u578b\u3001\u5feb\u901f\u7684\u6a21\u578b\u3002GPT-4 \u2192 \u4e00\u4e2a7B\u5b66\u751f\u6a21\u578b\uff0c\u5728\u7279\u5b9a\u4efb\u52a1\u4e0a\u6355\u83b7GPT-4\u7684\u5927\u90e8\u5206\u884c\u4e3a\u3002\u5b66\u751f\u6a21\u578b\u7684\u63a8\u7406\u6210\u672c\u53ef\u4ee5\u4f4e10-100\u500d\u3002</p> </li> <li> <p>\u4efb\u52a1\u7279\u5b9a\u84b8\u998f\uff1a\u4ec5\u5728\u4e0e\u90e8\u7f72\u4efb\u52a1\u76f8\u5173\u7684\u6570\u636e\u4e0a\u8fdb\u884c\u84b8\u998f\u3002\u4ece70B\u6559\u5e08\u6a21\u578b\u5728\u533b\u7597\u95ee\u7b54\u4e0a\u84b8\u998f\u51fa\u76847B\u6a21\u578b\uff0c\u5728\u8be5\u7279\u5b9a\u4efb\u52a1\u4e0a\u53ef\u4ee5\u8d85\u8d8a70B\u6a21\u578b\uff08\u56e0\u4e3a\u5b66\u751f\u6709\u9650\u7684\u5bb9\u91cf\u5b8c\u5168\u96c6\u4e2d\u5728\u76ee\u6807\u9886\u57df\u4e0a\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/02.%20efficient%20architectures/#_7","title":"\u526a\u679d","text":"<ul> <li> <p>\u526a\u679d\u79fb\u9664\u4e0d\u5fc5\u8981\u7684\u6743\u91cd\uff08\u5c06\u5176\u8bbe\u4e3a\u96f6\uff09\uff0c\u51cf\u5c11\u6a21\u578b\u5927\u5c0f\u548c\u8ba1\u7b97\u91cf\u3002</p> </li> <li> <p>\u975e\u7ed3\u6784\u5316\u526a\u679d\uff08\u57fa\u4e8e\u5e45\u503c\uff09\uff1a\u79fb\u9664\u7edd\u5bf9\u503c\u6700\u5c0f\u7684\u5355\u4e2a\u6743\u91cd\u3002\u8fd9\u521b\u5efa\u4e86\u7a00\u758f\u6743\u91cd\u77e9\u9635\u3002\u7b80\u5355\u6709\u6548\u7528\u4e8e\u538b\u7f29\uff0c\u4f46\u5f53\u524d\u786c\u4ef6\uff08GPU\uff09\u9664\u975e\u7a00\u758f\u6027\u9075\u5faa\u7279\u5b9a\u6a21\u5f0f\uff0c\u5426\u5219\u65e0\u6cd5\u9ad8\u6548\u52a0\u901f\u7a00\u758f\u64cd\u4f5c\u3002</p> </li> <li> <p>\u7ed3\u6784\u5316\u526a\u679d\uff1a\u79fb\u9664\u6574\u4e2a\u5355\u5143\u2014\u2014\u6ce8\u610f\u529b\u5934\u3001MLP\u795e\u7ecf\u5143\u6216\u5c42\u3002\u8fd9\u4ea7\u751f\u4e00\u4e2a\u66f4\u5c0f\u7684\u7a20\u5bc6\u6a21\u578b\uff0c\u53ef\u4ee5\u5728\u6807\u51c6\u786c\u4ef6\u4e0a\u76f4\u63a5\u52a0\u901f\u3002\u6743\u8861\u662f\u7c92\u5ea6\u66f4\u7c97\uff08\u79fb\u9664\u4e00\u4e2a\u5b8c\u6574\u7684\u5934\u53ef\u80fd\u540c\u65f6\u79fb\u9664\u4e86\u6709\u7528\u548c\u65e0\u7528\u7684\u6743\u91cd\uff09\u3002</p> </li> <li> <p>2:4\u7a00\u758f\u6027\uff08NVIDIA Ampere+\uff09\uff1a\u4e00\u79cd\u786c\u4ef6\u652f\u6301\u7684\u7a00\u758f\u6a21\u5f0f\uff0c\u6bcf4\u4e2a\u6743\u91cd\u4e2d\u67092\u4e2a\u4e3a\u96f6\u3002GPU\u7684\u7a00\u758fTensor Core\u8df3\u8fc7\u96f6\u4e58\u6cd5\uff0c\u5b9e\u73b0\u7ea62\u500d\u52a0\u901f\u3002\u8fd9\u662f\u76ee\u524d\u552f\u4e00\u5177\u6709\u5b9e\u9645\u786c\u4ef6\u52a0\u901f\u7684\u7a00\u758f\u6a21\u5f0f\u3002</p> </li> <li> <p>\u5f69\u7968\u5047\u8bf4\uff08Frankle &amp; Carlin\uff0c2019\uff09\uff1a\u5728\u968f\u673a\u521d\u59cb\u5316\u7684\u7f51\u7edc\u4e2d\uff0c\u5b58\u5728\u4e00\u4e2a\u5b50\u7f51\u7edc\uff08\"\u4e2d\u5956\u5f69\u7968\"\uff09\uff0c\u53ef\u4ee5\u5355\u72ec\u8bad\u7ec3\u4ee5\u5339\u914d\u5b8c\u6574\u7f51\u7edc\u7684\u6027\u80fd\u3002\u627e\u5230\u8fd9\u4e9b\u5b50\u7f51\u7edc\uff08\u901a\u8fc7\u8bad\u7ec3\u3001\u526a\u679d\u548c\u91cd\u7f6e\uff09\u6210\u672c\u9ad8\u6602\uff0c\u4f46\u8fd9\u4e2a\u6d1e\u5bdf\u6fc0\u52b1\u4e86\u526a\u679d\u7814\u7a76\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/02.%20efficient%20architectures/#nas","title":"\u795e\u7ecf\u67b6\u6784\u641c\u7d22\uff08NAS\uff09","text":"<ul> <li> <p>NAS\u901a\u8fc7\u641c\u7d22\u53ef\u80fd\u7684\u67b6\u6784\u7a7a\u95f4\u6765\u81ea\u52a8\u5316\u67b6\u6784\u8bbe\u8ba1\uff0c\u627e\u5230\u5728\u786c\u4ef6\u7ea6\u675f\uff08\u5ef6\u8fdf\u3001\u5185\u5b58\u3001\u529f\u8017\uff09\u4e0b\u6700\u5927\u5316\u7cbe\u5ea6\u7684\u67b6\u6784\u3002</p> </li> <li> <p>EfficientNet\uff08\u7b2c8\u7ae0\uff09\u5c31\u662f\u901a\u8fc7NAS\u627e\u5230\u7684\uff1a\u590d\u5408\u7f29\u653e\u89c4\u5219\uff08\u5e73\u8861\u6df1\u5ea6\u3001\u5bbd\u5ea6\u3001\u5206\u8fa8\u7387\uff09\u662f\u4ece\u641c\u7d22\u4e2d\u6d8c\u73b0\u7684\uff0c\u800c\u975e\u4eba\u7c7b\u76f4\u89c9\u3002</p> </li> <li> <p>\u5bf9\u4e8e\u63a8\u7406\u6548\u7387\uff0cNAS\u53ef\u4ee5\u627e\u5230\u9488\u5bf9\u7279\u5b9a\u786c\u4ef6\u76ee\u6807\u4f18\u5316\u7684\u67b6\u6784\uff1a\"\u627e\u5230\u4e00\u4e2a\u5728iPhone\u795e\u7ecf\u5f15\u64ce\u4e0a\u5ef6\u8fdf&lt;5ms\u4e14\u5728ImageNet\u4e0a\u7cbe\u5ea6&gt;80%\u7684\u6a21\u578b\u3002\"\u641c\u7d22\u7a7a\u95f4\u5305\u62ec\u5c42\u7c7b\u578b\u3001\u5bbd\u5ea6\u3001\u6fc0\u6d3b\u51fd\u6570\u548c\u6ce8\u610f\u529b\u6a21\u5f0f\u3002</p> </li> <li> <p>\u4e00\u6b21\u6027\u7f51\u7edc\u8bad\u7ec3\u4e00\u4e2a\u5355\u4e2a\u8fc7\u53c2\u6570\u5316\u7f51\u7edc\uff0c\u4e3a\u4e0d\u540c\u7684\u90e8\u7f72\u76ee\u6807\u63d0\u53d6\u5b50\u7f51\u7edc\u3002\u4e00\u6b21\u8bad\u7ec3\u8fd0\u884c\u4ea7\u751f\u9488\u5bf9\u4e91GPU\u3001\u79fb\u52a8GPU\u548cCPU\u4f18\u5316\u7684\u6a21\u578b\uff0c\u6bcf\u4e2a\u90fd\u9488\u5bf9\u5176\u76ee\u6807\u8fdb\u884c\u4e86\u4f18\u5316\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/02.%20efficient%20architectures/#colabnotebook","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216notebook\uff09","text":"<ol> <li> <p>\u5b9e\u73b0\u6ed1\u52a8\u7a97\u53e3\u6ce8\u610f\u529b\uff0c\u5e76\u4e0e\u5168\u6ce8\u610f\u529b\u6bd4\u8f83\u5185\u5b58\u4f7f\u7528\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\ndef full_attention(Q, K, V):\n    \"\"\"\u6807\u51c6O(n\u00b2)\u6ce8\u610f\u529b\u3002\"\"\"\n    scores = Q @ K.T / jnp.sqrt(Q.shape[-1])\n    weights = jax.nn.softmax(scores, axis=-1)\n    return weights @ V\n\ndef sliding_window_attention(Q, K, V, window_size=128):\n    \"\"\"\u6ed1\u52a8\u7a97\u53e3\u6ce8\u610f\u529b\uff1a\u6bcf\u4e2atoken\u5173\u6ce8\u524dwindow_size\u4e2atoken\u3002\"\"\"\n    n = Q.shape[0]\n    d = Q.shape[-1]\n    output = jnp.zeros_like(Q)\n\n    for i in range(n):\n        start = max(0, i - window_size + 1)\n        k_window = K[start:i+1]\n        v_window = V[start:i+1]\n        scores = Q[i] @ k_window.T / jnp.sqrt(d)\n        weights = jax.nn.softmax(scores)\n        output = output.at[i].set(weights @ v_window)\n\n    return output\n\nn, d = 512, 64\nkey = jax.random.PRNGKey(0)\nQ = jax.random.normal(key, (n, d))\nK = jax.random.normal(jax.random.PRNGKey(1), (n, d))\nV = jax.random.normal(jax.random.PRNGKey(2), (n, d))\n\nprint(f\"\u5168\u6ce8\u610f\u529b\u5185\u5b58:    O(n\u00b2) = {n*n} \u4e2a\u6761\u76ee\")\nprint(f\"\u7a97\u53e3 (w=128) \u5185\u5b58:   O(n*w) = {n*128} \u4e2a\u6761\u76ee\")\nprint(f\"\u51cf\u5c11: {n*n / (n*128):.1f}x\")\n</code></pre></p> </li> <li> <p>\u6bd4\u8f83MHA\u3001GQA\u548cMQA\u7684KV\u7f13\u5b58\u5927\u5c0f\u3002\u5c55\u793a\u4e3a\u4ec0\u4e48GQA\u662f\u5b9e\u9645\u7684\u6700\u4f73\u9009\u62e9\u3002 <pre><code>def kv_cache_size(n_heads, n_kv_heads, d_head, seq_len, bytes=2):\n    \"\"\"KV\u7f13\u5b58\u5927\u5c0f\uff08MB\uff09\u3002\"\"\"\n    return 2 * n_kv_heads * d_head * seq_len * bytes / 1e6\n\nn_heads = 32\nd_head = 128\nseq_len = 32768\n\nmha = kv_cache_size(n_heads, n_heads, d_head, seq_len)       # 32\u4e2aKV\u5934\ngqa = kv_cache_size(n_heads, 8, d_head, seq_len)              # 8\u4e2aKV\u5934\nmqa = kv_cache_size(n_heads, 1, d_head, seq_len)              # 1\u4e2aKV\u5934\n\nprint(f\"MHA (32\u4e2aKV\u5934): {mha:.0f} MB \u6bcf\u5c42\")\nprint(f\"GQA (8\u4e2aKV\u5934):  {gqa:.0f} MB \u6bcf\u5c42 ({mha/gqa:.0f}x \u66f4\u5c0f)\")\nprint(f\"MQA (1\u4e2aKV\u5934):   {mqa:.0f} MB \u6bcf\u5c42 ({mha/mqa:.0f}x \u66f4\u5c0f)\")\n</code></pre></p> </li> <li> <p>\u901a\u8fc7\u4ece\u968f\u673a\u6ce8\u610f\u529b\u5c42\u4e2d\u79fb\u9664\u6700\u4e0d\u91cd\u8981\u7684\u6ce8\u610f\u529b\u5934\u5e76\u6d4b\u91cf\u8f93\u51fa\u53d8\u5316\u6765\u6a21\u62df\u7ed3\u6784\u5316\u526a\u679d\u3002 <pre><code>import jax\nimport jax.numpy as jnp\n\nkey = jax.random.PRNGKey(0)\nn_heads, seq_len, d_head = 8, 64, 32\n\n# \u968f\u673a\u591a\u5934\u6ce8\u610f\u529b\u8f93\u51fa\uff08\u6bcf\u4e2a\u5934\u4e00\u4e2a\uff09\nhead_outputs = jax.random.normal(key, (n_heads, seq_len, d_head))\n\n# \u5b8c\u6574\u8f93\u51fa\uff1a\u8fde\u63a5\u6240\u6709\u5934\nfull_output = head_outputs.reshape(seq_len, n_heads * d_head)\n\n# \u91cd\u8981\u6027\uff1a\u901a\u8fc7\u8303\u6570\u5ea6\u91cf\u6bcf\u4e2a\u5934\u7684\u8d21\u732e\nhead_norms = jnp.linalg.norm(head_outputs, axis=(1, 2))\nprint(\"\u5934\u91cd\u8981\u6027\uff08\u6309\u8303\u6570\uff09:\", jnp.round(head_norms, 2))\n\n# \u526a\u679d\u6700\u4e0d\u91cd\u8981\u7684\u5934\nfor n_keep in [8, 6, 4, 2]:\n    top_heads = jnp.argsort(head_norms)[-n_keep:]\n    pruned = head_outputs[top_heads].reshape(seq_len, n_keep * d_head)\n\n    # \u586b\u5145\u5230\u539f\u59cb\u5927\u5c0f\u7528\u4e8e\u6bd4\u8f83\uff08\u5c06\u526a\u6389\u7684\u5934\u8bbe\u4e3a\u96f6\uff09\n    full_pruned = jnp.zeros_like(head_outputs)\n    full_pruned = full_pruned.at[top_heads].set(head_outputs[top_heads])\n    full_pruned = full_pruned.reshape(seq_len, n_heads * d_head)\n\n    error = jnp.linalg.norm(full_output - full_pruned) / jnp.linalg.norm(full_output)\n    print(f\"\u4fdd\u7559 {n_keep}/{n_heads} \u4e2a\u5934: \u76f8\u5bf9\u8bef\u5dee = {error:.4f}, \"\n          f\"\u5185\u5b58 = {n_keep/n_heads:.0%}\")\n</code></pre></p> </li> </ol>"},{"location":"chapter%2017%3A%20AI%20inference/03.%20serving%20and%20batching/","title":"\u670d\u52a1\u4e0e\u6279\u5904\u7406","text":"<p>\u5411\u6570\u5343\u5e76\u53d1\u7528\u6237\u63d0\u4f9bLLM\u670d\u52a1\u9700\u8981\u7684\u4e0d\u53ea\u662f\u52a0\u8f7d\u6a21\u578b\u548c\u8fd0\u884c\u63a8\u7406\u3002\u672c\u6587\u6db5\u76d6\u9884\u586b\u5145-\u89e3\u7801\u5206\u79bb\u3001\u8fde\u7eed\u6279\u5904\u7406\u3001PagedAttention\u548cvLLM\u3001\u8c03\u5ea6\u7b56\u7565\u3001\u5206\u79bb\u5f0f\u670d\u52a1\u3001\u591a\u6a21\u578b\u548cLoRA\u670d\u52a1\uff0c\u4ee5\u53ca\u5173\u952e\u6307\u6807</p> <ul> <li>\u5355\u4e2aLLM\u63a8\u7406\u8bf7\u6c42\u5f88\u7b80\u5355\uff1a\u8f93\u5165token\uff0c\u751f\u6210\u8f93\u51fatoken\u3002\u4f46\u8981\u541110,000\u4e2a\u5e76\u53d1\u7528\u6237\u63d0\u4f9b\u4f4e\u5ef6\u8fdf\u3001\u9ad8\u541e\u5410\u91cf\u7684LLM\u670d\u52a1\uff0c\u8fd9\u662f\u4e00\u4e2a\u7cfb\u7edf\u5de5\u7a0b\u95ee\u9898\u3002\u6734\u7d20\u65b9\u6cd5\uff08\u4e00\u6b21\u5904\u7406\u4e00\u4e2a\u8bf7\u6c42\uff09\u6d6a\u8d39\u4e8690%\u4ee5\u4e0a\u7684GPU\u5bb9\u91cf\u3002\u667a\u80fd\u6279\u5904\u7406\u548c\u8c03\u5ea6\u53ef\u4ee5\u5728\u4e0d\u589e\u52a0\u786c\u4ef6\u7684\u60c5\u51b5\u4e0b\u5c06\u541e\u5410\u91cf\u63d0\u9ad810-50\u500d\u3002</li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/03.%20serving%20and%20batching/#vs","title":"\u9884\u586b\u5145 vs \u89e3\u7801\uff1a\u4e24\u4e2a\u622a\u7136\u4e0d\u540c\u7684\u9636\u6bb5","text":"<ul> <li> <p>LLM\u63a8\u7406\u6709\u4e24\u4e2a\u4e0d\u540c\u7684\u9636\u6bb5\uff0c\u5177\u6709\u6839\u672c\u4e0d\u540c\u7684\u8ba1\u7b97\u7279\u5f81\uff1a</p> </li> <li> <p>\u9884\u586b\u5145\uff08\u63d0\u793a\u5904\u7406\uff09\uff1a\u540c\u65f6\u5904\u7406\u6240\u6709\u8f93\u5165token\u3002\u8fd9\u662f\u4e00\u4e2a\u5355\u6b21\u5927\u89c4\u6a21\u77e9\u9635\u4e58\u6cd5\uff1a\\(O(\\text{prompt\\_length} \\times d_{\\text{model}}^2)\\)\u3002\u63d0\u793a\u53ef\u4ee5\u5e76\u884c\u5904\u7406\uff08\u6240\u6709token\u90fd\u5df2\u77e5\uff09\u3002\u9884\u586b\u5145\u662f\u8ba1\u7b97\u53d7\u9650\u7684\uff1aGPU\u7684ALU\u662f\u74f6\u9888\u3002</p> </li> <li> <p>\u89e3\u7801\uff08token\u751f\u6210\uff09\uff1a\u81ea\u56de\u5f52\u5730\u4e00\u6b21\u751f\u6210\u4e00\u4e2atoken\u3002\u6bcf\u4e2a\u65b0token\u9700\u8981\u901a\u8fc7KV\u7f13\u5b58\u5173\u6ce8\u6240\u6709\u5148\u524d\u7684token\u3002\u89e3\u7801\u662f\u5185\u5b58\u5e26\u5bbd\u53d7\u9650\u7684\uff1aGPU\u5927\u90e8\u5206\u65f6\u95f4\u82b1\u5728\u4ece\u5185\u5b58\u52a0\u8f7d\u6a21\u578b\u6743\u91cd\u548cKV\u7f13\u5b58\u4e0a\uff0c\u800c\u4e0d\u662f\u8ba1\u7b97\u3002\u6bcf\u4e2a\u89e3\u7801\u6b65\u9aa4\u53ea\u4ea7\u751f\u4e00\u4e2atoken\uff0c\u4f46\u5fc5\u987b\u52a0\u8f7d\u6574\u4e2a\u6a21\u578b\uff0870B FP16\u6a21\u578b\u7ea6140 GB\uff09\u3002</p> </li> <li> <p>\u542b\u4e49\uff1a</p> </li> </ul> \u9884\u586b\u5145 \u89e3\u7801 \u5904\u7406\u7684token \u4e00\u6b21\u6027\u5168\u90e8\uff08\u5e76\u884c\uff09 \u4e00\u6b21\u4e00\u4e2a\uff08\u987a\u5e8f\uff09 \u74f6\u9888 \u8ba1\u7b97\uff08FLOPS\uff09 \u5185\u5b58\u5e26\u5bbd \u7b97\u672f\u5f3a\u5ea6 \u9ad8 \u975e\u5e38\u4f4e GPU\u5229\u7528\u7387 \u9ad8\uff0850-80%\uff09 \u4f4e\uff081-10%\uff09\uff0c\u65e0\u6279\u5904\u7406\u65f6 \u5ef6\u8fdf\u6307\u6807 \u9996token\u65f6\u95f4\uff08TTFT\uff09 \u6bcf\u8f93\u51fatoken\u65f6\u95f4\uff08TPOT\uff09 <ul> <li>TTFT\u5f71\u54cd\u7528\u6237\u4f53\u9a8c\uff08\u591a\u4e45\u76f4\u5230\u54cd\u5e94\u5f00\u59cb\u6d41\u5f0f\u4f20\u8f93\uff09\u3002TPOT\u51b3\u5b9a\u611f\u77e5\u7684\u751f\u6210\u901f\u5ea6\u3002\u7528\u6237\u53ef\u4ee5\u5bb9\u5fcd\u8f83\u9ad8\u7684TTFT\uff081-5\u79d2\uff09\uff0c\u4f46\u671f\u671b\u5feb\u901f\u7684TPOT\uff08\u5bf9\u8bdd\u5e94\u7528\u6bcftoken 30-100\u6beb\u79d2\uff09\u3002</li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/03.%20serving%20and%20batching/#_2","title":"\u9759\u6001\u6279\u5904\u7406\uff08\u6734\u7d20\u65b9\u6cd5\uff09","text":"<ul> <li> <p>\u6700\u7b80\u5355\u7684\u6279\u5904\u7406\uff1a\u6536\u96c6\\(B\\)\u4e2a\u8bf7\u6c42\uff0c\u586b\u5145\u5230\u76f8\u540c\u957f\u5ea6\uff0c\u4f5c\u4e3a\u5355\u4e2a\u6279\u6b21\u5904\u7406\u3002</p> </li> <li> <p>\u95ee\u98981\uff1a\u8bf7\u6c42\u6709\u4e0d\u540c\u7684\u63d0\u793a\u957f\u5ea6\uff0c\u5e76\u751f\u6210\u4e0d\u540c\u6570\u91cf\u7684\u8f93\u51fatoken\u3002\u77ed\u8bf7\u6c42\u63d0\u524d\u5b8c\u6210\uff0c\u4f46\u5fc5\u987b\u7b49\u5f85\u6279\u6b21\u4e2d\u6700\u957f\u7684\u8bf7\u6c42\u5b8c\u6210\u540e\u624d\u80fd\u5f00\u59cb\u4e0b\u4e00\u4e2a\u6279\u6b21\u3002GPU\u5728\u4e3a\u5269\u4f59\u7684\u4e00\u4e2a\u957f\u8bf7\u6c42\u751f\u6210token\u65f6\u5904\u4e8e\u7a7a\u95f2\u72b6\u6001\u3002</p> </li> <li> <p>\u95ee\u98982\uff1a\u586b\u5145\u6d6a\u8d39\u8ba1\u7b97\u3002\u5982\u679c\u6700\u957f\u63d0\u793a\u662f2000\u4e2atoken\uff0c\u6700\u77ed\u662f50\u4e2a\uff0c\u6279\u6b21\u88ab\u586b\u5145\u52302000\u3002GPU\u4e3a\u77ed\u8bf7\u6c42\u5904\u7406\u4e861950\u4e2a\u586b\u5145token\u2014\u2014\u7eaf\u5c5e\u6d6a\u8d39\u3002</p> </li> </ul> <p></p>"},{"location":"chapter%2017%3A%20AI%20inference/03.%20serving%20and%20batching/#_3","title":"\u8fde\u7eed\u6279\u5904\u7406","text":"<ul> <li> <p>\u8fde\u7eed\u6279\u5904\u7406\uff08\u4e5f\u79f0\u4e3a\u8fed\u4ee3\u7ea7\u6279\u5904\u7406\uff09\u901a\u8fc7\u5728\u5355\u4e2a\u89e3\u7801\u6b65\u9aa4\u7684\u7c92\u5ea6\u4e0a\u64cd\u4f5c\u6765\u89e3\u51b3\u8fd9\u4e24\u4e2a\u95ee\u9898\uff0c\u800c\u4e0d\u662f\u6574\u4e2a\u8bf7\u6c42\u3002</p> </li> <li> <p>\u5728\u6bcf\u4e2a\u89e3\u7801\u6b65\u9aa4\uff1a</p> <ol> <li>\u6240\u6709\u8fdb\u884c\u4e2d\u7684\u8bf7\u6c42\u5e76\u884c\u751f\u6210\u4e00\u4e2atoken\uff08\u4f5c\u4e3a\u4e00\u4e2a\u6279\u6b21\uff09\u3002</li> <li>\u5b8c\u6210\u7684\u8bf7\u6c42\uff08\u751f\u6210EOS token\uff09\u7acb\u5373\u4ece\u6279\u6b21\u4e2d\u79fb\u9664\u3002</li> <li>\u961f\u5217\u4e2d\u7684\u65b0\u8bf7\u6c42\u7acb\u5373\u63d2\u5165\u5230\u91ca\u653e\u7684\u69fd\u4f4d\u4e2d\u3002</li> </ol> </li> <li> <p>\u6279\u6b21\u5927\u5c0f\u6bcf\u6b65\u52a8\u6001\u53d8\u5316\u3002GPU\u4ece\u4e0d\u7b49\u5019\u843d\u540e\u8005\uff0c\u4e5f\u6ca1\u6709\u6d6a\u8d39\u7684\u586b\u5145\uff08\u6bcf\u4e2a\u8bf7\u6c42\u53ea\u4f7f\u7528\u5b83\u9700\u8981\u7684\u69fd\u4f4d\uff09\u3002</p> </li> <li> <p>\u5f71\u54cd\uff1a\u8fde\u7eed\u6279\u5904\u7406\u901a\u5e38\u6bd4\u9759\u6001\u6279\u5904\u7406\u63d0\u9ad8\u541e\u5410\u91cf2-10\u500d\uff0c\u6a21\u578b\u8d28\u91cf\u4e0d\u53d8\u4e14\u5ef6\u8fdf\u65e0\u660e\u663e\u589e\u52a0\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/03.%20serving%20and%20batching/#pagedattentionvllm","title":"PagedAttention\u548cvLLM","text":"<ul> <li>KV\u7f13\u5b58\u9020\u6210\u4e86\u4e00\u4e2a\u5185\u5b58\u7ba1\u7406\u5669\u68a6\u3002\u6bcf\u4e2a\u8bf7\u6c42\u90fd\u6709\u4e00\u4e2a\u968f\u7740\u6bcf\u4e2a\u751f\u6210\u7684token\u800c\u589e\u957f\u7684KV\u7f13\u5b58\u3002\u4e0d\u540c\u8bf7\u6c42\u5904\u4e8e\u4e0d\u540c\u9636\u6bb5\uff08\u4e0d\u540c\u7f13\u5b58\u5927\u5c0f\uff09\u3002\u4e3a\u6bcf\u4e2a\u8bf7\u6c42\u5206\u914d\u8fde\u7eed\u5185\u5b58\u6d6a\u8d39\u7a7a\u95f4\uff08\u5fc5\u987b\u4e3a\u6700\u5927\u53ef\u80fd\u957f\u5ea6\u5206\u914d\uff0c\u5373\u4f7f\u8bf7\u6c42\u53ea\u751f\u6210\u51e0\u4e2atoken\uff09\u3002</li> </ul> <ul> <li> <p>PagedAttention\uff08Kwon\u7b49\u4eba\uff0c2023\uff09\u5c06\u64cd\u4f5c\u7cfb\u7edf\u865a\u62df\u5185\u5b58\u7684\u6982\u5ff5\uff08\u7b2c13\u7ae0\uff09\u5e94\u7528\u4e8eKV\u7f13\u5b58\u3002\u7f13\u5b58\u88ab\u5212\u5206\u4e3a\u56fa\u5b9a\u5927\u5c0f\u7684\u9875\uff08token\u4f4d\u7f6e\u7684\u5757\uff09\u3002\u9875\u6309\u9700\u5206\u914d\uff0c\u5728\u7269\u7406GPU\u5185\u5b58\u4e2d\u53ef\u4ee5\u662f\u975e\u8fde\u7eed\u7684\u3002</p> </li> <li> <p>\u4f18\u52bf\uff1a</p> <ul> <li>\u65e0\u788e\u7247\uff1a\u9875\u5927\u5c0f\u7edf\u4e00\uff0c\u56e0\u6b64\u8bf7\u6c42\u4e4b\u95f4\u6ca1\u6709\u6d6a\u8d39\u5185\u5b58\u7684\"\u7a7a\u6d1e\"\u3002</li> <li>\u60f0\u6027\u5206\u914d\uff1a\u4ec5\u5728token\u5b9e\u9645\u751f\u6210\u65f6\u5206\u914d\u5185\u5b58\uff0c\u800c\u4e0d\u662f\u9884\u5206\u914d\u6700\u5927\u957f\u5ea6\u3002</li> <li>\u5199\u65f6\u590d\u5236\uff1a\u5171\u4eab\u5171\u540c\u524d\u7f00\uff08\u4f8b\u5982\u7cfb\u7edf\u63d0\u793a\uff09\u7684\u8bf7\u6c42\u5171\u4eab\u76f8\u540c\u7684KV\u7f13\u5b58\u9875\u3002\u4ec5\u5f53\u8bf7\u6c42\u5206\u53c9\u65f6\u624d\u590d\u5236\u9875\u3002</li> </ul> </li> <li> <p>vLLM\u662f\u57fa\u4e8ePagedAttention\u6784\u5efa\u7684\u63a8\u7406\u5f15\u64ce\u3002\u901a\u8fc7\u51e0\u4e4e\u6d88\u9664KV\u7f13\u5b58\u5185\u5b58\u6d6a\u8d39\uff0c\u5b83\u5b9e\u73b0\u4e86\u6bd4\u9759\u6001\u5206\u914d\u670d\u52a1\uff08\u5982\u6ca1\u6709\u5206\u9875\u6ce8\u610f\u529b\u7684HuggingFace text-generation-inference\uff09\u9ad82-4\u500d\u7684\u541e\u5410\u91cf\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/03.%20serving%20and%20batching/#_4","title":"\u8c03\u5ea6\u7b56\u7565","text":"<ul> <li> <p>\u5f53\u591a\u4e2a\u8bf7\u6c42\u5728\u7b49\u5f85\u4e14GPU\u53ea\u80fd\u5904\u7406\u6709\u9650\u6279\u6b21\u65f6\uff0c\u8c03\u5ea6\u51b3\u5b9a\u670d\u52a1\u54ea\u4e9b\u8bf7\u6c42\uff1a</p> </li> <li> <p>\u5148\u6765\u5148\u670d\u52a1\uff08FCFS\uff09\uff1a\u6309\u5230\u8fbe\u987a\u5e8f\u5904\u7406\u8bf7\u6c42\u3002\u7b80\u5355\u4f46\u4e0d\u516c\u5e73\uff1a\u4e00\u4e2a\u63d0\u4ea410K-token\u751f\u6210\u7684\u7528\u6237\u4f1a\u963b\u585e\u6240\u6709\u540e\u9762\u7684\u7528\u6237\u3002</p> </li> <li> <p>\u6700\u77ed\u4f5c\u4e1a\u4f18\u5148\uff08SJF\uff09\uff1a\u5904\u7406\u6700\u5148\u5b8c\u6210\u7684\u8bf7\u6c42\u3002\u6700\u5c0f\u5316\u5e73\u5747\u5ef6\u8fdf\uff0c\u4f46\u60e9\u7f5a\u957f\u65f6\u95f4\u8fd0\u884c\u7684\u8bf7\u6c42\uff08\u5b83\u4eec\u53ef\u80fd\u88ab\u997f\u6b7b\uff09\u3002\u5728\u5b9e\u8df5\u4e2d\uff0c\u4f30\u8ba1\u8f93\u51fa\u957f\u5ea6\u672a\u77e5\uff0c\u56e0\u6b64SJF\u4f7f\u7528\u542f\u53d1\u5f0f\u65b9\u6cd5\uff08\u63d0\u793a\u957f\u5ea6\u3001\u7528\u6237\u5386\u53f2\uff09\u3002</p> </li> <li> <p>\u62a2\u5360\uff1a\u5982\u679c\u9ad8\u4f18\u5148\u7ea7\u8bf7\u6c42\u5230\u8fbe\uff0c\u6682\u505c\u4f4e\u4f18\u5148\u7ea7\u7684\u8fdb\u884c\u4e2d\u8bf7\u6c42\uff08\u5c06\u5176KV\u7f13\u5b58\u4ea4\u6362\u5230CPU\u5185\u5b58\u6216SSD\uff09\uff0c\u670d\u52a1\u9ad8\u4f18\u5148\u7ea7\u8bf7\u6c42\uff0c\u7136\u540e\u6062\u590d\u6682\u505c\u7684\u8bf7\u6c42\u3002vLLM\u652f\u6301\u6b64\u529f\u80fd\u3002</p> </li> <li> <p>\u57fa\u4e8e\u4f18\u5148\u7ea7\uff1a\u4e3a\u7528\u6237\u6216\u8bf7\u6c42\u7c7b\u578b\u5206\u914d\u4f18\u5148\u7ea7\u3002\u5b9e\u65f6\u4ea4\u4e92\u67e5\u8be2\u6bd4\u6279\u5904\u7406\u4f5c\u4e1a\u83b7\u5f97\u66f4\u9ad8\u4f18\u5148\u7ea7\u3002\u7ed3\u5408\u62a2\u5360\uff0c\u8fd9\u786e\u4fdd\u9ad8\u4f18\u5148\u7ea7\u6d41\u91cf\u7684\u5ef6\u8fdfSLO\u3002</p> </li> <li> <p>Token\u9884\u7b97\uff1a\u9650\u5236\u6d3b\u8dc3\u6279\u6b21\u4e2d\u7684\u603btoken\u6570\u3002\u8fd9\u9632\u6b62\u5c11\u91cf\u957f\u8bf7\u6c42\u72ec\u5360GPU\u5185\u5b58\u5e76\u997f\u6b7b\u65b0\u8bf7\u6c42\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/03.%20serving%20and%20batching/#_5","title":"\u5206\u79bb\u5f0f\u670d\u52a1","text":"<ul> <li> <p>\u9884\u586b\u5145\u548c\u89e3\u7801\u5177\u6709\u76f8\u53cd\u7684\u8ba1\u7b97\u7279\u5f81\u3002\u5728\u540c\u4e00GPU\u4e0a\u8fd0\u884c\u4e24\u8005\u610f\u5473\u7740GPU\u5728\u8ba1\u7b97\u53d7\u9650\uff08\u9884\u586b\u5145\uff09\u548c\u5185\u5b58\u5e26\u5bbd\u53d7\u9650\uff08\u89e3\u7801\uff09\u4e4b\u95f4\u4ea4\u66ff\uff0c\u4ece\u672a\u5145\u5206\u5229\u7528\u4efb\u4e00\u8d44\u6e90\u3002</p> </li> <li> <p>\u5206\u79bb\u5f0f\u670d\u52a1\u5c06\u5b83\u4eec\u5206\u5f00\uff1a</p> <ul> <li>\u9884\u586b\u5145\u8282\u70b9\uff1a\u4e3a\u8ba1\u7b97\u4f18\u5316\u7684GPU\uff08\u9ad8FLOPS\uff0c\u53ef\u80fd\u5185\u5b58\u8f83\u5c11\uff09\u3002\u5904\u7406\u6240\u6709\u4f20\u5165\u63d0\u793a\u3002</li> <li>\u89e3\u7801\u8282\u70b9\uff1a\u4e3a\u5185\u5b58\u5e26\u5bbd\u4f18\u5316\u7684GPU\uff08\u5927KV\u7f13\u5b58\u5bb9\u91cf\uff0c\u9ad8\u5185\u5b58\u5e26\u5bbd\uff09\u3002\u5904\u7406\u6240\u6709token\u751f\u6210\u3002</li> </ul> </li> <li> <p>\u9884\u586b\u5145\u8282\u70b9\u8ba1\u7b97\u521d\u59cbKV\u7f13\u5b58\u5e76\u901a\u8fc7NVLink\u6216\u7f51\u7edc\u5c06\u5176\u53d1\u9001\u5230\u89e3\u7801\u8282\u70b9\u3002\u89e3\u7801\u8282\u70b9\u4f7f\u7528\u63a5\u6536\u5230\u7684\u7f13\u5b58\u751f\u6210token\u3002</p> </li> <li> <p>\u8fd9\u662fMooncake\uff08\u6708\u4e4b\u6697\u9762\uff09\u7684\u67b6\u6784\uff0c\u5e76\u6b63\u5728\u88ab\u591a\u4e2aLLM\u670d\u52a1\u56e2\u961f\u63a2\u7d22\u3002\u597d\u5904\uff1a\u6bcf\u4e2aGPU\u7c7b\u578b\u4e0e\u5176\u5de5\u4f5c\u8d1f\u8f7d\u7279\u5f81\u5339\u914d\uff0c\u63d0\u9ad8\u6574\u4f53\u5229\u7528\u7387\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/03.%20serving%20and%20batching/#lora","title":"\u591a\u6a21\u578b\u548cLoRA\u670d\u52a1","text":"<ul> <li> <p>\u5728\u751f\u4ea7\u4e2d\uff0c\u4f60\u901a\u5e38\u670d\u52a1\u591a\u4e2a\u6a21\u578b\uff08\u4e0d\u540c\u5c42\u7ea7\u7684\u6a21\u578b\u5927\u5c0f\u4e0d\u540c\uff0c\u4e0d\u540c\u4efb\u52a1\u7684\u5fae\u8c03\u53d8\u4f53\u4e0d\u540c\uff09\u3002</p> </li> <li> <p>\u6a21\u578b\u590d\u7528\uff1a\u5728\u540c\u4e00GPU\u4e0a\u52a0\u8f7d\u591a\u4e2a\u6a21\u578b\uff0c\u5c06\u8bf7\u6c42\u8def\u7531\u5230\u76f8\u5e94\u6a21\u578b\u3002GPU\u5185\u5b58\u5171\u4eab\uff1a\u4e00\u4e2a40 GB GPU\u53ef\u80fd\u540c\u65f6\u6301\u6709\u4e00\u4e2a13B\u6a21\u578b\uff0826 GB\uff09\u548c\u4e00\u4e2a7B\u6a21\u578b\uff0814 GB\uff09\u3002</p> </li> <li> <p>LoRA\u670d\u52a1\uff1a\u4e0d\u662f\u90e8\u7f72\u5355\u72ec\u7684\u5fae\u8c03\u6a21\u578b\uff0c\u800c\u662f\u90e8\u7f72\u4e00\u4e2a\u57fa\u7840\u6a21\u578b\u5e76\u5e26\u6709\u591a\u4e2aLoRA\u9002\u914d\u5668\uff08\u7b2c6\u7ae0\uff09\u3002\u6bcf\u4e2a\u9002\u914d\u5668\u589e\u52a0&lt;1%\u7684\u53c2\u6570\u3002\u8bf7\u6c42\u5728\u63a8\u7406\u65f6\u8def\u7531\u5230\u76f8\u5e94\u7684\u9002\u914d\u5668\u3002</p> </li> <li> <p>S-LoRA\uff08Sheng\u7b49\u4eba\uff0c2023\uff09\uff1a\u4ece\u4e00\u4e2a\u57fa\u7840\u6a21\u578b\u670d\u52a1\u6570\u5343\u4e2aLoRA\u9002\u914d\u5668\u3002\u9002\u914d\u5668\u5b58\u50a8\u5728CPU\u4e0a\uff0c\u6309\u9700\u5206\u9875\u5230GPU\u5185\u5b58\u3002\u57fa\u7840\u6a21\u578b\u7684KV\u7f13\u5b58\u548c\u6743\u91cd\u88ab\u5171\u4eab\uff1b\u53ea\u6709\u5c0f\u7684LoRA\u77e9\u9635\u56e0\u8bf7\u6c42\u800c\u5f02\u3002</p> </li> <li> <p>Punica\uff08Chen\u7b49\u4eba\uff0c2023\uff09\uff1a\u901a\u8fc7\u4f7f\u7528\u81ea\u5b9a\u4e49CUDA\u5185\u6838\u5728\u540c\u4e00\u6279\u6b21\u4e2d\u4e3a\u4e0d\u540c\u8bf7\u6c42\u5e94\u7528\u4e0d\u540c\u7684LoRA\u77e9\u9635\uff0c\u8de8\u4e0d\u540cLoRA\u9002\u914d\u5668\u5bf9\u8bf7\u6c42\u8fdb\u884c\u6279\u5904\u7406\u3002\u8fd9\u907f\u514d\u4e86\u6bcf\u4e2a\u8bf7\u6c42\u5207\u6362\u9002\u914d\u5668\u7684\u5f00\u9500\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/03.%20serving%20and%20batching/#_6","title":"\u53d7\u9650\u548c\u5f15\u5bfc\u751f\u6210","text":"<ul> <li> <p>\u8bb8\u591a\u5e94\u7528\u9700\u8981LLM\u4ee5\u7279\u5b9a\u683c\u5f0f\u4ea7\u751f\u8f93\u51fa\uff1a\u6709\u6548\u7684JSON\u3001SQL\u67e5\u8be2\u3001\u7279\u5b9a\u8bed\u8a00\u7684\u4ee3\u7801\u6216\u9075\u5faa\u6a21\u5f0f\u7684\u54cd\u5e94\u3002\u53d7\u9650\u751f\u6210\u4fdd\u8bc1\u8f93\u51fa\u7b26\u5408\u8bed\u6cd5\u6216\u6a21\u5f0f\u3002</p> </li> <li> <p>\u8bed\u6cd5\u53d7\u9650\u89e3\u7801\uff1a\u5728\u6bcf\u4e2a\u89e3\u7801\u6b65\u9aa4\uff0c\u5c4f\u853d\u4f1a\u8fdd\u53cd\u8bed\u6cd5\u7684token\u3002\u5982\u679c\u5230\u76ee\u524d\u4e3a\u6b62\u7684\u8f93\u51fa\u662f<code>{\"name\": \"Alice\", \"age\":</code>\u4e14\u8bed\u6cd5\u8981\u6c42\u63a5\u4e0b\u6765\u662f\u6574\u6570\uff0c\u5219\u5c4f\u853d\u9664\u6570\u5b57\u5916\u7684\u6240\u6709token\u3002LLM\u7684\u6982\u7387\u5206\u5e03\u5728\u6709\u6548token\u4e0a\u91cd\u65b0\u5f52\u4e00\u5316\u3002</p> </li> <li> <p>Outlines\uff08Willard &amp; Louf\uff0c2023\uff09\uff1a\u5c06JSON\u6a21\u5f0f\u6216\u6b63\u5219\u8868\u8fbe\u5f0f\u7f16\u8bd1\u6210\u6709\u9650\u72b6\u6001\u673a\uff08FSM\uff09\u3002\u5728\u6bcf\u4e2a\u89e3\u7801\u6b65\u9aa4\uff0cFSM\u786e\u5b9a\u54ea\u4e9btoken\u662f\u6709\u6548\u7684\u540e\u7eed\u3002\u65e0\u6548token\u83b7\u5f97\u6982\u73870\u3002\u8fd9\u4fdd\u8bc1\u4e86100%\u7684\u6a21\u5f0f\u5408\u89c4\uff0c\u96f6\u91cd\u8bd5\u3002</p> </li> <li> <p>SGLang\u539f\u751f\u96c6\u6210\u53d7\u9650\u751f\u6210\uff1a\u4f60\u7528Python\u6307\u5b9a\u8f93\u51fa\u7ed3\u6784\uff0c\u5f15\u64ce\u9ad8\u6548\u5904\u7406token\u63a9\u7801\u548c\u7f13\u5b58\u3002\u8fd9\u4e0eRadixAttention\uff08\u524d\u7f00\u7f13\u5b58\uff09\u7ed3\u5408\uff0c\u4f7f\u5f97\u7ed3\u6784\u5316\u8f93\u51fa\u91cd\u7528\u7f13\u5b58\u7684\u516c\u5171\u524d\u7f00\u3002</p> </li> <li> <p>\u4e3a\u4ec0\u4e48\u91cd\u8981\uff1a\u6ca1\u6709\u53d7\u9650\u751f\u6210\uff0c\u4f60\u81ea\u7531\u751f\u6210\u7136\u540e\u89e3\u6790\u8f93\u51fa\uff0c\u5931\u8d25\u65f6\u91cd\u8bd5\u3002\u5bf9\u4e8e\u590d\u6742JSON\u6a21\u5f0f\uff0c\u91cd\u8bd5\u7387\u901a\u5e38\u4e3a10-30%\uff0c\u6d6a\u8d39\u8ba1\u7b97\u3002\u53d7\u9650\u751f\u6210\u5b8c\u5168\u6d88\u9664\u4e86\u91cd\u8bd5\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/03.%20serving%20and%20batching/#_7","title":"\u8bf7\u6c42\u8def\u7531","text":"<ul> <li> <p>\u5e76\u975e\u6bcf\u4e2a\u67e5\u8be2\u90fd\u9700\u8981\u6700\u5927\u7684\u6a21\u578b\u3002\u8bf7\u6c42\u8def\u7531\u6839\u636e\u4f30\u8ba1\u7684\u96be\u5ea6\u5c06\u67e5\u8be2\u5b9a\u5411\u5230\u4e0d\u540c\u7684\u6a21\u578b\uff1a</p> </li> <li> <p>\u7ea7\u8054\uff1a\u5148\u5c1d\u8bd5\u5c0f\u6a21\u578b\u3002\u5982\u679c\u5c0f\u6a21\u578b\u7684\u7f6e\u4fe1\u5ea6\u4f4e\u4e8e\u9608\u503c\uff08\u4f8b\u5982\uff0ctop token\u7684softmax\u6982\u7387&lt;0.8\uff09\uff0c\u5219\u5347\u7ea7\u5230\u66f4\u5927\u7684\u6a21\u578b\u3002\u7b80\u5355\u67e5\u8be2\uff0880%+\u7684\u6d41\u91cf\uff09\u7531\u5c0f\u6a21\u578b\u5ec9\u4ef7\u670d\u52a1\uff1b\u53ea\u6709\u56f0\u96be\u67e5\u8be2\u4f7f\u7528\u6602\u8d35\u6a21\u578b\u3002</p> </li> <li> <p>\u5b66\u4e60\u578b\u8def\u7531\uff1a\u8bad\u7ec3\u4e00\u4e2a\u8f7b\u91cf\u7ea7\u5206\u7c7b\u5668\uff08\u6216\u4f7f\u7528\u5c0f\u6a21\u578b\u7684\u56f0\u60d1\u5ea6\uff09\u6765\u9884\u6d4b\u67e5\u8be2\u9700\u8981\u54ea\u4e2a\u6a21\u578b\u5c42\u7ea7\u3002\u5c06\"2+2\u7b49\u4e8e\u591a\u5c11\uff1f\"\u8def\u7531\u52303B\u6a21\u578b\uff0c\u5c06\"\u89e3\u91ca\u91cf\u5b50\u7ea0\u7f20\u7684\u6570\u5b66\u57fa\u7840\"\u8def\u7531\u523070B\u6a21\u578b\u3002</p> </li> <li> <p>\u5f71\u54cd\uff1a\u5982\u679c80%\u7684\u67e5\u8be2\u53ef\u4ee5\u7531\u6210\u672c\u4f4e10\u500d\u7684\u6a21\u578b\u5904\u7406\uff0c\u5e73\u5747\u6bcf\u67e5\u8be2\u6210\u672c\u4e0b\u964d\u7ea670%\u3002\u8fd9\u662f\u591a\u6a21\u578b\u90e8\u7f72\u4e2d\u5f71\u54cd\u6700\u5927\u7684\u6210\u672c\u4f18\u5316\u4e4b\u4e00\u3002</p> </li> <li> <p>\u8bbe\u5907\u7aef+\u4e91\u6df7\u5408\u8def\u7531\uff1aCactus\uff08github.com/cactus-compute/cactus\uff09\u5728\u8bbe\u5907\u7ea7\u522b\u5b9e\u73b0\u8bf7\u6c42\u8def\u7531\u3002\u5b83\u901a\u8fc7\u81ea\u5b9a\u4e49ARM SIMD\u5185\u6838\u5728\u8bbe\u5907\u7aef\uff08\u624b\u673a\u3001\u7b14\u8bb0\u672c\u7535\u8111\u3001\u53ef\u7a7f\u6234\u8bbe\u5907\uff09\u8fd0\u884c\u5c0f\u6a21\u578b\uff0c\u5e76\u5728\u672c\u5730\u6a21\u578b\u7f6e\u4fe1\u5ea6\u4f4e\u6216\u67e5\u8be2\u8d85\u51fa\u8bbe\u5907\u80fd\u529b\u65f6\u81ea\u52a8\u8def\u7531\u5230\u4e91\u7aef\u6a21\u578b\u3002\u5e94\u7528\u4e3a\u4e24\u6761\u8def\u5f84\u4f7f\u7528OpenAI\u517c\u5bb9API\u2014\u2014\u8def\u7531\u662f\u900f\u660e\u7684\u3002\u8fd9\u662f\u5728\u57fa\u7840\u8bbe\u65bd\u7ea7\u522b\u7684\u7ea7\u8054\uff1a\u7b2c\u4e00\u5c42\u662f\u514d\u8d39\u7684\uff08\u8bbe\u5907\u7aef\uff09\uff0c\u7b2c\u4e8c\u5c42\u82b1\u94b1\uff08\u4e91API\uff09\u3002\u5bf9\u4e8e\u5927\u591a\u6570\u67e5\u8be2\u7b80\u5355\u7684\u5e94\u7528\uff08\u52a9\u624b\u95ee\u7b54\u3001\u81ea\u52a8\u8865\u5168\u3001\u8f6c\u5f55\uff09\uff0c\u8bbe\u5907\u7aef\u5904\u7406\u8986\u76d670-90%\u7684\u6d41\u91cf\uff0c\u8fb9\u9645\u6210\u672c\u4e3a\u96f6\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/03.%20serving%20and%20batching/#_8","title":"\u63a8\u7406\u6307\u6807","text":"<ul> <li>\u6b63\u786e\u7684\u6307\u6807\u53d6\u51b3\u4e8e\u7528\u4f8b\uff1a</li> </ul> \u6307\u6807 \u6d4b\u91cf\u5185\u5bb9 \u76ee\u6807\uff08\u5bf9\u8bdd\u5f0f\uff09 \u76ee\u6807\uff08\u6279\u5904\u7406\uff09 TTFT \u9996token\u65f6\u95f4 &lt;1 s \u4e0d\u592a\u91cd\u8981 TPOT \u6bcf\u8f93\u51fatoken\u65f6\u95f4 &lt;100 ms \u4e0d\u592a\u91cd\u8981 \u541e\u5410\u91cf token/\u79d2\uff08\u603b\u8ba1\uff09 \u4e0d\u592a\u91cd\u8981 \u6700\u5927\u5316 p99\u5ef6\u8fdf \u6700\u5dee\u76841%\u8bf7\u6c42 &lt;5 s &lt;30 s \u6bcftoken\u6210\u672c $/100\u4e07token \u6700\u5c0f\u5316 \u6700\u5c0f\u5316 SLO\u5408\u89c4\u7387 \u6ee1\u8db3\u5ef6\u8fdf\u76ee\u6807\u7684\u8bf7\u6c42\u767e\u5206\u6bd4 &gt;99% &gt;95% <ul> <li> <p>TTFT vs TPOT\u6743\u8861\uff1a\u6fc0\u8fdb\u7684\u6279\u5904\u7406\u589e\u52a0\u541e\u5410\u91cf\uff08\u603btoken\u6570/\u79d2\u66f4\u591a\uff09\uff0c\u4f46\u589e\u52a0TPOT\uff08\u6bcf\u4e2atoken\u8017\u65f6\u66f4\u957f\uff0c\u56e0\u4e3aGPU\u5904\u7406\u66f4\u591a\u8bf7\u6c42\uff09\u3002\u8c03\u5ea6\u7b56\u7565\u5fc5\u987b\u5e73\u8861\u541e\u5410\u91cf\uff08\u6536\u5165\uff09\u4e0e\u5ef6\u8fdf\uff08\u7528\u6237\u4f53\u9a8c\uff09\u3002</p> </li> <li> <p>\u6bcftoken\u6210\u672c\u662f\u751f\u4ea7\u7684\u6700\u7ec8\u6307\u6807\u3002\u5b83\u7ed3\u5408\u4e86\u786c\u4ef6\u6210\u672c\uff08GPU\u79df\u91d1\uff09\u3001\u541e\u5410\u91cf\uff08token/\u79d2\uff09\u548c\u5229\u7528\u7387\u3002\u8fd0\u884c\u572850% GPU\u5229\u7528\u7387\u7684\u7cfb\u7edf\u6bd4100%\u5229\u7528\u7387\u7684\u7cfb\u7edf\u6bcftoken\u6210\u672c\u9ad82\u500d\u3002\u8fd9\u5c31\u662f\u6279\u5904\u7406\u3001\u8c03\u5ea6\u548cPagedAttention\u5982\u6b64\u91cd\u8981\u7684\u539f\u56e0\u2014\u2014\u5b83\u4eec\u63d0\u9ad8\u4e86\u5229\u7528\u7387\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/03.%20serving%20and%20batching/#colabnotebook","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216notebook\uff09","text":"<ol> <li> <p>\u6a21\u62df\u8fde\u7eedvs\u9759\u6001\u6279\u5904\u7406\u5e76\u6d4b\u91cf\u541e\u5410\u91cf\u5dee\u5f02\u3002 <pre><code>import random\nimport time\n\ndef simulate_static_batching(requests, batch_size=8):\n    \"\"\"\u5728\u56fa\u5b9a\u6279\u6b21\u4e2d\u5904\u7406\u8bf7\u6c42\u3002\u7b49\u5f85\u6240\u6709\u5b8c\u6210\u3002\"\"\"\n    total_tokens = 0\n    total_time = 0\n\n    for i in range(0, len(requests), batch_size):\n        batch = requests[i:i + batch_size]\n        max_len = max(r['output_len'] for r in batch)\n        # \u6279\u6b21\u4e2d\u6240\u6709\u8bf7\u6c42\u8017\u65f6\u7b49\u4e8e\u6700\u957f\u8bf7\u6c42\n        batch_time = max_len * 0.01  # \u6bcftoken 10ms\n        total_time += batch_time\n        total_tokens += sum(r['output_len'] for r in batch)\n\n    return total_tokens / total_time  # token/\u79d2\n\ndef simulate_continuous_batching(requests, max_batch=8):\n    \"\"\"\u4f7f\u7528\u8fde\u7eed\u6279\u5904\u7406\u5904\u7406\u3002\u79fb\u9664\u5b8c\u6210\u8bf7\u6c42\uff0c\u6dfb\u52a0\u65b0\u8bf7\u6c42\u3002\"\"\"\n    total_tokens = 0\n    total_time = 0\n    active = []\n    queue = list(requests)\n\n    while active or queue:\n        # \u586b\u5145\u6279\u6b21\n        while len(active) &lt; max_batch and queue:\n            active.append({'remaining': queue.pop(0)['output_len']})\n\n        if not active:\n            break\n\n        # \u4e00\u4e2a\u89e3\u7801\u6b65\u9aa4\uff1a\u6240\u6709\u6d3b\u8dc3\u8bf7\u6c42\u751f\u62101\u4e2atoken\n        for req in active:\n            req['remaining'] -= 1\n        total_tokens += len(active)\n        total_time += 0.01  # \u6bcf\u6b6510ms\n\n        # \u79fb\u9664\u5b8c\u6210\u7684\u8bf7\u6c42\n        active = [r for r in active if r['remaining'] &gt; 0]\n\n    return total_tokens / total_time\n\n# \u751f\u6210\u5177\u6709\u4e0d\u540c\u8f93\u51fa\u957f\u5ea6\u7684\u8bf7\u6c42\nrandom.seed(42)\nrequests = [{'output_len': random.randint(10, 500)} for _ in range(100)]\n\nstatic_tps = simulate_static_batching(requests)\ncontinuous_tps = simulate_continuous_batching(requests)\n\nprint(f\"\u9759\u6001\u6279\u5904\u7406:     {static_tps:.0f} tokens/s\")\nprint(f\"\u8fde\u7eed\u6279\u5904\u7406: {continuous_tps:.0f} tokens/s\")\nprint(f\"\u52a0\u901f\u6bd4: {continuous_tps / static_tps:.1f}x\")\n</code></pre></p> </li> <li> <p>\u8ba1\u7b97PagedAttention\u7684KV\u7f13\u5b58\u5185\u5b58\u8282\u7701\u3002\u6bd4\u8f83\u9884\u5206\u914d\uff08\u6700\u574f\u60c5\u51b5\uff09vs\u5206\u9875\uff08\u5b9e\u9645\u4f7f\u7528\uff09\u3002 <pre><code>def paged_vs_preallocated(n_requests, max_seq_len, avg_seq_len, page_size, kv_per_token_bytes):\n    \"\"\"\u6bd4\u8f83\u5185\u5b58\u4f7f\u7528\uff1a\u9884\u5206\u914dvs\u5206\u9875KV\u7f13\u5b58\u3002\"\"\"\n    # \u9884\u5206\u914d\uff1a\u6bcf\u4e2a\u8bf7\u6c42\u83b7\u5f97max_seq_len\u4e2a\u69fd\u4f4d\n    preallocated_gb = n_requests * max_seq_len * kv_per_token_bytes / 1e9\n\n    # \u5206\u9875\uff1a\u53ea\u5206\u914d\u4f7f\u7528\u7684\u90e8\u5206\uff08\u6309\u9875\u7c92\u5ea6\uff09\n    import math\n    avg_pages = math.ceil(avg_seq_len / page_size)\n    paged_gb = n_requests * avg_pages * page_size * kv_per_token_bytes / 1e9\n\n    waste_preallocated = (max_seq_len - avg_seq_len) / max_seq_len\n    waste_paged = (avg_pages * page_size - avg_seq_len) / (avg_pages * page_size)\n\n    print(f\"\u8bf7\u6c42\u6570: {n_requests}, \u6700\u5927\u5e8f\u5217: {max_seq_len}, \u5e73\u5747\u5e8f\u5217: {avg_seq_len}\")\n    print(f\"  \u9884\u5206\u914d: {preallocated_gb:.1f} GB (\u6d6a\u8d39: {waste_preallocated:.0%})\")\n    print(f\"  \u5206\u9875:        {paged_gb:.1f} GB (\u6d6a\u8d39: {waste_paged:.0%})\")\n    print(f\"  \u8282\u7701:      {preallocated_gb - paged_gb:.1f} GB ({preallocated_gb/paged_gb:.1f}x)\")\n    print()\n\n# Llama-70B\uff1a\u6bcf\u5c42\u6bcftoken\u7ea61.3 KB\uff0c80\u5c42 = \u6bcftoken\u7ea6100 KB\u603b\u8ba1\nkv_bytes = 100_000\n\n# \u573a\u666f1\uff1a\u77ed\u8bf7\u6c42\uff0c\u5927\u6700\u5927\u503c\npaged_vs_preallocated(256, max_seq_len=4096, avg_seq_len=256, page_size=16, kv_per_token_bytes=kv_bytes)\n\n# \u573a\u666f2\uff1a\u4e0d\u540c\u957f\u5ea6\npaged_vs_preallocated(256, max_seq_len=8192, avg_seq_len=1024, page_size=16, kv_per_token_bytes=kv_bytes)\n\n# \u573a\u666f3\uff1a\u957f\u4e0a\u4e0b\u6587\npaged_vs_preallocated(64, max_seq_len=131072, avg_seq_len=16000, page_size=16, kv_per_token_bytes=kv_bytes)\n</code></pre></p> </li> </ol>"},{"location":"chapter%2017%3A%20AI%20inference/04.%20edge%20inference/","title":"\u8fb9\u7f18\u63a8\u7406","text":"<p>\u8fb9\u7f18\u63a8\u7406\u5728\u7528\u6237\u8bbe\u5907\uff08\u624b\u673a\u3001\u7b14\u8bb0\u672c\u7535\u8111\u3001\u7269\u8054\u7f51\u4f20\u611f\u5668\uff09\u4e0a\u8fd0\u884c\u6a21\u578b\uff0c\u65e0\u9700\u5c06\u6570\u636e\u53d1\u9001\u5230\u4e91\u7aef\u3002\u672c\u6587\u6db5\u76d6\u8fb9\u7f18\u9650\u5236\u3001\u6a21\u578b\u538b\u7f29\u6d41\u6c34\u7ebf\u3001\u8bbe\u5907\u7aef\u8fd0\u884c\u65f6\u3001\u7f16\u8bd1\u5668\u6808\u3001\u786c\u4ef6\u76ee\u6807\uff08NPU\u3001\u795e\u7ecf\u5f15\u64ce\uff09\u3001\u8bbe\u5907\u7aefLLM\u3001\u8054\u90a6\u5b66\u4e60\u548c\u5ef6\u8fdf\u4f18\u5316</p> <ul> <li> <p>\u4e91\u7aef\u63a8\u7406\u9700\u8981\u7f51\u7edc\u8fde\u63a5\uff0c\u589e\u52a0\u5ef6\u8fdf\uff0850-200\u6beb\u79d2\u5f80\u8fd4\uff09\uff0c\u6bcf\u6b21\u8bf7\u6c42\u82b1\u8d39\u91d1\u94b1\uff0c\u5e76\u5c06\u7528\u6237\u6570\u636e\u53d1\u9001\u5230\u7b2c\u4e09\u65b9\u670d\u52a1\u5668\u3002\u8fb9\u7f18\u63a8\u7406\u6d88\u9664\u4e86\u6240\u6709\u56db\u4e2a\u95ee\u9898\uff1a\u6a21\u578b\u672c\u5730\u8fd0\u884c\uff0c\u5373\u65f6\u54cd\u5e94\uff0c\u6bcf\u6b21\u63a8\u7406\u96f6\u6210\u672c\uff0c\u4e14\u6570\u636e\u4fdd\u6301\u79c1\u5bc6\u3002</p> </li> <li> <p>\u6743\u8861\uff1a\u8fb9\u7f18\u8bbe\u5907\u7684\u8ba1\u7b97\u548c\u5185\u5b58\u6bd4\u6570\u636e\u4e2d\u5fc3GPU\u5c0f100-1000\u500d\u3002\u4f7f\u6a21\u578b\u5728\u8fd9\u4e9b\u7ea6\u675f\u4e0b\u8fd0\u884c\u9700\u8981\u5728\u6bcf\u4e2a\u5c42\u9762\u8fdb\u884c\u79ef\u6781\u4f18\u5316\u3002</p> </li> <li> <p>Cactus\uff08github.com/cactus-compute/cactus) \u662f\u4e00\u4e2a\u4e13\u4e3a\u79fb\u52a8\u548c\u53ef\u7a7f\u6234\u8bbe\u5907\u6784\u5efa\u7684\u4f4e\u5ef6\u8fdfAI\u5f15\u64ce\u3002\u5b83\u5728\u751f\u4ea7\u4e2d\u5c55\u793a\u4e86\u672c\u6587\u6db5\u76d6\u7684\u8bb8\u591a\u6280\u672f\uff1a\u81ea\u5b9a\u4e49ARM SIMD\u5185\u6838\u7528\u4e8e\u6ce8\u610f\u529b\u548c\u77e9\u9635\u8fd0\u7b97\uff08\u7b2c16\u7ae0\uff09\u3001KV\u7f13\u5b58\u91cf\u5316\uff08\u7b2c17\u7ae0\u6587\u4ef601\uff09\u3001\u5206\u5757\u9884\u586b\u5145\u3001Apple\u548cQualcomm\u82af\u7247\u4e0a\u7684NPU\u52a0\u901f\u63a8\u7406\u3001\u96f6\u62f7\u8d1d\u5185\u5b58\u6620\u5c04\u5b9e\u73b010\u500d\u66f4\u4f4e\u7684RAM\u4f7f\u7528\uff0c\u4ee5\u53ca\u5728\u8bbe\u5907\u7aef\u8ba1\u7b97\u4e0d\u8db3\u65f6\u7684\u81ea\u52a8\u4e91\u56de\u9000\u3002Cactus\u652f\u6301\u8de8iOS\u3001Android\u3001macOS\u548c\u5d4c\u5165\u5f0fLinux\u7684\u591a\u6a21\u6001\u63a8\u7406\uff08LLM\u3001\u89c6\u89c9\u3001\u8bed\u97f3\uff09\uff0c\u5e76\u63d0\u4f9bSwift\u3001Kotlin\u3001Python\u3001Flutter\u3001React Native\u548cRust\u7684SDK\u3002\u5176\u57fa\u51c6\u6d4b\u8bd5\u663e\u793a\uff0c\u5728M4 Pro\u4e0a1.2B INT4\u6a21\u578b\u89e3\u7801\u8fbe\u5230100 tokens/s\uff0c\u5728iPhone 17 Pro\u4e0a\u8fbe\u523048 tokens/s\u2014\u2014\u8fd9\u662f\u4f18\u5316\u8fb9\u7f18\u63a8\u7406\u7684\u5177\u4f53\u793a\u4f8b\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/04.%20edge%20inference/#_2","title":"\u8fb9\u7f18\u7ea6\u675f","text":"\u8d44\u6e90 \u4e91GPU\uff08H100\uff09 \u7b14\u8bb0\u672c\u7535\u8111\uff08M4\uff09 \u624b\u673a\uff08Snapdragon 8 Gen 3\uff09 IoT\uff08ESP32\uff09 \u5185\u5b58 80 GB HBM3 16-36 GB \u7edf\u4e00\u5185\u5b58 8-12 GB LPDDR5 520 KB \u8ba1\u7b97 989 TFLOPS\uff08FP8\uff09 38 TOPS\uff08\u795e\u7ecf\u5f15\u64ce\uff09 45 TOPS\uff08NPU\uff09 0.001 TOPS \u529f\u8017 700 W 15-30 W 5-10 W 0.1 W \u5b58\u50a8 TB 256 GB-2 TB 128-512 GB 4 MB <ul> <li>\u4e91GPU\u548c\u624b\u673aNPU\u4e4b\u95f4\u7684\u8ba1\u7b97\u5dee\u8ddd\u7ea6\u4e3a20\u500d\u3002GPU\u548c\u5fae\u63a7\u5236\u5668\u4e4b\u95f4\u7684\u5dee\u8ddd\u7ea6\u4e3a1,000,000\u500d\u3002\u4e0d\u540c\u8bbe\u5907\u9700\u8981\u4e0d\u540c\u7a0b\u5ea6\u7684\u538b\u7f29\u548c\u4e0d\u540c\u7684\u6a21\u578b\u67b6\u6784\u3002</li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/04.%20edge%20inference/#_3","title":"\u6a21\u578b\u538b\u7f29\u6d41\u6c34\u7ebf","text":"<ul> <li>\u5bf9\u4e8e\u8fb9\u7f18\u90e8\u7f72\uff0c\u538b\u7f29\u4e0d\u662f\u5355\u4e00\u6280\u672f\u2014\u2014\u5b83\u662f\u4e00\u4e2a\u6309\u987a\u5e8f\u5e94\u7528\u7684\u4e92\u8865\u6280\u672f\u6d41\u6c34\u7ebf\uff1a</li> </ul> <pre><code>\u5b8c\u6574\u6a21\u578b\uff08FP32\uff0c70B\u53c2\u6570\uff09\n    \u2193 \u77e5\u8bc6\u84b8\u998f \u2192 \u66f4\u5c0f\u6a21\u578b\uff087B\u53c2\u6570\uff09\n    \u2193 \u7ed3\u6784\u5316\u526a\u679d \u2192 \u79fb\u9664\u5197\u4f59\u5934/\u5c42\uff084B\u6709\u6548\uff09\n    \u2193 \u91cf\u5316\uff08INT4\uff09 \u2192 4\u500d\u66f4\u5c0f\uff082 GB\uff09\n    \u2193 \u7f16\u8bd1\u5668\u4f18\u5316 \u2192 \u878d\u5408\u5185\u6838\uff0c\u4f18\u5316\u5185\u5b58\u5e03\u5c40\n    \u2193 \u8fd0\u884c\u65f6 \u2192 \u8bbe\u5907\u7aef\u6267\u884c\n</code></pre> <ul> <li>\u6bcf\u4e00\u6b65\u51cf\u5c11\u5927\u5c0f\u548c\u5ef6\u8fdf\u3002\u987a\u5e8f\u5f88\u91cd\u8981\uff1a\u5148\u84b8\u998f\uff08\u51cf\u5c11\u67b6\u6784\uff09\uff0c\u7136\u540e\u526a\u679d\uff08\u79fb\u9664\u7ed3\u6784\uff09\uff0c\u7136\u540e\u91cf\u5316\uff08\u964d\u4f4e\u7cbe\u5ea6\uff09\uff0c\u6700\u540e\u7f16\u8bd1\uff08\u4e3a\u76ee\u6807\u786c\u4ef6\u4f18\u5316\uff09\u3002\u5728\u91cf\u5316\u4e4b\u540e\u8fdb\u884c\u84b8\u998f\u4f1a\u8bd5\u56fe\u538b\u7f29\u5df2\u7ecf\u635f\u5931\u8d28\u91cf\u7684\u6a21\u578b\u3002</li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/04.%20edge%20inference/#_4","title":"\u8bbe\u5907\u7aef\u8fd0\u884c\u65f6","text":"<ul> <li> <p>\u8fd0\u884c\u65f6\u52a0\u8f7d\u6a21\u578b\u3001\u5206\u914d\u5185\u5b58\u5e76\u5728\u76ee\u6807\u786c\u4ef6\u4e0a\u6267\u884c\u63a8\u7406\u3002\u6bcf\u4e2a\u5e73\u53f0\u6709\u5176\u504f\u597d\u7684\u8fd0\u884c\u65f6\uff1a</p> </li> <li> <p>ONNX Runtime\uff1a\u8de8\u5e73\u53f0\uff08Windows\u3001Linux\u3001macOS\u3001iOS\u3001Android\uff09\u3002\u652f\u6301CPU\u3001GPU\uff08CUDA\u3001DirectML\u3001CoreML\u3001NNAPI\uff09\u548c\u8bb8\u591a\u52a0\u901f\u5668\u540e\u7aef\u3002\u6700\u5177\u53ef\u79fb\u690d\u6027\u7684\u9009\u9879\u3002\u6a21\u578b\u4ecePyTorch/TensorFlow\u5bfc\u51fa\u4e3aONNX\u683c\u5f0f\u3002</p> </li> <li> <p>TensorFlow Lite\uff08TFLite\uff09\uff1aGoogle\u7684\u8fb9\u7f18\u8fd0\u884c\u65f6\u3002\u9488\u5bf9ARM CPU\u548cAndroid NPU\u4f18\u5316\u3002\u4e8c\u8fdb\u5236\u6587\u4ef6\u5c0f\u5de7\uff08\u7ea61 MB\uff09\u3002\u652f\u6301INT8\u548cfloat16\u3002Android\u90e8\u7f72\u7684\u6807\u51c6\u3002</p> </li> <li> <p>Core ML\uff1aApple\u7684iOS/macOS\u8fd0\u884c\u65f6\u3002\u6839\u636e\u6a21\u578b\u7279\u5f81\u81ea\u52a8\u4f7f\u7528\u795e\u7ecf\u5f15\u64ce\u3001GPU\u6216CPU\u3002\u6a21\u578b\u4f7f\u7528<code>coremltools</code>\u4ecePyTorch/TensorFlow\u8f6c\u6362\u3002\u4e0eApple\u786c\u4ef6\u7d27\u5bc6\u96c6\u6210\uff08\u7edf\u4e00\u5185\u5b58\u3001\u795e\u7ecf\u5f15\u64ce\uff09\u3002</p> </li> <li> <p>ExecuTorch\uff1aMeta\u65b0\u63a8\u51fa\u7684\u8bbe\u5907\u7aefPyTorch\u8fd0\u884c\u65f6\u3002\u4e13\u4e3a\u8fb9\u7f18\u90e8\u7f72\u8bbe\u8ba1\uff0c\u5177\u6709\u63d0\u524d\u7f16\u8bd1\u548c\u64cd\u4f5c\u7ea7\u786c\u4ef6\u52a0\u901f\u5668\u59d4\u6d3e\u529f\u80fd\u3002PyTorch Mobile\u7684\u7ee7\u4efb\u8005\u3002</p> </li> <li> <p>TensorRT\uff1aNVIDIA\u7684GPU\u63a8\u7406\u4f18\u5316\u8fd0\u884c\u65f6\uff08\u7b2c15\u7ae0\uff09\u3002\u878d\u5408\u5c42\u3001\u9009\u62e9\u6700\u4f18\u5185\u6838\u5e76\u81ea\u52a8\u91cf\u5316\u3002\u5728NVIDIA GPU\u4e0a\u6bd4PyTorch eager\u6a21\u5f0f\u5feb2-5\u500d\u3002</p> </li> <li> <p>llama.cpp\uff1a\u7528\u4e8eLLM\u7684\u5355\u6587\u4ef6C++\u63a8\u7406\u5f15\u64ce\u3002\u652f\u6301GGUF\u91cf\u5316\uff08Q4\u3001Q5\u3001Q8\uff09\u3001CPU\uff08AVX/NEON\uff09\u3001Metal\uff08Apple GPU\uff09\u3001CUDA\u548cVulkan\u3002\u5728\u6d88\u8d39\u7ea7\u786c\u4ef6\u4e0a\u8fd0\u884cLLM\u7684\u9996\u9009\u65b9\u6848\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/04.%20edge%20inference/#_5","title":"\u7f16\u8bd1\u5668\u6808","text":"<ul> <li>\u5728\u9ad8\u7ea7\u6a21\u578b\uff08PyTorch\u56fe\uff09\u548c\u786c\u4ef6\uff08NPU\u6307\u4ee4\uff09\u4e4b\u95f4\u662f\u7f16\u8bd1\u5668\u6808\uff0c\u5b83\u4e3a\u7279\u5b9a\u76ee\u6807\u4f18\u5316\u6a21\u578b\uff1a</li> </ul> <pre><code>PyTorch\u6a21\u578b\n    \u2193 \u5bfc\u51fa\uff08torch.export\u3001ONNX\u3001TorchScript\uff09\n\u56feIR\uff08\u4e2d\u95f4\u8868\u793a\uff09\n    \u2193 \u56fe\u4f18\u5316\n        - \u5e38\u91cf\u6298\u53e0\uff08\u7f16\u8bd1\u65f6\u8ba1\u7b97\u5e38\u91cf\u8868\u8fbe\u5f0f\uff09\n        - \u6b7b\u4ee3\u7801\u6d88\u9664\uff08\u79fb\u9664\u672a\u4f7f\u7528\u7684\u64cd\u4f5c\uff09\n        - \u7b97\u5b50\u878d\u5408\uff08conv + bn + relu \u2192 \u5355\u4e2a\u878d\u5408\u64cd\u4f5c\uff09\n        - \u5e03\u5c40\u8f6c\u6362\uff08NCHW \u2192 NHWC\u7528\u4e8eARM\uff0c\u901a\u9053\u6700\u540e\uff09\n    \u2193 \u964d\u7ea7\n\u786c\u4ef6\u7279\u5b9aIR\n    \u2193 \u540e\u7aef\u4f18\u5316\n        - \u5206\u5757\u548c\u5faa\u73af\u6392\u5e8f\uff08\u7f13\u5b58\u53cb\u597d\u7684\u8bbf\u95ee\u6a21\u5f0f\uff09\n        - \u5411\u91cf\u5316\uff08SIMD\uff0c\u7b2c16\u7ae0\uff09\n        - \u5185\u5b58\u89c4\u5212\uff08\u91cd\u7528\u7f13\u51b2\u533a\u4ee5\u6700\u5c0f\u5316\u5cf0\u503c\u5185\u5b58\uff09\n        - \u5185\u6838\u9009\u62e9\uff08\u4e3a\u6bcf\u4e2a\u64cd\u4f5c\u9009\u62e9\u6700\u4f73\u5b9e\u73b0\uff09\n    \u2193 \u4ee3\u7801\u751f\u6210\n\u673a\u5668\u4ee3\u7801 / NPU\u6307\u4ee4\n</code></pre> <ul> <li> <p>\u7b97\u5b50\u878d\u5408\u662f\u5f71\u54cd\u6700\u5927\u7684\u4f18\u5316\u3002\u4e00\u4e2aTransformer\u5757\u7ea6\u670920\u4e2a\u64cd\u4f5c\uff08\u77e9\u9635\u4e58\u3001\u52a0\u6cd5\u3001\u5c42\u5f52\u4e00\u5316\u3001softmax\u7b49\uff09\u3002\u6ca1\u6709\u878d\u5408\uff0c\u6bcf\u4e2a\u64cd\u4f5c\u5c06\u5176\u8f93\u51fa\u5199\u5165\u5185\u5b58\uff0c\u4e0b\u4e00\u4e2a\u64cd\u4f5c\u518d\u8bfb\u56de\u3002\u6709\u4e86\u878d\u5408\uff0c\u591a\u4e2a\u64cd\u4f5c\u7ec4\u5408\u6210\u4e00\u4e2a\u5185\u6838\uff0c\u5c06\u6570\u636e\u4fdd\u7559\u5728\u5bc4\u5b58\u5668/\u7f13\u5b58\u4e2d\u3002\u8fd9\u53ef\u4ee5\u4f7f\u901f\u5ea6\u5feb2-5\u500d\uff08\u7b2c16\u7ae0\uff0c\u5c4b\u9876\u6a21\u578b\uff09\u3002</p> </li> <li> <p>\u5185\u5b58\u89c4\u5212\uff1a\u7f16\u8bd1\u5668\u5206\u6790\u6a21\u578b\u56fe\u4ee5\u786e\u5b9a\u54ea\u4e9b\u5f20\u91cf\u7684\u751f\u547d\u5468\u671f\u91cd\u53e0\uff0c\u53ef\u4ee5\u5171\u4eab\u76f8\u540c\u7684\u5185\u5b58\u7f13\u51b2\u533a\u3002\u4e00\u4e2a\u6709100\u4e2a\u4e2d\u95f4\u5f20\u91cf\u7684\u6a21\u578b\u53ef\u80fd\u53ea\u9700\u898110\u5f20\u91cf\u7684\u5185\u5b58\uff0c\u56e0\u4e3a\u5927\u591a\u6570\u5f20\u91cf\u5728\u5176\u4ed6\u5f20\u91cf\u521b\u5efa\u4e4b\u524d\u5c31\u88ab\u6d88\u8017\u548c\u91ca\u653e\u4e86\u3002\u8fd9\u5728\u5185\u5b58\u6709\u9650\u7684\u8bbe\u5907\u4e0a\u81f3\u5173\u91cd\u8981\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/04.%20edge%20inference/#_6","title":"\u786c\u4ef6\u76ee\u6807","text":""},{"location":"chapter%2017%3A%20AI%20inference/04.%20edge%20inference/#gpu","title":"\u79fb\u52a8GPU","text":"<ul> <li> <p>Qualcomm Adreno\uff08Android\uff09\uff1a\u652f\u6301OpenCL\u3001Vulkan\u8ba1\u7b97\uff08\u7b2c16\u7ae0\uff09\u548cQualcomm\u4e13\u6709\u7684SNPE\uff08Snapdragon\u795e\u7ecf\u5904\u7406\u5f15\u64ce\uff09\u3002Adreno GPU\u5177\u6709256-1024\u4e2aALU\uff0c\u652f\u6301FP16\u548cINT8\u3002</p> </li> <li> <p>ARM Mali\uff08Android\uff09\uff1a\u652f\u6301OpenCL\u548cVulkan\u3002Mali GPU\u4f7f\u7528\u57fa\u4e8e\u56fe\u5757\u7684\u67b6\u6784\uff08\u4e0e\u684c\u9762GPU\u4e0d\u540c\uff09\uff0c\u8fd9\u5f71\u54cd\u6700\u4f18\u5185\u5b58\u8bbf\u95ee\u6a21\u5f0f\u3002</p> </li> <li> <p>Apple GPU\uff08iOS/macOS\uff09\uff1a\u901a\u8fc7Metal\uff08Apple\u7684GPU API\uff09\u8bbf\u95ee\u3002\u7edf\u4e00\u5185\u5b58\u67b6\u6784\u610f\u5473\u7740\u6ca1\u6709CPU\u2194GPU\u590d\u5236\u5f00\u9500\u3002Metal Performance Shaders\uff08MPS\uff09\u63d0\u4f9b\u4f18\u5316\u7684ML\u539f\u8bed\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/04.%20edge%20inference/#npu","title":"\u795e\u7ecf\u5904\u7406\u5355\u5143\uff08NPU\uff09","text":"<ul> <li> <p>NPU\u662f\u4e13\u95e8\u4e3aML\u63a8\u7406\u8bbe\u8ba1\u7684\u56fa\u5b9a\u529f\u80fd\u52a0\u901f\u5668\u3002\u5b83\u4eec\u5728\u6807\u51c6ML\u64cd\u4f5c\uff08\u77e9\u9635\u4e58\u3001\u5377\u79ef\u3001\u6fc0\u6d3b\uff09\u4e0a\u6bd4GPU\u8282\u80fd\u5f97\u591a\u3002</p> </li> <li> <p>Apple\u795e\u7ecf\u5f15\u64ce\uff1a16\u6838\uff0c\u7ea638 TOPS\uff08INT8\uff09\u3002\u901a\u8fc7Core ML\u8bbf\u95ee\u3002\u975e\u5e38\u9002\u5408\u89c6\u89c9\u6a21\u578b\u548c\u8bbe\u5907\u7aef\u6269\u6563\u3002\u4e0d\u80fd\u8fd0\u884c\u4efb\u610f\u4ee3\u7801\u2014\u2014\u53ea\u652f\u6301Core ML\u652f\u6301\u7684\u64cd\u4f5c\u3002</p> </li> <li> <p>Qualcomm Hexagon NPU\uff1a\u96c6\u6210\u5230Snapdragon SoC\u4e2d\u3002\u652f\u6301INT8\u548cINT4\u63a8\u7406\u3002\u901a\u8fc7SNPE\u6216ONNX Runtime\uff08\u5e26QNN\u540e\u7aef\uff09\u8bbf\u95ee\u3002\u4e3a\u8bbe\u5907\u7aef\u529f\u80fd\u5982\u80cc\u666f\u865a\u5316\u3001\u8bed\u97f3\u8bc6\u522b\u548c\u5b9e\u65f6\u7ffb\u8bd1\u63d0\u4f9b\u652f\u6301\u3002</p> </li> <li> <p>Google Edge TPU\uff1a\u4e91\u7aefTPU\u7684\u5c0f\u578b\u4f4e\u529f\u8017\u7248\u672c\u30024 TOPS\uff0c2W\u3002\u7528\u4e8eCoral\u8bbe\u5907\u8fdb\u884c\u8bbe\u5907\u7aef\u63a8\u7406\u3002\u4ec5\u652f\u6301INT8\u91cf\u5316\u7684TFLite\u6a21\u578b\u3002</p> </li> <li> <p>\u59d4\u6d3e\u6a21\u5f0f\uff1a\u8fd0\u884c\u65f6\u5728NPU\uff08\u7528\u4e8e\u652f\u6301\u7684\u64cd\u4f5c\uff09\u548cCPU\uff08\u7528\u4e8e\u4e0d\u652f\u6301\u7684\u64cd\u4f5c\uff09\u4e4b\u95f4\u62c6\u5206\u6a21\u578b\u56fe\u3002\u6700\u5927\u5316\u5728NPU\u4e0a\u8fd0\u884c\u7684\u90e8\u5206\u662f\u6027\u80fd\u548c\u80fd\u6548\u7684\u5173\u952e\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/04.%20edge%20inference/#llm","title":"\u8bbe\u5907\u7aefLLM","text":"<ul> <li>\u5728\u624b\u673a\u548c\u7b14\u8bb0\u672c\u7535\u8111\u4e0a\u8fd0\u884cLLM\u5df2\u53d8\u5f97\u53ef\u884c\uff0c\u5f97\u76ca\u4e8e\u5c0f\u6a21\u578b\u548c\u79ef\u6781\u7684\u91cf\u5316\uff1a</li> </ul> \u6a21\u578b \u53c2\u6570 \u91cf\u5316\u540e\u5927\u5c0f \u76ee\u6807\u8bbe\u5907 \u6027\u80fd Phi-3 Mini 3.8B ~2 GB\uff08Q4\uff09 \u624b\u673a/\u7b14\u8bb0\u672c iPhone 15\u4e0a~15 tokens/s Gemma 2B 2B ~1.5 GB\uff08Q4\uff09 \u624b\u673a Pixel 8\u4e0a~20 tokens/s Llama 3.2 1B 1B ~700 MB\uff08Q4\uff09 \u624b\u673a ~30 tokens/s Llama 3.2 3B 3B ~2 GB\uff08Q4\uff09 \u624b\u673a/\u7b14\u8bb0\u672c ~15 tokens/s Llama 3.1 8B 8B ~4.5 GB\uff08Q4\uff09 \u7b14\u8bb0\u672c M2\u4e0a~20 tokens/s <ul> <li> <p>\u6311\u6218\uff1a</p> <ul> <li>\u5185\u5b58\uff1a3B Q4\u6a21\u578b\u53602 GB\uff0c\u4f46\u957f\u5bf9\u8bdd\u7684KV\u7f13\u5b58\u589e\u52a0\u4e86\u663e\u8457\u989d\u5916\u5185\u5b58\u3002\u624b\u673a\u4e0a\u7684\u4e0a\u4e0b\u6587\u957f\u5ea6\u901a\u5e38\u9650\u5236\u57282-4K token\u3002</li> <li>\u70ed\u8282\u6d41\uff1a\u6301\u7eed\u63a8\u7406\u4f7f\u624b\u673a\u53d1\u70ed\u3002\u8fde\u7eed\u751f\u621030\u79d2\u540e\uff0cSoC\u4f1a\u964d\u4f4e\u65f6\u949f\u901f\u5ea6\u4ee5\u9632\u6b62\u8fc7\u70ed\uff0c\u6027\u80fd\u4e0b\u964d30-50%\u3002</li> <li>\u7535\u6c60\uff1a\u4ee515 tokens/s\u8fd0\u884c3B\u6a21\u578b\u6d88\u8017\u7ea63-5W\u300230\u5206\u949f\u7684\u5bf9\u8bdd\u6d88\u8017\u5178\u578b\u624b\u673a\u7535\u6c60\u7ea65%\u3002\u5076\u5c14\u4f7f\u7528\u53ef\u4ee5\u63a5\u53d7\uff0c\u4f46\u59cb\u7ec8\u5728\u7ebf\u5e94\u7528\u5b58\u5728\u95ee\u9898\u3002</li> </ul> </li> <li> <p>llama.cpp\u662f\u8bbe\u5907\u7aefLLM\u7684\u6807\u51c6\u3002\u5b83\u5728CPU\uff08AVX2\u3001NEON\u3001I8MM\uff09\u3001Apple GPU\uff08Metal\uff09\u3001NVIDIA GPU\uff08CUDA\uff09\u3001AMD GPU\uff08ROCm/Vulkan\uff09\u751a\u81f3\u624b\u673a\u4e0a\uff08\u901a\u8fc7Android\u4e0a\u7684Termux\uff09\u8fd0\u884c\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/04.%20edge%20inference/#_7","title":"\u8054\u90a6\u5b66\u4e60","text":"<ul> <li> <p>\u8054\u90a6\u5b66\u4e60\u5728\u8bb8\u591a\u8bbe\u5907\u4e0a\u8bad\u7ec3\u6a21\u578b\uff0c\u65e0\u9700\u96c6\u4e2d\u6570\u636e\u3002\u6bcf\u4e2a\u8bbe\u5907\u5728\u5176\u672c\u5730\u6570\u636e\u4e0a\u8bad\u7ec3\uff0c\u8ba1\u7b97\u68af\u5ea6\u66f4\u65b0\uff0c\u5e76\u5c06\u53ea\u6709\u66f4\u65b0\uff08\u800c\u975e\u6570\u636e\uff09\u53d1\u9001\u5230\u805a\u5408\u66f4\u65b0\u7684\u4e2d\u592e\u670d\u52a1\u5668\u3002</p> </li> <li> <p>\u7b97\u6cd5\uff08FedAvg\uff09\uff1a</p> <ol> <li>\u670d\u52a1\u5668\u5c06\u5f53\u524d\u6a21\u578b\u53d1\u9001\u7ed9\\(K\\)\u4e2a\u9009\u5b9a\u8bbe\u5907\u3002</li> <li>\u6bcf\u4e2a\u8bbe\u5907\u5728\u5176\u672c\u5730\u6570\u636e\u4e0a\u5fae\u8c03\u6a21\u578b\u51e0\u6b65\u3002</li> <li>\u6bcf\u4e2a\u8bbe\u5907\u5c06\u5176\u66f4\u65b0\u540e\u7684\u6a21\u578b\uff08\u6216\u5dee\u5f02\uff09\u53d1\u9001\u56de\u670d\u52a1\u5668\u3002</li> <li>\u670d\u52a1\u5668\u5e73\u5747\u66f4\u65b0\uff1a\\(W_{\\text{new}} = \\frac{1}{K} \\sum_{k=1}^{K} W_k\\)\u3002</li> <li>\u91cd\u590d\u3002</li> </ol> </li> <li> <p>\u9690\u79c1\uff1a\u539f\u59cb\u6570\u636e\u4ece\u4e0d\u79bb\u5f00\u8bbe\u5907\u3002\u670d\u52a1\u5668\u53ea\u770b\u5230\u805a\u5408\u7684\u6a21\u578b\u66f4\u65b0\u3002\u5dee\u5206\u9690\u79c1\u5411\u66f4\u65b0\u6dfb\u52a0\u566a\u58f0\uff0c\u4f7f\u5f97\u65e0\u6cd5\u4ece\u68af\u5ea6\u4e2d\u9006\u5411\u63a8\u65ad\u5355\u4e2a\u6570\u636e\u70b9\u3002</p> </li> <li> <p>\u901a\u4fe1\u6548\u7387\uff1a\u6a21\u578b\u66f4\u65b0\u5f88\u5927\uff08\u4e0e\u6a21\u578b\u76f8\u540c\u5927\u5c0f\uff09\u3002\u538b\u7f29\u6280\u672f\u51cf\u5c11\u4e86\u8fd9\u4e00\u70b9\uff1a\u68af\u5ea6\u91cf\u5316\uff08\u53d1\u9001INT8\u68af\u5ea6\u800c\u4e0d\u662fFP32\uff09\u3001\u7a00\u758f\u5316\uff08\u53ea\u53d1\u9001\u6700\u5927\u7684\u68af\u5ea6\uff09\u548c\u68af\u5ea6\u7d2f\u79ef\uff08\u505a\u66f4\u591a\u672c\u5730\u6b65\u9aa4\uff0c\u53d1\u9001\u66f4\u5c11\u9891\u7387\uff09\u3002</p> </li> <li> <p>\u5e94\u7528\uff1aGoogle\u7684\u952e\u76d8\u9884\u6d4b\uff08Gboard\uff09\u3001Apple\u7684\u8bed\u97f3\u8bc6\u522b\u3001\u5065\u5eb7\u76d1\u6d4b\uff08\u5728\u654f\u611f\u5065\u5eb7\u6570\u636e\u4e0a\u8bad\u7ec3\u800c\u4e0d\u96c6\u4e2d\u6570\u636e\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/04.%20edge%20inference/#_8","title":"\u5ef6\u8fdf\u4f18\u5316","text":"<ul> <li> <p>\u9664\u4e86\u538b\u7f29\uff0c\u8fd8\u6709\u51e0\u79cd\u6280\u672f\u51cf\u5c11\u7aef\u5230\u7aef\u63a8\u7406\u5ef6\u8fdf\uff1a</p> </li> <li> <p>\u63d0\u524d\u9000\u51fa\uff1a\u5728\u4e2d\u95f4\u5c42\u6dfb\u52a0\u5206\u7c7b\u5934\u3002\u5982\u679c\u6a21\u578b\u5728\u7b2c6\u5c42\uff08\u517124\u5c42\uff09\u5df2\u7ecf\u81ea\u4fe1\uff0c\u5219\u8fd4\u56de\u9884\u6d4b\u800c\u4e0d\u8fd0\u884c\u7b2c7-24\u5c42\u3002\u7b80\u5355\u8f93\u5165\u63d0\u524d\u9000\u51fa\uff0c\u56f0\u96be\u8f93\u5165\u4f7f\u7528\u5b8c\u6574\u6a21\u578b\u3002\u5bf9\u4e8e\u6df7\u5408\u7b80\u5355\u548c\u56f0\u96be\u8f93\u5165\u7684\u4efb\u52a1\uff0c\u5e73\u5747\u5ef6\u8fdf\u663e\u8457\u4e0b\u964d\u3002</p> </li> <li> <p>\u6a21\u578b\u5206\u533a\uff1a\u5728NPU\uff08\u5bf9\u77e9\u9635\u4e58\u9ad8\u6548\uff09\u3001GPU\uff08\u5bf9\u4e0d\u89c4\u5219\u64cd\u4f5c\u9ad8\u6548\uff09\u548cCPU\uff08\u5904\u7406\u5176\u4ed6\u4e00\u5207\uff09\u4e4b\u95f4\u62c6\u5206\u6a21\u578b\u3002\u7f16\u8bd1\u5668\u6839\u636e\u6027\u80fd\u5206\u6790\u51b3\u5b9a\u54ea\u4e9b\u64cd\u4f5c\u53bb\u54ea\u91cc\u3002</p> </li> <li> <p>\u7f13\u5b58\uff1a\u5bf9\u4e8e\u5177\u6709\u91cd\u590d\u67e5\u8be2\u7684\u5e94\u7528\uff08\u81ea\u52a8\u8865\u5168\u3001\u4ee3\u7801\u8865\u5168\uff09\uff0c\u7f13\u5b58\u6700\u8fd1\u7684\u8ba1\u7b97\u3002\u5982\u679c\u7528\u6237\u8f93\u5165\"How do I\"\u4e14\u6a21\u578b\u6700\u8fd1\u751f\u6210\u4e86\"How do I\"\u7684\u8865\u5168\uff0c\u53ef\u4ee5\u91cd\u7528\u7f13\u5b58\u7684KV\u7f13\u5b58\uff0c\u5b8c\u5168\u8df3\u8fc7\u9884\u586b\u5145\u9636\u6bb5\u3002</p> </li> <li> <p>\u63a8\u6d4b\u6027\u9884\u53d6\uff1a\u9884\u6d4b\u7528\u6237\u4e0b\u4e00\u6b65\u5c06\u505a\u4ec0\u4e48\uff0c\u5728\u7528\u6237\u8be2\u95ee\u4e4b\u524d\u5f00\u59cb\u63a8\u7406\u3002\u804a\u5929\u5e94\u7528\u53ef\u80fd\u5728\u7528\u6237\u9605\u8bfb\u5f53\u524d\u7b54\u6848\u65f6\u5f00\u59cb\u751f\u6210\u53ef\u80fd\u540e\u7eed\u95ee\u9898\u7684\u54cd\u5e94\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/04.%20edge%20inference/#colabnotebook","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216notebook\uff09","text":"<ol> <li> <p>\u6a21\u62df\u6a21\u578b\u538b\u7f29\u6d41\u6c34\u7ebf\u3002\u4ecefloat32\u6a21\u578b\u5f00\u59cb\uff0c\u4f9d\u6b21\u5e94\u7528\u84b8\u998f\uff08\u6a21\u62df\uff09\u3001\u526a\u679d\u548c\u91cf\u5316\uff0c\u5e76\u8ddf\u8e2a\u6bcf\u4e00\u6b65\u7684\u5927\u5c0f\u3002 <pre><code>def compression_pipeline(original_params_M, original_bits=32):\n    size_mb = original_params_M * 1e6 * original_bits / 8 / 1e6\n\n    print(f\"\u539f\u59cb: {original_params_M}M \u53c2\u6570, {original_bits}-\u4f4d \u2192 {size_mb:.0f} MB\")\n\n    # \u6b65\u9aa41\uff1a\u77e5\u8bc6\u84b8\u998f\uff08\u51cf\u5c11\u53c2\u6570\uff09\n    distilled_params = original_params_M * 0.15  # 70B \u2192 ~10B \u7b49\u4ef7\n    size_mb = distilled_params * 1e6 * original_bits / 8 / 1e6\n    print(f\"\u84b8\u998f\u540e ({distilled_params:.0f}M \u53c2\u6570): {size_mb:.0f} MB\")\n\n    # \u6b65\u9aa42\uff1a\u7ed3\u6784\u5316\u526a\u679d\uff08\u79fb\u9664\u5269\u4f5930%\uff09\n    pruned_params = distilled_params * 0.7\n    size_mb = pruned_params * 1e6 * original_bits / 8 / 1e6\n    print(f\"\u526a\u679d\u540e ({pruned_params:.0f}M \u53c2\u6570): {size_mb:.0f} MB\")\n\n    # \u6b65\u9aa43\uff1aINT4\u91cf\u5316\n    size_mb = pruned_params * 1e6 * 4 / 8 / 1e6\n    print(f\"INT4\u91cf\u5316\u540e: {size_mb:.0f} MB\")\n\n    print(f\"\u603b\u538b\u7f29\u6bd4: {original_params_M * 1e6 * original_bits / 8 / 1e6 / size_mb:.0f}x\")\n\nprint(\"=== \u4ece70B\u6a21\u578b\u5f00\u59cb ===\")\ncompression_pipeline(70000)\n\nprint(\"\\n=== \u4ece7B\u6a21\u578b\u5f00\u59cb ===\")\ncompression_pipeline(7000)\n</code></pre></p> </li> <li> <p>\u4f30\u8ba1\u8bbe\u5907\u7aef\u63a8\u7406\u5ef6\u8fdf\u3002\u7ed9\u5b9a\u6a21\u578b\u7684\u64cd\u4f5c\u8ba1\u6570\u548c\u786c\u4ef6\u89c4\u683c\uff0c\u8ba1\u7b97\u662f\u5426\u6ee1\u8db3\u5ef6\u8fdf\u76ee\u6807\u3002 <pre><code>def estimate_latency(model_name, params_M, bits, compute_tops, mem_bw_gbs, seq_len=256):\n    \"\"\"\u4f30\u8ba1\u5185\u5b58\u5e26\u5bbd\u53d7\u9650\u6a21\u578b\u7684token\u751f\u6210\u5ef6\u8fdf\u3002\"\"\"\n    # \u6a21\u578b\u5927\u5c0f\uff08\u5b57\u8282\uff09\n    model_bytes = params_M * 1e6 * bits / 8\n\n    # \u89e3\u7801\u662f\u5185\u5b58\u53d7\u9650\u7684\uff1a\u6bcftoken\u5fc5\u987b\u52a0\u8f7d\u6574\u4e2a\u6a21\u578b\n    time_per_token_ms = model_bytes / (mem_bw_gbs * 1e9) * 1000\n\n    # \u6bcf\u79d2token\u6570\n    tokens_per_sec = 1000 / time_per_token_ms\n\n    print(f\"{model_name}: {params_M/1000:.1f}B \u53c2\u6570 @ {bits}-\u4f4d = {model_bytes/1e9:.1f} GB\")\n    print(f\"  \u5185\u5b58\u5e26\u5bbd: {mem_bw_gbs} GB/s\")\n    print(f\"  \u6bcftoken\u65f6\u95f4: {time_per_token_ms:.1f} ms\")\n    print(f\"  Tokens/\u79d2: {tokens_per_sec:.0f}\")\n    print()\n\n# Apple M2 Pro\uff1a200 GB/s \u7edf\u4e00\u5185\u5b58\u5e26\u5bbd\nprint(\"=== Apple M2 Pro (200 GB/s) ===\")\nestimate_latency(\"Llama-7B Q4\", 7000, 4, 15.8, 200)\nestimate_latency(\"Llama-7B Q8\", 7000, 8, 15.8, 200)\nestimate_latency(\"Llama-70B Q4\", 70000, 4, 15.8, 200)\n\n# \u624b\u673a\uff08Snapdragon 8 Gen 3\uff09\uff1a~50 GB/s LPDDR5\nprint(\"=== Snapdragon 8 Gen 3 (50 GB/s) ===\")\nestimate_latency(\"Phi-3 Mini Q4\", 3800, 4, 45, 50)\nestimate_latency(\"Llama-3B Q4\", 3000, 4, 45, 50)\n</code></pre></p> </li> </ol>"},{"location":"chapter%2017%3A%20AI%20inference/05.%20scaling%20and%20deployment/","title":"\u6269\u7f29\u4e0e\u90e8\u7f72","text":"<p>\u5411\u6570\u767e\u4e07\u7528\u6237\u63d0\u4f9b\u5927\u6a21\u578b\u670d\u52a1\u9700\u8981\u8de8\u591a\u4e2aGPU\u5206\u5e03\u63a8\u7406\u3001\u5728\u9700\u8981\u4e4b\u524d\u9884\u6d4btoken\u3001\u7f13\u5b58\u5171\u4eab\u4e0a\u4e0b\u6587\u4ee5\u53ca\u9009\u62e9\u5408\u9002\u7684\u6846\u67b6\u3002\u672c\u6587\u6db5\u76d6\u63a8\u7406\u65f6\u7684\u5e76\u884c\u6027\u3001\u63a8\u6d4b\u6027\u89e3\u7801\u3001\u524d\u7f00\u7f13\u5b58\u3001\u63a8\u7406\u6846\u67b6\u3001\u6210\u672c\u4f18\u5316\u548c\u76d1\u63a7</p> <ul> <li>\u5355\u4e2aH100 GPU\u670d\u52a1\u4e00\u4e2a70B\u6a21\u578b\u53ef\u4ee5\u5904\u7406\u7ea6100\u4e2a\u5e76\u53d1\u7528\u6237\uff0c\u4ea4\u4e92\u5ef6\u8fdf\u53ef\u63a5\u53d7\u3002\u670d\u52a11000\u4e07\u7528\u6237\u9700\u8981100,000\u4e2aGPU\u2014\u2014\u4e91\u8ba1\u7b97\u6bcf\u5e74\u82b1\u8d39\u7ea630\u4ebf\u7f8e\u5143\u3002\u6bcf\u4e00\u4e2a\u767e\u5206\u70b9\u7684\u6548\u7387\u63d0\u5347\u5c31\u80fd\u8282\u7701\u6570\u5343\u4e07\u7f8e\u5143\u3002\u8fd9\u5c31\u662f\u63a8\u7406\u4f18\u5316\u4e0d\u662f\u5b66\u672f\u95ee\u9898\u7684\u539f\u56e0\uff1a\u5b83\u76f4\u63a5\u51b3\u5b9aAI\u4ea7\u54c1\u7684\u7ecf\u6d4e\u6027\u3002</li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/05.%20scaling%20and%20deployment/#_2","title":"\u63a8\u7406\u65f6\u7684\u6a21\u578b\u5e76\u884c","text":"<ul> <li>\u5f53\u6a21\u578b\u592a\u5927\u65e0\u6cd5\u88c5\u5165\u5355\u5f20GPU\u65f6\uff0c\u5fc5\u987b\u8de8\u591a\u4e2aGPU\u62c6\u5206\u3002\u8bad\u7ec3\u65f6\u7684\u5e76\u884c\u7b56\u7565\uff08\u7b2c6\u7ae0\uff09\u5728\u63a8\u7406\u65f6\u9002\u7528\uff0c\u4f46\u6743\u8861\u4e0d\u540c\u3002</li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/05.%20scaling%20and%20deployment/#_3","title":"\u5f20\u91cf\u5e76\u884c","text":"<ul> <li>\u5f20\u91cf\u5e76\u884c\uff08Megatron\u98ce\u683c\uff0c\u7b2c6\u7ae0\uff09\u8de8GPU\u62c6\u5206\u5355\u4e2a\u6743\u91cd\u77e9\u9635\u3002\u5bf9\u4e8e\u7ebf\u6027\u5c42\\(Y = XW\\)\uff0c\u6743\u91cd\u77e9\u9635\\(W\\)\u8de8\\(N\\)\u4e2aGPU\u6309\u5217\u62c6\u5206\u3002\u6bcf\u4e2aGPU\u8ba1\u7b97\u90e8\u5206\u7ed3\u679c\uff0c\u7136\u540eall-reduce\u805a\u5408\uff1a</li> </ul> \\[W = [W_1 | W_2 | \\cdots | W_N], \\quad Y_i = X W_i, \\quad Y = \\text{concat}(Y_1, \\ldots, Y_N)\\] <ul> <li> <p>\u5728\u63a8\u7406\u65f6\uff0c\u5f20\u91cf\u5e76\u884c\u662f\u6a21\u578b\u65e0\u6cd5\u88c5\u5165\u5355\u5f20GPU\u65f6\u7684\u9ed8\u8ba4\u9009\u62e9\u3002FP16\u768470B\u6a21\u578b\u9700\u8981140 GB\u2014\u2014\u8de82\u5f2080 GB GPU\u4f7f\u7528\u5f20\u91cf\u5e76\u884c\u62c6\u5206\u3002</p> </li> <li> <p>\u5ef6\u8fdf\u5f71\u54cd\uff1a\u5f20\u91cf\u5e76\u884c\u6bcf\u5c42\u589e\u52a0\u4e00\u4e2aall-reduce\u901a\u4fe1\u6b65\u9aa4\u3002\u5728NVLink\uff08900 GB/s\uff09\u4e0a\uff0c\u6bcf\u5c42\u589e\u52a0\u7ea60.1 ms\u3002\u5728PCIe\uff0832 GB/s\uff09\u4e0a\uff0c\u6bcf\u5c42\u589e\u52a0\u7ea63 ms\u3002\u5bf9\u4e8e80\u5c42\u768470B\u6a21\u578b\u57282\u5f20GPU\u4e0a\uff1aNVLink\u603b\u589e\u52a0\u7ea68 ms\uff0cPCIe\u603b\u589e\u52a0\u7ea6240 ms\u3002\u8fd9\u5c31\u662fNVLink\u5bf9\u591aGPU\u63a8\u7406\u81f3\u5173\u91cd\u8981\u7684\u539f\u56e0\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/05.%20scaling%20and%20deployment/#_4","title":"\u6d41\u6c34\u7ebf\u5e76\u884c","text":"<ul> <li> <p>\u6d41\u6c34\u7ebf\u5e76\u884c\u5c06\u4e0d\u540c\u7684\u5c42\u5206\u914d\u7ed9\u4e0d\u540c\u7684GPU\u3002GPU 1\u5904\u7406\u7b2c0-39\u5c42\uff0cGPU 2\u5904\u7406\u7b2c40-79\u5c42\u3002token\u987a\u5e8f\u6d41\u8fc7\u6d41\u6c34\u7ebf\u3002</p> </li> <li> <p>\u5728\u63a8\u7406\u65f6\uff0c\u6d41\u6c34\u7ebf\u5e76\u884c\u7684\u5ef6\u8fdf\u9ad8\u4e8e\u5f20\u91cf\u5e76\u884c\uff08\u6bcf\u4e2atoken\u5fc5\u987b\u904d\u5386\u6574\u4e2a\u6d41\u6c34\u7ebf\uff09\uff0c\u4f46\u901a\u4fe1\u5f00\u9500\u66f4\u4f4e\uff08\u53ea\u6709\u6fc0\u6d3b\u503c\u5728GPU\u4e4b\u95f4\u4f20\u9012\uff0c\u65e0\u9700all-reduce\uff09\u3002\u5f53GPU\u901a\u8fc7\u6162\u901f\u4e92\u8fde\uff08\u4e0d\u540c\u8282\u70b9\uff0c\u65e0NVLink\uff09\u8fde\u63a5\u65f6\uff0c\u66f4\u503e\u5411\u4e8e\u4f7f\u7528\u6d41\u6c34\u7ebf\u5e76\u884c\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/05.%20scaling%20and%20deployment/#_5","title":"\u5e8f\u5217\u5e76\u884c","text":"<ul> <li> <p>\u5bf9\u4e8e\u975e\u5e38\u957f\u7684\u5e8f\u5217\uff0c\u5373\u4f7f\u6a21\u578b\u672c\u8eab\u9002\u5408\uff0cKV\u7f13\u5b58\u672c\u8eab\u53ef\u80fd\u65e0\u6cd5\u88c5\u5165\u5355\u5f20GPU\u3002\u5e8f\u5217\u5e76\u884c\u5c06KV\u7f13\u5b58\u5206\u7247\u5230\u591a\u4e2aGPU\u4e0a\uff1a\u6bcf\u4e2aGPU\u5b58\u50a8\u5e8f\u5217\u7f13\u5b58\u952e\u548c\u503c\u7684\u4e00\u90e8\u5206\u3002</p> </li> <li> <p>\u5728\u6ce8\u610f\u529b\u671f\u95f4\uff0c\u6bcf\u4e2aGPU\u5728\u5176\u7f13\u5b58\u7684\u6bb5\u4e0a\u8ba1\u7b97\u90e8\u5206\u6ce8\u610f\u529b\u5206\u6570\uff0c\u7136\u540e\u901a\u8fc7\u89c4\u7ea6\u5408\u5e76\u7ed3\u679c\u3002\u8fd9\u7528\u4e8e\u957f\u4e0a\u4e0b\u6587\u63a8\u7406\uff08128K+ token\uff09\uff0c\u5176\u4e2dKV\u7f13\u5b58\u8d85\u8fc7\u5355GPU\u5185\u5b58\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/05.%20scaling%20and%20deployment/#_6","title":"\u63a8\u6d4b\u6027\u89e3\u7801","text":"<ul> <li>\u63a8\u6d4b\u6027\u89e3\u7801\u662f\u5f71\u54cd\u6700\u5927\u7684LLM\u63a8\u7406\u4f18\u5316\u4e4b\u4e00\u3002\u5176\u6d1e\u5bdf\uff1a\u89e3\u7801\u901f\u5ea6\u6162\u662f\u56e0\u4e3a\u4e00\u6b21\u53ea\u751f\u6210\u4e00\u4e2atoken\uff0c\u6bcf\u4e2atoken\u9700\u8981\u5927\u6a21\u578b\u7684\u5b8c\u6574\u524d\u5411\u4f20\u64ad\u3002\u4f46\u5c0f\u6a21\u578b\u53ef\u4ee5\u66f4\u5feb\u5730\u751f\u6210\u5019\u9009token\uff0c\u800c\u5927\u6a21\u578b\u53ef\u4ee5\u9a8c\u8bc1\u591a\u4e2a\u5019\u9009token\u3002</li> </ul> <ul> <li>\u7b97\u6cd5\uff1a<ol> <li>\u8349\u7a3f\u6a21\u578b\uff08\u5c0f\u578b\u3001\u5feb\u901f\u2014\u2014\u4f8b\u59821B\u53c2\u6570\uff09\u81ea\u56de\u5f52\u751f\u6210\\(k\\)\u4e2a\u5019\u9009token\u3002</li> <li>\u76ee\u6807\u6a21\u578b\uff08\u5927\u578b\u3001\u51c6\u786e\u2014\u2014\u4f8b\u598270B\uff09\u5bf9\u6574\u4e2a\u8349\u7a3f\u5e8f\u5217\u8fd0\u884c\u4e00\u6b21\u524d\u5411\u4f20\u64ad\uff0c\u8ba1\u7b97\u6bcf\u4e2a\u5019\u9009token\u7684\u6982\u7387\u3002</li> <li>\u5982\u679c\u76ee\u6807\u6a21\u578b\u540c\u610f\uff08\u8be5token\u7684\u6982\u7387\u8db3\u591f\u9ad8\uff09\uff0c\u6bcf\u4e2a\u5019\u9009\u88ab\u63a5\u53d7\u3002\u88ab\u62d2\u7edd\u7684\u5019\u9009\u4ece\u76ee\u6807\u6a21\u578b\u7684\u5206\u5e03\u4e2d\u91cd\u65b0\u91c7\u6837\u3002</li> <li>\u5e73\u5747\u6bcf\u4e2a\u9a8c\u8bc1\u6b65\u9aa4\u63a5\u53d7\u591a\u4e2atoken\uff0c\u52a0\u901f\u6bd4\u4e0e\u63a5\u53d7\u7387\u6210\u6b63\u6bd4\u3002</li> </ol> </li> </ul> \\[\\text{\u52a0\u901f\u6bd4} \\approx \\frac{k \\times \\text{acceptance\\_rate}}{\\text{cost\\_ratio}} \\approx 2\\text{-}3\\times\\] <ul> <li> <p>\u4e3a\u4ec0\u4e48\u65e0\u8d28\u91cf\u635f\u5931\uff1a\u62d2\u7edd\u91c7\u6837\u65b9\u6848\u4fdd\u8bc1\u8f93\u51fa\u5206\u5e03\u4e0e\u76ee\u6807\u6a21\u578b\u5b8c\u5168\u5339\u914d\u3002\u63a8\u6d4b\u6027\u89e3\u7801\u662f\u65e0\u635f\u7684\u2014\u2014\u8f93\u51fa\u5728\u7edf\u8ba1\u4e0a\u4e0e\u5355\u72ec\u8fd0\u884c\u76ee\u6807\u6a21\u578b\u76f8\u540c\uff0c\u53ea\u662f\u66f4\u5feb\u3002</p> </li> <li> <p>\u53d8\u4f53\uff1a</p> <ul> <li>Medusa\uff08Cai\u7b49\u4eba\uff0c2024\uff09\uff1a\u4e0d\u662f\u72ec\u7acb\u7684\u8349\u7a3f\u6a21\u578b\uff0c\u800c\u662f\u5411\u76ee\u6807\u6a21\u578b\u6dfb\u52a0\u591a\u4e2a\u8f7b\u91cf\u7ea7\"\u5934\"\uff0c\u540c\u65f6\u9884\u6d4b\u591a\u4e2a\u672a\u6765token\u3002\u65e0\u9700\u72ec\u7acb\u6a21\u578b\u3002</li> <li>EAGLE\uff08Li\u7b49\u4eba\uff0c2024\uff09\uff1a\u8bad\u7ec3\u4e00\u4e2a\u4f7f\u7528\u76ee\u6807\u6a21\u578b\u9690\u85cf\u72b6\u6001\u9884\u6d4b\u672a\u6765token\u7684\u8f7b\u91cf\u7ea7\u8349\u7a3f\u5934\u3002\u63a5\u53d7\u7387\u9ad8\u4e8e\u72ec\u7acb\u7684\u8349\u7a3f\u6a21\u578b\u3002</li> <li>\u81ea\u63a8\u6d4b\u6027\u89e3\u7801\uff1a\u76ee\u6807\u6a21\u578b\u672c\u8eab\u4f7f\u7528\u63d0\u524d\u9000\u51fa\u751f\u6210\u8349\u7a3f\uff08\u4ec5\u8fd0\u884c\u524d\u51e0\u5c42\u4f5c\u4e3a\u8349\u7a3f\uff0c\u7136\u540e\u7528\u5b8c\u6574\u6a21\u578b\u9a8c\u8bc1\uff09\u3002</li> <li>\u5e76\u884c\u89e3\u7801\uff1a\u5e76\u884c\u751f\u6210\u591a\u4e2a\u5ef6\u7eed\uff08\u5019\u9009\u6811\uff09\u5e76\u4e00\u6b21\u6027\u9a8c\u8bc1\u6574\u68f5\u6811\u3002\u541e\u5410\u91cf\u66f4\u9ad8\uff0c\u4f46\u5206\u652fKV\u7f13\u5b58\u4f7f\u7528\u66f4\u591a\u5185\u5b58\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/05.%20scaling%20and%20deployment/#_7","title":"\u524d\u7f00\u7f13\u5b58","text":"<ul> <li> <p>\u8bb8\u591a\u8bf7\u6c42\u5171\u4eab\u5171\u540c\u7684\u524d\u7f00\uff1a\u7cfb\u7edf\u63d0\u793a\u3001few-shot\u793a\u4f8b\u6216\u5e38\u89c1\u67e5\u8be2\u6a21\u5f0f\u3002\u524d\u7f00\u7f13\u5b58\u5b58\u50a8\u8fd9\u4e9b\u524d\u7f00\u7684KV\u7f13\u5b58\u5e76\u5728\u8bf7\u6c42\u4e4b\u95f4\u91cd\u7528\u3002</p> </li> <li> <p>\u7cfb\u7edf\u63d0\u793a\u7f13\u5b58\uff1a\u5982\u679c\u6bcf\u4e2a\u8bf7\u6c42\u90fd\u4ee5\u76f8\u540c\u76842000-token\u7cfb\u7edf\u63d0\u793a\u5f00\u59cb\uff0c\u8fd92000\u4e2atoken\u7684KV\u7f13\u5b58\u88ab\u8ba1\u7b97\u4e00\u6b21\uff0c\u5e76\u5728\u6240\u6709\u8bf7\u6c42\u4e4b\u95f4\u5171\u4eab\u3002\u5bf9\u4e8e80\u5c42\u768470B\u6a21\u578b\uff0c\u6bcf\u6b21\u8bf7\u6c42\u8282\u7701\u7ea6200 MB\u3002</p> </li> <li> <p>\u57fa\u6570\u6811\u7f13\u5b58\uff08SGLang\uff09\uff1a\u5c06\u7f13\u5b58\u7684\u524d\u7f00\u7ec4\u7ec7\u5728\u57fa\u6570\u6811\uff08trie\uff09\u4e2d\u3002\u5f53\u65b0\u8bf7\u6c42\u5230\u8fbe\u65f6\uff0c\u627e\u5230\u6700\u957f\u7684\u7f13\u5b58\u524d\u7f00\u5339\u914d\uff0c\u5e76\u4ece\u90a3\u91cc\u5f00\u59cb\u751f\u6210\uff0c\u8df3\u8fc7\u5339\u914d\u524d\u7f00\u7684\u8ba1\u7b97\u3002</p> </li> <li> <p>\u5f71\u54cd\uff1a\u5bf9\u4e8e\u5177\u6709\u957f\u5171\u4eab\u524d\u7f00\u7684\u5e94\u7528\uff08\u5e26\u7cfb\u7edf\u63d0\u793a\u7684\u804a\u5929\u673a\u5668\u4eba\u3001\u5177\u6709\u5e38\u89c1\u68c0\u7d22\u6bb5\u843d\u7684RAG\uff09\uff0c\u524d\u7f00\u7f13\u5b58\u5c06TTFT\u964d\u4f4e50-90%\uff0c\u5e76\u8282\u7701\u76f8\u5e94\u7684GPU\u8ba1\u7b97\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/05.%20scaling%20and%20deployment/#kv","title":"KV\u7f13\u5b58\u9a71\u9010","text":"<ul> <li> <p>\u9664\u4e86\u91cf\u5316KV\u7f13\u5b58\uff08\u6587\u4ef601\uff09\u548c\u4f7f\u7528GQA/MLA\u51cf\u5c0f\u5176\u5927\u5c0f\uff08\u6587\u4ef602\uff09\u4e4b\u5916\uff0cKV\u7f13\u5b58\u9a71\u9010\u7b56\u7565\u9009\u62e9\u6027\u5730\u79fb\u9664\u4e0d\u592a\u53ef\u80fd\u5728\u672a\u6765\u88ab\u5173\u6ce8\u7684\u7f13\u5b58token\u3002</p> </li> <li> <p>H2O\uff08\u91cd\u8981token\u8bc6\u522b\u5668\uff0cZhang\u7b49\u4eba\uff0c2023\uff09\u89c2\u5bdf\u5230\u6ce8\u610f\u529b\u5206\u6570\u9075\u5faa\u5e42\u5f8b\uff1a\u4e00\u5c0f\u90e8\u5206token\uff08\"\u91cd\u8981token\"\uff09\u83b7\u5f97\u5927\u90e8\u5206\u6ce8\u610f\u529b\uff0c\u800c\u5927\u591a\u6570token\u83b7\u5f97\u7684\u6ce8\u610f\u529b\u53ef\u4ee5\u5ffd\u7565\u4e0d\u8ba1\u3002H2O\u4fdd\u7559\uff1a</p> <ol> <li>\u6700\u8fd1token\uff08\u6700\u540e\\(w\\)\u4e2atoken\u7684\u6ed1\u52a8\u7a97\u53e3\uff0c\u7c7b\u4f3cStreamingLLM\uff09\u3002</li> <li>\u91cd\u8981token\uff08\u5728\u6240\u6709\u8fc7\u53bb\u89e3\u7801\u6b65\u9aa4\u4e2d\u7d2f\u79ef\u6ce8\u610f\u529b\u5206\u6570\u6700\u9ad8\u7684\u524d\\(k\\)\u4e2atoken\uff09\u3002</li> </ol> </li> <li> <p>\u65e2\u4e0d\u662f\u6700\u8fd1\u4e5f\u4e0d\u662f\u91cd\u8981token\u7684token\u88ab\u9a71\u9010\u3002\u8fd9\u4fdd\u6301\u56fa\u5b9a\u5927\u5c0f\u7684KV\u7f13\u5b58\uff0c\u540c\u65f6\u4fdd\u7559\u5b9e\u9645\u5f71\u54cd\u751f\u6210\u7684token\u3002H2O\u4ec5\u4f7f\u752820%\u7684\u5185\u5b58\u5c31\u5b9e\u73b0\u4e86\u63a5\u8fd1\u5b8c\u6574KV\u7f13\u5b58\u7684\u8d28\u91cf\u3002</p> </li> <li> <p>Scissorhands\uff08Liu\u7b49\u4eba\uff0c2023\uff09\u91c7\u7528\u7c7b\u4f3c\u65b9\u6cd5\uff0c\u4f46\u4f7f\u7528\u66f4\u590d\u6742\u7684\u5ea6\u91cf\uff1a\u5728\u5f53\u524d\u6b65\u9aa4\u4e2d\u83b7\u5f97\u9ad8\u6ce8\u610f\u529b\u7684token\u88ab\u4fdd\u7559\uff0c\u800c\u5df2\u7ecf\\(T\\)\u6b65\u6ca1\u6709\u88ab\u5173\u6ce8\u7684token\u88ab\u9a71\u9010\u3002\u8fd9\u9002\u5e94\u4e86\u751f\u6210\u8fc7\u7a0b\u4e2d\u6ce8\u610f\u529b\u6a21\u5f0f\u7684\u53d8\u5316\u3002</p> </li> <li> <p>\u52a8\u6001\u9a71\u9010+StreamingLLM\uff1a\u7ed3\u5408\u6ce8\u610f\u529b\u6c47\u805a\u70b9\uff08\u6c38\u4e45\u4fdd\u7559\u524d\u51e0\u4e2atoken\uff09\u548c\u52a8\u6001\u9a71\u9010\uff08\u4fdd\u7559\u6700\u8fd1+\u91cd\u8981token\uff09\u3002\u8fd9\u662f\u6700\u5185\u5b58\u9ad8\u6548\u7684\u65b9\u6cd5\uff0c\u9002\u7528\u4e8e\u975e\u5e38\u957f\u7684\u751f\u6210\uff0c\u5b9e\u73b0\u4e86\u65e0\u9650\u957f\u5ea6\u751f\u6210\uff0c\u8d28\u91cf\u4e0b\u964d\u6709\u9650\u3002</p> </li> <li> <p>\u6240\u6709\u9a71\u9010\u65b9\u6cd5\u7684\u6838\u5fc3\u6d1e\u5bdf\uff1aLLM\u6ce8\u610f\u529b\u5728\u5b9e\u8df5\u4e2d\u662f\u7a00\u758f\u7684\u2014\u2014\u5c3d\u7ba1\u67b6\u6784\u4f1a\u5bf9\u6240\u6709\u7f13\u5b58\u7684token\u8ba1\u7b97\u6ce8\u610f\u529b\uff0c\u4f46\u5b9e\u9645\u6ce8\u610f\u529b\u6743\u91cd\u96c6\u4e2d\u5728\u5c0f\u5b50\u96c6\u4e0a\u3002\u9a71\u9010\u5176\u4f59\u90e8\u5206\u5bf9\u8f93\u51fa\u8d28\u91cf\u5f71\u54cd\u6781\u5c0f\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/05.%20scaling%20and%20deployment/#_8","title":"\u63a8\u7406\u6846\u67b6","text":"<ul> <li>LLM\u670d\u52a1\u751f\u6001\u5df2\u6536\u655b\u5230\u51e0\u4e2a\u4e3b\u8981\u6846\u67b6\uff1a</li> </ul> \u6846\u67b6 \u4f18\u52bf \u6700\u9002\u5408 vLLM PagedAttention\u3001\u8fde\u7eed\u6279\u5904\u7406\u3001\u9ad8\u541e\u5410\u91cf \u901a\u7528LLM\u670d\u52a1\uff0c\u6700\u9ad8\u541e\u5410\u91cf TensorRT-LLM NVIDIA\u4f18\u5316\u5185\u6838\u3001FP8\u3001\u98de\u884c\u4e2d\u6279\u5904\u7406 NVIDIA GPU\u4e0a\u7684\u6700\u5927\u6027\u80fd SGLang \u524d\u7f00\u7f13\u5b58\uff08RadixAttention\uff09\u3001\u5feb\u901f\u7ed3\u6784\u5316\u751f\u6210 \u5177\u6709\u5171\u4eab\u524d\u7f00\u7684\u5e94\u7528\uff0c\u53d7\u9650\u8f93\u51fa llama.cpp CPU/Metal/CUDA/Vulkan\u3001GGUF\u91cf\u5316\u3001\u53ef\u79fb\u690d \u6d88\u8d39\u7ea7\u786c\u4ef6\uff0c\u8bbe\u5907\u7aef\u63a8\u7406 TGI\uff08HuggingFace\uff09 \u7b80\u5355API\uff0c\u6613\u4e8e\u90e8\u7f72\uff0c\u6a21\u578b\u4e2d\u5fc3\u96c6\u6210 \u5feb\u901f\u90e8\u7f72\uff0cHuggingFace\u751f\u6001 Ollama \u4e00\u952e\u4e0b\u8f7d\u548c\u63d0\u4f9b\u670d\u52a1 \u4e2a\u4eba\u4f7f\u7528\uff0c\u672c\u5730\u5f00\u53d1 ExLlamaV2 \u6781\u81f4\u91cf\u5316\u4f18\u5316\uff08EXL2\u683c\u5f0f\uff09 \u5185\u5b58\u53d7\u9650\u7684GPU\u63a8\u7406 <ul> <li> <p>vLLM\u662f\u751f\u4ea7\u7ea7LLM\u670d\u52a1\u7684\u9ed8\u8ba4\u9009\u62e9\u3002\u5b83\u652f\u6301\u8fde\u7eed\u6279\u5904\u7406\u3001PagedAttention\u3001\u5f20\u91cf\u5e76\u884c\u3001\u63a8\u6d4b\u6027\u89e3\u7801\u3001LoRA\u670d\u52a1\u548c\u5927\u591a\u6570\u5f00\u6e90\u6a21\u578b\u3002</p> </li> <li> <p>TensorRT-LLM\u5728NVIDIA\u786c\u4ef6\u4e0a\u5b9e\u73b0\u6700\u9ad8\u7684\u539f\u59cb\u6027\u80fd\uff08\u5728\u76f8\u540cGPU\u4e0a\u6bd4vLLM\u5feb10-30%\uff09\uff0c\u4f46\u7075\u6d3b\u6027\u8f83\u4f4e\u4e14\u66f4\u96be\u4ee5\u5b9a\u5236\u3002</p> </li> <li> <p>SGLang\u5728\u5e94\u7528\u5177\u6709\u7ed3\u6784\u5316\u8f93\u51fa\uff08JSON\u3001\u7279\u5b9a\u683c\u5f0f\u7684\u4ee3\u7801\uff09\u6216\u5171\u4eab\u524d\u7f00\u65f6\u8868\u73b0\u51fa\u8272\uff0c\u8fd9\u5f97\u76ca\u4e8e\u5176\u57fa\u6570\u6ce8\u610f\u529b\u7f13\u5b58\u548c\u53d7\u9650\u89e3\u7801\u5f15\u64ce\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/05.%20scaling%20and%20deployment/#_9","title":"\u6210\u672c\u4f18\u5316","text":"<ul> <li> <p>\u5728\u89c4\u6a21\u4e0a\uff0c\u63a8\u7406\u6210\u672c\u4e3b\u5bfcML\u9884\u7b97\u3002\u964d\u4f4e\u6210\u672c\u7684\u7b56\u7565\uff1a</p> </li> <li> <p>\u5408\u7406\u9009\u62e9GPU\uff1a\u5e76\u975e\u6bcf\u4e2a\u6a21\u578b\u90fd\u9700\u8981H100\u3002\u91cf\u5316\u76847B\u6a21\u578b\u5728A10G\uff08\u7ea6\\(1/\u5c0f\u65f6\uff09\u4e0a\u8fd0\u884c\u826f\u597d\uff0c\u800c\u4e0d\u662fH100\uff08\u7ea6\\)8/\u5c0f\u65f6\uff09\u3002\u5339\u914dGPU\u5230\u5de5\u4f5c\u8d1f\u8f7d\u3002</p> </li> <li> <p>\u7ade\u4ef7\u5b9e\u4f8b\uff1a\u4e91\u63d0\u4f9b\u5546\u63d0\u4f9b\u672a\u4f7f\u7528\u7684GPU\u5bb9\u91cf\uff0c\u6298\u626360-90%\uff08AWS Spot\u3001GCP Preemptible\uff09\u3002\u7ade\u4ef7\u5b9e\u4f8b\u53ef\u80fd\u88ab\u4e2d\u65ad\uff0c\u56e0\u6b64\u9002\u7528\u4e8e\u6279\u5904\u7406\u63a8\u7406\u800c\u4e0d\u662f\u5ef6\u8fdf\u5173\u952e\u578b\u670d\u52a1\u3002\u7ed3\u5408\u62a2\u5360\u5904\u7406\uff08\u4fdd\u5b58\u72b6\u6001\uff0c\u5728\u65b0\u5b9e\u4f8b\u4e0a\u6062\u590d\uff09\uff0c\u7ade\u4ef7\u5b9e\u4f8b\u4e5f\u53ef\u4ee5\u670d\u52a1\u4ea4\u4e92\u5f0f\u6d41\u91cf\u3002</p> </li> <li> <p>\u81ea\u52a8\u6269\u7f29\uff1a\u6839\u636e\u6d41\u91cf\u6269\u5c55GPU\u6570\u91cf\u3002\u9ad8\u5cf0\u671f\u6269\u5c55\uff0c\u591c\u95f4\u7f29\u51cf\u3002Kubernetes HPA\uff08\u6c34\u5e73Pod\u81ea\u52a8\u6269\u7f29\u5668\uff09\u6216\u4e91\u539f\u751f\u81ea\u52a8\u6269\u7f29\uff08AWS SageMaker\u3001GCP Vertex AI\uff09\u5904\u7406\u6b64\u529f\u80fd\u3002</p> </li> <li> <p>\u6279\u5904\u7406+\u5229\u7528\u7387\uff1a30%\u548c90% GPU\u5229\u7528\u7387\u4e4b\u95f4\u7684\u5dee\u5f02\u662f\u6bcftoken\u6210\u672c3\u500d\u3002\u8fde\u7eed\u6279\u5904\u7406\u3001\u667a\u80fd\u8c03\u5ea6\u548cPagedAttention\u90fd\u63d0\u9ad8\u4e86\u5229\u7528\u7387\u3002</p> </li> <li> <p>\u91cf\u5316\uff1aINT4 vs FP16\u662f4\u500d\u66f4\u5c11\u5185\u5b58 \u2192 \u9002\u5408\u66f4\u5c0f\u7684GPU \u2192 \u6210\u672c\u964d\u4f4e2-4\u500d\u3002\u6b64\u5916\uff0c\u66f4\u591a\u8bf7\u6c42\u9002\u5408\u540c\u4e00\u6279\u6b21 \u2192 \u66f4\u9ad8\u541e\u5410\u91cf \u2192 \u66f4\u4f4e\u6bcftoken\u6210\u672c\u3002</p> </li> <li> <p>\u6bcftoken\u6210\u672c\u57fa\u51c6\uff08\u8fd1\u4f3c\u503c\uff0c2026\u5e74\uff09\uff1a</p> </li> </ul> \u914d\u7f6e \u6bcf100\u4e07token\u6210\u672c GPT-4o API $2.50 Claude 3.5 Sonnet API $3.00 Llama-70B on H100\uff08vLLM\uff0cFP16\uff09 $0.50 Llama-70B on H100\uff08TRT-LLM\uff0cINT8\uff09 $0.25 Llama-8B on A10G\uff08vLLM\uff0cINT4\uff09 $0.05 Llama-3B \u8bbe\u5907\u7aef\uff08llama.cpp\uff09 $0\uff08\u786c\u4ef6\u6210\u672c\u644a\u9500\uff09"},{"location":"chapter%2017%3A%20AI%20inference/05.%20scaling%20and%20deployment/#_10","title":"\u76d1\u63a7","text":"<ul> <li> <p>\u751f\u4ea7\u63a8\u7406\u9700\u8981\u6301\u7eed\u76d1\u63a7\uff0c\u4ee5\u4fbf\u5728\u7528\u6237\u53d7\u5230\u5f71\u54cd\u4e4b\u524d\u53d1\u73b0\u964d\u7ea7\uff1a</p> </li> <li> <p>\u5ef6\u8fdf\u76d1\u63a7\uff1a\u8ddf\u8e2aTTFT\u548cTPOT\u7684p50\u3001p95\u548cp99\u3002\u8bbe\u7f6e\u544a\u8b66\uff0c\u5f53p99\u8d85\u8fc7SLO\u65f6\u89e6\u53d1\u3002p99\u7684\u5c16\u5cf0\u901a\u5e38\u6307\u793a\uff1aKV\u7f13\u5b58\u5185\u5b58\u538b\u529b\uff08\u6296\u52a8\uff09\u3001\u957f\u65f6\u95f4\u8fd0\u884c\u7684\u8bf7\u6c42\u5784\u65ad\u6279\u6b21\u3001\u6216GPU\u70ed\u8282\u6d41\u3002</p> </li> <li> <p>\u541e\u5410\u91cf\u76d1\u63a7\uff1a\u8ddf\u8e2a\u6bcfGPU\u6bcf\u79d2token\u6570\u3002\u4e0b\u964d\u6307\u793a\uff1a\u6279\u6b21\u6548\u7387\u964d\u4f4e\uff08\u8bb8\u591a\u77ed\u8bf7\u6c42\u2192\u6279\u6b21\u5229\u7528\u7387\u4f4e\uff09\u3001\u5e8f\u5217\u957f\u5ea6\u589e\u52a0\uff08\u6bcf\u4e2a\u8bf7\u6c42\u66f4\u591aKV\u7f13\u5b58\u5185\u5b58\uff09\u3001\u6216\u786c\u4ef6\u95ee\u9898\uff08GPU\u5904\u4e8eECC\u7ea0\u9519\u6a21\u5f0f\uff0c\u8fd0\u884c\u66f4\u6162\uff09\u3002</p> </li> <li> <p>GPU\u5229\u7528\u7387\uff1a\u8ddf\u8e2aSM\u5360\u7528\u7387\u3001\u5185\u5b58\u5229\u7528\u7387\u548c\u5185\u5b58\u5e26\u5bbd\u3002\u4f4eSM\u5360\u7528\u7387+\u9ad8\u5185\u5b58\u5229\u7528\u7387=\u5185\u5b58\u53d7\u9650\uff08\u9700\u8981\u66f4\u591a\u5e26\u5bbd\u6216\u91cf\u5316\uff09\u3002\u9ad8SM\u5360\u7528\u7387+\u4f4e\u5185\u5b58\u5229\u7528\u7387=\u8ba1\u7b97\u53d7\u9650\uff08\u9700\u8981\u66f4\u591aFLOPS\u6216\u66f4\u5c0f\u6a21\u578b\uff09\u3002</p> </li> <li> <p>\u6a21\u578b\u8d28\u91cf\u76d1\u63a7\uff1a\u8ddf\u8e2a\u6bcf\u8bf7\u6c42\u6307\u6807\uff08\u54cd\u5e94\u957f\u5ea6\u3001\u4fdd\u7559\u96c6\u4e0a\u7684\u56f0\u60d1\u5ea6\u3001\u7528\u6237\u53cd\u9988\u4fe1\u53f7\uff09\u3002\u6a21\u578b\u8d28\u91cf\u53ef\u80fd\u56e0\u4ee5\u4e0b\u539f\u56e0\u964d\u7ea7\uff1a\u6570\u636e\u6f02\u79fb\uff08\u4f20\u5165\u8bf7\u6c42\u7684\u5206\u5e03\u53d8\u5316\uff09\u3001KV\u7f13\u5b58\u91cf\u5316\u8bef\u5dee\u5728\u957f\u5bf9\u8bdd\u4e2d\u7d2f\u79ef\u3001\u6216\u670d\u52a1\u6d41\u6c34\u7ebf\u4e2d\u7684\u9519\u8bef\u3002</p> </li> <li> <p>\u6210\u672c\u76d1\u63a7\uff1a\u8ddf\u8e2a\u6bcf\u6a21\u578b\u6bcfGPU\u7c7b\u578b\u6bcftoken\u6210\u672c\u3002\u5982\u679c\u6210\u672c\u589e\u52a0\u800c\u541e\u5410\u91cf\u6ca1\u6709\u589e\u52a0\uff0c\u8c03\u67e5\u6548\u7387\u56de\u5f52\uff08\u65b0\u6a21\u578b\u7248\u672c\u5185\u5b58\u4f7f\u7528\u66f4\u9ad8\u3001\u6279\u6b21\u914d\u7f6e\u6b21\u4f18\u3001\u6216GPU\u5229\u7528\u4e0d\u8db3\uff09\u3002</p> </li> <li> <p>\u5de5\u5177\uff1aPrometheus + Grafana\uff08\u7b2c15\u7ae0\uff09\u7528\u4e8e\u57fa\u7840\u8bbe\u65bd\u6307\u6807\uff0cvLLM/TRT-LLM\u7684\u5185\u7f6e\u6307\u6807\u7aef\u70b9\uff0c\u4ee5\u53ca\u7528\u4e8e\u6a21\u578b\u7ea7\u6307\u6807\u7684\u81ea\u5b9a\u4e49\u65e5\u5fd7\u8bb0\u5f55\u3002</p> </li> </ul>"},{"location":"chapter%2017%3A%20AI%20inference/05.%20scaling%20and%20deployment/#colabnotebook","title":"\u7f16\u7a0b\u4efb\u52a1\uff08\u4f7f\u7528CoLab\u6216notebook\uff09","text":"<ol> <li> <p>\u6a21\u62df\u63a8\u6d4b\u6027\u89e3\u7801\u3002\u4f7f\u7528\u5feb\u901f\u7684\"\u8349\u7a3f\"\u51fd\u6570\u548c\u6162\u901f\u7684\"\u76ee\u6807\"\u51fd\u6570\uff0c\u6d4b\u91cf\u4e00\u6b21\u751f\u6210\u548c\u9a8c\u8bc1\u591a\u4e2atoken\u7684\u52a0\u901f\u6bd4\u3002 <pre><code>import random\nimport time\n\ndef target_model(tokens):\n    \"\"\"\u6162\u4f46\u51c6\u786e\u7684\u6a21\u578b\u3002\u8fd4\u56de\u6bcf\u4e2a\u5019\u9009token\u7684\u6982\u7387\u3002\"\"\"\n    time.sleep(0.01)  # \u6a21\u62df\u6bcf\u6b21\u524d\u5411\u4f20\u64ad10ms\n    # \u7528\u4e8e\u6a21\u62df\uff1a\u63a5\u53d7\u5076\u6570token\n    return [0.9 if t % 2 == 0 else 0.1 for t in tokens]\n\ndef draft_model():\n    \"\"\"\u5feb\u4f46\u8fd1\u4f3c\u7684\u6a21\u578b\u3002\u751f\u6210\u4e00\u4e2a\u5019\u9009token\u3002\"\"\"\n    time.sleep(0.001)  # \u6a21\u62df\u6bcftoken 1ms\n    return random.randint(0, 9)\n\ndef standard_decoding(n_tokens):\n    \"\"\"\u4e00\u6b21\u751f\u6210\u4e00\u4e2atoken\uff0c\u4f7f\u7528\u76ee\u6807\u6a21\u578b\u3002\"\"\"\n    tokens = []\n    for _ in range(n_tokens):\n        time.sleep(0.01)  # \u76ee\u6807\u6a21\u578b\u751f\u62101\u4e2atoken\n        tokens.append(random.randint(0, 9))\n    return tokens\n\ndef speculative_decoding(n_tokens, k=4):\n    \"\"\"\u751f\u6210k\u4e2a\u8349\u7a3ftoken\uff0c\u7528\u76ee\u6807\u6a21\u578b\u9a8c\u8bc1\uff0c\u63a5\u53d7/\u62d2\u7edd\u3002\"\"\"\n    tokens = []\n    total_target_calls = 0\n\n    while len(tokens) &lt; n_tokens:\n        # \u8349\u7a3f\uff1a\u5feb\u901f\u751f\u6210k\u4e2a\u5019\u9009\n        candidates = [draft_model() for _ in range(k)]\n\n        # \u9a8c\u8bc1\uff1a\u4e00\u6b21\u76ee\u6807\u6a21\u578b\u8c03\u7528\u9a8c\u8bc1\u6240\u6709k\u4e2a\u5019\u9009\n        probs = target_model(candidates)\n        total_target_calls += 1\n\n        # \u63a5\u53d7token\uff0c\u76f4\u5230\u4e00\u4e2a\u88ab\u62d2\u7edd\n        for i, (tok, prob) in enumerate(zip(candidates, probs)):\n            if random.random() &lt; prob:\n                tokens.append(tok)\n                if len(tokens) &gt;= n_tokens:\n                    break\n            else:\n                # \u4ece\u76ee\u6807\u5206\u5e03\u91cd\u65b0\u91c7\u6837\n                tokens.append(tok + 1)  # \u7b80\u5316\u91cd\u65b0\u91c7\u6837\n                break\n\n    return tokens, total_target_calls\n\nn = 50\n\nstart = time.time()\n_ = standard_decoding(n)\nstandard_time = time.time() - start\n\nstart = time.time()\n_, target_calls = speculative_decoding(n, k=5)\nspec_time = time.time() - start\n\nprint(f\"\u6807\u51c6:    {standard_time:.2f}s ({n} \u6b21\u76ee\u6807\u8c03\u7528)\")\nprint(f\"\u63a8\u6d4b\u6027: {spec_time:.2f}s ({target_calls} \u6b21\u76ee\u6807\u8c03\u7528)\")\nprint(f\"\u52a0\u901f\u6bd4:     {standard_time / spec_time:.1f}x\")\n</code></pre></p> </li> <li> <p>\u4f30\u8ba1\u5e94\u7528\u4e8eLLM\u670d\u52a1\u90e8\u7f72\u7684\u4e0d\u540c\u4f18\u5316\u7b56\u7565\u7684\u6210\u672c\u8282\u7701\u3002 <pre><code>def serving_cost_analysis(\n    model_name, params_B, precision_bits,\n    gpu_name, gpu_mem_gb, gpu_cost_per_hr,\n    target_throughput_tps,\n):\n    \"\"\"\u4f30\u8ba1LLM\u90e8\u7f72\u7684\u670d\u52a1\u6210\u672c\u3002\"\"\"\n    model_size_gb = params_B * 1e9 * precision_bits / 8 / 1e9\n    gpus_for_model = max(1, int((model_size_gb * 1.2) / gpu_mem_gb + 0.99))  # 1.2x\u7528\u4e8eKV\u7f13\u5b58\n\n    # \u7c97\u7565\u541e\u5410\u91cf\u4f30\u8ba1\uff08\u5185\u5b58\u5e26\u5bbd\u53d7\u9650\uff09\n    tokens_per_gpu = 500 / (params_B * precision_bits / 16)  # \u5f52\u4e00\u5316\u52307B FP16\u7684500 tok/s\n    total_throughput = tokens_per_gpu * gpus_for_model\n\n    replicas = max(1, int(target_throughput_tps / total_throughput + 0.99))\n    total_gpus = gpus_for_model * replicas\n    cost_per_hr = total_gpus * gpu_cost_per_hr\n    cost_per_1M_tokens = cost_per_hr / (total_throughput * replicas * 3600 / 1e6)\n\n    print(f\"{model_name} @ {precision_bits}-\u4f4d \u5728 {gpu_name} \u4e0a:\")\n    print(f\"  \u6a21\u578b\u5927\u5c0f: {model_size_gb:.0f} GB \u2192 {gpus_for_model} GPU(s)/\u526f\u672c\")\n    print(f\"  \u541e\u5410\u91cf: {total_throughput:.0f} tok/s/\u526f\u672c\")\n    print(f\"  \u9700\u8fbe\u5230{target_throughput_tps} tok/s\u7684\u526f\u672c\u6570: {replicas}\")\n    print(f\"  \u603bGPU\u6570: {total_gpus}\")\n    print(f\"  \u6210\u672c: ${cost_per_hr:.0f}/\u5c0f\u65f6, ${cost_per_1M_tokens:.2f}/100\u4e07token\")\n    print()\n\nprint(\"=== \u6210\u672c\u6bd4\u8f83 ===\\n\")\n\n# \u57fa\u7ebf\uff1aH100\u4e0a\u7684FP16\nserving_cost_analysis(\"Llama-70B\", 70, 16, \"H100\", 80, 8.0, 1000)\n\n# \u91cf\u5316\u540e\uff1aH100\u4e0a\u7684INT8\nserving_cost_analysis(\"Llama-70B\", 70, 8, \"H100\", 80, 8.0, 1000)\n\n# \u91cf\u5316\u540e\uff1aA100\u4e0a\u7684INT4\nserving_cost_analysis(\"Llama-70B\", 70, 4, \"A100\", 80, 4.0, 1000)\n\n# \u5c0f\u6a21\u578b\uff1aA10G\u4e0a\u76848B\nserving_cost_analysis(\"Llama-8B\", 8, 4, \"A10G\", 24, 1.0, 1000)\n</code></pre></p> </li> </ol>"},{"location":"chapter%2018%3A%20ML%20systems%20design/01.%20systems%20design%20fundamentals/","title":"\u7cfb\u7edf\u8bbe\u8ba1\u57fa\u7840","text":"<p>\u7cfb\u7edf\u8bbe\u8ba1\u662f\u6784\u5efa\u53ef\u5728\u5927\u89c4\u6a21\u4e0b\u53ef\u9760\u8fd0\u884c\u7684\u8f6f\u4ef6\u7684\u65b9\u6cd5\u3002\u672c\u6587\u4ef6\u6db5\u76d6\u5ba2\u6237\u7aef-\u670d\u52a1\u5668\u67b6\u6784\u3001\u7f51\u7edc\u534f\u8bae\u3001DNS\u3001\u4ee3\u7406\u3001\u8d1f\u8f7d\u5747\u8861\u3001\u7f13\u5b58\u3001\u6570\u636e\u5e93\u3001\u6d88\u606f\u961f\u5217\u3001\u4e00\u81f4\u6027\u6a21\u578b\u548c\u5f39\u6027\u6a21\u5f0f</p> <ul> <li>\u751f\u4ea7\u73af\u5883\u4e2d\u7684\u6bcf\u4e00\u4e2aML\u7cfb\u7edf\u90fd\u662f\u4e00\u4e2a\u5206\u5e03\u5f0f\u7cfb\u7edf\u3002\u63a8\u8350\u5f15\u64ce\u4e0d\u4ec5\u4ec5\u662f\u6a21\u578b\u2014\u2014\u5b83\u662f\u4e00\u4e2aAPI\u670d\u52a1\u5668\u3001\u4e00\u4e2a\u7279\u5f81\u5b58\u50a8\u3001\u4e00\u4e2a\u6a21\u578b\u6ce8\u518c\u8868\u3001\u4e00\u4e2a\u7f13\u5b58\u5c42\u3001\u4e00\u4e2a\u6d88\u606f\u961f\u5217\u548c\u4e00\u4e2a\u76d1\u63a7\u6808\uff0c\u6240\u6709\u8fd9\u4e9b\u901a\u8fc7\u7f51\u7edc\u8fdb\u884c\u901a\u4fe1\u3002\u7406\u89e3\u7cfb\u7edf\u8bbe\u8ba1\u662f\u533a\u5206\"\u6211\u8bad\u7ec3\u4e86\u4e00\u4e2a\u6a21\u578b\"\u548c\"\u6211\u6784\u5efa\u4e86\u4e00\u4e2a\u4ea7\u54c1\"\u7684\u5173\u952e\u3002</li> <li>\u9876\u7ea7\u79d1\u6280\u516c\u53f8\uff08Google\u3001Meta\u3001Amazon\u3001OpenAI\uff09\u7684\u7cfb\u7edf\u8bbe\u8ba1\u9762\u8bd5\u4f1a\u6d4b\u8bd5\u4f60\u662f\u5426\u80fd\u8bbe\u8ba1\u8fd9\u4e9b\u7cfb\u7edf\u3002\u672c\u7ae0\u4e3a\u4f60\u63d0\u4f9b\u57fa\u7840\u6784\u5efa\u6a21\u5757\uff08\u672c\u6587\u4ef6\uff09\u3001\u4e91\u57fa\u7840\u8bbe\u65bd\uff08\u6587\u4ef602\uff09\u3001\u6269\u5c55\u6a21\u5f0f\uff08\u6587\u4ef603\uff09\u3001ML\u7279\u5b9a\u8bbe\u8ba1\uff08\u6587\u4ef604\uff09\u548c\u5b9e\u64cd\u793a\u4f8b\uff08\u6587\u4ef605\uff09\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/01.%20systems%20design%20fundamentals/#-","title":"\u5ba2\u6237\u7aef-\u670d\u52a1\u5668\u67b6\u6784","text":"<ul> <li>\u57fa\u672c\u6a21\u5f0f\uff1a\u5ba2\u6237\u7aef\u53d1\u9001\u8bf7\u6c42\uff0c\u670d\u52a1\u5668\u5904\u7406\u8bf7\u6c42\u5e76\u8fd4\u56de\u54cd\u5e94\u3002\u4f60\u7684\u6d4f\u89c8\u5668\uff08\u5ba2\u6237\u7aef\uff09\u5411google.com\uff08\u670d\u52a1\u5668\uff09\u53d1\u9001HTTP\u8bf7\u6c42\uff0c\u670d\u52a1\u5668\u8fd4\u56deHTML\u3002</li> <li>\u8bf7\u6c42-\u54cd\u5e94\u6a21\u5f0f\uff1a\u540c\u6b65\u3002\u5ba2\u6237\u7aef\u7b49\u5f85\u54cd\u5e94\u3002\u7b80\u5355\u4f46\u4f1a\u4ea7\u751f\u74f6\u9888\uff1a\u5ba2\u6237\u7aef\u5728\u7b49\u5f85\u65f6\u7a7a\u95f2\uff0c\u670d\u52a1\u5668\u5fc5\u987b\u5728\u5904\u7406\u5b8c\u5f53\u524d\u8bf7\u6c42\u540e\u624d\u80fd\u7ee7\u7eed\u3002</li> <li>\u65e0\u72b6\u6001\u670d\u52a1\u5668\uff1a\u670d\u52a1\u5668\u4e0d\u8bb0\u4f4f\u5148\u524d\u7684\u8bf7\u6c42\u3002\u6bcf\u4e2a\u8bf7\u6c42\u5305\u542b\u5904\u7406\u5b83\u6240\u9700\u7684\u6240\u6709\u4fe1\u606f\u3002\u8fd9\u4f7f\u5f97\u6269\u5c55\u53d8\u5f97\u5bb9\u6613\uff1a\u4efb\u4f55\u670d\u52a1\u5668\u90fd\u53ef\u4ee5\u5904\u7406\u4efb\u4f55\u8bf7\u6c42\uff0c\u56e0\u6b64\u4f60\u53ef\u4ee5\u5728\u8d1f\u8f7d\u5747\u8861\u5668\u540e\u9762\u6dfb\u52a0\u66f4\u591a\u670d\u52a1\u5668\u3002</li> <li>\u6709\u72b6\u6001\u670d\u52a1\u5668\uff1a\u670d\u52a1\u5668\u5728\u8bf7\u6c42\u4e4b\u95f4\u7ef4\u62a4\u72b6\u6001\uff08\u4f8b\u5982\uff0c\u7528\u6237\u4f1a\u8bdd\uff09\u3002\u6269\u5c55\u66f4\u56f0\u96be\uff0c\u56e0\u4e3a\u6765\u81ea\u540c\u4e00\u7528\u6237\u7684\u8bf7\u6c42\u5fc5\u987b\u53d1\u9001\u5230\u540c\u4e00\u53f0\u670d\u52a1\u5668\uff08\u4f1a\u8bdd\u4eb2\u548c\u6027\uff09\u3002\u73b0\u4ee3\u7cfb\u7edf\u901a\u8fc7\u5c06\u72b6\u6001\u5b58\u50a8\u5728\u6570\u636e\u5e93\u6216\u7f13\u5b58\uff08Redis\uff09\u4e2d\u6765\u907f\u514d\u670d\u52a1\u5668\u7aef\u72b6\u6001\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/01.%20systems%20design%20fundamentals/#_2","title":"\u7f51\u7edc\u534f\u8bae","text":"<ul> <li>\u6211\u4eec\u5728\u7b2c13\u7ae0\uff08TCP/IP\u5c42\u3001\u5957\u63a5\u5b57\uff09\u4e2d\u4ecb\u7ecd\u4e86\u7f51\u7edc\u77e5\u8bc6\u3002\u8fd9\u91cc\u6211\u4eec\u5173\u6ce8\u7cfb\u7edf\u8bbe\u8ba1\u4e2d\u4f7f\u7528\u7684\u5e94\u7528\u5c42\u534f\u8bae\uff1a</li> <li>HTTP/HTTPS\uff1aWeb\u548c\u5927\u591a\u6570API\u7684\u534f\u8bae\u3002\u8bf7\u6c42\u65b9\u6cd5\uff1aGET\uff08\u8bfb\u53d6\uff09\u3001POST\uff08\u521b\u5efa/\u9884\u6d4b\uff09\u3001PUT\uff08\u66f4\u65b0\uff09\u3001DELETE\uff08\u5220\u9664\uff09\u3002HTTPS\u589e\u52a0\u4e86TLS\u52a0\u5bc6\uff08\u7b2c13\u7ae0\u5b89\u5168\u90e8\u5206\uff09\u3002REST API\uff08\u7b2c15\u7ae0\u6587\u4ef603\uff09\u57fa\u4e8eHTTP\u6784\u5efa\u3002</li> <li>WebSocket\uff1a\u5ba2\u6237\u7aef\u548c\u670d\u52a1\u5668\u4e4b\u95f4\u7684\u6301\u4e45\u53cc\u5411\u8fde\u63a5\u3002\u4e0eHTTP\uff08\u8bf7\u6c42\u2192\u54cd\u5e94\u2192\u8fde\u63a5\u5173\u95ed\uff09\u4e0d\u540c\uff0cWebSocket\u4fdd\u6301\u8fde\u63a5\u6253\u5f00\uff0c\u7528\u4e8e\u5b9e\u65f6\u6d41\u5f0f\u4f20\u8f93\u3002\u7528\u4e8e\uff1aLLM\u4ee4\u724c\u6d41\u5f0f\u4f20\u8f93\uff08\u751f\u6210\u65f6\u53d1\u9001\u4ee4\u724c\uff09\u3001\u5b9e\u65f6\u4eea\u8868\u76d8\u3001\u804a\u5929\u5e94\u7528\u3002</li> <li>gRPC\uff1aGoogle\u7684RPC\u6846\u67b6\u3002\u4f7f\u7528Protocol Buffers\uff08\u4e8c\u8fdb\u5236\u5e8f\u5217\u5316\uff0c\u6bd4JSON\u5c0f\u7ea610\u500d\u4e14\u66f4\u5feb\uff09\uff0c\u57fa\u4e8eHTTP/2\u3002\u652f\u6301\u6d41\u5f0f\u4f20\u8f93\uff08\u670d\u52a1\u7aef\u3001\u5ba2\u6237\u7aef\u3001\u53cc\u5411\uff09\u3002\u7528\u4e8e\u6ce8\u91cd\u6027\u80fd\u7684\u5185\u90e8\u670d\u52a1\u95f4\u901a\u4fe1\u3002Triton\u63a8\u7406\u670d\u52a1\u5668\uff08\u7b2c15\u7ae0\uff09\u548cTensorFlow Serving\u4f7f\u7528gRPC\u3002</li> <li>Protocol Buffers\uff1a\u5728<code>.proto</code>\u6587\u4ef6\u4e2d\u5b9a\u4e49\u6d88\u606f\u6a21\u5f0f\uff1a</li> </ul> <pre><code>message PredictRequest {\n    repeated float features = 1;\n    string model_version = 2;\n}\n\nmessage PredictResponse {\n    float prediction = 1;\n    float confidence = 2;\n}\n\nservice ModelService {\n    rpc Predict(PredictRequest) returns (PredictResponse);\n}\n</code></pre> <ul> <li>\u8be5\u6a21\u5f0f\u88ab\u7f16\u8bd1\u6210\u4efb\u4f55\u8bed\u8a00\uff08Python\u3001C++\u3001Go\u3001Java\uff09\u7684\u5ba2\u6237\u7aef\u548c\u670d\u52a1\u7aef\u4ee3\u7801\u3002\u7c7b\u578b\u5b89\u5168\u3001\u5411\u540e\u517c\u5bb9\u6027\u548c\u9ad8\u6027\u80fd\u90fd\u81ea\u7136\u5177\u5907\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/01.%20systems%20design%20fundamentals/#dns","title":"DNS","text":"<ul> <li>DNS\uff08\u57df\u540d\u7cfb\u7edf\uff09\u5c06\u4eba\u7c7b\u53ef\u8bfb\u7684\u540d\u79f0\u8f6c\u6362\u4e3aIP\u5730\u5740\uff08\u7b2c13\u7ae0\uff09\u3002\u5bf9\u4e8e\u7cfb\u7edf\u8bbe\u8ba1\uff0cDNS\u8fd8\u63d0\u4f9b\uff1a</li> <li>\u901a\u8fc7DNS\u7684\u8d1f\u8f7d\u5747\u8861\uff1a\u4e3a\u540c\u4e00\u57df\u540d\u8fd4\u56de\u4e0d\u540c\u7684IP\u5730\u5740\uff0c\u5c06\u6d41\u91cf\u5206\u5e03\u5230\u591a\u4e2a\u670d\u52a1\u5668\u3002\u7b80\u5355\u4f46\u7c92\u5ea6\u8f83\u7c97\uff08DNS\u7ed3\u679c\u4f1a\u88ab\u7f13\u5b58\u6570\u5206\u949f\u5230\u6570\u5c0f\u65f6\uff0c\u56e0\u6b64\u6d41\u91cf\u4e0d\u4f1a\u5feb\u901f\u91cd\u65b0\u5e73\u8861\uff09\u3002</li> <li>\u5730\u7406\u8def\u7531\uff1a\u6839\u636e\u5ba2\u6237\u7aef\u4f4d\u7f6e\u8fd4\u56de\u6700\u8fd1\u6570\u636e\u4e2d\u5fc3\u7684IP\u3002\u4e1c\u4eac\u7684\u7528\u6237\u83b7\u5f97\u65e5\u672c\u6570\u636e\u4e2d\u5fc3\uff1b\u4f26\u6566\u7684\u7528\u6237\u83b7\u5f97\u6b27\u6d32\u6570\u636e\u4e2d\u5fc3\u3002</li> <li>\u6545\u969c\u8f6c\u79fb\uff1a\u5982\u679c\u670d\u52a1\u5668\u5b95\u673a\uff0cDNS\u505c\u6b62\u8fd4\u56de\u5176IP\u3002\u65b0\u5ba2\u6237\u7aef\u8fde\u63a5\u5230\u5065\u5eb7\u7684\u670d\u52a1\u5668\u3002\u4f46\u7f13\u5b58\u7684DNS\u6761\u76ee\u610f\u5473\u7740\u67d0\u4e9b\u5ba2\u6237\u7aef\u4f1a\u7ee7\u7eed\u8bbf\u95ee\u5df2\u5b95\u673a\u7684\u670d\u52a1\u5668\u6301\u7eed\u6570\u5206\u949f\uff08TTL\u95ee\u9898\uff09\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/01.%20systems%20design%20fundamentals/#_3","title":"\u4ee3\u7406","text":"<ul> <li>\u4ee3\u7406\u662f\u5ba2\u6237\u7aef\u548c\u670d\u52a1\u5668\u4e4b\u95f4\u7684\u4e2d\u4ecb\uff1a</li> <li>\u53cd\u5411\u4ee3\u7406\uff08\u5728\u670d\u52a1\u5668\u524d\u9762\uff09\uff1a\u5ba2\u6237\u7aef\u8fde\u63a5\u5230\u4ee3\u7406\uff0c\u4ee3\u7406\u5c06\u8bf7\u6c42\u8f6c\u53d1\u7ed9\u540e\u7aef\u670d\u52a1\u5668\u3002\u5ba2\u6237\u7aef\u4e0d\u77e5\u9053\u54ea\u4e2a\u670d\u52a1\u5668\u5904\u7406\u4e86\u8bf7\u6c42\u3002Nginx\u548cHAProxy\u662f\u6807\u51c6\u7684\u53cd\u5411\u4ee3\u7406\u3002\u5b83\u4eec\u63d0\u4f9b\uff1a\u8d1f\u8f7d\u5747\u8861\uff08\u5206\u53d1\u8bf7\u6c42\uff09\u3001SSL\u7ec8\u6b62\uff08\u5728\u4ee3\u7406\u5904\u89e3\u5bc6HTTPS\uff0c\u5411\u540e\u7aef\u53d1\u9001\u660e\u6587HTTP\uff09\u3001\u7f13\u5b58\u3001\u901f\u7387\u9650\u5236\u548c\u538b\u7f29\u3002</li> <li>API\u7f51\u5173\uff1a\u4e00\u79cd\u4e13\u95e8\u7528\u4e8eAPI\u7684\u53cd\u5411\u4ee3\u7406\u3002\u5904\u7406\u8eab\u4efd\u9a8c\u8bc1\u3001\u901f\u7387\u9650\u5236\u3001\u8bf7\u6c42\u8def\u7531\uff08\u4e0d\u540c\u8def\u5f84\u2192\u4e0d\u540c\u670d\u52a1\uff09\u548cAPI\u7248\u672c\u7ba1\u7406\u3002Kong\u3001AWS API Gateway\u548cEnvoy\u662f\u5e38\u89c1\u9009\u62e9\u3002</li> <li>\u5bf9\u4e8eML\u670d\u52a1\uff1aAPI\u7f51\u5173\u4f4d\u4e8e\u6a21\u578b\u670d\u52a1\u5668\u524d\u9762\u3002\u5b83\u9a8c\u8bc1API\u5bc6\u94a5\u3001\u5bf9\u514d\u8d39\u7528\u6237\u8fdb\u884c\u901f\u7387\u9650\u5236\u3001\u5c06<code>/v1/predict</code>\u8def\u7531\u5230\u6a21\u578b\u670d\u52a1\u5668A\u3001\u5c06<code>/v2/predict</code>\u8def\u7531\u5230\u6a21\u578b\u670d\u52a1\u5668B\uff0c\u5e76\u6536\u96c6\u4f7f\u7528\u6307\u6807\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/01.%20systems%20design%20fundamentals/#_4","title":"\u8d1f\u8f7d\u5747\u8861","text":"<ul> <li>\u5f53\u4f60\u62e5\u6709\u591a\u53f0\u670d\u52a1\u5668\u65f6\uff0c\u8d1f\u8f7d\u5747\u8861\u5668\u5c06\u4f20\u5165\u8bf7\u6c42\u5206\u5e03\u5230\u5b83\u4eec\u4e4b\u95f4\u3002</li> </ul> <ul> <li>\u7b97\u6cd5\uff1a<ul> <li>\u8f6e\u8be2\uff1a\u6309\u987a\u5e8f\u53d1\u9001\u8bf7\u6c42\u5230\u670d\u52a1\u5668\uff081, 2, 3, 1, 2, 3...\uff09\u3002\u7b80\u5355\u3001\u516c\u5e73\uff0c\u4f46\u4e0d\u8003\u8651\u670d\u52a1\u5668\u8d1f\u8f7d\u3002</li> <li>\u6700\u5c11\u8fde\u63a5\uff1a\u53d1\u9001\u5230\u6d3b\u52a8\u8fde\u63a5\u6700\u5c11\u7684\u670d\u52a1\u5668\u3002\u9002\u7528\u4e8e\u5904\u7406\u65f6\u95f4\u53ef\u53d8\u7684\u8bf7\u6c42\uff08\u6709\u4e9bLLM\u8bf7\u6c42\u751f\u621010\u4e2a\u4ee4\u724c\uff0c\u6709\u4e9b\u751f\u62101000\u4e2a\uff09\u3002</li> <li>\u52a0\u6743\u8f6e\u8be2\uff1a\u5bb9\u91cf\u66f4\u5927\u7684\u670d\u52a1\u5668\u83b7\u5f97\u66f4\u591a\u8bf7\u6c42\u3002\u62e5\u670980 GB GPU\u5185\u5b58\u7684\u670d\u52a1\u5668\u5904\u7406\u7684\u8bf7\u6c42\u91cf\u662f40 GB\u7684\u4e24\u500d\u3002</li> <li>\u4e00\u81f4\u6027\u54c8\u5e0c\uff1a\u5bf9\u8bf7\u6c42\u952e\u8fdb\u884c\u54c8\u5e0c\u8fd0\u7b97\uff0c\u6620\u5c04\u5230\u7279\u5b9a\u670d\u52a1\u5668\u3002\u76f8\u540c\u7684\u952e\u59cb\u7ec8\u53d1\u9001\u5230\u76f8\u540c\u7684\u670d\u52a1\u5668\u3002\u9002\u7528\u4e8e\uff1a\u7f13\u5b58\uff08\u540c\u4e00\u7528\u6237\u7684\u8bf7\u6c42\u547d\u4e2d\u540c\u4e00\u7f13\u5b58\uff09\u3001\u4f1a\u8bdd\u4eb2\u548c\u6027\u548c\u524d\u7f00\u7f13\u5b58\uff08\u7b2c17\u7ae0\uff1a\u5177\u6709\u76f8\u540c\u7cfb\u7edf\u63d0\u793a\u8bcd\u7684\u8bf7\u6c42\u53d1\u9001\u5230\u5177\u6709\u8be5\u63d0\u793a\u8bcdKV\u7f13\u5b58\u7684\u670d\u52a1\u5668\uff09\u3002</li> </ul> </li> <li>L4 vs L7\u8d1f\u8f7d\u5747\u8861\uff1a<ul> <li>L4\uff08\u4f20\u8f93\u5c42\uff09\uff1a\u57fa\u4e8eIP\u548c\u7aef\u53e3\u8def\u7531\u3002\u5feb\u901f\u4f46\u65e0\u6cd5\u68c0\u67e5\u8bf7\u6c42\u5185\u5bb9\u3002</li> <li>L7\uff08\u5e94\u7528\u5c42\uff09\uff1a\u57fa\u4e8eHTTP\u8def\u5f84\u3001\u6807\u5934\u6216\u6b63\u6587\u5185\u5bb9\u8def\u7531\u3002\u53ef\u4ee5\u5c06<code>/api/chat</code>\u8def\u7531\u5230\u804a\u5929\u670d\u52a1\u5668\uff0c\u5c06<code>/api/embed</code>\u8def\u7531\u5230\u5d4c\u5165\u670d\u52a1\u5668\u3002\u8f83\u6162\u4f46\u66f4\u7075\u6d3b\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/01.%20systems%20design%20fundamentals/#_5","title":"\u7f13\u5b58","text":"<ul> <li>\u7f13\u5b58\u5c06\u9891\u7e41\u8bbf\u95ee\u7684\u6570\u636e\u5b58\u50a8\u5728\u5feb\u901f\u5b58\u50a8\u5c42\uff08\u5185\u5b58\uff09\u4e2d\uff0c\u4ee5\u907f\u514d\u91cd\u65b0\u8ba1\u7b97\u6216\u91cd\u65b0\u83b7\u53d6\u3002</li> </ul> <ul> <li>\u7f13\u5b58\u6a21\u5f0f\uff1a<ul> <li>\u7f13\u5b58\u65c1\u8def\uff08\u60f0\u6027\u52a0\u8f7d\uff09\uff1a\u5e94\u7528\u7a0b\u5e8f\u5148\u68c0\u67e5\u7f13\u5b58\u3002\u672a\u547d\u4e2d\u65f6\uff0c\u4ece\u6570\u636e\u5e93\u83b7\u53d6\u3001\u5b58\u50a8\u5230\u7f13\u5b58\u5e76\u8fd4\u56de\u3002\u6700\u5e38\u89c1\u7684\u6a21\u5f0f\u3002</li> <li>\u76f4\u5199\uff1a\u6bcf\u6b21\u5199\u5165\u540c\u65f6\u5199\u5165\u7f13\u5b58\u548c\u6570\u636e\u5e93\u3002\u786e\u4fdd\u7f13\u5b58\u59cb\u7ec8\u662f\u6700\u65b0\u7684\uff0c\u4f46\u4f1a\u51cf\u6162\u5199\u5165\u901f\u5ea6\u3002</li> <li>\u56de\u5199\uff1a\u5199\u5165\u53ea\u8fdb\u5165\u7f13\u5b58\uff1b\u7f13\u5b58\u5f02\u6b65\u5237\u65b0\u5230\u6570\u636e\u5e93\u3002\u5199\u5165\u6700\u5feb\uff0c\u4f46\u82e5\u7f13\u5b58\u5237\u65b0\u524d\u5d29\u6e83\u5219\u6709\u6570\u636e\u4e22\u5931\u98ce\u9669\u3002</li> </ul> </li> <li>\u9a71\u9010\u7b56\u7565\uff08\u5f53\u7f13\u5b58\u6ee1\u65f6\uff09\uff1a<ul> <li>LRU\uff08\u6700\u8fd1\u6700\u5c11\u4f7f\u7528\uff09\uff1a\u9a71\u9010\u6700\u957f\u65f6\u95f4\u672a\u88ab\u8bbf\u95ee\u7684\u6761\u76ee\u3002\u6700\u5e38\u89c1\u7684\u7b56\u7565\u3002</li> <li>LFU\uff08\u6700\u4e0d\u9891\u7e41\u4f7f\u7528\uff09\uff1a\u9a71\u9010\u8bbf\u95ee\u6b21\u6570\u6700\u5c11\u7684\u6761\u76ee\u3002\u5f53\u67d0\u4e9b\u6761\u76ee\u6301\u7eed\u53d7\u6b22\u8fce\u65f6\u6548\u679c\u66f4\u597d\u3002</li> <li>TTL\uff08\u751f\u5b58\u65f6\u95f4\uff09\uff1a\u6761\u76ee\u5728\u56fa\u5b9a\u65f6\u957f\u540e\u8fc7\u671f\u3002\u7528\u4e8e\u4f1a\u8fc7\u65f6\u7684\u6570\u636e\uff08\u6a21\u578b\u9884\u6d4b\u7f13\u5b585\u5206\u949f\uff0c\u7279\u5f81\u503c\u7f13\u5b581\u5c0f\u65f6\uff09\u3002</li> </ul> </li> <li>CDN\uff08\u5185\u5bb9\u5206\u53d1\u7f51\u7edc\uff09\uff1a\u7528\u4e8e\u9759\u6001\u5185\u5bb9\uff08\u56fe\u7247\u3001JavaScript\u3001CSS\uff09\u7684\u5168\u7403\u5206\u5e03\u5f0f\u7f13\u5b58\u3002\u904d\u5e03100\u591a\u4e2a\u5730\u70b9\u7684\u670d\u52a1\u5668\u4ece\u79bb\u7528\u6237\u6700\u8fd1\u7684\u4f4d\u7f6e\u63d0\u4f9b\u7f13\u5b58\u5185\u5bb9\u3002\u5bf9\u4e8eML\uff1a\u6a21\u578b\u6743\u91cd\u53ef\u4ee5\u7f13\u5b58\u5728CDN\u4e0a\u4ee5\u5b9e\u73b0\u5feb\u901f\u4e0b\u8f7d\u3002</li> <li>Redis\uff1a\u6807\u51c6\u7684\u952e\u503c\u5185\u5b58\u7f13\u5b58/\u6570\u636e\u5e93\u3002\u652f\u6301\u5b57\u7b26\u4e32\u3001\u5217\u8868\u3001\u96c6\u5408\u3001\u6709\u5e8f\u96c6\u5408\u3001\u54c8\u5e0c\u548c\u6d41\u3002\u4e9a\u6beb\u79d2\u7ea7\u5ef6\u8fdf\u3002\u7528\u4e8e\uff1a\u7f13\u5b58\u6a21\u578b\u9884\u6d4b\u3001\u5b58\u50a8\u4f1a\u8bdd\u6570\u636e\u3001\u901f\u7387\u9650\u5236\uff08\u7edf\u8ba1\u6bcf\u4e2a\u7528\u6237\u6bcf\u5206\u949f\u7684\u8bf7\u6c42\u6570\uff09\u548c\u5b9e\u65f6\u7279\u5f81\u670d\u52a1\u3002</li> <li>\u5bf9\u4e8eML\u670d\u52a1\uff1a\u7f13\u5b58\u91cd\u590d\u8f93\u5165\u7684\u9884\u6d4b\u7ed3\u679c\u3002\u5982\u679c\u5f88\u591a\u7528\u6237\u95ee\"\u6cd5\u56fd\u7684\u9996\u90fd\u662f\u4ec0\u4e48\uff1f\"\uff0c\u8ba1\u7b97\u4e00\u6b21\u7b54\u6848\u7136\u540e\u63d0\u4f9b\u7f13\u5b58\u7ed3\u679c\u3002\u5bf9\u4e8e\u804a\u5929\u673a\u5668\u4eba\u5de5\u4f5c\u8d1f\u8f7d\uff0c\u7f13\u5b58\u547d\u4e2d\u7387\u901a\u5e38\u4e3a20-40%\uff0c\u6309\u6bd4\u4f8b\u964d\u4f4eGPU\u6210\u672c\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/01.%20systems%20design%20fundamentals/#_6","title":"\u6570\u636e\u5e93","text":""},{"location":"chapter%2018%3A%20ML%20systems%20design/01.%20systems%20design%20fundamentals/#sql","title":"SQL\uff08\u5173\u7cfb\u578b\uff09","text":"<ul> <li>SQL\u6570\u636e\u5e93\uff08PostgreSQL\u3001MySQL\uff09\u4ee5\u5305\u542b\u884c\u548c\u5217\u7684\u5f62\u5f0f\u5b58\u50a8\u6570\u636e\u3002\u8868\u4e4b\u95f4\u7684\u5173\u7cfb\u901a\u8fc7\u5916\u952e\u8868\u793a\u3002\u67e5\u8be2\u4f7f\u7528SQL\u3002ACID\u4fdd\u8bc1\uff1a<ul> <li>\u539f\u5b50\u6027\uff1a\u4e8b\u52a1\u8981\u4e48\u5b8c\u5168\u5b8c\u6210\uff0c\u8981\u4e48\u5b8c\u5168\u56de\u6eda\u3002\u6ca1\u6709\u90e8\u5206\u66f4\u65b0\u3002</li> <li>\u4e00\u81f4\u6027\uff1a\u6570\u636e\u5e93\u4ece\u4e00\u4e2a\u6709\u6548\u72b6\u6001\u8f6c\u6362\u5230\u53e6\u4e00\u4e2a\u6709\u6548\u72b6\u6001\u3002\u7ea6\u675f\u6761\u4ef6\uff08\u552f\u4e00\u952e\u3001\u5916\u952e\uff09\u59cb\u7ec8\u5f97\u5230\u6ee1\u8db3\u3002</li> <li>\u9694\u79bb\u6027\uff1a\u5e76\u53d1\u4e8b\u52a1\u4e0d\u4e92\u76f8\u5e72\u6270\u3002</li> <li>\u6301\u4e45\u6027\uff1a\u5df2\u63d0\u4ea4\u7684\u6570\u636e\u5728\u5d29\u6e83\u540e\u4ecd\u7136\u5b58\u5728\uff08\u5728\u786e\u8ba4\u524d\u5199\u5165\u78c1\u76d8\uff09\u3002</li> </ul> </li> <li>SQL\u6570\u636e\u5e93\u64c5\u957f\uff1a\u5177\u6709\u5173\u7cfb\u7684\u6709\u7ed3\u6784\u6570\u636e\u3001\u590d\u6742\u67e5\u8be2\uff08\u8054\u63a5\u3001\u805a\u5408\uff09\u3001\u4e25\u683c\u7684\u4e00\u81f4\u6027\u8981\u6c42\u548c\u6570\u636e\u5b8c\u6574\u6027\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/01.%20systems%20design%20fundamentals/#nosql","title":"NoSQL","text":"<ul> <li>NoSQL\u6570\u636e\u5e93\u4e3a\u4e86\u53ef\u6269\u5c55\u6027\u548c\u7075\u6d3b\u6027\u800c\u727a\u7272\u4e86\u4e00\u4e9bACID\u4fdd\u8bc1\uff1a<ul> <li>\u952e\u503c\u5b58\u50a8\uff08Redis\u3001DynamoDB\uff09\uff1a\u6700\u7b80\u5355\u7684\u6a21\u578b\u3002\u6309\u952e\u5feb\u901f\u67e5\u627e\u3002\u7528\u4e8e\u7f13\u5b58\u3001\u4f1a\u8bdd\u5b58\u50a8\u548c\u7279\u5f81\u5b58\u50a8\u3002</li> <li>\u6587\u6863\u5b58\u50a8\uff08MongoDB\u3001Firestore\uff09\uff1a\u5b58\u50a8\u7c7b\u4f3cJSON\u7684\u6587\u6863\u3002\u7075\u6d3b\u7684\u6a21\u5f0f\uff08\u6bcf\u4e2a\u6587\u6863\u53ef\u4ee5\u6709\u4e0d\u540c\u5b57\u6bb5\uff09\u3002\u7528\u4e8e\u7528\u6237\u8d44\u6599\u3001\u4ea7\u54c1\u76ee\u5f55\u548c\u914d\u7f6e\u3002</li> <li>\u5217\u65cf\u5b58\u50a8\uff08Cassandra\u3001HBase\uff09\uff1a\u9488\u5bf9\u5199\u5165\u5bc6\u96c6\u578b\u5de5\u4f5c\u8d1f\u8f7d\u548c\u65f6\u95f4\u5e8f\u5217\u6570\u636e\u8fdb\u884c\u4e86\u4f18\u5316\u3002\u7528\u4e8e\u4e8b\u4ef6\u65e5\u5fd7\u3001\u6307\u6807\u548c\u5206\u6790\u3002</li> <li>\u56fe\u6570\u636e\u5e93\uff08Neo4j\uff09\uff1a\u5b58\u50a8\u8282\u70b9\u548c\u8fb9\u3002\u9488\u5bf9\u904d\u5386\u67e5\u8be2\u8fdb\u884c\u4e86\u4f18\u5316\u3002\u7528\u4e8e\u793e\u4ea4\u7f51\u7edc\u3001\u77e5\u8bc6\u56fe\u8c31\u548c\u63a8\u8350\u7cfb\u7edf\u3002</li> <li>\u5411\u91cf\u6570\u636e\u5e93\uff08Pinecone\u3001Milvus\u3001Weaviate\u3001FAISS\uff09\uff1a\u5b58\u50a8\u9ad8\u7ef4\u5d4c\u5165\u5e76\u652f\u6301\u8fd1\u4f3c\u6700\u8fd1\u90bb\uff08ANN\uff09\u641c\u7d22\u3002\u5bf9\u4e8e\u8bed\u4e49\u641c\u7d22\u3001RAG\uff08\u68c0\u7d22\u589e\u5f3a\u751f\u6210\uff09\u548c\u63a8\u8350\u7cfb\u7edf\u81f3\u5173\u91cd\u8981\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/01.%20systems%20design%20fundamentals/#cap","title":"CAP\u5b9a\u7406","text":"<ul> <li>\u5728\u5206\u5e03\u5f0f\u6570\u636e\u5e93\u4e2d\uff0c\u6700\u591a\u53ea\u80fd\u6ee1\u8db3\u4e09\u4e2a\u5c5e\u6027\u4e2d\u7684\u4e24\u4e2a\uff1a<ul> <li>\u4e00\u81f4\u6027\uff1a\u6bcf\u6b21\u8bfb\u53d6\u90fd\u8fd4\u56de\u6700\u65b0\u7684\u5199\u5165\u3002</li> <li>\u53ef\u7528\u6027\uff1a\u6bcf\u4e2a\u8bf7\u6c42\u90fd\u4f1a\u6536\u5230\u54cd\u5e94\uff08\u5373\u4f7f\u67d0\u4e9b\u8282\u70b9\u5b95\u673a\uff09\u3002</li> <li>\u5206\u533a\u5bb9\u5fcd\u6027\uff1a\u7cfb\u7edf\u5728\u7f51\u7edc\u5206\u533a\uff08\u8282\u70b9\u65e0\u6cd5\u901a\u4fe1\uff09\u65f6\u4ecd\u80fd\u7ee7\u7eed\u8fd0\u884c\u3002</li> </ul> </li> </ul> <ul> <li>\u7531\u4e8e\u5206\u5e03\u5f0f\u7cfb\u7edf\u4e2d\u7f51\u7edc\u5206\u533a\u4e0d\u53ef\u907f\u514d\uff0c\u771f\u6b63\u7684\u9009\u62e9\u662fCP\uff08\u4e00\u81f4\u4f46\u5728\u5206\u533a\u671f\u95f4\u53ef\u80fd\u4e0d\u53ef\u7528\u2014\u2014\u5982PostgreSQL\uff09 vs AP\uff08\u53ef\u7528\u4f46\u5728\u5206\u533a\u671f\u95f4\u53ef\u80fd\u8fd4\u56de\u8fc7\u671f\u6570\u636e\u2014\u2014\u5982Cassandra\u3001DynamoDB\uff09\u3002</li> <li>\u5bf9\u4e8eML\uff1a\u7279\u5f81\u5b58\u50a8\u901a\u5e38\u9009\u62e9AP\uff08\u7a0d\u5fae\u8fc7\u671f\u7684\u7279\u5f81\u503c\u4e5f\u6bd4\u65e0\u6cd5\u9884\u6d4b\u8981\u597d\uff09\u3002\u6a21\u578b\u6ce8\u518c\u8868\u9009\u62e9CP\uff08\u63d0\u4f9b\u9519\u8bef\u7684\u6a21\u578b\u7248\u672c\u662f\u707e\u96be\u6027\u7684\uff09\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/01.%20systems%20design%20fundamentals/#_7","title":"\u5206\u7247","text":"<ul> <li>\u5206\u7247\u5c06\u6570\u636e\u5e93\u62c6\u5206\u5230\u591a\u53f0\u673a\u5668\u4e0a\u3002\u6bcf\u4e2a\u5206\u7247\u6301\u6709\u6570\u636e\u7684\u4e00\u4e2a\u5b50\u96c6\u3002</li> <li>\u54c8\u5e0c\u5206\u7247\uff1a\u5bf9\u952e\u8fdb\u884c\u54c8\u5e0c\u8fd0\u7b97\u4ee5\u786e\u5b9a\u5206\u7247\u3002<code>shard = hash(user_id) % num_shards</code>\u3002\u5206\u5e03\u5747\u5300\u4f46\u4e0d\u652f\u6301\u8303\u56f4\u67e5\u8be2\u3002</li> <li>\u8303\u56f4\u5206\u7247\uff1a\u6bcf\u4e2a\u5206\u7247\u6301\u6709\u4e00\u4e2a\u952e\u8303\u56f4\uff08\u7528\u6237A-G\u5728\u5206\u72471\uff0cH-N\u5728\u5206\u72472\uff09\u3002\u652f\u6301\u8303\u56f4\u67e5\u8be2\u4f46\u53ef\u80fd\u4ea7\u751f\u70ed\u70b9\uff08\u5982\u679c\u5f88\u591a\u7528\u6237\u540d\u5b57\u4ee5\"S\"\u5f00\u5934\uff09\u3002</li> <li>\u91cd\u65b0\u5206\u7247\u95ee\u9898\uff1a\u6dfb\u52a0\u5206\u7247\u4f1a\u4f7f\u54c8\u5e0c\u6620\u5c04\u5931\u6548\u3002\u4e00\u81f4\u6027\u54c8\u5e0c\u6700\u5c0f\u5316\u6570\u636e\u79fb\u52a8\uff1a\u6dfb\u52a0\u7b2cn\u4e2a\u5206\u7247\u65f6\uff0c\u53ea\u6709\u7ea61/n\u7684\u952e\u9700\u8981\u79fb\u52a8\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/01.%20systems%20design%20fundamentals/#_8","title":"\u6570\u636e\u5e93\u7d22\u5f15","text":"<ul> <li>\u7d22\u5f15\u662f\u4e00\u79cd\u52a0\u901f\u67e5\u8be2\u7684\u6570\u636e\u7ed3\u6784\uff0c\u4ee3\u4ef7\u662f\u989d\u5916\u7684\u5b58\u50a8\u7a7a\u95f4\u548c\u8f83\u6162\u7684\u5199\u5165\u901f\u5ea6\u3002\u6ca1\u6709\u7d22\u5f15\u65f6\uff0c\u67e5\u8be2\u4f1a\u626b\u63cf\u6bcf\u4e00\u884c\uff08\\(O(n)\\)\uff09\u3002\u6709\u7d22\u5f15\u65f6\uff0c\u53ef\u4ee5\u5728\\(O(\\log n)\\)\u65f6\u95f4\u5185\u627e\u5230\u76ee\u6807\u3002</li> <li>B\u6811\u7d22\u5f15\uff08\u9ed8\u8ba4\uff09\uff1a\u4e00\u79cd\u5e73\u8861\u6811\uff08\u7b2c13\u7ae0\u3001\u7b2c14\u7ae0\uff09\uff0c\u5176\u4e2d\u6bcf\u4e2a\u8282\u70b9\u5305\u542b\u591a\u4e2a\u952e\u548c\u6307\u9488\u3002B\u6811\u5bf9\u7f13\u5b58\u53cb\u597d\uff08\u5bbd\u8282\u70b9\u9002\u5408\u7f13\u5b58\u884c\uff09\u5e76\u652f\u6301\u8303\u56f4\u67e5\u8be2\uff08<code>WHERE age BETWEEN 20 AND 30</code>\uff09\u3002\u5927\u591a\u6570SQL\u6570\u636e\u5e93\u4f7f\u7528B\u6811\u3002</li> <li>\u54c8\u5e0c\u7d22\u5f15\uff1a\u4f7f\u7528\u54c8\u5e0c\u51fd\u6570\u5c06\u952e\u6620\u5c04\u5230\u884c\u4f4d\u7f6e\u3002\\(O(1)\\)\u67e5\u627e\u4f46\u4e0d\u652f\u6301\u8303\u56f4\u67e5\u8be2\u3002\u7528\u4e8e\u7cbe\u786e\u5339\u914d\u67e5\u627e\uff08<code>WHERE id = 12345</code>\uff09\u3002</li> <li>\u590d\u5408\u7d22\u5f15\uff1a\u5bf9\u591a\u4e2a\u5217\u7684\u7d22\u5f15\u3002<code>CREATE INDEX ON users(country, city)</code> \u52a0\u901f\u6309\u56fd\u5bb6\u6216\u6309\u56fd\u5bb6+\u57ce\u5e02\u7b5b\u9009\u7684\u67e5\u8be2\uff0c\u4f46\u4e0d\u80fd\u52a0\u901f\u4ec5\u6309\u57ce\u5e02\u7684\u67e5\u8be2\uff08\u6700\u5de6\u8fb9\u7684\u5217\u5fc5\u987b\u5728\u67e5\u8be2\u4e2d\uff09\u3002</li> <li>\u6743\u8861\uff1a\u6bcf\u4e2a\u7d22\u5f15\u90fd\u4f1a\u52a0\u901f\u8bfb\u53d6\u4f46\u51cf\u6162\u5199\u5165\uff08\u6bcf\u6b21\u63d2\u5165/\u66f4\u65b0/\u5220\u9664\u90fd\u5fc5\u987b\u66f4\u65b0\u7d22\u5f15\uff09\u5e76\u5360\u7528\u5b58\u50a8\u7a7a\u95f4\uff08\u6bcf\u4e2a\u7d22\u5f15\u7ea6\u5360\u8868\u5927\u5c0f\u768410-30%\uff09\u3002\u4e0d\u8981\u7d22\u5f15\u6240\u6709\u5185\u5bb9\u2014\u2014\u53ea\u7d22\u5f15\u4f60\u7ecf\u5e38\u67e5\u8be2\u7684\u5217\u3002</li> <li>\u5bf9\u4e8eML\u7cfb\u7edf\uff1a\u7279\u5f81\u5b58\u50a8\u7684\u5728\u7ebf\u6570\u636e\u5e93\u9700\u8981\u5728\u5b9e\u4f53\u952e\uff08user_id\u3001item_id\uff09\u4e0a\u5efa\u7acb\u7d22\u5f15\u4ee5\u5b9e\u73b0\u5feb\u901f\u7279\u5f81\u67e5\u627e\u3002\u5b9e\u9a8c\u8ddf\u8e2a\u6570\u636e\u5e93\u9700\u8981\u5728\uff08experiment_id\u3001metric_name\uff09\u4e0a\u5efa\u7acb\u7d22\u5f15\u4ee5\u5b9e\u73b0\u4eea\u8868\u76d8\u67e5\u8be2\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/01.%20systems%20design%20fundamentals/#api","title":"API\u8bbe\u8ba1","text":"<ul> <li>\u7cfb\u7edf\u901a\u8fc7API\u8fdb\u884c\u901a\u4fe1\u3002\u826f\u597d\u7684API\u8bbe\u8ba1\u4f7f\u7cfb\u7edf\u53ef\u7528\u3001\u53ef\u8fdb\u5316\u548c\u53ef\u8c03\u8bd5\uff1a</li> <li>REST\u7ea6\u5b9a\uff1a\u4f7f\u7528\u540d\u8bcd\u8868\u793a\u8d44\u6e90\uff08<code>/users</code>\u3001<code>/models</code>\uff09\uff0cHTTP\u65b9\u6cd5\u8868\u793a\u64cd\u4f5c\uff08GET=\u8bfb\u53d6\u3001POST=\u521b\u5efa\u3001PUT=\u66f4\u65b0\u3001DELETE=\u5220\u9664\uff09\uff0c\u72b6\u6001\u7801\u8868\u793a\u7ed3\u679c\uff08200=OK\u3001201=\u5df2\u521b\u5efa\u3001400=\u9519\u8bef\u8bf7\u6c42\u3001404=\u672a\u627e\u5230\u3001429=\u88ab\u9650\u6d41\u3001500=\u670d\u52a1\u5668\u9519\u8bef\uff09\u3002</li> <li>\u5206\u9875\uff1a\u5bf9\u4e8e\u8fd4\u56de\u5217\u8868\u7684\u7aef\u70b9\uff0c\u6c38\u8fdc\u4e0d\u8981\u4e00\u6b21\u8fd4\u56de\u6240\u6709\u7ed3\u679c\u3002\u4f7f\u7528\u57fa\u4e8e\u6e38\u6807\u7684\u5206\u9875\uff08<code>GET /items?cursor=abc&amp;limit=50</code>\uff09\u6216\u57fa\u4e8e\u504f\u79fb\u91cf\u7684\u5206\u9875\uff08<code>GET /items?offset=100&amp;limit=50</code>\uff09\u3002\u5bf9\u4e8e\u5927\u6570\u636e\u96c6\uff0c\u57fa\u4e8e\u6e38\u6807\u7684\u5206\u9875\u66f4\u9ad8\u6548\uff08\u57fa\u4e8e\u504f\u79fb\u91cf\u7684\u5206\u9875\u9700\u8981\u8df3\u8fc7\u884c\uff09\u3002</li> <li>\u7248\u672c\u7ba1\u7406\uff1a\u5728API\u8def\u5f84\u524d\u52a0\u4e0a\u7248\u672c\u524d\u7f00\uff08<code>/v1/predict</code>\u3001<code>/v2/predict</code>\uff09\u3002\u8fd9\u6837\u53ef\u4ee5\u5728\u4e0d\u7834\u574f\u73b0\u6709\u5ba2\u6237\u7aef\u7684\u60c5\u51b5\u4e0b\u6f14\u8fdbAPI\u3002\u5ba2\u6237\u7aef\u6309\u7167\u81ea\u5df1\u7684\u8282\u594f\u8fc1\u79fb\u5230v2\uff1bv1\u88ab\u5f03\u7528\u4f46\u5728\u6d41\u91cf\u4e0b\u964d\u4e4b\u524d\u4e0d\u4f1a\u5220\u9664\u3002</li> <li>\u9519\u8bef\u54cd\u5e94\uff1a\u8fd4\u56de\u7ed3\u6784\u5316\u7684\u9519\u8bef\u4fe1\u606f\uff1a</li> </ul> <pre><code>{\n    \"error\": {\n        \"code\": \"INVALID_INPUT\",\n        \"message\": \"\u7279\u5f81'user_age'\u5fc5\u987b\u4e3a\u6b63\u6574\u6570\",\n        \"details\": {\"field\": \"user_age\", \"value\": -5}\n    }\n}\n</code></pre>"},{"location":"chapter%2018%3A%20ML%20systems%20design/01.%20systems%20design%20fundamentals/#_9","title":"\u6d88\u606f\u961f\u5217","text":"<ul> <li>\u6d88\u606f\u961f\u5217\u5c06\u751f\u4ea7\u8005\uff08\u751f\u6210\u5de5\u4f5c\u7684\u670d\u52a1\uff09\u4e0e\u6d88\u8d39\u8005\uff08\u5904\u7406\u5de5\u4f5c\u7684\u670d\u52a1\uff09\u89e3\u8026\u3002\u751f\u4ea7\u8005\u5c06\u6d88\u606f\u53d1\u9001\u5230\u961f\u5217\uff1b\u6d88\u8d39\u8005\u5728\u5c31\u7eea\u65f6\u62c9\u53d6\u6d88\u606f\u3002</li> <li>\u961f\u5217\u4e3a\u4ec0\u4e48\u91cd\u8981\uff1a\u6ca1\u6709\u961f\u5217\u65f6\uff0c\u5982\u679c\u6d88\u8d39\u8005\u6162\u6216\u5b95\u673a\uff0c\u751f\u4ea7\u8005\u4f1a\u88ab\u963b\u585e\u3002\u6709\u4e86\u961f\u5217\uff0c\u751f\u4ea7\u8005\u53d1\u9001\u540e\u5c31\u65e0\u9700\u7b49\u5f85\uff1b\u961f\u5217\u7f13\u51b2\u6d88\u606f\uff0c\u76f4\u5230\u6d88\u8d39\u8005\u51c6\u5907\u597d\u3002</li> <li>Apache Kafka\uff1a\u4e00\u4e2a\u5206\u5e03\u5f0f\u3001\u6301\u4e45\u5316\u3001\u9ad8\u541e\u5410\u91cf\u7684\u6d88\u606f\u961f\u5217\u3002\u6d88\u606f\u5b58\u50a8\u5728\u4e3b\u9898\u4e2d\uff0c\u6bcf\u4e2a\u4e3b\u9898\u8de8\u591a\u4e2a\u4ee3\u7406\u5206\u533a\u3002\u6d88\u8d39\u8005\u4ece\u5206\u533a\u8bfb\u53d6\uff0c\u8ddf\u8e2a\u5176\u4f4d\u7f6e\uff08\u504f\u79fb\u91cf\uff09\u3002Kafka\u4fdd\u8bc1\u5206\u533a\u5185\u7684\u987a\u5e8f\uff0c\u5e76\u53ef\u91cd\u64ad\u6d88\u606f\uff08\u65e5\u5fd7\u662f\u6301\u4e45\u5316\u7684\uff09\u3002</li> <li>\u53d1\u5e03/\u8ba2\u9605\uff1a\u53d1\u5e03\u8005\u5c06\u6d88\u606f\u53d1\u9001\u5230\u4e3b\u9898\uff1b\u8be5\u4e3b\u9898\u7684\u6240\u6709\u8ba2\u9605\u8005\u90fd\u4f1a\u6536\u5230\u4e00\u4efd\u526f\u672c\u3002\u7528\u4e8e\u4e8b\u4ef6\u9a71\u52a8\u67b6\u6784\uff1a\"\u65b0\u6a21\u578b\u5df2\u90e8\u7f72\"\u89e6\u53d1\u76d1\u63a7\u670d\u52a1\u3001A/B\u6d4b\u8bd5\u670d\u52a1\u548c\u65e5\u5fd7\u670d\u52a1\u540c\u65f6\u54cd\u5e94\u3002</li> <li>\u5bf9\u4e8eML\uff1a\u9884\u6d4b\u8bf7\u6c42\u901a\u8fc7HTTP\u5230\u8fbe\uff0c\u653e\u5165Kafka\u961f\u5217\uff0c\u7531GPU\u5de5\u4f5c\u7ebf\u7a0b\u5904\u7406\uff0c\u7ed3\u679c\u901a\u8fc7\u56de\u8c03\u6216WebSocket\u8fd4\u56de\u3002\u961f\u5217\u7f13\u51b2\u7a81\u53d1\u7684\u6d41\u91cf\uff0c\u5e76\u786e\u4fdd\u5373\u4f7fGPU\u5de5\u4f5c\u7ebf\u7a0b\u5d29\u6e83\u4e5f\u4e0d\u4f1a\u4e22\u5931\u8bf7\u6c42\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/01.%20systems%20design%20fundamentals/#_10","title":"\u4e00\u81f4\u6027\u6a21\u578b","text":"<ul> <li>\u5728\u5206\u5e03\u5f0f\u7cfb\u7edf\u4e2d\uff0c\u4e0d\u540c\u8282\u70b9\u53ef\u80fd\u5bf9\u6570\u636e\u6709\u4e0d\u540c\u7684\u89c6\u56fe\u3002\u4e00\u81f4\u6027\u6a21\u578b\u5b9a\u4e49\u4e86\u7cfb\u7edf\u63d0\u4f9b\u7684\u4fdd\u8bc1\uff1a</li> <li>\u5f3a\u4e00\u81f4\u6027\uff1a\u5199\u64cd\u4f5c\u4e4b\u540e\uff0c\u6240\u6709\u540e\u7eed\u8bfb\u53d6\uff08\u4ece\u4efb\u4f55\u8282\u70b9\uff09\u90fd\u80fd\u770b\u5230\u65b0\u503c\u3002\u6613\u4e8e\u63a8\u7406\u4f46\u901f\u5ea6\u6162\uff08\u9700\u8981\u5728\u8282\u70b9\u4e4b\u95f4\u534f\u8c03\uff09\u3002</li> <li>\u6700\u7ec8\u4e00\u81f4\u6027\uff1a\u5199\u64cd\u4f5c\u4e4b\u540e\uff0c\u8bfb\u53d6\u53ef\u80fd\u5728\u67d0\u6bb5\u65f6\u95f4\u5185\u770b\u5230\u8fc7\u671f\u6570\u636e\uff0c\u4f46\u6700\u7ec8\u4f1a\u770b\u5230\u65b0\u503c\u3002\u901f\u5ea6\u5feb\uff08\u65e0\u9700\u534f\u8c03\uff09\u4f46\u9700\u8981\u5e94\u7528\u7a0b\u5e8f\u5904\u7406\u8fc7\u671f\u8bfb\u53d6\u3002</li> <li>\u56e0\u679c\u4e00\u81f4\u6027\uff1a\u5982\u679c\u64cd\u4f5cA\u56e0\u679c\u4e0a\u5148\u4e8eB\uff08\u4f8b\u5982\uff0c\"\u5199\u5165X\u7136\u540e\u8bfb\u53d6X\"\uff09\uff0c\u7cfb\u7edf\u4fdd\u8bc1B\u80fd\u770b\u5230A\u7684\u7ed3\u679c\u3002\u4f46\u4e0d\u76f8\u5173\u7684\u64cd\u4f5c\u53ef\u80fd\u4ee5\u4efb\u4f55\u987a\u5e8f\u88ab\u770b\u5230\u3002</li> <li>\u8bfb\u5199\u4e00\u81f4\u6027\uff1a\u7528\u6237\u59cb\u7ec8\u80fd\u7acb\u5373\u770b\u5230\u81ea\u5df1\u7684\u5199\u5165\uff0c\u5373\u4f7f\u5176\u4ed6\u7528\u6237\u770b\u5230\u7684\u662f\u8fc7\u671f\u6570\u636e\u3002\u5927\u591a\u6570\u5e94\u7528\u7a0b\u5e8f\u6240\u9700\u7684\u6700\u5c0f\u4e00\u81f4\u6027\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/01.%20systems%20design%20fundamentals/#_11","title":"\u5f39\u6027\u6a21\u5f0f","text":"<ul> <li>\u901f\u7387\u9650\u5236\uff1a\u9650\u5236\u6bcf\u4e2a\u7528\u6237\u5728\u65f6\u95f4\u7a97\u53e3\u5185\u7684\u8bf7\u6c42\u6570\u3002\u9632\u6b62\u6ee5\u7528\u5e76\u786e\u4fdd\u516c\u5e73\u8bbf\u95ee\u3002\u4f7f\u7528Redis\u4e2d\u7684\u4ee4\u724c\u6876\u6216\u6ed1\u52a8\u7a97\u53e3\u8ba1\u6570\u5668\u5b9e\u73b0\u3002</li> <li>\u65ad\u8def\u5668\uff1a\u5982\u679c\u4e0b\u6e38\u670d\u52a1\u5f00\u59cb\u5931\u8d25\uff08\u9519\u8bef\u7387\u8d85\u8fc7\u9608\u503c\uff09\uff0c\u65ad\u8def\u5668\"\u65ad\u5f00\"\u5e76\u505c\u6b62\u5411\u5176\u53d1\u9001\u8bf7\u6c42\uff08\u7acb\u5373\u8fd4\u56de\u56de\u9000\u54cd\u5e94\uff09\u3002\u8d85\u65f6\u540e\uff0c\"\u534a\u5f00\"\u5e76\u53d1\u9001\u6d4b\u8bd5\u8bf7\u6c42\u3002\u5982\u679c\u6d4b\u8bd5\u6210\u529f\uff0c\u5219\"\u95ed\u5408\"\uff08\u6062\u590d\u6b63\u5e38\u64cd\u4f5c\uff09\u3002\u8fd9\u9632\u6b62\u4e86\u7ea7\u8054\u6545\u969c\uff1a\u5982\u679c\u7279\u5f81\u5b58\u50a8\u5b95\u673a\uff0c\u6a21\u578b\u670d\u52a1\u5668\u8fd4\u56de\u65e0\u7279\u5f81\u7684\u9884\u6d4b\uff0c\u800c\u4e0d\u662f\u6bcf\u6b21\u8bf7\u6c42\u90fd\u8d85\u65f6\u3002</li> <li>\u80cc\u538b\uff1a\u5f53\u7cfb\u7edf\u8fc7\u8f7d\u65f6\uff0c\u5b83\u5411\u4e0a\u6e38\u53d1\u51fa\u4fe1\u53f7\u8981\u6c42\u51cf\u901f\u3002\u4e0e\u5176\u63a5\u53d7\u8bf7\u6c42\u7136\u540e\u5931\u8d25\uff0c\u4e0d\u5982\u5c3d\u65e9\u62d2\u7edd\u591a\u4f59\u7684\u8bf7\u6c42\uff08\u8fd4\u56de429\u6216503\u72b6\u6001\u7801\uff09\u3002\u5ba2\u6237\u7aef\u4ee5\u6307\u6570\u9000\u907f\u91cd\u8bd5\u3002</li> <li>\u6307\u6570\u9000\u907f\u91cd\u8bd5\uff1a\u5982\u679c\u8bf7\u6c42\u5931\u8d25\uff0c\u7b49\u5f851\u79d2\u540e\u91cd\u8bd5\u3002\u5982\u679c\u518d\u6b21\u5931\u8d25\uff0c\u7b49\u5f852\u79d2\u3002\u7136\u540e\u662f4\u79d2\u30018\u79d2\uff0c\u4f9d\u6b64\u7c7b\u63a8\u3002\u52a0\u5165\u968f\u673a\u6296\u52a8\u4ee5\u9632\u6b62\u6240\u6709\u5ba2\u6237\u7aef\u540c\u65f6\u91cd\u8bd5\uff08\u60ca\u7fa4\u95ee\u9898\uff09\u3002</li> <li>\u5e42\u7b49\u6027\uff1a\u5982\u679c\u6267\u884c\u4e24\u6b21\u7684\u6548\u679c\u4e0e\u6267\u884c\u4e00\u6b21\u76f8\u540c\uff0c\u5219\u8be5\u64cd\u4f5c\u662f\u5e42\u7b49\u7684\u3002<code>PUT /user/123 {\"name\": \"Alice\"}</code>\u662f\u5e42\u7b49\u7684\uff08\u5c06\u540d\u79f0\u8bbe\u7f6e\u4e3a\"Alice\"\u4e24\u6b21\u6ca1\u95ee\u9898\uff09\u3002<code>POST /payments</code>\u4e0d\u662f\uff08\u652f\u4ed8\u4e24\u6b21\u5f88\u7cdf\u7cd5\uff09\u3002\u4f7f\u64cd\u4f5c\u5e42\u7b49\u53ef\u786e\u4fdd\u91cd\u8bd5\u662f\u5b89\u5168\u7684\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/02.%20cloud%20computing/","title":"\u4e91\u8ba1\u7b97","text":"<p>\u4e91\u8ba1\u7b97\u4e3aML\u5de5\u4f5c\u8d1f\u8f7d\u63d0\u4f9b\u6309\u9700\u57fa\u7840\u8bbe\u65bd\uff0c\u65e0\u9700\u62e5\u6709\u786c\u4ef6\u3002\u672c\u6587\u4ef6\u6db5\u76d6\u670d\u52a1\u6a21\u578b\u3001\u4e3b\u8981\u4e91\u670d\u52a1\u5546\u3001\u5bb9\u5668\u548cKubernetes\u3001\u5b58\u50a8\u3001\u4e91\u7f51\u7edc\u3001\u65e0\u670d\u52a1\u5668\u8ba1\u7b97\u3001\u6210\u672c\u7ba1\u7406\u548c\u57fa\u7840\u8bbe\u65bd\u5373\u4ee3\u7801</p> <ul> <li>\u8bad\u7ec3\u524d\u6cbf\u6a21\u578b\u9700\u8981\u6570\u5343\u4e2aGPU\u6301\u7eed\u6570\u6708\u3002\u6ca1\u6709\u521d\u521b\u516c\u53f8\u62e5\u6709\u8fd9\u6837\u7684\u786c\u4ef6\u3002\u4e91\u8ba1\u7b97\u8ba9\u4f60\u6309\u5c0f\u65f6\u79df\u8d41\uff0c\u8bad\u7ec3\u65f6\u6269\u5c55\uff0c\u63a8\u7406\u65f6\u7f29\u51cf\uff0c\u53ea\u4e3a\u4f7f\u7528\u91cf\u4ed8\u8d39\u3002\u7406\u89e3\u4e91\u57fa\u7840\u8bbe\u65bd\u5bf9\u4e8e\u4efb\u4f55\u5728\u7b14\u8bb0\u672c\u7535\u8111\u4e4b\u5916\u6784\u5efaML\u7cfb\u7edf\u7684\u4eba\u6765\u8bf4\u90fd\u662f\u5fc5\u4e0d\u53ef\u5c11\u7684\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/02.%20cloud%20computing/#_2","title":"\u4e91\u670d\u52a1\u6a21\u578b","text":"<ul> <li>\u4e91\u670d\u52a1\u6309\u63d0\u4f9b\u5546\u7ba1\u7406\u7a0b\u5ea6\u7684\u5c42\u53e0\u5212\u5206\uff1a</li> </ul> \u6a21\u578b \u4f60\u7ba1\u7406 \u63d0\u4f9b\u5546\u7ba1\u7406 \u793a\u4f8b IaaS\uff08\u57fa\u7840\u8bbe\u65bd\uff09 \u64cd\u4f5c\u7cfb\u7edf\u3001\u8fd0\u884c\u65f6\u3001\u5e94\u7528 \u786c\u4ef6\u3001\u865a\u62df\u5316\u3001\u7f51\u7edc AWS EC2\u3001GCP Compute Engine PaaS\uff08\u5e73\u53f0\uff09 \u5e94\u7528\u3001\u6570\u636e \u64cd\u4f5c\u7cfb\u7edf\u3001\u8fd0\u884c\u65f6\u3001\u6269\u5c55\u3001\u4fee\u8865 AWS SageMaker\u3001GCP Vertex AI SaaS\uff08\u8f6f\u4ef6\uff09 \u4ec0\u4e48\u90fd\u4e0d\u7528\u7ba1\uff08\u53ea\u7ba1\u7528\uff09 \u4e00\u5207 OpenAI API\u3001Weights &amp; Biases FaaS\uff08\u51fd\u6570\uff09 \u5355\u4e2a\u51fd\u6570 \u5176\u4ed6\u6240\u6709 AWS Lambda\u3001GCP Cloud Functions <ul> <li>\u5bf9\u4e8eML\uff1a\u5927\u591a\u6570\u56e2\u961f\u6df7\u5408\u4f7f\u7528\u3002IaaS\u7528\u4e8e\u81ea\u5b9a\u4e49\u8bad\u7ec3\uff08\u5b8c\u5168\u63a7\u5236GPU\u5b9e\u4f8b\uff09\uff0cPaaS\u7528\u4e8e\u6258\u7ba1\u8bad\u7ec3\u548c\u670d\u52a1\uff08SageMaker\u3001Vertex AI\u5904\u7406\u7f16\u6392\uff09\uff0cSaaS\u7528\u4e8e\u5de5\u5177\uff08W&amp;B\u7528\u4e8e\u5b9e\u9a8c\u8ddf\u8e2a\uff0cOpenAI API\u7528\u4e8e\u57fa\u7ebf\u6bd4\u8f83\uff09\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/02.%20cloud%20computing/#_3","title":"\u4e3b\u8981\u4e91\u670d\u52a1\u5546","text":""},{"location":"chapter%2018%3A%20ML%20systems%20design/02.%20cloud%20computing/#aws","title":"AWS\uff08\u4e9a\u9a6c\u900a\u4e91\u670d\u52a1\uff09","text":"<ul> <li>\u6700\u5927\u7684\u4e91\u670d\u52a1\u5546\uff08\u7ea632%\u5e02\u573a\u4efd\u989d\uff09\u3002\u5173\u952eML\u670d\u52a1\uff1a<ul> <li>EC2\uff1a\u865a\u62df\u673a\u3002GPU\u5b9e\u4f8b\uff1ap4d\uff08A100\uff09\u3001p5\uff08H100\uff09\u3001g5\uff08A10G\u7528\u4e8e\u63a8\u7406\uff09\u3002</li> <li>S3\uff1a\u5bf9\u8c61\u5b58\u50a8\u3002\u5b58\u50a8\u6570\u636e\u96c6\u548c\u6a21\u578b\u6743\u91cd\u7684\u6807\u51c6\u3002\u51e0\u4e4e\u65e0\u9650\u7684\u5bb9\u91cf\uff0c\u7ea6$0.023/GB/\u6708\u3002</li> <li>SageMaker\uff1a\u6258\u7ba1ML\u5e73\u53f0\u3002\u5904\u7406\u8bad\u7ec3\u3001\u8d85\u53c2\u6570\u8c03\u4f18\u3001\u90e8\u7f72\u548c\u76d1\u63a7\u3002</li> <li>EKS\uff1a\u6258\u7ba1Kubernetes\u3002</li> <li>Lambda\uff1a\u65e0\u670d\u52a1\u5668\u51fd\u6570\u3002\u4e0d\u9002\u5408GPU\u5de5\u4f5c\u8d1f\u8f7d\uff0c\u4f46\u9002\u7528\u4e8e\u9884\u5904\u7406\u548c\u7f16\u6392\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/02.%20cloud%20computing/#gcp","title":"GCP\uff08\u8c37\u6b4c\u4e91\u5e73\u53f0\uff09","text":"<ul> <li>\u8c37\u6b4c\u7684\u4e91\uff08\u7ea611%\u5e02\u573a\u4efd\u989d\uff09\u3002\u5173\u952eML\u670d\u52a1\uff1a<ul> <li>Compute Engine\uff1a\u865a\u62df\u673a\u3002GPU\u5b9e\u4f8b\u63d0\u4f9bA100\u3001H100\u3002TPU VM\u7528\u4e8eTPU\u8bbf\u95ee\u3002</li> <li>GCS\uff1a\u5bf9\u8c61\u5b58\u50a8\uff08\u7c7b\u4f3cS3\uff09\u3002</li> <li>Vertex AI\uff1a\u6258\u7ba1ML\u5e73\u53f0\u3002\u539f\u751f\u652f\u6301JAX/TPU\u3002</li> <li>GKE\uff1a\u6258\u7ba1Kubernetes\uff08\u6700\u6210\u719f\u7684K8s\u4ea7\u54c1\uff0c\u56e0\u4e3a\u8c37\u6b4c\u521b\u5efa\u4e86Kubernetes\uff09\u3002</li> <li>Cloud TPU\uff1aGCP\u72ec\u6709\u3002v5e\u548cv5p\u7528\u4e8e\u5927\u89c4\u6a21\u8bad\u7ec3\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/02.%20cloud%20computing/#azure","title":"Azure\uff08\u5fae\u8f6f\uff09","text":"<ul> <li>\u5fae\u8f6f\u7684\u4e91\uff08\u7ea623%\u5e02\u573a\u4efd\u989d\uff09\u3002\u5173\u952eML\u670d\u52a1\uff1a<ul> <li>Azure VM\uff1aGPU\u5b9e\u4f8b\u63d0\u4f9bA100\u3001H100\u3002</li> <li>Azure Blob\u5b58\u50a8\uff1a\u5bf9\u8c61\u5b58\u50a8\u3002</li> <li>Azure ML\uff1a\u6258\u7ba1ML\u5e73\u53f0\u3002</li> <li>AKS\uff1a\u6258\u7ba1Kubernetes\u3002</li> <li>OpenAI\u670d\u52a1\uff1a\u901a\u8fc7Azure API\u72ec\u5bb6\u8bbf\u95eeOpenAI\u6a21\u578b\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/02.%20cloud%20computing/#kubernetes","title":"\u5bb9\u5668\u548cKubernetes","text":"<ul> <li>\u6211\u4eec\u5728\u7b2c13\u7ae0\uff08\u64cd\u4f5c\u7cfb\u7edf\uff09\u4e2d\u6982\u5ff5\u6027\u5730\u4ecb\u7ecd\u4e86\u5bb9\u5668\uff08Docker\uff09\u548cKubernetes\uff0c\u5e76\u5728\u7b2c15\u7ae0\uff08\u90e8\u7f72\uff09\u4e2d\u8fdb\u884c\u4e86\u5b9e\u8df5\u3002\u8fd9\u91cc\u6211\u4eec\u5173\u6ce8\u4e91\u7279\u5b9a\u7684\u6a21\u5f0f\uff1a</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/02.%20cloud%20computing/#kubernetesml","title":"Kubernetes\u7528\u4e8eML","text":"<ul> <li>Kubernetes\uff08K8s\uff09\u5927\u89c4\u6a21\u7f16\u6392\u5bb9\u5668\u3002\u5173\u952e\u6982\u5ff5\uff1a<ul> <li>Pod\uff1a\u6700\u5c0f\u7684\u53ef\u90e8\u7f72\u5355\u5143\u3002\u5305\u542b\u4e00\u4e2a\u6216\u591a\u4e2a\u5171\u4eab\u7f51\u7edc\u548c\u5b58\u50a8\u7684\u5bb9\u5668\u3002\u4e00\u4e2a\u6a21\u578b\u670d\u52a1Pod\u53ef\u80fd\u5305\u542b\uff1a\u6a21\u578b\u670d\u52a1\u5668\u5bb9\u5668 + \u7528\u4e8e\u6307\u6807\u6536\u96c6\u7684\u8fb9\u8f66\u5bb9\u5668\u3002</li> <li>Deployment\uff1a\u7ba1\u7406\u4e00\u7ec4\u76f8\u540c\u7684Pod\u3002\u6307\u5b9a\u6240\u9700\u7684\u526f\u672c\u6570\u3002\u5982\u679cPod\u5d29\u6e83\uff0cK8s\u4f1a\u81ea\u52a8\u521b\u5efa\u66ff\u4ee3Pod\u3002</li> <li>Service\uff1a\u4e00\u7ec4Pod\u7684\u7a33\u5b9a\u7f51\u7edc\u7aef\u70b9\u3002\u5ba2\u6237\u7aef\u8fde\u63a5\u5230Service\uff1bK8s\u8def\u7531\u5230\u5065\u5eb7\u7684Pod\u3002\u7c7b\u578b\uff1aClusterIP\uff08\u5185\u90e8\uff09\u3001NodePort\uff08\u901a\u8fc7\u8282\u70b9\u7aef\u53e3\u5bf9\u5916\u66b4\u9732\uff09\u3001LoadBalancer\uff08\u901a\u8fc7\u4e91\u8d1f\u8f7d\u5747\u8861\u5668\u5bf9\u5916\u66b4\u9732\uff09\u3002</li> <li>StatefulSet\uff1a\u7c7b\u4f3cDeployment\u4f46\u7528\u4e8e\u6709\u72b6\u6001\u5de5\u4f5c\u8d1f\u8f7d\u3002\u6bcf\u4e2aPod\u83b7\u5f97\u6301\u4e45\u7684\u8eab\u4efd\u548c\u7a33\u5b9a\u7684\u5b58\u50a8\u3002\u7528\u4e8e\u6570\u636e\u5e93\u548c\u5206\u5e03\u5f0f\u8bad\u7ec3\uff08\u6bcf\u4e2a\u5de5\u4f5c\u8005\u9700\u8981\u7a33\u5b9a\u7684\u8eab\u4efd\u4ee5\u4fbf\u901a\u4fe1\uff09\u3002</li> <li>DaemonSet\uff1a\u5728\u6bcf\u4e2a\u8282\u70b9\u4e0a\u8fd0\u884c\u4e00\u4e2aPod\u3002\u7528\u4e8e\uff1a\u76d1\u63a7\u4ee3\u7406\uff08Prometheus\u8282\u70b9\u5bfc\u51fa\u5668\uff09\u3001\u65e5\u5fd7\u6536\u96c6\u5668\uff08Fluentd\uff09\u3001GPU\u8bbe\u5907\u63d2\u4ef6\uff08NVIDIA\u8bbe\u5907\u63d2\u4ef6\uff09\u3002</li> </ul> </li> <li>K8s\u4e2d\u7684GPU\u8c03\u5ea6\uff1aNVIDIA\u8bbe\u5907\u63d2\u4ef6\u5c06GPU\u66b4\u9732\u4e3aK8s\u8d44\u6e90\u3002Pod\u8bf7\u6c42GPU\uff1a</li> </ul> <pre><code>resources:\n  limits:\n    nvidia.com/gpu: 2  # \u6b64Pod\u9700\u89812\u4e2aGPU\n</code></pre> <ul> <li>K8s\u5c06Pod\u8c03\u5ea6\u5230\u5177\u67092\u4e2a\u53ef\u7528GPU\u7684\u8282\u70b9\u4e0a\u3002\u8fd9\u5c31\u662f\u4e91ML\u5e73\u53f0\u4e3a\u8bad\u7ec3\u548c\u63a8\u7406\u5206\u914dGPU\u7684\u65b9\u5f0f\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/02.%20cloud%20computing/#_4","title":"\u81ea\u52a8\u7f29\u653e","text":"<ul> <li>\u6c34\u5e73Pod\u81ea\u52a8\u7f29\u653e\u5668\uff08HPA\uff09\uff1a\u57fa\u4e8e\u6307\u6807\uff08CPU\u4f7f\u7528\u7387\u3001\u8bf7\u6c42\u7387\u3001\u81ea\u5b9a\u4e49\u6307\u6807\u5982GPU\u5229\u7528\u7387\u6216\u961f\u5217\u6df1\u5ea6\uff09\u7f29\u653ePod\u6570\u91cf\u3002</li> <li>\u96c6\u7fa4\u81ea\u52a8\u7f29\u653e\u5668\uff1a\u7f29\u653e\u8282\u70b9\u6570\u91cf\u3002\u5982\u679c\u7531\u4e8e\u6ca1\u6709\u8db3\u591f\u8282\u70b9\u800c\u65e0\u6cd5\u8c03\u5ea6Pod\uff0c\u96c6\u7fa4\u81ea\u52a8\u7f29\u653e\u5668\u4f1a\u4ece\u4e91\u670d\u52a1\u5546\u5904\u914d\u7f6e\u65b0\u7684VM\u3002\u5f53\u8282\u70b9\u5229\u7528\u4e0d\u8db3\u65f6\uff0c\u5b83\u4f1a\u6392\u7a7a\u5e76\u7ec8\u6b62\u5b83\u4eec\u3002</li> <li>KEDA\uff08Kubernetes\u4e8b\u4ef6\u9a71\u52a8\u81ea\u52a8\u7f29\u653e\uff09\uff1a\u57fa\u4e8e\u5916\u90e8\u4e8b\u4ef6\u6e90\uff08Kafka\u961f\u5217\u6df1\u5ea6\u3001HTTP\u8bf7\u6c42\u7387\uff09\u8fdb\u884c\u7f29\u653e\u3002\u975e\u5e38\u9002\u5408\u63a8\u7406\uff1a\u5f53\u8bf7\u6c42\u961f\u5217\u589e\u957f\u65f6\u6269\u5c55\u6a21\u578b\u670d\u52a1\u5668\uff0c\u5f53\u961f\u5217\u4e3a\u7a7a\u65f6\u7f29\u51cf\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/02.%20cloud%20computing/#_5","title":"\u5b58\u50a8","text":"\u7c7b\u578b \u7279\u6027 \u7528\u9014 \u793a\u4f8b \u5757\u5b58\u50a8 \u4f4e\u5ef6\u8fdf\uff0c\u9644\u52a0\u5230\u5355\u53f0VM \u64cd\u4f5c\u7cfb\u7edf\u78c1\u76d8\u3001\u6570\u636e\u5e93 AWS EBS\u3001GCP Persistent Disk \u5bf9\u8c61\u5b58\u50a8 \u65e0\u9650\u5bb9\u91cf\uff0cHTTP\u8bbf\u95ee \u6570\u636e\u96c6\u3001\u6a21\u578b\u6743\u91cd\u3001\u65e5\u5fd7 AWS S3\u3001GCS\u3001Azure Blob \u6587\u4ef6\u5b58\u50a8 \u8de8VM\u5171\u4eab\uff0cPOSIX \u5171\u4eab\u8bad\u7ec3\u6570\u636e AWS EFS\u3001GCP Filestore\u3001NFS \u6570\u636e\u6e56 \u8bfb\u53d6\u65f6\u5b9a\u4e49\u6a21\u5f0f\uff0c\u539f\u59cb\u6570\u636e \u5206\u6790\u3001\u7279\u5f81\u5de5\u7a0b Delta Lake\u3001Iceberg\u3001Hudi <ul> <li>\u5bf9\u4e8eML\u8bad\u7ec3\uff1a\u6570\u636e\u96c6\u5b58\u50a8\u5728\u5bf9\u8c61\u5b58\u50a8\uff08S3/GCS\uff09\u4e2d\u3002\u8bad\u7ec3\u811a\u672c\u4ece\u5bf9\u8c61\u5b58\u50a8\u8bfb\u53d6\u6570\u636e\u5230\u5185\u5b58\u3002\u5bf9\u4e8e\u5feb\u901f\u968f\u673a\u8bbf\u95ee\uff08\u968f\u673a\u6570\u636e\u52a0\u8f7d\uff09\uff0c\u8981\u4e48\uff1a\uff081\uff09\u5728\u8bad\u7ec3\u524d\u5c06\u6570\u636e\u96c6\u4e0b\u8f7d\u5230\u672c\u5730SSD\uff0c\uff082\uff09\u4f7f\u7528\u9ad8\u541e\u5410\u91cf\u6587\u4ef6\u7cfb\u7edf\uff08Lustre\u3001FSx\uff09\uff0c\u6216\uff083\uff09\u4f7f\u7528\u80fd\u9ad8\u6548\u6d41\u5f0f\u548c\u7f13\u5b58\u7684\u6570\u636e\u5e93\u52a0\u8f7d\u5e93\uff08WebDataset\u3001FFCV\uff09\u3002</li> <li>\u6a21\u578b\u6743\u91cd\uff1a\u5b58\u50a8\u5728\u5e26\u7248\u672c\u7ba1\u7406\u7684\u5bf9\u8c61\u5b58\u50a8\u4e2d\u300270B\u6a21\u578b\u5728FP16\u4e0b\u7ea6140 GB\u3002\u4ee51 GB/s\u7684\u901f\u5ea6\u4eceS3\u52a0\u8f7d\u7ea6\u97002.5\u5206\u949f\u3002\u5728\u672c\u5730SSD\u4e0a\u7f13\u5b58\u53ef\u51cf\u5c11\u63a8\u7406\u7684\u51b7\u542f\u52a8\u65f6\u95f4\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/02.%20cloud%20computing/#_6","title":"\u4e91\u7f51\u7edc","text":"<ul> <li>VPC\uff08\u865a\u62df\u79c1\u6709\u4e91\uff09\uff1a\u4e91\u4e2d\u7684\u9694\u79bb\u7f51\u7edc\u3002\u4f60\u7684VM\u3001\u6570\u636e\u5e93\u548c\u670d\u52a1\u5728VPC\u5185\u90e8\u901a\u4fe1\u3002\u5916\u90e8\u6d41\u91cf\u901a\u8fc7\u8d1f\u8f7d\u5747\u8861\u5668\u6216\u7f51\u5173\u8fdb\u5165\u3002</li> <li>\u5b50\u7f51\uff1a\u5c06VPC\u5212\u5206\u4e3a\u591a\u4e2a\u6bb5\u3002\u516c\u6709\u5b50\u7f51\u53ef\u8bbf\u95ee\u4e92\u8054\u7f51\uff08\u7528\u4e8eAPI\u670d\u52a1\u5668\uff09\u3002\u79c1\u6709\u5b50\u7f51\u4e0d\u53ef\u8bbf\u95ee\uff08\u7528\u4e8e\u6570\u636e\u5e93\u3001GPU\u5de5\u4f5c\u7ebf\u7a0b\uff09\u3002\u8fd9\u662f\u6700\u5c0f\u6743\u9650\u5b89\u5168\u539f\u5219\u5728\u7f51\u7edc\u4e0a\u7684\u7b49\u4ef7\u7269\u3002</li> <li>\u5b89\u5168\u7ec4\uff08AWS\uff09/ \u9632\u706b\u5899\u89c4\u5219\uff08GCP\uff09\uff1a\u63a7\u5236\u5141\u8bb8\u54ea\u4e9b\u6d41\u91cf\u3002\"\u5141\u8bb8\u6765\u81ea\u4efb\u4f55\u5730\u65b9\u7684\u5165\u7ad9HTTP\u7aef\u53e380\u3002\u4ec5\u5141\u8bb8\u6765\u81ea\u6211\u7684IP\u7684\u5165\u7ad9SSH\u7aef\u53e322\u3002\u963b\u6b62\u5176\u4ed6\u6240\u6709\u6d41\u91cf\u3002\"\u5b89\u5168\u7ec4\u914d\u7f6e\u9519\u8bef\u662f\u4e91\u5b89\u5168\u4e8b\u4ef6\u7684\u9996\u8981\u539f\u56e0\u3002</li> <li>\u670d\u52a1\u7f51\u683c\uff08Istio\u3001Envoy\uff09\uff1a\u7ba1\u7406K8s\u5185\u90e8\u7684\u670d\u52a1\u95f4\u901a\u4fe1\u3002\u63d0\u4f9b\uff1amTLS\u52a0\u5bc6\uff08\u6bcf\u6b21\u670d\u52a1\u95f4\u8c03\u7528\u90fd\u52a0\u5bc6\uff09\u3001\u6d41\u91cf\u8def\u7531\uff08A/B\u6d4b\u8bd5\uff1a\u5c0610%\u6d41\u91cf\u8def\u7531\u5230\u65b0\u6a21\u578b\uff09\u3001\u91cd\u8bd5\u3001\u8d85\u65f6\u3001\u65ad\u8def\u548c\u53ef\u89c2\u6d4b\u6027\uff08\u54ea\u4e2a\u670d\u52a1\u8c03\u7528\u4e86\u54ea\u4e2a\uff0c\u82b1\u4e86\u591a\u957f\u65f6\u95f4\uff09\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/02.%20cloud%20computing/#_7","title":"\u65e0\u670d\u52a1\u5668\u8ba1\u7b97","text":"<ul> <li>\u65e0\u670d\u52a1\u5668\uff08AWS Lambda\u3001GCP Cloud Functions\uff09\uff1a\u4f60\u4e0a\u4f20\u4e00\u4e2a\u51fd\u6570\uff0c\u4e91\u670d\u52a1\u5546\u5728\u89e6\u53d1\u65f6\u8fd0\u884c\u5b83\u3002\u65e0\u9700\u7ba1\u7406\u670d\u52a1\u5668\uff0c\u65e0\u9700\u914d\u7f6e\u7f29\u653e\u3002\u6309\u8c03\u7528\u6b21\u6570\u4ed8\u8d39\uff08\u901a\u5e38\u6bcf100\u4e07\u6b21\u8c03\u7528$0.20 + \u8ba1\u7b97\u65f6\u95f4\uff09\u3002</li> <li>\u51b7\u542f\u52a8\uff1a\u4e00\u6bb5\u65f6\u95f4\u4e0d\u6d3b\u52a8\u540e\u7684\u7b2c\u4e00\u6b21\u8c03\u7528\u9700\u8981\u66f4\u957f\u65f6\u95f4\uff08\u670d\u52a1\u5546\u5fc5\u987b\u5206\u914d\u5bb9\u5668\u5e76\u52a0\u8f7d\u4f60\u7684\u4ee3\u7801\uff09\u3002\u51b7\u542f\u52a8\u4e3a0.5-5\u79d2\uff0c\u4f7f\u5f97\u65e0\u670d\u52a1\u5668\u4e0d\u9002\u5408\u5bf9\u5ef6\u8fdf\u654f\u611f\u7684ML\u63a8\u7406\u3002</li> <li>\u5bf9\u4e8eML\uff1a\u65e0\u670d\u52a1\u5668\u9002\u7528\u4e8e\uff1a\u9884\u5904\u7406\uff08\u53d1\u9001\u5230\u6a21\u578b\u524d\u8c03\u6574\u56fe\u50cf\u5927\u5c0f\uff09\u3001\u540e\u5904\u7406\uff08\u683c\u5f0f\u5316\u6a21\u578b\u8f93\u51fa\uff0c\u53d1\u9001\u901a\u77e5\uff09\u3001\u7f16\u6392\uff08\u65b0\u6570\u636e\u5230\u8fbe\u65f6\u89e6\u53d1\u8bad\u7ec3\u6d41\u6c34\u7ebf\uff09\u548c\u8f7b\u91cf\u7ea7\u63a8\u7406\uff08\u80fd\u5bb9\u5fcd\u51b7\u542f\u52a8\u7684\u5c0f\u6a21\u578b\uff09\u3002</li> <li>\u65e0\u670d\u52a1\u5668\u4e0d\u9002\u7528\u4e8e\uff1aGPU\u63a8\u7406\uff08\u5927\u591a\u6570\u65e0\u670d\u52a1\u5668\u5e73\u53f0\u4e0d\u652f\u6301GPU\uff09\u3001\u957f\u65f6\u95f4\u8fd0\u884c\u7684\u8bad\u7ec3\u4f5c\u4e1a\uff08Lambda\u768415\u5206\u949f\u8d85\u65f6\uff09\u6216\u6709\u72b6\u6001\u670d\u52a1\uff08\u8c03\u7528\u4e4b\u95f4\u6ca1\u6709\u6301\u4e45\u72b6\u6001\uff09\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/02.%20cloud%20computing/#_8","title":"\u6210\u672c\u7ba1\u7406","text":"<ul> <li>\u4e91\u6210\u672c\u662fML\u56e2\u961f\u7684\u9996\u8981\u8fd0\u8425\u95ee\u9898\u3002\u5355\u4e2aH100\u5b9e\u4f8b\u7ea6\\(8/\u5c0f\u65f6\u300264-GPU\u8bad\u7ec3\u8fd0\u884c\u7ea6\\)500/\u5c0f\u65f6\u3002\u4e00\u4e2a\u6708\u7684\u8bad\u7ec3\u8fd0\u884c\u7ea6$360,000\u3002\u6210\u672c\u4f18\u5316\u662f\u5de5\u7a0b\u95ee\u9898\uff0c\u4e0d\u662f\u4f1a\u8ba1\u95ee\u9898\u3002</li> <li>\u7ade\u4ef7/\u62a2\u5360\u5f0f\u5b9e\u4f8b\uff1a\u672a\u4f7f\u7528\u7684\u4e91\u5bb9\u91cf\u4ee560-90%\u7684\u6298\u6263\u51fa\u552e\u3002\u670d\u52a1\u5546\u53ef\u572830\u79d2\u52302\u5206\u949f\u901a\u77e5\u540e\u56de\u6536\u3002\u7528\u4e8e\uff1a\u5bb9\u9519\u8bad\u7ec3\uff08\u7ecf\u5e38\u68c0\u67e5\u70b9\uff0c\u5728\u65b0\u5b9e\u4f8b\u4e0a\u6062\u590d\uff09\u3001\u6279\u91cf\u63a8\u7406\u3001\u6570\u636e\u9884\u5904\u7406\u3002\u4e0d\u7528\u4e8e\uff1a\u5bf9\u5ef6\u8fdf\u654f\u611f\u7684\u670d\u52a1\uff08\u4e2d\u65ad=\u505c\u673a\uff09\u3002</li> <li>\u9884\u7559\u5b9e\u4f8b\uff1a\u627f\u8bfa\u4f7f\u75281-3\u5e74\uff0c\u4eab\u53d730-60%\u6298\u6263\u3002\u7528\u4e8e\uff1a\u4f60\u77e5\u9053\u57fa\u7ebf\u8d1f\u8f7d\u7684\u7a33\u6001\u63a8\u7406\u670d\u52a1\u3002</li> <li>\u81ea\u52a8\u7f29\u653e\uff1a\u9ad8\u5cf0\u65f6\u6bb5\u6269\u5c55\uff0c\u591c\u95f4/\u5468\u672b\u7f29\u51cf\u3002\u5cf0\u65f6\u9700\u898110\u4e2aGPU\u3001\u591c\u95f4\u9700\u89812\u4e2a\u7684\u6a21\u578b\u670d\u52a1\u5668\uff0c\u901a\u8fc7\u81ea\u52a8\u7f29\u653e\u76f8\u6bd424/7\u8fd0\u884c10\u4e2aGPU\u53ef\u8282\u7701\u7ea660%\u6210\u672c\u3002</li> <li>\u5408\u7406\u9009\u578b\uff1a\u4e0d\u8981\u57287B\u6a21\u578b\u4e0a\u4f7f\u7528H100\uff0c\u5982\u679c\u5b83\u5728A10G\u4e0a\u8fd0\u884c\u826f\u597d\u3002\u5c06GPU\u5339\u914d\u5230\u5de5\u4f5c\u8d1f\u8f7d\u3002\u4f7f\u7528\u6027\u80fd\u5206\u6790\uff08\u7b2c16\u7ae0\uff09\u786e\u5b9a\u6700\u5408\u9002\u7684GPU\u3002</li> <li>\u5b58\u50a8\u6210\u672c\uff1a\u5bf9\u8c61\u5b58\u50a8\u4fbf\u5b9c\uff08S3\u6807\u51c6\u7ea6$0.023/GB/\u6708\uff09\uff0c\u4f46\u4f1a\u7d2f\u79ef\u3002\u4e00\u4e2a\u56e2\u961f\u5982\u679c\u4fdd\u5b58\u6bcf\u4e2a\u8bad\u7ec3\u68c0\u67e5\u70b9\uff08\u6bcf\u4e2a10 GB\uff0c\u6bcf\u4e2a\u5b9e\u9a8c100\u4e2a\uff0c50\u4e2a\u5b9e\u9a8c\uff09\uff0c\u7d2f\u79ef50 TB = $1,150/\u6708\u3002\u8bbe\u7f6e\u751f\u547d\u5468\u671f\u7b56\u7565\u81ea\u52a8\u5220\u9664\u65e7\u68c0\u67e5\u70b9\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/02.%20cloud%20computing/#_9","title":"\u591a\u533a\u57df\u90e8\u7f72","text":"<ul> <li>\u5bf9\u4e8e\u5168\u7403ML\u7cfb\u7edf\uff08\u670d\u52a1\u5168\u7403\u7528\u6237\uff09\uff0c\u5728\u5355\u4e2a\u533a\u57df\u90e8\u7f72\u610f\u5473\u7740\u8fdc\u7a0b\u7528\u6237\u7684\u9ad8\u5ef6\u8fdf\uff08\u4e1c\u4eac\u7684\u7528\u6237\u8bbf\u95ee\u7f8e\u56fd\u670d\u52a1\u5668\u4f1a\u589e\u52a0\u7ea6150ms\u7684\u7f51\u7edc\u5f80\u8fd4\uff09\u548c\u5355\u70b9\u6545\u969c\uff08\u5982\u679c\u8be5\u533a\u57df\u5b95\u673a\uff0c\u6574\u4e2a\u670d\u52a1\u79bb\u7ebf\uff09\u3002</li> <li>\u591a\u533a\u57df\u6a21\u5f0f\uff1a<ul> <li>\u4e3b\u5907\u6a21\u5f0f\uff1a\u4e00\u4e2a\u4e3b\u533a\u57df\u5904\u7406\u6240\u6709\u6d41\u91cf\u3002\u8f85\u52a9\u533a\u57df\u6709\u70ed\u5907\uff08\u590d\u5236\u6570\u636e\uff0c\u51c6\u5907\u63a5\u6536\u6d41\u91cf\uff09\u3002\u4e3b\u533a\u57df\u6545\u969c\u65f6\uff0cDNS\u5207\u6362\u5230\u8f85\u52a9\u533a\u57df\u3002\u6545\u969c\u8f6c\u79fb\u671f\u95f4\u7684\u505c\u673a\u65f6\u95f4\uff1a30\u79d2\u5230\u51e0\u5206\u949f\u3002</li> <li>\u53cc\u6d3b\u6a21\u5f0f\uff1a\u4e24\u4e2a\u533a\u57df\u540c\u65f6\u5904\u7406\u6d41\u91cf\u3002\u7528\u6237\u88ab\u8def\u7531\u5230\u6700\u8fd1\u7684\u533a\u57df\u3002\u4e24\u4e2a\u533a\u57df\u90fd\u6709\u6700\u65b0\u6570\u636e\uff08\u5f02\u6b65\u6216\u540c\u6b65\u590d\u5236\uff09\u3002\u5355\u533a\u57df\u6545\u969c\u65f6\u65e0\u505c\u673a\u2014\u2014\u6d41\u91cf\u81ea\u52a8\u91cd\u65b0\u8def\u7531\u3002</li> </ul> </li> <li>\u6570\u636e\u590d\u5236\uff1a\u56f0\u96be\u7684\u90e8\u5206\u3002\u6a21\u578b\u6743\u91cd\u53ef\u4ee5\u8f7b\u677e\u590d\u5236\uff08\u590d\u5236\u5230\u6bcf\u4e2a\u533a\u57df\u7684S3\uff09\u3002\u7279\u5f81\u5b58\u50a8\u6570\u636e\u5fc5\u987b\u4ee5\u53ef\u63a5\u53d7\u7684\u9648\u65e7\u5ea6\u590d\u5236\u3002\u7528\u6237\u6570\u636e\u53ef\u80fd\u6709\u6570\u636e\u9a7b\u7559\u8981\u6c42\uff08GDPR\uff1a\u6b27\u6d32\u7528\u6237\u6570\u636e\u5fc5\u987b\u7559\u5728\u6b27\u6d32\uff09\u3002</li> <li>GPU\u4e91\u4ef7\u683c\u6bd4\u8f83\uff082026\u5e74\u8fd1\u4f3c\u503c\uff09\uff1a</li> </ul> GPU AWS GCP Azure \u5178\u578b\u7528\u9014 A10G\uff0824 GB\uff09 $1.00/\u5c0f\u65f6\uff08g5\uff09 $0.90/\u5c0f\u65f6 $0.90/\u5c0f\u65f6 \u5c0f\u6a21\u578b\u63a8\u7406 A100\uff0880 GB\uff09 $4.10/\u5c0f\u65f6\uff08p4d\uff09 $3.70/\u5c0f\u65f6 $3.40/\u5c0f\u65f6 \u8bad\u7ec3\u3001\u5927\u578b\u63a8\u7406 H100\uff0880 GB\uff09 $8.00/\u5c0f\u65f6\uff08p5\uff09 $7.50/\u5c0f\u65f6 $7.00/\u5c0f\u65f6 \u524d\u6cbf\u8bad\u7ec3 TPU v5e \u65e0 $1.20/\u5c0f\u65f6 \u65e0 JAX\u5927\u89c4\u6a21\u8bad\u7ec3 <ul> <li>\u7ade\u4ef7/\u62a2\u5360\u5f0f\u5b9a\u4ef7\u901a\u5e38\u6bd4\u8fd9\u4e9b\u4ef7\u683c\u4f4e60-70%\u3002\u4ef7\u683c\u56e0\u533a\u57df\u548c\u53ef\u7528\u6027\u800c\u5f02\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/02.%20cloud%20computing/#_10","title":"\u57fa\u7840\u8bbe\u65bd\u5373\u4ee3\u7801","text":"<ul> <li>IaC\u5728\u7248\u672c\u63a7\u5236\u7684\u914d\u7f6e\u6587\u4ef6\u4e2d\u5b9a\u4e49\u57fa\u7840\u8bbe\u65bd\uff08VM\u3001\u7f51\u7edc\u3001\u6570\u636e\u5e93\u3001K8s\u96c6\u7fa4\uff09\u3002\u4e0d\u662f\u5728AWS\u63a7\u5236\u53f0\u4e2d\u70b9\u51fb\u6309\u94ae\uff0c\u800c\u662f\u7f16\u5199\u4ee3\u7801\u63cf\u8ff0\u4f60\u60f3\u8981\u7684\u5185\u5bb9\uff0c\u7136\u540e\u5de5\u5177\u521b\u5efa\u5b83\u3002</li> <li>Terraform\uff08HashiCorp\uff09\uff1a\u6807\u51c6\u7684IaC\u5de5\u5177\u3002\u9002\u7528\u4e8e\u6240\u6709\u4e3b\u8981\u4e91\u670d\u52a1\u5546\u3002\u58f0\u660e\u5f0f\uff1a\u4f60\u63cf\u8ff0\u671f\u671b\u72b6\u6001\uff0cTerraform\u8ba1\u7b97\u9700\u8981\u521b\u5efa/\u4fee\u6539/\u5220\u9664\u4ec0\u4e48\u4ee5\u8fbe\u5230\u8be5\u72b6\u6001\u3002</li> </ul> <pre><code># main.tf \u2014 \u521b\u5efa\u7528\u4e8e\u63a8\u7406\u7684GPU VM\nresource \"aws_instance\" \"model_server\" {\n  ami           = \"ami-0abcdef1234567890\"  # \u6df1\u5ea6\u5b66\u4e60AMI\n  instance_type = \"g5.xlarge\"               # A10G GPU\n\n  tags = {\n    Name = \"model-server-prod\"\n  }\n}\n\nresource \"aws_s3_bucket\" \"model_weights\" {\n  bucket = \"my-model-weights-prod\"\n\n  versioning {\n    enabled = true\n  }\n}\n</code></pre> <pre><code>terraform init      # \u4e0b\u8f7d\u63d0\u4f9b\u5546\u63d2\u4ef6\nterraform plan      # \u663e\u793a\u5c06\u8981\u66f4\u6539\u7684\u5185\u5bb9\nterraform apply     # \u521b\u5efa\u57fa\u7840\u8bbe\u65bd\nterraform destroy   # \u5168\u90e8\u62c6\u9664\n</code></pre> <ul> <li>IaC\u4e3a\u4f55\u91cd\u8981\uff1a\u53ef\u91cd\u73b0\u6027\uff08\u4ece\u4ee3\u7801\u91cd\u5efa\u6574\u4e2a\u57fa\u7840\u8bbe\u65bd\uff09\u3001\u5ba1\u8ba1\uff08git\u5386\u53f2\u663e\u793a\u8c01\u66f4\u6539\u4e86\u4ec0\u4e48\uff09\u3001\u707e\u96be\u6062\u590d\uff08\u4ece\u540c\u4e00\u914d\u7f6e\u5728\u4e0d\u540c\u533a\u57df\u91cd\u5efa\uff09\u548c\u73af\u5883\u4e00\u81f4\u6027\uff08\u5f00\u53d1\u3001\u9884\u53d1\u5e03\u548c\u751f\u4ea7\u4f7f\u7528\u76f8\u540c\u6a21\u677f\uff0c\u4ec5\u53c2\u6570\u4e0d\u540c\uff09\u3002</li> <li>Pulumi\uff1a\u7c7b\u4f3cTerraform\uff0c\u4f46\u4f7f\u7528\u771f\u6b63\u7684\u7f16\u7a0b\u8bed\u8a00\uff08Python\u3001TypeScript\u3001Go\uff09\u800c\u4e0d\u662fHCL\u3002\u5f53\u57fa\u7840\u8bbe\u65bd\u903b\u8f91\u590d\u6742\u65f6\uff08\u6761\u4ef6\u3001\u5faa\u73af\u3001\u52a8\u6001\u914d\u7f6e\uff09\u5f88\u6709\u7528\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/","title":"\u5927\u89c4\u6a21\u57fa\u7840\u8bbe\u65bd","text":"<p>\u6784\u5efa\u670d\u52a1\u6570\u767e\u4e07\u7528\u6237\u7684\u7cfb\u7edf\u9700\u8981\u7684\u4e0d\u53ea\u662f\u5355\u4e2a\u670d\u52a1\u5668\u3002\u672c\u6587\u4ef6\u6db5\u76d6\u53ef\u6269\u5c55\u6027\u6a21\u5f0f\u3001\u5206\u5e03\u5f0f\u7cfb\u7edf\u57fa\u7840\u3001\u5fae\u670d\u52a1\u3001\u6570\u636e\u6d41\u6c34\u7ebf\u3001\u6570\u636e\u5e93\u6269\u5c55\u3001\u641c\u7d22\u548c\u5411\u91cf\u7cfb\u7edf\u3001\u53ef\u89c2\u6d4b\u6027\u3001\u53ef\u9760\u6027\u5de5\u7a0b\u4ee5\u53caCI/CD</p> <ul> <li>\u6bcf\u79d2\u670d\u52a11\u4e2a\u8bf7\u6c42\u7684\u6a21\u578b\u53ef\u4ee5\u5728\u7b14\u8bb0\u672c\u7535\u8111\u4e0a\u8fd0\u884c\u3002\u6bcf\u79d2\u670d\u52a1100,000\u4e2a\u8bf7\u6c42\u4e14\u53ef\u7528\u6027\u8fbe\u523099.9%\u9700\u8981\u5206\u5e03\u5f0f\u7cfb\u7edf\u3001\u81ea\u52a8\u6545\u969c\u8f6c\u79fb\u548c\u7cbe\u5fc3\u8bbe\u8ba1\u7684\u6570\u636e\u6d41\u6c34\u7ebf\u3002\u672c\u6587\u4ef6\u6db5\u76d6\u5f25\u5408\u8fd9\u4e00\u5dee\u8ddd\u7684\u6a21\u5f0f\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/#_2","title":"\u53ef\u6269\u5c55\u6027","text":"<ul> <li>\u5782\u76f4\u6269\u5c55\uff08\u5411\u4e0a\u6269\u5c55\uff09\uff1a\u6362\u66f4\u5927\u7684\u673a\u5668\u3002\u66f4\u591aCPU\u3001\u66f4\u591a\u5185\u5b58\u3001\u66f4\u5927\u7684GPU\u3002\u7b80\u5355\u4f46\u6709\u786c\u6027\u9650\u5236\uff08\u6700\u5927\u7684\u53ef\u7528\u673a\u5668\uff09\u548c\u5355\u70b9\u6545\u969c\u3002</li> <li>\u6c34\u5e73\u6269\u5c55\uff08\u5411\u5916\u6269\u5c55\uff09\uff1a\u589e\u52a0\u66f4\u591a\u673a\u5668\u3002\u6bcf\u53f0\u5904\u7406\u4e00\u90e8\u5206\u6d41\u91cf\u3002\u6ca1\u6709\u5355\u673a\u9650\u5236\uff0c\u4f46\u9700\u8981\uff1a\u8d1f\u8f7d\u5747\u8861\uff08\u6587\u4ef601\uff09\u3001\u6570\u636e\u5206\u533a\u548c\u5904\u7406\u5206\u5e03\u5f0f\u72b6\u6001\u3002</li> <li>\u65e0\u72b6\u6001\u670d\u52a1\u9ed8\u8ba4\u662f\u53ef\u6c34\u5e73\u6269\u5c55\u7684\u3002\u5728\u8d1f\u8f7d\u5747\u8861\u5668\u540e\u9762\u6dfb\u52a0\u66f4\u591a\u5b9e\u4f8b\u5373\u53ef\u3002\u5728\u542f\u52a8\u65f6\u52a0\u8f7d\u6743\u91cd\u5e76\u72ec\u7acb\u5904\u7406\u8bf7\u6c42\u7684\u6a21\u578b\u63a8\u7406\u670d\u52a1\u5668\u662f\u65e0\u72b6\u6001\u7684\u2014\u2014\u4efb\u4f55\u5b9e\u4f8b\u90fd\u53ef\u4ee5\u5904\u7406\u4efb\u4f55\u8bf7\u6c42\u3002</li> <li>\u6709\u72b6\u6001\u670d\u52a1\uff08\u6570\u636e\u5e93\u3001KV\u7f13\u5b58\u3001\u7279\u5f81\u5b58\u50a8\uff09\u66f4\u96be\u6269\u5c55\u3002\u72b6\u6001\u5fc5\u987b\u5728\u591a\u53f0\u673a\u5668\u95f4\u5206\u533a\uff08\u5206\u7247\uff0c\u6587\u4ef601\uff09\u5e76\u590d\u5236\u4ee5\u5b9e\u73b0\u5bb9\u9519\u3002</li> <li>\u53ef\u6269\u5c55\u6027\u65b9\u7a0b\uff1a\u5bf9\u4e8e\u4e00\u4e2a\u6709\\(n\\)\u53f0\u670d\u52a1\u5668\u7684\u7cfb\u7edf\uff1a<ul> <li>\u7406\u60f3\u60c5\u51b5\uff1a\u541e\u5410\u91cf\u7ebf\u6027\u6269\u5c55\uff08\\(n\\)\u53f0\u670d\u52a1\u5668\u2192\\(n\\times\\)\u541e\u5410\u91cf\uff09\u3002</li> <li>\u5b9e\u9645\u60c5\u51b5\uff1a\u534f\u8c03\u3001\u8d1f\u8f7d\u5747\u8861\u548c\u6570\u636e\u4f20\u8f93\u7684\u5f00\u9500\u610f\u5473\u7740\u541e\u5410\u91cf\u4e9a\u7ebf\u6027\u6269\u5c55\u3002\u963f\u59c6\u8fbe\u5c14\u5b9a\u5f8b\uff08\u7b2c13\u7ae0\uff09\u9002\u7528\uff1a\u4e32\u884c\u90e8\u5206\uff08\u5171\u4eab\u72b6\u6001\u3001\u534f\u8c03\uff09\u9650\u5236\u4e86\u52a0\u901f\u6bd4\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/#_3","title":"\u5206\u5e03\u5f0f\u7cfb\u7edf","text":"<ul> <li>\u5206\u5e03\u5f0f\u7cfb\u7edf\u662f\u4e00\u7ec4\u534f\u8c03\u63d0\u4f9b\u670d\u52a1\u5668\u7684\u673a\u5668\u3002\u57fa\u672c\u6311\u6218\uff1a</li> <li>\u7f51\u7edc\u5206\u533a\uff1a\u673a\u5668\u4e0d\u80fd\u603b\u662f\u901a\u4fe1\u3002\u7f51\u7ebf\u88ab\u5207\u65ad\u3001\u4ea4\u6362\u673a\u6545\u969c\u3001\u6570\u636e\u4e2d\u5fc3\u65ad\u7535\u3002\u7cfb\u7edf\u5fc5\u987b\u5904\u7406\u90e8\u5206\u6545\u969c\u3002</li> <li>\u65f6\u949f\u504f\u5dee\uff1a\u673a\u5668\u6709\u4e0d\u540c\u7684\u65f6\u949f\u3002\"\u4e8b\u4ef6A\u53d1\u751f\u5728\u673a\u56681\u768410:00:01\"\u548c\"\u4e8b\u4ef6B\u53d1\u751f\u5728\u673a\u56682\u768410:00:01\"\u5e76\u4e0d\u610f\u5473\u5b83\u4eec\u540c\u65f6\u53d1\u751f\u3002\u903b\u8f91\u65f6\u949f\uff08Lamport\u65f6\u95f4\u6233\u3001\u5411\u91cf\u65f6\u949f\uff09\u5efa\u7acb\u6392\u5e8f\u800c\u4e0d\u4f9d\u8d56\u7269\u7406\u65f6\u949f\u3002</li> <li>\u5171\u8bc6\uff1a\u591a\u53f0\u673a\u5668\u5982\u4f55\u5c31\u67d0\u4e2a\u503c\u8fbe\u6210\u4e00\u81f4\uff08\u4f8b\u5982\uff0c\u8c01\u662f\u9886\u5bfc\u8005\uff09\uff1fRaft\u662f\u6807\u51c6\u7684\u5171\u8bc6\u7b97\u6cd5\u3002\u4e00\u7ec4\u8282\u70b9\u9009\u4e3e\u4e00\u4e2a\u9886\u5bfc\u8005\u3002\u9886\u5bfc\u8005\u5904\u7406\u6240\u6709\u5199\u5165\u3002\u5982\u679c\u9886\u5bfc\u8005\u5931\u8d25\uff0c\u5269\u4f59\u8282\u70b9\u9009\u4e3e\u65b0\u7684\u9886\u5bfc\u8005\u3002\u9700\u8981\u591a\u6570\uff085\u4e2a\u8282\u70b9\u4e2d\u76843\u4e2a\uff09\u624d\u80fd\u8fd0\u884c\uff0c\u56e0\u6b64\u80fd\u5bb9\u5fcd\\(\\lfloor(n-1)/2\\rfloor\\)\u4e2a\u6545\u969c\u3002</li> <li>\u5206\u5e03\u5f0f\u9501\uff1a\u786e\u4fdd\u53ea\u6709\u4e00\u53f0\u673a\u5668\u6267\u884c\u5173\u952e\u64cd\u4f5c\u3002Redlock\uff08\u57fa\u4e8eRedis\uff09\u8de8\u591a\u4e2aRedis\u5b9e\u4f8b\u83b7\u53d6\u9501\u3002\u5982\u679c\u591a\u6570\u5b9e\u4f8b\u6388\u4e88\u9501\uff0c\u5219\u83b7\u53d6\u6210\u529f\u3002\u7528\u4e8e\uff1a\u9632\u6b62\u91cd\u590d\u7684\u6a21\u578b\u90e8\u7f72\uff0c\u786e\u4fdd\u53ea\u6709\u4e00\u4e2a\u8bad\u7ec3\u4f5c\u4e1a\u5199\u5165\u68c0\u67e5\u70b9\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/#_4","title":"\u5fae\u670d\u52a1","text":"<ul> <li>\u5fae\u670d\u52a1\u5c06\u7cfb\u7edf\u5206\u89e3\u4e3a\u5c0f\u578b\u3001\u72ec\u7acb\u53ef\u90e8\u7f72\u7684\u670d\u52a1\u3002\u6bcf\u4e2a\u670d\u52a1\u62e5\u6709\u4e00\u4e2a\u9886\u57df\uff1a</li> </ul> <pre><code>\u250c\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2510  \u250c\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2510  \u250c\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2510\n\u2502 API\u7f51\u5173     \u2502\u2192 \u2502 \u7279\u5f81\u670d\u52a1     \u2502\u2192 \u2502 \u7279\u5f81\u6570\u636e\u5e93   \u2502\n\u2514\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2518  \u2514\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2518  \u2514\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2518\n       \u2502\n       \u251c\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2192 \u250c\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2510  \u250c\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2510\n       \u2502          \u2502 \u6a21\u578b\u670d\u52a1     \u2502\u2192 \u2502 \u6a21\u578b\u5b58\u50a8     \u2502\n       \u2502          \u2514\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2518  \u2514\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2518\n       \u2502\n       \u2514\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2192 \u250c\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2510  \u250c\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2510\n                  \u2502 \u65e5\u5fd7\u670d\u52a1     \u2502\u2192 \u2502 \u65e5\u5fd7\u5b58\u50a8     \u2502\n                  \u2514\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2518  \u2514\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2518\n</code></pre> <ul> <li>\u4f18\u70b9\uff1a\u72ec\u7acb\u90e8\u7f72\uff08\u66f4\u65b0\u6a21\u578b\u670d\u52a1\u800c\u4e0d\u5f71\u54cd\u7279\u5f81\u670d\u52a1\uff09\u3001\u72ec\u7acb\u7f29\u653e\uff08\u6839\u636e\u8bf7\u6c42\u8d1f\u8f7d\u7f29\u653e\u6a21\u578b\u670d\u52a1\u5668\uff0c\u6839\u636e\u7279\u5f81\u5b58\u50a8\u8bfb\u53d6\u7387\u7f29\u653e\u7279\u5f81\u670d\u52a1\u5668\uff09\u3001\u6280\u672f\u81ea\u7531\uff08\u6a21\u578b\u670d\u52a1\u7528Python\uff0c\u7279\u5f81\u670d\u52a1\u7528Go\uff09\u3002</li> <li>\u7f3a\u70b9\uff1a\u7f51\u7edc\u5f00\u9500\uff08\u6bcf\u6b21\u670d\u52a1\u8c03\u7528\u90fd\u662f\u7f51\u7edc\u5f80\u8fd4\uff09\u3001\u590d\u6742\u6027\uff08\u8c03\u8bd5\u8de8\u8d8a\u591a\u4e2a\u670d\u52a1\uff09\u3001\u6570\u636e\u4e00\u81f4\u6027\uff08\u6ca1\u6709\u8de8\u670d\u52a1\u7684\u4e8b\u52a1\uff09\u3002</li> <li>\u670d\u52a1\u53d1\u73b0\uff1aAPI\u7f51\u5173\u5982\u4f55\u627e\u5230\u6a21\u578b\u670d\u52a1\uff1f\u9009\u9879\uff1a\u57fa\u4e8eDNS\uff08\u6bcf\u4e2a\u670d\u52a1\u6ce8\u518c\u4e00\u4e2aDNS\u540d\uff09\u3001K8s\u670d\u52a1\uff08\u5185\u7f6e\uff09\u6216\u670d\u52a1\u6ce8\u518c\u8868\uff08Consul\u3001Eureka\uff09\u3002</li> <li>Saga\u6a21\u5f0f\uff1a\u5bf9\u4e8e\u8de8\u591a\u4e2a\u670d\u52a1\u7684\u64cd\u4f5c\uff08\u521b\u5efa\u7528\u6237+\u5206\u914d\u8d44\u6e90+\u53d1\u9001\u6b22\u8fce\u90ae\u4ef6\uff09\uff0c\u4f7f\u7528saga\uff1a\u4e00\u7cfb\u5217\u672c\u5730\u4e8b\u52a1\uff0c\u5982\u679c\u4efb\u4f55\u6b65\u9aa4\u5931\u8d25\u5219\u6267\u884c\u8865\u507f\u64cd\u4f5c\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/#_5","title":"\u6570\u636e\u6d41\u6c34\u7ebf","text":"<ul> <li>ML\u7cfb\u7edf\u6d88\u8017\u5927\u91cf\u6570\u636e\u3002\u6570\u636e\u6d41\u6c34\u7ebf\u79fb\u52a8\u3001\u8f6c\u6362\u548c\u670d\u52a1\u8fd9\u4e9b\u6570\u636e\uff1a</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/#_6","title":"\u6279\u5904\u7406","text":"<ul> <li>\u6309\u56fa\u5b9a\u95f4\u9694\uff08\u6bcf\u5c0f\u65f6\u3001\u6bcf\u5929\uff09\u5904\u7406\u5927\u91cf\u6570\u636e\u3002</li> <li>MapReduce\uff1a\u539f\u59cb\u7684\u6279\u5904\u7406\u8303\u5f0f\u3002Map\uff08\u72ec\u7acb\u8f6c\u6362\u6bcf\u6761\u8bb0\u5f55\uff09\u2192 Shuffle\uff08\u6309\u952e\u5206\u7ec4\uff09\u2192 Reduce\uff08\u6309\u7ec4\u805a\u5408\uff09\u3002\u6982\u5ff5\u4e0a\u7b80\u5355\u4f46\u5b9e\u73b0\u7e41\u7410\u3002</li> <li>Apache Spark\uff1a\u73b0\u4ee3\u6279\u5904\u7406\u5f15\u64ce\u3002\u5185\u5b58\u5904\u7406\uff08\u5bf9\u4e8e\u8fed\u4ee3\u7b97\u6cd5\u6bd4MapReduce\u5feb100\u500d\uff09\u3002\u652f\u6301SQL\u3001DataFrame\u548cML\u6d41\u6c34\u7ebf\u3002\u5927\u89c4\u6a21\u7279\u5f81\u5de5\u7a0b\u7684\u6807\u51c6\u3002</li> <li>\u793a\u4f8b\uff1a\u4e3a\u63a8\u8350\u7cfb\u7edf\u8ba1\u7b97\u7528\u6237\u7279\u5f81\u3002\u8f93\u5165\uff1a\u8fc7\u53bb30\u5929\u768410\u4ebf\u7528\u6237\u6d3b\u52a8\u4e8b\u4ef6\u3002\u8f93\u51fa\uff1a1\u4ebf\u7528\u6237\u7279\u5f81\u5411\u91cf\u3002\u6bcf\u5929\u4f5c\u4e3aSpark\u4f5c\u4e1a\u8fd0\u884c\uff0c\u8f93\u51fa\u5230\u7279\u5f81\u5b58\u50a8\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/#_7","title":"\u6d41\u5904\u7406","text":"<ul> <li>\u5b9e\u65f6\u5904\u7406\u5230\u8fbe\u7684\u6570\u636e\uff08\u4e9a\u79d2\u7ea7\u5ef6\u8fdf\uff09\u3002</li> <li>Apache Flink\uff1a\u9886\u5148\u7684\u6d41\u5904\u7406\u5f15\u64ce\u3002\u7cbe\u786e\u4e00\u6b21\u5904\u7406\u3001\u4e8b\u4ef6\u65f6\u95f4\u5904\u7406\uff08\u6309\u4e8b\u4ef6\u53d1\u751f\u65f6\u95f4\u5904\u7406\uff0c\u800c\u975e\u5230\u8fbe\u65f6\u95f4\uff09\u3001\u7a97\u53e3\u5316\uff08\u6eda\u52a8\u3001\u6ed1\u52a8\u3001\u4f1a\u8bdd\u7a97\u53e3\uff09\u3002</li> <li>Kafka Streams\uff1a\u5185\u7f6e\u4e8eKafka\u7684\u8f7b\u91cf\u7ea7\u6d41\u5904\u7406\u3002\u9002\u7528\u4e8e\u7b80\u5355\u8f6c\u6362\uff08\u8fc7\u6ee4\u3001\u805a\u5408\uff09\uff0c\u65e0\u9700\u90e8\u7f72\u5355\u72ec\u7684\u96c6\u7fa4\u3002</li> <li>\u793a\u4f8b\uff1a\u5b9e\u65f6\u6b3a\u8bc8\u68c0\u6d4b\u3002\u6bcf\u7b14\u4fe1\u7528\u5361\u4ea4\u6613\u662f\u4e00\u4e2aKafka\u4e8b\u4ef6\u3002Flink\u4f5c\u4e1a\u8ba1\u7b97\u8fd0\u884c\u7edf\u8ba1\uff08\u4ea4\u6613\u9891\u7387\u3001\u4f4d\u7f6e\u53d8\u5316\uff09\u5e76\u5728100ms\u5185\u6807\u8bb0\u5f02\u5e38\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/#lambda","title":"Lambda\u67b6\u6784","text":"<ul> <li>\u7ed3\u5408\u6279\u5904\u7406\u548c\u6d41\u5904\u7406\u3002\u6279\u5904\u7406\u5c42\u63d0\u4f9b\u51c6\u786e\u3001\u5168\u9762\u7684\u7ed3\u679c\uff08\u4f46\u6709\u5ef6\u8fdf\uff09\u3002\u901f\u5ea6\u5c42\u63d0\u4f9b\u8fd1\u4f3c\u3001\u5b9e\u65f6\u7684\u7ed3\u679c\u3002\u670d\u52a1\u5c42\u5408\u5e76\u4e24\u8005\u3002</li> <li>\u5b9e\u9645\u4e0a\uff0c\u8bb8\u591a\u56e2\u961f\u73b0\u5728\u4f7f\u7528Kappa\u67b6\u6784\uff1a\u4ec5\u6d41\u5904\u7406\uff0c\u5c06\u6d41\u89c6\u4e3a\u4e8b\u5b9e\u6765\u6e90\u3002\u6d41\u662f\u53ef\u91cd\u64ad\u7684\uff08Kafka\u4fdd\u7559\u4e8b\u4ef6\uff09\uff0c\u56e0\u6b64\u53ef\u4ee5\u901a\u8fc7\u91cd\u64ad\u6d41\u6765\u6a21\u62df\u6279\u5904\u7406\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/#ml","title":"ML\u8bad\u7ec3\u57fa\u7840\u8bbe\u65bd","text":"<ul> <li>\u8bad\u7ec3\u524d\u6cbf\u6a21\u578b\uff08100B+\u53c2\u6570\uff09\u662f\u4e00\u4e2a\u5927\u89c4\u6a21\u57fa\u7840\u8bbe\u65bd\u95ee\u9898\uff1a\u6570\u5343\u4e2aGPU\u8fd0\u884c\u6570\u6708\uff0c\u6d88\u8017\u5146\u74e6\u7ea7\u7535\u529b\uff0c\u751f\u6210PB\u7ea7\u6570\u636e\uff0c\u82b1\u8d39\u6570\u5343\u4e07\u7f8e\u5143\u3002\u57fa\u7840\u8bbe\u65bd\u51b3\u5b9a\u4e86\u8bad\u7ec3\u6210\u529f\u8fd8\u662f\u5931\u8d25\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/#gpu","title":"GPU\u96c6\u7fa4","text":"<ul> <li>\u8bad\u7ec3\u96c6\u7fa4\u662f\u7531\u9ad8\u901f\u7f51\u7edc\u8fde\u63a5\u7684GPU\u670d\u52a1\u5668\u96c6\u5408\u3002\u5173\u952e\u7ec4\u4ef6\uff1a</li> </ul> <ul> <li>GPU\u670d\u52a1\u5668\uff08\u8282\u70b9\uff09\uff1a\u6bcf\u53f0\u670d\u52a1\u5668\u67094-8\u4e2aGPU\u3002\u5178\u578b\u914d\u7f6e\uff1a8\u00d7H100 GPU\u30012\u00d7AMD EPYC CPU\u30012 TB RAM\u300130 TB NVMe SSD\u3002\u8282\u70b9\u5185\u7684GPU\u901a\u8fc7NVLink\u8fde\u63a5\uff08H100\u4e0a\u6bcf\u4e2aGPU 900 GB/s\uff09\uff0c\u6bd4PCIe\u5feb30\u500d\u3002</li> <li>\u96c6\u7fa4\u89c4\u6a21\uff1a\u5c0f\u578b\u8bad\u7ec3\u96c6\u7fa4\u670964-256\u4e2aGPU\uff088-32\u4e2a\u8282\u70b9\uff09\u3002\u524d\u6cbf\u6a21\u578b\u8bad\u7ec3\u96c6\u7fa4\u67094,000-32,000\u4e2aGPU\uff08500-4000\u4e2a\u8282\u70b9\uff09\u3002Meta\u7684Llama 3\u4f7f\u7528\u4e8616,384\u4e2aH100 GPU\u3002Google\u5728\u62e5\u67098,000+\u4e2a\u82af\u7247\u7684TPU pod\u4e0a\u8bad\u7ec3\u3002</li> <li>\u7c97\u7565\u4f30\u7b97\uff1a\u8bad\u7ec370B\u6a21\u578b\u9700\u8981\u7ea6\\(200\u4e07\u3002\u8bad\u7ec3400B+\u524d\u6cbf\u6a21\u578b\u9700\u8981\u7ea6\\)5000\u4e07-\\(1\u4ebf\u3002\u96c6\u7fa4\u786c\u4ef6\u672c\u8eab\u5728H100\u4ef7\u683c\u4e0b\u7ea6\\)5\u4ebf-\\(10\u4ebf\uff08\\)3\u4e07/GPU \u00d7 16,000 GPU = $4.8\u4ebf\uff09\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/#_8","title":"\u7f51\u7edc\u62d3\u6251","text":"<ul> <li>GPU\u8282\u70b9\u4e4b\u95f4\u7684\u7f51\u7edc\u662f\u6700\u5173\u952e\u7684\u57fa\u7840\u8bbe\u65bd\u7ec4\u4ef6\u3002\u5982\u679cGPU\u4e0d\u80fd\u8db3\u591f\u5feb\u5730\u4ea4\u6362\u68af\u5ea6\uff0c\u5b83\u4eec\u5c31\u4f1a\u95f2\u7f6e\u7b49\u5f85\u901a\u4fe1\u5b8c\u6210\u3002</li> <li>InfiniBand\u662fGPU\u96c6\u7fa4\u7f51\u7edc\u7684\u6807\u51c6\u3002NVIDIA\u7684Quantum-2 InfiniBand\u63d0\u4f9b\u6bcf\u4e2a\u7aef\u53e3400 Gb/s\u3002\u6bcf\u4e2a\u8282\u70b9\u901a\u5e38\u67098\u4e2aInfiniBand\u7aef\u53e3\uff08\u6bcf\u4e2aGPU\u4e00\u4e2a\uff09\uff0c\u6bcf\u4e2a\u8282\u70b9\u7684\u603b\u5bf9\u5206\u5e26\u5bbd\u4e3a400 GB/s\u3002</li> <li>RDMA\uff08\u8fdc\u7a0b\u76f4\u63a5\u5185\u5b58\u8bbf\u95ee\uff09\uff1aInfiniBand\u652f\u6301RDMA\uff0c\u5b83\u76f4\u63a5\u5728\u8282\u70b9\u95f4\u7684GPU\u5185\u5b58\u4e4b\u95f4\u4f20\u8f93\u6570\u636e\uff0c\u65e0\u9700CPU\u53c2\u4e0e\u3002\u8fd9\u5c06\u5ef6\u8fdf\u4ece\u7ea6100\u03bcs\uff08TCP\uff09\u964d\u4f4e\u5230\u7ea61\u03bcs\uff0c\u5bf9\u4e8e\u9ad8\u6548\u7684\u68af\u5ea6\u5168\u89c4\u7ea6\uff08\u7b2c6\u7ae0\uff09\u81f3\u5173\u91cd\u8981\u3002</li> <li>\u7f51\u7edc\u62d3\u6251\u5f88\u91cd\u8981\uff1a\u80d6\u6811\uff08Clos\u7f51\u7edc\uff09\u63d0\u4f9b\u5168\u5bf9\u5206\u5e26\u5bbd\uff08\u4efb\u4f55GPU\u53ef\u4ee5\u4e0e\u5176\u4ed6\u4efb\u4f55GPU\u4ee5\u5168\u901f\u901a\u4fe1\uff09\u3002\u66f4\u4fbf\u5b9c\u7684\u62d3\u6251\uff08\u8f68\u9053\u4f18\u5316\u30013D\u73af\u9762\uff09\u63d0\u4f9b\u8f83\u5c11\u7684\u5e26\u5bbd\u4f46\u6210\u672c\u66f4\u4f4e\u3002\u62d3\u6251\u5fc5\u987b\u5339\u914d\u5e76\u884c\u7b56\u7565\uff1a<ul> <li>\u6570\u636e\u5e76\u884c\uff1a\u8de8\u6240\u6709GPU\u7684\u5168\u89c4\u7ea6\u2192\u9700\u8981\u9ad8\u5bf9\u5206\u5e26\u5bbd\uff08\u80d6\u6811\uff09\u3002</li> <li>\u5f20\u91cf\u5e76\u884c\uff1a\u8282\u70b9\u5185\u901a\u4fe1\u2192NVLink\u5904\u7406\u6b64\u9700\u6c42\uff08\u4e0d\u9700\u8981\u7f51\u7edc\uff09\u3002</li> <li>\u6d41\u6c34\u7ebf\u5e76\u884c\uff1a\u76f8\u90bb\u6d41\u6c34\u7ebf\u9636\u6bb5\u4e4b\u95f4\u7684\u901a\u4fe1\u2192\u53ea\u9700\u8981\u7279\u5b9a\u8282\u70b9\u5bf9\u4e4b\u95f4\u7684\u5e26\u5bbd\uff08\u8f68\u9053\u4f18\u5316\u5373\u53ef\uff09\u3002</li> </ul> </li> <li>\u4ee5\u592a\u7f51\u66ff\u4ee3\u65b9\u6848\uff1aRoCE v2\uff08\u878d\u5408\u4ee5\u592a\u7f51\u4e0a\u7684RDMA\uff09\u5728\u6807\u51c6\u4ee5\u592a\u7f51\u57fa\u7840\u8bbe\u65bd\u4e0a\u63d0\u4f9bRDMA\u3002\u6bd4InfiniBand\u4fbf\u5b9c\uff0c\u4f46\u5ef6\u8fdf\u66f4\u9ad8\u4e14\u66f4\u6613\u62e5\u585e\u3002Google\u5728\u67d0\u4e9bTPU pod\u7f51\u7edc\u4e2d\u4f7f\u7528RoCE\u3002\u8d85\u4ee5\u592a\u7f51\u8054\u76df\u6b63\u5728\u5f00\u53d1\u7528\u4e8eAI\u5de5\u4f5c\u8d1f\u8f7d\u7684\u65e0\u635f\u4ee5\u592a\u7f51\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/#_9","title":"\u8bad\u7ec3\u5b58\u50a8","text":"<ul> <li>\u8bad\u7ec3\u9700\u8981\u4e09\u4e2a\u5b58\u50a8\u5c42\u7ea7\uff1a<ul> <li>\u6570\u636e\u96c6\u5b58\u50a8\uff1a\u8bad\u7ec3\u8bed\u6599\uff081-100 TB\u6587\u672c\uff0c\u6216PB\u7ea7\u591a\u6a21\u6001\u6570\u636e\uff09\u3002\u5b58\u50a8\u5728\u5206\u5e03\u5f0f\u6587\u4ef6\u7cfb\u7edf\u6216\u5bf9\u8c61\u5b58\u50a8\u4e2d\u3002\u5fc5\u987b\u652f\u6301\u9ad8\u541e\u5410\u91cf\u987a\u5e8f\u8bfb\u53d6\uff08\u6570\u636e\u52a0\u8f7d\u5668\u4ee5\u5927\u6279\u91cf\u8bfb\u53d6\u6570\u636e\uff09\u3002Lustre\u548cGPFS\u662f\u5e38\u89c1\u7684HPC\u6587\u4ef6\u7cfb\u7edf\uff1b\u4e91\u66ff\u4ee3\u65b9\u6848\u5305\u62ecFSx for Lustre\uff08AWS\uff09\u548cFilestore\uff08GCP\uff09\u3002</li> <li>\u68c0\u67e5\u70b9\u5b58\u50a8\uff1a\u8bad\u7ec3\u72b6\u6001\uff08\u6a21\u578b\u6743\u91cd+\u4f18\u5316\u5668\u72b6\u6001+\u8c03\u5ea6\u5668\u72b6\u6001\uff09\u5b9a\u671f\u4fdd\u5b58\u3002\u5bf9\u4e8e\u4f7f\u7528Adam\u4f18\u5316\u5668\u7684\u6df7\u5408\u7cbe\u5ea670B\u6a21\u578b\uff1a\u6bcf\u4e2a\u68c0\u67e5\u70b9\u7ea6560 GB\uff0870B \u00d7 4\u5b57\u8282 \u00d7 2\u7528\u4e8e\u4f18\u5316\u5668\uff09\u3002\u6bcf\u5c0f\u65f6\u4fdd\u5b58\u4e00\u6b21\uff0c\u8fd0\u884c3\u4e2a\u6708=\u7ea62000\u4e2a\u68c0\u67e5\u70b9=1.1 PB\u3002\u5b9e\u9645\u4e0a\uff0c\u53ea\u4fdd\u7559\u6700\u65b0\u7684N\u4e2a\u68c0\u67e5\u70b9\uff0c\u65e7\u7684\u4f1a\u88ab\u5220\u9664\u3002\u5fc5\u987b\u8db3\u591f\u5feb\uff0c\u4f7f\u68c0\u67e5\u70b9\u4e0d\u4f1a\u663e\u8457\u62d6\u6162\u8bad\u7ec3\u3002</li> <li>\u65e5\u5fd7\u548c\u6307\u6807\uff1a\u5b9e\u9a8c\u8ddf\u8e2a\u6570\u636e\uff08\u635f\u5931\u66f2\u7ebf\u3001\u5b66\u4e60\u7387\u8ba1\u5212\u3001\u68af\u5ea6\u8303\u6570\uff09\u3002\u76f8\u5bf9\u8f83\u5c0f\u4f46\u5fc5\u987b\u5b9e\u65f6\u5199\u5165\u3002W&amp;B\u3001MLflow\u6216TensorBoard\u5904\u7406\u6b64\u9700\u6c42\u3002</li> </ul> </li> <li>\u5b58\u50a8\u74f6\u9888\uff1a\u4e00\u4e2a16,000-GPU\u96c6\u7fa4\u52a0\u8f7d\u4e00\u4e2a\u8bad\u7ec3\u6279\u6b21\u9700\u8981\u6301\u7eed\u8bfb\u53d6\u7ea6100 GB/s\u7684\u6570\u636e\u3002\u5982\u679c\u6587\u4ef6\u7cfb\u7edf\u65e0\u6cd5\u7ef4\u6301\u6b64\u541e\u5410\u91cf\uff0cGPU\u5c06\u95f2\u7f6e\u7b49\u5f85\u6570\u636e\u3002\u6570\u636e\u6d41\u6c34\u7ebf\u4f18\u5316\uff08\u9884\u53d6\u3001\u7f13\u5b58\u3001\u4f7f\u7528WebDataset\u6216Mosaic Streaming\u8fdb\u884c\u683c\u5f0f\u4f18\u5316\uff09\u81f3\u5173\u91cd\u8981\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/#_10","title":"\u4f5c\u4e1a\u8c03\u5ea6","text":"<ul> <li>GPU\u96c6\u7fa4\u670d\u52a1\u4e8e\u591a\u4e2a\u56e2\u961f\u548c\u9879\u76ee\u3002\u4f5c\u4e1a\u8c03\u5ea6\u5668\u5c06GPU\u5206\u914d\u7ed9\u8bad\u7ec3\u4f5c\u4e1a\uff1a</li> <li>SLURM\uff1a\u6807\u51c6\u7684HPC\u4f5c\u4e1a\u8c03\u5ea6\u5668\u3002\u7528\u6237\u63d0\u4ea4\u4f5c\u4e1a\uff0c\u6307\u5b9aGPU\u6570\u91cf\u3001\u5185\u5b58\u548c\u65f6\u95f4\u9650\u5236\u3002SLURM\u5206\u914d\u8d44\u6e90\u5e76\u7ba1\u7406\u961f\u5217\u3002\u652f\u6301\u57fa\u4e8e\u4f18\u5148\u7ea7\u7684\u8c03\u5ea6\u3001\u62a2\u5360\u548c\u56e2\u961f\u95f4\u7684\u516c\u5e73\u4efd\u989d\u5206\u914d\u3002</li> <li>\u5e26GPU\u8c03\u5ea6\u7684Kubernetes\uff08\u7b2c18\u7ae0\u6587\u4ef602\uff09\uff1a\u4e91\u539f\u751f\u65b9\u6cd5\u3002K8s GPU\u8bbe\u5907\u63d2\u4ef6\u5c06GPU\u66b4\u9732\u4e3a\u53ef\u8c03\u5ea6\u8d44\u6e90\u3002Volcano\u548cRun:ai\u589e\u52a0\u4e86ML\u7279\u5b9a\u7684\u8c03\u5ea6\u529f\u80fd\uff1a\u7fa4\u4f53\u8c03\u5ea6\uff08\u4e00\u6b21\u4e3a\u4e00\u4e2a\u4f5c\u4e1a\u5206\u914d\u6240\u6709GPU\uff0c\u800c\u4e0d\u662f\u9010\u4e2a\u5206\u914d\uff09\u3001\u4f18\u5148\u7ea7\u961f\u5217\u548cGPU\u65f6\u95f4\u5171\u4eab\u3002</li> <li>\u8c03\u5ea6\u6311\u6218\uff1a<ul> <li>\u788e\u7247\u5316\uff1a\u4e00\u4e2a\u62e5\u67091000\u4e2aGPU\u7684\u96c6\u7fa4\u53ef\u80fd\u6709200\u4e2a\u7a7a\u95f2\uff0c\u4f46\u5206\u5e03\u572850\u4e2a\u8282\u70b9\u4e0a\uff08\u6bcf\u4e2a\u8282\u70b94\u4e2a\u7a7a\u95f2\uff09\u3002\u9700\u8981128\u4e2a\u8fde\u7eedGPU\u7684\u4f5c\u4e1a\u65e0\u6cd5\u8fd0\u884c\uff0c\u5373\u4f7f\u6709\u8db3\u591f\u7684\u603bGPU\u6570\u3002\u53bb\u788e\u7247\u5316\uff08\u8fc1\u79fb\u4f5c\u4e1a\u4ee5\u5408\u5e76\u7a7a\u95f2GPU\uff09\u6216\u62d3\u6251\u611f\u77e5\u8c03\u5ea6\uff08\u5206\u914d\u8fde\u63a5\u826f\u597d\u7684GPU\uff09\u53ef\u4ee5\u89e3\u51b3\u6b64\u95ee\u9898\u3002</li> <li>\u4f18\u5148\u7ea7\u548c\u62a2\u5360\uff1a\u7d27\u6025\u5b9e\u9a8c\u5e94\u62a2\u5360\u4f4e\u4f18\u5148\u7ea7\u4f5c\u4e1a\u3002\u4f46\u62a2\u5360\u4e00\u4e2a\u5df2\u8fd0\u884c2\u5929\u7684\u8bad\u7ec3\u4f5c\u4e1a\u4f1a\u6d6a\u8d39\u8ba1\u7b97\u8d44\u6e90\u3002\u8c03\u5ea6\u5668\u5fc5\u987b\u5728\u4f18\u5148\u7ea7\u548c\u6548\u7387\u4e4b\u95f4\u53d6\u5f97\u5e73\u8861\u3002</li> <li>\u516c\u5e73\u4efd\u989d\uff1a\u56e2\u961f\u5e94\u5728\u4e00\u6bb5\u65f6\u95f4\u5185\u83b7\u5f97\u5176\u5206\u914d\u7684\u8ba1\u7b97\u4efd\u989d\uff0c\u5373\u4f7f\u4e00\u4e2a\u56e2\u961f\u63d0\u4ea4\u7684\u4f5c\u4e1a\u8d85\u8fc7\u5176\u4efd\u989d\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/#_11","title":"\u5bb9\u9519","text":"<ul> <li>\u5728\u6570\u5343\u4e2aGPU\u8fd0\u884c\u6570\u6708\u7684\u89c4\u6a21\u4e0b\uff0c\u786c\u4ef6\u6545\u969c\u4e0d\u662f\u5f02\u5e38\u2014\u2014\u800c\u662f\u5e38\u6001\u300216,000-GPU\u96c6\u7fa4\u7684\u5e73\u5747\u6545\u969c\u95f4\u9694\u65f6\u95f4\u4ee5\u5c0f\u65f6\u8ba1\uff0c\u800c\u975e\u6708\u3002</li> <li>\u5e38\u89c1\u6545\u969c\uff1aGPU\u5185\u5b58\u9519\u8bef\uff08ECC\u53ef\u7ea0\u6b63\u548c\u4e0d\u53ef\u7ea0\u6b63\uff09\u3001NVLink\u6545\u969c\uff08\u8282\u70b9\u5185GPU\u5230GPU\u901a\u4fe1\uff09\u3001InfiniBand\u94fe\u8def\u6545\u969c\uff08\u8282\u70b9\u5230\u8282\u70b9\u901a\u4fe1\uff09\u3001\u8282\u70b9\u5d29\u6e83\uff08\u5185\u6838\u6050\u614c\u3001PSU\u6545\u969c\uff09\u548c\u5b58\u50a8\u6545\u969c\uff08\u78c1\u76d8\u6216\u63a7\u5236\u5668\u6545\u969c\uff09\u3002</li> <li>\u68c0\u67e5\u70b9\u662f\u4e3b\u8981\u7684\u9632\u5fa1\u624b\u6bb5\u3002\u6bcfN\u6b65\u4fdd\u5b58\u5b8c\u6574\u7684\u8bad\u7ec3\u72b6\u6001\uff08\u6a21\u578b\u3001\u4f18\u5316\u5668\u3001\u6570\u636e\u52a0\u8f7d\u5668\u4f4d\u7f6e\uff09\u3002\u6545\u969c\u65f6\uff1a\u8bc6\u522b\u6545\u969c\u8282\u70b9\uff0c\u66ff\u6362\u6216\u79fb\u9664\u5b83\uff0c\u4ece\u6700\u8fd1\u7684\u68c0\u67e5\u70b9\u6062\u590d\u8bad\u7ec3\u3002\u6545\u969c\u7684\u4ee3\u4ef7\u662f\u6700\u540e\u4e00\u6b21\u68c0\u67e5\u70b9\u548c\u6545\u969c\u4e4b\u95f4\u7684\u8ba1\u7b97\u91cf\u3002</li> <li>\u68c0\u67e5\u70b9\u9891\u7387\u6743\u8861\uff1a\u9891\u7e41\u68c0\u67e5\u70b9\uff08\u6bcf10\u5206\u949f\uff09\u5728\u6545\u969c\u65f6\u6d6a\u8d39\u66f4\u5c11\u7684\u8ba1\u7b97\uff0c\u4f46\u4f1a\u51cf\u6162\u8bad\u7ec3\uff08\u4fdd\u5b58560 GB\u9700\u8981\u65f6\u95f4\uff09\u3002\u4e0d\u9891\u7e41\u68c0\u67e5\u70b9\uff08\u6bcf2\u5c0f\u65f6\uff09\u66f4\u5feb\uff0c\u4f46\u6545\u969c\u65f6\u6d6a\u8d39\u591a\u8fbe2\u5c0f\u65f6\u7684\u8ba1\u7b97\u3002\u5927\u591a\u6570\u56e2\u961f\u6bcf20-60\u5206\u949f\u68c0\u67e5\u4e00\u6b21\u3002</li> <li>\u5f39\u6027\u8bad\u7ec3\uff1a\u73b0\u4ee3\u6846\u67b6\uff08PyTorch Elastic\u3001DeepSpeed\uff09\u652f\u6301\u5728\u4e0d\u91cd\u542f\u7684\u60c5\u51b5\u4e0b\u8c03\u6574\u8bad\u7ec3\u89c4\u6a21\u3002\u5982\u679c500\u4e2a\u8282\u70b9\u4e2d\u67092\u4e2a\u8282\u70b9\u6545\u969c\uff0c\u8bad\u7ec3\u7ee7\u7eed\u4f7f\u7528498\u4e2a\u8282\u70b9\u3002\u6545\u969c\u8282\u70b9\u88ab\u66ff\u6362\uff0c\u8bad\u7ec3\u5728\u5b83\u4eec\u91cd\u65b0\u4e0a\u7ebf\u65f6\u81ea\u52a8\u7eb3\u5165\u3002</li> <li>\u5065\u5eb7\u76d1\u63a7\uff1a\u6301\u7eed\u76d1\u63a7\u6240\u6709GPU\uff08\u6e29\u5ea6\u3001\u5185\u5b58\u9519\u8bef\u3001\u8ba1\u7b97\u541e\u5410\u91cf\uff09\u3001\u7f51\u7edc\u94fe\u8def\uff08\u4e22\u5305\u3001\u5ef6\u8fdf\uff09\u548c\u5b58\u50a8\uff08\u541e\u5410\u91cf\u3001\u9519\u8bef\u7387\uff09\u3002\u5f02\u5e38\u65f6\u81ea\u52a8\u544a\u8b66\u3002\u4e00\u4e9b\u96c6\u7fa4\u8fd0\u884c\u5b9a\u671fGPU\u5065\u5eb7\u68c0\u67e5\uff08\u4e00\u4e2a\u7b80\u77ed\u7684\u8ba1\u7b97\u6d4b\u8bd5\uff09\u4ee5\u4e3b\u52a8\u8bc6\u522b\u5728\u6545\u969c\u524d\u6027\u80fd\u4e0b\u964d\u7684\u786c\u4ef6\u3002</li> <li>\u5927\u89c4\u6a21\u573a\u666f\uff1a\u8bad\u7ec3Meta\u7684Llama 3\uff0816,384\u4e2aH100\uff0c54\u5929\uff09\u7ecf\u5386\u4e86\u7ea6466\u6b21\u4f5c\u4e1a\u4e2d\u65ad\u3002\u6709\u6548\u8bad\u7ec3\u65f6\u95f4\u4ec5\u4e3a\u6302\u949f\u65f6\u95f4\u7684\u7ea690%\u2014\u201410%\u635f\u5931\u4e8e\u6545\u969c\u548c\u6062\u590d\u3002\u5b9e\u73b090%\uff08\u800c\u975e50%\u621670%\uff09\u7684\u57fa\u7840\u8bbe\u65bd\u662f\u533a\u5206\u80fd\u8bad\u7ec3\u524d\u6cbf\u6a21\u578b\u7684\u7ec4\u7ec7\u548c\u4e0d\u80fd\u8bad\u7ec3\u7684\u7ec4\u7ec7\u7684\u5173\u952e\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/#_12","title":"\u6210\u672c\u548c\u6548\u7387","text":"<ul> <li>\u8bad\u7ec3\u57fa\u7840\u8bbe\u65bd\u6210\u672c\u7531GPU\u5c0f\u65f6\u4e3b\u5bfc\uff1a</li> </ul> \u7ec4\u4ef6 \u5360\u603b\u6210\u672c\u767e\u5206\u6bd4 GPU\u8ba1\u7b97 70-80% \u7f51\u7edc\uff08InfiniBand\uff09 10-15% \u5b58\u50a8 5-10% \u51b7\u5374\u548c\u7535\u6e90 5-10% <ul> <li>GPU\u5229\u7528\u7387\uff08\u6a21\u578bFLOPs\u5229\u7528\u7387\uff0cMFU\uff09\u8861\u91cfGPU\u7406\u8bba\u5cf0\u503c\u6027\u80fd\u4e2d\u6709\u591a\u5c11\u88ab\u7528\u4e8e\u5b9e\u9645\u6709\u7528\u8ba1\u7b97\u3002H100\u5cf0\u503c\u4e3a989 TFLOPS\uff08FP8\uff09\u3002\u8fbe\u523040-50% MFU\u7b97\u826f\u597d\uff1b50-60%\u7b97\u4f18\u79c0\u3002\u5dee\u8ddd\u6765\u81ea\uff1a\u901a\u4fe1\u5f00\u9500\uff08\u5168\u89c4\u7ea6\u3001\u6d41\u6c34\u7ebf\u6c14\u6ce1\uff09\u3001\u5185\u5b58\u5e26\u5bbd\u9650\u5236\u4ee5\u53ca\u68c0\u67e5\u70b9\u548c\u6570\u636e\u52a0\u8f7d\u671f\u95f4\u7684\u95f2\u7f6e\u65f6\u95f4\u3002</li> <li>\u63d0\u9ad8MFU\uff1a\u91cd\u53e0\u8ba1\u7b97\u548c\u901a\u4fe1\uff08\u7b2c6\u7ae0\uff09\u3001\u4f7f\u7528\u9ad8\u6548\u6ce8\u610f\u529b\uff08Flash Attention\uff0c\u7b2c16\u7ae0\uff09\u3001\u4f18\u5316\u6570\u636e\u52a0\u8f7d\uff08\u9632\u6b62GPU\u9965\u997f\uff09\u3001\u51cf\u5c11\u68c0\u67e5\u70b9\u5f00\u9500\uff08\u5f02\u6b65\u68c0\u67e5\u70b9\uff0c\u5148\u68c0\u67e5\u5230\u5feb\u901fNVMe\uff0c\u7136\u540e\u540e\u53f0\u590d\u5236\u5230\u6301\u4e45\u5b58\u50a8\uff09\u3002</li> <li>\u81ea\u5efavs\u79df\u7528\uff1a\u5728\u5c0f\u89c4\u6a21\uff08&lt;256\u4e2aGPU\uff09\u4e0b\uff0c\u4e91\u66f4\u4fbf\u5b9c\uff08\u65e0\u524d\u671f\u6210\u672c\uff0c\u6309\u5c0f\u65f6\u4ed8\u8d39\uff09\u3002\u5728\u5927\u89c4\u6a21\uff08&gt;1000\u4e2aGPU\uff0c\u6301\u7eed\u4f7f\u75286+\u4e2a\u6708\uff09\u4e0b\uff0c\u62e5\u6709\u786c\u4ef6\u66f4\u4fbf\u5b9c\uff083\u5e74\u5185TCO\u4f4e\u7ea62-3\u500d\uff09\u3002\u5927\u591a\u6570AI\u516c\u53f8\u6df7\u5408\u4f7f\u7528\uff1a\u81ea\u6709\u96c6\u7fa4\u7528\u4e8e\u6301\u7eed\u8bad\u7ec3\uff0c\u4e91\u7528\u4e8e\u7a81\u53d1\u5bb9\u91cf\u548c\u5b9e\u9a8c\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/#_13","title":"\u6570\u636e\u5e93\u6269\u5c55","text":"<ul> <li>\u53ea\u8bfb\u526f\u672c\uff1a\u5c06\u8bfb\u53d6\u67e5\u8be2\u8def\u7531\u5230\u4e3b\u6570\u636e\u5e93\u7684\u526f\u672c\u3002\u4e3b\u5e93\u5904\u7406\u5199\u5165\uff0c\u526f\u672c\u5904\u7406\u8bfb\u53d6\u3002\u7531\u4e8e\u5927\u591a\u6570\u5de5\u4f5c\u8d1f\u8f7d\u662f\u8bfb\u53d6\u5bc6\u96c6\u578b\u7684\uff0895%+\u8bfb\u53d6\uff09\uff0c\u8fd9\u4f7f\u8bfb\u53d6\u541e\u5410\u91cf\u968f\u526f\u672c\u6570\u91cf\u7ebf\u6027\u6269\u5c55\u3002</li> <li>\u5206\u533a\uff08\u5206\u7247\uff0c\u6765\u81ea\u6587\u4ef601\uff09\uff1a\u5c06\u6570\u636e\u5206\u5272\u5230\u591a\u4e2a\u6570\u636e\u5e93\u3002\u6bcf\u4e2a\u5206\u533a\u662f\u72ec\u7acb\u7684\uff0c\u652f\u6301\u5e76\u884c\u8bfb\u53d6\u548c\u5199\u5165\u3002\u6311\u6218\u662f\u8de8\u5206\u533a\u67e5\u8be2\uff08\u8fde\u63a5\u6765\u81ea\u4e0d\u540c\u5206\u7247\u7684\u6570\u636e\uff09\u3002</li> <li>\u8fde\u63a5\u6c60\uff1a\u6570\u636e\u5e93\u6709\u6709\u9650\u7684\u8fde\u63a5\u5bb9\u91cf\u3002\u8fde\u63a5\u6c60\uff08PostgreSQL\u7684PgBouncer\uff09\u5728\u8bf7\u6c42\u95f4\u590d\u7528\u8fde\u63a5\uff0c\u9632\u6b62\u5f53\u6570\u767e\u4e2a\u670d\u52a1\u5b9e\u4f8b\u5404\u81ea\u5c1d\u8bd5\u8fde\u63a5\u65f6\u51fa\u73b0\u8fde\u63a5\u8017\u5c3d\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/#_14","title":"\u641c\u7d22\u548c\u5411\u91cf\u7cfb\u7edf","text":""},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/#_15","title":"\u6587\u672c\u641c\u7d22","text":"<ul> <li>\u5012\u6392\u7d22\u5f15\uff1a\u6587\u672c\u641c\u7d22\u7684\u57fa\u7840\u3002\u5bf9\u6bcf\u4e2a\u5355\u8bcd\uff0c\u5b58\u50a8\u5305\u542b\u8be5\u5355\u8bcd\u7684\u6587\u6863\u5217\u8868\u3002\u67e5\u8be2\u5bf9\u6bcf\u4e2a\u67e5\u8be2\u8bcd\u7684\u5217\u8868\u6c42\u4ea4\u96c6\u3002Elasticsearch\u662f\u6807\u51c6\uff1a\u5206\u5e03\u5f0f\u3001\u5b9e\u65f6\u3001\u652f\u6301\u5168\u6587\u641c\u7d22\u3001\u805a\u5408\u548c\u5730\u7406\u7a7a\u95f4\u67e5\u8be2\u3002</li> <li>BM25\uff1a\u6807\u51c6\u6587\u672c\u68c0\u7d22\u8bc4\u5206\u51fd\u6570\u3002\u6839\u636e\u8bcd\u9891\u3001\u9006\u6587\u6863\u9891\u7387\u548c\u6587\u6863\u957f\u5ea6\u5f52\u4e00\u5316\u5bf9\u6587\u6863\u8bc4\u5206\u3002\u7b80\u5355\u800c\u6709\u6548\u2014\u2014\u5bf9\u4e8e\u5173\u952e\u8bcd\u5bc6\u96c6\u578b\u67e5\u8be2\u4ecd\u7136\u80fd\u4e0e\u795e\u7ecf\u65b9\u6cd5\u7ade\u4e89\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/#_16","title":"\u5411\u91cf\u641c\u7d22","text":"<ul> <li>\u5411\u91cf\u6570\u636e\u5e93\u5b58\u50a8\u5d4c\u5165\uff08\u9ad8\u7ef4\u5411\u91cf\uff09\u5e76\u652f\u6301\u5feb\u901f\u8fd1\u4f3c\u6700\u8fd1\u90bb\uff08ANN\uff09\u641c\u7d22\u3002\u7ed9\u5b9a\u4e00\u4e2a\u67e5\u8be2\u5d4c\u5165\uff0c\u627e\u5230\\(k\\)\u4e2a\u6700\u76f8\u4f3c\u7684\u5b58\u50a8\u5d4c\u5165\u3002</li> <li>FAISS\uff08Facebook AI\u76f8\u4f3c\u6027\u641c\u7d22\uff09\uff1a\u4e00\u4e2a\u7528\u4e8eANN\u641c\u7d22\u7684\u5e93\uff08\u800c\u975e\u6570\u636e\u5e93\uff09\u3002\u652f\u6301\u591a\u79cd\u7d22\u5f15\u7c7b\u578b\uff1a<ul> <li>Flat\uff1a\u7cbe\u786e\u641c\u7d22\uff0c\\(O(n)\\)\u3002\u7528\u4e8e\u5c0f\u6570\u636e\u96c6\u6216\u4f5c\u4e3a\u57fa\u51c6\u3002</li> <li>IVF\uff08\u5012\u6392\u6587\u4ef6\uff09\uff1a\u5c06\u5411\u91cf\u5206\u533a\u5230\u7c07\u4e2d\uff0c\u4ec5\u641c\u7d22\u6700\u8fd1\u7684\u7c07\u3002\u6bcf\u4e2a\u67e5\u8be2\\(O(n/k)\\)\u3002</li> <li>HNSW\uff08\u5206\u5c42\u53ef\u5bfc\u822a\u5c0f\u4e16\u754c\uff09\uff1a\u57fa\u4e8e\u56fe\u3002\u6784\u5efa\u5206\u5c42\u56fe\uff0c\u4ece\u7c97\u5230\u7ec6\u5bfc\u822a\u3002\u6781\u5feb\u4e14\u51c6\u786e\uff0c\u662f\u5927\u591a\u6570\u5e94\u7528\u7684\u9ed8\u8ba4\u9009\u62e9\u3002</li> <li>\u4e58\u79ef\u91cf\u5316\uff08PQ\uff09\uff1a\u5c06\u5411\u91cf\u538b\u7f29\u4e3a\u7d27\u51d1\u7f16\u7801\u4ee5\u5b9e\u73b0\u5185\u5b58\u9ad8\u6548\u641c\u7d22\u3002\u7528\u51c6\u786e\u5ea6\u6362\u53d6\u5185\u5b58\u3002</li> </ul> </li> <li>\u6258\u7ba1\u5411\u91cf\u6570\u636e\u5e93\uff1aPinecone\u3001Weaviate\u3001Milvus\u3001Qdrant\u3002\u5b83\u4eec\u5904\u7406FAISS\u4e0d\u5177\u5907\u7684\u6269\u5c55\u3001\u590d\u5236\u548c\u5b9e\u65f6\u66f4\u65b0\u3002</li> <li>\u5bf9\u4e8eRAG\uff08\u68c0\u7d22\u589e\u5f3a\u751f\u6210\uff09\uff1a\u7528\u6237\u67e5\u8be2\u2192\u7528\u6587\u672c\u7f16\u7801\u5668\u5d4c\u5165\u2192\u641c\u7d22\u5411\u91cf\u6570\u636e\u5e93\u4ee5\u627e\u5230\u76f8\u5173\u6587\u6863\u2192\u5c06\u68c0\u7d22\u5230\u7684\u6587\u6863\u524d\u7f6e\u5230LLM\u63d0\u793a\u4e2d\u3002\u68c0\u7d22\u8d28\u91cf\u76f4\u63a5\u51b3\u5b9aLLM\u54cd\u5e94\u7684\u8d28\u91cf\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/#_17","title":"\u53ef\u89c2\u6d4b\u6027","text":"<ul> <li>\u53ef\u89c2\u6d4b\u6027\u662f\u4ece\u7cfb\u7edf\u5916\u90e8\u8f93\u51fa\u7406\u89e3\u7cfb\u7edf\u5185\u90e8\u72b6\u6001\u7684\u80fd\u529b\u3002\u4e09\u5927\u652f\u67f1\uff1a</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/#_18","title":"\u65e5\u5fd7","text":"<ul> <li>\u7ed3\u6784\u5316\u65e5\u5fd7\uff08JSON\uff09\u662f\u53ef\u641c\u7d22\u548c\u53ef\u89e3\u6790\u7684\u3002\u975e\u7ed3\u6784\u5316\u65e5\u5fd7\uff08\"ERROR: something failed\"\uff09\u5219\u4e0d\u662f\u3002\u59cb\u7ec8\u8bb0\u5f55\uff1a\u65f6\u95f4\u6233\u3001\u670d\u52a1\u540d\u3001\u8bf7\u6c42ID\uff08\u7528\u4e8e\u8de8\u670d\u52a1\u8ffd\u8e2a\uff09\u3001\u4e25\u91cd\u7ea7\u522b\u548c\u76f8\u5173\u4e0a\u4e0b\u6587\u3002</li> <li>ELK\u6808\uff08Elasticsearch\u3001Logstash\u3001Kibana\uff09\uff1a\u6807\u51c6\u65e5\u5fd7\u6d41\u6c34\u7ebf\u3002Logstash\u6536\u96c6\u548c\u8f6c\u6362\u65e5\u5fd7\uff0cElasticsearch\u5efa\u7acb\u7d22\u5f15\uff0cKibana\u53ef\u89c6\u5316\u548c\u641c\u7d22\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/#_19","title":"\u6307\u6807","text":"<ul> <li>\u6307\u6807\u662f\u968f\u65f6\u95f4\u53d8\u5316\u7684\u6570\u503c\u6d4b\u91cf\uff1a\u8bf7\u6c42\u7387\u3001\u9519\u8bef\u7387\u3001\u5ef6\u8fdf\u767e\u5206\u4f4d\u6570\u3001GPU\u5229\u7528\u7387\u3001\u961f\u5217\u6df1\u5ea6\u3002Prometheus\u4ece\u670d\u52a1\u6293\u53d6\u6307\u6807\uff1bGrafana\u5728\u4eea\u8868\u76d8\u4e2d\u53ef\u89c6\u5316\u5e76\u8bbe\u7f6e\u544a\u8b66\u3002</li> <li>\u670d\u52a1\u7684RED\u65b9\u6cd5\uff1aRate\uff08\u8bf7\u6c42/\u79d2\uff09\u3001Errors\uff08\u9519\u8bef\u7387\uff09\u3001Duration\uff08\u5ef6\u8fdf\uff09\u3002\u4e3a\u6bcf\u4e2a\u670d\u52a1\u76d1\u63a7\u8fd9\u4e9b\u6307\u6807\u3002</li> <li>\u8d44\u6e90\u7684USE\u65b9\u6cd5\uff1aUtilisation\uff08\u4f7f\u7528\u767e\u5206\u6bd4\uff09\u3001Saturation\uff08\u961f\u5217\u6df1\u5ea6\uff09\u3001Errors\u3002\u4e3a\u6bcf\u4e2a\u8d44\u6e90\uff08CPU\u3001GPU\u3001\u5185\u5b58\u3001\u78c1\u76d8\u3001\u7f51\u7edc\uff09\u76d1\u63a7\u8fd9\u4e9b\u6307\u6807\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/#_20","title":"\u8ffd\u8e2a","text":"<ul> <li>\u5206\u5e03\u5f0f\u8ffd\u8e2a\u8ddf\u8e2a\u5355\u4e2a\u8bf7\u6c42\u8de8\u591a\u4e2a\u670d\u52a1\u7684\u8def\u5f84\u3002\u7528\u6237\u8bf7\u6c42\u547d\u4e2dAPI\u7f51\u5173\u2192\u7279\u5f81\u670d\u52a1\u2192\u6a21\u578b\u670d\u52a1\u2192\u540e\u5904\u7406\u3002\u4e00\u4e2a\u8ffd\u8e2a\u8bb0\u5f55\u4e86\u6bcf\u6b21\u8df3\u8f6c\u7684\u65f6\u5e8f\uff0c\u663e\u793a\u5ef6\u8fdf\u82b1\u5728\u54ea\u91cc\u3002</li> <li>OpenTelemetry\uff1a\u8ffd\u8e2a\u3001\u6307\u6807\u548c\u65e5\u5fd7\u7684\u5f00\u653e\u6807\u51c6\u3002\u4e00\u6b21\u4ee3\u7801\u57cb\u70b9\uff0c\u5bfc\u51fa\u5230\u4efb\u4f55\u540e\u7aef\uff08Jaeger\u3001Zipkin\u3001Datadog\uff09\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/#_21","title":"\u53ef\u9760\u6027","text":"<ul> <li>SLO\uff08\u670d\u52a1\u7b49\u7ea7\u76ee\u6807\uff09\uff1a\u76ee\u6807\u53ef\u9760\u6027\u3002\"99.9%\u7684\u8bf7\u6c42\u5728&lt;200ms\u5185\u5b8c\u6210\u3002\"\u8fd9\u7ed9\u51fa\u4e86\u5177\u4f53\u7684\u9519\u8bef\u9884\u7b97\uff1a0.1%\u7684\u8bf7\u6c42\uff08\u6bcf\u6708\u7ea643\u5206\u949f\uff09\u53ef\u4ee5\u6162\u6216\u5931\u8d25\u3002</li> <li>SLI\uff08\u670d\u52a1\u7b49\u7ea7\u6307\u6807\uff09\uff1a\u6d4b\u91cf\u6307\u6807\u3002\"\u8fc7\u53bb5\u5206\u949f\u7684\u7b2c99\u767e\u5206\u4f4d\u5ef6\u8fdf\u3002\"</li> <li>SLA\uff08\u670d\u52a1\u7b49\u7ea7\u534f\u8bae\uff09\uff1a\u6709\u540e\u679c\u7684\u5408\u540c\u627f\u8bfa\u3002\"\u5982\u679c\u53ef\u7528\u6027\u4f4e\u4e8e99.95%\uff0c\u5ba2\u6237\u83b7\u5f97\u4fe1\u7528\u989d\u5ea6\u3002\"</li> <li>\u9519\u8bef\u9884\u7b97\uff1a\u5982\u679c\u4f60\u7684SLO\u662f99.9%\uff0c\u800c\u4f60\u8fbe\u5230\u4e8699.99%\uff0c\u4f60\u5c31\u6709\u8fdb\u884c\u98ce\u9669\u53d8\u66f4\uff08\u90e8\u7f72\u65b0\u6a21\u578b\u3001\u8fc1\u79fb\u6570\u636e\u5e93\uff09\u7684\u9884\u7b97\u3002\u5982\u679c\u4f60\u53ea\u670999.85%\uff0c\u51bb\u7ed3\u6240\u6709\u53d8\u66f4\uff0c\u4e13\u6ce8\u4e8e\u53ef\u9760\u6027\u3002\u9519\u8bef\u9884\u7b97\u5c06\u53ef\u9760\u6027\u4ece\u62bd\u8c61\u76ee\u6807\u8f6c\u5316\u4e3a\u53ef\u8861\u91cf\u7684\u8d44\u6e90\u3002</li> <li>\u6df7\u6c8c\u5de5\u7a0b\uff1a\u6545\u610f\u6ce8\u5165\u6545\u969c\uff08\u6740\u6b7b\u670d\u52a1\u5668\u3001\u6dfb\u52a0\u7f51\u7edc\u5ef6\u8fdf\u3001\u7834\u574f\u6570\u636e\uff09\u4ee5\u6d4b\u8bd5\u7cfb\u7edf\u662f\u5426\u80fd\u6b63\u786e\u5904\u7406\u3002Netflix\u7684Chaos Monkey\u968f\u673a\u7ec8\u6b62\u751f\u4ea7\u5b9e\u4f8b\u3002\u5982\u679c\u7cfb\u7edf\u4fdd\u6301\u8fd0\u884c\uff0c\u5b83\u5c31\u662f\u6709\u5f39\u6027\u7684\u3002\u5982\u679c\u5d29\u6e83\u4e86\uff0c\u4f60\u5728\u7528\u6237\u4e4b\u524d\u53d1\u73b0\u4e86\u4e00\u4e2abug\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/03.%20large%20scale%20infrastructure/#cicd","title":"CI/CD","text":"<ul> <li>\u6301\u7eed\u96c6\u6210\uff1a\u81ea\u52a8\u6784\u5efa\u548c\u6d4b\u8bd5\u6bcf\u6b21\u4ee3\u7801\u53d8\u66f4\u3002\u6bcf\u6b21\u63a8\u9001\u89e6\u53d1\uff1alint\u3001\u7c7b\u578b\u68c0\u67e5\u3001\u5355\u5143\u6d4b\u8bd5\u3001\u96c6\u6210\u6d4b\u8bd5\u3002\u4efb\u4f55\u5931\u8d25\uff0c\u53d8\u66f4\u88ab\u62d2\u7edd\u3002\u8fd9\u80fd\u5728bug\u5230\u8fbe\u751f\u4ea7\u4e4b\u524d\u6355\u83b7\u5b83\u4eec\u3002</li> <li>\u6301\u7eed\u90e8\u7f72\uff1a\u81ea\u52a8\u90e8\u7f72\u901a\u8fc7CI\u7684\u53d8\u66f4\u3002\u90e8\u7f72\u7b56\u7565\uff1a<ul> <li>\u84dd\u7eff\u90e8\u7f72\uff1a\u8fd0\u884c\u4e24\u4e2a\u76f8\u540c\u7684\u73af\u5883\uff08\u84dd\u8272=\u5f53\u524d\uff0c\u7eff\u8272=\u65b0\u7248\u672c\uff09\u3002\u5c06\u6d41\u91cf\u4ece\u84dd\u8272\u77ac\u95f4\u5207\u6362\u5230\u7eff\u8272\u3002\u5982\u679c\u7eff\u8272\u5931\u8d25\uff0c\u5207\u6362\u56de\u84dd\u8272\uff08\u5373\u65f6\u56de\u6eda\uff09\u3002</li> <li>\u91d1\u4e1d\u96c0\u90e8\u7f72\uff1a\u5c06\u4e00\u5c0f\u90e8\u5206\u6d41\u91cf\uff081-5%\uff09\u8def\u7531\u5230\u65b0\u7248\u672c\u3002\u76d1\u63a7\u9519\u8bef\u3002\u5982\u679c\u6307\u6807\u826f\u597d\uff0c\u9010\u6b65\u589e\u52a0\u6d41\u91cf\u3002\u8fd9\u9650\u5236\u4e86\u4e0d\u826f\u90e8\u7f72\u7684\u5f71\u54cd\u8303\u56f4\u3002</li> <li>\u529f\u80fd\u6807\u5fd7\uff1a\u90e8\u7f72\u65b0\u4ee3\u7801\u4f46\u9690\u85cf\u5728\u6807\u5fd7\u540e\u9762\u3002\u4e3a\u90e8\u5206\u7528\u6237\u542f\u7528\u8be5\u6807\u5fd7\uff08\u5185\u90e8\u6d4b\u8bd5\u4eba\u5458\uff0c\u7136\u540e\u662fbeta\u7528\u6237\uff0c\u7136\u540e\u662f\u6240\u6709\u7528\u6237\uff09\u3002\u5c06\u90e8\u7f72\uff08\u4ee3\u7801\u4e0a\u7ebf\uff09\u4e0e\u53d1\u5e03\uff08\u7528\u6237\u770b\u5230\u529f\u80fd\uff09\u89e3\u8026\u3002</li> </ul> </li> <li>\u5bf9\u4e8eML\uff1aCI/CD\u5305\u62ec\u6a21\u578b\u7279\u5b9a\u7684\u6b65\u9aa4\u3002\u6a21\u578b\u53d8\u66f4\u89e6\u53d1\uff1a\u5355\u5143\u6d4b\u8bd5\uff08\u5f62\u72b6\u6d4b\u8bd5\u3001\u68af\u5ea6\u68c0\u67e5\uff09\u3001\u5728\u4fdd\u7559\u96c6\u4e0a\u8bc4\u4f30\uff08\u51c6\u786e\u7387\u4e0d\u5f97\u4e0b\u964d\uff09\u3001\u5f71\u5b50\u90e8\u7f72\uff08\u65b0\u65e7\u6a21\u578b\u5e76\u884c\u8fd0\u884c\uff0c\u6bd4\u8f83\u8f93\u51fa\uff09\u548c\u9010\u6b65\u63a8\u51fa\uff08\u91d1\u4e1d\u96c0\u4ece1%\u2192100%\uff09\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/","title":"ML\u7cfb\u7edf\u8bbe\u8ba1","text":"<p>ML\u7cfb\u7edf\u8bbe\u8ba1\u5c06\u6587\u4ef601-03\u4e2d\u7684\u57fa\u7840\u8bbe\u65bd\u6a21\u5f0f\u5e94\u7528\u4e8e\u673a\u5668\u5b66\u4e60\u7684\u7279\u5b9a\u6311\u6218\u3002\u672c\u6587\u4ef6\u6db5\u76d6ML\u751f\u547d\u5468\u671f\u3001\u6570\u636e\u7ba1\u7406\u3001\u8bad\u7ec3\u57fa\u7840\u8bbe\u65bd\u3001\u6a21\u578b\u8bc4\u4f30\u3001\u670d\u52a1\u7b56\u7565\u3001\u7279\u5f81\u5de5\u7a0b\u3001ML\u6d41\u6c34\u7ebf\u548c\u76d1\u63a7</p> <ul> <li>\u50cf\"\u4e3aYouTube\u8bbe\u8ba1\u4e00\u4e2a\u63a8\u8350\u7cfb\u7edf\"\u8fd9\u6837\u7684\u7cfb\u7edf\u8bbe\u8ba1\u9762\u8bd5\u95ee\u9898\u5e76\u4e0d\u662f\u8981\u6c42\u4f60\u63cf\u8ff0\u63a8\u8350\u7b97\u6cd5\u3002\u5b83\u8981\u6c42\u4f60\u8bbe\u8ba1\u6574\u4e2a\u7cfb\u7edf\uff1a\u6570\u636e\u6d41\u6c34\u7ebf\u3001\u7279\u5f81\u5de5\u7a0b\u3001\u6a21\u578b\u8bad\u7ec3\u3001\u8bc4\u4f30\u3001\u670d\u52a1\u3001\u76d1\u63a7\u548c\u8fed\u4ee3\u3002\u672c\u6587\u4ef6\u63d0\u4f9b\u4e86\u6846\u67b6\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/#ml_1","title":"ML\u7cfb\u7edf\u751f\u547d\u5468\u671f","text":"<ul> <li>\u6bcf\u4e2aML\u7cfb\u7edf\u90fd\u9075\u5faa\u76f8\u540c\u7684\u751f\u547d\u5468\u671f\uff0c\u65e0\u8bba\u662f\u5783\u573e\u90ae\u4ef6\u5206\u7c7b\u5668\u8fd8\u662f\u57fa\u7840\u6a21\u578b\uff1a</li> </ul> <pre><code>\u95ee\u9898\u5b9a\u4e49 \u2192 \u6570\u636e \u2192 \u7279\u5f81 \u2192 \u8bad\u7ec3 \u2192 \u8bc4\u4f30 \u2192 \u90e8\u7f72 \u2192 \u76d1\u63a7 \u2192 \u8fed\u4ee3\n       \u2191                                                        \u2502\n       \u2514\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2500\u2518\n</code></pre>"},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/#_1","title":"\u95ee\u9898\u5b9a\u4e49","text":"<ul> <li>\u5728\u63a5\u89e6\u6570\u636e\u6216\u6a21\u578b\u4e4b\u524d\uff0c\u5148\u5b9a\u4e49\uff1a<ul> <li>\u9884\u6d4b\u4ec0\u4e48\uff1f\uff08\u70b9\u51fb\u6982\u7387\u3001\u4e0b\u4e00\u4e2a\u4ee4\u724c\u3001\u76ee\u6807\u8fb9\u754c\u6846\uff09</li> <li>\u7528\u6237\u662f\u8c01\uff1f\uff08\u6700\u7ec8\u7528\u6237\u3001\u5185\u90e8\u5206\u6790\u5e08\u3001\u5176\u4ed6ML\u6a21\u578b\uff09</li> <li>\u7ea6\u675f\u662f\u4ec0\u4e48\uff1f\uff08\u5ef6\u8fdf&lt;100ms\u3001\u79bb\u7ebf\u6279\u91cf\u64cd\u4f5c\u53ef\u4ee5\u3001\u5fc5\u987b\u5728\u8bbe\u5907\u4e0a\u8fd0\u884c\uff09</li> <li>\u4e1a\u52a1\u6307\u6807\u662f\u4ec0\u4e48\uff1f\uff08\u6536\u5165\u3001\u53c2\u4e0e\u5ea6\u3001\u51c6\u786e\u7387\uff09\u4ee5\u53caML\u6307\u6807\u5982\u4f55\u4e0e\u4e4b\u5173\u8054\uff1f</li> <li>\u57fa\u7ebf\u662f\u4ec0\u4e48\uff1f\uff08\u542f\u53d1\u5f0f\u65b9\u6cd5\u3001\u57fa\u4e8e\u89c4\u5219\u7684\u7cfb\u7edf\u3001\u73b0\u6709\u6a21\u578b\uff09\u2014\u2014\u4f60\u5fc5\u987b\u51fb\u8d25\u5b83\u624d\u80fd\u8bc1\u660eML\u7cfb\u7edf\u7684\u4ef7\u503c\u3002</li> </ul> </li> <li>\u5e38\u89c1\u9519\u8bef\uff1a\u5728\u7406\u89e3\u95ee\u9898\u4e4b\u524d\u76f4\u63a5\u8df3\u5230\u6a21\u578b\u67b6\u6784\u3002\"\u6211\u4eec\u5e94\u8be5\u4f7f\u7528Transformer\"\u4e0d\u662f\u7cfb\u7edf\u8bbe\u8ba1\u7684\u7b54\u6848\u3002\"\u6211\u4eec\u9700\u8981\u5728200ms\u5185\u9884\u6d4b1000\u4e07\u4e2a\u5019\u9009\u7684\u70b9\u51fb\u6982\u7387\uff0c\u56e0\u6b64\u6211\u4eec\u9700\u8981\u4e00\u4e2a\u4e24\u9636\u6bb5\u7cfb\u7edf\uff1a\u5feb\u901f\u68c0\u7d22\u7136\u540e\u4e00\u4e2a\u5c0f\u578b\u6392\u5e8f\u6a21\u578b\"\u624d\u662f\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/#_2","title":"\u6570\u636e\u7ba1\u7406","text":""},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/#_3","title":"\u6570\u636e\u6536\u96c6\u548c\u6807\u6ce8","text":"<ul> <li>\u663e\u5f0f\u6807\u7b7e\uff1a\u4eba\u7c7b\u6807\u6ce8\u6570\u636e\uff08\u70b9\u51fb/\u4e0d\u70b9\u51fb\u3001\u76ee\u6807\u8fb9\u754c\u6846\u3001\u5bf9\u8bdd\u8d28\u91cf\u8bc4\u5206\uff09\u3002\u6602\u8d35\uff08\u53d6\u51b3\u4e8e\u590d\u6742\u5ea6\uff0c\u6bcf\u4e2a\u6807\u7b7e\u7ea6\\(0.02-\\)10\uff09\u3001\u7f13\u6162\u4e14\u4e3b\u89c2\u3002</li> <li>\u9690\u5f0f\u6807\u7b7e\uff1a\u4ece\u7528\u6237\u884c\u4e3a\u4e2d\u63a8\u5bfc\u6807\u7b7e\u3002\u70b9\u51fb\u3001\u505c\u7559\u65f6\u95f4\u3001\u8d2d\u4e70\u3001\u8df3\u8fc7\u3002\u5ec9\u4ef7\u4e14\u4e30\u5bcc\uff0c\u4f46\u6709\u566a\u58f0\uff08\u70b9\u51fb\u4e0d\u610f\u5473\u7740\u6ee1\u610f\uff1b\u8df3\u8fc7\u4e0d\u610f\u5473\u7740\u4e0d\u559c\u6b22\uff09\u3002</li> <li>\u7a0b\u5e8f\u5316\u6807\u6ce8\uff08Snorkel\uff09\uff1a\u7f16\u5199\u6807\u6ce8\u51fd\u6570\uff08\u542f\u53d1\u5f0f\u65b9\u6cd5\u3001\u6b63\u5219\u8868\u8fbe\u5f0f\u3001\u73b0\u6709\u6a21\u578b\uff09\uff0c\u5bf9\u6bcf\u4e2a\u6837\u672c\u8fdb\u884c\u6295\u7968\u3002\u7edf\u8ba1\u6c47\u603b\u6295\u7968\u4ee5\u4ea7\u751f\u6982\u7387\u6807\u7b7e\u3002\u53ef\u6269\u5c55\u5230\u6570\u767e\u4e07\u6837\u672c\uff0c\u5177\u6709\u4e2d\u7b49\u51c6\u786e\u5ea6\u3002</li> <li>\u4e3b\u52a8\u5b66\u4e60\uff1a\u6a21\u578b\u8bc6\u522b\u6700\u4e0d\u786e\u5b9a\u7684\u6837\u672c\uff0c\u5e76\u8bf7\u6c42\u4eba\u5de5\u6807\u6ce8\u8fd9\u4e9b\u6837\u672c\u3002\u8fd9\u6700\u5927\u9650\u5ea6\u5730\u63d0\u9ad8\u4e86\u6807\u6ce8\u6548\u7387\uff1a1000\u4e2a\u4e3b\u52a8\u9009\u62e9\u7684\u6807\u7b7e\u53ef\u4ee5\u5339\u914d10000\u4e2a\u968f\u673a\u6807\u7b7e\u7684\u8d28\u91cf\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/#_4","title":"\u6570\u636e\u8d28\u91cf","text":"<ul> <li>\u6570\u636e\u9a8c\u8bc1\uff1a\u68c0\u67e5\u6bcf\u6279\u4f20\u5165\u6570\u636e\u7684\u6a21\u5f0f\u8fdd\u53cd\uff08\u5b57\u6bb5\u7f3a\u5931\u3001\u7c7b\u578b\u9519\u8bef\uff09\u3001\u5206\u5e03\u504f\u79fb\uff08\u5e73\u5747\u503c\u663e\u8457\u53d8\u5316\uff09\u548c\u6570\u91cf\u5f02\u5e38\uff08\u9884\u671f100\u4e07\u884c\uff0c\u6536\u523050\u4e07\u884c\uff09\u3002</li> <li>Great Expectations\u548cTFX Data Validation\u662f\u5b9a\u4e49\u6570\u636e\u671f\u671b\u5e76\u5728\u8fdd\u53cd\u65f6\u53d1\u51fa\u544a\u8b66\u7684\u5de5\u5177\u3002</li> <li>\u6570\u636e\u7248\u672c\u7ba1\u7406\uff1a\u6bcf\u6b21\u8bad\u7ec3\u8fd0\u884c\u5e94\u8be5\u662f\u53ef\u91cd\u73b0\u7684\u3002DVC\uff08\u7b2c15\u7ae0\uff09\u5c06\u6570\u636e\u6587\u4ef6\u4e0e\u4ee3\u7801\u4e00\u8d77\u8ffd\u8e2a\u3002\u6bcf\u4e2a\u6570\u636e\u96c6\u7248\u672c\u83b7\u5f97\u4e00\u4e2a\u54c8\u5e0c\u503c\uff1b\u8bad\u7ec3\u914d\u7f6e\u5f15\u7528\u8be5\u54c8\u5e0c\u503c\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/#_5","title":"\u7279\u5f81\u5b58\u50a8","text":"<ul> <li>\u7279\u5f81\u5b58\u50a8\uff08\u7b2c15\u7ae0\uff09\u4e3a\u8bad\u7ec3\u548c\u670d\u52a1\u63d0\u4f9b\u4e00\u81f4\u7684\u7279\u5f81\u3002\u5173\u952e\u6982\u5ff5\uff1a<ul> <li>\u79bb\u7ebf\u7279\u5f81\uff1a\u4ece\u6279\u5904\u7406\u6d41\u6c34\u7ebf\uff08Spark\uff09\u8ba1\u7b97\uff0c\u5b58\u50a8\u5728\u6570\u636e\u4ed3\u5e93\u4e2d\u3002\u5728\u8bad\u7ec3\u548c\u6279\u91cf\u63a8\u7406\u671f\u95f4\u4f7f\u7528\u3002\u793a\u4f8b\uff1a\u7528\u6237\u8fc7\u53bb30\u5929\u7684\u5e73\u5747\u4f1a\u8bdd\u65f6\u957f\u3001\u5546\u54c1\u7684\u603b\u8d2d\u4e70\u6b21\u6570\u3002</li> <li>\u5728\u7ebf\u7279\u5f81\uff1a\u5b9e\u65f6\u8ba1\u7b97\u6216\u9884\u5148\u8ba1\u7b97\u5e76\u4ece\u4f4e\u5ef6\u8fdf\u5b58\u50a8\uff08Redis\u3001DynamoDB\uff09\u63d0\u4f9b\u670d\u52a1\u3002\u5728\u5b9e\u65f6\u63a8\u7406\u671f\u95f4\u4f7f\u7528\u3002\u793a\u4f8b\uff1a\u7528\u6237\u6700\u8fd1\u76845\u4e2a\u64cd\u4f5c\u3001\u5f53\u524d\u8d2d\u7269\u8f66\u5185\u5bb9\u3002</li> <li>\u8bad\u7ec3-\u670d\u52a1\u504f\u5dee\uff1a\u5982\u679c\u7279\u5f81\u8ba1\u7b97\u5728\u8bad\u7ec3\u548c\u670d\u52a1\u4e4b\u95f4\u4e0d\u540c\uff0c\u6a21\u578b\u5728\u63a8\u7406\u65f6\u770b\u5230\u7684\u7279\u5f81\u503c\u4e0e\u8bad\u7ec3\u65f6\u4e0d\u540c\u3002\u7279\u5f81\u5b58\u50a8\u901a\u8fc7\u5bf9\u4e24\u8005\u4f7f\u7528\u76f8\u540c\u7684\u8ba1\u7b97\u6765\u6d88\u9664\u6b64\u95ee\u9898\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/#_6","title":"\u8bad\u7ec3\u57fa\u7840\u8bbe\u65bd","text":"<ul> <li>\u5bf9\u4e8e\u672c\u4e66\u7684\u8bfb\u8005\uff0c\u5206\u5e03\u5f0f\u8bad\u7ec3\u5728\u7b2c6\u7ae0\uff08\u6570\u636e\u5e76\u884c\u3001\u6a21\u578b\u5e76\u884c\u3001\u6df7\u5408\u7cbe\u5ea6\u3001\u7f29\u653e\u5b9a\u5f8b\uff09\u4e2d\u5df2\u6709\u6df1\u5165\u4ecb\u7ecd\u3002\u8fd9\u91cc\u6211\u4eec\u5173\u6ce8\u7cfb\u7edf\u65b9\u9762\uff1a</li> <li>\u5b9e\u9a8c\u8ddf\u8e2a\uff08W&amp;B\u3001MLflow\u2014\u2014\u7b2c15\u7ae0\uff09\uff1a\u6bcf\u6b21\u8bad\u7ec3\u8fd0\u884c\u8bb0\u5f55\u8d85\u53c2\u6570\u3001\u6307\u6807\u3001git\u63d0\u4ea4\u3001\u6570\u636e\u7248\u672c\u548c\u786c\u4ef6\u3002\u8fd9\u662f\u6a21\u578b\u7248\u672c\u63a7\u5236\u7684ML\u7b49\u4ef7\u7269\u3002</li> <li>\u8d85\u53c2\u6570\u8c03\u4f18\uff1a\u81ea\u52a8\u5316\u641c\u7d22\u8d85\u53c2\u6570\u3002\u65b9\u6cd5\uff1a\u7f51\u683c\u641c\u7d22\uff08\u7a77\u5c3d\uff0c\u6602\u8d35\uff09\u3001\u968f\u673a\u641c\u7d22\uff08\u51fa\u5947\u5730\u6709\u6548\uff09\u3001\u8d1d\u53f6\u65af\u4f18\u5316\uff08\u5bf9\u76ee\u6807\u5efa\u6a21\uff0c\u5728\u6539\u8fdb\u53ef\u80fd\u6027\u9ad8\u7684\u5730\u65b9\u91c7\u6837\uff09\u548cASHA\uff08\u5f02\u6b65\u8fde\u7eed\u51cf\u534a\uff1a\u542f\u52a8\u8bb8\u591a\u8bd5\u9a8c\uff0c\u65e9\u671f\u6dd8\u6c70\u8868\u73b0\u4e0d\u4f73\u7684\uff09\u3002</li> <li>\u8bad\u7ec3\u6d41\u6c34\u7ebf\u7f16\u6392\uff08Airflow\u3001Kubeflow\u2014\u2014\u7b2c15\u7ae0\uff09\uff1a\u81ea\u52a8\u5316\u6570\u636e\u51c6\u5907\u2192\u8bad\u7ec3\u2192\u8bc4\u4f30\u2192\u6ce8\u518c\u7684\u5e8f\u5217\u3002\u5b89\u6392\u6bcf\u65e5\u91cd\u65b0\u8bad\u7ec3\u3002\u5728\u5931\u8d25\u65f6\u53d1\u51fa\u544a\u8b66\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/#_7","title":"\u6a21\u578b\u8bc4\u4f30","text":""},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/#_8","title":"\u79bb\u7ebf\u8bc4\u4f30","text":"<ul> <li>\u4fdd\u7559\u6d4b\u8bd5\u96c6\uff1a\u5728\u6a21\u578b\u8bad\u7ec3\u65f6\u4ece\u672a\u89c1\u8fc7\u7684\u6570\u636e\u4e0a\u8bc4\u4f30\u3002\u6807\u51c6\u505a\u6cd5\uff0c\u4f46\u5982\u679c\u6d4b\u8bd5\u96c6\u4e0d\u4ee3\u8868\u751f\u4ea7\u6570\u636e\uff0c\u53ef\u80fd\u4f1a\u4ea7\u751f\u8bef\u5bfc\u3002</li> <li>\u57fa\u4e8e\u5206\u7247\u7684\u8bc4\u4f30\uff1a\u5728\u5b50\u7ec4\u4e0a\u8bc4\u4f30\uff08\u6309\u7528\u6237\u4eba\u53e3\u7edf\u8ba1\u3001\u5185\u5bb9\u7c7b\u578b\u3001\u8bed\u8a00\u3001\u65f6\u95f4\u6bb5\uff09\u3002\u4e00\u4e2a\u603b\u4f53\u51c6\u786e\u738795%\u7684\u6a21\u578b\u53ef\u80fd\u5728\u7279\u5b9a\u5c11\u6570\u7fa4\u4f53\u4e0a\u7684\u51c6\u786e\u7387\u53ea\u670970%\u2014\u2014\u4e0d\u53ef\u63a5\u53d7\u3002</li> <li>\u56de\u6d4b\uff1a\u5bf9\u4e8e\u65f6\u95f4\u5e8f\u5217\u6216\u987a\u5e8f\u9884\u6d4b\uff0c\u6309\u65f6\u95f4\u987a\u5e8f\u5728\u5386\u53f2\u6570\u636e\u4e0a\u8fdb\u884c\u8bc4\u4f30\u3002\u4f7f\u7528\u622a\u81f3\u65f6\u95f4\\(t\\)\u7684\u6570\u636e\u8bad\u7ec3\uff0c\u5728\\(t\\)\u5230\\(t + \\Delta t\\)\u7684\u6570\u636e\u4e0a\u8bc4\u4f30\u3002\u907f\u514d\u4f7f\u7528\u672a\u6765\u6570\u636e\u8fdb\u884c\u8bad\u7ec3\u5bfc\u81f4\u7684\u6570\u636e\u6cc4\u9732\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/#_9","title":"\u5728\u7ebf\u8bc4\u4f30","text":"<ul> <li>A/B\u6d4b\u8bd5\uff1a\u5c06\u5b9e\u65f6\u6d41\u91cf\u968f\u673a\u5206\u4e3a\u5bf9\u7167\u7ec4\uff08\u65e7\u6a21\u578b\uff09\u548c\u5b9e\u9a8c\u7ec4\uff08\u65b0\u6a21\u578b\uff09\u3002\u4ee5\u7edf\u8ba1\u663e\u8457\u6027\u6bd4\u8f83\u4e1a\u52a1\u6307\u6807\uff08\u6536\u5165\u3001\u53c2\u4e0e\u5ea6\u3001\u7559\u5b58\u7387\uff09\u3002\u8bc4\u4f30ML\u53d8\u66f4\u7684\u9ec4\u91d1\u6807\u51c6\u3002<ul> <li>\u6837\u672c\u91cf\uff1a\u4f60\u9700\u8981\u8db3\u591f\u7684\u6570\u636e\u6765\u68c0\u6d4b\u9884\u671f\u7684\u6548\u5e94\u91cf\u3002\u70b9\u51fb\u73870.1%\u7684\u6539\u8fdb\u9700\u8981\u6570\u767e\u4e07\u6b21\u5c55\u793a\u624d\u80fd\u4ee5\u663e\u8457\u6027\u68c0\u6d4b\u5230\u3002</li> <li>\u65f6\u957f\uff1a\u8fd0\u884c\u81f3\u5c11\u4e00\u4e2a\u5b8c\u6574\u5468\u671f\uff08\u5927\u591a\u6570\u4ea7\u54c11-2\u5468\uff09\u4ee5\u6355\u83b7\u65e5-\u5468\u6548\u5e94\u3002</li> <li>\u62a4\u680f\u6307\u6807\uff1a\u76d1\u63a7\u4e0d\u5e94\u53d8\u5316\u7684\u6307\u6807\uff08\u9875\u9762\u52a0\u8f7d\u65f6\u95f4\u3001\u9519\u8bef\u7387\u3001\u5d29\u6e83\u7387\uff09\u4ee5\u53ca\u76ee\u6807\u6307\u6807\u3002\u4e00\u4e2a\u589e\u52a0\u6536\u5165\u4f46\u540c\u65f6\u589e\u52a0\u5d29\u6e83\u7387\u7684\u6a21\u578b\u662f\u51c0\u8d1f\u9762\u7684\u3002</li> </ul> </li> <li>\u5f71\u5b50\u90e8\u7f72\uff1a\u5728\u751f\u4ea7\u4e2d\u4e0e\u65b0\u6a21\u578b\u5e76\u884c\u8fd0\u884c\u65e7\u6a21\u578b\u3002\u4e24\u8005\u63a5\u6536\u76f8\u540c\u7684\u8bf7\u6c42\uff0c\u4f46\u53ea\u6709\u65e7\u6a21\u578b\u7684\u9884\u6d4b\u4f1a\u63d0\u4f9b\u7ed9\u7528\u6237\u3002\u6bd4\u8f83\u8f93\u51fa\u3002\u8fd9\u80fd\u5728\u4e0d\u5f71\u54cd\u7528\u6237\u7684\u60c5\u51b5\u4e0b\u6355\u83b7bug\u548c\u8d28\u91cf\u95ee\u9898\u3002</li> <li>\u4ea4\u9519\u5b9e\u9a8c\uff1a\u5bf9\u4e8e\u6392\u5e8f\u95ee\u9898\uff0c\u5c06\u65e7\u6a21\u578b\u548c\u65b0\u6a21\u578b\u7684\u7ed3\u679c\u4ea4\u9519\u5728\u4e00\u4e2a\u5217\u8868\u4e2d\u3002\u7528\u6237\u4e0e\u4ea4\u9519\u5217\u8868\u4ea4\u4e92\uff0c\u4f60\u6d4b\u91cf\u54ea\u4e2a\u6a21\u578b\u7684\u7ed3\u679c\u83b7\u5f97\u66f4\u591a\u53c2\u4e0e\u3002\u76f8\u6bd4A/B\u6d4b\u8bd5\u9700\u8981\u66f4\u5c11\u7684\u7528\u6237\u5373\u53ef\u8fbe\u5230\u663e\u8457\u6027\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/#_10","title":"\u6a21\u578b\u670d\u52a1","text":""},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/#vs","title":"\u6279\u91cfvs\u5b9e\u65f6","text":"<ul> <li>\u6279\u91cf\u63a8\u7406\uff1a\u9884\u5148\u8ba1\u7b97\u6240\u6709\u53ef\u80fd\u8f93\u5165\u7684\u9884\u6d4b\u7ed3\u679c\u3002\u5b58\u50a8\u5728\u6570\u636e\u5e93/\u7f13\u5b58\u4e2d\u3002\u4ece\u7f13\u5b58\u63d0\u4f9b\u670d\u52a1\u3002\u9002\u7528\u4e8e\uff1a\u8f93\u5165\u7a7a\u95f4\u6709\u9650\uff08\u6bcf\u665a\u4e3a\u6240\u6709\u7528\u6237\u63a8\u8350\uff09\u3001\u65b0\u9c9c\u5ea6\u4e0d\u91cd\u8981\uff08\u6bcf\u65e5\u9884\u6d4b\u5373\u53ef\uff09\u3001\u5ef6\u8fdf\u5bb9\u5fcd\u5ea6\u9ad8\u3002</li> <li>\u5b9e\u65f6\u63a8\u7406\uff1a\u6309\u9700\u4e3a\u6bcf\u4e2a\u8bf7\u6c42\u8ba1\u7b97\u9884\u6d4b\u7ed3\u679c\u3002\u9002\u7528\u4e8e\uff1a\u8f93\u5165\u7a7a\u95f4\u65e0\u9650\uff08\u4efb\u4f55\u7528\u6237\u67e5\u8be2\uff09\u3001\u65b0\u9c9c\u5ea6\u91cd\u8981\uff08\u7acb\u5373\u4e3a\u6b64\u7279\u5b9a\u67e5\u8be2\u8fdb\u884c\u9884\u6d4b\uff09\u3001\u5ef6\u8fdf\u5fc5\u987b\u4f4e\u3002</li> <li>\u8bb8\u591a\u7cfb\u7edf\u4e24\u8005\u90fd\u7528\uff1a\u6279\u91cf\u9884\u8ba1\u7b97\u4e00\u7ec4\u5019\u9009\u7ed3\u679c\uff08\u4fbf\u5b9c\uff0c\u8986\u76d680%\u7684\u6d41\u91cf\uff09\uff0c\u5b9e\u65f6\u5904\u7406\u5176\u4f59\u90e8\u5206\uff08\u6602\u8d35\uff0c\u8986\u76d6\u5c3e\u90e8\u67e5\u8be2\u548c\u65b0\u7528\u6237\uff09\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/#_11","title":"\u6a21\u578b\u7248\u672c\u7ba1\u7406\u548c\u6ce8\u518c\u8868","text":"<ul> <li>\u6a21\u578b\u6ce8\u518c\u8868\uff08MLflow\u3001W&amp;B\u3001SageMaker\uff09\u5b58\u50a8\u8bad\u7ec3\u597d\u7684\u6a21\u578b\u53ca\u5176\u5143\u6570\u636e\uff1a<ul> <li>\u7248\u672c\u53f7\u548c\u8bad\u7ec3\u65e5\u671f\u3002</li> <li>\u8bad\u7ec3\u914d\u7f6e\u548c\u6570\u636e\u7248\u672c\u3002</li> <li>\u8bc4\u4f30\u6307\u6807\uff08\u51c6\u786e\u7387\u3001\u5ef6\u8fdf\u3001\u5185\u5b58\u4f7f\u7528\uff09\u3002</li> <li>\u9636\u6bb5\uff1a\u5f00\u53d1\u2192\u9884\u53d1\u5e03\u2192\u751f\u4ea7\u2192\u5f52\u6863\u3002</li> </ul> </li> <li>\u56de\u6eda\uff1a\u5982\u679c\u65b0\u6a21\u578b\u5728\u751f\u4ea7\u4e2d\u5bfc\u81f4\u6307\u6807\u4e0b\u964d\uff0c\u7acb\u5373\u6062\u590d\u5230\u524d\u4e00\u4e2a\u7248\u672c\u3002\u6ce8\u518c\u8868\u4f7f\u8fd9\u6210\u4e3a\u4e00\u952e\u64cd\u4f5c\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/#_12","title":"\u7279\u5f81\u5de5\u7a0b","text":"<ul> <li>\u7279\u5f81\u5de5\u7a0b\u5c06\u539f\u59cb\u6570\u636e\u8f6c\u6362\u4e3a\u6a21\u578b\u6240\u9700\u7684\u8f93\u5165\u3002\u5b83\u901a\u5e38\u662fML\u4e2d\u6760\u6746\u7387\u6700\u9ad8\u7684\u6d3b\u52a8\uff1a\u66f4\u597d\u7684\u7279\u5f81\u80fd\u6539\u8fdb\u6bcf\u4e2a\u6a21\u578b\uff0c\u800c\u66f4\u597d\u7684\u6a21\u578b\u53d7\u9650\u4e8e\u5b83\u4eec\u6536\u5230\u7684\u7279\u5f81\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/#vs_1","title":"\u5728\u7ebfvs\u79bb\u7ebf\u7279\u5f81","text":"<ul> <li>\u79bb\u7ebf\u7279\u5f81\u662f\u9884\u5148\u8ba1\u7b97\u7684\uff0c\u53d8\u5316\u7f13\u6162\uff08\u7528\u6237\u4eba\u53e3\u7edf\u8ba1\u300130\u5929\u805a\u5408\uff09\u3002\u7531\u6279\u5904\u7406\u6d41\u6c34\u7ebf\uff08Spark\uff09\u8ba1\u7b97\uff0c\u5b58\u50a8\u5728\u7279\u5f81\u5b58\u50a8\u4e2d\u3002</li> <li>\u5728\u7ebf\u7279\u5f81\u53cd\u6620\u5f53\u524d\u72b6\u6001\uff0c\u53d8\u5316\u8fc5\u901f\uff08\u8d2d\u7269\u8f66\u4e2d\u7684\u5546\u54c1\u3001\u6700\u8fd1\u64cd\u4f5c\u3001\u5f53\u524d\u4f4d\u7f6e\uff09\u3002\u4ece\u4e8b\u4ef6\u6d41\u5b9e\u65f6\u8ba1\u7b97\u6216\u4ece\u5feb\u901f\u5b58\u50a8\u4e2d\u67e5\u627e\u3002</li> <li>\u7279\u5f81\u65b0\u9c9c\u5ea6\uff1a\u67d0\u4e9b\u7279\u5f81\u9700\u8981\u79d2\u7ea7\u65b0\u9c9c\u5ea6\uff08\u6b3a\u8bc8\u68c0\u6d4b\uff1a\u6b64\u4ea4\u6613\u76f8\u5bf9\u4e8e\u6700\u8fd15\u7b14\u4ea4\u6613\u662f\u5426\u5f02\u5e38\uff1f\uff09\u3002\u5176\u4ed6\u7684\u53ef\u4ee5\u5bb9\u5fcd\u5c0f\u65f6\u7ea7\u9648\u65e7\u5ea6\uff08\u63a8\u8350\uff1a\u6839\u636e\u7528\u6237\u5386\u53f2\uff0c\u8be5\u7528\u6237\u504f\u597d\u4ec0\u4e48\u7c7b\u578b\uff1f\uff09\u3002\u66f4\u65b0\u9c9c\u7684\u7279\u5f81\u8ba1\u7b97\u548c\u670d\u52a1\u66f4\u6602\u8d35\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/#_13","title":"\u5e38\u89c1\u7279\u5f81\u6a21\u5f0f","text":"<ul> <li>\u8ba1\u6570\u7279\u5f81\uff1a\u65f6\u95f4\u7a97\u53e3\u5185\u7684\u4e8b\u4ef6\u8ba1\u6570\uff08\u8fc7\u53bb7\u5929\u7684\u8d2d\u4e70\u6b21\u6570\u3001\u8fc7\u53bb24\u5c0f\u65f6\u7684\u767b\u5f55\u6b21\u6570\uff09\u3002</li> <li>\u5d4c\u5165\u7279\u5f81\uff1a\u5206\u7c7b\u53d8\u91cf\u7684\u5b66\u4e60\u5d4c\u5165\uff08\u7528\u6237\u5d4c\u5165\u3001\u5546\u54c1\u5d4c\u5165\u3001\u67e5\u8be2\u5d4c\u5165\uff09\u3002\u8fd9\u4e9b\u662f\u53cc\u5854\u6a21\u578b\u548c\u7c7b\u4f3c\u67b6\u6784\u7684\u8f93\u5165\u3002</li> <li>\u4ea4\u53c9\u7279\u5f81\uff1a\u4e24\u4e2a\u6216\u591a\u4e2a\u7279\u5f81\u7684\u7ec4\u5408\uff08user_age \u00d7 item_category\uff09\u3002\u6355\u83b7\u5355\u4e2a\u7279\u5f81\u65e0\u6cd5\u6355\u83b7\u7684\u4ea4\u4e92\u3002</li> <li>\u65f6\u95f4\u7279\u5f81\uff1a\u81ea\u4e0a\u6b21\u64cd\u4f5c\u4ee5\u6765\u7684\u65f6\u95f4\u3001\u661f\u671f\u51e0\u3001\u4e00\u5929\u4e2d\u7684\u5c0f\u65f6\u3002\u6355\u83b7\u65f6\u95f4\u6a21\u5f0f\u3002</li> <li>\u805a\u5408\u7279\u5f81\uff1a\u6570\u503c\u7279\u5f81\u5728\u67d0\u4e2a\u7ec4\u4e0a\u7684\u5747\u503c\u3001\u4e2d\u4f4d\u6570\u3001\u6700\u5c0f\u503c\u3001\u6700\u5927\u503c\u3001\u6807\u51c6\u5dee\uff08\u6b64\u5356\u5bb6\u7684\u5546\u54c1\u5e73\u5747\u8bc4\u5206\uff09\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/#ml_2","title":"ML\u6d41\u6c34\u7ebf","text":"<ul> <li>ML\u6d41\u6c34\u7ebf\u7f16\u6392\u4ece\u6570\u636e\u5230\u90e8\u7f72\u6a21\u578b\u7684\u6574\u4e2a\u5de5\u4f5c\u6d41\u7a0b\uff1a</li> </ul> <pre><code>\u6570\u636e\u6444\u5165 \u2192 \u9a8c\u8bc1 \u2192 \u7279\u5f81\u5de5\u7a0b \u2192 \u8bad\u7ec3 \u2192 \u8bc4\u4f30 \u2192 \u6ce8\u518c \u2192 \u90e8\u7f72 \u2192 \u76d1\u63a7\n</code></pre> <ul> <li>\u6bcf\u4e2a\u6b65\u9aa4\u662f\u7f16\u6392\u5668\uff08Airflow\u3001Kubeflow\u3001Metaflow\u2014\u2014\u7b2c15\u7ae0\uff09\u4e2d\u7684\u4e00\u4e2a\u4efb\u52a1\u3002\u6d41\u6c34\u7ebf\uff1a<ul> <li>\u6309\u8ba1\u5212\u8fd0\u884c\uff08\u6bcf\u65e5\u91cd\u65b0\u8bad\u7ec3\uff09\u6216\u89e6\u53d1\u8fd0\u884c\uff08\u65b0\u6570\u636e\u53ef\u7528\uff09\u3002</li> <li>\u662f\u5e42\u7b49\u7684\uff08\u91cd\u65b0\u8fd0\u884c\u4ea7\u751f\u76f8\u540c\u7ed3\u679c\uff09\u3002</li> <li>\u6709\u91cd\u8bd5\u903b\u8f91\uff08\u5982\u679c\u7279\u5f81\u8ba1\u7b97\u5931\u8d25\uff0c\u4f7f\u7528\u9000\u907f\u91cd\u8bd53\u6b21\uff09\u3002</li> <li>\u4ea7\u751f\u5236\u54c1\uff08\u8bad\u7ec3\u597d\u7684\u6a21\u578b\u3001\u8bc4\u4f30\u62a5\u544a\u3001\u7279\u5f81\u7edf\u8ba1\uff09\uff0c\u8fd9\u4e9b\u5236\u54c1\u88ab\u7248\u672c\u5316\u7ba1\u7406\u5e76\u5b58\u50a8\u3002</li> </ul> </li> <li>Metaflow\uff08Netflix/Outerbounds\uff09\u7279\u522b\u9002\u5408ML\uff1a\u5b83\u5bf9\u4ee3\u7801\u3001\u6570\u636e\u548c\u6a21\u578b\u4e00\u8d77\u8fdb\u884c\u7248\u672c\u7ba1\u7406\uff0c\u652f\u6301\u76f8\u540c\u4ee3\u7801\u7684\u672c\u5730\u5f00\u53d1\u548c\u4e91\u6267\u884c\uff0c\u5e76\u4e0eK8s\u548cAWS\u96c6\u6210\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/#_14","title":"\u76d1\u63a7","text":"<ul> <li>\u6211\u4eec\u5728\u7b2c15\u7ae0\uff08Prometheus\u3001Grafana\u3001\u544a\u8b66\uff09\u4e2d\u4ecb\u7ecd\u4e86\u76d1\u63a7\u57fa\u7840\u3002\u8fd9\u91cc\u6211\u4eec\u5173\u6ce8ML\u7279\u5b9a\u7684\u76d1\u63a7\uff1a</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/#_15","title":"\u6570\u636e\u6f02\u79fb","text":"<ul> <li>\u6570\u636e\u6f02\u79fb\u53d1\u751f\u5728\u4f20\u5165\u6570\u636e\u7684\u5206\u5e03\u76f8\u5bf9\u4e8e\u8bad\u7ec3\u6570\u636e\u53d1\u751f\u53d8\u5316\u65f6\u3002\u5728\u590f\u5b63\u6570\u636e\u4e0a\u8bad\u7ec3\u7684\u6a21\u578b\u53ef\u80fd\u5728\u51ac\u5b63\u6570\u636e\u4e0a\u8868\u73b0\u4e0d\u4f73\uff08\u4e0d\u540c\u7684\u7528\u6237\u884c\u4e3a\u3001\u4e0d\u540c\u7684\u4ea7\u54c1\u53ef\u7528\u6027\uff09\u3002</li> <li>\u68c0\u6d4b\uff1a\u4f7f\u7528\u7edf\u8ba1\u6d4b\u8bd5\u6bd4\u8f83\u4f20\u5165\u7279\u5f81\u5206\u5e03\u4e0e\u8bad\u7ec3\u5206\u5e03\uff1a<ul> <li>KS\u68c0\u9a8c\uff08Kolmogorov-Smirnov\uff09\uff1a\u6bd4\u8f83\u4e24\u4e2a\u7ecf\u9a8c\u5206\u5e03\u3002\u68c0\u9a8c\u5b83\u4eec\u662f\u5426\u6765\u81ea\u76f8\u540c\u7684\u5e95\u5c42\u5206\u5e03\u3002</li> <li>PSI\uff08\u603b\u4f53\u7a33\u5b9a\u6027\u6307\u6570\uff09\uff1a\u8861\u91cf\u5206\u5e03\u504f\u79fb\u4e86\u591a\u5c11\u3002PSI &lt; 0.1\u4e3a\u7a33\u5b9a\uff0c0.1-0.25\u4e3a\u4e2d\u5ea6\u504f\u79fb\uff0c&gt; 0.25\u4e3a\u663e\u8457\u504f\u79fb\u3002</li> <li>\u5d4c\u5165\u6f02\u79fb\uff1a\u4f7f\u7528\u8d28\u5fc3\u8ddd\u79bb\u6216MMD\uff08\u6700\u5927\u5747\u503c\u5dee\u5f02\uff09\u6bd4\u8f83\u4f20\u5165\u67e5\u8be2\u7684\u5d4c\u5165\u5206\u5e03\u4e0e\u8bad\u7ec3\u96c6\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/#_16","title":"\u6982\u5ff5\u6f02\u79fb","text":"<ul> <li>\u6982\u5ff5\u6f02\u79fb\u53d1\u751f\u5728\u8f93\u5165\u548c\u8f93\u51fa\u4e4b\u95f4\u7684\u5173\u7cfb\u53d1\u751f\u53d8\u5316\u65f6\u3002\u7279\u5f81\u770b\u8d77\u6765\u76f8\u540c\uff0c\u4f46\u6b63\u786e\u7684\u9884\u6d4b\u4e0d\u540c\u3002\u793a\u4f8b\uff1a\u7528\u6237\u504f\u597d\u5728\u4e00\u573a\u6587\u5316\u6d3b\u52a8\u3001\u6d41\u884c\u75c5\u6216\u4ea7\u54c1\u53d8\u66f4\u540e\u53d1\u751f\u8f6c\u53d8\u3002</li> <li>\u6982\u5ff5\u6f02\u79fb\u6bd4\u6570\u636e\u6f02\u79fb\u66f4\u96be\u68c0\u6d4b\uff0c\u56e0\u4e3a\u5b83\u9700\u8981\u5e26\u6807\u7b7e\u7684\u6570\u636e\u3002\u76d1\u63a7\u4ee3\u7406\u6307\u6807\uff1a\u70b9\u51fb\u7387\u3001\u8f6c\u5316\u7387\u3001\u7528\u6237\u6ee1\u610f\u5ea6\u8bc4\u5206\u3002\u6301\u7eed\u4e0b\u964d\u53ef\u80fd\u8868\u660e\u6982\u5ff5\u6f02\u79fb\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/#_17","title":"\u6a21\u578b\u9000\u5316","text":"<ul> <li>\u6a21\u578b\u4f1a\u56e0\u591a\u79cd\u539f\u56e0\u968f\u65f6\u95f4\u9000\u5316\uff1a\u6570\u636e\u6f02\u79fb\u3001\u6982\u5ff5\u6f02\u79fb\u3001\u7279\u5f81\u6d41\u6c34\u7ebf\u9519\u8bef\uff08\u7279\u5f81\u5f00\u59cb\u8fd4\u56de\u7a7a\u503c\uff09\u4ee5\u53ca\u4e0a\u6e38\u6570\u636e\u53d8\u5316\uff08\u7b2c\u4e09\u65b9API\u66f4\u6539\u5176\u54cd\u5e94\u683c\u5f0f\uff09\u3002</li> <li>\u54cd\u5e94\uff1a\u68c0\u6d4b\u5230\u9000\u5316\u65f6\uff0c\u884c\u52a8\u53d6\u51b3\u4e8e\u4e25\u91cd\u7a0b\u5ea6\uff1a<ul> <li>\u8f7b\u5ea6\uff1a\u5728\u6700\u8fd1\u6570\u636e\u4e0a\u91cd\u65b0\u8bad\u7ec3\uff08\u5b9a\u65f6\u91cd\u65b0\u8bad\u7ec3\u53ef\u5904\u7406\u6b64\u60c5\u51b5\uff09\u3002</li> <li>\u4e2d\u5ea6\uff1a\u8c03\u67e5\u6839\u672c\u539f\u56e0\uff08\u54ea\u4e2a\u7279\u5f81\u53d1\u751f\u4e86\u53d8\u5316\uff1f\u54ea\u4e2a\u7528\u6237\u7fa4\u4f53\u53d7\u5230\u5f71\u54cd\uff1f\uff09\u3002</li> <li>\u4e25\u91cd\uff1a\u7acb\u5373\u56de\u6eda\u5230\u4ee5\u524d\u7684\u6a21\u578b\u7248\u672c\uff0c\u7136\u540e\u8c03\u67e5\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/#_18","title":"\u53cd\u9988\u5faa\u73af","text":"<ul> <li>ML\u7cfb\u7edf\u521b\u5efa\u53cd\u9988\u5faa\u73af\uff1a\u6a21\u578b\u7684\u9884\u6d4b\u5f71\u54cd\u7528\u6237\u884c\u4e3a\uff0c\u540e\u8005\u6210\u4e3a\u4e0b\u4e00\u4e2a\u6a21\u578b\u7248\u672c\u7684\u8bad\u7ec3\u6570\u636e\u3002\u8fd9\u4e9b\u5faa\u73af\u53ef\u80fd\u662f\u826f\u6027\u7684\uff0c\u4e5f\u53ef\u80fd\u662f\u6076\u6027\u7684\u3002</li> <li>\u6b63\u53cd\u9988\u5faa\u73af\uff08\u5371\u9669\u7684\uff09\uff1a\u63a8\u8350\u6a21\u578b\u4e3b\u8981\u5c55\u793a\u70ed\u95e8\u5546\u54c1\u2192\u7528\u6237\u70b9\u51fb\u70ed\u95e8\u5546\u54c1\uff08\u56e0\u4e3a\u4ed6\u4eec\u53ea\u770b\u5230\u8fd9\u4e9b\uff09\u2192\u6a21\u578b\u4e86\u89e3\u5230\u70ed\u95e8\u5546\u54c1\u66f4\u53d7\u6b22\u8fce\u2192\u591a\u6837\u6027\u5d29\u6e83\u3002\u6a21\u578b\u521b\u9020\u4e86\u786e\u8ba4\u5176\u504f\u89c1\u7684\u6570\u636e\u3002</li> <li>\u8d1f\u53cd\u9988\u5faa\u73af\uff08\u4e5f\u5371\u9669\u7684\uff09\uff1a\u6b3a\u8bc8\u68c0\u6d4b\u6a21\u578b\u6355\u83b7\u4e86\u6240\u6709A\u7c7b\u6b3a\u8bc8\u2192\u6ca1\u6709A\u7c7b\u6b3a\u8bc8\u8fdb\u5165\u8bad\u7ec3\u6570\u636e\u2192\u4e0b\u4e00\u4e2a\u6a21\u578b\u672a\u5b66\u4f1a\u68c0\u6d4bA\u7c7b\u2192A\u7c7b\u6b3a\u8bc8\u91cd\u65b0\u51fa\u73b0\u3002</li> <li>\u7f13\u89e3\u63aa\u65bd\uff1a<ul> <li>\u63a2\u7d22\uff1a\u5c55\u793a\u4e00\u4e9b\u6a21\u578b\u4e0d\u786e\u5b9a\u7684\u5546\u54c1\uff08epsilon-greedy\u3001Thompson\u91c7\u6837\uff09\u3002\u8fd9\u751f\u6210\u4e86\u591a\u6837\u5316\u7684\u8bad\u7ec3\u6570\u636e\u3002</li> <li>\u53cd\u4e8b\u5b9e\u65e5\u5fd7\u8bb0\u5f55\uff1a\u8bb0\u5f55\u6a21\u578b\u672c\u4f1a\u9884\u6d4b\u7684\u7ed3\u679c\uff0c\u800c\u4e0d\u4ec5\u4ec5\u662f\u7528\u6237\u770b\u5230\u7684\u7ed3\u679c\u3002\u5728\u53cd\u4e8b\u5b9e\u6570\u636e\u4e0a\u8bad\u7ec3\u4ee5\u6d88\u9664\u504f\u5dee\u3002</li> <li>\u4fdd\u7559\u96c6\uff1a\u968f\u673a\u5c06\u4e00\u90e8\u5206\u6d41\u91cf\u7528\u4e8e\u65e0\u6a21\u578b\u8fc7\u6ee4\u7684\u670d\u52a1\u3002\u672a\u7ecf\u8fc7\u6ee4\u7684\u6570\u636e\u4e3a\u8bc4\u4f30\u6a21\u578b\u8d28\u91cf\u63d0\u4f9b\u4e86\u771f\u5b9e\u4f9d\u636e\u3002</li> <li>\u5ef6\u8fdf\u6807\u7b7e\uff1a\u5728\u4f7f\u7528\u6570\u636e\u8bad\u7ec3\u4e4b\u524d\u7b49\u5f85\u771f\u5b9e\u7ed3\u679c\u3002\u4eca\u5929\u70b9\u51fb\u7684\u63a8\u8350\u53ef\u80fd\u660e\u5929\u5c31\u540e\u6094\u3002\u6b3a\u8bc8\u9884\u6d4b\u5fc5\u987b\u7b49\u5f85\u9000\u6b3e\u7a97\u53e3\uff0830-90\u5929\uff09\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/#_19","title":"\u5d4c\u5165\u8868\u7ba1\u7406","text":"<ul> <li>\u5927\u89c4\u6a21ML\u7cfb\u7edf\u901a\u5e38\u6709\u5305\u542b1\u4ebf+\u6761\u76ee\u7684\u5d4c\u5165\u8868\uff08\u6bcf\u4e2a\u7528\u6237\u3001\u5546\u54c1\u3001\u5e7f\u544a\u6216\u5b9e\u4f53\u4e00\u4e2a\u5d4c\u5165\uff09\u3002\u5927\u89c4\u6a21\u7ba1\u7406\u8fd9\u4e9b\u662f\u7cfb\u7edf\u6311\u6218\uff1a</li> <li>\u5b58\u50a8\uff1a1\u4ebf\u5b9e\u4f53\u00d7256\u7ef4\u00d7float16 = 50 GB\u3002\u4e0d\u9002\u5408GPU\u5185\u5b58\u3002\u89e3\u51b3\u65b9\u6848\uff1a\u5b58\u50a8\u5728CPU\u5185\u5b58\u4e2d\u5e76\u914d\u5408GPU\u7aef\u7f13\u5b58\uff0c\u8de8\u591a\u53f0\u673a\u5668\u5206\u7247\uff0c\u6216\u4f7f\u7528\u54c8\u5e0c\u5d4c\u5165\uff08\u5c06\u5b9e\u4f53\u54c8\u5e0c\u5230\u56fa\u5b9a\u5927\u5c0f\u7684\u8868\uff0c\u63a5\u53d7\u51b2\u7a81\uff09\u3002</li> <li>\u66f4\u65b0\uff1a\u5d4c\u5165\u968f\u6a21\u578b\u91cd\u65b0\u8bad\u7ec3\u800c\u53d8\u5316\u3002\u5411\u670d\u52a1\u90e8\u7f72\u65b0\u7684\u5d4c\u5165\u8868\u9700\u8981\uff1a\u5728\u4e0d\u4e2d\u65ad\u5b9e\u65f6\u6d41\u91cf\u65f6\u52a0\u8f7d50 GB\u5230\u5185\u5b58\uff0c\u9a8c\u8bc1\u6b63\u786e\u6027\uff0c\u4ee5\u53ca\u5728\u6307\u6807\u4e0b\u964d\u65f6\u56de\u6eda\u3002\u5bf9\u5d4c\u5165\u8868\u4f7f\u7528\u84dd\u7eff\u90e8\u7f72\u3002</li> <li>\u9648\u65e7\u5ea6\uff1a\u65b0\u521b\u5efa\u7684\u7528\u6237\u6ca1\u6709\u5d4c\u5165\uff08\u51b7\u542f\u52a8\u95ee\u9898\uff09\u3002\u89e3\u51b3\u65b9\u6848\uff1a\u4f7f\u7528\u9ed8\u8ba4\u5d4c\u5165\uff0c\u901a\u8fc7\u7279\u5f81\u5230\u5d4c\u5165\u6a21\u578b\u4ece\u7528\u6237\u7279\u5f81\u6d3e\u751f\u5d4c\u5165\uff0c\u6216\u56de\u9000\u5230\u975e\u4e2a\u6027\u5316\u6a21\u578b\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/04.%20ML%20systems%20design/#_20","title":"\u516c\u5e73\u6027\u548c\u504f\u89c1","text":"<ul> <li>ML\u7cfb\u7edf\u53ef\u80fd\u4f1a\u7cfb\u7edf\u6027\u5730\u5bf9\u5f85\u4e0d\u540c\u7fa4\u4f53\u4e0d\u540c\uff0c\u901a\u5e38\u53cd\u6620\u4e86\u8bad\u7ec3\u6570\u636e\u4e2d\u7684\u504f\u89c1\u3002\u516c\u5e73\u6027\u76d1\u63a7\u662f\u4e00\u79cd\u8d23\u4efb\uff0c\u4e0d\u662f\u53ef\u9009\u529f\u80fd\u3002</li> <li>\u76d1\u63a7\u6307\u6807\uff1a<ul> <li>\u4eba\u53e3\u7edf\u8ba1\u5747\u7b49\uff1a\u4e0d\u540c\u7fa4\u4f53\uff08\u6027\u522b\u3001\u79cd\u65cf\u3001\u5e74\u9f84\uff09\u7684\u6b63\u9884\u6d4b\u7387\u662f\u5426\u4e0d\u540c\uff1f</li> <li>\u5747\u7b49\u673a\u4f1a\uff1a\u4e0d\u540c\u7fa4\u4f53\u7684\u771f\u9633\u6027\u7387\u662f\u5426\u4e0d\u540c\uff1f\uff08\u62db\u8058\u6a21\u578b\u5e94\u8be5\u540c\u6837\u64c5\u957f\u8bc6\u522b\u6240\u6709\u7fa4\u4f53\u7684\u5408\u683c\u5019\u9009\u4eba\u3002\uff09</li> <li>\u6821\u51c6\uff1a\u5982\u679c\u6a21\u578b\u8bf4P(\u5408\u683c) = 0.7\u5bf9\u4e8e\u7fa4\u4f53A\uff0c\u90a3\u4e48\u7fa4\u4f53A\u4e2d\u5b9e\u9645\u4e0a\u670970%\u662f\u5408\u683c\u7684\u5417\uff1f\u5bf9\u4e8e\u7fa4\u4f53B\u4e5f\u662f\u540c\u6837\uff1f</li> </ul> </li> <li>\u5b9e\u9645\u6b65\u9aa4\uff1a<ul> <li>\u5728\u5206\u7247\uff08\u5b50\u7ec4\uff09\u4e0a\u8bc4\u4f30\u6a21\u578b\u6027\u80fd\uff0c\u800c\u4e0d\u4ec5\u4ec5\u662f\u603b\u4f53\u6307\u6807\u3002</li> <li>\u5728\u6a21\u578b\u8bc4\u4f30\u6d41\u6c34\u7ebf\u4e2d\u7eb3\u5165\u516c\u5e73\u6027\u6307\u6807\uff08\u4e00\u4e2a\u63d0\u9ad8\u603b\u4f53\u51c6\u786e\u7387\u4f46\u964d\u4f4e\u7279\u5b9a\u7fa4\u4f53\u6027\u80fd\u7684\u6a21\u578b\u672a\u7ecf\u5ba1\u67e5\u4e0d\u5e94\u90e8\u7f72\uff09\u3002</li> <li>\u8bb0\u5f55\u5df2\u77e5\u7684\u9650\u5236\u548c\u5931\u8d25\u6a21\u5f0f\u3002</li> <li>\u4e3a\u5728\u654f\u611f\u9886\u57df\uff08\u62db\u8058\u3001\u8d37\u6b3e\u3001\u5211\u4e8b\u53f8\u6cd5\u3001\u533b\u7597\uff09\u90e8\u7f72\u7684\u6a21\u578b\u5efa\u7acb\u5ba1\u67e5\u6d41\u7a0b\u3002</li> </ul> </li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/","title":"ML\u8bbe\u8ba1\u793a\u4f8b","text":"<p>\u5b66\u4e60ML\u7cfb\u7edf\u8bbe\u8ba1\u7684\u6700\u4f73\u65b9\u5f0f\u662f\u901a\u8fc7\u5b9e\u64cd\u793a\u4f8b\u3002\u672c\u6587\u4ef6\u8be6\u7ec6\u4ecb\u7ecd\u4e86\u4e03\u4e2a\u5b8c\u6574\u7684\u8bbe\u8ba1\uff1a\u63a8\u8350\u7cfb\u7edf\u3001\u641c\u7d22\u6392\u5e8f\u3001\u5e7f\u544a\u70b9\u51fb\u9884\u6d4b\u3001\u6b3a\u8bc8\u68c0\u6d4b\u3001\u5185\u5bb9\u5ba1\u6838\u3001\u5bf9\u8bdd\u5f0fAI\u548c\u5927\u89c4\u6a21\u56fe\u50cf\u641c\u7d22</p> <ul> <li>\u6bcf\u4e2a\u793a\u4f8b\u9075\u5faa\u4e00\u81f4\u7684\u6846\u67b6\uff1a<ol> <li>\u95ee\u9898\u5b9a\u4e49\uff1a\u6211\u4eec\u5728\u6784\u5efa\u4ec0\u4e48\uff0c\u7528\u6237\u662f\u8c01\uff0c\u7ea6\u675f\u662f\u4ec0\u4e48\uff1f</li> <li>\u6570\u636e\uff1a\u6211\u4eec\u6709\u4ec0\u4e48\u6570\u636e\uff0c\u5982\u4f55\u6536\u96c6\uff0c\u5982\u4f55\u6807\u6ce8\uff1f</li> <li>\u7279\u5f81\uff1a\u6a21\u578b\u9700\u8981\u4ec0\u4e48\u7279\u5f81\uff1f</li> <li>\u6a21\u578b\uff1a\u4ec0\u4e48\u67b6\u6784\u548c\u8bad\u7ec3\u65b9\u6cd5\uff1f</li> <li>\u670d\u52a1\uff1a\u6a21\u578b\u5982\u4f55\u90e8\u7f72\u548c\u63d0\u4f9b\u670d\u52a1\uff1f</li> <li>\u8bc4\u4f30\uff1a\u6211\u4eec\u5982\u4f55\u8861\u91cf\u6210\u529f\uff1f</li> <li>\u8fed\u4ee3\uff1a\u968f\u7740\u65f6\u95f4\u7684\u63a8\u79fb\uff0c\u6211\u4eec\u4f1a\u505a\u54ea\u4e9b\u6539\u8fdb\uff1f</li> </ol> </li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#1-youtubenetflixspotify","title":"1. \u63a8\u8350\u7cfb\u7edf\uff08\u4f8b\u5982YouTube\u3001Netflix\u3001Spotify\uff09","text":""},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_1","title":"\u95ee\u9898\u5b9a\u4e49","text":"<ul> <li>\u76ee\u6807\uff1a\u5411\u7528\u6237\u5c55\u793a\u4ed6\u4eec\u4f1a\u559c\u6b22\u7684\u5185\u5bb9\uff0c\u6700\u5927\u5316\u53c2\u4e0e\u5ea6\uff08\u89c2\u770b\u65f6\u95f4\u3001\u6536\u542c\u6b21\u6570\u3001\u70b9\u51fb\u91cf\uff09\u3002</li> <li>\u89c4\u6a21\uff1a10\u4ebf+\u7528\u6237\uff0c1\u4ebf+\u9879\u76ee\uff0c\u6bcf\u79d210K+\u63a8\u8350\u3002</li> <li>\u5ef6\u8fdf\uff1a\u5b8c\u6574\u63a8\u8350\u6d41\u6c34\u7ebf&lt;200ms\u3002</li> <li>\u5173\u952e\u6311\u6218\uff1a\u5019\u9009\u7a7a\u95f4\u5de8\u5927\uff081\u4ebf\u4e2a\u9879\u76ee\uff09\u3002\u65e0\u6cd5\u4e3a\u6240\u6709\u7528\u6237\u5b9e\u65f6\u8bc4\u5206\u6240\u6709\u9879\u76ee\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_2","title":"\u67b6\u6784\uff1a\u4e24\u9636\u6bb5\u6d41\u6c34\u7ebf","text":"<pre><code>1\u4ebf\u4e2a\u9879\u76ee \u2192 \u5019\u9009\u751f\u6210\uff08\u5feb\u901f\u3001\u7c97\u7565\uff09\u2192 1000\u4e2a\u5019\u9009\n          \u2192 \u6392\u5e8f\uff08\u7f13\u6162\u3001\u7cbe\u786e\uff09\u2192 100\u4e2a\u6392\u5e8f\u9879\u76ee\n          \u2192 \u91cd\u65b0\u6392\u5e8f\uff08\u4e1a\u52a1\u89c4\u5219\uff09\u2192 \u5c55\u793a\u7ed9\u7528\u6237\u768420\u4e2a\n</code></pre>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_3","title":"\u5019\u9009\u751f\u6210","text":"<ul> <li>\u76ee\u6807\uff1a\u5c061\u4ebf\u4e2a\u9879\u76ee\u51cf\u5c11\u5230\u7ea61000\u4e2a\u5019\u9009\u3002\u5fc5\u987b\u5feb\u901f\uff08&lt;50ms\uff09\u3002</li> <li>\u53cc\u5854\u6a21\u578b\uff1a\u5c06\u7528\u6237\u548c\u9879\u76ee\u7f16\u7801\u5230\u76f8\u540c\u7684\u5d4c\u5165\u7a7a\u95f4\u3002\u7528\u6237\u5d4c\u5165\u6355\u83b7\u504f\u597d\uff1b\u9879\u76ee\u5d4c\u5165\u6355\u83b7\u5185\u5bb9\u7279\u5f81\u3002\u5f97\u5206 = \u7528\u6237\u5d4c\u5165\u548c\u9879\u76ee\u5d4c\u5165\u7684\u70b9\u79ef\u3002</li> <li>\u8bad\u7ec3\uff1a\u5728\uff08\u7528\u6237\u3001\u6b63\u6837\u672c\u3001\u8d1f\u6837\u672c\uff09\u4e09\u5143\u7ec4\u4e0a\u8fdb\u884c\u5bf9\u6bd4\u5b66\u4e60\u3002\u6b63\u6837\u672c=\u7528\u6237\u53c2\u4e0e\u8fc7\u7684\u9879\u76ee\u3002\u8d1f\u6837\u672c=\u968f\u673a\u9879\u76ee+\u96be\u8d1f\u6837\u672c\uff08\u7528\u6237\u672a\u53c2\u4e0e\u8fc7\u7684\u70ed\u95e8\u9879\u76ee\uff09\u3002</li> <li>\u670d\u52a1\uff1a\u9884\u5148\u8ba1\u7b97\u6240\u6709\u9879\u76ee\u5d4c\u5165\u3002\u5728\u8bf7\u6c42\u65f6\uff1a\u8ba1\u7b97\u7528\u6237\u5d4c\u5165\uff0cANN\u641c\u7d22\uff08\u5411\u91cf\u6570\u636e\u5e93\u4e2d\u7684HNSW\uff09\u4ee5\u627e\u5230\u6700\u8fd1\u76841000\u4e2a\u9879\u76ee\u5d4c\u5165\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_4","title":"\u6392\u5e8f","text":"<ul> <li>\u76ee\u6807\uff1a\u7cbe\u786e\u8bc4\u52061000\u4e2a\u5019\u9009\u3002\u53ef\u4ee5\u82b1\u8d39\u7ea6100ms\u3002</li> <li>\u6a21\u578b\uff1a\u4e00\u4e2a\u6df1\u5ea6\u795e\u7ecf\u7f51\u7edc\uff08MLP\u6216Transformer\uff09\uff0c\u4f7f\u7528\u4e30\u5bcc\u7279\u5f81\uff1a\u7528\u6237\u7279\u5f81\uff08\u4eba\u53e3\u7edf\u8ba1\u3001\u5386\u53f2\u3001\u4e0a\u4e0b\u6587\uff09\u3001\u9879\u76ee\u7279\u5f81\uff08\u5185\u5bb9\u3001\u6d41\u884c\u5ea6\u3001\u65b0\u9c9c\u5ea6\uff09\u548c\u4ea4\u53c9\u7279\u5f81\uff08\u7528\u6237-\u9879\u76ee\u4ea4\u4e92\u5386\u53f2\u3001\u4e0a\u4e0b\u6587\u76f8\u5173\u6027\uff09\u3002</li> <li>\u8f93\u51fa\uff1a\u9884\u6d4b\u7684\u53c2\u4e0e\u6982\u7387\uff08\u70b9\u51fb\u3001\u89c2\u770b50%+\u3001\u70b9\u8d5e\u3001\u5206\u4eab\uff09\u3002\u591a\u4e2a\u76ee\u6807\u53ef\u4ee5\u7ec4\u5408\uff1a\\(\\text{score} = w_1 \\cdot P(\\text{\u70b9\u51fb}) + w_2 \\cdot P(\\text{\u89c2\u770b}) + w_3 \\cdot P(\\text{\u70b9\u8d5e})\\)\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_5","title":"\u91cd\u65b0\u6392\u5e8f","text":"<ul> <li>\u5e94\u7528\u4e1a\u52a1\u89c4\u5219\uff1a\u591a\u6837\u6027\uff08\u4e0d\u5c55\u793a\u6765\u81ea\u540c\u4e00\u521b\u4f5c\u8005\u76845\u4e2a\u89c6\u9891\uff09\u3001\u65b0\u9c9c\u5ea6\uff08\u63d0\u5347\u65b0\u5185\u5bb9\uff09\u3001\u5b89\u5168\uff08\u8fc7\u6ee4\u88ab\u6807\u8bb0\u7684\u5185\u5bb9\uff09\u548c\u4e2a\u6027\u5316\u63a2\u7d22\uff08\u5c55\u793a\u4e00\u4e9b\u7528\u6237\u53ef\u80fd\u53d1\u73b0\u7684\u4f4e\u6392\u540d\u9879\u76ee\uff09\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_6","title":"\u7c97\u7565\u4f30\u7b97\u6570\u5b57","text":"<ul> <li>\u9879\u76ee\u5d4c\u5165\u7d22\u5f15\uff1a1\u4ebf\u4e2a\u9879\u76ee\u00d7256\u7ef4\u00d7float16 = 50 GB\u3002HNSW\u7d22\u5f15\u589e\u52a0\u7ea62\u500d\u5f00\u9500\u2192\u7ea6100 GB\u3002\u9002\u5408\u5177\u6709128 GB\u5185\u5b58\u7684\u5355\u53f0\u673a\u5668\uff0c\u6216\u5206\u7247\u52304\u00d732 GB\u673a\u5668\u3002</li> <li>\u7528\u6237\u5d4c\u5165\u8ba1\u7b97\uff1a\u6bcf\u4e2a\u7528\u6237\u7ea65ms\uff08\u5c0f\u578bMLP\u5904\u7406\u7528\u6237\u7279\u5f81\uff09\u3002\u572810K QPS\u4e0b\uff0c\u9700\u8981\u7ea650\u4e2a\u6a21\u578b\u526f\u672c\u5904\u7406\u8d1f\u8f7d\u3002</li> <li>ANN\u641c\u7d22\uff1a\u4f7f\u7528HNSW\u4ece1\u4ebf\u4e2a\u5411\u91cf\u4e2d\u641c\u7d22\u524d1000\u4e2a\u7ea6\u97002ms\u3002\u572810K QPS\u4e0b\uff0c\u6bcf\u4e2a\u7d22\u5f15\u526f\u672c\u5904\u7406\u7ea6500 QPS\u2192\u9700\u898120\u4e2a\u526f\u672c\u3002</li> <li>\u6392\u5e8f\u6a21\u578b\uff1a1000\u4e2a\u5019\u9009\u00d7\u6bcf\u4e2a\u5019\u9009\u7ea60.1ms = \u6bcf\u6b21\u8bf7\u6c42100ms\u3002\u572810K QPS\u4e0b\uff0c\u9700\u8981\u6bcf\u79d21000 GPU\u79d2\u2192\u4ec5\u6392\u5e8f\u5c31\u9700\u8981\u7ea610\u4e2aA10G GPU\u3002</li> <li>\u603b\u57fa\u7840\u8bbe\u65bd\uff1a\u7ea620\u4e2a\u5d4c\u5165\u7d22\u5f15\u526f\u672c+\u7ea650\u4e2a\u7528\u6237\u5d4c\u5165\u670d\u52a1\u5668+\u7ea610\u4e2a\u6392\u5e8fGPU+\u7f13\u5b58+\u8d1f\u8f7d\u5747\u8861\u5668\u3002\u6210\u672c\uff1a\u4e91\u4ef7\u683c\u4e0b\u6bcf\u6708\u7ea6\\(5\u4e07-\\)10\u4e07\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_7","title":"\u51b7\u542f\u52a8","text":"<ul> <li>\u65b0\u7528\u6237\uff08\u65e0\u5386\u53f2\u8bb0\u5f55\uff09\uff1a\u4f7f\u7528\u4eba\u53e3\u7edf\u8ba1\u7279\u5f81\u3001\u8bbe\u5907/\u4f4d\u7f6e\u4e0a\u4e0b\u6587\u548c\u57fa\u4e8e\u6d41\u884c\u5ea6\u7684\u63a8\u8350\u3002\u7ecf\u8fc75-10\u6b21\u4ea4\u4e92\u540e\uff0c\u5207\u6362\u5230\u4e2a\u6027\u5316\u6a21\u578b\u3002</li> <li>\u65b0\u9879\u76ee\uff08\u65e0\u53c2\u4e0e\u6570\u636e\uff09\uff1a\u4f7f\u7528\u57fa\u4e8e\u5185\u5bb9\u7684\u7279\u5f81\uff08\u6807\u9898\u3001\u63cf\u8ff0\u3001\u7f29\u7565\u56fe\u5d4c\u5165\uff09\u3002\u5206\u914d\u63a2\u7d22\u9884\u7b97\uff1a\u5411\u4e00\u90e8\u5206\u7528\u6237\u5c55\u793a\u65b0\u9879\u76ee\u4ee5\u5feb\u901f\u6536\u96c6\u53c2\u4e0e\u6570\u636e\u3002\u5728\u7ecf\u8fc7\u63d0\u5347\u671f\u540e\u4ecd\u65e0\u53c2\u4e0e\u7684\u9879\u76ee\u88ab\u964d\u7ea7\u3002</li> <li>\u51b7\u542f\u52a8\u662f\u7cfb\u7edf\u95ee\u9898\uff1a\u7279\u5f81\u5b58\u50a8\u5fc5\u987b\u4f18\u96c5\u5730\u5904\u7406\u7f3a\u5931\u7279\u5f81\uff08\u8fd4\u56de\u9ed8\u8ba4\u503c\uff0c\u800c\u4e0d\u662f\u9519\u8bef\uff09\u3002\u6a21\u578b\u5fc5\u987b\u4f7f\u7528\u7f3a\u5931\u7279\u5f81\u8fdb\u884c\u8bad\u7ec3\uff08\u8bad\u7ec3\u671f\u95f4\u5bf9\u7528\u6237\u5386\u53f2\u7279\u5f81\u8fdb\u884cdropout\u53ef\u4ee5\u6a21\u62df\u65b0\u7528\u6237\uff09\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_8","title":"\u8bc4\u4f30","text":"<ul> <li>\u79bb\u7ebf\uff1aNDCG\uff08\u5f52\u4e00\u5316\u6298\u635f\u7d2f\u8ba1\u589e\u76ca\uff09\u3001Recall@K\u3001Precision@K\u3002</li> <li>\u5728\u7ebf\uff1a\u6d4b\u91cf\u89c2\u770b\u65f6\u95f4\u3001DAU\u3001\u7559\u5b58\u7684A/B\u6d4b\u8bd5\u3002\u957f\u671fA/B\u6d4b\u8bd5\uff08\u6570\u5468\uff09\u4ee5\u6355\u83b7\u77ed\u671f\u6d4b\u8bd5\u65e0\u6cd5\u89c2\u5bdf\u5230\u7684\u7528\u6237\u7559\u5b58\u6548\u5e94\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#2-googlebing","title":"2. \u641c\u7d22\u6392\u5e8f\uff08\u4f8b\u5982Google\u3001Bing\uff09","text":""},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_9","title":"\u95ee\u9898\u5b9a\u4e49","text":"<ul> <li>\u76ee\u6807\uff1a\u7ed9\u5b9a\u7528\u6237\u67e5\u8be2\uff0c\u4ece\u6570\u5341\u4ebf\u6587\u6863\u7684\u8bed\u6599\u5e93\u4e2d\u8fd4\u56de\u6700\u76f8\u5173\u7684\u7ed3\u679c\u3002</li> <li>\u5ef6\u8fdf\uff1a\u603b\u8ba1&lt;500ms\uff08\u68c0\u7d22100ms + \u6392\u5e8f200ms + \u6e32\u67d3100ms + \u5f00\u9500\uff09\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_10","title":"\u67b6\u6784\uff1a\u67e5\u8be2\u7406\u89e3\u2192\u68c0\u7d22\u2192\u6392\u5e8f","text":""},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_11","title":"\u67e5\u8be2\u7406\u89e3","text":"<ul> <li>\u5728\u68c0\u7d22\u4e4b\u524d\uff0c\u5904\u7406\u539f\u59cb\u67e5\u8be2\u4ee5\u6539\u8fdb\u7ed3\u679c\uff1a</li> <li>\u62fc\u5199\u7ea0\u6b63\uff1a\"reccomendation systm\"\u2192\"recommendation system\"\u3002\u4f7f\u7528\u7f16\u8f91\u8ddd\u79bb\u6a21\u578b\u6216\u5e8f\u5217\u5230\u5e8f\u5217\u6a21\u578b\uff0c\u5728\uff08\u62fc\u5199\u9519\u8bef\uff0c\u7ea0\u6b63\uff09\u5bf9\u4e0a\u8bad\u7ec3\uff0c\u6570\u636e\u6765\u81ea\u641c\u7d22\u65e5\u5fd7\u3002</li> <li>\u67e5\u8be2\u6269\u5c55\uff1a\u6dfb\u52a0\u76f8\u5173\u672f\u8bed\u4ee5\u63d0\u9ad8\u53ec\u56de\u7387\u3002\"Python ML\"\u2192\"Python machine learning scikit-learn pytorch\u3002\"\u4f7f\u7528\u540c\u4e49\u8bcd\u8bcd\u5178\u3001\u8bcd\u5d4c\u5165\u6216LLM\u751f\u6210\u6269\u5c55\u3002</li> <li>\u610f\u56fe\u5206\u7c7b\uff1a\u786e\u5b9a\u7528\u6237\u60f3\u8981\u4ec0\u4e48\u3002\"buy Nike shoes\"\u662f\u4ea4\u6613\u578b\uff08\u5c55\u793a\u4ea7\u54c1\u9875\u9762\uff09\u3002\"How does backpropagation work\"\u662f\u4fe1\u606f\u578b\uff08\u5c55\u793a\u6587\u7ae0\uff09\u3002\"facebook.com\"\u662f\u5bfc\u822a\u578b\uff08\u76f4\u63a5\u8f6c\u5230\u7f51\u7ad9\uff09\u3002\u4e0d\u540c\u610f\u56fe\u5e94\u89e6\u53d1\u4e0d\u540c\u7684\u68c0\u7d22\u7b56\u7565\u548c\u7ed3\u679c\u5e03\u5c40\u3002</li> <li>\u5b9e\u4f53\u8bc6\u522b\uff1a\u4ece\u67e5\u8be2\u4e2d\u63d0\u53d6\u5b9e\u4f53\u3002\"best restaurants near Times Square\"\u2192\u4f4d\u7f6e\uff1a\"Times Square\"\uff0c\u5b9e\u4f53\u7c7b\u578b\uff1a\"restaurants\u3002\"\u8def\u7531\u5230\u4f4d\u7f6e\u611f\u77e5\u641c\u7d22\u6d41\u6c34\u7ebf\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_12","title":"\u68c0\u7d22","text":"<ul> <li>BM25\uff08\u4f20\u7edf\uff09\uff1a\u4f7f\u7528\u5012\u6392\u7d22\u5f15\u8fdb\u884c\u8bcd\u5339\u914d\u68c0\u7d22\u3002\u5feb\u901f\uff0c\u5bf9\u5173\u952e\u8bcd\u67e5\u8be2\u6709\u6548\u3002\u6ca1\u6709\u8bed\u4e49\u7406\u89e3\uff08\"dog food\"\u4e0d\u5339\u914d\"canine nutrition\"\uff09\u3002</li> <li>\u7a20\u5bc6\u68c0\u7d22\uff1a\u5c06\u67e5\u8be2\u548c\u6587\u6863\u7f16\u7801\u4e3a\u5d4c\u5165\uff08\u4f7f\u7528\u5982DPR\u6216ColBERT\u7684\u53cc\u7f16\u7801\u5668\uff09\u3002\u901a\u8fc7ANN\u641c\u7d22\u68c0\u7d22\u3002\u6355\u83b7\u8bed\u4e49\u76f8\u4f3c\u6027\uff08\"dog food\"\u5339\u914d\"canine nutrition\"\uff09\u3002\u6bd4BM25\u6162\uff0c\u4f46\u5bf9\u4e8e\u81ea\u7136\u8bed\u8a00\u67e5\u8be2\u66f4\u597d\u3002</li> <li>\u6df7\u5408\u68c0\u7d22\uff1a\u7ed3\u5408BM25\u548c\u7a20\u5bc6\u68c0\u7d22\u3002BM25\u627e\u5230\u7cbe\u786e\u5173\u952e\u8bcd\u5339\u914d\uff1b\u7a20\u5bc6\u68c0\u7d22\u627e\u5230\u8bed\u4e49\u5339\u914d\u3002\u5408\u5e76\u5e76\u53bb\u91cd\u3002\u4e24\u5168\u5176\u7f8e\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_13","title":"\u6392\u5e8f","text":"<ul> <li>\u5b66\u4e60\u6392\u5e8f\uff1a\u4e00\u4e2a\u6a21\u578b\u5bf9\u6bcf\u4e2a\uff08\u67e5\u8be2\uff0c\u6587\u6863\uff09\u5bf9\u8bc4\u5206\u3002\u4e09\u79cd\u65b9\u6cd5\uff1a<ul> <li>\u70b9\u5f0f\uff1a\u72ec\u7acb\u9884\u6d4b\u6bcf\u4e2a\u6587\u6863\u7684\u76f8\u5173\u6027\u5206\u6570\u3002\u7b80\u5355\u4f46\u5ffd\u7565\u76f8\u5bf9\u987a\u5e8f\u3002</li> <li>\u6210\u5bf9\u5f0f\uff1a\u9884\u6d4b\u4e24\u4e2a\u6587\u6863\u4e2d\u54ea\u4e2a\u66f4\u76f8\u5173\u3002LambdaMART\uff08\u68af\u5ea6\u63d0\u5347\u6811\uff09\u662f\u7ecf\u5178\u65b9\u6cd5\u3002</li> <li>\u5217\u8868\u5f0f\uff1a\u76f4\u63a5\u9488\u5bf9\u5217\u8868\u7ea7\u6307\u6807\uff08NDCG\uff09\u4f18\u5316\u6574\u4e2a\u6392\u5e8f\u5217\u8868\u3002\u66f4\u590d\u6742\u4f46\u7ed3\u679c\u6700\u597d\u3002</li> </ul> </li> <li>\u4ea4\u53c9\u7f16\u7801\u5668\uff1a\u4e00\u4e2a\u4ee5<code>[\u67e5\u8be2\uff0c\u6587\u6863]</code>\u4e3a\u8f93\u5165\u5e76\u8f93\u51fa\u76f8\u5173\u6027\u5206\u6570\u7684Transformer\u3002\u6bd4\u53cc\u7f16\u7801\u5668\u66f4\u51c6\u786e\uff08\u540e\u8005\u72ec\u7acb\u7f16\u7801\u67e5\u8be2\u548c\u6587\u6863\uff09\uff0c\u56e0\u4e3a\u5b83\u6355\u83b7\u4e86\u7ec6\u7c92\u5ea6\u7684\u4ea4\u4e92\u3002\u4f46\u5bf9\u4e8e\u5b8c\u6574\u8bed\u6599\u5e93\u6765\u8bf4\u592a\u6162\u2014\u2014\u4ec5\u7528\u4e8e\u5bf9\u68c0\u7d22\u524d100-1000\u4e2a\u5019\u9009\u8fdb\u884c\u91cd\u65b0\u6392\u5e8f\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_14","title":"\u7279\u5f81","text":"<ul> <li>\u67e5\u8be2\u7279\u5f81\uff1a\u67e5\u8be2\u957f\u5ea6\u3001\u8bed\u8a00\u3001\u610f\u56fe\u5206\u7c7b\uff08\u5bfc\u822a\u578b\u3001\u4fe1\u606f\u578b\u3001\u4ea4\u6613\u578b\uff09\u3002</li> <li>\u6587\u6863\u7279\u5f81\uff1aPageRank\u3001\u65b0\u9c9c\u5ea6\u3001\u5185\u5bb9\u8d28\u91cf\u5206\u6570\u3001\u57df\u540d\u6743\u5a01\u6027\u3002</li> <li>\u67e5\u8be2-\u6587\u6863\u7279\u5f81\uff1aBM25\u5206\u6570\u3001\u5d4c\u5165\u76f8\u4f3c\u5ea6\u3001\u7cbe\u786e\u5339\u914d\u6570\u3001\u5386\u53f2\u65e5\u5fd7\u4e2d\u6b64\uff08\u67e5\u8be2\uff0c\u6587\u6863\uff09\u5bf9\u7684\u70b9\u51fb\u7387\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#3","title":"3. \u5e7f\u544a\u70b9\u51fb\u9884\u6d4b","text":""},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_15","title":"\u95ee\u9898\u5b9a\u4e49","text":"<ul> <li>\u76ee\u6807\uff1a\u9884\u6d4b\u7528\u6237\u70b9\u51fb\u5e7f\u544a\u7684\u6982\u7387\u3002\u8fd9\u51b3\u5b9a\u5728\u5b9e\u65f6\u62cd\u5356\u4e2d\u51fa\u4ef7\u591a\u5c11\u3002</li> <li>\u89c4\u6a21\uff1a\u6bcf\u79d2100K+\u6b21\u62cd\u5356\uff0c\u6bcf\u6b21\u9884\u6d4b\u9700\u572810ms\u5185\u5b8c\u6210\u3002</li> <li>\u6536\u5165\u5f71\u54cd\uff1a\u70b9\u51fb\u9884\u6d4b\u51c6\u786e\u7387\u63d0\u9ad80.1%\u5c31\u76f8\u5f53\u4e8e\u6570\u767e\u4e07\u7684\u989d\u5916\u6536\u5165\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_16","title":"\u67b6\u6784","text":"<ul> <li>\u7279\u5f81\u5de5\u7a0b\u662f\u5e7f\u544a\u7cfb\u7edf\u7684\u6838\u5fc3\u3002\u7279\u5f81\u5305\u62ec\uff1a<ul> <li>\u7528\u6237\u7279\u5f81\uff1a\u4eba\u53e3\u7edf\u8ba1\u3001\u6d4f\u89c8\u5386\u53f2\u3001\u8d2d\u4e70\u5386\u53f2\u3001\u8bbe\u5907\u3001\u4f4d\u7f6e\u3001\u4e00\u5929\u4e2d\u7684\u65f6\u95f4\u3002</li> <li>\u5e7f\u544a\u7279\u5f81\uff1a\u521b\u610f\uff08\u56fe\u7247/\u6587\u5b57\uff09\u3001\u5e7f\u544a\u4e3b\u3001\u7c7b\u522b\u3001\u5386\u53f2CTR\u3001\u51fa\u4ef7\u91d1\u989d\u3002</li> <li>\u4e0a\u4e0b\u6587\u7279\u5f81\uff1a\u9875\u9762\u5185\u5bb9\u3001\u5e7f\u544a\u4f4d\u7f6e\u3001\u8bbe\u5907\u7c7b\u578b\u3001\u8fde\u63a5\u901f\u5ea6\u3002</li> <li>\u4ea4\u53c9\u7279\u5f81\uff1auser_category\u00d7ad_category\u4ea4\u4e92\uff0cuser_region\u00d7ad_campaign\u4ea4\u4e92\u3002</li> </ul> </li> <li>\u6a21\u578b\uff1a\u5386\u53f2\u4e0a\u7528\u903b\u8f91\u56de\u5f52\uff08\u7b80\u5355\u3001\u5feb\u901f\u3001\u53ef\u89e3\u91ca\uff09\u3002\u73b0\u4ee3\u7cfb\u7edf\u4f7f\u7528\u6df1\u5ea6\u5b66\u4e60\uff1aDLRM\uff08\u6df1\u5ea6\u5b66\u4e60\u63a8\u8350\u6a21\u578b\uff09\uff0c\u5bf9\u5206\u7c7b\u7279\u5f81\u4f7f\u7528\u5d4c\u5165\u8868\uff0c\u5bf9\u7a20\u5bc6\u7279\u5f81\u4f7f\u7528MLP\u3002</li> <li>\u6821\u51c6\uff1a\u9884\u6d4b\u6982\u7387\u5fc5\u987b\u51c6\u786e\uff08\u5982\u679c\u6a21\u578b\u8bf4P(\u70b9\u51fb)=0.05\uff0c\u90a3\u4e48\u5b9e\u9645\u4e0a\u5e94\u8be5\u67095%\u7684\u5c55\u793a\u88ab\u70b9\u51fb\uff09\u3002\u6821\u51c6\u81f3\u5173\u91cd\u8981\uff0c\u56e0\u4e3a\u9884\u6d4b\u6982\u7387\u76f4\u63a5\u51b3\u5b9a\u51fa\u4ef7\u91d1\u989d\u3002</li> <li>\u63a2\u7d22-\u5229\u7528\uff1a\u603b\u662f\u5c55\u793a\u9884\u6d4b\u7684\u6700\u4f73\u5e7f\u544a\u5728\u957f\u671f\u6765\u770b\u662f\u6b21\u4f18\u7684\uff08\u4f60\u6c38\u8fdc\u65e0\u6cd5\u53d1\u73b0\u65b0\u5e7f\u544a\u53ef\u80fd\u66f4\u597d\uff09\u3002Thompson\u91c7\u6837\u6216\\(\\epsilon\\)-greedy\u63a2\u7d22\u786e\u4fdd\u6709\u4e00\u90e8\u5206\u5c55\u793a\u5206\u914d\u7ed9\u4e0d\u786e\u5b9a\u6027\u8f83\u9ad8\u7684\u5e7f\u544a\u4ee5\u6536\u96c6\u6570\u636e\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_17","title":"\u5b9e\u65f6\u7ade\u4ef7","text":"<ul> <li>\u5f53\u7528\u6237\u52a0\u8f7d\u9875\u9762\u65f6\uff0c\u5e7f\u544a\u62cd\u5356\u5728&lt;100ms\u5185\u8fdb\u884c\uff1a<ol> <li>\u53d1\u5e03\u8005\u5411\u591a\u4e2a\u5e7f\u544a\u4ea4\u6613\u5e73\u53f0\u53d1\u9001\u7ade\u4ef7\u8bf7\u6c42\uff08\u7528\u6237\u4fe1\u606f\u3001\u9875\u9762\u4e0a\u4e0b\u6587\uff09\u3002</li> <li>\u6bcf\u4e2a\u5e7f\u544a\u4e3b\u7684\u7ade\u4ef7\u670d\u52a1\u5668\u9884\u6d4b\u5176\u5e7f\u544a\u7684CTR\u3002</li> <li>\u51fa\u4ef7 = CTR \u00d7 \u6bcf\u6b21\u70b9\u51fb\u7684\u4ef7\u503c\u3002\u51fa\u4ef7\u9ad8\u7684\u8d62\u5f97\u62cd\u5356\u3002</li> <li>\u83b7\u80dc\u7684\u5e7f\u544a\u88ab\u5c55\u793a\uff1b\u5982\u679c\u88ab\u70b9\u51fb\uff0c\u5e7f\u544a\u4e3b\u4ed8\u8d39\u3002</li> </ol> </li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#4","title":"4. \u6b3a\u8bc8\u68c0\u6d4b","text":""},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_18","title":"\u95ee\u9898\u5b9a\u4e49","text":"<ul> <li>\u76ee\u6807\uff1a\u5b9e\u65f6\u68c0\u6d4b\u6b3a\u8bc8\u6027\u4ea4\u6613\uff08\u4fe1\u7528\u5361\u6b3a\u8bc8\u3001\u8d26\u6237\u76d7\u7528\u3001\u865a\u5047\u8bc4\u8bba\uff09\u3002</li> <li>\u5ef6\u8fdf\uff1a&lt;100ms\uff08\u4ea4\u6613\u5fc5\u987b\u5728\u652f\u4ed8\u5904\u7406\u524d\u88ab\u6279\u51c6\u6216\u6807\u8bb0\uff09\u3002</li> <li>\u5173\u952e\u6311\u6218\uff1a\u6781\u7aef\u7c7b\u522b\u4e0d\u5e73\u8861\uff08\u6b3a\u8bc8\u73870.1%\uff09\u3002\u8bef\u62a5\u4f1a\u963b\u6b62\u5408\u6cd5\u7528\u6237\uff1b\u6f0f\u62a5\u4f1a\u9020\u6210\u91d1\u94b1\u635f\u5931\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_19","title":"\u67b6\u6784","text":""},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_20","title":"\u7279\u5f81","text":"<ul> <li>\u4ea4\u6613\u7279\u5f81\uff1a\u91d1\u989d\u3001\u8d27\u5e01\u3001\u5546\u6237\u7c7b\u522b\u3001\u4e00\u5929\u4e2d\u7684\u65f6\u95f4\u3001\u662f\u5426\u8de8\u56fd\u3002</li> <li>\u7528\u6237\u7279\u5f81\uff1a\u8d26\u6237\u5e74\u9f84\u3001\u5e73\u5747\u4ea4\u6613\u91d1\u989d\u3001\u8fd1\u671f\u4ea4\u6613\u6b21\u6570\u3001\u8bbe\u5907\u6307\u7eb9\u3002</li> <li>\u901f\u5ea6\u7279\u5f81\uff08\u5b9e\u65f6\uff0c\u6765\u81ea\u6d41\u5904\u7406\u6d41\u6c34\u7ebf\uff09\uff1a\u8fc7\u53bb5\u5206\u949f\u5185\u7684\u4ea4\u6613\u6b21\u6570\u3001\u8fc7\u53bb1\u5c0f\u65f6\u5185\u7684\u4e0d\u540c\u5546\u6237\u6570\u3001\u4e0e\u4e0a\u6b21\u4ea4\u6613\u7684\u5730\u7406\u8ddd\u79bb\u3002</li> <li>\u56fe\u7279\u5f81\uff1a\u6b64\u5546\u6237\u662f\u5426\u4e0e\u5df2\u77e5\u6b3a\u8bc8\u56e2\u4f19\u6709\u5173\u8054\uff1f\u6b64\u8bbe\u5907\u662f\u5426\u4e0e\u88ab\u6807\u8bb0\u8d26\u6237\u5171\u4eab\uff1f</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_21","title":"\u6a21\u578b","text":"<ul> <li>\u68af\u5ea6\u63d0\u5347\u6811\uff08XGBoost\u3001LightGBM\uff09\u662f\u8868\u683c\u6570\u636e\u6b3a\u8bc8\u68c0\u6d4b\u7684\u6807\u51c6\u3002\u5b83\u4eec\u5904\u7406\u6df7\u5408\u7279\u5f81\u7c7b\u578b\u3001\u53ef\u89e3\u91ca\uff08\u7279\u5f81\u91cd\u8981\u6027\uff09\u4e14\u8bad\u7ec3\u5feb\u901f\u3002</li> <li>\u5904\u7406\u4e0d\u5e73\u8861\uff1a\u5bf9\u591a\u6570\u7c7b\u8fdb\u884c\u6b20\u91c7\u6837\u3001\u5bf9\u5c11\u6570\u7c7b\u8fdb\u884c\u8fc7\u91c7\u6837\uff08SMOTE\uff09\uff0c\u6216\u5728\u635f\u5931\u51fd\u6570\u4e2d\u4f7f\u7528\u7c7b\u522b\u6743\u91cd\u3002Focal loss\uff08\u7b2c8\u7ae0\uff09\u964d\u4f4e\u7b80\u5355\u8d1f\u6837\u672c\u7684\u6743\u91cd\u3002</li> <li>\u6210\u672c\u77e9\u9635\uff1a\u8bef\u62a5\uff08\u963b\u6b62\u5408\u6cd5\u4ea4\u6613\uff09\u6709\u6210\u672c\uff08\u7528\u6237\u632b\u8d25\u611f\u3001\u9500\u552e\u635f\u5931\uff09\u3002\u6f0f\u62a5\uff08\u9057\u6f0f\u6b3a\u8bc8\uff09\u6709\u4e0d\u540c\u7684\u6210\u672c\uff08\u8d22\u52a1\u635f\u5931\uff09\u3002\u51b3\u7b56\u9608\u503c\u5e94\u6700\u5c0f\u5316\u603b\u9884\u671f\u6210\u672c\uff0c\u800c\u975e\u6700\u5927\u5316\u51c6\u786e\u7387\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_22","title":"\u4eba\u5728\u56de\u8def\u4e2d","text":"<ul> <li>\u4e0d\u786e\u5b9a\u7684\u9884\u6d4b\uff08\u6a21\u578b\u7f6e\u4fe1\u5ea6\u57280.3\u548c0.7\u4e4b\u95f4\uff09\u53d1\u9001\u7ed9\u4eba\u5de5\u5ba1\u6838\u5458\u3002\u5ba1\u6838\u5458\u7684\u51b3\u7b56\u6210\u4e3a\u91cd\u65b0\u8bad\u7ec3\u7684\u6807\u7b7e\u3002\u8fd9\u521b\u5efa\u4e86\u4e00\u4e2a\u53cd\u9988\u5faa\u73af\uff1a\u968f\u7740\u6a21\u578b\u770b\u5230\u66f4\u591a\u6807\u8bb0\u7684\u6b3a\u8bc8\u6848\u4f8b\uff0c\u5b83\u968f\u7740\u65f6\u95f4\u7684\u63a8\u79fb\u800c\u6539\u8fdb\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#5","title":"5. \u5185\u5bb9\u5ba1\u6838","text":""},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_23","title":"\u95ee\u9898\u5b9a\u4e49","text":"<ul> <li>\u76ee\u6807\uff1a\u81ea\u52a8\u68c0\u6d4b\u5e76\u79fb\u9664\u6709\u5bb3\u5185\u5bb9\uff08\u4ec7\u6068\u8a00\u8bba\u3001\u66b4\u529b\u3001\u865a\u5047\u4fe1\u606f\u3001CSAM\uff09\u4ece\u4e00\u4e2a\u5e73\u53f0\u3002</li> <li>\u89c4\u6a21\uff1a\u6bcf\u5929\u6570\u5341\u4ebf\u6761\u5e16\u5b50\uff08\u6587\u672c\u3001\u56fe\u7247\u3001\u89c6\u9891\uff09\u3002</li> <li>\u6311\u6218\uff1a\u4e0a\u4e0b\u6587\u4f9d\u8d56\uff08\u8bbd\u523a\u3001\u620f\u4eff\u3001\u6587\u5316\u7ec6\u5fae\u5dee\u522b\uff09\u3002\u5fc5\u987b\u5728\u8a00\u8bba\u81ea\u7531\u548c\u5b89\u5168\u4e4b\u95f4\u53d6\u5f97\u5e73\u8861\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_24","title":"\u67b6\u6784","text":"<ul> <li>\u591a\u6a21\u6001\u5206\u7c7b\uff1a\u6587\u672c\u3001\u56fe\u7247\u548c\u89c6\u9891\u5206\u522b\u4f7f\u7528\u5355\u72ec\u7684\u6a21\u578b\uff0c\u52a0\u4e0a\u878d\u5408\u5c42\u7ec4\u5408\u5b83\u4eec\u7684\u4fe1\u53f7\u3002</li> <li>\u6587\u672c\u5ba1\u6838\uff1a\u5fae\u8c03\u7684\u8bed\u8a00\u6a21\u578b\u5c06\u6587\u672c\u5206\u7c7b\u4e3a\u7c7b\u522b\uff08\u9a9a\u6270\u3001\u4ec7\u6068\u8a00\u8bba\u3001\u865a\u5047\u4fe1\u606f\u3001\u5783\u573e\u4fe1\u606f\uff09\u3002\u591a\u8bed\u8a00\u6a21\u578b\u5904\u7406100+\u79cd\u8bed\u8a00\u3002</li> <li>\u56fe\u7247\u5ba1\u6838\uff1a\u89c6\u89c9\u6a21\u578b\u68c0\u6d4b\uff1a\u9732\u9aa8\u5185\u5bb9\uff08\u88f8\u4f53\u3001\u66b4\u529b\uff09\u3001\u56fe\u7247\u4e2d\u7684\u6587\u5b57\uff08OCR+\u6587\u672c\u5206\u7c7b\u5668\uff09\u548c\u5df2\u77e5\u6709\u5bb3\u5185\u5bb9\uff08\u54c8\u5e0c\u5339\u914d\u4e0e\u5df2\u77e5CSAM\u6570\u636e\u5e93\u8fdb\u884c\u6bd4\u5bf9\uff09\u3002</li> <li>\u89c6\u9891\u5ba1\u6838\uff1a\u6309\u56fa\u5b9a\u95f4\u9694\u91c7\u6837\u5e27\uff0c\u5bf9\u6bcf\u5e27\u8fd0\u884c\u56fe\u50cf\u5206\u7c7b\u5668\uff0c\u7ed3\u5408\u97f3\u9891\u8f6c\u5f55\uff08ASR\u2192\u6587\u672c\u5206\u7c7b\u5668\uff09\u3002</li> <li>\u7b56\u7565\u5373\u4ee3\u7801\uff1a\u5ba1\u6838\u7b56\u7565\u4ee5\u7ed3\u6784\u5316\u89c4\u5219\u5b9a\u4e49\uff0c\u5c06\u6a21\u578b\u8f93\u51fa\u6620\u5c04\u5230\u64cd\u4f5c\uff1a</li> </ul> <pre><code>if text_model.hate_speech_score &gt; 0.9:\n    action = \"remove\"\nelif text_model.hate_speech_score &gt; 0.7:\n    action = \"human_review\"\nelse:\n    action = \"allow\"\n</code></pre> <ul> <li>\u7b56\u7565\u9891\u7e41\u66f4\u6539\uff08\u65b0\u6cd5\u89c4\u3001\u4e0d\u65ad\u53d1\u5c55\u7684\u89c4\u8303\uff09\u3002\u5c06\u7b56\u7565\u4e0e\u6a21\u578b\u5206\u79bb\u786e\u4fdd\u53ef\u4ee5\u5728\u4e0d\u91cd\u65b0\u8bad\u7ec3\u7684\u60c5\u51b5\u4e0b\u90e8\u7f72\u66f4\u6539\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#vs","title":"\u4e3b\u52a8vs\u88ab\u52a8\u5ba1\u6838","text":"<ul> <li>\u4e3b\u52a8\u5ba1\u6838\uff08\u53d1\u5e03\u524d\uff09\uff1a\u5728\u5185\u5bb9\u4e0a\u7ebf\u524d\u8fd0\u884c\u5206\u7c7b\u5668\u3002\u9ad8\u7f6e\u4fe1\u5ea6\u8fdd\u89c4\u81ea\u52a8\u963b\u6b62\u3002\u8fd9\u9632\u6b62\u4e86\u6709\u5bb3\u5185\u5bb9\u88ab\u770b\u5230\uff0c\u4f46\u4f1a\u589e\u52a0\u53d1\u5e03\u5ef6\u8fdf\u5e76\u5b58\u5728\u8bef\u62a5\u98ce\u9669\uff08\u963b\u6b62\u5408\u6cd5\u5185\u5bb9\uff09\u3002</li> <li>\u88ab\u52a8\u5ba1\u6838\uff08\u53d1\u5e03\u540e\uff09\uff1a\u5185\u5bb9\u7acb\u5373\u4e0a\u7ebf\u3002\u7528\u6237\u53ef\u4ee5\u4e3e\u62a5\u8fdd\u89c4\u3002\u4e3e\u62a5\u89e6\u53d1\u5206\u7c7b\u5668+\u4eba\u5de5\u5ba1\u6838\u3002\u53d1\u5e03\u8005\u5ef6\u8fdf\u4f4e\uff0c\u4f46\u6709\u5bb3\u5185\u5bb9\u5728\u68c0\u6d4b\u5230\u4e4b\u524d\u662f\u53ef\u89c1\u7684\u3002</li> <li>\u5927\u591a\u6570\u5e73\u53f0\u4e24\u8005\u90fd\u7528\uff1a\u5bf9\u9ad8\u4e25\u91cd\u6027\u7c7b\u522b\uff08CSAM\uff1a\u96f6\u5bb9\u5fcd\uff0c\u53d1\u5e03\u524d\u963b\u6b62\uff09\u4f7f\u7528\u4e3b\u52a8\u5ba1\u6838\uff0c\u5bf9\u7ec6\u5fae\u7c7b\u522b\uff08\u865a\u5047\u4fe1\u606f\uff1a\u9700\u8981\u4eba\u5de5\u5224\u65ad\uff0c\u6536\u5230\u4e3e\u62a5\u540e\u5ba1\u6838\uff09\u4f7f\u7528\u88ab\u52a8\u5ba1\u6838\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_25","title":"\u54c8\u5e0c\u5339\u914d","text":"<ul> <li>\u5bf9\u4e8e\u5df2\u77e5\u6709\u5bb3\u5185\u5bb9\uff08CSAM\u3001\u6050\u6016\u4e3b\u4e49\u5ba3\u4f20\uff09\uff0c\u4f7f\u7528\u611f\u77e5\u54c8\u5e0c\uff1a\u8ba1\u7b97\u5bf9\u5fae\u5c0f\u4fee\u6539\uff08\u88c1\u526a\u3001\u8c03\u6574\u5927\u5c0f\u3001\u538b\u7f29\uff09\u9c81\u68d2\u7684\u56fe\u50cf/\u89c6\u9891\u54c8\u5e0c\u503c\u3002\u4e0e\u5df2\u77e5\u6709\u5bb3\u5185\u5bb9\u6570\u636e\u5e93\uff08NCMEC\u7684\u54c8\u5e0c\u6570\u636e\u5e93\u3001GIFCT\u5171\u4eab\u54c8\u5e0c\u6570\u636e\u5e93\uff09\u8fdb\u884c\u6bd4\u8f83\u3002\u5339\u914d\u2192\u7acb\u5373\u79fb\u9664\uff0c\u65e0\u9700\u5206\u7c7b\u5668\u3002</li> <li>PhotoDNA\uff08\u5fae\u8f6f\uff09\u662fCSAM\u68c0\u6d4b\u7684\u6807\u51c6\u611f\u77e5\u54c8\u5e0c\u3002\u5728\u8bb8\u591a\u53f8\u6cd5\u7ba1\u8f96\u533a\u8fd9\u4e0d\u4ec5\u662f\u6280\u672f\u9009\u62e9\uff0c\u66f4\u662f\u6cd5\u5f8b\u4e49\u52a1\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_26","title":"\u7c97\u7565\u4f30\u7b97\u6570\u5b57","text":"<ul> <li>\u89c4\u6a21\uff1a\u6bcf\u592910\u4ebf\u6761\u5e16\u5b50=\u7ea612K\u5e16\u5b50/\u79d2\u3002\u6bcf\u4e2a\u5e16\u5b50\u9700\u8981\uff1a\u6587\u672c\u5206\u7c7b\uff08\u7ea65ms\uff09\u3001\u56fe\u7247\u5206\u7c7b\uff08\u7ea620ms\uff09\u3001\u54c8\u5e0c\u5339\u914d\uff08\u7ea61ms\uff09\u3002\u572812K QPS\u4e0b\uff1a\u9700\u8981\u7ea660\u4e2a\u6587\u672c\u5206\u7c7b\u5668\u3001\u7ea6240\u4e2a\u56fe\u7247\u5206\u7c7b\u5668\u548c\u7ea612\u4e2a\u54c8\u5e0c\u5339\u914d\u5668\uff08\u52a0\u4e0a\u5197\u4f59\uff09\u3002</li> <li>\u4eba\u5de5\u5ba1\u6838\uff1a\u5982\u679c2%\u7684\u5e16\u5b50\u88ab\u6807\u8bb0\u5ba1\u6838=\u6bcf\u59292000\u4e07\u6761\u3002\u4ee5\u6bcf\u4eba\u6bcf\u5929100\u6761\u5ba1\u6838\u8ba1\uff0c\u9700\u898120\u4e07\u5ba1\u6838\u5458\uff08\u8fd9\u5c31\u662f\u81ea\u52a8\u5316\u51c6\u786e\u7387\u81f3\u5173\u91cd\u8981\u7684\u539f\u56e0\uff1a\u8bef\u62a5\u6bcf\u964d\u4f4e0.1%\u5c31\u80fd\u6bcf\u5929\u8282\u7701100\u4e07\u6761\u5ba1\u6838\uff09\u3002</li> <li>\u5ef6\u8fdf\u9884\u7b97\uff1a\u4e3b\u52a8\u5ba1\u6838\u5fc5\u987b\u5728\u53d1\u5e03\u6d41\u6c34\u7ebf\u5185\u5b8c\u6210\uff08\u7ea6500ms\uff09\u3002\u6587\u672c\uff085ms\uff09+ \u56fe\u7247\uff0820ms\uff09+ \u54c8\u5e0c\uff081ms\uff09+ \u5f00\u9500=\u8fdc\u5728\u9884\u7b97\u4e4b\u5185\u3002\u89c6\u9891\u662f\u4f8b\u5916\uff1a\u5373\u4f7f\u4ece10\u5206\u949f\u89c6\u9891\u4e2d\u6bcf\u79d2\u91c7\u68371\u5e27\uff0c\u4e5f\u9700\u8981600\u6b21\u5206\u7c7b\u5668\u8c03\u7528\u2192\u5f02\u6b65\u5904\u7406\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_27","title":"\u5347\u7ea7\u5de5\u4f5c\u6d41","text":"<ul> <li>\u81ea\u52a8\u79fb\u9664\u2192\u4eba\u5de5\u5ba1\u6838\u4e0a\u8bc9\u2192\u4e13\u5bb6\u5ba1\u6838\uff08\u6cd5\u5f8b\u3001\u6587\u5316\u4e13\u5bb6\uff09\u2192\u653f\u7b56\u56e2\u961f\u5904\u7406\u6a21\u7cca\u6848\u4f8b\u3002\u6bcf\u4e2a\u7ea7\u522b\u5904\u7406\u7684\u6848\u4f8b\u66f4\u5c11\u4f46\u66f4\u7ec6\u81f4\u3002</li> <li>\u53cd\u9988\u7ed9\u6a21\u578b\uff1a\u4eba\u5de5\u5ba1\u6838\u51b3\u7b56\u662f\u91cd\u65b0\u8bad\u7ec3\u7684\u6700\u9ad8\u8d28\u91cf\u6807\u7b7e\u3002\u6a21\u578b\u548c\u5ba1\u6838\u5458\u4e4b\u95f4\u7684\u5206\u6b67\u88ab\u4f18\u5148\u7528\u4e8e\u4e3b\u52a8\u5b66\u4e60\u2014\u2014\u5b83\u4eec\u4ee3\u8868\u4e86\u6a21\u578b\u5904\u7406\u6700\u5dee\u7684\u6848\u4f8b\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#6-airag","title":"6. \u5bf9\u8bdd\u5f0fAI\uff08\u57fa\u4e8eRAG\u7684\u804a\u5929\u673a\u5668\u4eba\uff09","text":""},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_28","title":"\u95ee\u9898\u5b9a\u4e49","text":"<ul> <li>\u76ee\u6807\uff1a\u4e00\u4e2a\u80fd\u56de\u7b54\u5173\u4e8e\u516c\u53f8\u4ea7\u54c1\u95ee\u9898\u7684\u804a\u5929\u673a\u5668\u4eba\uff0c\u4f7f\u7528\u5176\u6587\u6863\u3002</li> <li>\u8981\u6c42\uff1a\u51c6\u786e\uff08\u4e0d\u4ea7\u751f\u5e7b\u89c9\uff09\u3001\u5f15\u7528\u6765\u6e90\u3001\u5904\u7406\u540e\u7eed\u95ee\u9898\u3001\u4fdd\u6301\u5728\u4ea7\u54c1\u9886\u57df\u5185\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#rag","title":"\u67b6\u6784\uff1a\u68c0\u7d22\u589e\u5f3a\u751f\u6210\uff08RAG\uff09","text":"<pre><code>\u7528\u6237\u67e5\u8be2 \u2192 \u67e5\u8be2\u5d4c\u5165 \u2192 \u5411\u91cf\u641c\u7d22\uff08\u6587\u6863\uff09\u2192 Top-K\u5757\n                                                      \u2193\n\u7528\u6237\u67e5\u8be2 + \u68c0\u7d22\u5230\u7684\u5757 \u2192 LLM \u2192 \u54cd\u5e94\uff08\u542b\u5f15\u7528\uff09\n</code></pre>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_29","title":"\u7ec4\u4ef6","text":"<ul> <li>\u6587\u6863\u6444\u5165\uff1a\u5c06\u6587\u6863\u5206\u5757\u5e76\u5d4c\u5165\u3002\u5206\u5757\u7b56\u7565\u975e\u5e38\u91cd\u8981\uff1a<ul> <li>\u56fa\u5b9a\u5927\u5c0f\u5206\u5757\uff1a\u6bcfN\u4e2a\u4ee4\u724c\uff08\u5982500\uff09\u5206\u5272\uff0cM\u4e2a\u4ee4\u724c\uff08\u598250\uff09\u91cd\u53e0\u3002\u7b80\u5355\uff0c\u5757\u5927\u5c0f\u53ef\u9884\u6d4b\uff0c\u4f46\u53ef\u80fd\u5728\u53e5\u5b50\u4e2d\u95f4\u6216\u6bb5\u843d\u4e2d\u95f4\u5206\u5272\uff0c\u4e22\u5931\u4e0a\u4e0b\u6587\u3002</li> <li>\u8bed\u4e49\u5206\u5757\uff1a\u5728\u6bb5\u843d\u6216\u7ae0\u8282\u8fb9\u754c\u5206\u5272\u3002\u6bcf\u4e2a\u5757\u662f\u4e00\u4e2a\u8fde\u8d2f\u7684\u4fe1\u606f\u5355\u5143\u3002\u5927\u5c0f\u53ef\u53d8\uff08\u6709\u4e9b\u5757100\u4e2a\u4ee4\u724c\uff0c\u5176\u4ed6800\u4e2a\uff09\uff0c\u9700\u8981\u68c0\u7d22\u7cfb\u7edf\u5904\u7406\u53ef\u53d8\u957f\u5ea6\u3002</li> <li>\u9012\u5f52\u5206\u5757\uff1a\u5c1d\u8bd5\u5728\u6bb5\u843d\u8fb9\u754c\u5206\u5272\u3002\u5982\u679c\u6bb5\u843d\u592a\u957f\uff0c\u5728\u53e5\u5b50\u8fb9\u754c\u5206\u5272\u3002\u5982\u679c\u53e5\u5b50\u592a\u957f\uff0c\u5728\u56fa\u5b9a\u5927\u5c0f\u5206\u5272\u3002\u8fde\u8d2f\u6027\u548c\u5927\u5c0f\u4e00\u81f4\u6027\u7684\u6700\u4f73\u5e73\u8861\u3002</li> <li>\u5d4c\u5165\uff1a\u7528\u6587\u672c\u7f16\u7801\u5668\uff08\u5982E5\u3001BGE\u3001Cohere embed\uff09\u5d4c\u5165\u6bcf\u4e2a\u5757\u3002\u5b58\u50a8\u5728\u5411\u91cf\u6570\u636e\u5e93\u4e2d\u3002</li> </ul> </li> <li>\u68c0\u7d22\uff1a\u5d4c\u5165\u7528\u6237\u67e5\u8be2\uff0c\u641c\u7d22\u5411\u91cf\u6570\u636e\u5e93\u4e2d\u6700\u76f8\u4f3c\u7684\\(k\\)\u4e2a\u5757\uff08\u901a\u5e38\\(k = 5\\)-\\(10\\)\uff09\u3002\u53ef\u9009\u5730\u4f7f\u7528\u4ea4\u53c9\u7f16\u7801\u5668\u91cd\u65b0\u6392\u5e8f\u4ee5\u63d0\u9ad8\u7cbe\u5ea6\u3002</li> <li>\u751f\u6210\uff1a\u6784\u5efa\u5305\u542b\u68c0\u7d22\u5757\u4f5c\u4e3a\u4e0a\u4e0b\u6587\u7684\u63d0\u793a\uff1a</li> </ul> <pre><code>\u7cfb\u7edf\uff1a\u4f60\u662f\u4e00\u4e2a\u6709\u7528\u7684\u52a9\u624b\u3002\u4ec5\u57fa\u4e8e\u63d0\u4f9b\u7684\u4e0a\u4e0b\u6587\u56de\u7b54\u3002\n\u5982\u679c\u7b54\u6848\u4e0d\u5728\u4e0a\u4e0b\u6587\u4e2d\uff0c\u8bf7\u8bf4\"\u6211\u4e0d\u77e5\u9053\u3002\"\n\n\u4e0a\u4e0b\u6587\uff1a\n[\u5757 1]\n[\u5757 2]\n...\n\n\u7528\u6237\uff1a{\u95ee\u9898}\n</code></pre> <ul> <li>\u62a4\u680f\uff1a\u9632\u6b62LLM\u56de\u7b54\u4ea7\u54c1\u9886\u57df\u5916\u7684\u95ee\u9898\u3001\u751f\u6210\u6709\u5bb3\u5185\u5bb9\u6216\u4e0e\u68c0\u7d22\u5230\u7684\u4e0a\u4e0b\u6587\u76f8\u77db\u76fe\u3002\u5b9e\u73b0\u4e3a\uff1a\u8f93\u5165\u8fc7\u6ee4\uff08\u62d2\u7edd\u79bb\u9898\u67e5\u8be2\uff09\u3001\u8f93\u51fa\u8fc7\u6ee4\uff08\u68c0\u67e5\u54cd\u5e94\u662f\u5426\u4e0e\u68c0\u7d22\u5230\u7684\u4e0a\u4e0b\u6587\u4e00\u81f4\uff09\u548c\u5baa\u6cd5\u63d0\u793a\uff08\u6307\u793a\u6a21\u578b\u62d2\u7edd\u67d0\u4e9b\u8bf7\u6c42\uff09\u3002</li> <li>\u5bf9\u8bdd\u8bb0\u5fc6\uff1a\u7ef4\u62a4\u6700\u8fd1\\(n\\)\u8f6e\u5bf9\u8bdd\u3002\u5c06\u5176\u5305\u542b\u5728\u63d0\u793a\u4e2d\uff0c\u4f7f\u6a21\u578b\u80fd\u7406\u89e3\u540e\u7eed\u95ee\u9898\uff08\"\u5b9a\u4ef7\u5982\u4f55\uff1f\"\u2192\u9700\u8981\u5173\u4e8e\u54ea\u4e2a\u4ea7\u54c1\u7684\u5148\u524d\u4e0a\u4e0b\u6587\uff09\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_30","title":"\u67e5\u8be2\u91cd\u5199","text":"<ul> <li>\u7528\u6237\u7ecf\u5e38\u95ee\u6a21\u7cca\u7684\u540e\u7eed\u95ee\u9898\uff1a\"\u5b9a\u4ef7\u5982\u4f55\uff1f\"\uff08\u4ec0\u4e48\u4ea7\u54c1\u7684\u5b9a\u4ef7\uff1f\uff09\u3002\u67e5\u8be2\u91cd\u5199\u4f7f\u7528\u5bf9\u8bdd\u5386\u53f2\u751f\u6210\u72ec\u7acb\u67e5\u8be2\uff1a<ul> <li>\u8f93\u5165\uff1a\u5bf9\u8bdd\u5386\u53f2 + \"\u5b9a\u4ef7\u5982\u4f55\uff1f\"</li> <li>\u91cd\u5199\u540e\uff1a\"\u4ea7\u54c1X\u7684\u4f01\u4e1a\u7248\u5b9a\u4ef7\u662f\u591a\u5c11\uff1f\"</li> </ul> </li> <li>\u8fd9\u4e2a\u91cd\u5199\u540e\u7684\u67e5\u8be2\u624d\u662f\u88ab\u5d4c\u5165\u5e76\u5728\u5411\u91cf\u6570\u636e\u5e93\u4e2d\u641c\u7d22\u7684\u3002\u5982\u679c\u6ca1\u6709\u91cd\u5199\uff0c\u68c0\u7d22\u4f1a\u641c\u7d22\"\u5b9a\u4ef7\"\u800c\u6ca1\u6709\u4e0a\u4e0b\u6587\uff0c\u8fd4\u56de\u4e0d\u76f8\u5173\u7684\u5757\u3002</li> <li>\u67e5\u8be2\u91cd\u5199\u53ef\u4ee5\u7528\u5c0f\u578bLLM\u8c03\u7528\uff08\u7ea650ms\uff09\u6216\u5fae\u8c03\u7684\u5e8f\u5217\u5230\u5e8f\u5217\u6a21\u578b\uff08\u7ea65ms\uff09\u5b8c\u6210\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_31","title":"\u7c97\u7565\u4f30\u7b97\u6570\u5b57","text":"<ul> <li>\u6587\u6863\u8bed\u6599\u5e93\uff1a10K\u9875\uff0c\u6bcf\u9875\u5e73\u57472000\u4e2a\u4ee4\u724c=2000\u4e07\u4ee4\u724c\u3002\u4ee5\u6bcf\u5757500\u4e2a\u4ee4\u724c\u300150\u4e2a\u91cd\u53e0\u8ba1=\u7ea644K\u4e2a\u5757\u3002</li> <li>\u5d4c\u5165\u7d22\u5f15\uff1a44K\u5757\u00d7768\u7ef4\u00d7float16=\u7ea665 MB\u3002\u8f7b\u677e\u9002\u5408\u5185\u5b58\u3002\u5373\u4f7f1000\u4e07\u4e2a\u5757\u4e5f\u4ec5\u7ea615 GB\u3002</li> <li>\u5ef6\u8fdf\u5206\u89e3\uff1a\u67e5\u8be2\u5d4c\u5165\uff085ms\uff09+ \u5411\u91cf\u641c\u7d22\uff082ms\uff09+ \u4ea4\u53c9\u7f16\u7801\u5668\u91cd\u65b0\u6392\u5e8f\uff08\u524d50\u4e2a20ms\uff09+ LLM\u751f\u6210\uff08500-2000ms\uff09= \u603b\u8ba1\u7ea6600-2100ms\u3002LLM\u5360\u4e3b\u5bfc\u5730\u4f4d\u3002\u4f7f\u7528\u6d41\u5f0f\u4f20\u8f93\u51cf\u5c11\u611f\u77e5\u5ef6\u8fdf\u3002</li> <li>\u6210\u672c\uff1a\u4ee5\\(3/100\u4e07\u4ee4\u724c\uff08Claude/GPT-4 API\uff09\u8ba1\uff0c\u6bcf\u59291000\u6b21\u67e5\u8be2\u3001\u6bcf\u6b21\u7ea62000\u4e2a\u4ee4\u724c=\u7ea6\\)6/\u5929\u3002\u5927\u89c4\u6a21\uff08\u6bcf\u5929100\u4e07\u6b21\u67e5\u8be2\uff09\u4e0b\uff0c\u57282\u4e2aA10G GPU\u4e0a\u81ea\u6258\u7ba17B\u6a21\u578b\uff08\u7ea6$50/\u5929\uff09\u53ef\u5b9e\u73b0100\u500d\u6210\u672c\u964d\u4f4e\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_32","title":"\u8bc4\u4f30","text":"<ul> <li>\u68c0\u7d22\u8d28\u91cf\uff1aRecall@K\uff08\u524dK\u4e2a\u5757\u662f\u5426\u5305\u542b\u7b54\u6848\uff1f\uff09\u3001MRR\uff08\u5e73\u5747\u5012\u6570\u6392\u540d\uff09\u3002</li> <li>\u751f\u6210\u8d28\u91cf\uff1a\u4e8b\u5b9e\u51c6\u786e\u6027\uff08\u54cd\u5e94\u662f\u5426\u5339\u914d\u68c0\u7d22\u5230\u7684\u4e0a\u4e0b\u6587\uff1f\uff09\u3001\u6709\u4f9d\u636e\u6027\uff08\u54cd\u5e94\u662f\u5426\u5f15\u7528\u4e86\u6b63\u786e\u5757\uff1f\uff09\u3001\u7b54\u6848\u76f8\u5173\u6027\u3002</li> <li>\u7aef\u5230\u7aef\uff1a\u7528\u6237\u6ee1\u610f\u5ea6\uff08\u8d5e/\u8e29\uff09\u3001\u8f6c\u63a5\u7ed9\u4eba\u5de5\u5ba2\u670d\u7684\u6bd4\u7387\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#7","title":"7. \u5927\u89c4\u6a21\u56fe\u50cf\u641c\u7d22","text":""},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_33","title":"\u95ee\u9898\u5b9a\u4e49","text":"<ul> <li>\u76ee\u6807\uff1a\u7ed9\u5b9a\u4e00\u5f20\u56fe\u50cf\uff0c\u4ece10\u4ebf+\u56fe\u50cf\u7684\u8bed\u6599\u5e93\u4e2d\u627e\u5230\u89c6\u89c9\u4e0a\u76f8\u4f3c\u7684\u56fe\u50cf\u3002</li> <li>\u5e94\u7528\uff1a\u53cd\u5411\u56fe\u50cf\u641c\u7d22\u3001\u4ea7\u54c1\u641c\u7d22\uff08\u7167\u7247\u2192\u5339\u914d\u7684\u4ea7\u54c1\uff09\u3001\u91cd\u590d\u68c0\u6d4b\u3002</li> <li>\u5ef6\u8fdf\uff1a&lt;500ms\uff08\u5305\u62ec\u7f51\u7edc\u5f80\u8fd4\u65f6\u95f4\uff09\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_34","title":"\u67b6\u6784","text":"<pre><code>\u67e5\u8be2\u56fe\u50cf \u2192 \u5d4c\u5165\u6a21\u578b\uff08ViT/CLIP\uff09\u2192 512\u7ef4\u5411\u91cf \u2192 ANN\u641c\u7d22 \u2192 Top-K\u7ed3\u679c\n</code></pre>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_35","title":"\u5d4c\u5165\u63d0\u53d6","text":"<ul> <li>\u6a21\u578b\uff1a\u9884\u8bad\u7ec3\u7684\u89c6\u89c9\u7f16\u7801\u5668\uff08ViT\u3001CLIP\u7684\u56fe\u50cf\u7f16\u7801\u5668\u3001DINOv2\uff09\u3002\u5982\u679c\u9700\u8981\uff0c\u5728\u7279\u5b9a\u9886\u57df\uff08\u65f6\u5c1a\u3001\u7535\u5546\u3001\u533b\u5b66\u5f71\u50cf\uff09\u4e0a\u8fdb\u884c\u5fae\u8c03\u3002</li> <li>\u8bad\u7ec3\uff1a\u5bf9\u6bd4\u5b66\u4e60\uff08\u7b2c10\u7ae0\uff09\u3002\u6b63\u6837\u672c\u5bf9=\u540c\u4e00\u56fe\u50cf\u7684\u4e0d\u540c\u89c6\u89d2\uff08\u6216\u56fe\u50cf+\u5339\u914d\u7684\u6587\u672c\uff09\u3002\u8d1f\u6837\u672c\u5bf9=\u968f\u673a\u56fe\u50cf\u3002\u6a21\u578b\u5b66\u4e60\u4e3a\u76f8\u4f3c\u56fe\u50cf\u751f\u6210\u76f8\u4f3c\u5d4c\u5165\uff0c\u4e3a\u4e0d\u540c\u56fe\u50cf\u751f\u6210\u4e0d\u540c\u5d4c\u5165\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_36","title":"\u7d22\u5f15","text":"<ul> <li>\u79bb\u7ebf\uff1a\u5d4c\u5165\u6240\u670910\u4ebf\u5f20\u56fe\u50cf\u5e76\u6784\u5efaANN\u7d22\u5f15\u3002\u5bf9\u4e8eHNSW\uff08\u6587\u4ef603\uff09\uff0c\u6784\u5efa\u7d22\u5f15\u9700\u8981\u6570\u5c0f\u65f6\uff0c\u7d22\u5f15\u5b58\u50a8\u5728\u5185\u5b58\u4e2d\uff0810\u4ebf\u00d7512\u7ef4\u00d7float16 + \u56fe\u5f00\u9500\u7ea6128 GB\uff09\u3002</li> <li>\u5206\u7247\uff1a\u5c06\u7d22\u5f15\u62c6\u5206\u6210\u8de8\u591a\u53f0\u673a\u5668\u3002\u6bcf\u53f0\u673a\u5668\u6301\u6709\u4e00\u4e2a\u5206\u7247\u3002\u67e5\u8be2\u65f6\uff0c\u5e76\u884c\u641c\u7d22\u6240\u6709\u5206\u7247\u5e76\u5408\u5e76\u524dK\u4e2a\u7ed3\u679c\u3002</li> <li>\u589e\u91cf\u66f4\u65b0\uff1a\u65b0\u56fe\u50cf\uff08\u4e0a\u4f20\u3001\u65b0\u4ea7\u54c1\uff09\u5fc5\u987b\u6dfb\u52a0\u5230\u7d22\u5f15\u4e2d\u3002HNSW\u652f\u6301\u589e\u91cf\u63d2\u5165\u800c\u65e0\u9700\u91cd\u5efa\u3002\u5411\u91cf\u6570\u636e\u5e93\uff08Milvus\u3001Pinecone\uff09\u539f\u751f\u5904\u7406\u6b64\u9700\u6c42\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_37","title":"\u670d\u52a1","text":"<ul> <li>\u5d4c\u5165\u670d\u52a1\uff1a\u8fd0\u884cViT\u6a21\u578b\u7684GPU\u670d\u52a1\u5668\u3002\u5ef6\u8fdf\uff1a\u6bcf\u5f20\u56fe\u50cf\u7ea620ms\u3002\u6279\u91cf\u5904\u7406\u591a\u4e2a\u67e5\u8be2\u4ee5\u63d0\u9ad8\u541e\u5410\u91cf\u3002</li> <li>\u641c\u7d22\u670d\u52a1\uff1aANN\u7d22\u5f15\u670d\u52a1\u5668\u3002\u5ef6\u8fdf\uff1a\u5bf9\u4e8e10\u4ebf\u5411\u91cf\u4e2d\u641c\u7d22\u524d100\u4e2a\uff08\u4f7f\u7528HNSW\uff09\u7ea610ms\u3002</li> <li>\u7f13\u5b58\uff1a\u7f13\u5b58\u70ed\u95e8\u67e5\u8be2\u7684\u7ed3\u679c\u3002\u5bf9\u4e8e\u91cd\u590d\u68c0\u6d4b\uff0c\u7f13\u5b58\u6700\u8fd1\u4e0a\u4f20\u7684\u56fe\u50cf\u7684\u5d4c\u5165\uff0c\u5728\u641c\u7d22\u5b8c\u6574\u7d22\u5f15\u4e4b\u524d\u5c06\u65b0\u4e0a\u4f20\u4e0e\u7f13\u5b58\u8fdb\u884c\u6bd4\u8f83\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_38","title":"\u8bc4\u4f30","text":"<ul> <li>Precision@K\uff1a\u524dK\u4e2a\u7ed3\u679c\u662f\u5426\u5b9e\u9645\u76f8\u4f3c\uff1f</li> <li>Recall@K\uff1a\u5728\u8bed\u6599\u5e93\u4e2d\u6240\u6709\u771f\u6b63\u76f8\u4f3c\u7684\u56fe\u50cf\u4e2d\uff0c\u6709\u591a\u5c11\u5728\u524dK\u4e2a\u4e2d\uff1f</li> <li>\u5e73\u5747\u7cbe\u5ea6\u5747\u503c\uff08mAP\uff09\uff1a\u7cbe\u786e\u7387-\u53ec\u56de\u7387\u66f2\u7ebf\u4e0b\u7684\u9762\u79ef\u3002</li> <li>\u4eba\u5de5\u8bc4\u4f30\uff1a\u5bf9\u4e8e\u4e3b\u89c2\u76f8\u4f3c\u6027\uff0c\u4eba\u5de5\u8bc4\u5206\u5458\u5224\u65ad\u68c0\u7d22\u5230\u7684\u56fe\u50cf\u662f\u5426\u76f8\u5173\u3002</li> </ul>"},{"location":"chapter%2018%3A%20ML%20systems%20design/05.%20ML%20design%20examples/#_39","title":"\u9762\u8bd5\u6846\u67b6","text":"<ul> <li>\u5f53\u4f60\u9047\u5230\u7cfb\u7edf\u8bbe\u8ba1\u95ee\u9898\u65f6\uff0c\u9075\u5faa\u6b64\u6846\u67b6\uff1a</li> <li>\u6f84\u6e05\u9700\u6c42\uff082-3\u5206\u949f\uff09\uff1a\u8be2\u95ee\u89c4\u6a21\u3001\u5ef6\u8fdf\u3001\u4e00\u81f4\u6027\u8981\u6c42\u548c\u8fb9\u7f18\u60c5\u51b5\u3002\"\u591a\u5c11\u7528\u6237\uff1f\u53ef\u63a5\u53d7\u7684\u5ef6\u8fdf\u662f\u591a\u5c11\uff1f\u6545\u969c\u65f6\u4f1a\u53d1\u751f\u4ec0\u4e48\uff1f\"</li> <li>\u9ad8\u5c42\u8bbe\u8ba1\uff085-7\u5206\u949f\uff09\uff1a\u753b\u51fa\u4e3b\u8981\u7ec4\u4ef6\u53ca\u5176\u4ea4\u4e92\u3002\u4ece\u6b63\u5e38\u8def\u5f84\u5f00\u59cb\u3002\u4f7f\u7528\u6587\u4ef601-03\u4e2d\u7684\u6a21\u5f0f\u3002</li> <li>\u6df1\u5165\u63a2\u8ba8\uff0815-20\u5206\u949f\uff09\uff1a\u9009\u62e9\u6700\u6709\u8da3/\u6700\u5177\u6311\u6218\u6027\u7684\u7ec4\u4ef6\u5e76\u8be6\u7ec6\u8bbe\u8ba1\u3002\u8fd9\u662f\u4f60\u5c55\u793a\u6df1\u5ea6\u7684\u5730\u65b9\u3002\u5bf9\u4e8eML\u7cfb\u7edf\uff0c\u6df1\u5165\u63a2\u8ba8\u901a\u5e38\u6d89\u53ca\uff1a\u6a21\u578b\u67b6\u6784\u3001\u7279\u5f81\u6d41\u6c34\u7ebf\u6216\u670d\u52a1\u67b6\u6784\u3002</li> <li>\u8bc4\u4f30\u548c\u76d1\u63a7\uff083-5\u5206\u949f\uff09\uff1a\u4f60\u5982\u4f55\u8861\u91cf\u6210\u529f\uff1f\u53ef\u80fd\u51fa\u4ec0\u4e48\u95ee\u9898\uff1f\u4f60\u5982\u4f55\u68c0\u6d4b\u548c\u54cd\u5e94\u95ee\u9898\uff1f</li> <li> <p>\u8fed\u4ee3\uff082-3\u5206\u949f\uff09\uff1a\u5982\u679c\u6709\u66f4\u591a\u65f6\u95f4/\u8d44\u6e90\uff0c\u4f60\u4f1a\u6539\u8fdb\u4ec0\u4e48\uff1f\u8fd9\u8868\u660e\u4f60\u7406\u89e3\u6743\u8861\u5e76\u80fd\u8bbe\u5b9a\u4f18\u5148\u7ea7\u3002</p> </li> <li> <p>\u9762\u8bd5\u5b98\u770b\u4e2d\u7684\uff1a\u7ed3\u6784\u5316\u601d\u7ef4\uff08\u4e0d\u662f\u76f4\u63a5\u8df3\u5230\u89e3\u51b3\u65b9\u6848\uff09\u3001\u6743\u8861\u610f\u8bc6\uff08\u6bcf\u4e2a\u9009\u62e9\u90fd\u6709\u4ee3\u4ef7\uff09\u3001\u5b9e\u8df5\u77e5\u8bc6\uff08\u4f60\u786e\u5b9e\u6784\u5efa\u8fc7\u7cfb\u7edf\uff09\u548c\u6c9f\u901a\u80fd\u529b\uff08\u4f60\u80fd\u6e05\u6670\u89e3\u91ca\u4f60\u7684\u8bbe\u8ba1\u5417\uff1f\uff09\u3002</p> </li> </ul>"},{"location":"chapter%2019%3A%20applied%20AI/01.%20AI%20for%20finance/","title":"AI for Finance","text":"<ul> <li>\u65f6\u95f4\u5e8f\u5217\u9884\u6d4b\uff1aARIMA\u3001\u6307\u6570\u5e73\u6ed1\u3001Prophet\u3001\u795e\u7ecf\u7f51\u7edc\u65b9\u6cd5\uff08LSTM\u3001Temporal Fusion Transformer\u3001PatchTST\uff09</li> <li>\u7b97\u6cd5\u4ea4\u6613\uff1a\u4fe1\u53f7\u751f\u6210\u3001\u6267\u884c\u7b97\u6cd5\uff08TWAP\u3001VWAP\uff09\u3001\u5e02\u573a\u5fae\u89c2\u7ed3\u6784</li> <li>\u6295\u8d44\u7ec4\u5408\u4f18\u5316\uff1a\u5747\u503c-\u65b9\u5dee\uff08Markowitz\uff09\u3001Black-Litterman\u3001\u57fa\u4e8eRL\u7684\u6295\u8d44\u7ec4\u5408\u7ba1\u7406</li> <li>\u98ce\u9669\u5efa\u6a21\uff1aValue at Risk (VaR)\u3001Expected Shortfall\u3001\u8499\u7279\u5361\u6d1b\u6a21\u62df\u3001\u4fe1\u7528\u8bc4\u5206</li> <li>\u6b3a\u8bc8\u68c0\u6d4b\uff1a\u5f02\u5e38\u68c0\u6d4b\u3001\u57fa\u4e8e\u56fe\u7684\u65b9\u6cd5\u3001\u5b9e\u65f6\u6d41\u5904\u7406</li> <li>\u91d1\u878d\u4e2d\u7684NLP\uff1a\u65b0\u95fb/\u8d22\u62a5\u7535\u8bdd\u4f1a\u8bae\u7684\u60c5\u7eea\u5206\u6790\u3001\u91d1\u878d\u6587\u6863\u7406\u89e3</li> <li>\u53e6\u7c7b\u6570\u636e\uff1a\u536b\u661f\u56fe\u50cf\u3001\u793e\u4ea4\u5a92\u4f53\u3001\u7f51\u7edc\u722c\u866b</li> <li>\u76d1\u7ba1\u4e0e\u4f26\u7406\uff1a\u6a21\u578b\u53ef\u89e3\u91ca\u6027\uff08SHAP\u3001LIME\uff09\u3001\u4fe1\u8d37\u516c\u5e73\u6027\u3001\u76d1\u7ba1\u5408\u89c4</li> </ul>"},{"location":"chapter%2019%3A%20applied%20AI/02.%20protein%20design/","title":"AI for Biology","text":"<ul> <li>\u86cb\u767d\u8d28\u7ed3\u6784\u9884\u6d4b\uff1aAlphaFold 1/2/3\u3001ESMFold\u3001\u5171\u8fdb\u5316\u5206\u6790\u3001MSA transformers</li> <li>\u86cb\u767d\u8d28\u8bbe\u8ba1\uff1a\u9006\u6298\u53e0\uff08ProteinMPNN\uff09\u3001\u7528\u4e8e\u86cb\u767d\u8d28\u751f\u6210\u7684\u6269\u6563\u6a21\u578b\uff08RFDiffusion\uff09\u3001\u5e7b\u89c9\uff08hallucination\uff09</li> <li>\u836f\u7269\u53d1\u73b0\uff1a\u5206\u5b50\u8868\u793a\uff08SMILES\u3001\u56fe\uff09\u3001\u5206\u5b50\u6027\u8d28\u9884\u6d4b\u3001\u865a\u62df\u7b5b\u9009\u3001\u5206\u5b50\u5bf9\u63a5</li> <li>\u751f\u6210\u5316\u5b66\uff1a\u5206\u5b50\u751f\u6210\uff08VAE\u3001GAN\u3001\u6269\u6563\u6a21\u578b\uff09\u3001\u9006\u5408\u6210\u9884\u6d4b</li> <li>\u57fa\u56e0\u7ec4\u5b66\uff1aDNA\u5e8f\u5217\u5efa\u6a21\uff08Enformer\u3001Hyena DNA\uff09\u3001\u53d8\u5f02\u6548\u5e94\u9884\u6d4b\u3001CRISPR\u5f15\u5bfc\u8bbe\u8ba1</li> <li>\u5355\u7ec6\u80de\u5206\u6790\uff1ascRNA-seq\u3001\u7ec6\u80de\u7c7b\u578b\u805a\u7c7b\u3001\u8f68\u8ff9\u63a8\u65ad</li> <li>\u533b\u5b66\u5f71\u50cf\uff1a\u653e\u5c04\u5b66\uff08CheXNet\uff09\u3001\u75c5\u7406\u5b66\uff08\u5168\u5207\u7247\u56fe\u50cf\uff09\u3001\u5206\u5272\uff08nnU-Net\uff09</li> <li>\u4e34\u5e8aNLP\uff1a\u533b\u5b66\u5b9e\u4f53\u63d0\u53d6\u3001\u4e34\u5e8a\u8bd5\u9a8c\u5339\u914d\u3001\u7535\u5b50\u5065\u5eb7\u8bb0\u5f55</li> </ul>"},{"location":"chapter%2020%3A%20bleeding%20edge%20AI/01.%20quantum%20machine%20learning/","title":"\u91cf\u5b50\u673a\u5668\u5b66\u4e60 (Quantum Machine Learning)","text":"<ul> <li>\u91cf\u5b50\u8ba1\u7b97\u57fa\u7840\uff1a\u91cf\u5b50\u6bd4\u7279 (qubit)\u3001\u53e0\u52a0 (superposition)\u3001\u7ea0\u7f20 (entanglement)\u3001\u6d4b\u91cf (measurement)</li> <li>\u91cf\u5b50\u95e8\uff1a\u6ce1\u5229\u95e8 (Pauli X, Y, Z)\u3001\u54c8\u8fbe\u739b\u95e8 (Hadamard)\u3001CNOT \u95e8\u3001\u6258\u4f5b\u5229\u95e8 (Toffoli)\u3001\u65cb\u8f6c\u95e8 (rotation gates)</li> <li>\u91cf\u5b50\u7535\u8def\uff1a\u7535\u8def\u6a21\u578b (circuit model)\u3001\u53c2\u6570\u5316\u7535\u8def (parameterised circuits)\u3001\u6df1\u5ea6\u4e0e\u5bbd\u5ea6 (depth and width)</li> <li>\u53d8\u5206\u91cf\u5b50\u7b97\u6cd5\uff1aVQE\u3001QAOA\u3001\u53d8\u5206\u5206\u7c7b\u5668 (variational classifiers)</li> <li>\u91cf\u5b50\u6838\u65b9\u6cd5\uff1a\u91cf\u5b50\u7279\u5f81\u6620\u5c04 (quantum feature maps)\u3001\u91cf\u5b50\u652f\u6301\u5411\u91cf\u673a (quantum support vector machines)</li> <li>\u91cf\u5b50\u795e\u7ecf\u7f51\u7edc\uff1a\u4f5c\u4e3a\u795e\u7ecf\u5c42\u7684\u53c2\u6570\u5316\u91cf\u5b50\u7535\u8def (parameterised quantum circuits as neural layers)</li> <li>\u8d2b\u7620\u9ad8\u539f (barren plateaus)\uff1a\u91cf\u5b50\u7535\u8def\u4e2d\u7684\u68af\u5ea6\u6d88\u5931 (vanishing gradients)\u3001\u53ef\u8868\u8fbe\u6027\u4e0e\u53ef\u8bad\u7ec3\u6027 (expressibility vs trainability)</li> <li>\u91cf\u5b50\u4f18\u52bf\u8fa9\u8bba\uff1aNISQ \u65f6\u4ee3\u5c40\u9650\u6027 (NISQ era limitations)\u3001\u5bb9\u9519\u91cf\u5b50\u8ba1\u7b97\u65f6\u95f4\u7ebf (fault-tolerant quantum computing timeline)</li> <li>\u6df7\u5408\u7ecf\u5178-\u91cf\u5b50\u67b6\u6784\uff1a\u7ecf\u5178\u6d41\u6c34\u7ebf\u4e2d\u7684\u91cf\u5b50\u5c42 (quantum layers in classical pipelines)</li> </ul>"},{"location":"chapter%2020%3A%20bleeding%20edge%20AI/02.%20neuromorphic%20computing/","title":"\u795e\u7ecf\u5f62\u6001\u8ba1\u7b97 (Neuromorphic Computing)","text":"<ul> <li>\u751f\u7269\u5b66\u542f\u53d1\uff1a\u8109\u51b2\u795e\u7ecf\u5143 (spiking neurons)\u3001\u7a81\u89e6\u53ef\u5851\u6027 (synaptic plasticity)\u3001\u65f6\u95f4\u7f16\u7801 (temporal coding)</li> <li>\u8109\u51b2\u795e\u7ecf\u7f51\u7edc (SNN)\uff1a\u6574\u5408\u53d1\u653e\u6a21\u578b\u2014\u2014LIF\u3001IF (integrate-and-fire models)\u3001\u8109\u51b2\u65f6\u5e8f (spike timing)</li> <li>SNN \u4e2d\u7684\u5b66\u4e60\uff1aSTDP\uff08\u8109\u51b2\u65f6\u5e8f\u4f9d\u8d56\u53ef\u5851\u6027\uff09\u3001\u4ee3\u7406\u68af\u5ea6\u65b9\u6cd5 (surrogate gradient methods)\u3001\u4ece ANN \u8f6c\u6362 (conversion from ANNs)</li> <li>\u795e\u7ecf\u5f62\u6001\u786c\u4ef6\uff1aIntel Loihi 2\u3001IBM TrueNorth\u3001SpiNNaker\u3001BrainScaleS</li> <li>\u4e8b\u4ef6\u9a71\u52a8\u8ba1\u7b97\uff1a\u5f02\u6b65\u5904\u7406 (asynchronous processing)\u3001\u9ad8\u80fd\u6548 (energy efficiency)</li> <li>\u4e8b\u4ef6\u76f8\u673a (DVS)\uff1a\u795e\u7ecf\u5f62\u6001\u89c6\u89c9\u4f20\u611f\u5668 (neuromorphic vision sensors)\u3001\u7a00\u758f\u65f6\u5e8f\u6570\u636e (sparse temporal data)</li> <li>\u5e94\u7528\uff1a\u4f4e\u529f\u8017\u8fb9\u7f18\u63a8\u7406 (low-power edge inference)\u3001\u673a\u5668\u4eba (robotics)\u3001\u59cb\u7ec8\u5728\u7ebf\u4f20\u611f (always-on sensing)</li> <li>\u4e0e\u4f20\u7edf\u6df1\u5ea6\u5b66\u4e60\u5bf9\u6bd4\uff1a\u5ef6\u8fdf (latency)\u3001\u529f\u8017 (power)\u3001\u7cbe\u5ea6 (accuracy) \u7684\u6743\u8861</li> </ul>"}]}