DeepSeek 开源了 TileKernels——一个完全用 Python TileLang DSL 编写的 GPU 内核库,覆盖 MoE 路由、FP8/FP4 量化、Engram 条件记忆、流形超连接(mHC)等核心操作。所有内核都逼近硬件极限性能。这背后是一个更大的野心:让 Python 成为 GPU 编程的一等公民。两个仓库的关系TileLangTileKernels是什么GPU/CPU 内核 DSL + 编译器基础设施用 TileLang 写的高性能 LLM 内核库Star5,7101,078作者北大 + 微软研究院DeepSeek底层基于 TVM 编译器基于 TileLang类比“GPU 编程的 Rust 编译器”