个人简介
我是黄业琦,爱丁堡大学 Edinburgh-AISys 研究组的博士生,研究方向为 AI 系统。我的研究致力于提升系统能力以支持大规模 AI 应用,涵盖训练和推理过程。我喜欢参与各种 AI 项目。然而,当前的 AI 仍然不够强大。我的目标是让 AI 对所有人更加易用,并在实际工业应用中发挥实质性的作用。
这一宏大目标需要系统性的方法来实现。我之前的研究集中在高性能计算领域的问题上,因此我对科学和工业界的前沿问题有深入了解。要将 AI 引入这些领域,我们需要服务更大的 AI 模型,并提升 AI 模型训练和推理的性能。为了解决这个问题,我尝试从更细粒度的角度出发,专注于改进系统和编译器基础设施。我近期的研究集中在最新一代的 2D Mesh 架构 AI 芯片上,如 TPU 和 Cerebras。
此外,我是一名开源开发者。我喜欢参加黑客马拉松,也喜欢在 Github 上分享我的想法。这是我的博客:个人博客
技能
技术
爱好
研究兴趣
- 计算机系统
- 分布式机器学习
- 无服务器系统
教育经历
爱丁堡大学
中国科学技术大学
近期论文
SwarmX: A Scheduler Agent Framework for Large Agentic Workflow Clusters
Submitted to 18th USENIX Symposium on Operating Systems Design and Implementation (OSDI 26) OSDI 2026 (Under Review)
MICA: An Efficient Compiler for Mesh-Based AI Accelerators
Submitted to 18th USENIX Symposium on Operating Systems Design and Implementation (OSDI 26) OSDI 2026 (Under Review)
RAGBoost: Efficient Retrieval-Augmented Generation with Accuracy-Preserving Context Reuse
Submitted to 8th Conference on Machine Learning and Systems (MLSys 2026) MLSys 2026 (Under Review)
WaferLLM: Large Language Model Inference at Wafer Scale
17th USENIX Symposium on Operating Systems Design and Implementation (OSDI 25) OSDI 2025
MoE-CAP: Benchmarking Cost, Accuracy and Performance of Sparse Mixture-of-Experts Systems
arXiv preprint arXiv
项目
BTMR-Paper
Insanely Fast Paper Reading Tool - An AI-powered web application for extracting, analyzing, and summarizing academic papers
Bili-Investigate
A Streamlit-based web application for tracking Bilibili content creators' video updates with smart incremental fetching
YA-PapersWithCode
Yet Another Papers With Code - A modern recreation of the Papers With Code platform with AI-powered semantic search
ContextKeeper
AI assistant for RTX GPU users with extensible plugin ecosystem - A community fork of NVIDIA G-Assist
联系方式
yeqi.huang@ed.ac.uk
10 Crichton Street, Edinburgh, United Kingdom
Informatics Forum Room 1.43
如果想和我讨论,请使用这个工具: 预约会议