个人简介
我是黄业琦,爱丁堡大学 Edinburgh-AISys 研究组的博士生,研究方向为 AI 系统。我的研究致力于提升系统能力以支持大规模 AI 应用,涵盖训练和推理过程。我喜欢参与各种 AI 项目。然而,当前的 AI 仍然不够强大。我的目标是让 AI 对所有人更加易用,并在实际工业应用中发挥实质性的作用。
这一宏大目标需要系统性的方法来实现。我之前的研究集中在高性能计算领域的问题上,因此我对科学和工业界的前沿问题有深入了解。要将 AI 引入这些领域,我们需要服务更大的 AI 模型,并提升 AI 模型训练和推理的性能。为了解决这个问题,我尝试从更细粒度的角度出发,专注于改进系统和编译器基础设施。我近期的研究集中在最新一代的 2D Mesh 架构 AI 芯片上,如 TPU 和 Cerebras。
此外,我是一名开源开发者。我喜欢参加黑客马拉松,也喜欢在 Github 上分享我的想法。这是我的博客:个人博客
技能
技术
爱好
研究兴趣
- 计算机系统
- 分布式机器学习
- 无服务器系统
教育经历
爱丁堡大学
中国科学技术大学
近期论文
MICA: An End-to-End Compiler Stack for Mesh Accelerators
SOSP 2026 · Under Review
Swarmpilot: A Scheduler Agent Framework for Large Agentic Workflow Clusters
EuroSys 2026 · Under Review
BARSA: An Adaptive Test-Time Scaling Strategy for Mathematical Reasoning under Global Compute Budgets
ICML 2026 Workshop
Ryze: Evidence-Enriched Data Synthesis from Biomedical Papers
ACL 2026 Demo
ContextPilot: Efficient Retrieval-Augmented Generation with Accuracy-Preserving Context Reuse
MLSys 2026
LLM-Monitor: Efficient Privacy Violation Monitoring for LLMs
ACL 2025 Demo · Under Review
MoE-CAP: Benchmarking Cost, Accuracy and Performance of Sparse Mixture-of-Experts Systems
NeurIPS 2025
ServerlessLLM: Locality-Enhanced Serverless Inference for Large Language Models
OSDI 2024
Symplectic Structure-Preserving Particle-in-Cell Whole-Volume Simulation of Tokamak Plasmas
SC 2021
项目
BioVLM
Evidence-enriched data synthesis pipeline from biomedical papers, training BioVLM-8B that surpasses GPT-5.2 on LAB-Bench.
LLM-Monitor
Low-cost, evolvable privacy violation monitoring system for LLMs, 15x faster than GPT-5.2.
AI4Math Sketchpad
Grant-funded system for converting mathematical proofs into structured data for auto-formalization.
BTMR-Paper
Insanely Fast Paper Reading Tool - An AI-powered web application for extracting, analyzing, and summarizing academic papers
Bili-Investigate
A Streamlit-based web application for tracking Bilibili content creators' video updates with smart incremental fetching
YA-PapersWithCode
Yet Another Papers With Code - A modern recreation of the Papers With Code platform with AI-powered semantic search
联系方式
yeqi.huang@ed.ac.uk
10 Crichton Street, Edinburgh, United Kingdom
Informatics Forum Room 1.43