Faculty Profiles - YUAN Binhang | The Hong Kong University of Science and Technology

Binhang YUAN
袁彬航

PhD in Computer Science
Rice University, 2020

Assistant Professor
Department of Computer Science and Engineering

(852) 2358 6978
biyuan@ust.hk
Room 3517
Personal Web

Google Scholar

TflKxcIAAAAJ

ORCID

0000-0002-3188-2769

Scopus ID

57190226826

Research Interest Publications Projects Teaching Assignment RPG Supervision

Research Interest

Data management
Data-driven machine learning
Database systems
Distributed systems
Distributed computing

Publications

All Years 36 2025 10 2024 6 2023 4 2022 6 2021 5 2020 1 2019 4

2025 10

Foundation models as assistive tools in hydrometeorology: Opportunities, challenges, and perspectives

Water Resources Research, v. 61, (4), April 2025, article number e2024WR039553
Zhang, Lujia; Song, Yurong; Cui, Hanzhe; Lu, Mengqian; Li, Chenyue; Yuan, Binhang; Wang, Bin; Lall, Upmanu; Yang, Jing
Article

Top Ten Challenges Towards Agentic Neural Graph Databases

IEEE Data Engineering Bulletin, v. 49, (1), March 2025, p. 104-123
Bai, Jiaxin; Wang, Zihao; Zhou, Yukun; Yin, Hang; Fei, Weizhi; Hu, Qi; Deng, Zheye; Cheng, Jiayang; Zheng, Tianshi; Tsang, Hong Ting; Gao, Yisen; Xie, Zhongwei; Li, Yufei; Fan, Lixin; Yuan, Binhang; Wang, Wei; Chen, Lei; Zhou, Xiaofang; Song, Yangqiu
Article

DeFT: Decoding with Flash Tree-attention for Efficient Tree-structured LLM Inference

13th International Conference on Learning Representations, ICLR 2025 / International Conference on Learning Representations, ICLR. International Conference on Learning Representations, ICLR, 2025, p. 3587-3618
Yao, Jinwei; Chen, Kaiqi; Zhang, Kexun; You, Jiaxuan; Yuan, Binhang; Wang, Zeke; Lin, Tao
Conference paper

Demystifying Cost-Efficiency in LLM Serving over Heterogeneous GPUs

Jiang, Youhe; Fu, Fangcheng; Yao, Xiaozhe; He, Guoliang; Miao, Xupeng; Klimovic, Ana; Cui, Bin; Yuan, Binhang; Yoneki, Eiko
Conference paper

Efficient Pretraining Data Selection for Language Models via Multi-Actor Collaboration

Bai, Tianyi; Yang, Ling; Wong, Zhen Hao; Sun, Fupeng; Zhuang, Xinlin; Peng, Jiahui; Zhang, Chi; Wu, Lijun; Qiu, Jiantao; Zhang, Wentao; Yuan, Binhang; He, Conghui
Conference paper

HexGen-2: Disaggregated Generative Inference of LLMs in Heterogeneous Environment

Jiang, Youhe; Yan, Ran; Yuan, Binhang
Conference paper

MLKV: Efficiently Scaling up Large Embedding Model Training with Disk-based Key-Value Storage

Proceedings - International Conference on Data Engineering / IEEE. Piscataway, NJ : IEEE, 2025, article number 11112993
He, Yongjun; Waleffe, Roger; Han, Zhichao; George, Johnu; Yuan, Binhang; Zhang, Zitao; Shan, Yinan; Zhao, Yang; Dutta, Debojyoti; Rekatsinas, Theodoros; Zhang, Ce
Conference paper

Prompt Inversion Attack against Collaborative Inference of Large Language Models

Proceedings - IEEE Symposium on Security and Privacy / IEEE. Piscataway, NJ : IEEE, 2025, p. 1695-1712, article number 11023374
Qu, Wenjie; Zhou, Yuguang; Wu, Yongji; Xiao, Tingsong; Yuan, Binhang; Li, Yiming; Zhang, Jiaheng
Conference paper

Ratel: Optimizing Holistic Data Movement to Fine-tune 100B Model on a Consumer GPU

Liao, Changyue; Sun, Mo; Yang, Zihan; Xie, Jun; Chen, Kaiqi; Yuan, Binhang; Wu, Fei; Wang, Zeke
Conference paper

Toppings: CPU-Assisted, Rank-Aware Adapter Serving for LLM Inference

Proceedings of the 2025 USENIX Annual Technical Conference, ATC 2025 / USENIX Association. USENIX Association, 2025, p. 613-629
Li, Suyi; Lu, Hanfeng; Wu, Tianyuan; Yu, Minchen; Weng, Qizhen; Chen, Xusheng; Shan, Yizhou; Yuan, Binhang; Wang, Wei
Conference paper

2024 6

Stochastic gradient descent without full data shuffle: with applications to in-database machine learning and deep learning systems

VLDB Journal, April 2024
Xu, Lijie; Qiu, Shuang; Yuan, Binhang; Jiang, Jiawei; Renggli, Cedric; Gan, Shaoduo; Kara, Kaan; Li, Guoliang; Liu, Ji; Wu, Wentao; Ye, Jieping; Zhang, Ce
Article

HEXGEN: Generative Inference of Large Language Model over Heterogeneous Environment

Proceedings of Machine Learning Research, v. 235, July 2024, article number 881, p. 21946-21961
Jiang, Youhe; Yan, Ran; Yao, Xiaozhe; Zhou, Yang; Chen, Beidi; Yuan, Binhang
Conference paper

HexGen: Generative Inference of Large-Scale Foundation Model over Heterogeneous Decentralized Environment

Jiang, Youhe; Yan, Ran; Yao, Xiaozhe; Zhou, Yang; Chen, Beidi; Yuan, Binhang
Conference paper

Model-Glue: Democratized LLM Scaling for A Large Model Zoo in the Wild.

Advances in Neural Information Processing Systems, v. 37, December 2024
Zhao, Xinyu; Sun, Guoheng; Cai, Ruisi; Zhou, Yukun; Li, Pingzhi; Wang, Peihao; Tan, Bowen; He, Yexiao; Chen, Li; Liang, Yi; Chen, Beidi; Yuan, Binhang; Wang, Hongyi; Li, Ang; Wang, Zhangyang; Chen, Tianlong
Conference paper

Position: Exploring the Robustness of Pipeline-Parallelism-Based Decentralized Training

Proceedings of Machine Learning Research, v. 235, July 2024, article number 1338, p. 32978-32989
Lu, Lin; Dai, Chenxi; Tao, Wangcheng; Yuan, Binhang; Sun, Yanan; Zhou, Pan
Conference paper

Serving Deep Learning Models from Relational Databases

Advances in Database Technology - EDBT, v. 27, (3), March 2024, p. 717-724
Zhou, Lixi; Lin, Qi; Chowdhury, Kanchan; Masood, Saif; Eichenberger, Alexandre; Min, Hong; Sim, Alexander; Wang, Jie; Wang, Yida; Wu, Kesheng; Yuan, Binhang; Zou, Jia
Conference paper

2023 4

Auto-Differentiation of Relational Computations for Very Large Scale Machine Learning

Tang, Yuxin; Ding, Zhimin; Jankov, Dimitrije; Yuan, Binhang; Bourgeois, Daniel; Jermaine, Chris
Conference paper

CocktailSGD: Fine-tuning Foundation Models over 500Mbps Networks

Wang, Jue; Lu, Yucheng; Yuan, Binhang; Chen, Beidi; Liang, Percy; De Sa, Christopher; Ré, Christopher; Zhang, Ce
Conference paper

Deja Vu: Contextual Sparsity for Efficient LLMs at Inference Time

Liu, Zichang; Wang, Jue; Dao, Tri; Zhou, Tianyi; Yuan, Binhang; Song, Zhao; Shrivastava, Anshumali; Zhang, Ce; Tian, Yuandong; Ré, Christopher; Chen, Beidi
Conference paper

High-throughput Generative Inference of Large Language Models with a Single GPU

Sheng, Ying; Zheng, Lianmin; Yuan, Binhang; Li, Zhuohan; Ryabinin, Max; Fu, Daniel Y.; Xie, Zhiqiang; Chen, Beidi; Barrett, Clark; Gonzalez, Joseph E.; Liang, Percy; Ré, Christopher; Stoica, Ion; Zhang, Ce
Conference paper

2022 6

Decentralized Training of Foundation Models in Heterogeneous Environments

Advances in Neural Information Processing Systems, v. 35, 2022
Yuan, Binhang; He, Yongjun; Davis, Jared Quincy; Zhang, Tianyi; Dao, Tri; Chen, Beidi; Liang, Percy; Re, Christopher; Zhang, Ce
Conference paper

Distributed Learning of Fully Connected Neural Networks using Independent Subnet Training

Proceedings of the VLDB Endowment, v. 15, (8), April 2022, p. 1581-1590
Yuan, Binhang; Wolfe, Cameron R.; Dun, Chen; Tang, Yuxin; Kyrillidis, Anastasios; Jermaine, Chris
Conference paper

Efficient flow scheduling in distributed deep learning training with echelon formation

HotNets '22: Proceedings of the 21st ACM Workshop on Hot Topics in Networks / Association for Computing Machinery. New York, NY : Association for Computing Machinery, 2022, p. 93-100
Pan, Rui; Lei, Yiming; Li, Jialong; Xie, Zhiqiang; Yuan, Binhang; Xia, Yiting
Conference paper

Fine-tuning Language Models over Slow Networks using Activation Quantization with Guarantees

Advances in Neural Information Processing Systems, v. 35, 2022
Wang, Jue; Yuan, Binhang; Rimanic, Luka; He, Yongjun; Dao, Tri; Chen, Beidi; Ré, Christopher; Zhang, Ce
Conference paper

In-Database Machine Learning with CorgiPile: Stochastic Gradient Descent without Full Data Shuffle

SIGMOD '22: Proceedings of the 2022 International Conference on Management of Data / Association for Computing Machinery. New York, NY : Association for Computing Machinery, 2022, p. 1286-1300
Xu, Lijie; Qiu, Shuang; Yuan, Binhang; Jiang, Jiawei; Renggli, Cedric; Gan, Shaoduo; Kara, Kaan; Li, Guoliang; Liu, Ji; Wu, Wentao; Ye, Jieping; Zhang, Ce
Conference paper

Persia: An Open, Hybrid System Scaling Deep Learning-based Recommenders up to 100 Trillion Parameters

KDD '22: Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining / Association for Computing Machinery. New York, NY : Association for Computing Machinery, 2022, p. 3288-3298
Lian, Xiangru; Yuan, Binhang; Liu, Ji
Conference paper

2021 5

Distributed numerical and machine learning computations via two-phase execution of aggregated join trees

Proceedings of the VLDB Endowment, v. 14, (7), March 2021, p. 1228-1240
Jankov, Dimitrije; Yuan, Binhang; Luo, Shangyu; Jermaine, Chris
Article

Automatic Optimization of Matrix Implementations for Distributed Machine Learning and Linear Algebra

SIGMOD '21: Proceedings of the 2021 International Conference on Management of Data / Association for Computing Machinery. New York, NY : Association for Computing Machinery, 2021, p. 1222-1234
Luo, Shangyu; Jankov, Dimitrije; Yuan, Binhang; Jermaine, Chris
Conference paper

BAGUA: Scaling up Distributed Learning with System Relaxations

Proceedings of the VLDB Endowment, v. 15, (4), December 2021, p. 804-813
Gan, Shaoduo; Jiang, Jiawei; Yuan, Binhang; Zhang, Ce; Lian, Xiangru; Wang, Rui; Chang, Jianbin; Liu, Chengjun; Shi, Hongmei; Zhang, Shengzhuo; Li, Xianghong; Sun, Tengxu; Yang, Sen; Liu, Ji
Conference paper

Lachesis: automatic partitioning for UDF-centric analytics

Proceedings of the VLDB Endowment, v. 14, (8), April 2021, p. 1262-1275
Zou, Jia; Das, Amitabh; Barhate, Pratik; Iyengar, Arun; Yuan, Binhang; Jankov, Dimitrije; Jermaine, Chris
Conference paper

Tensor relational algebra for distributed machine learning system design

Proceedings of the VLDB Endowment, v. 14, (8), April 2021, p. 1338-1350
Yuan, Binhang; Jankov, Dimitrije; Zou, Jia; Tang, Yuxin; Bourgeois, Daniel; Jermaine, Chris
Conference paper

2020 1

Declarative Recursive Computation on an RDBMS: or, Why You Should Use a Database For Distributed Machine Learning

ACM SIGMOD Record, v. 49, (1), March 2020, p. 43-50
Jankov, DImitrije; Luo, Shangyu; Yuan, Binhang; Cai, Zhuhua; Zou, Jia; Jermaine, Chris; Gao, Zekai J.
Article

2018 2

Declarative Recursive Computation on an RDBMS or, Why You Should Use a Database For Distributed Machine Learning

Proceedings of the VLDB Endowment, v. 12, (7), March 2019, p. 822-835
Jankov, Dimitrije; Luo, Shangyu; Yuan, Binhang; Cai, Zhuhua; Zou, Jia; Jermaine, Chris; Gao, Zekai J.
Conference paper

PlinyCompute: A platform for high-performance, distributed, data-intensive tool development

SIGMOD '18: Proceedings of the 2018 International Conference on Management of Data / Association for Computing Machinery. New York, NY : Association for Computing Machinery, 2018, p. 1189-1204
Zou, Jia; Barnett, R. Matthew; Lorido-Botran, Tania; Luo, Shangyu; Monroy, Carlos; Sikdar, Sourav; Teymourian, Kia; Yuan, Binhang; Jermaine, Chris
Conference paper

2017 1

Abridging source code

Proceedings of the ACM on Programming Languages, v. 1, (OOPSLA), October 2017, article number 58, p. 1-26
Yuan, Binhang; Murali, Vijayaraghavan; Jermaine, Christopher
Article

2014 1

Effective video retargeting with jittery assessment

IEEE Transactions on Multimedia, v. 16, (1), January 2014, article number 6636046, p. 272-277
Yan, Bo; Yuan, Binhang; Yang, Bo
Article

Article 2

Foundation models as assistive tools in hydrometeorology: Opportunities, challenges, and perspectives

Water Resources Research, v. 61, (4), April 2025, article number e2024WR039553
Zhang, Lujia; Song, Yurong; Cui, Hanzhe; Lu, Mengqian; Li, Chenyue; Yuan, Binhang; Wang, Bin; Lall, Upmanu; Yang, Jing

Top Ten Challenges Towards Agentic Neural Graph Databases

IEEE Data Engineering Bulletin, v. 49, (1), March 2025, p. 104-123
Bai, Jiaxin; Wang, Zihao; Zhou, Yukun; Yin, Hang; Fei, Weizhi; Hu, Qi; Deng, Zheye; Cheng, Jiayang; Zheng, Tianshi; Tsang, Hong Ting; Gao, Yisen; Xie, Zhongwei; Li, Yufei; Fan, Lixin; Yuan, Binhang; Wang, Wei; Chen, Lei; Zhou, Xiaofang; Song, Yangqiu

Conference paper 8

DeFT: Decoding with Flash Tree-attention for Efficient Tree-structured LLM Inference

13th International Conference on Learning Representations, ICLR 2025 / International Conference on Learning Representations, ICLR. International Conference on Learning Representations, ICLR, 2025, p. 3587-3618
Yao, Jinwei; Chen, Kaiqi; Zhang, Kexun; You, Jiaxuan; Yuan, Binhang; Wang, Zeke; Lin, Tao

Demystifying Cost-Efficiency in LLM Serving over Heterogeneous GPUs

Jiang, Youhe; Fu, Fangcheng; Yao, Xiaozhe; He, Guoliang; Miao, Xupeng; Klimovic, Ana; Cui, Bin; Yuan, Binhang; Yoneki, Eiko

Efficient Pretraining Data Selection for Language Models via Multi-Actor Collaboration

Bai, Tianyi; Yang, Ling; Wong, Zhen Hao; Sun, Fupeng; Zhuang, Xinlin; Peng, Jiahui; Zhang, Chi; Wu, Lijun; Qiu, Jiantao; Zhang, Wentao; Yuan, Binhang; He, Conghui

HexGen-2: Disaggregated Generative Inference of LLMs in Heterogeneous Environment

Jiang, Youhe; Yan, Ran; Yuan, Binhang

MLKV: Efficiently Scaling up Large Embedding Model Training with Disk-based Key-Value Storage

Proceedings - International Conference on Data Engineering / IEEE. Piscataway, NJ : IEEE, 2025, article number 11112993
He, Yongjun; Waleffe, Roger; Han, Zhichao; George, Johnu; Yuan, Binhang; Zhang, Zitao; Shan, Yinan; Zhao, Yang; Dutta, Debojyoti; Rekatsinas, Theodoros; Zhang, Ce

Prompt Inversion Attack against Collaborative Inference of Large Language Models

Proceedings - IEEE Symposium on Security and Privacy / IEEE. Piscataway, NJ : IEEE, 2025, p. 1695-1712, article number 11023374
Qu, Wenjie; Zhou, Yuguang; Wu, Yongji; Xiao, Tingsong; Yuan, Binhang; Li, Yiming; Zhang, Jiaheng

Ratel: Optimizing Holistic Data Movement to Fine-tune 100B Model on a Consumer GPU

Liao, Changyue; Sun, Mo; Yang, Zihan; Xie, Jun; Chen, Kaiqi; Yuan, Binhang; Wu, Fei; Wang, Zeke

Toppings: CPU-Assisted, Rank-Aware Adapter Serving for LLM Inference

Proceedings of the 2025 USENIX Annual Technical Conference, ATC 2025 / USENIX Association. USENIX Association, 2025, p. 613-629
Li, Suyi; Lu, Hanfeng; Wu, Tianyuan; Yu, Minchen; Weng, Qizhen; Chen, Xusheng; Shan, Yizhou; Yuan, Binhang; Wang, Wei

Article 1

Stochastic gradient descent without full data shuffle: with applications to in-database machine learning and deep learning systems

VLDB Journal, April 2024
Xu, Lijie; Qiu, Shuang; Yuan, Binhang; Jiang, Jiawei; Renggli, Cedric; Gan, Shaoduo; Kara, Kaan; Li, Guoliang; Liu, Ji; Wu, Wentao; Ye, Jieping; Zhang, Ce

Conference paper 5

HEXGEN: Generative Inference of Large Language Model over Heterogeneous Environment

Proceedings of Machine Learning Research, v. 235, July 2024, article number 881, p. 21946-21961
Jiang, Youhe; Yan, Ran; Yao, Xiaozhe; Zhou, Yang; Chen, Beidi; Yuan, Binhang

HexGen: Generative Inference of Large-Scale Foundation Model over Heterogeneous Decentralized Environment

Jiang, Youhe; Yan, Ran; Yao, Xiaozhe; Zhou, Yang; Chen, Beidi; Yuan, Binhang

Model-Glue: Democratized LLM Scaling for A Large Model Zoo in the Wild.

Advances in Neural Information Processing Systems, v. 37, December 2024
Zhao, Xinyu; Sun, Guoheng; Cai, Ruisi; Zhou, Yukun; Li, Pingzhi; Wang, Peihao; Tan, Bowen; He, Yexiao; Chen, Li; Liang, Yi; Chen, Beidi; Yuan, Binhang; Wang, Hongyi; Li, Ang; Wang, Zhangyang; Chen, Tianlong

Position: Exploring the Robustness of Pipeline-Parallelism-Based Decentralized Training

Proceedings of Machine Learning Research, v. 235, July 2024, article number 1338, p. 32978-32989
Lu, Lin; Dai, Chenxi; Tao, Wangcheng; Yuan, Binhang; Sun, Yanan; Zhou, Pan

Serving Deep Learning Models from Relational Databases

Advances in Database Technology - EDBT, v. 27, (3), March 2024, p. 717-724
Zhou, Lixi; Lin, Qi; Chowdhury, Kanchan; Masood, Saif; Eichenberger, Alexandre; Min, Hong; Sim, Alexander; Wang, Jie; Wang, Yida; Wu, Kesheng; Yuan, Binhang; Zou, Jia

Conference paper 4

Auto-Differentiation of Relational Computations for Very Large Scale Machine Learning

Tang, Yuxin; Ding, Zhimin; Jankov, Dimitrije; Yuan, Binhang; Bourgeois, Daniel; Jermaine, Chris

CocktailSGD: Fine-tuning Foundation Models over 500Mbps Networks

Wang, Jue; Lu, Yucheng; Yuan, Binhang; Chen, Beidi; Liang, Percy; De Sa, Christopher; Ré, Christopher; Zhang, Ce

Deja Vu: Contextual Sparsity for Efficient LLMs at Inference Time

Liu, Zichang; Wang, Jue; Dao, Tri; Zhou, Tianyi; Yuan, Binhang; Song, Zhao; Shrivastava, Anshumali; Zhang, Ce; Tian, Yuandong; Ré, Christopher; Chen, Beidi

High-throughput Generative Inference of Large Language Models with a Single GPU

Sheng, Ying; Zheng, Lianmin; Yuan, Binhang; Li, Zhuohan; Ryabinin, Max; Fu, Daniel Y.; Xie, Zhiqiang; Chen, Beidi; Barrett, Clark; Gonzalez, Joseph E.; Liang, Percy; Ré, Christopher; Stoica, Ion; Zhang, Ce

Conference paper 6

Decentralized Training of Foundation Models in Heterogeneous Environments

Advances in Neural Information Processing Systems, v. 35, 2022
Yuan, Binhang; He, Yongjun; Davis, Jared Quincy; Zhang, Tianyi; Dao, Tri; Chen, Beidi; Liang, Percy; Re, Christopher; Zhang, Ce

Distributed Learning of Fully Connected Neural Networks using Independent Subnet Training

Proceedings of the VLDB Endowment, v. 15, (8), April 2022, p. 1581-1590
Yuan, Binhang; Wolfe, Cameron R.; Dun, Chen; Tang, Yuxin; Kyrillidis, Anastasios; Jermaine, Chris

Efficient flow scheduling in distributed deep learning training with echelon formation

HotNets '22: Proceedings of the 21st ACM Workshop on Hot Topics in Networks / Association for Computing Machinery. New York, NY : Association for Computing Machinery, 2022, p. 93-100
Pan, Rui; Lei, Yiming; Li, Jialong; Xie, Zhiqiang; Yuan, Binhang; Xia, Yiting

Fine-tuning Language Models over Slow Networks using Activation Quantization with Guarantees

Advances in Neural Information Processing Systems, v. 35, 2022
Wang, Jue; Yuan, Binhang; Rimanic, Luka; He, Yongjun; Dao, Tri; Chen, Beidi; Ré, Christopher; Zhang, Ce

In-Database Machine Learning with CorgiPile: Stochastic Gradient Descent without Full Data Shuffle

SIGMOD '22: Proceedings of the 2022 International Conference on Management of Data / Association for Computing Machinery. New York, NY : Association for Computing Machinery, 2022, p. 1286-1300
Xu, Lijie; Qiu, Shuang; Yuan, Binhang; Jiang, Jiawei; Renggli, Cedric; Gan, Shaoduo; Kara, Kaan; Li, Guoliang; Liu, Ji; Wu, Wentao; Ye, Jieping; Zhang, Ce

Persia: An Open, Hybrid System Scaling Deep Learning-based Recommenders up to 100 Trillion Parameters

KDD '22: Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining / Association for Computing Machinery. New York, NY : Association for Computing Machinery, 2022, p. 3288-3298
Lian, Xiangru; Yuan, Binhang; Liu, Ji

Article 1

Distributed numerical and machine learning computations via two-phase execution of aggregated join trees

Proceedings of the VLDB Endowment, v. 14, (7), March 2021, p. 1228-1240
Jankov, Dimitrije; Yuan, Binhang; Luo, Shangyu; Jermaine, Chris

Conference paper 4

Automatic Optimization of Matrix Implementations for Distributed Machine Learning and Linear Algebra

SIGMOD '21: Proceedings of the 2021 International Conference on Management of Data / Association for Computing Machinery. New York, NY : Association for Computing Machinery, 2021, p. 1222-1234
Luo, Shangyu; Jankov, Dimitrije; Yuan, Binhang; Jermaine, Chris

BAGUA: Scaling up Distributed Learning with System Relaxations

Proceedings of the VLDB Endowment, v. 15, (4), December 2021, p. 804-813
Gan, Shaoduo; Jiang, Jiawei; Yuan, Binhang; Zhang, Ce; Lian, Xiangru; Wang, Rui; Chang, Jianbin; Liu, Chengjun; Shi, Hongmei; Zhang, Shengzhuo; Li, Xianghong; Sun, Tengxu; Yang, Sen; Liu, Ji

Lachesis: automatic partitioning for UDF-centric analytics

Proceedings of the VLDB Endowment, v. 14, (8), April 2021, p. 1262-1275
Zou, Jia; Das, Amitabh; Barhate, Pratik; Iyengar, Arun; Yuan, Binhang; Jankov, Dimitrije; Jermaine, Chris

Tensor relational algebra for distributed machine learning system design

Proceedings of the VLDB Endowment, v. 14, (8), April 2021, p. 1338-1350
Yuan, Binhang; Jankov, Dimitrije; Zou, Jia; Tang, Yuxin; Bourgeois, Daniel; Jermaine, Chris

Article 1

Declarative Recursive Computation on an RDBMS: or, Why You Should Use a Database For Distributed Machine Learning

ACM SIGMOD Record, v. 49, (1), March 2020, p. 43-50
Jankov, DImitrije; Luo, Shangyu; Yuan, Binhang; Cai, Zhuhua; Zou, Jia; Jermaine, Chris; Gao, Zekai J.

Conference paper 2

Declarative Recursive Computation on an RDBMS or, Why You Should Use a Database For Distributed Machine Learning

Proceedings of the VLDB Endowment, v. 12, (7), March 2019, p. 822-835
Jankov, Dimitrije; Luo, Shangyu; Yuan, Binhang; Cai, Zhuhua; Zou, Jia; Jermaine, Chris; Gao, Zekai J.

PlinyCompute: A platform for high-performance, distributed, data-intensive tool development

SIGMOD '18: Proceedings of the 2018 International Conference on Management of Data / Association for Computing Machinery. New York, NY : Association for Computing Machinery, 2018, p. 1189-1204
Zou, Jia; Barnett, R. Matthew; Lorido-Botran, Tania; Luo, Shangyu; Monroy, Carlos; Sikdar, Sourav; Teymourian, Kia; Yuan, Binhang; Jermaine, Chris

Article 1

Abridging source code

Proceedings of the ACM on Programming Languages, v. 1, (OOPSLA), October 2017, article number 58, p. 1-26
Yuan, Binhang; Murali, Vijayaraghavan; Jermaine, Christopher

Article 1

Effective video retargeting with jittery assessment

IEEE Transactions on Multimedia, v. 16, (1), January 2014, article number 6636046, p. 272-277
Yan, Bo; Yuan, Binhang; Yang, Bo

2018 2

Declarative Recursive Computation on an RDBMS or, Why You Should Use a Database For Distributed Machine Learning

Proceedings of the VLDB Endowment, v. 12, (7), March 2019, p. 822-835
Jankov, Dimitrije; Luo, Shangyu; Yuan, Binhang; Cai, Zhuhua; Zou, Jia; Jermaine, Chris; Gao, Zekai J.
Conference paper

PlinyCompute: A platform for high-performance, distributed, data-intensive tool development

SIGMOD '18: Proceedings of the 2018 International Conference on Management of Data / Association for Computing Machinery. New York, NY : Association for Computing Machinery, 2018, p. 1189-1204
Zou, Jia; Barnett, R. Matthew; Lorido-Botran, Tania; Luo, Shangyu; Monroy, Carlos; Sikdar, Sourav; Teymourian, Kia; Yuan, Binhang; Jermaine, Chris
Conference paper

2017 1

Abridging source code

Proceedings of the ACM on Programming Languages, v. 1, (OOPSLA), October 2017, article number 58, p. 1-26
Yuan, Binhang; Murali, Vijayaraghavan; Jermaine, Christopher
Article

2014 1

Effective video retargeting with jittery assessment

IEEE Transactions on Multimedia, v. 16, (1), January 2014, article number 6636046, p. 272-277
Yan, Bo; Yuan, Binhang; Yang, Bo
Article

Teaching Assignment

2025-26 Fall 6 2024-25 Summer 4 2024-25 Spring 1 2024-25 Winter 0 2024-25 Fall 1 2023-24 Summer 1

COMP4971A	Independent Work
COMP4971D	Independent Work
COMP4981	Final Year Project
COMP4981H	Final Year Thesis
COMP6211J	Advanced Large-Scale Machine Learning Systems for Foundation Models
UROP1100Q	Undergraduate Research Opportunities Series 1

COMP4971A	Independent Work
COMP4981	Final Year Project
COMP4981H	Final Year Thesis
UROP1000	Undergraduate Research Opportunities

COMP4901Y

Large-Scale Machine Learning for Foundation Models

COMP6211J

Advanced Large-Scale Machine Learning Systems for Foundation Models

COMP4971A

Independent Work

No Teaching Assignments

Research Postgraduate (RPG) Supervision

From January 2022 to December 2025 (As of 27 October 2025)

Current RPGs

Doctor of Philosophy

CHENG, Jiayi
Computer Science and Engineering
LIU, Yaofu (co-supervision)
Arts and Machine Creativity
PAN, Ding
Computer Science and Engineering
XU, Xu
Computer Science and Engineering
DING, Fangyu
Computer Science and Engineering
HE, Guangxin
Computer Science and Engineering
LI, Chenyue
Computer Science and Engineering
PENG, You
Computer Science and Engineering
QIU, Zipeng
Computer Science and Engineering
ZHOU, Yukun (co-supervision)
Computer Science and Engineering
BAI, Tianyi
Computer Science and Engineering
YAN, Ran
Computer Science and Engineering

Master of Philosophy

KIM, Hyeonjae
Computer Science and Engineering

Projects

From January 2023 to December 2025

All Projects 3 Leading Projects 1 Participating Projects 2

Breaking the LLM Resource Wall: A Novel Computing System based on a Heterogeneous, Disaggregated Cloud Infrastructure

突破大語言模型的資源牆：面向異構分離式雲架構的新型計算系統研究 Participating

National Natural Science Foundation of China (NSFC) / Research Grants Council (RGC)
Project Team (HKUST)
LI Bo (Lead)

WANG Wei

YUAN Binhang
2025 -
HKUST-MetaX Joint Laboratory for Advanced AI Computing

香港科技大學-沐曦先進人工智能計算聯合實驗室 Participating

MetaX Integrated Circuits (Shanghai) Co, Ltd.
Project Team (HKUST)
ZHOU Xiaofang (Lead)

CHEN Kai

GUO Song

HAN Sirui

XIE Yuan

YUAN Binhang
2024 -
Accommodating Open Foundation Model Training over Decentralized Computational Resources

在去中心化計算資源上的開源基礎模型訓練框架 Leading

RGC - Early Career Scheme
Project Team (HKUST)
YUAN Binhang (Lead)
2024 -

Research Interest

Publications

2025 10

2024 6

2023 4

2022 6

2021 5

2020 1

2018 2

2017 1

2014 1

Article 2

Conference paper 8

Article 1

Conference paper 5

Conference paper 4

Conference paper 6

Article 1

Conference paper 4

Article 1

Conference paper 2

Article 1

Article 1

2018 2

2017 1

2014 1

Teaching Assignment

Research Postgraduate (RPG) Supervision

From January 2022 to December 2025 (As of 27 October 2025)

Current RPGs

Projects

From January 2023 to December 2025

Your browser is out of date!