我是赵天韵,现为清华大学深圳国际研究生院计算机技术专业的硕士二年级研究生,师从江勇教授。 我本科毕业于北京邮电大学计算机科学与技术专业,并获得工学学士学位。
我的主要研究方向为面向大模型智能体的高效 RLHF 训练框架。我的邮箱为 zhao-ty24@mails.tsinghua.edu.cn ,欢迎与我沟通交流!
教育经历
| 清华大学 计算机技术 专业硕士 | 2024 年 9 月 - 2027 年 6 月 |
|---|---|
| 北京邮电大学 信息管理与信息系统 第二学士学位 肄业 | 2023 年 9 月 - 2024 年 6 月 |
| 北京邮电大学 计算机科学与技术 工学学士 | 2019 年 9 月 - 2023 年 6 月 |
学术论文
Seed-Prover: Deep and Broad Reasoning for Automated Theorem Proving
ByteDance Seed AI4Math
Tech Report, 2025
arXiv / GitHub显示全部作者
Algorithm
Luoxin Chen, Liankai Huang, Zhicheng Jiang, Allan Jie, Xiaoran Jin, Xing Jin, Chenggang Li, Wenlei Shi, Jiahui Wang, Siran Wang, Chenrui Wei,Shufa Wei, Yonghui Wu, Huajian Xin, Fan Yang, Hongyi Yuan, Zheng Yuan, Tianyang Zhan, Chi Zhang, Yue Zhang*, Yichi Zhou, Thomas Hanwen ZhuData
Jinming Gu, Wenhao Huang, Zhicheng Jiang, Xiaoran Jin, Kaijing Ma, Jiawei Shen, Tong Sun, Chenrui Wei, Shufa Wei, Yuchen Wu, Yihang Xia, Huaiyuan Ying*, Zheng Yuan, Ge ZhangInfra
Cheng Ren, He Sun, Zhihong Wang, Tianyun Zhao*, Jianqiu Zhao, Thomas Hanwen ZhuWhich Doors Are Open: Reinforcement Learning-based Internet-wide Port Scanning
Guanglei Song, Lin He, Tianyun Zhao, Yirui Luo, Yichao Wu, Linna Fan, Chenglong Li, Zhiliang Wang, Jiahai Yang
IWQoS, 2023
IEEE Xplore / GitHub实习经历
| 字节跳动 Seed Infra 机器学习系统研发实习生 | 2025 年 1 月 - 2025 年 7 月 |
|---|---|
| 华为 2012 实验室 网络技术实验室 研发实习生 | 2024 年 6 月 - 2024 年 8 月 |
| 腾讯 CSIG 智慧出行业务部 测试开发实习生 | 2021 年 7 月 - 2021 年 12 月 |
| 清华大学 网络研究院 网络管理与测量实验室 科研实习生 | 2021 年 12 月 - 2023 年 2 月 |
| 北京大学 计算机学院 无线感知实验室 科研实习生 | 2019 年 10 月 - 2020 年 1 月 |