学术成就记录

科研项目经历

1. 基于字典学习的可解释轨迹表示研究

时间: 2022.09 - 2023.11 | 角色: 项目负责人

项目简介: 针对现有轨迹表示方法缺乏可解释性的问题，提出了一种基于字典学习的可解释轨迹表示框架。该方法从大规模轨迹数据中自动提取常用子路径（pathlets）作为字典元素，通过简单拼接重构原始轨迹，生成的表示天然稀疏且具有强空间语义。

主要贡献:

设计了层次化字典学习算法，确保在大规模路网上的可扩展性
提供了字典估计误差的概率理论分析
在两个大规模真实出租车数据集上验证，下游任务（行程时间预测、数据压缩）性能显著优于基线方法

成果: 发表于 ACM SIGSPATIAL 2023（CCF-B类会议），并受邀在德国汉堡做口头报告

2. 大语言模型混合专家机制的隐藏协作研究

时间: 2024.06 - 2025.04 | 角色: 项目负责人

项目简介: 混合专家（Mixture-of-Experts, MoE）架构是当前大语言模型扩展的主流方案，但专家之间的协作机制尚不清楚。本项目深入分析MoE模型中专家的激活模式与协作行为，揭示了专家之间存在的隐藏协作现象。

主要贡献:

提出了分析MoE专家协作的新方法论
发现并量化了专家间的隐藏协作模式
为理解和优化MoE架构提供了新视角

成果: 发表于 EACL 2026（ACL旗下顶级NLP会议）

3. 智慧社区案例流转预测系统

时间: 2023.09 - 2024.06 | 角色: 核心成员

项目简介: 针对政府和社区组织处理大量民众诉求案例的效率问题，提出基于Decoder模型的案例流转路径和处理时间预测方法。通过建模案例在不同部门之间的流转规律，实现精准预测。

主要贡献:

参与设计基于Transformer Decoder的路径预测模型
协助构建深圳市多个社区平台的历史案例数据集
实验验证所提方法在路径预测和时间估计任务上显著优于传统机器学习基线

成果: 发表于 ACM MobiCom 2024（CCF-A类会议）

4. 可解释DNA序列表示学习（Dy-Mer）

时间: 2023.06 - 2025.01 | 角色: 核心成员

项目简介: DNA序列编码着重要的遗传信息，但其不定长特性难以直接用于数据挖掘算法。本项目提出Dy-Mer方法，基于字典学习将DNA序列转化为可解释的固定长度表示，利用高频K-mer作为字典基向量重构序列。

主要贡献:

参与设计基于稀疏恢复的DNA序列表示算法
协助开展DNA启动子分类实验，准确率提升13%
验证方法在DNA聚类和motif检测任务中的可解释性优势

成果: 发表于 Journal of the Franklin Institute 2025（SCI期刊）

5. 字典学习统一概率框架研究

时间: 2024.09 - 2025.09 | 角色: 核心成员

项目简介: 现有字典学习方法缺乏统一的理论框架。本项目提出一种基于概率模型的统一字典学习框架，实现稀疏激活约束下的字典学习，为不同应用场景提供灵活的理论基础。

主要贡献:

参与概率模型的理论推导与算法设计
协助开展实验验证与性能分析

成果: 论文已提交至 arXiv (arXiv:2509.25690)

论文发布情况

会议论文

Yuanbo Tang, Zhiyuan Peng, and Yang Li. “Explainable Trajectory Representation through Dictionary Learning.” In Proceedings of the 31st ACM International Conference on Advances in Geographic Information Systems, 1–4. SIGSPATIAL ‘23. New York, NY, USA: Association for Computing Machinery, 2023.
Yuanbo Tang, Yutong Tang, Ning Zhang, Meihan Chen, and Yang Li. “Unveiling Hidden Collaboration within Mixture-of-Experts in Large Language Models,” In Proceedings of the 18th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2026).
Yuanbo Tang, Yan Tang, Zixuan Zhang, Zihui Zhao, and Yang Li. “Data-Efficient and Robust Trajectory Generation through Pathlet Dictionary Learning,” In Conference on Parsimony and Learning (CPAL 2026).
Yiwen Liu, Dongdong Zhang, Xinyu Yang, Yuanbo Tang, Yang Chen, Qingmin Liao, and Yang Li. “Predicting Community Case Transfer Path and Processing Time Using Decoder Models.” In Proceedings of the 30th Annual International Conference on Mobile Computing and Networking, 2078–83. ACM MobiCom ‘24. New York, NY, USA: Association for Computing Machinery, 2024.

期刊论文

Zhiyuan Peng, Ning Zhang, Yuanbo Tang, and Yang Li. “Dy-Mer: An Explainable DNA Sequence Representation Scheme Using Dictionary Learning,” Journal of the Franklin Institute, 108307, 2025.

预印本

Zhengzhong Zhao, Yuanbo Tang, Jiaqi Ren, Xinyu Zhang, and Yang Li. “A Unified Probabilistic Framework for Dictionary Learning with Parsimonious Activation,” arXiv preprint arXiv:2509.25690, 2025.

软著/专利情况

暂无专利/软著记录，点击右上角”添加记录”按钮开始添加

在校荣誉获得情况

时间	荣誉名称	授予单位
2025.06	Future Leaders Scholarship (未来领袖奖学金)	清华大学
2024.06	Future Leaders Scholarship (未来领袖奖学金)	清华大学
2023.06	Future Leaders Scholarship (未来领袖奖学金)	清华大学
2019.06	Merit Student (优秀学生)	东南大学
2018.06	First-Grade Scholarship (一等奖学金)	东南大学
2017.12	First Prize in East China Division of National Robot Competition (全国机器人大赛华东赛区一等奖)	全国机器人大赛组委会

Yuanbo Tang

学术成就记录

科研项目经历

1. 基于字典学习的可解释轨迹表示研究

2. 大语言模型混合专家机制的隐藏协作研究

3. 智慧社区案例流转预测系统

4. 可解释DNA序列表示学习（Dy-Mer）

5. 字典学习统一概率框架研究

论文发布情况

会议论文

期刊论文

预印本

软著/专利情况

在校荣誉获得情况