米金鹏
职称:讲师
导师资格:硕导
学科专业:生物医学工程
电话:021-55271703
邮箱:jp.mi@usst.edu.cn
个人简介
工作经历
教育经历
研究方向
主要科研项目
代表性专利
代表性论文

【主持】

[1] 横向课题:面向室内场景的视觉自然语言导航系统开发。

[2] 上海哲社规划课题一般项目:基于混合神经-符号推理的北宋太宗朝亡佚《国史》文本复原研究。

[3] 工信部“一条龙”应用计划子课题:具身智能大模型。

[4] 横向课题:仿生机器人的多模态认知人机交互。

【参与】

[1] 中德国际合作与交流项目:Crossmodal Learning: Adaptivity, Prediction and Interaction。


2020/01 – 至今, 上海交通大学, 机器智能研究院, 讲师(硕导)


2015/04 – 2020/01, 德国汉堡大学, 计算机科学与技术

2008/09 – 2011/06, 中国矿业大学, 机械电子工程


研究聚焦视觉-自然语言多模态学习(VLM)、多模态理解、三维场景理解、具身导航等。

【主持】

[1] 横向课题:面向室内场景的视觉自然语言导航系统开发。

[2] 上海哲社规划课题一般项目:基于混合神经-符号推理的北宋太宗朝亡佚《国史》文本复原研究。

[3] 工信部“一条龙”应用计划子课题:具身智能大模型。

[4] 横向课题:仿生机器人的多模态认知人机交互。

【参与】

[1] 中德国际合作与交流项目:Crossmodal Learning: Adaptivity, Prediction and Interaction。


【发明专利】

[1] 一种应用于跨领域场景的多模型协同学习行为识别方法,2024年9月29日,中国,CN202411381144.6

[2] 一种软硬件结合的视觉深度学习模型推理加速方法,2022年7月12日,中国,CN202210817062.6

[3] 一种基于改进型角度估计的机械臂抓取方法,2022年7月18日,中国,CN202210840815.5

[4] 一种面向非结构场景中垃圾拾取任务的高效感知方法,2022年7月15日,中国,CN202210835850.8 


【代表性论文】

[1] Jinpeng Mi, Ying Wang, Jinbo Yang, et al. Zero-Shot Visual Grounding via Cascade Semantic Prototype Learning. IEEE Transactions on Circuits and Systems for Video Technology, 2026. DOI: 10.1109/TCSVT.2026.3678930.

[2] Haotian Pan, Shibo Huang, Jian Yang, Jinpeng Mi*, et al. Robot Navigation via Foundation Language Models: A Review. ACM Computing Surveys, 2026. DOI:10.1145/380253. (Corresponding Author)

[3] Dan Liu, Zhouli Shen, Ai Peng, Zhiyuan Ma, Jinpeng Mi*, et al. JSS-CLIP: Boosting Image-to-Video Transfer Learning with JigSaw Side Network[J]. Information Fusion, 2026(127):103775. (Corresponding Author)

[4] Jinpeng Mi, Ying Wang, Shaofei Jin, et al. 3D Dense Captioning via Prototypical Momentum Distillation[C]//IEEE International Conference on Robotics and Automation (ICRA), 2025: 1444-1450.

[5] Jinpeng Mi, Stefan Wermter, Jianwei Zhang. Adaptive Knowledge Distillation and Integration for Weakly Supervised Referring Expression Comprehension[J]. Knowledge-Based Systems, 2024(286): 111437.

[6] Jinpeng Mi, Shaofei Jin, Zhiqian Chen, et al. Zero-Shot Visual Grounding via Coarse-to-fine Representation Learning[J]. Neurocomputing, 2024(610): 128621.

[7] Jinpeng Mi, Song Tang, Zhiyuan Ma, et al. Weakly Supervised Referring Expression Grounding via Target-Guided Knowledge Distillation[C]//IEEE International Conference on Robotics and Automation (ICRA), 2023: 8299-8305.

[8] Jinpeng Mi, Zhiqian Chen, Jianwei Zhang. Weakly Supervised Referring Expression Grounding via Dynamic Self-Knowledge Distillation[C]//IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), 2023: 1254-1260.