多模态机械臂操作算法实习生(视觉/力觉/触觉/听觉) | 1、设计并实现机械臂多模态感知融合算法(视觉伺服+力位混合控制+触觉反馈),优化复杂场景下的操作精度与鲁棒性。 2、主导多传感器(RGB-D相机/六维力觉/触觉阵列/声学麦克风)数据融合闭环设计,实现亚毫米级操作精度。 3、协同硬件团队完成EtherCAT/CAN总线通信协议联调,确保算法在嵌入式系统(ROS 2/VxWorks)的实时性(延迟<10ms)。 4、搭建多模态仿真环境(Isaac Gym/MuJoCo),开发自动化工具链验证操作策略成功率(目标≥99.9%)。 5、优化力控算法在柔性物体抓取、精密装配等工业场景的泛化能力,建立操作性能量化评估标准。 6、跟踪具身智能领域最新成果(如扩散模型驱动的操作策略、多模态大模型),推动专利申报与技术迭代。 | 1、3年以上机械臂开发经验,至少主导过一个工业场景(汽车制造/3C电子)或医疗场景(手术机器人)多模态操作项目全流程。 2、硕士及以上学历,机器人学、控制工程、计算机科学、电子工程等相关专业(博士优先)。 3、精通Python/C++编程,熟练使用PyTorch/TensorFlow框架及ROS/ROS 2开发环境。 4、深入掌握多模态感知理论: (1)视觉:熟悉OpenCV/3D点云处理(PCL)、目标检测、分割等等; (2)力觉:掌握阻抗控制、导纳控制算法,熟悉六维力传感器校准; (3)触觉:了解触觉阵列信号解析(如SynTouch BioTac)、电子皮肤技术; (4)听觉:具备声学事件检测(如异常碰撞识别)及降噪算法经验。 5、熟练使用机器人仿真工具链(MuJoCo/Isaac Gym/Gazebo)及数值优化库(Eigen/Ceres)。 6、有触觉引导装配、低容错率抓取(如玻璃器皿)或声控操作成果者优先。 7、发表过机器人领域顶会论文(ICRA/IROS)或持有相关专利者优先 |
算法实习生 | 设计或参与以下研究方向: - Reasoning - Computer Use Agent - Code Agent - Embodied Agent 1. 负责Code、Computer Use、Robotics场景下的全链路训练,包括但不限于任务构建、数据收集、模型训练、评测,提高模型的任务执行表现 1. 奖励模型(Reward Model)的优化和创新 2. 对诸如r1-zero等新的训练范式的创新型探索 3. 探索如何构建稳健的评估方法,全面、客观、公正地评估模型的基础推理规划能力,以及和复杂环境的交互能力 2. 研究数据合成、scalable oversight, 突破数据瓶颈,减轻对人类标注的依赖; 3. 研究 system 2 在推理、规划能力中的应用,用“慢思考”提升效果,优化模型基础能力; 4. 提升模型的工具调用、API 交互能力,通过构建 agent解决复杂问题。 | 1. 正在攻读人工智能、计算机、软件工程、电子工程、自动化、机器人、数学等相关学位。 2. 精通计算机视觉、大语言模型、多模态大模型、强化学习、智能体等任意一个方向。 3. 有使用PyTorch等深度学习框架的使用经验,熟悉分布式训练框架(如Megatron-LM和DeepSpeed),并具备多机多卡分布式训练经验。 4. 理论基础扎实,具备创新精神和深入思考能力,具有较强的沟通能力和团队协作精神。 |
投递邮箱:cmrirecruit@cmhk.com